?NVIDIA發布LLM專用GPU:3倍注意力提升,26年發布
白貓 / 2025-09-10 13:1245396NVIDIA已經在GTC 2025上公布了下一代Rubin GPU的部分消息,不過現在看起來AI實在是太過于火爆,導致NVIDIA即使沒有正式發布Rubin GPU,但是產品先給大家安排上。就在今天,NVIDIA發布了為LLM中上下文處理所打造的專用GPU——Rubin CPX,將會采用下一代的架構設計,能夠實現數倍的性能提升,當然需要到2026年才能跟大家正式見面。

NVIDIA表示在文本推理方面,包括了AI提示以及生成響應,其中隨著提示詞越來越多和復雜,導致GPU的算力有些跟不上,因此需要一款特別打造的專用GPU來專門負責提示詞與上下文本的理解,而Rubin CPX就是這樣一款產品。未來Rubin CPX將會成為下一代Vera Rubin平臺的一部分,搭載Vera CPU以及Rubin GPU,滿血Vera Rubin平臺最高擁有8EFLOPS的AI算力。

Rubin CPX能夠擁有128GB的GDDR7顯存,在專注力性能上與上代相比提升3倍,同時NVFP4算力可以達到30PFLOPS,當然NVIDIA還表示Rubin CPX除了硬件之外,還將獲得NVIDIA打造的一整套軟件棧,包括開放模型,專門為企業AI任務打造。

只不過雖然今天NVIDIA已經發布了這款產品,但是具體發售需要等到2026年,至于為什么這么早就發布這款產品,很顯然NVIDIA希望盡早獲得相關廠商的訂單,畢竟現在AI硬件供不應求,早點給訂單,NVIDIA就可以早點去生產相關的產品。
點個贊916
?NVIDIA發布LLM專用GPU:3倍注意力提升,26年發布














滬公網安備 31010702005758號
發表評論注冊|登錄