午夜神马影院-日本天堂在线-国产精品777-奇米影视亚洲春色-天堂8中文-日本在线观看一区二区-天天干天天操天天插-国产精品女同-色骚综合-四川一级毛毛片-99在线看-国产极品久久-波多野吉衣毛片-婷婷在线综合-欧美视频成人-亚洲影视一区二区三区-国产精品久久久久久久一区二区-国产精品9191-污污免费观看-日本三区在线

?NVIDIA發布LLM專用GPU:3倍注意力提升,26年發布

?NVIDIA發布LLM專用GPU:3倍注意力提升,26年發布

白貓 / 2025-09-10 13:1245396

NVIDIA已經在GTC 2025上公布了下一代Rubin GPU的部分消息,不過現在看起來AI實在是太過于火爆,導致NVIDIA即使沒有正式發布Rubin GPU,但是產品先給大家安排上。就在今天,NVIDIA發布了為LLM中上下文處理所打造的專用GPU——Rubin CPX,將會采用下一代的架構設計,能夠實現數倍的性能提升,當然需要到2026年才能跟大家正式見面。

NVIDIA-Blackwell-NVL72-AI-Server-_2-728x410.png

NVIDIA表示在文本推理方面,包括了AI提示以及生成響應,其中隨著提示詞越來越多和復雜,導致GPU的算力有些跟不上,因此需要一款特別打造的專用GPU來專門負責提示詞與上下文本的理解,而Rubin CPX就是這樣一款產品。未來Rubin CPX將會成為下一代Vera Rubin平臺的一部分,搭載Vera CPU以及Rubin GPU,滿血Vera Rubin平臺最高擁有8EFLOPS的AI算力。

NVIDIA-CPX-scaled.jpg

Rubin CPX能夠擁有128GB的GDDR7顯存,在專注力性能上與上代相比提升3倍,同時NVFP4算力可以達到30PFLOPS,當然NVIDIA還表示Rubin CPX除了硬件之外,還將獲得NVIDIA打造的一整套軟件棧,包括開放模型,專門為企業AI任務打造。

NVIDIA-RUBIN-CPX-HERO.jpg

只不過雖然今天NVIDIA已經發布了這款產品,但是具體發售需要等到2026年,至于為什么這么早就發布這款產品,很顯然NVIDIA希望盡早獲得相關廠商的訂單,畢竟現在AI硬件供不應求,早點給訂單,NVIDIA就可以早點去生產相關的產品。


發表評論注冊|