午夜神马影院-日本天堂在线-国产精品777-奇米影视亚洲春色-天堂8中文-日本在线观看一区二区-天天干天天操天天插-国产精品女同-色骚综合-四川一级毛毛片-99在线看-国产极品久久-波多野吉衣毛片-婷婷在线综合-欧美视频成人-亚洲影视一区二区三区-国产精品久久久久久久一区二区-国产精品9191-污污免费观看-日本三区在线

NVIDIA GTC推出RTX Spark平臺(tái):128GB統(tǒng)一內(nèi)存,實(shí)現(xiàn)120B模型本地推理

NVIDIA GTC推出RTX Spark平臺(tái):128GB統(tǒng)一內(nèi)存,實(shí)現(xiàn)120B模型本地推理

白貓 / 2026-06-01 15:43211324
標(biāo)簽:COMPUTEX2026

AI在這數(shù)年間發(fā)展迅猛,尤其是從2025年開(kāi)始的AI風(fēng)潮,更是讓整個(gè)科技行業(yè)迎來(lái)了前所未有的機(jī)遇。其中NVIDIA自然成為了這場(chǎng)AI盛宴的最大贏家。伴隨著小龍蝦的火爆,代理式AI已經(jīng)成為了目前AI發(fā)展的最新階段,代理式AI的火爆也讓大企業(yè)以及個(gè)人對(duì)于AI算力的需求達(dá)到了前所未有的程度,像是NVIDIA這樣的AI企業(yè)也正不斷地推出海量的硬件產(chǎn)品來(lái)滿足行業(yè)的需求。

本屆GTC Taipei于6月1日至4日在臺(tái)北國(guó)際會(huì)議中心舉辦,NVIDIA CEO黃仁勛也在6月1日舉辦主題演講,展示和介紹NVIDIA是如何圍繞AI工廠、代理式AI、物理AI以及機(jī)器人去打造硬件產(chǎn)品以及建立相關(guān)的AI生態(tài),很顯然NVIDIA希望能夠成為代理式AI時(shí)代的掌舵者。

QQ20260601-114904_副本.png

QQ20260601-114700_副本.png

首先是Vera Rubin AI超算,NVIDIA表示這款產(chǎn)品專(zhuān)門(mén)為代理式AI設(shè)計(jì),在之前的GTC大會(huì)上已經(jīng)正式發(fā)布,不過(guò)經(jīng)過(guò)NVIDIA的打磨與合作伙伴的適配。如今NVIDIA已經(jīng)正式出貨Vera Rubin,這是專(zhuān)門(mén)為代理式AI打造的一整臺(tái)計(jì)算平臺(tái),與以往NVIDIA的計(jì)算平臺(tái)有所不同的是,Vera Rubin平臺(tái)實(shí)際上是由多款產(chǎn)品共同打造的AI解決方案,包括Vera Rubin NVL72、Vera CPU、Groq 3 LPX、BlueField-4 STX以及Spectrum-6這五個(gè)互聯(lián)的機(jī)架構(gòu)成,能夠借助強(qiáng)大的算力讓企業(yè)獲得無(wú)與倫比的AI體驗(yàn)。

QQ20260601-115108_副本.png

QQ20260601-120117_副本.png

在如今的AI推理年代,CPU已經(jīng)愈發(fā)重要,甚至在一定程度上成為了制約AI推理的重要因素,因此NVIDIA這一次選擇了自研的Vera CPU,擁有最高88顆核心以及176個(gè)線程,最高擁有1.2TB/s的內(nèi)存帶寬,與傳統(tǒng)的X86處理器相比,帶寬提升2倍,并且Vera CPU在代理式AI上的性能比X86高出了80%,延遲也更低,Token的消耗量能夠減少10倍,從而降低企業(yè)的算力成本。目前Vera Rubin平臺(tái)已經(jīng)陸續(xù)銷(xiāo)往客戶手中,這些客戶也正使用Vera Rubin平臺(tái)助力AI推理以及訓(xùn)練。

在軟件上,NVIDIA也推出了Nemotron 3 Ultra這款開(kāi)源模型,最高實(shí)現(xiàn)5倍的AI推理速度,同樣可以提升企業(yè)的推理效率,并且NVIDIA表示借助Open Shell安全沙盒,可以讓企業(yè)在使用Nemotron 3 Ultra的時(shí)候有效地保證數(shù)據(jù)的安全,并且NVIDIA也嚴(yán)格遵守?cái)?shù)據(jù)隱私,從而讓企業(yè)能夠更加安心地使用這款模型。NVIDIA也提供了豐富的CUDA X庫(kù),通過(guò)海量的技能來(lái)讓AI代理變得更加高效。

微信圖片_20260601143310.png

當(dāng)然上述都是NVIDIA面向企業(yè)所打造的產(chǎn)品,針對(duì)普通消費(fèi)者尤其是AI學(xué)習(xí)者或者開(kāi)發(fā)者, NVIDIA也與微軟深度合作,推出了RTX Spark處理器。該處理器融合了NVIDIA Grace CPU以及Blackwell RTX GPU,擁有6144顆CUDA核心,基于第五代Tensor Core最高可以實(shí)現(xiàn)1PFLOPS的FP4 AI算力,Grace CPU與聯(lián)發(fā)科共同打造,最高擁有20核,NVIDIA借助NVLink-C2C芯片互聯(lián)技術(shù)讓CPU與GPU之間實(shí)現(xiàn)高速互聯(lián),借助128GB統(tǒng)一內(nèi)存實(shí)現(xiàn)超大AI模型的本地化運(yùn)行。NVIDIA與微軟和其他合作伙伴一起,讓AI模型能夠更加高效、安全地在RTX Spark平臺(tái)下運(yùn)行,這也是解決目前AI開(kāi)發(fā)者的一個(gè)痛點(diǎn)。

QQ20260601-123251_副本.png

QQ20260601-123351_副本.png

NVIDIA將RTX Spark定義為三種不同的形態(tài),包括筆記本、臺(tái)式機(jī)和工作站, 三種形態(tài)應(yīng)對(duì)不同的使用場(chǎng)景,不過(guò)都需要滿足數(shù)據(jù)中心 AI、游戲以及專(zhuān)業(yè)創(chuàng)作等復(fù)雜任務(wù)。開(kāi)發(fā)者可以輕松地在RTX Spark平臺(tái)上從事90GB超大3D場(chǎng)景的渲染,120B大小模型的推理,玩家也可以在2K分辨率下以100幀率的速度暢玩3A大作,專(zhuān)業(yè)用戶也可以在RTX Spark上高效運(yùn)行數(shù)字生物、地震處理、天體物理等應(yīng)用。華碩、戴爾、惠普、聯(lián)想等企業(yè)已經(jīng)順利研發(fā)基于RTX Spark平臺(tái)打造的筆記本,在COMPUTEX 2026期間會(huì)陸續(xù)發(fā)布,大概率在秋季正式發(fā)售。老黃也將借助RTX Spark重新定義AI PC,并預(yù)言稱(chēng)未來(lái)的PC將會(huì)成為工作流中的超級(jí)計(jì)算機(jī)

QQ20260601-124155_副本.png

目前NVIDIA的AI硬件不僅僅滿足于傳統(tǒng)的PC以及高性能計(jì)算,像是智能汽車(chē)以及智能機(jī)器人都使用NVIDIA的硬件與AI模型,在本次的GTC大會(huì)上,NVIDIA也推出了Cosmos-3世界模型,能夠有效地解決人形機(jī)器人以及自動(dòng)駕駛中數(shù)據(jù)稀缺的情況,Alpa Mile-2模型也可以讓智能汽車(chē)變得更加智能,滿足在高速以及城市道路中復(fù)雜場(chǎng)景下的自動(dòng)駕駛。同時(shí)Isaac GR00T還可以讓人形機(jī)器人變得更智能,自由度也更高,已經(jīng)有包括宇樹(shù)等企業(yè)采用NVIDIA的最新解決方案研發(fā)人形機(jī)器人。

QQ20260601-124941_副本.png

毫無(wú)疑問(wèn)在代理式AI年代,AI已經(jīng)不僅僅是一款?yuàn)蕵?lè)工具,它已經(jīng)開(kāi)始為企業(yè)創(chuàng)造價(jià)值,極大程度地提升企業(yè)的工作效率,同時(shí)也讓開(kāi)發(fā)者的編程效率大幅提升。整個(gè)行業(yè)此時(shí)對(duì)于高算力AI硬件的需求也達(dá)到了前所未有的程度,對(duì)于提供工具的NVIDIA來(lái)說(shuō),顯然對(duì)旗下產(chǎn)品進(jìn)行快速迭代更新才能在這場(chǎng)AI盛宴中站穩(wěn)腳跟,并且在代理式AI時(shí)代仍然成為行業(yè)矚目的掌舵人,也讓自家的AI生態(tài)與標(biāo)準(zhǔn)牢牢地與行業(yè)綁定,從而支撐公司業(yè)績(jī)的快速成長(zhǎng)。


發(fā)表評(píng)論注冊(cè)|