NVIDIA GTC推出RTX Spark平臺：128GB統一內存，實現120B模型本地推理

白貓 / 2026-06-01 15:43214459

標簽：COMPUTEX2026

AI在這數年間發展迅猛，尤其是從2025年開始的AI風潮，更是讓整個科技行業迎來了前所未有的機遇。其中NVIDIA自然成為了這場AI盛宴的最大贏家。伴隨著小龍蝦的火爆，代理式AI已經成為了目前AI發展的最新階段，代理式AI的火爆也讓大企業以及個人對于AI算力的需求達到了前所未有的程度，像是NVIDIA這樣的AI企業也正不斷地推出海量的硬件產品來滿足行業的需求。

本屆GTC Taipei于6月1日至4日在臺北國際會議中心舉辦，NVIDIA CEO黃仁勛也在6月1日舉辦主題演講，展示和介紹NVIDIA是如何圍繞AI工廠、代理式AI、物理AI以及機器人去打造硬件產品以及建立相關的AI生態，很顯然NVIDIA希望能夠成為代理式AI時代的掌舵者。

QQ20260601-114904_副本.png

QQ20260601-114700_副本.png

首先是Vera Rubin AI超算，NVIDIA表示這款產品專門為代理式AI設計，在之前的GTC大會上已經正式發布，不過經過NVIDIA的打磨與合作伙伴的適配。如今NVIDIA已經正式出貨Vera Rubin，這是專門為代理式AI打造的一整臺計算平臺，與以往NVIDIA的計算平臺有所不同的是，Vera Rubin平臺實際上是由多款產品共同打造的AI解決方案，包括Vera Rubin NVL72、Vera CPU、Groq 3 LPX、BlueField-4 STX以及Spectrum-6這五個互聯的機架構成，能夠借助強大的算力讓企業獲得無與倫比的AI體驗。

QQ20260601-115108_副本.png

QQ20260601-120117_副本.png

在如今的AI推理年代，CPU已經愈發重要，甚至在一定程度上成為了制約AI推理的重要因素，因此NVIDIA這一次選擇了自研的Vera CPU，擁有最高88顆核心以及176個線程，最高擁有1.2TB/s的內存帶寬，與傳統的X86處理器相比，帶寬提升2倍，并且Vera CPU在代理式AI上的性能比X86高出了80%，延遲也更低，Token的消耗量能夠減少10倍，從而降低企業的算力成本。目前Vera Rubin平臺已經陸續銷往客戶手中，這些客戶也正使用Vera Rubin平臺助力AI推理以及訓練。

在軟件上，NVIDIA也推出了Nemotron 3 Ultra這款開源模型，最高實現5倍的AI推理速度，同樣可以提升企業的推理效率，并且NVIDIA表示借助Open Shell安全沙盒，可以讓企業在使用Nemotron 3 Ultra的時候有效地保證數據的安全，并且NVIDIA也嚴格遵守數據隱私，從而讓企業能夠更加安心地使用這款模型。NVIDIA也提供了豐富的CUDA X庫，通過海量的技能來讓AI代理變得更加高效。

微信圖片_20260601143310.png

當然上述都是NVIDIA面向企業所打造的產品，針對普通消費者尤其是AI學習者或者開發者， NVIDIA也與微軟深度合作，推出了RTX Spark處理器。該處理器融合了NVIDIA Grace CPU以及Blackwell RTX GPU，擁有6144顆CUDA核心，基于第五代Tensor Core最高可以實現1PFLOPS的FP4 AI算力，Grace CPU與聯發科共同打造，最高擁有20核，NVIDIA借助NVLink-C2C芯片互聯技術讓CPU與GPU之間實現高速互聯，借助128GB統一內存實現超大AI模型的本地化運行。NVIDIA與微軟和其他合作伙伴一起，讓AI模型能夠更加高效、安全地在RTX Spark平臺下運行，這也是解決目前AI開發者的一個痛點。

QQ20260601-123251_副本.png

QQ20260601-123351_副本.png

NVIDIA將RTX Spark定義為三種不同的形態，包括筆記本、臺式機和工作站，三種形態應對不同的使用場景，不過都需要滿足數據中心 AI、游戲以及專業創作等復雜任務。開發者可以輕松地在RTX Spark平臺上從事90GB超大3D場景的渲染，120B大小模型的推理，玩家也可以在2K分辨率下以100幀率的速度暢玩3A大作，專業用戶也可以在RTX Spark上高效運行數字生物、地震處理、天體物理等應用。華碩、戴爾、惠普、聯想等企業已經順利研發基于RTX Spark平臺打造的筆記本，在COMPUTEX 2026期間會陸續發布，大概率在秋季正式發售。老黃也將借助RTX Spark重新定義AI PC，并預言稱未來的PC將會成為工作流中的超級計算機。

QQ20260601-124155_副本.png

目前NVIDIA的AI硬件不僅僅滿足于傳統的PC以及高性能計算，像是智能汽車以及智能機器人都使用NVIDIA的硬件與AI模型，在本次的GTC大會上，NVIDIA也推出了Cosmos-3世界模型，能夠有效地解決人形機器人以及自動駕駛中數據稀缺的情況，Alpa Mile-2模型也可以讓智能汽車變得更加智能，滿足在高速以及城市道路中復雜場景下的自動駕駛。同時Isaac GR00T還可以讓人形機器人變得更智能，自由度也更高，已經有包括宇樹等企業采用NVIDIA的最新解決方案研發人形機器人。

QQ20260601-124941_副本.png

毫無疑問在代理式AI年代，AI已經不僅僅是一款娛樂工具，它已經開始為企業創造價值，極大程度地提升企業的工作效率，同時也讓開發者的編程效率大幅提升。整個行業此時對于高算力AI硬件的需求也達到了前所未有的程度，對于提供工具的NVIDIA來說，顯然對旗下產品進行快速迭代更新才能在這場AI盛宴中站穩腳跟，并且在代理式AI時代仍然成為行業矚目的掌舵人，也讓自家的AI生態與標準牢牢地與行業綁定，從而支撐公司業績的快速成長。