傳統(tǒng)與AI性能兩開花：AMD Zen 5架構(gòu)處理器全解析

白貓 / 2024-07-15 21:0084295

如今我們?cè)缫堰M(jìn)入了AI時(shí)代，包括ChatGPT、LLM等模型應(yīng)用已經(jīng)讓人們的生活得到天翻地覆的變化，對(duì)于CPU等硬件廠商來說，AI大規(guī)模普及帶來的算力要求達(dá)到了前所未有的程度，除了面向AI訓(xùn)練的服務(wù)器級(jí)別的硬件之外，主要用于AI推理的消費(fèi)級(jí)處理器同樣也需要強(qiáng)大的算力，讓AI應(yīng)用更加高效。

QQ截圖20240714225651.jpg

在臺(tái)北Computex 2024中，AMD發(fā)布了Zen 5架構(gòu)處理器，包括銳龍AI 300系以及銳龍9000系處理器，就在上周，AMD于洛杉磯舉辦了2024年的Tech Day活動(dòng)，為大家詳細(xì)介紹了Zen 5處理器的性能、參數(shù)以及與之配套的應(yīng)用。熱點(diǎn)科技也受邀來到現(xiàn)場(chǎng)，為大家?guī)鞿en 5架構(gòu)的詳細(xì)介紹。

Zen 5：徹底優(yōu)化，新制程架構(gòu)讓AI應(yīng)用得心應(yīng)手

首先是Zen 5架構(gòu)，Zen 5架構(gòu)擁有6個(gè)ALU，數(shù)量是上一代的3倍，此外AMD也表示銳龍9000系列處理器的調(diào)度器更加統(tǒng)一，從而能夠讓數(shù)據(jù)處理更加高效。以滿足AI、游戲等應(yīng)用的高效運(yùn)行。此外Zen 5也采用了48KB的12路L1緩存，在浮點(diǎn)運(yùn)算以及最大帶寬上均是上代的2倍，當(dāng)然Zen 5處理器也同樣支持完整版的AVX512指令，從而在一些專業(yè)應(yīng)用上有事半功倍的作用。

QQ截圖20240714225947.jpg

值得注意的是，與移動(dòng)處理器有所不同的是，AMD銳龍9000桌面處理器并沒有加入NPU，預(yù)計(jì)未來桌面CPU的主要功能還是與GPU打配合，從而滿足復(fù)雜的AI應(yīng)用。具體到大家關(guān)心的性能數(shù)據(jù)上，AMD Zen5的IPC相比較Zen 4提升了16%左右，這個(gè)成績(jī)還是相當(dāng)令人滿意的，畢竟除了IPC之外，基于Zen 5打造的銳龍9000系處理器在頻率上同樣有所提升。

QQ截圖20240714225957.jpg

在AI應(yīng)用上，Zen 5表現(xiàn)得就更加出色，其中機(jī)器學(xué)習(xí)應(yīng)用中，單核性能至高可以提升32%，而AES-XTS加密算法性能提升將達(dá)到35%，從而在新興應(yīng)用中充分壓榨處理器的性能。此外Zen 5也采用了臺(tái)積電的4nm以及3nm制程架構(gòu)，從而在頻率、性能、功耗等方面都處于行業(yè)領(lǐng)先。此外這一次AMD也表示Zen 5架構(gòu)將會(huì)應(yīng)用于各個(gè)領(lǐng)域，除了桌面與移動(dòng)處理器之外，包括EPYC霄龍?zhí)幚砥饕约扒度胧教幚砥鞯榷紝⒉捎肸en 5架構(gòu)，從而讓企業(yè)部署更加得心應(yīng)手。

銳龍9000系處理器：綜合性能最優(yōu)

對(duì)于桌面級(jí)用戶來說，銳龍9000系處理器的出現(xiàn)能夠讓游戲表現(xiàn)更加出色，當(dāng)然全新的Zen 5架構(gòu)也讓整個(gè)處理器的綜合表現(xiàn)達(dá)到前所未有的程度，而這種表現(xiàn)不僅僅是簡(jiǎn)單的性能，更包括功耗以及溫度。

QQ截圖20240714225703.jpg

首先是這一次的銳龍9000系處理器首發(fā)包括四個(gè)不同的型號(hào)，也就是銳龍9 9950X、銳龍9 9900X、銳龍7 9700X以及銳龍5 9600X，從核心以及線程數(shù)來看，它們與銳龍7000系處理器也沒有什么區(qū)別，分別為16核32線程、12核24線程、8核16線程以及6核12線程，頻率方面分別為5.7GHz/5.6GHz/5.5GHz以及5.4GHz。這些實(shí)際參數(shù)也已經(jīng)在臺(tái)北電腦展上公布了。

QQ截圖20240714225711.jpg

具體到實(shí)際性能，AMD銳龍9 9900X處理器與Intel Core i9-14900K相比，生產(chǎn)力性能提升幅度在10%，而游戲性能則領(lǐng)先13%上下。AMD銳龍7 9700X處理器與Intel Core i7-14700K相比，生產(chǎn)力性能領(lǐng)先15%，游戲性能領(lǐng)先12%，而銳龍5 9600X在生產(chǎn)力應(yīng)用中性能領(lǐng)先20%，游戲性能提升11%。至于為什么沒有銳龍9 9950X處理器的對(duì)比，大概率就是因?yàn)槟壳斑€沒有一個(gè)合適的對(duì)手吧。

QQ截圖20240714225725.jpg

不過如果光是從游戲性能來說，除了AMD老對(duì)手英特爾酷睿處理器之外，AMD銳龍9000系處理器還有一個(gè)自家兄弟需要競(jìng)爭(zhēng)，那就是擁有超大緩存的X3D系列處理器，AMD拿出銳龍7 9700X處理器以及銳龍7 5800X3D處理器作為對(duì)比對(duì)象，應(yīng)該是認(rèn)為這顆處理器算得上是最適合游戲玩家的處理器產(chǎn)品。在官方給出的對(duì)比圖中，銳龍7 9700X處理器的游戲性能平均提升12%，還是相當(dāng)給力的。

當(dāng)然AMD也承認(rèn)，在一些特別吃緩存的游戲中，還是X3D系列處理器更有優(yōu)勢(shì)，并且與銳龍7000系X3D處理器相比，銳龍7 9700X處理器只能算是打得有來有回，不出意外的話未來AMD也將推出基于Zen 5架構(gòu)打造的X3D系列處理器，從而在游戲性能上更加出色。事實(shí)上新的制程以及架構(gòu)紅利讓銳龍9000系處理器不但在絕對(duì)性能上讓人滿意，更是在溫度以及功耗上可以帶來十分驚艷的表現(xiàn)。

QQ截圖20240714225746.jpg

除了旗艦銳龍9 9950X處理器仍然保持170W的TDP之外，其他三款處理器在TDP上均有所下降，銳龍9 9900X變成了120w，而銳龍7 9700X以及銳龍5 9600X處理器的TDP為65W。熱阻效率提升了15%，從而讓在相同TDP下，銳龍9000系處理器的溫度下降幅度大約為7攝氏度。再加上改良過的PBO策略，新一代的銳龍9000系處理器將不再是火龍而讓人頭疼，主流處理器達(dá)到95攝氏度閾值的這種情況應(yīng)該不會(huì)在默認(rèn)設(shè)置下再次出現(xiàn)。

QQ截圖20240714225734.jpg

可以說改良之后的銳龍9000系處理器不但在性能上有比較大的提升，功耗以及溫度的下降也讓處理器當(dāng)之無愧地成了如今綜合性能最為出色的處理器終端，銳龍9000系處理器將于7月31日正式發(fā)售。

銳龍AI 300系處理器：集AI大成于一身

銳龍9000系處理器如果說是桌面處理器的巔峰的話，那么銳龍AI 300系處理器則是集AI大成于一身的新一代APU，除了CPU之外，包括RDNA 3.5 GPU以及XDNA 2 NPU更是讓這顆處理器擁有極其出色的圖形以及AI算力。

QQ截圖20240714230008.jpg

AMD兩款銳龍AI 300系處理器包括銳龍AI 9 HX 370以及銳龍AI 9 365處理器，前者擁有12核24線程的規(guī)格，最高頻率5.1GHz，擁有36MB的緩存，搭載Radeon 890M移動(dòng)顯卡，后者則擁有10核20線程的規(guī)格，最高頻率為5.0GHz，34MB的緩存，搭載Radeon 880M移動(dòng)顯卡。AMD將大頭放到了銳龍AI 300系處理器的NPU上，實(shí)際上這一次的Tech Day對(duì)于銳龍AI 300系處理器的CPU和GPU著墨就沒有這么多了。CPU在架構(gòu)上與桌面處理器相差不大，而GPU則采用了RDNA 3.5架構(gòu)，在能效比以及帶寬上擁有更高的表現(xiàn)，同時(shí)AMD也表示RDNA 3.5能夠?yàn)楣P記本帶來更高的續(xù)航。

QQ截圖20240714230304.jpg

與上一代GPU相比，RDNA 3.5的紋理渲染率達(dá)到了2倍，并且顯存帶寬也將有所增加，具體到實(shí)際表現(xiàn)上，與Hawk Point處理器相比，TimeSpy性能提升32%，而Night Raid提升19%，這還是在15W條件下的使用場(chǎng)景，如果TDP提升至25W或者35W，那么GPU性能將會(huì)提升更大。在臺(tái)北電腦展上AMD就已經(jīng)公布了一部分的測(cè)試成績(jī)，應(yīng)對(duì)1080P分辨率的游戲也是完全沒有任何的問題。

當(dāng)然銳龍AI 300系處理器中的C位選手顯然是NPU，AMD也花大量的時(shí)間為大家介紹基于XDNA 2打造的全新一代NPU。首先是AI，AMD表示對(duì)于不同的AI應(yīng)用負(fù)載，所需要的算力實(shí)際上也是不同的，例如高負(fù)載過去一直使用GPU，而輕度AI負(fù)載由CPU負(fù)責(zé)，但是CPU需要負(fù)責(zé)通用任務(wù)，而GPU更多地使用在圖形渲染上，兩者處理AI任務(wù)的效率談不上特別高，這時(shí)候就要第三種處理單元也就是專門為AI打造的NPU登場(chǎng)。

QQ截圖20240714230044.jpg

QQ截圖20240714230051.jpg

AMD表示對(duì)于AI應(yīng)用來說，不同應(yīng)用的模型大小實(shí)際上有著很大的不同，比如說實(shí)現(xiàn)實(shí)時(shí)應(yīng)用的AI特效所使用的模型就十分小巧，不需要太大的AI算力，但是像是Stable Diffusion 或者是LLM，就需要更大的AI算力，甚至還需要GPU來幫忙，但是GPU的功耗十分高。如果以能效比計(jì)算，GPU是CPU的8倍，而NPU則是CPU的35倍，因此越來越多的廠商將NPU植入到處理器之中。而AMD也是世界上首個(gè)將NPU植入到X86處理器中的廠商，也初步打造了屬于自己的AI生態(tài)系統(tǒng)。

QQ截圖20240714230108.jpg

傳統(tǒng)的多核處理器的計(jì)算單元之間相對(duì)比較獨(dú)立，在進(jìn)行計(jì)算的時(shí)候需要先通過緩存才能進(jìn)行數(shù)據(jù)交換，這樣無形中添加了數(shù)據(jù)交換的延遲，而到了XDNA AI引擎中，計(jì)算模塊共同在一個(gè)大的計(jì)算單元之中，相互之間為并行狀態(tài)，從而能夠更加快捷地從事特定任務(wù)例如AI的計(jì)算，AMD XDNA 2則將AI計(jì)算單元進(jìn)行了大幅擴(kuò)容，從20個(gè)AI引擎提升到了32個(gè)AI引擎，進(jìn)而讓AI算力從10TOPS狂飆至50TOPS，算力提升5倍，并且效率也能提升2倍，從而讓AI筆記本在續(xù)航表現(xiàn)上更加出色。

QQ截圖20240714231330.png

除此之外，隨著AI應(yīng)用場(chǎng)景的不斷延伸，大家對(duì)于AI計(jì)算的精度也越來越高，傳統(tǒng)的INT8似乎已經(jīng)有點(diǎn)力不從心，但是FP32算力又太過于浪費(fèi)，因此AMD想到了FP16，它的算力遠(yuǎn)超F(xiàn)P32，并且精度也足夠使用，因此AMD選擇FP16以及INT8將其融合打造成為Block FP16數(shù)據(jù)類型，結(jié)合了16位數(shù)據(jù)的高精度和8位數(shù)據(jù)的高性能，使AI計(jì)算更高效，實(shí)際表現(xiàn)也同樣如此。

甚至和更高精度的FP32相比，Block FP16在特定場(chǎng)合也沒有太大的損失，滿足AI任務(wù)是完全沒有任何的問題。可以說在如今的技術(shù)水平下，Block FP16是讓消費(fèi)者處理器解決AI應(yīng)用的最優(yōu)選，此外50TOPS的NPU算力也是目前移動(dòng)處理器中最好的選擇。有了強(qiáng)大的NPU，再配合改良過后的GPU與CPU，AMD銳龍AI 300系處理器能夠帶給用戶無與倫比的綜合體驗(yàn)。

Ryzen AI：新技術(shù)讓應(yīng)用更加得心應(yīng)手

雖然AMD新一代銳龍AI 300系處理器的硬件很出色，但是沒有好的軟件只能讓處理器成為無米之炊，因此AMD也不斷地更新自家Ryzen AI的應(yīng)用，從而讓NPU發(fā)揮最強(qiáng)大的性能。

QQ截圖20240714230203.jpg

QQ截圖20240714230211.jpg

隨著AI的爆發(fā)，越來越多的用戶、科技企業(yè)以及資本涌入到這個(gè)行業(yè)之中，目前已經(jīng)有74萬個(gè)AI模型順利落地，2023年一共創(chuàng)造了155億張AI圖片，過去十年計(jì)算模型的規(guī)模也提升了整整1000倍，全球AI使用者也達(dá)到了3.14億，而這些數(shù)據(jù)又給AI不斷地學(xué)習(xí)與提升自我，進(jìn)一步推動(dòng)AI的發(fā)展。

QQ截圖20240714230314.jpg

作為底層操作系統(tǒng)，微軟對(duì)于AI的力度支持達(dá)到了前所未有的程度，目前微軟已經(jīng)宣布了Copilot+PC概念，未來借助支持Copilot的Win11來讓用戶的生活與工作效率更上一層樓。當(dāng)然AMD也已經(jīng)和微軟達(dá)成深度合作，微軟Copilot可以充分利用AMD的NPU來從事高效的AI計(jì)算。除此之外Stable Diffusion 3也在6月初的時(shí)候正式開源，能夠創(chuàng)造出與真實(shí)社會(huì)相媲美的圖片，而Stable Diffusion XL Turbo實(shí)現(xiàn)了AMD NPU的深度整合，從而讓AIGC更加高效。

QQ截圖20240714230137.jpg

QQ截圖20240714230233.jpg

AMD表示與友商相比，自家Block FP16能夠帶來極其明顯的優(yōu)勢(shì)，在訓(xùn)練和推理70億參數(shù)的Llama v2模型的時(shí)候，AMD的NPU算力可以提升整整五倍，而Agentic AI RAG的測(cè)試版本也已經(jīng)兼容AMD的銳龍AI 300系處理器，可以讓NPU直接運(yùn)行Llama2-7B模型，在測(cè)試成績(jī)給力的同時(shí)也讓能耗大幅下降。BlackMagicdesign則表示利用AMD的AI算力，可以讓生產(chǎn)力軟件的效率大幅提升，部分特效的處理時(shí)間甚至高出了4倍，從而滿足視頻工作者的工作效率。

同時(shí)包括Adobe、Amuse、Ollama、Huging Face等軟件廠商也已經(jīng)實(shí)現(xiàn)了Ryzen AI的支持，總計(jì)超過了100余款。當(dāng)然第三代Ryzen AI還不是終點(diǎn)，AMD還推出了North Star計(jì)劃，未來AMD的Ryzen AI將會(huì)支持300億參數(shù)的大模型，實(shí)現(xiàn)3000的語義長(zhǎng)度，并且首個(gè)Token的生成時(shí)間也將縮短到100ms，每秒可以生成100個(gè)Token，遠(yuǎn)超現(xiàn)在的數(shù)據(jù)，顯然AMD未來認(rèn)為AI能夠帶來前所未有的能量，而自己的處理器也是為AI而生。

這一次的AMD Tech給人感受最深的就是整個(gè)會(huì)議都圍繞著AI打造，畢竟現(xiàn)在AI的發(fā)展實(shí)在是太過出乎意料，尤其是當(dāng)資本大幅涌入之后，AI模型日新月異，大家對(duì)于AI的算力要求也達(dá)到了前所未有的程度，AMD推出的基于Zen 5架構(gòu)的處理器，可以很好地應(yīng)對(duì)消費(fèi)級(jí)的AI應(yīng)用，從而為用戶帶來不同尋常的使用體驗(yàn)，自然也能在這場(chǎng)AI時(shí)代中占盡先機(jī)。

不過我們也看到，AI發(fā)展得越快，算力要求也就越高，部分應(yīng)用像是Sora、Stable Diffusion 3.0都對(duì)AI提出了極其嚴(yán)苛的算力需求，而這已經(jīng)不僅僅是APU可以解決的，不過可以肯定的是，今后的很長(zhǎng)一段時(shí)間內(nèi)，APU等處理器所負(fù)責(zé)的AI應(yīng)用覆蓋面將會(huì)越來越廣，而一些高要求的AI應(yīng)用，還將采用CPU與獨(dú)立顯卡搭配的組合，從而讓功耗以及效率保持一個(gè)完美的平衡。

點(diǎn)個(gè)贊2153

傳統(tǒng)與AI性能兩開花：AMD Zen 5架構(gòu)處理器全解析

發(fā)表評(píng)論注冊(cè)|登錄

熱點(diǎn)資訊

好物推薦