重振半導體領導者榮光：解讀英特爾2021架構日

白貓 / 2021-08-21 09:55228096

在半導體領域，英特爾絕對是一家繞不開的公司，作為半導體領域的巨頭，英特爾過去為大家帶來了相當多的黑科技，同時在CPU市場也是絕對的霸主，只不過近幾年AMD的強勢讓Intel這家半導體巨頭倍感壓力，旗下的處理器的產品似乎也少了點競爭力。特別是其推出的11代酷睿處理器，遭到了市場的冷落，玩家對此也是興趣寥寥。

QQ截圖20210820173549.jpg

而12代酷睿處理器似乎成為了英特爾的一根救命稻草，事實上作為第一款采用性能混合架構的量產處理器，12代酷睿處理器在曝光之時就受到了消費者的特別關注。而英特爾在今天舉辦的2021架構日上，向公眾詳細地介紹了12代酷睿處理器，并且也介紹了包括DG2顯卡、Sapphire Rapids以及Ponte Vecchio等諸多黑科技產品，向世人們證明自己才是半導體領域真正的大哥。可以說干貨滿滿，下面我們就通過這篇文章為大家帶來對于英特爾2021架構日的解讀。

作為和大家息息相關的硬件，英特爾的12代酷睿處理器自然是值得一說的，在遭遇了11代酷睿處理器的滑鐵盧之后，英特爾也希望能夠通過12代酷睿處理器再次奪取CPU王者的地位。

QQ截圖20210820173522.jpg

首先是架構，過去很長一段時間內，X86架構的CPU都采用了相同的核心，而現在英特爾終于將性能混合架構帶入到了12代酷睿處理器之中。不過12代酷睿處理器并非是英特爾第一款采用性能混合架構設計的CPU，過去Intel演示了Lakefield處理器，不過更多的還是以試水為主，市面上也難以見到這款處理器。可以說12代酷睿處理器是第一款采用性能混合架構的量產處理器。

QQ截圖20210820173615.jpg

對于英特爾來說，僅僅是性能混合架構的稱呼顯然不能完整闡述這兩顆核心，事實上它們除了在性能上有所不同之外，在功能上同樣有所區別。英特爾將大核心稱之為“性能核心”或者稱P核心，采用的是Golden Cove架構，支持AVX 512指令集以及DLBoost深度學習等功能，并且還支持超線程功能，最高可以達到8核16線程。而小核心稱之為“效能核心”或者稱為E核心，基于Gracemont架構，最高支持8核8線程，并不支持包括AVX 512在內的各種功能。也就是說12代酷睿處理器最高擁有16核心24線程的規格。

首先我們先來看下基于Golden Cove架構下的P核，P核基于11代酷睿處理器改進而來，除了架構進行了改良之外，對于CPU的基礎運算進行了大量的革新，這種設計理念未來將會影響到Intel今后的處理器設計思路。

QQ截圖20210820173638.jpg

相比較11代酷睿處理器，P核的解碼器從過去的4個升級到了6個，6μop緩存增至8μop，分配由5路增至6路，而物理寄存器也擴大了不少，重排序緩沖區提升至512條目。同時英特爾還大幅提升了12代酷睿處理器的分支預測準確度，這樣子可以降低一級的時延，并且提升了二級的預測帶寬。而且P核還搭載了英特爾高級矩形擴展，內置了下一代的AI加速技術，可用于學習推理以及訓練，讓CPU的數學運算更加強勁。

QQ截圖20210820173623.jpg

對于消費者來說，這些改進或許十分地陌生，英特爾也給出了P核的具體性能提升，相比較11代酷睿處理器，P核的平均IPC提升了19%，換句話說就是在同頻下性能提升19%，考慮到更加先進的工藝帶來的頻率提升，實際的單線程提升將會高于19%，這個提升幅度對于游戲玩家來說顯然更有益處，那就是單線程性能的提升帶來的結果就是游戲幀率的提升。

QQ截圖20210820173718.jpg

Intel的P核性能還是相當給力，除了P核之外，12代酷睿處理器還首次搭載了小核心的E核。E核實際上基于的是Atom家族，采用Gracemont架構，這是一款為低功耗設備所打造的處理器，而這一次也是其首次來到主流處理器之中。與P核相比，E核在面積上就小了很多，比如說一顆P核的面積可以塞下四顆E核的面積，同時四顆E核共享4MB的二級緩存。

QQ截圖20210820173730.jpg

QQ截圖20210820173750.jpg

盡管是Atom家族，但是過去幾年英特爾也在Atom家族中下了苦功夫。比如說和Skylake相比，Gracemont核心的延遲性能比Skylake提升40%，同性能下的功耗比降低40%，而數據吞吐峰值量更可以提升80%。英特爾也稱小核心設計可以在有限的芯片空間內，實現多核任務負載，換句話說就是降低CPU的功耗。需要注意的是，英特爾所說的小核心性能對比指的是延遲性能以及數據吞吐量這種，并不是CPU的絕對性能，至于Gracemont核心的絕對性能能夠達到怎樣的水平，我們還是需要等到12代酷睿處理器正式發布之后才能知曉。

QQ截圖20210820173555.jpg

盡管P核與E核的設計對于平衡性能與功耗大有益處，但是如何讓CPU的資源進行合理的調配卻大有學問，在X86處理器進入到性能混合架構時代之前，ARM處理器早已進入了混合架構設計，而目前的旗艦處理器甚至已經進入到三叢集時代，然而實際效果相信大家也看到了，手機處理器中翻車的可不在少數，如何能夠完美調度E核與P核，是英特爾的工程師們需要解決的一個棘手的問題。

對此英特爾發明了一項叫做“Thread Director”或者說線程調度器的設計，來調配P核與E核之間的計算資源。首先英特爾在CPU中嵌入了一個微型控制器，這個控制器用來監視每個線程的計算負載與參數，包括延遲、指令類型等，隨后英特爾將會把這些線程的參數告知微軟Windows 11中的系統調度器，由Win11來決定哪款進程適合P核，又有哪款進程適合E核，英特爾稱Thread Director最快只要30微妙就可以確定線程狀態，這可比傳統的系統調度器快得多，這項技術在移動端領域尤其重要。

從文章之中大家也發現了，想要讓Thread Director發揮最佳的作用，采用的系統自然是微軟Win11系統，不過即使是Win11系統，目前微軟與英特爾之間還需要更多時間去磨合，讓CPU的調度更加準確，至于Win10系統，英特爾表示現在還在初步的調試，所花費的時間也就更高，從英特爾的表態來看，還是建議Win10系統的用戶升級Win11系統。

QQ截圖20210820173901.jpg

英特爾在架構日上也公布了三款不同類型的12代酷睿處理器，除了桌面版之外也包括移動標壓處理器與低壓處理器，它們三款的Gracemont核心最高均為八個，桌面版采用LGA 1700接口，而移動標壓處理器則是6+8架構，14核20線程，至于超低壓處理器，則是2+8架構，10核12線程，移動版處理器在GPU上最高采用96EU單元，圖形性能還是值得肯定的。

QQ截圖20210820173919.jpg

除了上述主要的架構介紹之外，12代酷睿處理器也支持包括DDR5-4800、DDR4-3200、LPDDR5-5200、LPDDR4X-4266等多種內存制式，讓用戶正式進入DDR5內存時代，此外12代酷睿處理器也將原生支持PCIe 5.0，帶來更為充裕的帶寬。只不過PCIe 5.0對于目前的存儲設備以及顯卡來說遠遠過剩，算是錦上添花的功能。同時12代酷睿處理器擁有三種不同的高速通道，包括Compute Fabric、Memory Fabric以及I/O Fabric，三者帶寬分別是1TB/S，204GB/S以及64GB/S，充裕的帶寬顯然大大降低了處理器之間的傳輸延遲。

QQ截圖20210820174559.jpg

除了12代酷睿處理器之外，英特爾也在2021架構日上介紹了DG2架構GPU，當然現在英特爾將采用該架構的顯卡稱之為Intel Arc顯卡，中文名為英特爾銳炫。與DG1相比，英特爾銳炫顯卡專門為游戲發燒友打造，預計第一批產品將會在2022年第一季度和大家正式見面，屆時除了NV和AMD之外，游戲顯卡終于來了第三位選手。

QQ截圖20210820174609.jpg

英特爾在過去推出的各類GPU中，都采用了“執行單元”，而到了DG2架構中，則變成了全新的Xe內核，從命名就可以看到，英特爾對Xe架構顯卡進行了重新設計。從架構圖來看， DG2顯卡類似于NVIDIA的顯卡，每個Xe內核中，包含著16個矢量引擎，以及16個矩陣數學引擎，這些引擎用來進行FP32、FP16以及INT8的計算，也就是傳統的單精度以及AI計算。除了Xe內核之外，Intel也介紹了圖形單元簇，將其稱之為渲染切片，這是專門為圖形處理所搭載的架構，包括四個Xe內核以及為3D渲染所打造的計算單元，比如說光追單元，紋理單元、幾何前端，能夠支持DX12U的各種特征以及實時光線追蹤，同時也將支持類似于DLSS的XeSS功能。

XeSS使用深度學習來合成非常接近原生高分辨率渲染質量的圖像，在實際演示中，基于XeSS技術的虛幻5引擎的4K渲染圖像與原生4K相比幾乎不變，體現在游戲上就是幀率的增加。

QQ截圖20210820174645.jpg

QQ截圖20210820174655.jpg

而在純算力上，Intel銳炫顯卡的頻率提升幅度為50%，而且每瓦性能提升幅度也達到了50%，從而帶來更高的算力。為了讓英特爾的這款顯卡能夠發揮最出色的性能，英特爾也選擇了臺積電的6nm工藝，同時在驅動程序上，英特爾也和諸多游戲開發者一起，對Xe架構進行不斷地優化，目前該項工作已經有了初步的成效，在密集型圖形游戲之中，吞吐量提升15%，最高可以達到80%，從而讓游戲加載時間降低了25%。當然距離顯卡的正式發布還有近半年的時間，未來英特爾也將不斷地對顯卡進行改良，讓其更加符合游戲玩家的期盼。

當然除了這兩個大家最為關注的硬件之外，英特爾也在本次架構會上介紹了面向數據中心的Sapphire Rapids至強處理器與面向超算的Xe HPC和Ponte Vecchio。其中Sapphire Rapids基于Intel 7制程工藝技術，支持加速器接口架構指令集、高級矩陣擴展，以及數據流加速器，能夠提供更高的整體工作負載性能，在CPU、內存和緩存以及所有附加的內存、存儲和網絡設備之間移動數據。當然作為面向數據中心的新一代處理器，Sapphire Rapids通過先進的內存和下一代I/O，包括PCIe 5.0、CXL 1.1、DDR5和HBM技術，來推動行業技術轉型。

QQ截圖20210820174015.jpg

英特爾在之前表示Xe架構的GPU是一個大家族，除了面向發燒級玩家的Arc顯卡之外，也有針對超算推出的采用Xe HPC架構的Ponte Vecchio。Ponte Vecchio由多個復雜的單元構成，通過嵌入式多芯片互連橋接進行封裝，實現了設備之間的低功耗與高速的連接。

QQ截圖20210820174625.jpg

QQ截圖20210820174059.jpg

英特爾表示在Ponte Vecchio中，每一個單元均有8個Xe內核，提供4MB的一級緩存，基于臺積電最先進的5nm制程工藝，目前Ponte Vecchio芯片還處于早期的A0階段，不過先進的工藝以及豪華的參數已經可以讓其實現45T的FP32吞吐量，內存帶寬達到了5TBps，連接帶寬也達到了2TBps，英特爾稱通過訓練，目前A0芯片已經可以實現每秒43000張圖像的識別，達到了行業領先的水準。毫無疑問Ponte Vecchio的出現讓NVIDIA Tesla計算卡面臨巨大的挑戰，同時也可以讓整個超算行業得到進一步的發展。

除了上述這些硬件產品之外，英特爾也介紹了oneAPI，一個開放、規范、跨架構和跨廠商的統一軟件棧，讓開發者能夠擺脫專有語言和編程模型的束縛。未來也將有越來越多的開發者采用英特爾的oneAPI進行開發和優化，從而提升開發者的實際生產能力。

在本次的架構日上，英特爾為消費者以及企業用戶帶來了海量的架構說明，可以說是干貨十足，尤其是12代酷睿處理器，對于現在的消費級市場來說無疑是一針強心劑，讓英特爾能夠在日益激烈的CPU市場中占領腳跟。事實上對于X86架構的處理器來說，性能核與性能核的設計無疑是一個全新的領域，未來該設計是否成功，一切都是未知數，而英特爾作為半導體領域的領導者，勇敢地跨出了這一步，顯然還是有做大哥的擔當。我們也發現，想要讓英特爾新一代的產品發揮最出色的作用，毫無疑問軟件廠商需要跟上，接下來大家就應該期待微軟為消費者帶來一套令人滿意的Win11系統了。

重振半導體領導者榮光：解讀英特爾2021架構日

發表評論注冊|登錄

熱點資訊

好物推薦