午夜神马影院-日本天堂在线-国产精品777-奇米影视亚洲春色-天堂8中文-日本在线观看一区二区-天天干天天操天天插-国产精品女同-色骚综合-四川一级毛毛片-99在线看-国产极品久久-波多野吉衣毛片-婷婷在线综合-欧美视频成人-亚洲影视一区二区三区-国产精品久久久久久久一区二区-国产精品9191-污污免费观看-日本三区在线

重振半導體領導者榮光:解讀英特爾2021架構日

重振半導體領導者榮光:解讀英特爾2021架構日

白貓 / 2021-08-21 09:55228096

在半導體領域,英特爾絕對是一家繞不開的公司,作為半導體領域的巨頭,英特爾過去為大家帶來了相當多的黑科技,同時在CPU市場也是絕對的霸主,只不過近幾年AMD的強勢讓Intel這家半導體巨頭倍感壓力,旗下的處理器的產品似乎也少了點競爭力。特別是其推出的11代酷睿處理器,遭到了市場的冷落,玩家對此也是興趣寥寥。

QQ截圖20210820173549.jpg

12代酷睿處理器似乎成為了英特爾的一根救命稻草,事實上作為第一款采用性能混合架構的量產處理器,12代酷睿處理器在曝光之時就受到了消費者的特別關注。而英特爾在今天舉辦的2021架構日上,向公眾詳細地介紹了12代酷睿處理器,并且也介紹了包括DG2顯卡、Sapphire Rapids以及Ponte Vecchio等諸多黑科技產品,向世人們證明自己才是半導體領域真正的大哥。可以說干貨滿滿,下面我們就通過這篇文章為大家帶來對于英特爾2021架構日的解讀。

作為和大家息息相關的硬件,英特爾的12代酷睿處理器自然是值得一說的,在遭遇了11代酷睿處理器的滑鐵盧之后,英特爾也希望能夠通過12代酷睿處理器再次奪取CPU王者的地位。

QQ截圖20210820173522.jpg

首先是架構,過去很長一段時間內,X86架構的CPU都采用了相同的核心,而現在英特爾終于將性能混合架構帶入到了12代酷睿處理器之中。不過12代酷睿處理器并非是英特爾第一款采用性能混合架構設計的CPU,過去Intel演示了Lakefield處理器,不過更多的還是以試水為主,市面上也難以見到這款處理器。可以說12代酷睿處理器是第一款采用性能混合架構的量產處理器。

QQ截圖20210820173615.jpg

對于英特爾來說,僅僅是性能混合架構的稱呼顯然不能完整闡述這兩顆核心,事實上它們除了在性能上有所不同之外,在功能上同樣有所區別。英特爾將大核心稱之為“性能核心”或者稱P核心,采用的是Golden Cove架構,支持AVX 512指令集以及DLBoost深度學習等功能,并且還支持超線程功能,最高可以達到816線程。而小核心稱之為“效能核心”或者稱為E核心,基于Gracemont架構,最高支持88線程,并不支持包括AVX 512在內的各種功能。也就是說12代酷睿處理器最高擁有16核心24線程的規格。

首先我們先來看下基于Golden Cove架構下的P核,P核基于11代酷睿處理器改進而來,除了架構進行了改良之外,對于CPU的基礎運算進行了大量的革新,這種設計理念未來將會影響到Intel今后的處理器設計思路。

QQ截圖20210820173638.jpg

相比較11代酷睿處理器,P核的解碼器從過去的4個升級到了6個,6μop緩存增至8μop,分配由5路增至6路,而物理寄存器也擴大了不少,重排序緩沖區提升至512條目。同時英特爾還大幅提升了12代酷睿處理器的分支預測準確度,這樣子可以降低一級的時延,并且提升了二級的預測帶寬。而且P核還搭載了英特爾高級矩形擴展,內置了下一代的AI加速技術,可用于學習推理以及訓練,讓CPU的數學運算更加強勁。

QQ截圖20210820173623.jpg

對于消費者來說,這些改進或許十分地陌生,英特爾也給出了P核的具體性能提升,相比較11代酷睿處理器,P核的平均IPC提升了19%,換句話說就是在同頻下性能提升19%,考慮到更加先進的工藝帶來的頻率提升,實際的單線程提升將會高于19%,這個提升幅度對于游戲玩家來說顯然更有益處,那就是單線程性能的提升帶來的結果就是游戲幀率的提升。

QQ截圖20210820173718.jpg

IntelP核性能還是相當給力,除了P核之外,12代酷睿處理器還首次搭載了小核心的E核。E核實際上基于的是Atom家族,采用Gracemont架構,這是一款為低功耗設備所打造的處理器,而這一次也是其首次來到主流處理器之中。與P核相比,E核在面積上就小了很多,比如說一顆P核的面積可以塞下四顆E核的面積,同時四顆E核共享4MB的二級緩存。

QQ截圖20210820173730.jpg

QQ截圖20210820173750.jpg

盡管是Atom家族,但是過去幾年英特爾也在Atom家族中下了苦功夫。比如說和Skylake相比,Gracemont核心的延遲性能比Skylake提升40%,同性能下的功耗比降低40%,而數據吞吐峰值量更可以提升80%。英特爾也稱小核心設計可以在有限的芯片空間內,實現多核任務負載,換句話說就是降低CPU的功耗。需要注意的是,英特爾所說的小核心性能對比指的是延遲性能以及數據吞吐量這種,并不是CPU的絕對性能,至于Gracemont核心的絕對性能能夠達到怎樣的水平,我們還是需要等到12代酷睿處理器正式發布之后才能知曉。

QQ截圖20210820173555.jpg

盡管P核與E核的設計對于平衡性能與功耗大有益處,但是如何讓CPU的資源進行合理的調配卻大有學問,在X86處理器進入到性能混合架構時代之前,ARM處理器早已進入了混合架構設計,而目前的旗艦處理器甚至已經進入到三叢集時代,然而實際效果相信大家也看到了,手機處理器中翻車的可不在少數,如何能夠完美調度E核與P核,是英特爾的工程師們需要解決的一個棘手的問題。

對此英特爾發明了一項叫做“Thread Director”或者說線程調度器的設計,來調配P核與E核之間的計算資源。首先英特爾在CPU中嵌入了一個微型控制器,這個控制器用來監視每個線程的計算負載與參數,包括延遲、指令類型等,隨后英特爾將會把這些線程的參數告知微軟Windows 11中的系統調度器,由Win11來決定哪款進程適合P核,又有哪款進程適合E核,英特爾稱Thread Director最快只要30微妙就可以確定線程狀態,這可比傳統的系統調度器快得多,這項技術在移動端領域尤其重要。

從文章之中大家也發現了,想要讓Thread Director發揮最佳的作用,采用的系統自然是微軟Win11系統,不過即使是Win11系統,目前微軟與英特爾之間還需要更多時間去磨合,讓CPU的調度更加準確,至于Win10系統,英特爾表示現在還在初步的調試,所花費的時間也就更高,從英特爾的表態來看,還是建議Win10系統的用戶升級Win11系統。

QQ截圖20210820173901.jpg

英特爾在架構日上也公布了三款不同類型的12代酷睿處理器,除了桌面版之外也包括移動標壓處理器與低壓處理器,它們三款的Gracemont核心最高均為八個,桌面版采用LGA 1700接口,而移動標壓處理器則是6+8架構,1420線程,至于超低壓處理器,則是2+8架構,1012線程,移動版處理器在GPU上最高采用96EU單元,圖形性能還是值得肯定的。

QQ截圖20210820173919.jpg

除了上述主要的架構介紹之外,12代酷睿處理器也支持包括DDR5-4800DDR4-3200LPDDR5-5200LPDDR4X-4266等多種內存制式,讓用戶正式進入DDR5內存時代,此外12代酷睿處理器也將原生支持PCIe 5.0,帶來更為充裕的帶寬。只不過PCIe 5.0對于目前的存儲設備以及顯卡來說遠遠過剩,算是錦上添花的功能。同時12代酷睿處理器擁有三種不同的高速通道,包括Compute FabricMemory Fabric以及I/O Fabric,三者帶寬分別是1TB/S204GB/S以及64GB/S,充裕的帶寬顯然大大降低了處理器之間的傳輸延遲。

QQ截圖20210820174559.jpg

除了12代酷睿處理器之外,英特爾也在2021架構日上介紹了DG2架構GPU,當然現在英特爾將采用該架構的顯卡稱之為Intel Arc顯卡,中文名為英特爾銳炫。與DG1相比,英特爾銳炫顯卡專門為游戲發燒友打造,預計第一批產品將會在2022年第一季度和大家正式見面,屆時除了NVAMD之外,游戲顯卡終于來了第三位選手。

QQ截圖20210820174609.jpg

英特爾在過去推出的各類GPU中,都采用了“執行單元”,而到了DG2架構中,則變成了全新的Xe內核,從命名就可以看到,英特爾對Xe架構顯卡進行了重新設計。從架構圖來看, DG2顯卡類似于NVIDIA的顯卡,每個Xe內核中,包含著16個矢量引擎,以及16個矩陣數學引擎,這些引擎用來進行FP32FP16以及INT8的計算,也就是傳統的單精度以及AI計算。除了Xe內核之外,Intel也介紹了圖形單元簇,將其稱之為渲染切片,這是專門為圖形處理所搭載的架構,包括四個Xe內核以及為3D渲染所打造的計算單元,比如說光追單元,紋理單元、幾何前端,能夠支持DX12U的各種特征以及實時光線追蹤,同時也將支持類似于DLSSXeSS功能。

XeSS使用深度學習來合成非常接近原生高分辨率渲染質量的圖像,在實際演示中,基于XeSS技術的虛幻5引擎的4K渲染圖像與原生4K相比幾乎不變,體現在游戲上就是幀率的增加。

QQ截圖20210820174645.jpg

QQ截圖20210820174655.jpg

而在純算力上,Intel銳炫顯卡的頻率提升幅度為50%,而且每瓦性能提升幅度也達到了50%,從而帶來更高的算力。為了讓英特爾的這款顯卡能夠發揮最出色的性能,英特爾也選擇了臺積電的6nm工藝,同時在驅動程序上,英特爾也和諸多游戲開發者一起,對Xe架構進行不斷地優化,目前該項工作已經有了初步的成效,在密集型圖形游戲之中,吞吐量提升15%,最高可以達到80%,從而讓游戲加載時間降低了25%。當然距離顯卡的正式發布還有近半年的時間,未來英特爾也將不斷地對顯卡進行改良,讓其更加符合游戲玩家的期盼。

當然除了這兩個大家最為關注的硬件之外,英特爾也在本次架構會上介紹了面向數據中心的Sapphire Rapids至強處理器與面向超算的Xe HPC和Ponte Vecchio。其中Sapphire Rapids基于Intel 7制程工藝技術,支持加速器接口架構指令集、高級矩陣擴展,以及數據流加速器,能夠提供更高的整體工作負載性能,在CPU、內存和緩存以及所有附加的內存、存儲和網絡設備之間移動數據。當然作為面向數據中心的新一代處理器,Sapphire Rapids通過先進的內存和下一代I/O,包括PCIe 5.0、CXL 1.1、DDR5和HBM技術,來推動行業技術轉型。

QQ截圖20210820174015.jpg

英特爾在之前表示Xe架構的GPU是一個大家族,除了面向發燒級玩家的Arc顯卡之外,也有針對超算推出的采用Xe HPC架構的Ponte VecchioPonte Vecchio由多個復雜的單元構成,通過嵌入式多芯片互連橋接進行封裝,實現了設備之間的低功耗與高速的連接。

QQ截圖20210820174625.jpg

QQ截圖20210820174059.jpg

英特爾表示在Ponte Vecchio中,每一個單元均有8Xe內核,提供4MB的一級緩存,基于臺積電最先進的5nm制程工藝,目前Ponte Vecchio芯片還處于早期的A0階段,不過先進的工藝以及豪華的參數已經可以讓其實現45TFP32吞吐量,內存帶寬達到了5TBps,連接帶寬也達到了2TBps,英特爾稱通過訓練,目前A0芯片已經可以實現每秒43000張圖像的識別,達到了行業領先的水準。毫無疑問Ponte Vecchio的出現讓NVIDIA Tesla計算卡面臨巨大的挑戰,同時也可以讓整個超算行業得到進一步的發展。

除了上述這些硬件產品之外,英特爾也介紹了oneAPI,一個開放、規范、跨架構和跨廠商的統一軟件棧,讓開發者能夠擺脫專有語言和編程模型的束縛。未來也將有越來越多的開發者采用英特爾的oneAPI進行開發和優化,從而提升開發者的實際生產能力。

在本次的架構日上,英特爾為消費者以及企業用戶帶來了海量的架構說明,可以說是干貨十足,尤其是12代酷睿處理器,對于現在的消費級市場來說無疑是一針強心劑,讓英特爾能夠在日益激烈的CPU市場中占領腳跟。事實上對于X86架構的處理器來說,性能核與性能核的設計無疑是一個全新的領域,未來該設計是否成功,一切都是未知數,而英特爾作為半導體領域的領導者,勇敢地跨出了這一步,顯然還是有做大哥的擔當。我們也發現,想要讓英特爾新一代的產品發揮最出色的作用,毫無疑問軟件廠商需要跟上,接下來大家就應該期待微軟為消費者帶來一套令人滿意的Win11系統了。

聲明類型:無需添加自主聲明

發表評論注冊|