
在實物評測完成之前,這有可能是最全面最深入的AMD ZEN 2架構解讀文章了。我們知道,在采用業界領先的7nm工藝之后,配合全面強化的ZEN 2架構,第三代AMD銳龍臺式機處理器終于一飛沖天,在各方面領先競爭對手,AMD也再次站到了領軍者的位置。那么ZEN 2架構到底強在哪里?我們受邀參加了AMD Next Horizon Gaming Tech Day技術分享會,AMD的工程師團隊給出了最詳細的答案(COMPUTEX2019報道文章中已經介紹過的部分我們會簡單帶過)。
★★★前方超多技術干貨預警,請注意腦部降溫以防燒毀★★★
模塊化玩到極致,徹底解放ZEN 2性能

ZEN 2架構三大提升:+15% IPC、2倍的緩存容量、2倍的浮點運算能力

ZEN 2架構三大設計目標:在所有計算模式下提供更高芯片內帶寬、行業領先的能效密度、在AM4平臺上無縫升級更多核心與I/O通道
第一代(ZEN架構)和第二代(ZEN+架構)AMD銳龍臺式機處理器上市之后,都以極高的性價比、強悍的多線程性能方面贏得了市場和用戶的認可,不過在絕對的單核心性能、執行效率和內存延遲方面還不能對競品實現全面碾壓。
因此,AMD必然會在ZEN 2架構中解決這些問題,所以“在所有計算模式下提供更高芯片內帶寬”、“行業領先的能效密度”、“在AM4平臺上無縫升級更多核心與I/O通道”就成為了ZEN 2價格的三大設計目標。而從最終效果來看,ZEN 2真的實現了15%的IPC提升、緩存和浮點性能都增加到了上代的兩倍,效果相當顯著。

目前采用ZEN 2架構的AM4處理器由兩個CCD(每個CCD包含兩個CCX共8個核心)和一個cIOD(IO核心)組成
在進一步了解ZEN 2架構之前,我們有必要先了解一下組成完整ZEN 2架構的各個單元。以目前最高規格的ZEN 2架構第三代AMD銳龍臺式機處理器銳龍9 3950X為例,它由兩個CCD和一個cIOD組成。一個CCD包含兩個CCX,每個CCX具備4個物理核心,并共享16MB L3(相對上代翻了一倍)。如此一來,最高規格的AMD銳龍9 3950X總緩存就達到了72MB之多,這么大緩存作用是什么?我們后面會詳細介紹。
cIOD則是IO模塊,不僅要負責對外連接,還要負責處理器核心之間的通信。值得一提的是兩個CCD都采用了7nm制程,而cIOD則采用了12nm制程,如此組合也是充分考慮性能與成本的平衡,畢竟cIOD頻率不高,12nm完全能滿足設計需求。
ZEN 2各個處理器核心之間的通信還是通過Infinity Fabric總線傳輸到cIOD再到處理器核心這樣的路線來完成,而為了適配新加入的帶寬翻倍的PCIe 4.0總線,ZEN 2用于內部通信的Infinity Fabric總線進行了升級,帶寬實現了翻倍。
此外,ZEN 2的內存控制器也提供了1/2分頻模式,在DDR4 3733之上就使用1/2分頻,如此一來,ZEN 2對于高頻內存的支持能力大大增強,不但默認支持DDR4 3200,而且從現場的超頻演示來看,AMD銳龍9 3950X完全可以支持到DDR4 5000以上!AMD工程師更是興奮地宣布在ZEN 2上所謂的內存兼容性再也不是問題了。
好了,現在來細看一下ZEN 2架構的升級之處。后面這一部分比較復雜,相信大多數朋友看起來都頭痛,所以我們就撿大家比較容易理解的關鍵部分進行介紹。

ZEN 2繼續支持SMT技術以實現一個核心兩個線程;配備了新的分支預測器;更大的微操作緩存,現在支持4K指令集;更大的三級緩存,兩倍于ZEN和ZEN+;每個Cycle可以實現2個負載和1個存儲;雙浮點單元×256Fmacs,雙倍浮點與負載存儲帶寬,4條流水線設計,包括雙浮點加法和雙浮點乘法(乘法操作延遲從4加速到3),現在支持單操作AVX256。

具備32K/8-Way的指令緩存和數據緩存;二級緩存高達512K/8-Way;TLBs:L1 64全部包括指令與數據,所有頁面尺寸,L2包括512指令,2K數據;更快的基于虛擬化的安全功能;硬件增強安全緩解。

聽起來是不是感覺云里霧里?那就簡單總結一下。前面已經介紹了ZEN 2價格中各個核心都通過Infinity Fabric總線進行數據傳輸,但這樣的傳輸都會經過cIOD來完成,那么會不會造成更大的延遲呢?
AMD顯然考慮到了這個問題,因此通過Infinity Fabric總線帶寬與處理器緩存容量翻倍、提高TLBs命中率等一系列優化措施來降低核心與核心數據傳輸的延遲,因此我們看到最終的結果是ZEN 2游戲性能非常出色,相對上代ZEN+有明顯提升,顯然沒有受到核心間傳輸延遲的負面影響。
此外,ZEN 2在浮點單元方面的改進很大,還加入了對AVX256的支持,因此浮點性能得到了成倍的增長,為AMD銳龍9 3950X成為游戲處理器之王打下了堅實基礎。

封裝方面,得益于7nm制程對于減小Die面積的幫助,ZEN 2的CCX面積相對ZEN+減小了47%之多,從而可以在一塊芯片上塞進16個核心,相比上代產品實現了核心數量翻倍的提升。

同時,7nm也帶來了功耗的大幅降低,ZEN 2的每瓦性能相比同級競品提升了56%之多,功耗卻明顯要低很多,例如AMD銳龍7 3700X的滿載功耗就比Intel酷睿i7 9700K低了22W。

在效率方面,ZEN 2架構相比ZEN+架構也有大幅提升,AMD銳龍7 3700X相比AMD銳龍7 2700X的每瓦性能就提升了75%,功耗也低了60W之多。

7nm工藝還大大提升了ZEN 2架構的頻率上限,同時也降低了所需的電壓,目前ZEN 2的最高加速頻率可達4.6GHz。

在封裝方面,ZEN 2也是黑科技滿滿。前面我們介紹過,ZEN 2具備兩個7nm的CCD和一個12nm的cIOD,因此可以說是一種混合式的封裝方式。
在7nm的CCD部分,ZEN 2采用了Cu Pillar with PB-Free Cap的封裝方式,這種方案規格為50~100micron,而12nm的cIOD部分原本計劃采用Pb-Free Bump方案,規格為75~150micron,但后來也決定改用Cu Pillar方案。畢竟Cu Pillar方案更緊湊、也方便封裝后高度與CCD一致。特別值得一提的是,ZEN 2處理器采用高達12層的布線,同時cIOD的位置也進行了優化,提升了對高頻內存的兼容性。
總結:每一個細節的嚴謹,造就了新一代最強游戲U

每一分進步,都來自每一分不妥協和每一分嚴謹。從工程師講解的ZEN 2架構設計歷程我們可以感受到,AMD確確實實是放眼未來(ZEN 3和ZEN 4也已經在規劃之中)、以領跑高性能計算為目標、不斷地在追求技術的創新,而這一切努力終于都收獲了回報,第三代銳龍終于做到了一飛沖天獨孤求敗,從頂級的第三代AMD銳龍臺式機處理器銳龍9到主流的銳龍5,都實現了打平或小勝對手游戲性能、碾壓對手多線程性能的目標,其中第三代AMD銳龍臺式機處理器銳龍9 3950X甚至還能越級挑戰Intel HEDT平臺的酷睿i9 9920X,表現超乎想象。總而言之,第三代AMD銳龍臺式機處理器沒有讓游戲玩家失望,確實值得期待!(7月7日正式開售,不要錯過!)