AMD在E3 2019前夕的Next Horizon Gaming大會上正式發(fā)布了Ryzen 3000系列第三代銳龍桌面處理器,新的處理器擁有最高16核心32線程的規(guī)格,CPU架構(gòu)也從現(xiàn)在的Zen+升級為Zen 2,性能上會有明顯的提升,按照AMD提供的數(shù)據(jù)顯示,第三代銳龍桌面處理器的游戲性能已經(jīng)追平甚至超過同價位下英特爾的第九代酷睿處理器,在創(chuàng)作性能方面則是全面碾壓對方,在加上主板平臺支持PCI-E 4.0的優(yōu)勢,從各種意義上說已經(jīng)展現(xiàn)出足夠的優(yōu)勢來超越對手。
不過當我們仔細去看第三代銳龍桌面處理器時,我們發(fā)現(xiàn)了一個很有趣的事情,那就是CPU的內(nèi)部不是一個封裝在一起的大核心,而是被分為了CPU核心以及I/O核心兩個部分,其中CPU核心采用的是7nm工藝打造,而I/O核心則采用12nm工藝打造,內(nèi)存控制器也不再整合于CPU核心中,而是被拿出來放到了I/O核心中,通過Data Fabric總線與CPU核心進行數(shù)據(jù)交換。
實際上不僅僅是內(nèi)存控制器與CPU進行數(shù)據(jù)交換時要用到I/O核心上的Data Fabric總線,由于提供PCI-E 4.0通道的PCI-E控制器也整合在I/O核心中,因此CPU、內(nèi)存與GPU直接的數(shù)據(jù)交換都會通過Data Fabric總線進行??吹竭@里大家是不是覺得這樣的結(jié)構(gòu)有點眼熟呢?是的,此時處理器的I/O核心實際上就相當于很久之前主板上的北橋芯片,是整個平臺的數(shù)據(jù)交換中心,因此我們甚至可以說,第三代銳龍桌面處理器對應(yīng)的整個平臺,似乎又回到了很久之前的“CPU+北橋+南橋”結(jié)構(gòu)。
那么為什么AMD要在自家最新款的桌面處理器中使用這種看起來已經(jīng)落后的結(jié)構(gòu)呢?這點我們不妨從內(nèi)存控制器的發(fā)展進程看起,來看看內(nèi)存控制器放在不同的位置會有些什么優(yōu)點和缺點,這樣或許我們可以更好地理解AMD為什么要在第三代銳龍桌面處理器中,把內(nèi)存處理器放到I/O核心中。
傳統(tǒng)的南北橋主板芯片組時代
在AMD的K8架構(gòu)處理器、英特爾的第一代酷睿處理器登場之前,他們兩家的CPU平臺都是最傳統(tǒng)的“CPU+北橋+南橋”結(jié)構(gòu)。此時的CPU就是純粹的CPU,除了運算指令外并不具備其他功能。北橋芯片則是整個主板的數(shù)據(jù)交換中樞,整合有內(nèi)存控制器以及AGP/PCI-E控制器等重要的控制功能,CPU、GPU與內(nèi)存之間的數(shù)據(jù)交換都要通過北橋芯片進行;南橋芯片則用于擴展外圍I/O接口,例如SATA和USB接口等。
在這個時代,主板能支持什么樣的內(nèi)存和顯卡,都是由北橋芯片決定的,南橋芯片則決定主板可以提供多少外圍I/O接口。因此當時不少主板都是以其北橋芯片來劃分市場的,產(chǎn)品型號命名上也會想法嵌入北橋芯片的名字,以此來強調(diào)自己產(chǎn)品的定位。這樣的架構(gòu)同時也賦予了平臺極高的靈活性,通過不同的北橋和南橋芯片的搭配,廠商可以進一步細分產(chǎn)品線,同時舊款的CPU也可以通過用在新主板上的方式來獲得新的功能,例如英特爾Pentium E5200處理器在搭配P965主板使用時可支持DDR2內(nèi)存,搭配P45主板使用的話就可以使用DDR3內(nèi)存了。
但是這種結(jié)構(gòu)有個缺點,那就是北橋芯片的負荷實在太重了,由于整個平臺的數(shù)據(jù)交換都需要經(jīng)過北橋芯片,因此北橋芯片的數(shù)據(jù)帶寬必須要非常充足才能滿足整個平臺的使用需求。而隨著各種應(yīng)用對CPU、內(nèi)存與顯卡性能的需求越來越高,三者之間的數(shù)據(jù)交換速率也越來越快,這種傳統(tǒng)架構(gòu)開始不堪重負,特別是CPU與內(nèi)存之間的數(shù)據(jù)交換,北橋芯片與CPU之間的總線帶寬越來越難以滿足需求,在一定程度上也制約了CPU性能的發(fā)揮,這時候就需要一種新的結(jié)構(gòu)來滿足整個平臺的性能需求了。
CPU核心整合內(nèi)存控制器時代
從時間點來看,AMD要比英特爾更早地在桌面CPU中整合內(nèi)存控制器,早在K8架構(gòu)處理器時代他們就已經(jīng)這么做了,而那個時候英特爾的平臺還處于傳統(tǒng)的南北橋結(jié)構(gòu)階段,AMD也因此實現(xiàn)了技術(shù)層面上的逆襲。內(nèi)存控制器整合到CPU內(nèi)部帶來的最大好處,就是CPU與內(nèi)存之間的數(shù)據(jù)訪問延遲得到了大幅度的縮短,兩者的運行幾乎達到了同步的水平,使得CPU核心的性能可以得到完全的發(fā)揮。
同時由于北橋芯片剝離了內(nèi)存控制器,其負荷可以說是大大降低了,因此自身的體積、功耗和發(fā)熱量都得到了縮減。但由于本身還需要承擔PCI-E控制器的功能,因此這個時候北橋芯片仍然是區(qū)分主板級別的重要判定標準,但至少主板能支持什么樣的內(nèi)存,已經(jīng)不再需要由北橋芯片來決定,不同等級的主板之間的差別在一定程度上是減少了。
英特爾直到第一代酷睿處理器才在CPU中整合了內(nèi)存控制器,同時也是那個時候開始酷睿處理器有了我們熟悉的i3/i5/i7等級劃分。不過與AMD在整合內(nèi)存控制器后仍然維持南北橋主板芯片組的做法不同,第一代酷睿處理器除了X58平臺的Core i7-9xx系列外,其余產(chǎn)品都只需要搭配一個主板芯片即可,因為英特爾不僅在CPU中整合了內(nèi)存控制器,就連PCI-E控制器都已經(jīng)整合到了CPU當中(Core i7-9XX系列并無整合PCI-E控制器),所以這個時候的CPU就像是“CPU+北橋”的結(jié)合體,不過由于原本北橋芯片的部分功能仍然需要主板芯片來實現(xiàn),因此這個時候主板芯片的作用就不僅僅是南橋了,而是要比傳統(tǒng)的南橋芯片承擔更多的工作。
不過第一代酷睿處理器的“整合”也并非是將所有組成都放在一個核心中,實際上基于32nm工藝和Clarkdale核心打造的第一代酷睿處理器實際上還是會分為CPU+GPU兩個獨立的核心,CPU核心提供的仍然是純粹的運算功能,而內(nèi)存控制器和PCI-E控制器都位于GPU核心中,但畢竟兩者之間的距離被大大縮短,內(nèi)部走線也可以得到最佳的優(yōu)化,所以從綜合性能仍然有著很明顯的增長。
反觀AMD,雖然他們從K8架構(gòu)就在CPU內(nèi)部整合了內(nèi)存控制器,但是一直到推土機、打樁機架構(gòu)CPU,其仍然沒有將PCI-E控制器整合到CPU中,因此從整個主板的結(jié)構(gòu)來看也仍然是傳統(tǒng)的“CPU+北橋+南橋”設(shè)計,這對于主板的生產(chǎn)制造就產(chǎn)生了一定的難度,也不利于整機綜合性能的進一步提升。
全面整合內(nèi)存控制器與PCI-E控制器的時代
英特爾在經(jīng)歷了第一代酷睿處理器的“CPU+北橋”簡單整合后,從第二代酷睿處理器開始就全面將內(nèi)存控制器、PCI-E控制器與核芯顯卡都整合到了一個核心當中,當然為了讓不同主板芯片的檔次得到區(qū)分,有部分平臺部分功能仍然需要搭配相應(yīng)主板芯片才能實現(xiàn),例如只有P系列與Z系列的主板才能支持K系列處理器超頻,而P系列主板不支持核顯輸出等等。
而AMD雖然要到第一代銳龍?zhí)幚砥鞑艑⒈睒蛐酒闹饕δ苷系紺PU當中,不過他們家的APU倒是更早地就實現(xiàn)了相應(yīng)的技術(shù),在AMD的第一代桌面APU上我們就可以看到其擁有完整的“CPU+GPU+北橋”功能,而且三者是封裝到一個核心當中,有著很高的整合度,相應(yīng)的主板平臺也因此從“芯片組”變?yōu)榱恕靶酒?。從這里我們也可以看出,AMD并非在技術(shù)上無法將北橋芯片整合到CPU當中,而是出于各種各樣的原因和需求,要到第一代銳龍?zhí)幚砥鞯臅r候才全面引入這樣的設(shè)計而已。
AMD:Zen 2架構(gòu)是平衡度最佳的設(shè)計
現(xiàn)在我們把目光返回到第三代銳龍桌面處理器的身上,從其目前的結(jié)構(gòu)來說,其實它是用回了類似于英特爾第一代酷睿處理器的結(jié)構(gòu),就是CPU核心與I/O核心(相當于傳統(tǒng)意義上的北橋核心)分別封裝,然后整合到一個PCB上。從理論上來說,這樣的結(jié)構(gòu)并不利于CPU核心與內(nèi)存控制器之間的數(shù)據(jù)交換,即便在是同一塊PCB上,其內(nèi)存延遲相比整合到CPU核心內(nèi)部是要更高一些的。而且我們也可以看到,如果是對應(yīng)8核以上產(chǎn)品,那么兩個CCD之間想要交換數(shù)據(jù),那么也得通過I/O核心上的Data Fabric總線進行,這也不是一個有利于提升CPU性能的設(shè)計。從這些方面來看,我們甚至可以說第三代銳龍?zhí)幚砥鞣炊悬c像是走了回頭路。
那么AMD為什么會采用這種“回頭路”設(shè)計呢?對此AMD表示所有的設(shè)計其實都在他們的考慮當中,實際上你不能將這些設(shè)計的任何一個部分單獨剝離出去看,你要從整個CPU的設(shè)計來進行看待,不可否認這樣的結(jié)構(gòu)并不是CCD模塊相互之間交換數(shù)據(jù)的最佳設(shè)計,也不是CPU核心與內(nèi)存控制器通訊的最佳方式,但是在綜合考量多方面的表現(xiàn)后,這種設(shè)計的平衡度是最佳的,首先憑借CPU內(nèi)部的大緩存設(shè)計以及Zen 2架構(gòu)種的指令預(yù)測機制,這些問題其實很大程度上已經(jīng)得到了解決,最終的CPU性能表現(xiàn)可以說明一切。
其次這是一種靈活度很高的結(jié)構(gòu),通過不同數(shù)量的CCD核心與I/O核心搭配,是可以輕松衍生出各種不同級別的產(chǎn)品,例如8核心16線程的處理器,就只需要搭配1個CCD模塊即可,或者也可以將其中一個CCD模塊換成GPU,那么就可以衍生出對應(yīng)的APU產(chǎn)品了。而且這種模塊化的設(shè)計在更換或去掉其中一個模塊后,并不會影響其它模塊的運作和性能表現(xiàn),這讓CPU或者APU的設(shè)計可以變得更為簡單。
退一步講,目前7nm工藝對于AMD來說仍然是一種新工藝,產(chǎn)能與成熟度都處于爬升階段,在這個時期就應(yīng)該把產(chǎn)能分配最優(yōu)化,把最重要的組成部分放在7nm工藝上,剩下的部分使用更為成熟的12nm工藝,這樣也有利于提升產(chǎn)品的良品率,進而提升有效產(chǎn)能,讓玩家可以在第一時間感受到新架構(gòu)處理器的威力。
那么未來Zen 2架構(gòu)會不會有整合度更高的產(chǎn)品呢?AMD方面并未進行透露,但可能性還是很大的,例如當7nm工藝足夠成熟,產(chǎn)能非常充足的時候,Zen 2架構(gòu)的CPU和APU很有可能會回歸到全整合型設(shè)計。如果真的有那個時候,Zen 2架構(gòu)是否還會迸發(fā)出更高的性能呢?大家不妨拭目以待。