三星GPU為何比海思聯(lián)發(fā)科更吃香?實力牛掰?
我們經(jīng)常看到一些網(wǎng)友提問,其中就有問到“同樣是T880,MP4和MP12有什么區(qū)別”,以及“為什么三星處理器的GPU就比海思和聯(lián)發(fā)科更受待見”。這兩個問題其實是共通的,本文中筆者就來詳細(xì)解讀一下相關(guān)的概念。
本文部分圖片來自網(wǎng)絡(luò),向相關(guān)版權(quán)方致敬。
GPU是什么?
事實上在筆者寫過的科普文里面已經(jīng)不是第一次提及GPU的基本概念了,這里為了內(nèi)容的完整性就先簡單重復(fù)一下。GPU即圖形處理器(Graphics Processing Unit),就是顯卡的核心處理單元,本質(zhì)上是強(qiáng)調(diào)高性能高強(qiáng)度大規(guī)模多線程浮點運(yùn)算的處理器單元。
具體來說,GPU就是基于硬件加速思想,專門為圖形加速任務(wù)和類似原理的用途所構(gòu)建的專用處理器,和作為通用處理平臺的CPU有著本質(zhì)的不同,無論是基本構(gòu)造還是運(yùn)行方式。其中比較重要的一點在于我們知道CPU的規(guī)模翻倍,也就是核心數(shù)翻倍并不一定會大幅提高性能,尤其是對于受強(qiáng)調(diào)的單線程毫無貢獻(xiàn),但GPU相反,以用戶視角而言,同頻同架構(gòu),規(guī)模翻倍就可以認(rèn)為是性能翻倍。
MP、ALU與核心數(shù)的區(qū)別:
接下來我們就說說大家關(guān)心的核心數(shù)的問題。對于核心數(shù)我們更熟悉的還是CPU那邊的定義,一個核心對應(yīng)一個邏輯線程,而對于手機(jī)在內(nèi)的移動平臺而言,因為都基于ARM指令集,即便是有不少的自主架構(gòu),同期同檔次的產(chǎn)品也是可以同臺競技,因為各自的核心之間并不會有太離譜的差異。
然而GPU則不同,因為各家廠商都擁有獨(dú)立迭代的圖形技術(shù)體系,這就意味著即便核心二字十分生動形象,其實也不能用從CPU那邊借來的“核心數(shù)”概念來直接衡量,因為廠商完全可以自己定義核心,這樣同代同檔產(chǎn)品的核心數(shù)很可能就會有幾個數(shù)量級的區(qū)別,完全失去了橫行比較的意義。
目前為止,我們最常見的核心數(shù)所對應(yīng)的概念是MP,出現(xiàn)在ARM Mali系列的GPU上,三星、海思、聯(lián)發(fā)科等SOC廠商都是它的客戶。具體而言,MP指的是“可獨(dú)立運(yùn)行和銷售的基本規(guī)模”(實際是按照shader core的數(shù)量),對應(yīng)的是ARM對外授權(quán)的銷售需要,即依照GPU吃規(guī)模的特點,通過對shader核心進(jìn)行有限數(shù)量的重復(fù)疊加,來滿足客戶們不同檔次的需求,同時節(jié)省自家的研發(fā)和宣傳成本。這樣在同樣核心的基礎(chǔ)上,比如都是T880,粗略估算,T880MP4就是基本型T880MP1的4倍性能,而T880MP12則是12倍。
特別需要注意的是,由于Mali近些年的產(chǎn)品型號都以0結(jié)尾,這樣也有另一種后面不接MP的簡寫,即T880MP4寫作T884,T880MP12寫作T8812。然而在某些地方比如一些OTT盒子的店家宣傳上,這種寫法被錯誤使用于虛假宣傳,比如寫成T884MP4實際4核但對外號稱16核,這種則需要各位冷靜辨明。
此外,在Mali 400和450系列上,由于彼時是頂點和像素處理器分開而非現(xiàn)行的shader core統(tǒng)一渲染,一般只計算像素處理器的數(shù)量,或者將頂點和像素處理器分開計算。
而在另外一家大廠,即Imagination的PowerVR系列上也有類似的計算方式,但除了5XT系列,都是將核心數(shù)融入產(chǎn)品型號的第二位數(shù),即PowerVR 6230、GT7600等即分別是雙核心和6核心。
至于高通則是另一種做法,由于它的Adreno系列GPU只供給自家的驍龍SOC,完全的自產(chǎn)自銷就沒有像前面兩位那樣按照基礎(chǔ)規(guī)模分級的必要,故而高通一直不宣傳核心數(shù),外界只知道型號,給人一種只靠單核打天下的印象。當(dāng)然了解GPU基本構(gòu)造的人當(dāng)然知道Adreno肯定是多核規(guī)模,只是計算起來僅能通過數(shù)ALU即算術(shù)邏輯單元的方式進(jìn)行,比如目前當(dāng)紅的Adreno530就是256ALU。
那有沒有直接計算ALU還宣傳出來的廠商呢?當(dāng)然有,就是以桌面GPU出名的廠商N(yùn)VIDIA,自家Tegra4的72核和TegraK1的192核宣傳都是直接以ALU(CUDA)計數(shù),看起來很嚇人。當(dāng)然必須強(qiáng)調(diào)的是,其實別家定義的一個核心內(nèi)也會包含一定數(shù)量的ALU,直接比較數(shù)量根本無法對應(yīng)GPU實際規(guī)模上的不同,自然也毫無意義。事實上橫向判斷性能高低最好還是通過圖形跑分。
規(guī)模、頻率和能耗比:
無論是核心數(shù)還是ALU,最終指向的還是GPU的規(guī)模。那么除此之外還有什么會影響GPU的性能呢?當(dāng)然還有頻率,這里任何類型的處理器定義都一樣,是指驅(qū)動處理器運(yùn)行的時鐘脈沖信號在單位時間內(nèi)發(fā)射的數(shù)量,通常一次脈沖對應(yīng)一次完整的核心計算,因此也可以視為處理器的性能跟隨頻率線性增減。
舉個例子,海思麒麟950的GPU是T880MP4@900MHz,而換算到滿血Exynos 8890的MP12規(guī)模,對等性能大約需要300MHz,即在一定范圍內(nèi),少核高頻可以做到和多核低頻一樣的性能,畢竟8890實際在650MHz,是K950的兩倍有余。然而高頻會帶來一個問題,即能耗比的降低,隨著頻率的提升,功耗的增加要比性能快得多,而同樣的性能下,少核高頻的耗能也要明顯高于多核低頻。
為什么海思和聯(lián)發(fā)科不受待見?
這就可以解答為什么三星處理器的聲望要高于海思和聯(lián)發(fā)科,正是因為在旗艦平臺上,三星是秉承和高通一樣的大規(guī)模低頻率的策略,而海思和聯(lián)發(fā)科則相反。少核高頻帶來了更大的功耗和發(fā)熱,好處則是節(jié)省成本,畢竟只需要改時鐘不需要花錢買額外的晶體管,顯然這說明海思和聯(lián)發(fā)科過于摳門,不如三星堆料良心。
此外無節(jié)制的高頻還是一種惡性循環(huán),因為帶來的額外功耗造成發(fā)熱,會使機(jī)體更早觸碰到溫控限制而導(dǎo)致降頻,使處理器的性能下降,所以頻率不是隨意提升的,要看制程工藝具體的可承受情況而定。華為海思麒麟960和聯(lián)發(fā)科Helio X20系列的GPU性能被人詬病的緣由就是如此。
【文章轉(zhuǎn)載自網(wǎng)絡(luò),版權(quán)歸原作者所有,若有侵權(quán)請聯(lián)系刪除】