盤點(diǎn)高通、蘋果、華為、聯(lián)發(fā)科手機(jī)SoC,AI性能差別在哪里?
12月6日,高通在美國(guó)發(fā)布最新一代旗艦移動(dòng)平臺(tái)驍龍855,一周后的12月13日,聯(lián)發(fā)科技在深圳發(fā)布了最新處理器Helio P90。加上此前亮相的三星Exynos 9820、蘋果A12 Bionic以及華為海思麒麟980,可以說(shuō)手機(jī)SoC已經(jīng)進(jìn)入了比拼AI性能的時(shí)代。不過(guò),蘋果和海思集成了專為AI加速的硬件單元NPU,但高通和聯(lián)發(fā)科卻選擇了優(yōu)化的路線,這是為什么?
7nm不是唯一選擇
蘋果的A11 Bionic和華為海思麒麟970在去年發(fā)布的時(shí)候就已經(jīng)集成了專為AI加速的NPU單元,但AI性能的提升離不開工藝制程、CPU、GPU等硬件以及軟件的共同協(xié)作。我們知道,在很長(zhǎng)一段時(shí)間內(nèi)處理器性能的提升靠的是工藝制程的提升,到了AI時(shí)代,除了在設(shè)計(jì)上需要做進(jìn)一步的優(yōu)化,對(duì)先進(jìn)制程的需求也更加強(qiáng)烈。因此為了繼續(xù)提升處理器的AI性能,麒麟980和A12 Bionic都選擇了臺(tái)積電的7nm工藝,都集成了69億個(gè)晶體管。同樣選擇臺(tái)積電7nm工藝的還有本月發(fā)布的驍龍855,但這款SoC集成多少個(gè)晶體管暫不清楚。
不過(guò),7nm并非最新手機(jī)SoC的唯一選擇,聯(lián)發(fā)科Helio P90采用的是12nm制程,對(duì)于為何不采用7nm工藝的問(wèn)題,聯(lián)發(fā)科技無(wú)線通信事業(yè)部總經(jīng)理李宗霖接受媒體采訪時(shí)表示:“并不是有7nm就可以有很好的AI體驗(yàn),還需要考慮系統(tǒng)架構(gòu)、功耗以及與應(yīng)用的結(jié)合。同時(shí),還與我們要帶給消費(fèi)者什么樣的體驗(yàn)有很大的關(guān)系?!闭J(rèn)為,Helio P90的定位并非旗艦級(jí),因此必須更多的權(quán)衡7nm成本增加和性能提升之間的關(guān)系,顯然12nm是聯(lián)發(fā)科認(rèn)為性價(jià)比最高的工藝。
三星Exynos9820雖然定位是旗艦級(jí),但卻采用了8nm工藝。原因很簡(jiǎn)單,8nm LPP工藝是三星基于10nm LPP演進(jìn)而來(lái)的工藝,可以使芯片能效提升10%,芯片面積降低10%。
可以看到,雖然不是5款最新處理器并非全都采用7nm工藝,但可以明確的是在處理器性能的提升上,手機(jī)SoC設(shè)計(jì)廠商依舊期待制程提升帶來(lái)的性能、功耗、芯片面積的提升,即便半導(dǎo)體制程的提升正變得越來(lái)越難。
CPU高性能核心集群再細(xì)分
選擇了工藝節(jié)點(diǎn)之后,在設(shè)計(jì)不出大問(wèn)題的情況下已經(jīng)在很大程度上決定了這款處理器的性能。當(dāng)然,為了滿足AI的需求,上述5款處理器有3款處理器的CPU采用了大中小核的架構(gòu)。麒麟980是率先采用了Big.middle.little新設(shè)計(jì)的SoC,也就是將高性能核心集群再細(xì)分為高、中兩部分,包括2個(gè)Cortex A76@2.6GHz、2個(gè)Cortex A76@1.92GHz、4個(gè)Cortex A55@1.8GHz,三個(gè)集群將根據(jù)不同使用場(chǎng)景靈活調(diào)用,提升能耗比。
三星同樣采用Big.middle.little新設(shè)計(jì),不同的是由于三星有自主研發(fā)的Mongoose架構(gòu)CPU,因此Exynos9820的CPU是2個(gè)第四代Mongoose架構(gòu)內(nèi)核、2個(gè)Cortex-A75、4個(gè)Cortex-A55組合在一起,自研內(nèi)核和Cortex-A75提供高處理性能,Cortex-A55提供更高效率。三星稱,對(duì)比上代旗艦處理器Exynos9810,智能任務(wù)調(diào)度程序的新設(shè)計(jì)可將Exynos9820的多核性能提升15%。
驍龍855采用基于Arm Cortex A76 打造的 Kryo 485 CPU,首次集成了一顆超級(jí)內(nèi)核,主頻高達(dá)2.84GHz,3顆主頻2.42GHz的性能內(nèi)核,4顆主頻1.80GHz的效率內(nèi)核。高通表示驍龍855芯片相比前代產(chǎn)品驍龍845,CPU性能提升 45%,是8系列處理器有始以來(lái)最大的一次提升。
蘋果和聯(lián)發(fā)科則沒(méi)有采用大中小核的設(shè)計(jì)。蘋果A12 Bionic的CPU采用6核設(shè)計(jì),2個(gè)性能核心承擔(dān)高強(qiáng)度的計(jì)算任務(wù),4個(gè)能效核心處理日常任務(wù)。蘋果稱最新的性能控制器可動(dòng)態(tài)分配工作至不同核心,需要高速運(yùn)行時(shí)可同時(shí)發(fā)揮全部六個(gè)核心的性能。相比A11 Bionic,A12 Bionic的2個(gè)大核速度提升最高達(dá)15%,4小核最高節(jié)能50%。
聯(lián)發(fā)科Helio P90也采用八核架構(gòu),包括2個(gè)Arm Corte A75處理器,工作主頻率為2.2 GHz,與6個(gè)A55處理器,工作主頻率為2.0 GHz。聯(lián)發(fā)科表示,最新的CorePilot技術(shù)可以確保芯片能夠以最高效的方式在八核之間實(shí)現(xiàn)運(yùn)算資源的最優(yōu)配置,充分發(fā)揮八核架構(gòu)優(yōu)勢(shì)。至于為何沒(méi)有采用大中小核的設(shè)計(jì),聯(lián)發(fā)科技資深副總經(jīng)理暨技術(shù)長(zhǎng)周漁君對(duì)表示 :“我們希望每種核心之間的表現(xiàn)能有明顯的差別,不然大中小核的架構(gòu)可能意義不大。當(dāng)然,架構(gòu)的選擇還需要關(guān)注SoC的制程、散熱、用途等方面?!?/p>
GPU性能提升最高達(dá)50%
除了CPU,GPU也是移動(dòng)SoC主要的關(guān)注點(diǎn),A12 Bionic 4核GPU相比上代3核心的A11 Bionic GPU速度提升最高為50%。麒麟980首發(fā)Arm最新的GPU架構(gòu)Mali G76 MP10,與麒麟970的Mali G72 MP12相比,性能提高46%,能效比提高178%。Exynos的GPU同樣從Mali-G72升級(jí)為Mali-G76,三星稱升級(jí)后GPU的性能提升40%或35%的功耗表現(xiàn)。
驍龍855集成Adreno 640 GPU,高通表示新GPU能夠帶來(lái)20%的圖形渲染速度提升,同時(shí)還能繼續(xù)保持業(yè)界領(lǐng)先水平的每瓦特能效。Helio P90沒(méi)有選擇Arm Mali GPU而是集成了Imagination的PowerVR GM 9446,聯(lián)發(fā)科表示對(duì)比Helio P70,Helio P90的GPU性能提升了50%。
驍龍855和Helio P90為什么沒(méi)有NPU?
了解完5款最新手機(jī)SoC的工藝制程、CPU和GPU的升級(jí)之后,接下來(lái)要談的是這些最新SoC都強(qiáng)調(diào)的AI性能。蘋果和華為在SoC中集成了專為處理AI設(shè)計(jì)的新的NPU,其中A12 Bionic的Neural Engine架構(gòu)從A11 Bionic的雙核增加到了八核,性能也從A11 Bionic每秒能完成6000億次操作提高到A12 Bionic每秒能夠完成5萬(wàn)億次運(yùn)算,并且Core ML運(yùn)行速度最高可提升至9倍。
麒麟980的NPU則是從單核升級(jí)為雙核,使用了更高精度的深度網(wǎng)絡(luò),每分鐘可識(shí)別4500張圖像,具備更高的實(shí)時(shí)性,支持人臉識(shí)別、物體識(shí)別、物體檢測(cè)等AI場(chǎng)景。余承東表示,新的 NPU 處理單元速度比麒麟 970 的NPU快 2.2 倍。
相比蘋果和華為海思集成NPU已經(jīng)到了第二代產(chǎn)品,Exynos9820則是三星首次在SoC中集成專門處理人工智能任務(wù)的硬件單元NPU。三星方面稱,在NPU的支持下,Exynos9820相比Exynos99810人工智能性能提升7倍,并可以增強(qiáng)從照片到AR的性能。
高通和聯(lián)發(fā)科則沒(méi)有集成專門處理人工智能任務(wù)的硬件單元,而是在已有的硬件單元上進(jìn)行優(yōu)化和改進(jìn)。驍龍855選擇在DSP中集成一個(gè)全新設(shè)計(jì)的Hexagon張量加速器(Hexagon Tensor Accelerator,HTA),另外,Hexagon 690處理器、Adreno 640 GPU、Kryo 485 CPU共同構(gòu)組成了驍龍855支持的第四代多核人工智能引擎 AI Engine,可實(shí)現(xiàn)每秒超過(guò)7萬(wàn)億次運(yùn)算(7TOPs),AI性能較驍龍845提升3倍。
Helio P90對(duì)AI性能的提升則是借助APU1.0到APU 2.0的升級(jí),使AI算力提升4倍。據(jù)悉APU 2.0采用聯(lián)發(fā)科技的融合AI(Fusion AI)架構(gòu),AI算力最高可達(dá)到1127 GMACs(2.25 TOPs),支持Int8和FP16。此前報(bào)道過(guò),APU是基于此前 Helio P30 內(nèi)置的 VPU(圖像處理單元)經(jīng)過(guò)算法提升而推出。因此APU也是基于此前的硬件單元進(jìn)行的升級(jí)和優(yōu)化。
那么,高通和聯(lián)發(fā)科為什么不像蘋果、華為和三星一樣在SoCial中集成專為AI加速設(shè)計(jì)的硬件單元?其實(shí)原因很簡(jiǎn)單,那就是AI相關(guān)的技術(shù)和算法都還不夠成熟,高通和聯(lián)發(fā)科作為手機(jī)SoC的提供方,在確定到底哪種算法以及數(shù)據(jù)類型最適合深度學(xué)習(xí)之前,押注其中一種不僅不是明智的選擇,還可能因?yàn)橛布簧纤惴ǖ鵁o(wú)法滿足市場(chǎng)的需求缺乏競(jìng)爭(zhēng)力,因此除了借助工藝制程、CPU、GPU的持續(xù)升級(jí)滿足AI應(yīng)用,高通和聯(lián)發(fā)科還針對(duì)目前比較熱門的AI圖像應(yīng)用在已有的硬件上進(jìn)行優(yōu)化來(lái)更好地適應(yīng)不同手機(jī)廠商的需求。還有一點(diǎn)也非常關(guān)鍵,增加NPU帶來(lái)的成本的增加手機(jī)廠商可能難以接受。
相反,無(wú)論是蘋果、華為還是三星,他們自主研發(fā)的SoC目前都只用于自家的手機(jī)中,因此在應(yīng)用和需求相對(duì)明確的前提下去增加專用的AI加速單元不僅能獲得更好的效果,還能借此打造更多吸引消費(fèi)者的AI應(yīng)用,增加手機(jī)的吸引力和競(jìng)爭(zhēng)力。當(dāng)然,作為全球手機(jī)銷量前三的三星、華為和蘋果,手機(jī)的銷量也是支撐他們研發(fā)自主芯片和集成NPU的基礎(chǔ)。
小結(jié)
手機(jī)作為最普及的智能設(shè)備,對(duì)于AI的發(fā)展和普及有非常重要的作用,手機(jī)SoC除了比拼CPU和GPU性能,現(xiàn)在也開始比拼AI性能。不過(guò)在AI發(fā)展的初期,技術(shù)還有很多不確定的時(shí)候,手機(jī)SoC的提供方選擇的是在已有的硬件上進(jìn)行優(yōu)化滿足AI應(yīng)用需求,而具備自主研發(fā)處理器能力的手機(jī)廠商在需求和出貨量都更明朗的情況下用NPU來(lái)增加手機(jī)的競(jìng)爭(zhēng)力。
還有不可忽略的是,軟件在AI性能的提升中發(fā)揮著非常重要的作用,越來(lái)越多的芯片廠商都在增加在軟件方面的投入和優(yōu)化,同時(shí)還在增強(qiáng)與軟件公司的合作。
到底誰(shuí)的AI性能更高體驗(yàn)更好?光看跑分和性能的提升我們難以簡(jiǎn)單下結(jié)論,我們需要等待搭載驍龍855和Helio P90的手機(jī)發(fā)布后,再做一個(gè)對(duì)比。