當(dāng)前位置:首頁(yè) > 芯聞號(hào) > 充電吧
[導(dǎo)讀]上周我們對(duì)全新iPhone XS和A12處理器進(jìn)行了深入分析,不過(guò)主要部分集中在CPU的大核心集群以及GPU集群兩方面,對(duì)A12的低功耗小核心集群和NPU集群并沒(méi)有過(guò)多描述,本文便來(lái)繼續(xù)探究這兩部分。

上周我們對(duì)全新iPhone XS和A12處理器進(jìn)行了深入分析,不過(guò)主要部分集中在CPU的大核心集群以及GPU集群兩方面,對(duì)A12的低功耗小核心集群和NPU集群并沒(méi)有過(guò)多描述,本文便來(lái)繼續(xù)探究這兩部分。

代號(hào)“Tempes(暴風(fēng))”:兇猛的小核心

從A10這一代開(kāi)始,蘋果在SoC中引入了代號(hào)為“Twister(龍卷風(fēng))”的低功耗小核心集群,而后是A11為“Mistral(干冷的北風(fēng))”,而此次的A12則為“Tempest(暴風(fēng))”。不過(guò)多年來(lái)小核心經(jīng)歷三代更迭,我們卻從來(lái)沒(méi)有分析過(guò)這些架構(gòu),對(duì)它們始終有一種神秘感。

從某種意義上說(shuō),高性能的核心架構(gòu)無(wú)論怎樣壓低功耗,也無(wú)法媲美天生的低功耗小核心架構(gòu),即使時(shí)鐘門控設(shè)計(jì)完美,也無(wú)法避免核心中存在的靜態(tài)泄漏。使用更小的CPU核心有助于緩解靜態(tài)泄漏,以及提高動(dòng)態(tài)泄漏功率效率。

Tempest核心是一個(gè)亂序三發(fā)射的架構(gòu),這意味著它與Arm big.LITTLE體系下的小核心基本無(wú)關(guān),因?yàn)镃ortex A53和Cortex A55等均為更簡(jiǎn)單的順序執(zhí)行架構(gòu)。Tempest核心的執(zhí)行單元也相對(duì)較少,只有兩個(gè)簡(jiǎn)單ALU算數(shù)邏輯單元,其中一個(gè)可執(zhí)行整數(shù)和浮點(diǎn)乘法,另一個(gè)則能夠執(zhí)行浮點(diǎn)加法。除了兩條主要管道外,只有一個(gè)專用的組合裝載/存儲(chǔ)端口。

有趣的是,Tempest核心基本上與蘋果此前A6處理器的Swift核心是相同的,蘋果很有可能是將老的高性能架構(gòu)精簡(jiǎn)并修改為64位后作為低功耗小核心使用。如果Tempest核心確實(shí)是Swift核心派生的,那么在上面描述的三個(gè)執(zhí)行單元之外,還應(yīng)該有一個(gè)用于整數(shù)和浮點(diǎn)分區(qū)的專用端口,這樣在指令被饋送時(shí)才不會(huì)阻塞主流水線。

Tempest核心頻率最高可達(dá)1587MHz,有32KB L1緩存以及2MB L2緩存。除了L2容量較大之外,Tempest核心與A11的Mistral核心并沒(méi)有其他明顯差異。不過(guò)不幸的是,當(dāng)A11的小核心集群上只有一個(gè)線程處于活動(dòng)狀態(tài)時(shí),Mistral核心的頻率可以提升到1694MHz,高于Tempest核心,很難直接比較二者的能耗比。

與大核心Vortex非常相似,A12的Tempest核心的最大改進(jìn)體現(xiàn)在對(duì)內(nèi)存敏感的測(cè)試項(xiàng)中。,而輸給A11的Mistral核心主要是由于頻率劣勢(shì)??傮w而言,除了內(nèi)存改進(jìn)之外,Tempest核心在性能上與Mistral核心非常相似,這也為我們對(duì)比二者的能耗比提供了便利。

但不幸的是,Tempest核心相比Mistral核心的能耗比提升并不如大核心一樣巨大,縱觀SPECint2006測(cè)試,Tempest核心的能耗比提升了35%,考慮到Mistral核心的頻率更高,實(shí)際同頻下的能耗比提升還要低于35%。而在浮點(diǎn)基準(zhǔn)測(cè)試中,Tempest核心的能耗比平均只提高了17%。

如果將A11和A12的小核心與大核心以及來(lái)自Arm的競(jìng)爭(zhēng)對(duì)手放在一起對(duì)比,其實(shí)并沒(méi)有太大的驚喜。與蘋果的大核心相比,小核心的性能大概只有三分之一到四分之一,但它們消耗的能量卻足有大核心的一半。

(注:小核心的功耗只有大核心的七分之一到八分之一,但因?yàn)樾阅茌^低,執(zhí)行相同任務(wù)所用的時(shí)間更長(zhǎng),因此實(shí)際消耗的能量為大核心的一半)

不過(guò)令人驚訝的是,在SPEC的整數(shù)工作負(fù)載中,A12的Tempest核心和A11的Mistral核心性能甚至相當(dāng)于2.1GHz頻率下的Cortex A73,但Mistral核心的功耗卻僅有Cortex A73的41%(A11和麒麟970同為臺(tái)積電10nm)。不過(guò)在浮點(diǎn)工作負(fù)載中,小核心由于沒(méi)有專用的浮點(diǎn)執(zhí)行單元而失去了性能上的競(jìng)爭(zhēng)力,但它們?nèi)阅芴峁┖芨叩哪苄А?/p>

從測(cè)試來(lái)看,蘋果的小核心要比Arm的小核心性能要高得多,從私下里積累的Cortex A55測(cè)試成績(jī)來(lái)看,Tempest核心的性能大概是Cortex A55的將近3倍。Arm小核心的性能在實(shí)際使用中很容易成為短板,這意味著我們未來(lái)可能會(huì)看到更多像麒麟980這樣的的“大-中-小”三集群SoC,而Arm也應(yīng)該思考一下小核心是否還應(yīng)該繼續(xù)使用性能低下的順序執(zhí)行架構(gòu)。

NPU神經(jīng)網(wǎng)絡(luò)推理性能測(cè)試

A12另一個(gè)重大而神秘的進(jìn)化是自主研發(fā)的全新NPU,在上篇文章中曾經(jīng)提到,NPU在A12芯片上占據(jù)了較大的面積,幾乎相當(dāng)于兩顆Vortex大核心。

幸運(yùn)的是,魯大師的AImark支持iOS,使用Apple的CoreML框架來(lái)加速與Android相同的推理模型,可以直接對(duì)比蘋果和安卓陣營(yíng)處理器的神經(jīng)網(wǎng)絡(luò)推理性能。

從結(jié)果來(lái)看,雖然蘋果公布的理論性能(A11:0.6TOps,A12:5 TOps)在這個(gè)測(cè)試中并未得到很好的驗(yàn)證,但提升依然達(dá)到了4~6.5倍。測(cè)試中還發(fā)現(xiàn),擁有NPU的A11成績(jī)并沒(méi)有比A10高出許多,這可能是由于A11的NPU從未通過(guò)API公開(kāi)展示,因此在測(cè)試中只能使用GPU來(lái)執(zhí)行CoreML。

華為P20 Pro的麒麟970比A12落后大約2.5倍,恰好與各自宣稱的NPU理論性能比例相同(2TOP和5TOP)。而華為表示,麒麟980的全新雙核NPU比麒麟970的NPU快2.2倍,每分鐘可實(shí)現(xiàn)4500次推斷,由此看來(lái)麒麟980的AI性能應(yīng)該能夠追平A12。

高通驍龍845的表現(xiàn)也很好,在不同特性的測(cè)試中與麒麟970互有勝負(fù)。由于AJmark目前還不支持NNAPI,只能使用SNPE框架進(jìn)行推理加速,因此Pixel 2和Note9不得不使用CPU來(lái)進(jìn)行運(yùn)算,測(cè)試結(jié)果很差。

功耗方面,A12的NPU滿載功耗約為5.5瓦,且整個(gè)測(cè)試期間的功耗有很大起伏。這一功耗水平意味著蘋果希望擁有最高的突發(fā)處理性能。使用GPU加速AI處理的A11和10功耗在2.3瓦到5瓦范圍內(nèi),具體取決于推理模型。

via:Anandtech


本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國(guó)汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開(kāi)發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來(lái)越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來(lái)越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場(chǎng)的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開(kāi)幕式在貴陽(yáng)舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語(yǔ)權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營(yíng)業(yè)績(jī)穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤(rùn)率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長(zhǎng) 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競(jìng)爭(zhēng)力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競(jìng)爭(zhēng)優(yōu)勢(shì)...

關(guān)鍵字: 通信 BSP 電信運(yùn)營(yíng)商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國(guó)電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場(chǎng) NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長(zhǎng)三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡(jiǎn)稱"軟通動(dòng)力")與長(zhǎng)三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉