全新大小核A75、A55發(fā)布,DynamIQ才是設(shè)計(jì)者心中真正的big-LITTLE
在今年的3月份,ARM曾在北京召開全球發(fā)布會(huì),宣布下一代多核設(shè)計(jì)技術(shù)DynamIQ發(fā)布。而在近日召開的ARM TECH DAY的活動(dòng)上,又有了全新的進(jìn)展——首款采用DynamIQ技術(shù)的大小核A75和A55發(fā)布。
ARM CPU產(chǎn)品部高級(jí)營銷市場總監(jiān)Ian Smythe,資深產(chǎn)品經(jīng)理Phil Burr,高級(jí)技術(shù)總監(jiān)Peter Greenhalgh和GPU產(chǎn)品部Espen Oybo都出席并進(jìn)行了精彩的演講。
DynamIQ讓big-LITTLE更加自如
作為一種全新多核設(shè)計(jì)技術(shù),DynamIQ提供了更大的設(shè)計(jì)靈活度,增強(qiáng)了內(nèi)存分配的能力,專門加強(qiáng)了人工智能的應(yīng)用。關(guān)于人工智能方面的增強(qiáng)主要是增加了優(yōu)化算法庫,這個(gè)在前文中有講述,此處不再提及。主要來分析一下其多核設(shè)計(jì)靈活度和內(nèi)存分配方面的升級(jí)。
全新的DynamIQ可以支持4大4小,1大7小,2大6小,4小核,1大2小,1大3小和1大4小的多種設(shè)計(jì),比起傳統(tǒng)的big-LITTLE設(shè)計(jì)靈活度上可以說是提高了很多。這種高度靈活性使得A核處理器市場覆蓋面達(dá)到前所未有的廣度。1大7小可以適用于移動(dòng)手機(jī)市場,這也是原b-L時(shí)代就已經(jīng)取得的成績,而4小核的設(shè)計(jì)更加適用于智能家居的場景內(nèi),4大4小則可達(dá)到筆電,汽車電子的應(yīng)用需求。
可以這樣想,b-L實(shí)際上就是實(shí)現(xiàn)了跨核動(dòng)態(tài)功耗調(diào)節(jié),也就是Dynamic voltage and frequency scaling(DVFS)。而在b-L存在的問題是不能對(duì)一個(gè)集群(或稱簇,或稱Cluster)內(nèi)的每一個(gè)核都單獨(dú)進(jìn)行電壓配置。來舉一個(gè)常見的實(shí)例來說明,為什么人們常見在iphone在待機(jī)和性能方面的平衡表現(xiàn)要比很多安卓機(jī)要好一點(diǎn)呢?因?yàn)樘O果并沒有完全依賴于b-L,而是采用自研技術(shù),跨核動(dòng)態(tài)功耗調(diào)教的較好。而DynamIQ的出現(xiàn),完全解決了這一問題——現(xiàn)在設(shè)計(jì)者可以對(duì)一個(gè)集群內(nèi)的每一個(gè)大小核都單獨(dú)進(jìn)行電壓調(diào)節(jié)。
更加靈活的多核設(shè)計(jì)和更加精細(xì)的單核電壓調(diào)節(jié),還是不夠的,ARM還給每一個(gè)核心都單獨(dú)配置了專用L2 Cache,此外還有共享的L3 Cache。這個(gè)L3 Cache被設(shè)計(jì)在一個(gè)叫做DSU(DynamIQ Shared Unit)的部件內(nèi)。
如上圖所示,DSU內(nèi)部除了L3之外,還有電源管理、Snoop filter、ACP和BUS等等。下面來主要介紹一下L3的動(dòng)態(tài)分配。下圖是倆個(gè)不同的應(yīng)用場景,L3中的一部分會(huì)被用來外圍傳感器數(shù)據(jù)收集,另外的部分根據(jù)不同應(yīng)用需求產(chǎn)生的不同任務(wù)數(shù)量被分配成多份,每一份L3對(duì)應(yīng)一個(gè)任務(wù),給這一任務(wù)組內(nèi)的CPU群組共享。兩任務(wù)組也可以規(guī)劃為共享一塊L3。
分塊使用可以緩解CPU的壓力,此外L3還可以實(shí)現(xiàn)半關(guān)斷!譬如視頻播放這樣的任務(wù),可能一半的L3 Cache就已經(jīng)足夠,那么就可以關(guān)閉一半的L3,實(shí)現(xiàn)功耗節(jié)省。要知道,設(shè)備在很多狀態(tài)下,耗電大戶不是CPU而是這些cache的漏電。
DynamIQ的技術(shù)革新要點(diǎn)基本如上,接下來我們一起來看看基于DynamIQ設(shè)計(jì)而來的A75和A55都有了哪些提升。
A75
得益于DynamIQ的設(shè)計(jì),A75相對(duì)A73有了大幅提升,官方宣稱整體性能表現(xiàn)提升了50%(A73at2.4GHz,A75at3GHz)。
A55
同樣是得益于DynamIQ技術(shù),官方宣稱A55的功效表現(xiàn)是A53的2.5倍(A53in28nm,A55in16nm)。拆分開來看,同樣頻率下A55的性能是A53的兩倍,功耗表現(xiàn)提升15%。
此外,A55具有多達(dá)3000+的可配置參數(shù),可以8個(gè)小核配置成一個(gè)集群,這在A35上是無法實(shí)現(xiàn)的。
G72——Bifrost架構(gòu)升級(jí)
除了CPU之外,Mali GPU也是ARM業(yè)務(wù)的重要一部分,主要有G系列,V系列和DP系列等,分別面向不同的應(yīng)用領(lǐng)域。目前Mali在全球的出貨量位列第一,市面上半數(shù)的智能手機(jī)和移動(dòng)VR設(shè)備中都使用了Mali的GPU。而隨著生活場景的不斷變化,現(xiàn)在ARM已經(jīng)將高保真移動(dòng)游戲、VR和設(shè)備端的機(jī)器學(xué)習(xí)視為Mali的最重要業(yè)務(wù)增長點(diǎn)。
此次ATM TECH DAY的活動(dòng)推出的Mali-G72是其全新高性能GPU的代表,沿用Bifrost架構(gòu)并進(jìn)行了優(yōu)化,比起前代產(chǎn)品G71實(shí)現(xiàn)了25%的功耗降低。
移動(dòng)游戲方面可以節(jié)省68%的帶寬,機(jī)器學(xué)習(xí)方面可以減少17%的功耗。
M3已在DesignStart中開放
除了硬件方面的更新之外,ARM此次還帶來了重磅利好消息,DesignStart將取消預(yù)付授權(quán)費(fèi),并且將M3核也納入該計(jì)劃中來。這對(duì)于一些小型創(chuàng)業(yè)公司而言是極為有益的,可以降低其開發(fā)風(fēng)險(xiǎn)。而且一旦得到驗(yàn)證想要投入生產(chǎn)的話,500萬M3的總成本將低于20萬美金。為了實(shí)現(xiàn)ARM 1 trillion的出貨量愿景,服務(wù)好各種新興應(yīng)用的小客戶變得尤為重要。DesignStart就是其布局重要一環(huán),除了IP免費(fèi)外,DesignSrart還提供mbed、IDE工具、Debug工具等軟件和附加服務(wù)。從SoC的設(shè)計(jì)開始到最終產(chǎn)品生產(chǎn),給客戶實(shí)現(xiàn)一個(gè)全方位支持。
搭載全新A75,A55的CPU預(yù)計(jì)很快就可以和大家見面了,不少公司已經(jīng)取得授權(quán)。全新DynamIQ會(huì)比傳統(tǒng)b-L在實(shí)際產(chǎn)品上的表現(xiàn)會(huì)有多大的提升?這個(gè)很值得令人期待。另外如果你想要M0和M3的免費(fèi)授權(quán)的話,就趕快去申請(qǐng)吧,從Ian現(xiàn)場的演示來看,這一過程還真的是非常方便的。