ARM Cortex-A55: 從端到云實(shí)現(xiàn)高效能

時(shí)間：2017-11-21 22:30:42

關(guān)鍵字： ARM cortex-a55 嵌入式處理器高效能

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀]你是否已經(jīng)聽說了最近市場(chǎng)上發(fā)布了幾款新的 CPU?它們的性能非常強(qiáng)大!當(dāng)然，我說的就是 ARM Cortex-A75 和Cortex-A55，即首批基于新近發(fā)布的DynamIQ 技術(shù)的Cortex-A系列處理

你是否已經(jīng)聽說了最近市場(chǎng)上發(fā)布了幾款新的 CPU?它們的性能非常強(qiáng)大!當(dāng)然，我說的就是 ARM Cortex-A75 和Cortex-A55，即首批基于新近發(fā)布的DynamIQ 技術(shù)的Cortex-A系列處理器。本文我們討論的就是 Cortex-A55：一款對(duì)為未來數(shù)字世界舉足輕重的處理器。下面就隨單片機(jī)小編一起來了解一下相關(guān)內(nèi)容吧。

出生名門，久經(jīng)考驗(yàn)

想要理解 Cortex-A55 的真正潛力，我們來簡(jiǎn)要回顧一下其上一代產(chǎn)品：ARM Cortex-A53。采用這款 CPU 的設(shè)備已超過 15億臺(tái)，該 CPU 依然是當(dāng)今業(yè)界出貨量最高的 64 位 Cortex-A 系列 CPU。Cortex-A53 于 2012 年發(fā)布，其獨(dú)一無二的設(shè)計(jì)，集性能、低功耗以及尺寸擴(kuò)展性于一身，具備一系列多用途特性，因而可應(yīng)用于諸多市場(chǎng)，其中包括高端智能手機(jī)、網(wǎng)絡(luò)基礎(chǔ)設(shè)施、汽車信息娛樂、高級(jí)駕駛員輔助系統(tǒng) (ADAS)、數(shù)字電視、入門級(jí)移動(dòng)設(shè)備和消費(fèi)級(jí)設(shè)備乃至人造衛(wèi)星。

然而自 2012 年以來，我們周圍的世界發(fā)生了許多變化。我們現(xiàn)在看到的新興趨勢(shì)表明，保持互聯(lián)、萬物智能的數(shù)字世界具有非常大的發(fā)展?jié)摿?。從完全自主的自?dòng)駕駛汽車到各類設(shè)備上的智能應(yīng)用程序，人工智能 (AI) 和機(jī)器學(xué)習(xí) (ML) 將真正融入到我們的日常生活中，這一點(diǎn)已成定局。物聯(lián)網(wǎng) (IoT) 應(yīng)用的盛行意味著“物”的爆炸性增長(zhǎng)，越來越多的“物”在持續(xù)生成數(shù)據(jù)、消費(fèi)數(shù)據(jù)以及與數(shù)據(jù)進(jìn)行交互。增強(qiáng)現(xiàn)實(shí)、虛擬現(xiàn)實(shí)以及混合現(xiàn)實(shí) (AR、VR 以及 MR) 注定會(huì)徹底改變我們?nèi)祟愔g以及人機(jī)之間的互動(dòng)方式，將現(xiàn)實(shí)世界與數(shù)字世界融于一體。

在過去兩年里，ARM 的工程師致力于研究 Cortex-A53 的后繼產(chǎn)品，以滿足這類新興技術(shù)的需求，我們的目標(biāo)是打造出一款性能、效能以及擴(kuò)展性均大幅提升的 CPU，而且這款 CPU 還需要具備諸多先進(jìn)的特性，從而滿足從端到云的各種未來應(yīng)用需求，幸運(yùn)的是我們做到了。

性能全面提升

Cortex-A55 采用最新的 ARMv8.2 架構(gòu)，并在其前代產(chǎn)品的基礎(chǔ)上打造而成。它在性能方面突破了極限，同時(shí)依舊保持了與 Cortex-A53 相同的功耗水平。我們盡全力改進(jìn) Cortex-A53，并賦予其以下特性：

· 在相同的頻率與工藝條件下，內(nèi)存性能最高可達(dá) Cortex-A53 的兩倍

· 在相同的頻率與工藝條件下，效能比 Cortex-A53 高 15%

· 擴(kuò)展性比 Cortex-A53 高十倍以上

這些歸功于我們專注于 Cortex-A53 現(xiàn)有的設(shè)計(jì)理念并挑戰(zhàn)這些理念。

· 我們對(duì)分支預(yù)測(cè)程序(branch predictor)進(jìn)行了全面修改，在其算法中融入了神經(jīng)網(wǎng)絡(luò)元素來改進(jìn)預(yù)測(cè)。此外還新增了零周期分支預(yù)測(cè)程序(Zero-cycle branch predictor)以便進(jìn)一步減少流水線中的泡沫。這樣可以使指令之間的空閑時(shí)間越來越短。

· 我們的設(shè)計(jì)是，使二級(jí)高速緩存對(duì)每一顆 CPU 而言都是專用緩存，這樣一來與 Cortex-A53 相比，二級(jí)高速緩存的存取時(shí)間縮短了 50% 以上。我們還將二級(jí)高速緩存的工作頻率設(shè)計(jì)成與 CPU 相同的頻率。通過降低延遲大幅提升 CPU 在各類基準(zhǔn)測(cè)試工具中的性能。

· 我們推出了三級(jí)高速緩存，可供集群內(nèi)的所有 Cortex-A55 CPU 共享。這讓 DynamIQ 集群能夠得益于 CPU 附近增多的內(nèi)存容量，從而提升性能、降低系統(tǒng)功率。三級(jí)高速緩存是 DynamIQ 共享單元 (DSU) 的一部分，DSU 是DynamIQ 處理器中的一個(gè)新的功能單元。

· 8 位整數(shù)矩陣乘法對(duì)神經(jīng)網(wǎng)絡(luò)性能的影響超過85%。Cortex-A55 NEON流水線中增添了新的架構(gòu)指令，使其能夠在每個(gè)周期執(zhí)行 16 次 8 位整數(shù)運(yùn)算。這些新的指令還使該 CPU 能夠在每個(gè)周期執(zhí)行 8 次 16 位浮點(diǎn)運(yùn)算、對(duì)兩條 MAC 指令進(jìn)行舍入操作，有利于色彩空間轉(zhuǎn)換。

相較Cortex-A53，實(shí)現(xiàn)效能的大幅提升

對(duì)分支預(yù)測(cè)程序、NEON 和 FP 單元的上述改進(jìn)以及內(nèi)存延遲的縮短僅僅是 Cortex-A55 取得大幅性能提升的部分原因。Cortex-A55 不但實(shí)現(xiàn)了大幅性能提升，而且保持了與 Cortex-A53 相類似的功耗。總而言之，Cortex-A55 在節(jié)能性方面實(shí)現(xiàn)了 15% 的提升。相對(duì)于性能而言，功率在產(chǎn)品設(shè)計(jì)中更加重要。在提供同等性能的情況下，Cortex-A55 消耗的功率比 Cortex-A53 低 30% 之多!

Cortex-A55提供持續(xù)性能的時(shí)間遠(yuǎn)比當(dāng)今的 Cortex-A53 解決方案更長(zhǎng)。這一點(diǎn)對(duì)于 AR、VR 以及 MR 等領(lǐng)域的用戶體驗(yàn)而言至關(guān)重要，這些領(lǐng)域預(yù)計(jì)將會(huì)在未來移動(dòng)市場(chǎng)上占據(jù)主導(dǎo)地位。這些使用場(chǎng)合已經(jīng)高度線程化，對(duì)延遲有嚴(yán)格的要求。后者指的是移動(dòng)時(shí)間延遲，根據(jù)行業(yè)研究，這種延遲需要保持在 20 毫秒或以下，這樣才不會(huì)導(dǎo)致惡心和頭暈。雖然當(dāng)今的 CPU 已經(jīng)實(shí)現(xiàn)了達(dá)到 20 毫秒延遲所需的性能水平，但是發(fā)熱限制意味著這些 CPU 無法長(zhǎng)時(shí)間維持這樣的性能水平。有了 Cortex-A55，我們就能給出未來 VR 設(shè)備中延長(zhǎng)持續(xù)性能時(shí)間的解決方案。

行業(yè)領(lǐng)先的效率讓 Cortex-A55 在基礎(chǔ)設(shè)施市場(chǎng)卓爾不群。以太網(wǎng)供電 (PoE) 無線接入點(diǎn)以及安裝在后視鏡上的發(fā)熱受限的汽車解決方案等應(yīng)用均可利用熱效率極高的 Cortex-A55 在特定的發(fā)熱范圍內(nèi)提供最高性能。在 5G 遠(yuǎn)程無線電頭端 (RRH)，Cortex-A55 CPU 還能夠在特定功率范圍內(nèi)最大限度增加網(wǎng)絡(luò)吞吐量。

從端擴(kuò)展至云

[!--empirenews.page--]

除了性能與效率以外，Cortex-A55 的物理芯片尺寸以及計(jì)算性能也具有極高的擴(kuò)展性。為此，它包含了多個(gè) RTL 配置選項(xiàng)，從而使可配置容量達(dá)到了 Cortex-A53 的十倍。事實(shí)上，它擁有 3,000 多種獨(dú)特的配置，因而成為了史上最具擴(kuò)展性的Cortex-A CPU。

Cortex-A55 延續(xù)了 Cortex-A53 的靈活性，具備 NEON、Crypto 以及 ECC (糾錯(cuò)碼) 等選項(xiàng)，但是也采用了新的實(shí)用配置選項(xiàng)。例如，專用二級(jí)高速緩存的可配置容量從 64KB 到 256KB 不等，可帶來 10% 的性能提升。專用二級(jí)高速緩存能夠很好地提升性能，而且它無疑會(huì)成為諸多市場(chǎng)的默認(rèn)之選，它還被設(shè)計(jì)成了可選項(xiàng)，以便在物聯(lián)網(wǎng)等對(duì)尺寸敏感的市場(chǎng)上進(jìn)一步減小芯片尺寸。

DSU 無論在 Cortex-A55 還是在 Cortex-A75 上都很常見。它包含更多的配置選項(xiàng)，可根據(jù)用戶自身的應(yīng)用情況進(jìn)行定制。例如 CPU 之間共享的三級(jí)高速緩存可從 0KB 擴(kuò)展至最大 4MB。它還通過 AMBA 5 ACE 或 CHI 支持多用途接口選項(xiàng)，從而可用于更廣泛的系統(tǒng)。加速器相干性端口 (ACP) 和低延遲外圍端口 (PP) 也被集成到 DSU 當(dāng)中，這讓緊密耦合的加速器能夠連接至 Cortex-A55 以便處理通用計(jì)算。這些特性加上 Cortex-A55 的機(jī)器學(xué)習(xí)功能，讓更多的計(jì)算能夠在更靠近物聯(lián)網(wǎng)網(wǎng)關(guān)應(yīng)用“端”的地方執(zhí)行。

囊括諸多先進(jìn)特性，可用于各類新興應(yīng)用

人工智能會(huì)越來越普及，這已不是什么新鮮事。引申開來，我們的設(shè)備運(yùn)行機(jī)器學(xué)習(xí)任務(wù)也會(huì)變得十分普遍。有多種方法可以在芯片上實(shí)現(xiàn)機(jī)器學(xué)習(xí)的處理，然而 CPU 在這方面擁有獨(dú)特的優(yōu)勢(shì)。CPU 可進(jìn)行通用計(jì)算，因此它可以運(yùn)行到人工智能應(yīng)用的芯片當(dāng)中。目前機(jī)器學(xué)習(xí)和人工智能持續(xù)換代，固定功能的硬件不但價(jià)格昂貴，而且對(duì)機(jī)器學(xué)習(xí)而言容易過時(shí)。

對(duì) Cortex-A55 NEON流水線的改進(jìn)和新增的機(jī)器學(xué)習(xí)指令意味著 Cortex-A55 在矩陣乘法運(yùn)算方面的機(jī)器學(xué)習(xí)性能比Cortex A53要高出很多。最近發(fā)布的ARM 計(jì)算庫(kù)(ARM Compute Libraries)是專為 ARM Cortex-A NEON 和Mali GPU IP而優(yōu)化的入門級(jí)軟件函數(shù)集，它也可以應(yīng)用于 Cortex-A55 NEON 并進(jìn)一步提升其機(jī)器學(xué)習(xí)性能!

Cortex-A55的可靠性、可用性和可服務(wù)性 (RAS) 特性也很高，這些特性使其能夠服務(wù)于基礎(chǔ)設(shè)施以及汽車等各個(gè)領(lǐng)域。對(duì)汽車市場(chǎng)而言，Cortex-A55 的安全性現(xiàn)已得到提升。它在每一級(jí)高速緩存上均提供可選的 ECC 和奇偶校驗(yàn)特性，而且還支持“data poisoning”，這種方法可推遲已檢測(cè)到的、不可糾正的錯(cuò)誤，適用于更有彈性的系統(tǒng)。它還是首款在避免系統(tǒng)故障方面采用全新設(shè)計(jì)流程的 Cortex-A 系列 CPU，因而在搭配Cortex-R52的情況下十分適合 ASIL D 應(yīng)用。

深度嵌入高級(jí)電源管理特性

Cortex-A55具備諸多全新的電源特性，例如硬件控制狀態(tài)轉(zhuǎn)換能夠更快地從 ON 轉(zhuǎn)換至 OFF。Cortex-A55 還能夠根據(jù)當(dāng)前運(yùn)行的應(yīng)用程序自主地關(guān)閉三級(jí)高速緩存。對(duì)于 VR 等需要更多內(nèi)存的重載型應(yīng)用程序，三級(jí)高速緩存會(huì)完全打開。然而對(duì)于音樂播放等完全駐留在一級(jí)和二級(jí)高速緩存中的輕載型應(yīng)用程序而言，三級(jí)高速緩存會(huì)被關(guān)閉。額外還有兩種功率模式用于重載和輕載之間的應(yīng)用情形。

現(xiàn)在還可以創(chuàng)建單顆 CPU 或 CPU 群組，其中每一顆 CPU 都處于集群內(nèi)各自獨(dú)立的電壓域中，因此能夠更精細(xì)地動(dòng)態(tài)提升電壓和頻率。這有兩大好處：首先，它讓設(shè)計(jì)師能夠進(jìn)一步調(diào)節(jié)系統(tǒng)，從而實(shí)現(xiàn)最佳的性能和節(jié)能性。其次，這還意味著 DynamIQ 系統(tǒng)能夠更輕松地緊密匹配設(shè)備多變的發(fā)熱限制，因此可以最大限度發(fā)揮性能。

big.LITTLE處理的新時(shí)代

big.LITTLE 技術(shù)自 2011 年問世以來一直是異構(gòu)處理的代名詞。因此當(dāng)今市面上每三臺(tái)安卓 ARMv8 設(shè)備中就有兩臺(tái)依賴 big.LITTLE 技術(shù)來實(shí)現(xiàn)功率和性能優(yōu)化。DynamIQ big.LITTLE是 DynamIQ 系統(tǒng)的新一代異構(gòu)計(jì)算技術(shù)。

它讓設(shè)計(jì)師能夠利用 Cortex-A75 “大” CPU 和 Cortex-A55 “小” CPU 打造出充分集成的解決方案，大小 CPU 在物理上位于單一 CPU 集

它讓設(shè)計(jì)師能夠利用 Cortex-A75 “大” CPU 和 Cortex-A55 “小” CPU 打造出充分集成的解決方案，大小 CPU 在物理上位于單一 CPU 集群中。所有的軟件線程遷移和由此造成的大小 CPU 之間的高速緩存窺探(cache snoop)現(xiàn)在均發(fā)生在該集群內(nèi)。與 Cortex-A73 相比，Cortex-A75 CPU 可以用于頻率更高的使用場(chǎng)合，同時(shí)利用Cortex-A55 依舊保持持續(xù)的 DVFS 曲線。這是 big.LITTLE 系統(tǒng)的一項(xiàng)重要設(shè)計(jì)要求。這些特性合在一起，與上一代 big.LITTLE 技術(shù)相比，可大幅提升峰值性能、持續(xù)性能以及智能功能。

當(dāng)今的中端移動(dòng)和消費(fèi)級(jí)市場(chǎng)普遍采用基于Cortex-A53的 4 核和 8 核解決方案。然而，隨著人工智能和虛擬現(xiàn)實(shí)等高級(jí)使用場(chǎng)合從高端市場(chǎng)滲透到中端市場(chǎng)，廠商需要以更低的成本提供更高的性能和智能功能。DynamIQ big.LITTLE 通過推出新的異構(gòu) CPU 配置來滿足這一需求，例如 1 顆 Cortex-A75 + 3 顆 Cortex-A55 (1大+3小) 和 1 顆 Cortex-A75 + 7 顆 Cortex-A55 (1大+7小) 等等。這些新的配置以類似的芯片尺寸可分別與 4 核和 8 核的 Cortex-A55 設(shè)計(jì)相比，可以實(shí)現(xiàn) 2 倍以上的單線程性能。[!--empirenews.page--]

現(xiàn)已推出基礎(chǔ)設(shè)施和移動(dòng)片上系統(tǒng) (SoC) 設(shè)計(jì)指南

ARM 長(zhǎng)期以來一直在范例 SoC 設(shè)計(jì)驗(yàn)證我們的知識(shí)產(chǎn)權(quán)方面有著大量投入。由于 ARM 的知識(shí)產(chǎn)權(quán)組合與日俱增，這些范例系統(tǒng)的復(fù)雜度和范圍也隨之增長(zhǎng)。從 SoC 架構(gòu)到詳細(xì)的產(chǎn)前分析，這項(xiàng)工作涵蓋了方方面面。ARM 將以“系統(tǒng)指南”的形式提供這類知識(shí)。

除了全新 CPU 以外，ARM 還提供各種新的系統(tǒng)指南，這些指南涵蓋了移動(dòng)系統(tǒng)和基礎(chǔ)設(shè)施系統(tǒng)：

· 針對(duì)移動(dòng)系統(tǒng)的 CoreLink SGM-775 系統(tǒng)指南專為 Cortex-A75、Cortex-A55 以及 Mali-G72 而設(shè)計(jì)和優(yōu)化

· SGM-775 包括文檔、模型和軟件，而且可供 ARM 合作伙伴免費(fèi)使用

如需詳細(xì)了解如何實(shí)施移動(dòng)和基礎(chǔ)設(shè)施系統(tǒng)，敬請(qǐng)?jiān)L問我們的系統(tǒng)指南頁面。

基于 Cortex-A55 的設(shè)備預(yù)計(jì)什么時(shí)候上市?

Cortex-A55的最終發(fā)布令人激動(dòng)不已。Cortex-A55 在性能、節(jié)能性以及擴(kuò)展性等方面的長(zhǎng)足進(jìn)步將使其成為 ARM 的下一款出貨量最大的 Cortex-A 系列 CPU。然而，激動(dòng)人心之處不止于此。這一生態(tài)系統(tǒng)內(nèi)的大量 ARM 合作伙伴現(xiàn)已獲得 Cortex-A55 的相關(guān)許可，我已經(jīng)等不及想要看一看他們?cè)诮酉聛淼膸讉€(gè)月里將會(huì)發(fā)布哪些新一輪智能計(jì)算解決方案。雖然我們無法預(yù)測(cè)基于 Cortex-A55 的設(shè)備會(huì)以何種形式展現(xiàn)，但是可以確定的是，從2018年起未來將會(huì)無比激動(dòng)人心!