當前位置:首頁 > 嵌入式 > 嵌入式硬件
[導讀]你是否已經聽說了最近市場上發(fā)布了幾款新的 CPU?它們的性能非常強大!當然,我說的就是 ARM Cortex-A75 和Cortex-A55,即首批基于新近發(fā)布的DynamIQ 技術的Cortex-A系列處理

你是否已經聽說了最近市場上發(fā)布了幾款新的 CPU?它們的性能非常強大!當然,我說的就是 ARM Cortex-A75 和Cortex-A55,即首批基于新近發(fā)布的DynamIQ 技術的Cortex-A系列處理器。本文我們討論的就是 Cortex-A55:一款對為未來數(shù)字世界舉足輕重的處理器。下面就隨單片機小編一起來了解一下相關內容吧。

出生名門,久經考驗

 

想要理解 Cortex-A55 的真正潛力,我們來簡要回顧一下其上一代產品:ARM Cortex-A53。采用這款 CPU 的設備已超過 15億臺,該 CPU 依然是當今業(yè)界出貨量最高的 64 位 Cortex-A 系列 CPU。Cortex-A53 于 2012 年發(fā)布,其獨一無二的設計,集性能、低功耗以及尺寸擴展性于一身,具備一系列多用途特性,因而可應用于諸多市場,其中包括高端智能手機、網(wǎng)絡基礎設施、汽車信息娛樂、高級駕駛員輔助系統(tǒng) (ADAS)、數(shù)字電視、入門級移動設備和消費級設備乃至人造衛(wèi)星。

然而自 2012 年以來,我們周圍的世界發(fā)生了許多變化。我們現(xiàn)在看到的新興趨勢表明,保持互聯(lián)、萬物智能的數(shù)字世界具有非常大的發(fā)展?jié)摿?。從完全自主的自動駕駛汽車到各類設備上的智能應用程序,人工智能 (AI) 和機器學習 (ML) 將真正融入到我們的日常生活中,這一點已成定局。物聯(lián)網(wǎng) (IoT) 應用的盛行意味著“物”的爆炸性增長,越來越多的“物”在持續(xù)生成數(shù)據(jù)、消費數(shù)據(jù)以及與數(shù)據(jù)進行交互。增強現(xiàn)實、虛擬現(xiàn)實以及混合現(xiàn)實 (AR、VR 以及 MR) 注定會徹底改變我們人類之間以及人機之間的互動方式,將現(xiàn)實世界與數(shù)字世界融于一體。

在過去兩年里,ARM 的工程師致力于研究 Cortex-A53 的后繼產品,以滿足這類新興技術的需求,我們的目標是打造出一款性能、效能以及擴展性均大幅提升的 CPU,而且這款 CPU 還需要具備諸多先進的特性,從而滿足從端到云的各種未來應用需求,幸運的是我們做到了。

性能全面提升

 

Cortex-A55 采用最新的 ARMv8.2 架構,并在其前代產品的基礎上打造而成。它在性能方面突破了極限,同時依舊保持了與 Cortex-A53 相同的功耗水平。我們盡全力改進 Cortex-A53,并賦予其以下特性:

· 在相同的頻率與工藝條件下,內存性能最高可達 Cortex-A53 的兩倍

· 在相同的頻率與工藝條件下,效能比 Cortex-A53 高 15%

· 擴展性比 Cortex-A53 高十倍以上

這些歸功于我們專注于 Cortex-A53 現(xiàn)有的設計理念并挑戰(zhàn)這些理念。

· 我們對分支預測程序(branch predictor)進行了全面修改,在其算法中融入了神經網(wǎng)絡元素來改進預測。此外還新增了零周期分支預測程序(Zero-cycle branch predictor)以便進一步減少流水線中的泡沫。這樣可以使指令之間的空閑時間越來越短。

· 我們的設計是,使二級高速緩存對每一顆 CPU 而言都是專用緩存,這樣一來與 Cortex-A53 相比,二級高速緩存的存取時間縮短了 50% 以上。我們還將二級高速緩存的工作頻率設計成與 CPU 相同的頻率。通過降低延遲大幅提升 CPU 在各類基準測試工具中的性能。

· 我們推出了三級高速緩存,可供集群內的所有 Cortex-A55 CPU 共享。這讓 DynamIQ 集群能夠得益于 CPU 附近增多的內存容量,從而提升性能、降低系統(tǒng)功率。三級高速緩存是 DynamIQ 共享單元 (DSU) 的一部分,DSU 是DynamIQ 處理器中的一個新的功能單元。

· 8 位整數(shù)矩陣乘法對神經網(wǎng)絡性能的影響超過85%。Cortex-A55 NEON流水線中增添了新的架構指令,使其能夠在每個周期執(zhí)行 16 次 8 位整數(shù)運算。這些新的指令還使該 CPU 能夠在每個周期執(zhí)行 8 次 16 位浮點運算、對兩條 MAC 指令進行舍入操作,有利于色彩空間轉換。

相較Cortex-A53,實現(xiàn)效能的大幅提升

 

對分支預測程序、NEON 和 FP 單元的上述改進以及內存延遲的縮短僅僅是 Cortex-A55 取得大幅性能提升的部分原因。Cortex-A55 不但實現(xiàn)了大幅性能提升,而且保持了與 Cortex-A53 相類似的功耗??偠灾?,Cortex-A55 在節(jié)能性方面實現(xiàn)了 15% 的提升。相對于性能而言,功率在產品設計中更加重要。在提供同等性能的情況下,Cortex-A55 消耗的功率比 Cortex-A53 低 30% 之多!

Cortex-A55提供持續(xù)性能的時間遠比當今的 Cortex-A53 解決方案更長。這一點對于 AR、VR 以及 MR 等領域的用戶體驗而言至關重要,這些領域預計將會在未來移動市場上占據(jù)主導地位。這些使用場合已經高度線程化,對延遲有嚴格的要求。后者指的是移動時間延遲,根據(jù)行業(yè)研究,這種延遲需要保持在 20 毫秒或以下,這樣才不會導致惡心和頭暈。雖然當今的 CPU 已經實現(xiàn)了達到 20 毫秒延遲所需的性能水平,但是發(fā)熱限制意味著這些 CPU 無法長時間維持這樣的性能水平。有了 Cortex-A55,我們就能給出未來 VR 設備中延長持續(xù)性能時間的解決方案。

 

行業(yè)領先的效率讓 Cortex-A55 在基礎設施市場卓爾不群。以太網(wǎng)供電 (PoE) 無線接入點以及安裝在后視鏡上的發(fā)熱受限的汽車解決方案等應用均可利用熱效率極高的 Cortex-A55 在特定的發(fā)熱范圍內提供最高性能。在 5G 遠程無線電頭端 (RRH),Cortex-A55 CPU 還能夠在特定功率范圍內最大限度增加網(wǎng)絡吞吐量。

從端擴展至云

 

[!--empirenews.page--]

除了性能與效率以外,Cortex-A55 的物理芯片尺寸以及計算性能也具有極高的擴展性。為此,它包含了多個 RTL 配置選項,從而使可配置容量達到了 Cortex-A53 的十倍。事實上,它擁有 3,000 多種獨特的配置,因而成為了史上最具擴展性的Cortex-A CPU。

Cortex-A55 延續(xù)了 Cortex-A53 的靈活性,具備 NEON、Crypto 以及 ECC (糾錯碼) 等選項,但是也采用了新的實用配置選項。例如,專用二級高速緩存的可配置容量從 64KB 到 256KB 不等,可帶來 10% 的性能提升。專用二級高速緩存能夠很好地提升性能,而且它無疑會成為諸多市場的默認之選,它還被設計成了可選項,以便在物聯(lián)網(wǎng)等對尺寸敏感的市場上進一步減小芯片尺寸。

 

DSU 無論在 Cortex-A55 還是在 Cortex-A75 上都很常見。它包含更多的配置選項,可根據(jù)用戶自身的應用情況進行定制。例如 CPU 之間共享的三級高速緩存可從 0KB 擴展至最大 4MB。它還通過 AMBA 5 ACE 或 CHI 支持多用途接口選項,從而可用于更廣泛的系統(tǒng)。加速器相干性端口 (ACP) 和低延遲外圍端口 (PP) 也被集成到 DSU 當中,這讓緊密耦合的加速器能夠連接至 Cortex-A55 以便處理通用計算。這些特性加上 Cortex-A55 的機器學習功能,讓更多的計算能夠在更靠近物聯(lián)網(wǎng)網(wǎng)關應用“端”的地方執(zhí)行。

囊括諸多先進特性,可用于各類新興應用

 

人工智能會越來越普及,這已不是什么新鮮事。引申開來,我們的設備運行機器學習任務也會變得十分普遍。有多種方法可以在芯片上實現(xiàn)機器學習的處理,然而 CPU 在這方面擁有獨特的優(yōu)勢。CPU 可進行通用計算,因此它可以運行到人工智能應用的芯片當中。目前機器學習和人工智能持續(xù)換代,固定功能的硬件不但價格昂貴,而且對機器學習而言容易過時。

對 Cortex-A55 NEON流水線的改進和新增的機器學習指令意味著 Cortex-A55 在矩陣乘法運算方面的機器學習性能比Cortex A53要高出很多。最近發(fā)布的ARM 計算庫(ARM Compute Libraries)是專為 ARM Cortex-A NEON 和Mali GPU IP而優(yōu)化的入門級軟件函數(shù)集,它也可以應用于 Cortex-A55 NEON 并進一步提升其機器學習性能!

 

Cortex-A55的可靠性、可用性和可服務性 (RAS) 特性也很高,這些特性使其能夠服務于基礎設施以及汽車等各個領域。對汽車市場而言,Cortex-A55 的安全性現(xiàn)已得到提升。它在每一級高速緩存上均提供可選的 ECC 和奇偶校驗特性,而且還支持“data poisoning”,這種方法可推遲已檢測到的、不可糾正的錯誤,適用于更有彈性的系統(tǒng)。它還是首款在避免系統(tǒng)故障方面采用全新設計流程的 Cortex-A 系列 CPU,因而在搭配Cortex-R52的情況下十分適合 ASIL D 應用。

深度嵌入高級電源管理特性

 

Cortex-A55具備諸多全新的電源特性,例如硬件控制狀態(tài)轉換能夠更快地從 ON 轉換至 OFF。Cortex-A55 還能夠根據(jù)當前運行的應用程序自主地關閉三級高速緩存。對于 VR 等需要更多內存的重載型應用程序,三級高速緩存會完全打開。然而對于音樂播放等完全駐留在一級和二級高速緩存中的輕載型應用程序而言,三級高速緩存會被關閉。額外還有兩種功率模式用于重載和輕載之間的應用情形。

現(xiàn)在還可以創(chuàng)建單顆 CPU 或 CPU 群組,其中每一顆 CPU 都處于集群內各自獨立的電壓域中,因此能夠更精細地動態(tài)提升電壓和頻率。這有兩大好處:首先,它讓設計師能夠進一步調節(jié)系統(tǒng),從而實現(xiàn)最佳的性能和節(jié)能性。其次,這還意味著 DynamIQ 系統(tǒng)能夠更輕松地緊密匹配設備多變的發(fā)熱限制,因此可以最大限度發(fā)揮性能。

big.LITTLE處理的新時代

big.LITTLE 技術自 2011 年問世以來一直是異構處理的代名詞。因此當今市面上每三臺安卓 ARMv8 設備中就有兩臺依賴 big.LITTLE 技術來實現(xiàn)功率和性能優(yōu)化。DynamIQ big.LITTLE是 DynamIQ 系統(tǒng)的新一代異構計算技術。

它讓設計師能夠利用 Cortex-A75 “大” CPU 和 Cortex-A55 “小” CPU 打造出充分集成的解決方案,大小 CPU 在物理上位于單一 CPU 集

它讓設計師能夠利用 Cortex-A75 “大” CPU 和 Cortex-A55 “小” CPU 打造出充分集成的解決方案,大小 CPU 在物理上位于單一 CPU 集群中。所有的軟件線程遷移和由此造成的大小 CPU 之間的高速緩存窺探(cache snoop)現(xiàn)在均發(fā)生在該集群內。與 Cortex-A73 相比,Cortex-A75 CPU 可以用于頻率更高的使用場合,同時利用Cortex-A55 依舊保持持續(xù)的 DVFS 曲線。這是 big.LITTLE 系統(tǒng)的一項重要設計要求。這些特性合在一起,與上一代 big.LITTLE 技術相比,可大幅提升峰值性能、持續(xù)性能以及智能功能。

 

當今的中端移動和消費級市場普遍采用基于Cortex-A53的 4 核和 8 核解決方案。然而,隨著人工智能和虛擬現(xiàn)實等高級使用場合從高端市場滲透到中端市場,廠商需要以更低的成本提供更高的性能和智能功能。DynamIQ big.LITTLE 通過推出新的異構 CPU 配置來滿足這一需求,例如 1 顆 Cortex-A75 + 3 顆 Cortex-A55 (1大+3小) 和 1 顆 Cortex-A75 + 7 顆 Cortex-A55 (1大+7小) 等等。這些新的配置以類似的芯片尺寸可分別與 4 核和 8 核的 Cortex-A55 設計相比,可以實現(xiàn) 2 倍以上的單線程性能。[!--empirenews.page--]

現(xiàn)已推出基礎設施和移動片上系統(tǒng) (SoC) 設計指南

ARM 長期以來一直在范例 SoC 設計驗證我們的知識產權方面有著大量投入。由于 ARM 的知識產權組合與日俱增,這些范例系統(tǒng)的復雜度和范圍也隨之增長。從 SoC 架構到詳細的產前分析,這項工作涵蓋了方方面面。ARM 將以“系統(tǒng)指南”的形式提供這類知識。

除了全新 CPU 以外,ARM 還提供各種新的系統(tǒng)指南,這些指南涵蓋了移動系統(tǒng)和基礎設施系統(tǒng):

· 針對移動系統(tǒng)的 CoreLink SGM-775 系統(tǒng)指南專為 Cortex-A75、Cortex-A55 以及 Mali-G72 而設計和優(yōu)化

· SGM-775 包括文檔、模型和軟件,而且可供 ARM 合作伙伴免費使用

如需詳細了解如何實施移動和基礎設施系統(tǒng),敬請訪問我們的系統(tǒng)指南頁面。

基于 Cortex-A55 的設備預計什么時候上市?

Cortex-A55的最終發(fā)布令人激動不已。Cortex-A55 在性能、節(jié)能性以及擴展性等方面的長足進步將使其成為 ARM 的下一款出貨量最大的 Cortex-A 系列 CPU。然而,激動人心之處不止于此。這一生態(tài)系統(tǒng)內的大量 ARM 合作伙伴現(xiàn)已獲得 Cortex-A55 的相關許可,我已經等不及想要看一看他們在接下來的幾個月里將會發(fā)布哪些新一輪智能計算解決方案。雖然我們無法預測基于 Cortex-A55 的設備會以何種形式展現(xiàn),但是可以確定的是,從2018年起未來將會無比激動人心!

本站聲明: 本文章由作者或相關機構授權發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內容真實性等。需要轉載請聯(lián)系該專欄作者,如若文章內容侵犯您的權益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或將催生出更大的獨角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉型技術解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術公司SODA.Auto推出其旗艦產品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關鍵字: 汽車 人工智能 智能驅動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務中斷的風險,如企業(yè)系統(tǒng)復雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務連續(xù)性,提升韌性,成...

關鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產業(yè)博覽會開幕式在貴陽舉行,華為董事、質量流程IT總裁陶景文發(fā)表了演講。

關鍵字: 華為 12nm EDA 半導體

8月28日消息,在2024中國國際大數(shù)據(jù)產業(yè)博覽會上,華為常務董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權最終是由生態(tài)的繁榮決定的。

關鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應對環(huán)境變化,經營業(yè)績穩(wěn)中有升 落實提質增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務引領增長 以科技創(chuàng)新為引領,提升企業(yè)核心競爭力 堅持高質量發(fā)展策略,塑強核心競爭優(yōu)勢...

關鍵字: 通信 BSP 電信運營商 數(shù)字經濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術學會聯(lián)合牽頭組建的NVI技術創(chuàng)新聯(lián)盟在BIRTV2024超高清全產業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術創(chuàng)新聯(lián)...

關鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關鍵字: BSP 信息技術
關閉
關閉