深入了解 Armv9 架構(gòu)特性及優(yōu)勢(shì),利用 Arm Cortex-A320 迎接行業(yè)未來革新
Arm Cortex-A320 CPU 的推出具有重要的里程碑意義。作為首個(gè)基于 Armv9 架構(gòu)的超高能效 CPU,這一突破性的處理器為功耗有限的設(shè)備引入了此前僅在尖端移動(dòng)計(jì)算解決方案中使用的先進(jìn)功能,使其在人工智能 (AI) 處理、安全性和整體能效方面均實(shí)現(xiàn)了顯著提升。
鑒于已有其他 Arm 處理器在為多樣化的邊緣側(cè)和端點(diǎn)設(shè)備提供良好支持,為何還要將 Armv9 功能引入一款服務(wù)相同目標(biāo)設(shè)備的處理器技術(shù)中呢?答案是順“時(shí)”而為。
當(dāng)今的物聯(lián)網(wǎng) (IoT) 環(huán)境對(duì)邊緣設(shè)備的需求更勝以往。智能攝像頭需要在本地運(yùn)行復(fù)雜的計(jì)算機(jī)視覺算法;工業(yè)傳感器須處理復(fù)雜的機(jī)器學(xué)習(xí) (ML) 模型以進(jìn)行預(yù)測(cè)性維護(hù);即使是簡(jiǎn)單的端點(diǎn)設(shè)備,也越來越離不開增強(qiáng)的安全性和虛擬化功能。這些不斷變化的需求使得 Armv9 的先進(jìn)功能不再只是錦上添花,而是新一代物聯(lián)網(wǎng)創(chuàng)新的必備條件。
Armv9 架構(gòu)將 Cortex-A320 的革新功能帶到了邊緣側(cè),通過可伸縮向量擴(kuò)展 (SVE2) 等關(guān)鍵的 Armv9 特性,增強(qiáng)了 AI 和數(shù)字信號(hào)處理 (DSP) 性能;同時(shí),它還利用了內(nèi)存標(biāo)記擴(kuò)展 (MTE) 以及通過 Secure EL2 (S-EL2) 提供的先進(jìn)虛擬化支持等全面的安全特性。這些功能與 Cortex-A320 高能效的微架構(gòu)相結(jié)合,使其能夠維持嚴(yán)格的能耗預(yù)算,并同時(shí)為邊緣 AI 處理開創(chuàng)新的可能性。
讓我們一同來跟隨本文探索這些功能。
采用通用 Armv9 架構(gòu)的優(yōu)勢(shì)
Armv9 架構(gòu)的一大突出特性是支持 SVE2。SVE2 有助于提升 DSP 任務(wù)性能,該特性使得處理復(fù)雜算法更加快速、高效。這對(duì)于 AI 和 ML 工作負(fù)載等需要高算力的應(yīng)用特別有助益。借助 SVE2,智能攝像頭可以更高效地處理視頻流,語音接口能夠以更低的延遲進(jìn)行自然語言處理,而工業(yè)傳感器則可在保持長(zhǎng)時(shí)間電池續(xù)航的同時(shí),運(yùn)行復(fù)雜的分析算法。
請(qǐng)參閱:
· 利用 Armv9 CPU 和 SVE2 加速視頻解碼和圖像處理
· 架構(gòu)學(xué)習(xí) - SVE2 入門指南
Cortex-A320 先進(jìn)的安全性
安全性在當(dāng)今的數(shù)字時(shí)代至關(guān)重要。為滿足這一需求,Cortex-A320 采用了 MTE、指針驗(yàn)證 (PAC) 和分支目標(biāo)識(shí)別 (BTI) 等先進(jìn)的安全特性,并協(xié)同發(fā)揮作用,以防御各種網(wǎng)絡(luò)安全威脅。
MTE 有助于檢測(cè)和減少 C/C++ 程序中常見的內(nèi)存安全漏洞。通過對(duì)內(nèi)存分配進(jìn)行標(biāo)記,并在訪問時(shí)檢查這些標(biāo)記,MTE 可以識(shí)別并防范潛在的安全漏洞。PAC 通過確保函數(shù)指針和返回地址的完整性,為系統(tǒng)增加了一層額外的安全保護(hù),以減少攻擊者利用軟件漏洞的機(jī)會(huì)。而 BTI 則是通過確保間接分支僅指向有效位置,來保護(hù)系統(tǒng)免受控制流攻擊。
請(qǐng)參閱:
· 通過 MTE 增強(qiáng)安全性
· 在面向 Linux 的 AArch64 上啟用 PAC 和 BTI(上)
· 在面向 Linux 的 AArch64 上啟用 PAC 和 BTI(中)
· 在面向 Linux 的 AArch64 上啟用 PAC 和 BTI(下)
· 架構(gòu)學(xué)習(xí) - 為復(fù)雜軟件保駕護(hù)航
S-EL2 虛擬化增強(qiáng)隔離性
虛擬化是現(xiàn)代計(jì)算中的一項(xiàng)關(guān)鍵技術(shù),它能夠高效利用資源并改善不同工作負(fù)載之間的隔離性。Cortex-A320 支持 S-EL2 虛擬化,增強(qiáng)了在同一硬件上運(yùn)行的虛擬機(jī)之間的隔離性。這在多用戶環(huán)境中尤為重要,因?yàn)樵诖祟惌h(huán)境中,不同的用戶或應(yīng)用共享相同的物理資源。
S-EL2 為虛擬機(jī)提供了一個(gè)安全的執(zhí)行環(huán)境,可確保敏感數(shù)據(jù)和操作不受其他虛擬機(jī)以及底層虛擬機(jī)監(jiān)控程序的影響。該級(jí)別的隔離對(duì)于維護(hù)云計(jì)算和邊緣計(jì)算場(chǎng)景中數(shù)據(jù)的完整性和機(jī)密性相當(dāng)重要。
為了保護(hù)敏感數(shù)據(jù)和代碼免受未經(jīng)授權(quán)的訪問,TrustZone 是 Arm 處理器內(nèi)置的安全特性,它創(chuàng)建了一個(gè)獨(dú)立且受保護(hù)的環(huán)境,確保關(guān)鍵任務(wù)與潛在威脅隔離運(yùn)行。另一個(gè)選擇是 Hafnium,這是一個(gè)針對(duì) Arm 的 A 處理器的安全固件參考實(shí)現(xiàn),為受信任的應(yīng)用提供堅(jiān)實(shí)根基,并增強(qiáng)了系統(tǒng)對(duì)網(wǎng)絡(luò)威脅的防護(hù)。
請(qǐng)參閱:
· 架構(gòu)學(xué)習(xí) - 面向 AArch64 的 TrustZone
· Hafnium 文檔
SVE2 提升 DSP 性能
SVE2 對(duì)于提升 Cortex-A320 的 DSP 能力至關(guān)重要。DSP 任務(wù)在音視頻處理、通訊及科學(xué)計(jì)算等眾多應(yīng)用中必不可少。SVE2 通過引入一系列新指令和數(shù)據(jù)類型,優(yōu)化了這些任務(wù)的處理性能,從而進(jìn)一步擴(kuò)展了 Armv9 架構(gòu)的功能。
例如,SVE2 引入了用于矩陣乘法的新指令,這一操作是許多 ML 算法的基礎(chǔ)。這些指令使得處理大數(shù)據(jù)集變得更加快速和高效,從而提高了 ML 工作負(fù)載的性能。此外,SVE2 還支持如 BF16 等專為 ML 和 AI 應(yīng)用優(yōu)化的新數(shù)據(jù)類型。
請(qǐng)參閱:
· Arm 針對(duì) A 處理器架構(gòu)推出 SVE2 和 TME
利用龐大的 Armv9 軟件生態(tài)系統(tǒng)
Cortex-A320 的一大優(yōu)勢(shì)在于,它與廣泛的 Armv9 軟件生態(tài)系統(tǒng)的兼容性。該生態(tài)系統(tǒng)涵蓋一系列專為新一代邊緣 AI 開發(fā)和優(yōu)化的工具、庫和框架,如高度優(yōu)化的編譯器(包括支持循環(huán)優(yōu)化的 LLVM、加密和 SIMD)等。超過 2,000 萬名的 Arm 開發(fā)者均能借助這一生態(tài)系統(tǒng),充分受益于最新的軟件技術(shù)進(jìn)展,進(jìn)而加速其應(yīng)用的開發(fā)。
Armv9 軟件生態(tài)系統(tǒng)支持 Linux 和安卓等主流的操作系統(tǒng),并能夠提供更出色的性能和安全特性,以及容器化和云開發(fā)方法。開發(fā)者可訪問 Arm 廣泛的工具和資源,高效地構(gòu)建和部署應(yīng)用。
請(qǐng)參閱:
· Arm 嵌入式工具鏈:新一代 Arm C/C++ 嵌入式編譯器
· 擴(kuò)展 LLVM 優(yōu)化
運(yùn)行實(shí)時(shí)操作系統(tǒng)
Cortex-A320 兼容 Zephyr 等實(shí)時(shí)操作系統(tǒng) (RTOS),使其在物聯(lián)網(wǎng)和嵌入式應(yīng)用中的用途更為廣泛。Zephyr 是一款專為資源有限設(shè)備設(shè)計(jì)的可擴(kuò)展 RTOS,支持多種硬件架構(gòu)和通信協(xié)議,能夠?qū)崿F(xiàn)高效且可靠的開發(fā)。
Kleidi 賦能邊緣 AI 性能
Arm KleidiAI 是一款輕量級(jí)的開源 AI 庫。得益于關(guān)鍵的 ML 框架和運(yùn)行時(shí)集成,其優(yōu)化并加速了Cortex-A320 上的 AI 工作負(fù)載,使開發(fā)者能夠利用 Armv9 架構(gòu)的先進(jìn)功能和靈活性。Kleidi 優(yōu)化了跨不同工作負(fù)載的軟件級(jí)性能,以充分發(fā)揮 Arm CPU 上的 AI 加速。其高度優(yōu)化的內(nèi)核提升了 ExecuTorch、LiteRT(前身為 Tensorflow Lite)等主流 AI 框架性能,從而實(shí)現(xiàn)了更快速的邊緣 AI 執(zhí)行,以及 CPU 和 NPU 間順暢的工作負(fù)載靈活性。
現(xiàn)在,Arm Kleidi 將擴(kuò)展至物聯(lián)網(wǎng)領(lǐng)域,為新一代邊緣 AI 應(yīng)用釋放 CPU 性能。Kleidi 在嵌入式和物聯(lián)網(wǎng)用例中實(shí)現(xiàn)了顯著的性能加速。例如,在 Llama.cpp 上運(yùn)行微軟的 Tiny Stories 小語言模型時(shí),Cortex-A320 的性能提升了近 70%。這一強(qiáng)大的組合簡(jiǎn)化了 AI 開發(fā),并加速了數(shù)十億設(shè)備的性能,使開發(fā)者能夠更輕松地在恰當(dāng)?shù)臅r(shí)間和位置上執(zhí)行合適的 AI 工作負(fù)載。
請(qǐng)參閱:
· Kleidi - 軟件級(jí) AI 加速
· Arm KleidiAI 助力 AI 框架性能提升
Cortex-A320 塑造物聯(lián)網(wǎng)的未來
Cortex-A320 CPU 的推出標(biāo)志著計(jì)算技術(shù)的演進(jìn)歷程中的一個(gè)重要里程碑。憑借其先進(jìn)的特性和強(qiáng)大的架構(gòu),Cortex-A320 有望革新物聯(lián)網(wǎng)行業(yè),并為未來的創(chuàng)新應(yīng)用鋪平道路。廣泛采用的通用 Armv9 架構(gòu)、增強(qiáng)的安全特性、S-EL2 虛擬化、借助 SVE2 提升的 DSP 性能、與龐大的 Armv9 軟件生態(tài)系統(tǒng)的兼容性、對(duì) Zephyr 等 RTOS 的運(yùn)行支持,以及 Arm Kleidi 的引入,使其成為開發(fā)者和企業(yè)的理想之選。
將 Armv9 功能引入超高能效設(shè)備為邊緣側(cè)的創(chuàng)新開辟了全新的可能性。開發(fā)者現(xiàn)在可以構(gòu)思并打造以前在功耗有限環(huán)境中無法實(shí)現(xiàn)的應(yīng)用,譬如在本地運(yùn)行復(fù)雜 AI 的智能攝像頭、實(shí)時(shí)處理復(fù)雜 ML 模型的工業(yè)系統(tǒng),以及在不犧牲電池續(xù)航情況下實(shí)現(xiàn)企業(yè)級(jí)安全性的物聯(lián)網(wǎng)設(shè)備。
無論你是在開發(fā)物聯(lián)網(wǎng)解決方案、AI 和 ML 應(yīng)用,還是構(gòu)建安全計(jì)算環(huán)境,Cortex-A320 都能為你提供 AI 時(shí)代所需的工具和能力,助你旗開得勝。點(diǎn)擊此處,了解更多有關(guān) Cortex-A320 的信息,及其卓越性能、安全性和能效為物聯(lián)網(wǎng)領(lǐng)域帶來的變革性影響。