分布式安全機制實現更高效的ASIL-B級功能安全構建,Imagination發(fā)布最新汽車級GPU IP——IMG DXS GPU
近年來,隨著汽車智能化和電動化的快速發(fā)展,汽車半導體市場展現出了前所未有的增長潛力。根據S&P Global Mobility的預測,到2029年,全球汽車半導體市場的收入預計將大幅增長,超過1300億美元。2022年該市場的收入為680億美元,意味著未來幾年將實現一倍的增長。這一增長主要得益于先進駕駛輔助系統(tǒng)(ADAS)、電動化以及信息娛樂系統(tǒng)的普及,尤其是在電動汽車領域,半導體內容的增加更為顯著。未來十年,隨著這些技術的廣泛應用,汽車半導體市場將迎來爆發(fā)式的增長。
高性能計算需求上升正在推動著包括車規(guī)級GPU在內,發(fā)揮出更為關鍵的作用尤。隨著ADAS(高級駕駛輔助系統(tǒng))和自動駕駛對高性能計算需求的增加,車規(guī)級GPU不僅是圖像處理的核心,更在駕駛輔助、自動駕駛決策和傳感器數據融合等方面發(fā)揮著重要作用。車規(guī)級GPU正在推動汽車從輔助駕駛逐步邁向完全自動駕駛的未來。
作為深耕GPU領域近40年的專家,Imagination的半導體解決方案在各類市場中已經出貨超過13億臺設備,其中3.95億設備是應用在汽車領域的。尤其是在座艙和信息娛樂系統(tǒng)GPU IP供應上,是當之無愧的的全球領先者。通過統(tǒng)一的PowerVR GPU架構,Imagination在汽車領域內提供了高效、安全且可擴展的圖形和計算處理能力,滿足了現代汽車對計算性能日益增長的需求。
近日Imagination發(fā)布了其最新的汽車級GPU IP——IMG DXS GPU,相比上一代汽車GPU IP,DXS GPU的峰值性能提升了50%,并結合了最新的D系列架構效率和圖形功能,使其成為強大的圖形處理器。新推出的分布式安全機制(Distributed Safety Mechanisms)在不影響性能的前提下,簡化了實現ASIL-B(汽車功能安全等級)的成本。通過軟硬件的協(xié)同優(yōu)化,DXS GPU的計算性能提升高達10倍,極大增強了GPU在自動駕駛等高計算需求場景下的表現。
最新的PowerVR架構,突破GPU計算能力新高度
最新的IMG DXS GPU在圖形處理和計算性能上的強大表現。首先,相比上一代產品,DXS GPU的每核心性能提升了50%,顯著提高了圖形和計算任務的處理能力。此外,DXS GPU具有極強的可擴展性,支持擴展至四個核心,最大化系統(tǒng)的處理能力。在1GHz時,DXS MC1能夠達到1.5 TFLOPS的浮點性能,并在INT8計算中實現6 TOPS(每秒萬億次操作),圖形像素填充率達到48 GPixels/s。而當頻率提升至1.5GHz,DXS MC4的整體性能能夠達到9 TFLOPS的浮點性能、36 TOPS的INT8性能以及288 GPixels/s的像素填充率。通過這些優(yōu)化,DXS GPU在計算性能、圖形處理能力和可擴展性方面都達到了一個新的高度。
IMG DXS GPU的強大性能表現來自其最新一代PowerVR GPU架構。通過采用2D雙速率紋理處理、數據主線、固件處理器、片段著色率以及ASTC HDR等先進技術,該架構實現了性能密度提升20%。這種提升不僅增強了乘客的游戲體驗,還改善了車載用戶界面的響應速度,提供了更順暢的操作體驗。同時,PowerVR GPU顯著增強了環(huán)視系統(tǒng)的圖像渲染能力,提升了駕駛安全性,并為車內座艙提供了更個性化的體驗,使每輛車的座艙設計更加差異化、與眾不同。
據悉,IMG DXS GPU在多種工作負載下相較于競爭對手的顯著性能優(yōu)勢。首先,在峰值性能方面,IMG DXS的表現達到了競爭對手的四倍,這意味著在處理高強度任務時,它能夠提供極為強大的處理能力。此外,在填充率為中心的圖形工作負載中,其性能可以達到競爭對手的兩倍。而對于計算密集型圖形任務,IMG DXS GPU的性能提升高達28%。特別是在安全關鍵的工作負載中,IMG DXS的性能還能進一步提升,最高可達兩倍。這些表現凸顯了IMG DXS GPU在處理復雜圖形和計算任務時的出色能力,尤其在對安全性和性能有高要求的應用場景中,優(yōu)勢更加明顯。
“首先DXS完美地匹配了今天汽車對于中央計算的要求,迎合了整車架構正在從分布式轉向中央計算的趨勢。第二個是完美匹配今天高性能的中央計算的要求,它提供了遠高于CPU的計算性能,同時提供了遠遠高于NPU以及這類加速器SoC的編程靈活性?!盜magination車載GPU產品線產品總監(jiān)章政分享到,“而且除了性能之外,最重要的是我們推出了全新的功能安全解決方案:分布式安全機制——幾乎完全消除了以前的其他功能安全方案實現機制帶來的性能以及片芯面積損失?!?
創(chuàng)新的專利——分布式安全機制,讓ASIL-B的實現更為高效
正如章總強調的,此次IMG DXS GPU的一大創(chuàng)新就是采用了Imagination最新的專利技術——分布式安全機制,所以能夠在幾乎不增加核心面積的情況下,實現更高的安全性和性能效率,助力客戶構建ASIL-B級別的汽車級GPU。
要實現ASIL-B級功能安全,傳統(tǒng)的方式有雙核鎖步(Dual-Core Lock Step)和工作負載重復(Workload Repetition)兩種。其中雙核鎖步是通過增加核心面積(面積增加至兩倍),來實現更高的安全性。然而,雖然面積顯著增加,性能卻沒有顯著提升。這意味著為了滿足安全要求,系統(tǒng)的成本會大幅上升。工作負載重復這一方法通過在相同面積上重復工作負載,來提高安全性,但結果是性能僅為標準核心的一半。這種方法雖然占用的額外資源較少,但性能損失明顯。
IMG DXS GPU則能夠在標準核心的基礎上,以最小的面積增加的前提下,提供與標準核心相同的性能,同時實現ASIL-B的安全標準。這使得它比雙核鎖步和工作負載重復更為高效,既保證了安全性,又避免了面積和性能的重大損失。
這種創(chuàng)新的技術叫做Safety Pairs,這是一種分布式功能安全機制,是Imagination的最新專利技術,它通過利用現代處理器中的并行性和自然空閑時間來實現故障檢測,且無需對工作負載或硬件進行重復處理,從而減少了開銷。
如下圖展示了處理器在不同時間段的運行狀態(tài),其中每個條形代表了處理器的任務執(zhí)行情況和空閑狀態(tài)。黃色部分標記為“IDLE”(空閑),表示處理器的自然空閑時間,而紫色和紅色部分表示不同的任務執(zhí)行時間。通過在這些空閑時間運行測試向量來檢測潛在故障,Safety Pairs能夠在不增加硅片或工作負載的前提下,實現故障檢測功能。
這個技術的優(yōu)點在于它避免了傳統(tǒng)方法中需要通過重復執(zhí)行工作負載或增加處理單元來實現安全檢測的做法,從而提高了系統(tǒng)的效率和資源利用率。簡言之,Safety Pairs使得IMG DXS GPU能夠以更少的硬件和資源開銷,確保系統(tǒng)的安全性和可靠性,滿足汽車行業(yè)的功能安全要求(如ASIL-B標準)。
“為什么功能安全在車這一塊很難推廣起來?主要是因為成本,因為芯片面積增加一倍或者是性能降低為二分之一,對于廠商來說它的成本也就增加了一倍。這個增加一倍的成本,最后都要轉化到消費者頭上去,那這個價格就要增加一倍。過去沒有太多客戶愿意為這個東西買單,所以一直推不起來。”章政解釋到,“Imagination作為一個傳統(tǒng)的GPU玩家,我們對GPU非常了解,我們對GPU怎么運行是非常清楚的。所以我們利用了GPU的一些特性來非常靈活地實現了功能安全機制?!?
整體而言,DSM(Distributed Safety Mechanism-分布式安全機制)是一種分布式架構,通過持續(xù)發(fā)送微小的測試向量來確保各子組件的正確性與穩(wěn)定性。該機制不僅適用于車載電子系統(tǒng),還能夠滿足航空、醫(yī)療、工業(yè)等多個具備功能安全要求的領域的需求。Imagination將持續(xù)優(yōu)化和發(fā)展這一機制,提升其效率,并擴大其應用范圍。目前,DSM已能夠輕松滿足ASIL-B的安全等級要求。未來還有望將進一步提升其安全等級,并在更低的資源和成本消耗下,確保更高的安全標準的實現。
雙速率FP16+SPU增加+軟件優(yōu)化,AI能力提升近十倍
AI的能力和圖形處理的能力是相通的,而高階自動駕駛的實現又必須依賴AI能力,因此DXS GPU在AI能力上的創(chuàng)新和優(yōu)化,也是其重要的一部分。透過軟件優(yōu)化和架構創(chuàng)新,DXS GPU也進一步幫助開發(fā)者更快速和高效地將AI的能力部署到汽車中。
盡管圖形處理是GPU的核心強項,隨著計算任務對并行處理要求的增加,圖形處理和計算的需求變得高度一致,許多GPU廠商開始將圖形處理硬件用于加速計算任務。這一趨勢也推動了AI的發(fā)展,因為AI的巨大算力需求最初就是通過GPU實現的,而CPU無法提供足夠的計算能力來支持AI的工作。
然而,盡管現代AI算法需要更高的性能,當前的半導體技術仍然面臨帶寬和工藝節(jié)點的瓶頸,尤其是在5納米甚至更小的技術節(jié)點上,成本會極具上升。因此,DXS在架構上進行了創(chuàng)新,通過支持FP16精度的計算來滿足大部分AI工作負載的需求,減少了對高帶寬的依賴。FP16比FP32帶寬需求更低,通過增加雙速率的FP16單元和SPU,DXS能夠在FP16工作負載下提供三倍的算力,顯著提升了性能。
此外,為了進一步降低帶寬需求,DXS盡可能將所有計算控制在GPU內部,減少數據在GPU和其他模塊之間的流動,從而大幅降低系統(tǒng)的帶寬要求。DXS在1GHz主頻下,能夠在FP16半精度浮點計算中提供12 TFLOPS的性能,在int8計算中則可達到24 TOPS的性能,且在主頻進一步提高到1.2GHz甚至1.5GHz時,性能會進一步提升。
另外值得關注的一點在于,相比于其他專門用于AI加速的NPU,GPU的最大優(yōu)勢在于其成熟的生態(tài)系統(tǒng),這主要得益于基于開放標準的編程環(huán)境,如OpenCL、Vulkan和oneAPI。強大的生態(tài)系統(tǒng)不僅降低了研發(fā)成本,還使得客戶能夠方便地將任務從競爭平臺移植到DXS上,推動了產品的市場推廣和盈利能力。經過多年的發(fā)展,Imagination的GPU生態(tài)系統(tǒng)已經非常成熟,為客戶的產品優(yōu)化提供了極大的便利。
“整個NPU生態(tài)系統(tǒng)是四分五裂的,開發(fā)成本非常高。根據行業(yè)內一些反饋——一個 NPU 的硬件工程師大概要搭配 10 到 20 個軟件工程師去把這個 NPU 的硬件給運行起來,這個軟件的成本是非常昂貴的。而且NPU它是固化的一個東西(因為要追求效率,編程性就非常差),但是我們看一看今天 AI 才剛剛開始新的算法,每一天都在出現新的架構。沒法去預測明天會有哪個新的架構出現,所以今天固化的NPU架構也無法去適配未來新的算法架構。特別是當NPU都追求高制程,高制程的制造成本又非常高昂。如果固化架構的這一NPU的生命周期很短,那這筆投資基本上就是有去無回的?!闭抡貏e解釋到,”我們看到的這個將來的趨勢是什么?將來的趨勢是在 AI 沒有完全固化之前,編程性是很重要的。可編程性,一個開發(fā)的生態(tài)系統(tǒng)有眾多的參與者,能更好的適配新的這個方法是用新的 framework 讓這個產品的生命周期增長,能有更多的銷量,攤薄你研發(fā)的成本,那你這個公司的最后這個產品才有機會去盈利?!?
因此,DXS GPU有著天然的開發(fā)生態(tài)優(yōu)勢,而Imagination也進一步在硬件架構優(yōu)化創(chuàng)新的基礎上,提供了最新的計算庫(compute library)和工具包(Toolkit),來幫助開發(fā)者加速關鍵的汽車應用——特別是ADAS(高級駕駛輔助系統(tǒng))和計算機視覺相關的任務。
據悉,在一些典型的工作負載中,DXS的AI性能相比上一代產品提升了近十倍。前面提到雖然硬件性能僅提升約50%,但這次顯著的性能增長主要歸因于軟件的支持與優(yōu)化。特別是在計算庫方面,性能提升了2至4倍。優(yōu)化的計算庫不僅在帶寬使用上實現了顯著的節(jié)省,同時也對片上內存進行了有效的管理與優(yōu)化。通過盡可能將所有計算保持在片上運行,避免了數據在不同計算單元之間的頻繁傳輸,從而降低了帶寬消耗。這一優(yōu)化措施不僅提升了系統(tǒng)效率,也顯著降低了能耗,因為數據傳輸通常是能耗的主要來源之一。
未來,隨著計算庫的不斷增強,DXS GPU的硬件利用率將持續(xù)提升,使得更多的高級駕駛輔助系統(tǒng)(ADAS)功能能夠在GPU上實現。這樣DXS GPU就能夠為ADAS提供更多更靈活的算法支持,從而幫助客戶的產品在未來具備更高的可持續(xù)性。利用強大的可編程性和計算能力,客戶在面對新的自動駕駛算法或功能需求時,也能夠通過開放API快速地在DXS平臺上實現這些新功能,從而滿足市場多樣化需求。
靈活可拓展方案保證客戶成本效益,應對未來增長需求
最后,DXS GPU**延續(xù)了Imagination在GPU產品上的拓展性優(yōu)勢,這保證了客戶的長期靈活性和成本效益,尤其是在應對未來可能增長的智能座艙和人機交互(HMI)需求時。
“雖然現在的需求可能不需要使用最高級別的GPU,但DXS GPU架構設計了多種可擴展的方案,以滿足未來可能出現的更高計算需求。例如,在未來5到10年內,如果智能座艙的屏幕數量增加,或者對HMI的要求提升,用戶可以從不同級別的DSX GPU中選擇,比如從8核心到256核心,或者選擇更高級別的MC2、MC4型號。簡單來說,即便當前你選擇的是低規(guī)格的GPU,未來仍然可以根據需求逐步升級和擴展,保持靈活性和成本效益?!?a href="/tags/Imagination" target="_blank">Imagination 資深產品總監(jiān)Stephen Spain表示,“簡單來說,即便當前你選擇的是低規(guī)格的GPU,未來仍然可以根據需求逐步升級和擴展,保持靈活性和成本效益。”