當(dāng)前位置:首頁 > 嵌入式 > 嵌入式動態(tài)
[導(dǎo)讀]高階行動裝置對多媒體等視覺體驗的要求愈來愈高,促使行動處理器開發(fā)商大舉整合更多GPU核心,期借助平行運算能力,分散CPU運算負(fù)擔(dān),進而強化繪圖與視覺表現(xiàn)。在全球消費性

高階行動裝置對多媒體等視覺體驗的要求愈來愈高,促使行動處理器開發(fā)商大舉整合更多GPU核心,期借助平行運算能力,分散CPU運算負(fù)擔(dān),進而強化繪圖與視覺表現(xiàn)。

在全球消費性市場中,智慧手機與平板裝置無疑是最熱門的產(chǎn)品,根據(jù)顧能(Gartner)所發(fā)布的最新預(yù)測指出,2013年手機出貨量將超過十八億支,較2012年成長3.7%;平板的出貨量將上看一億八千四百萬臺,成長42.7%,呈現(xiàn)高速增長態(tài)勢。

尤其值得關(guān)注的是高階行動裝置產(chǎn)品更不斷推陳出新,給用戶的視覺性應(yīng)用體驗已接近個人電腦(PC)、電視等級,即可提供豐富、流暢的二維(2D)或三維(3D)使用者繪圖介面(GUI)、視網(wǎng)膜(Retina)級的高畫質(zhì)、快速的網(wǎng)頁呈現(xiàn)及攝影功能,以及更逼真的3D游戲等。

在一臺小小的行動裝置上要達到這些使用體驗,對于開發(fā)者而言,設(shè)計門檻已愈來愈高。以3D游戲為例,要讓行動裝置達到與PC、電視同級的游戲體驗,須提升的視覺效果包括實體表現(xiàn)、動態(tài)照明、高動態(tài)范圍材質(zhì)(HDRTexture)、先進陰影效果、幾何細節(jié)、次表面散射(SubsurfaceScattering),以及動態(tài)反射(DynamicReflection)等。

所幸,最關(guān)鍵的行動處理器架構(gòu)不斷升級,除出現(xiàn)整合中央處理器(CPU)和繪圖處理器(GPU)的異質(zhì)多核心架構(gòu)外,GPU的數(shù)量及處理能力也大幅提升,成為實現(xiàn)流暢、長時效視覺體驗的最大功臣。以下將剖析先進GPU在架構(gòu)上的變化與最新進展。

實現(xiàn)更酷炫繪圖功能異質(zhì)多核心SoC勢不可當(dāng)

愈來愈多中高階行動裝置配置四核心CPU的行動處理器,以輝達(NVIDIA)的Tegra系列來說,自Tegra3開始,就已進入4+1的多核心架構(gòu),即四顆效能核心加一顆省電核心,而最新一代的Tegra4,同樣采用4+1的多核心架構(gòu),但處理器核心從前代的Cortex-A9提升為Cortex-A15;至于Tegra4i則仍采用Cortex-A9(r4)CPU。

雖然CPU的數(shù)目愈多,意味著處理效能也跟著提升,但因CPU的序列處理特性,愈多核心意味著應(yīng)用程式撰寫亦愈困難;相較之下,由于GPU具備平行處理特性,能以近線性化來擴充效能,因此增加GPU數(shù)目所提升的效益,會比CPU顯著許多。

在此情況下,整合CPU與GPU的異質(zhì)多核心架構(gòu),就成了必然之勢。而當(dāng)GPU核心更多,也讓開發(fā)者有更大空間和彈性去做出更酷的繪圖效果、更細膩的細節(jié)表現(xiàn)及更生動的情境塑造,讓行動視覺與游戲的體驗大幅提升。

Tegra4的GPU子系統(tǒng)就是很好的例子,它從前代的十二顆GeForceGPU核心,一舉提高到七十二顆,六倍的核心數(shù)也帶來六倍于Tegra3的繪圖效能。Tegra4及Tegra3在GPU效能表現(xiàn)上的差異,請參考表1。在系統(tǒng)配置上,其架構(gòu)中有所謂的頂點著色器(VertexShader)和畫素著色器(PixelShader);前者讓工程師可自訂場景(Scene)中頂點的轉(zhuǎn)換過程,后者則是用來控制畫面上每個畫素的著色計算。

 

 

整合更多GPU核

更進一步來看,Tegra4的作法是將七十二顆GeForce核心拆分為二十四顆VertexShader與四十八顆PixelShader。其中每四顆VertexShader組成一組頂點處理引擎(VertexProcessingEngine,VPE),所以有六顆VPE,分別具有16KB、96-entry快取記憶體,能夠有效降低向外部晶片存取資料的需求。在相同時脈下,新的GeForce核心可以帶來1.5倍于Tegra3的效能,而前后代VertexShader數(shù)量相差六倍,相乘之下差距達九倍之多。此外,Tegar4總共具有四組畫素管線(PixelFragmentShaderPipeline),每組畫素管線可細分為三組算術(shù)邏輯單元(ALU),每個ALU則是由四顆GeForce核心(即PixelShader)組成。在實際運作時,會以ALU做為最小層級的單元,并稱為多功能處理單元(Multi-FunctionUnit,MFU),因此Tegar4總共具有十二組MFU,MFU可執(zhí)行函數(shù)、三角函數(shù)、對數(shù)、倒數(shù)、平方根及MOV等指令(組合語言中的復(fù)制)(圖1、2)。

 

 

圖1 Tegra4的邏輯性繪圖處理管線流程圖

 

 

圖2 Tegra4的GPU架構(gòu)方塊圖

降低多核心SoC耗電量架構(gòu)設(shè)計擔(dān)當(dāng)重任

對于行動裝置而言,電池的使用壽命與效能/功能表現(xiàn)占有同樣重要的地位。同樣是四核心行動晶片,因個別架構(gòu)不同,往往也有不同的效能與功耗表現(xiàn)。以Tegra4來說,除采用安謀國際(ARM)最先進的CPU核心外,透過可變對稱式多重處理(vSMP)架構(gòu),可依照使用需求進行調(diào)配,讓四顆效能核心發(fā)揮最大處理能力,并可視工作量,分別自動啟用及停用各顆核心,以大幅節(jié)省電力。

為了提升續(xù)航力,Tegra4延續(xù)Tegra3的省電概念,在晶片中加入第五顆處理器核心,不過名稱從協(xié)同核心(CompanionCore)改為省電核心(BatterySaverCore)。當(dāng)裝置處于背景處理郵件、社交軟體同步,或是播放影片、音樂等低效能需求情境時,系統(tǒng)將關(guān)閉效能核心,并使用省電核心負(fù)責(zé)執(zhí)行程式。

就晶片設(shè)計觀之,多核心處理器必定會面臨記憶體頻寬和整體系統(tǒng)功率的重大瓶頸,為了因應(yīng)此議題,Tegra4提出雙通道(2x32位元)的記憶體子系統(tǒng)作法。此外,為減少對晶片外記憶體的存取使用需求,Tegra4的GPU架構(gòu)中規(guī)畫頂點、畫素、材質(zhì)(Texture)專用的快取記憶體,讓運算任務(wù)盡量在晶片內(nèi)部完成,以提升處理效益和降低功耗。

另一個降低系統(tǒng)單晶片(SoC)功耗的重要策略,就是采用先進的電源管理技術(shù)。以Tegra4來說,即采用多層級時脈閘控(MultipleLevelsofClockGating)、顯示要求群組(DisplayRequestGroupig)、動態(tài)電壓與頻率調(diào)節(jié)(DVFS)等多種電源管理技術(shù),針對不同使用情境將電源需求降至最低。

運算型攝影架構(gòu)助力行動裝置影像效能升級

再從應(yīng)用端來看GPU架構(gòu)的發(fā)展,今日的使用者非常仰賴行動裝置來進行照相和和錄影功能,且希望達到專業(yè)級的效果。不過,相較于相機,手機或平板裝置在先天性上就難以配置太大的鏡頭,這時想得到高品質(zhì)的影像,就得靠更先進的影像處理技術(shù),甚至是運用電腦演算法來創(chuàng)造影像。[!--empirenews.page--]

為了提升消費型行動影像體驗,真正捕捉到「稍縱即逝」的瞬間畫面,Tegra4內(nèi)建Chimera運算型攝影架構(gòu),它融合CPU、GPU及影像訊號處理器(ISP)的處理能力,讓裝置制造商得以大幅強化行動影像。在此架構(gòu)下,行動裝置能夠即時擷取高品質(zhì)的Always-On高動態(tài)范圍照片和影片、高動態(tài)范圍全景攝影和持續(xù)的點觸追蹤(Tap-to-Track)等功能。

以高動態(tài)范圍全景攝影來說,其中運用廣角或「魚眼」鏡頭的效果,通常是只在昂貴的數(shù)位單眼相機才具備的功能。Chimera架構(gòu)讓相機在移動時即可擷取場景,毋須依循特定的方位進行掃描,并可任意從左右、上下或?qū)蔷€等方向移動,讓使用者可隨心所欲運用更多角度和任何順序的影像,即時「描繪」一張全景相片。持續(xù)型Tap-to-Track技術(shù)則讓使用者能在拍照時,針對場景中的一個人物或物件進行自動曝光和鎖定,隨后無論對焦主體移動位置,或者相機調(diào)整到另一個更好的拍攝角度,相機都會自動追蹤原先已鎖定的主體。持續(xù)型的Tap-to-track功能也能隨著相機移動調(diào)整曝光,避免影像主體或背景有曝光不足或過度曝光的現(xiàn)象。

更進一步來看,Chimera架構(gòu)能為人所不能的原因,憑藉的是其影像處理的速度高達每秒執(zhí)行約一千億次的數(shù)學(xué)運算。同時,它導(dǎo)入了許多先進演算法,包括運用X光電腦斷層掃描(CT)器、深度太空望遠鏡和間諜衛(wèi)星所使用的電腦運算技術(shù),進而排除從前無法解決的問題,讓行動影像的呈現(xiàn)效果就像人類肉眼看到的世界一樣,有很多不同的景物、地點和場景,并富含各種的光線變化。

異質(zhì)多核心SoC擴張應(yīng)用版圖

異質(zhì)多核心的SoC架構(gòu)的優(yōu)勢明顯,加上由行動市場所驅(qū)動的技術(shù)演進日漸成熟,使得更多嵌入式應(yīng)用也開始選擇導(dǎo)入這類的行動處理器,其中一個快速成長的市場,即是車用電子領(lǐng)域,特別是車內(nèi)資訊娛樂(IVI)系統(tǒng)、數(shù)位儀表板、駕駛支援等應(yīng)用,皆仰賴更強大的GPU/CPU來加以支援。

以IVI系統(tǒng)來說,須要提供逼真的3D地圖和地形、時髦流暢的使用者介面,以及功能豐富的音訊系統(tǒng)。透過在行動應(yīng)用已證實可行的Tegra行動處理器,汽車制造商可以更快將這些功能整合至車輛當(dāng)中。在視覺處理方面,輝達即特別為車商開發(fā)出基于Tegra行動處理器的視覺運算模組(VisualComputingModule,VCM)。

相較于更新周期較長的其他車載電子系統(tǒng),汽車用戶期待自己的IVI系統(tǒng)和行動應(yīng)用有相似的體驗。透過這套VCM模組式設(shè)計,車商就能將快速發(fā)展的行動處理器技術(shù)獨立出來開發(fā)與整合,進而能在不同的車款中快速建置IVI車載系統(tǒng),此舉也有助于大幅節(jié)省開發(fā)時間和成本。

舉例來說,知名汽車品牌商奧迪(Audi)即導(dǎo)入VCM并推出具連網(wǎng)功能的AudiMIB系統(tǒng),讓AudiConnect平臺可隨時完整更新Google地球影像和Google地圖街景服務(wù)的360度全景圖。它同時也能實現(xiàn)其他網(wǎng)路資料的傳輸,如即時汽油價、天氣預(yù)測及Google本地搜尋的有用資訊。

挑選CPU與GPU軟體開發(fā)支援/開發(fā)工具成指標(biāo)

除了先進的硬體功能外,軟體開發(fā)的支援及開發(fā)工具也是開發(fā)者選擇GPU/CPU的關(guān)鍵。如前所述,Tegra系列的彈性化架構(gòu),讓開發(fā)者能運用客制化的演算法來調(diào)整GPU架構(gòu),進而得到更突出的視覺效果。不僅如此,在Tegra開發(fā)人員工具(TegraAndroidDeveloperPack)中支持包括CPU采樣分析(TegraProfiler)和GPU分析(PerfHUDES)等功能,NsightTegra則提供Android本地端的開發(fā)環(huán)境,讓開發(fā)者能更方便且快速的達成工作目標(biāo)。

在更高的GPU繪圖效能帶動下,可以預(yù)見行動或車載裝置將能享有更佳的視覺體驗。另一個值得關(guān)注的發(fā)展,則是未來透過瀏覽器實現(xiàn)3D場景、高畫質(zhì)顯示及快速反應(yīng)游戲的需求將會浮現(xiàn),背后驅(qū)動的力量則來自HTML5及WebGL等技術(shù)的發(fā)展。

事實上,HTML5已能支援GPU的應(yīng)用,愈來愈多瀏覽器也開始運用GPU來加速其視覺表現(xiàn)。在跨裝置、跨平臺的網(wǎng)站上提供強大視覺內(nèi)容的時代即將來臨,這將會帶來很大的商機,當(dāng)然,挑戰(zhàn)也不小呢!

本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險,如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉