GPU重大突破:“光子”架構(gòu)實現(xiàn)移動端光線追蹤
克服光線追蹤進入移動端的難點
由于光線追蹤對于計算資源有著很高的要求,而移動端又非常注重功耗的表現(xiàn),所以光線追蹤功耗表現(xiàn)是其進入移動端的第一難題。據(jù)Imagination技術(shù)前瞻副總裁Kristof Beets分享,移動端面臨的限制很多,一方面核心的數(shù)量沒有辦法無限疊加,發(fā)熱和功耗都會成為很大的問題。Imagination新推出的具有光線追蹤功能的C系列GPU IP,它有專門的硬件部分把光線追蹤相關(guān)的計算分流到光線追蹤的硬件上,來實現(xiàn)光線追蹤的效果。其中包括光線的反射、陰影、全局照明和環(huán)境光的遮蔽??傮w上可以達到整個顯示效果的極大提升,同時保留原來非常低的功耗和效率。Imagination將新的光線追蹤架構(gòu)命名為“光子”。據(jù)Imagination中國區(qū)戰(zhàn)略市場與生態(tài)副總時昕博士分享,“去創(chuàng)造一個新的宇宙,大家第一個想到的概念是什么?我想到上帝說的一句話“要有光”。我們要創(chuàng)造一個全新的虛擬世界,我們第一個需要的東西也是光,所以我們把新的光線追蹤的架構(gòu)命名為光子。”新的“光子”GPU架構(gòu)這個專門用來進行光線追蹤處理的硬件單元叫做RAC(光線加速集群),通過該硬件的加速可以實現(xiàn)傳統(tǒng) 方式數(shù)倍的提升,各項性能幾乎都能提高50%。以32位的CXTRT3舉例:每秒鐘可以計算13億條光線的折射、反射,每秒算力達到1.5T,48G像素/s、紋理運算1.3G/s、48GBoxTest;如果做AI定點運算每秒可以達到6TOPS。
光線追蹤的大規(guī)模應用之路
光線追蹤的思路很早就已經(jīng)出現(xiàn),但受制于計算資源的需求較大,一直沒能得到很大規(guī)模應用。而且在前期碎片化問題嚴重,一些方案均來自自有API或軟件方案,這意味著內(nèi)容開發(fā)者并不難在后臺大量應用這些技術(shù)。專用的硬件加速的出現(xiàn)使其成為了可能,英偉達的硬件加速光線追蹤桌面級GPU的發(fā)布是一個節(jié)點,讓硬件方案進入市場并得到認可。而今Imagination的光線追蹤移動GPU的發(fā)布,是一個更為重要的節(jié)點,帶來了光追的大規(guī)模應用爆發(fā)的可能。為了進一步推進光追的普及,Imagination率先提出了一個光追的分級體系,如下圖所示:0級為傳統(tǒng)方案,可能是在圖形工作站上進行幾個小時的畫面渲染,可能也會有一些專業(yè)的非標準化的硬件來加速。1級是后來業(yè)界在將光追算法向GPU上逐漸遷移,將CPU版本軟件轉(zhuǎn)換成GPU的版本,借助GPU的并行計算能力來獲得數(shù)量級加速。2級中出現(xiàn)了更多細致的光線處理的新的方式,3級中出現(xiàn)了硬件BVH處理能力。據(jù)時昕博士分享,目前行業(yè)中即使是PC上的光追,大概就在2、3級的水平。第4級別是當前Imagination所發(fā)布的新產(chǎn)品可以達到的,這是全球第一次達到該級別的硬件處理能力。第5級上會進一步將會更多計算工作負荷從原來的GPU的渲染器或著色器中分離出來,轉(zhuǎn)移到專門的硬件上去加速,從而省下更多的GPU資源來做其他動態(tài)渲染,這樣可以在性能提升的同時降低功耗。
據(jù)悉諸多客戶已經(jīng)獲得了最新CXT的IP授權(quán),按照正常的產(chǎn)品研發(fā)周期推算,消費者有望在2023年在移動設(shè)備上體驗到硬件光線追蹤方案。