深度解析Tegra K1架構(gòu):NVIDIA再次吹響前進(jìn)號角(圖)
Tegra 2是首款雙核心安卓處理器,Tegra 3第一個做到了四核,Tegra 4則第一次帶來了四核A15。經(jīng)過四代產(chǎn)品的鋪墊,NVIDIA在移動領(lǐng)域積累了大量經(jīng)驗(yàn)和教訓(xùn),再次吹響了前進(jìn)的號角——Tegra K1。
這一次,NVIDIA首次在同一個名字下提供了兩種不同的版本,其一是傳統(tǒng)的4+1核心A15,其二是自主設(shè)計(jì)的雙核ARMv8 64位架構(gòu)(丹佛工程),并且都集成了開普勒架構(gòu)的GPU圖形核心,拋棄之前陳舊的NV4x而首次追上了桌面顯卡的步伐。
這一次,NVIDIA更加野心勃勃。
【CPU選擇之一:四核A15】
Tegra K1的這個版本和Tegra 4很相像,也是四個高性能A15核心、一個省電專用A15核心,但仍然有多出明顯改進(jìn):
1、晶體管布局。這個是對半導(dǎo)體廠商設(shè)計(jì)能力的最大考驗(yàn),也是決定芯片表現(xiàn)的關(guān)鍵。NVIDIA自稱汲取了Tegra 4上的經(jīng)驗(yàn)。
2、28nm HPM制造工藝。Tegra 4使用的是臺積電28nm HPL,最高只能跑到1.9GHz,而且經(jīng)常需要為了控制功耗而不得不降頻,而更高級的新工藝技術(shù)大大降低了動態(tài)功耗。
3、A15 R3核心。Tegra 4的核心是A15 r2p1版本,現(xiàn)在升級到了r3p3版本,而伴隨每次修訂,都會有大量Bug修復(fù)和時不時的性能提升。r3系列版本中,ARM增加了更精細(xì)的時鐘柵極,直接提高了能效。
綜上,Tegra K1的最高頻率來到了2.3GHz,而且可以在四個核心全部開啟的情況下跑出這個頻率,僅此帶來的性能提升就可以超過20%。
第五個節(jié)能核心的頻率最高1GHz,不過大部分時候會徘徊在500MHz左右。
NVIDIA宣稱,在同樣的功耗下,Tegra K1的性能可以提升40%,而在同樣的頻率下,Tegra K1的功耗能夠節(jié)省55%。
緩存沒有動,還是2MB二級緩存、32+32KB一級緩存,而內(nèi)存是64-bit LPDDR3/DDR3L,最大容量翻番至8GB,因?yàn)橹С至?0位物理尋址。
A15版本的Tegra K1已經(jīng)在2013年底投產(chǎn),將在本季度內(nèi)提供給廠商,上半年應(yīng)該就能看到實(shí)際產(chǎn)品出爐,不過有了Tegra 4的前車之鑒,廠商們肯定會更謹(jǐn)慎。
【CPU選擇之二:64位丹佛】
整整三年前的CES上,NVIDIA宣布正在自主開發(fā)ARM指令集微架構(gòu),代號“丹佛工程”,不過當(dāng)時定位的是PC、服務(wù)器,并沒有提及移動端,可能那個時候大家還沒有想到智能手機(jī)、平板機(jī)會發(fā)展得這么猛。
Tegra K1將在今年下半年迎來新版本,集成兩個丹佛核心,工藝可能仍是28nm HPM,而且兩個版本針腳兼容,因此內(nèi)存接口也不會變。
丹佛版Tegra K1將不再有節(jié)能核心,只有兩個更大的主核心。現(xiàn)在大家都在追逐更多核心,NVIDIA一下子返回雙核,會不會讓諸多小白感到“憤慨”?
NVIDIA宣稱丹佛架構(gòu)是七發(fā)射的,看起來很寬,但這只是處理器的內(nèi)部指令格式,現(xiàn)在還不清楚哪些指令能夠并發(fā),這是很關(guān)鍵的。
丹佛的一級指令緩存是128KB,一級數(shù)據(jù)緩存是64KB,這種非對稱設(shè)計(jì)在消費(fèi)級領(lǐng)域并不常見,可能和架構(gòu)設(shè)計(jì)特點(diǎn)有關(guān)。
28nm工藝加上七發(fā)射,丹佛版Tegra K1的主頻仍然能夠高達(dá)2.5GHz,這是挺不可思議的,不知道功耗控制會如何。
丹佛版Tegra K1的設(shè)計(jì)幾周前剛剛從工廠里返回,現(xiàn)在已經(jīng)可以運(yùn)行安卓4.4了,進(jìn)展順利,不過還得等半年多才能看到它。
【GPU:牛X的開普勒】
此前四代Tegra使用的圖形核心都叫做GeForce ULP,是基于古老NV40架構(gòu)而來的,非統(tǒng)一渲染,技術(shù)特性也很差,尤其是不支持OpenGL ES 2.0,好在性能還算不錯。
Tegra K1上,NVIDIA發(fā)狠首次借鑒了桌面級GPU,這在整個行業(yè)也是頭一遭,而且看上去Tegra未來會一直這么做,比如下代架構(gòu)麥克斯韋就也會很快進(jìn)入Tegra。
Tegra、GeForce的開普勒在架構(gòu)上是差不多的,擁有同樣大小的寄存器文件、共享的一級緩存,100% ISA(指令集架構(gòu))兼容,這說明開普勒的設(shè)計(jì)本身就很高明,直接就能拿過來用到移動端。
當(dāng)然規(guī)模小多了,只有一個陣列、192個流處理器(不過叫192核心芯片就太二了),而桌面和筆記本上至少兩個陣列、384個流處理器。我們看看筆記本上的GeForce 740M,功耗大約19W,其中包括3W左右的內(nèi)存IO、PCI-E和其它非GPU模塊,如果能再去掉6W的漏電,那就只剩下10W。
兩個陣列變成一個,功耗再降一半來到5W,而頻率和電壓再控制一下(核心頻率應(yīng)該是950MHz),2-3W是非常有可能的。NVIDIA宣稱的則是GPU部分低于2W。
曲面細(xì)分、幾何引擎都沒有刪減。FP64支持也在,相當(dāng)于FP32 1/24。紋理單元8個,ROP單元4個,只有PC版的四分之一。
DirectX 11、OpenGL 4.4、OpenGL ES 3.0、CUDA 6.0,這些在桌面上有的,Tegra里一個不缺,號稱有史以來最先進(jìn)的移動GPU并不為過,還添加支持了自適應(yīng)可伸縮紋理壓縮(ATSC)。
192個流處理器×2GFlops浮點(diǎn)性能每核心×950MHz核心頻率,Tegra K1的原始性能達(dá)到了365GFlops,遠(yuǎn)遠(yuǎn)超過Xbox 360、PS3,同時在紋理過濾、內(nèi)存帶寬上也都明顯勝出。單從指標(biāo)上看,Tegra K1已經(jīng)超越了上代游戲機(jī)。
或許是吃了Tegra 4高功耗的虧,NVIDIA這次非常注重能效,包括電路/電源/多層時鐘柵極、互連和數(shù)據(jù)路徑優(yōu)化、空閑/輕負(fù)載/高負(fù)載管理、二級緩存與壓縮、后端處理等等。
桌面上的開普勒擁有眾多計(jì)算單元和模塊,彼此高效互連非常重要,而移動版規(guī)模大大縮減,這方面的壓力也就輕了很多。
NVIDIA還提出,開普勒的色彩壓縮技術(shù)可以有效降低內(nèi)存帶寬占用,而且不僅僅是3D游戲里,UI界面渲染同樣如此,可節(jié)省43-76%。
NVIDIA宣揚(yáng)的另外一個數(shù)據(jù)是,在GFXBench 3.0 Manhattan OpenGL ES 3.0測試中,Tegra K1的能效是驍龍800、蘋果A7的1.5倍。
【圖像信號處理(ISP)、視頻】
ISP掌管著處理靜態(tài)圖片、動態(tài)視頻的圖像流水線,負(fù)責(zé)任務(wù)包括RGB轉(zhuǎn)換、3A(自動對焦/自動曝光/自動白平衡)、降噪、鏡頭糾正等等。
Tegra K1也使用了兩個ISP,占用面積更大,可以很好地支持雙攝像頭拍照等應(yīng)用。
Tegra K1 ISP是第三代產(chǎn)品了,每個都能以14位輸入每秒處理6億像素,兩個合并就是12億像素了,相比之下Tegra 4 4億像素、10位輸入就太弱了。
它還最高支持1億像素?cái)z像頭,最多4096個對焦點(diǎn)(64×64陣列),降噪、局部調(diào)和映射也都更好了。
Tegra K1兼容此前的Chimera 1.0,包括物體追蹤、始終開啟HDR、慢動作捕捉、全分辨率爆發(fā)等,并且?guī)砹诵碌腃himera 2.0,支持更好的臨時像素組合(temporal pixel binning/綜合CMOS的八個曝光點(diǎn)來進(jìn)一步降噪)、更快的全景拍照、視頻穩(wěn)定、更好的實(shí)時特效預(yù)覽。
它的內(nèi)核仍然可以運(yùn)行在CPU、GPU上,但這次應(yīng)該會支持CUDA了。
視頻方面,繼續(xù)支持2160p30 4K編碼、解碼,具體來說就是H.264 High Profile Level 5.1解碼、H.264 High Profile 4.2編碼,整體來收和Tegra 4上差不多,只是進(jìn)一步優(yōu)化了效率和功耗。
H.265解碼也是支持的,但沒有完整的硬件加速,而是交給NVENC、CPU共同處理。
NVIDIA展示了使用Tegra K1外接顯示器播放4K 30FPS H.264視頻,完全沒有掉幀,不過事實(shí)上Tegra 4也能做到這一點(diǎn),都可以通過LVDS、HDMI 1.4b、eDP 1.4來驅(qū)動4K顯示器。
輸入輸出方面有兩個USB 3.0、三個USB 2.0、eMMC 4.5.1、PCI-E x4。
哦對了,NVIDIA目前演示用的主要是一臺更換了Tegra K1處理器的Tegra Note 7,另有4GB內(nèi)存、1920×1200分辨率,比現(xiàn)在的高級很多??雌饋碜约移桨暹€會繼續(xù)堅(jiān)持做下去。
要點(diǎn): 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競爭優(yōu)勢...
關(guān)鍵字: 通信 BSP 電信運(yùn)營商 數(shù)字經(jīng)濟(jì)