1月10日消息,在今年的CES展上,Nvidia為我們帶來了Tegra系列移動芯片當中的最新成員——Tegra K1。這款芯片將會把Nvidia苦苦掙扎的移動處理器業(yè)務(wù)和更為成功的桌面顯卡部門聯(lián)合在一起。
根據(jù)Nvidia的說法,Tegra K1將會為移動設(shè)備帶來“下一代家用機的游戲圖形性能”,但功耗僅有2W。Nvidia是如何辦到這一切的呢?科技網(wǎng)站Android Authority日前就撰文對Tegra K1進行了深度介紹。文章內(nèi)容如下:
大量的CUDA核心
Tegra K1總共擁有192個顯卡處理核心(Tegra 4為72個),這無疑是這款芯片的一大亮點。顯卡的“血統(tǒng)”要比核心數(shù)量更為重要,而在這一點上,Tegra K1也沒有讓我們失望。不同于Tegra 4,Nvidia直接把Kepler架構(gòu)用在了Tegra K1身上,讓后者和GTX 680,Titan和780Ti這些桌面顯卡站在了同一水平線上。
雖然Nvidia并沒有對Tegra K1的Kepler架構(gòu)進行多少改動,但把它和上面這些頂級桌面顯卡放在一起比較的確有點不公平。Tegra K1只有單獨一個Nvidia SMX單元,其中包含了192個CUDA核心,8個紋理單元,4個光柵處理單元,這和Nvidia的頂級顯卡系列相比明顯少了很多。就拿GTX 680為例,這款顯卡擁有1536個CUDA核心,128個紋理單元,32個光柵處理單元。
Nvidia并未提及Tegra K1核心的時鐘頻率或者是帶寬,但在CES的展示當中,他們的確給出了Tegra K1的著色器性能峰值:365 GFLOPS。目前還很難去測算這款芯片的實際性能,但我們還是可以進行一些比較。比如說,定位低端的OEM版本GT630擁有192個CUDA核心,其著色器性能峰值為336 GFLOPS。
比較應(yīng)該已經(jīng)足夠了,那么Nvidia是如何把這一切放進一枚功耗僅有2W的芯片當中的呢?
從彼此獨立的芯片轉(zhuǎn)向單獨一枚SoC會帶來節(jié)能性上的明顯提升,而大幅縮減核心和光柵處理單元的數(shù)量也得以讓Tegra K1的功耗能夠低于Nvidia的Kepler筆記本芯片系列(已經(jīng)在20W以下了)。更大的128KB L2緩存也降低了消耗在片外存儲器訪問上的能源。
對于效率管理能耗的低級別優(yōu)化也應(yīng)該被給予特別的關(guān)注。門控電源和門控時鐘會快速識別出閑置的GPU核心,并降低時鐘頻率或者是徹底封閉這些區(qū)塊,以此達到降低功耗的目的。對于ASTC紋理壓縮的支持也會幫助降低UI和3D渲染的工作量。
無論是從圖形性能還是節(jié)能性上面,Tegra K1都是巨大的進步。但并非所有的提升都來自于硬件部分。
下一代API
要說在移動設(shè)備上提供下一代游戲體驗這方面,Tegra K1最顯著的新功能就是全面的圖形API支持了。也許你還記得,Tegra 4并不支持OpenGL、CUDA和DirectX 11這些常見的API,只是對部分游戲進行了優(yōu)化,這還要取決于開發(fā)者。Tegra K1在這方面得到了改善,帶來了對于OpenGL 4.4,微軟DirectX 11.2,OpenGL ES 3.0和Nvidia自家CUDA 6的全面支持。
新的API自然也帶來了圖形性能上的新提升,比如對于FXAA和TXAA抗鋸齒和Nvidia PhysX物理加速引擎的支持,還有Compute Shaders所帶來的一整套高級特效(比如環(huán)境光遮蔽)。Tegra K1同時也是市面上首款支持硬件曲面細分的移動顯卡,不過高通正在開發(fā)的Adreno 420同樣也會具備該功能。
這所帶來的好消息就是,PC和家用機游戲的開發(fā)者現(xiàn)在可以把自己的作品進行壓縮,然后放到移動設(shè)備上讓Tegra K1運行。考慮到這款芯片的性能據(jù)稱是要強過PlayStation 3和Xbox 360,所以跨平臺移植也不是沒有可能。Nvidia在展會現(xiàn)場已經(jīng)展示了Unreal Engine 4、《英雄薩姆3》和《三位一體2》的移植版,Tegra K1運行起來毫無問題。
兩種CPU設(shè)計
Tegra K1共有兩種CPU版本,針腳設(shè)計完全兼容,這也就意味著廠商可以輕松在兩者之間進行互換。第一種是我們所熟悉的四核+Cortex A15排布,架構(gòu)和Tegra 4幾乎完全相同。而第二種加入了Nvidia自己的雙核ARM CPU。
和Tegra 4一樣,Tegra K1的CPU共有4個滿速A15核心,用于處理繁重任務(wù),額外的一個低性能A15“附屬核心”就負責一些簡單任務(wù)。每一個核心還可以被封閉以降低能耗,只有在需要時,額外的核心才會開啟。但K1和Tegra 4之間有一個細微的差別,那就是前者的CPU是基于新的第三版ARM Cortex A15核心設(shè)計。
第三版Cortex A15主要對門控時鐘進行了封閉,從而達到了提升節(jié)能性的目的。轉(zhuǎn)換到28nm HPM制程工藝也進一步降低了能耗,Nvidia也將時鐘速度提升了20%,從1.9GHz提高到了2.3GHz。
Tegra K1的A15處理器也要比Tegra 4的稍快一些,但提升程度并沒有Kepler顯卡那樣大。但是,這種久經(jīng)考驗的四核設(shè)計意味著Nvidia可以很快開始Tegra K1的生產(chǎn),OEM廠商預計會在本季度收到供貨。
而代號為“Denver”的第二種CPU設(shè)計就完全不同了。Nvidia徹底放棄了附屬核心這種設(shè)計,而選擇了更加傳統(tǒng)的雙核配置。這兩個核心基于新的ARMv8架構(gòu),同時支持64位和32位。Denver的最高時鐘頻率鎖定在2.5GHz,同時具備更大的128KB L1指令緩存和64KB L1數(shù)據(jù)緩存。不過遺憾的是,目前有關(guān)Denver的信息還非常有限,不過Nvidia放棄流行的四核設(shè)計而選擇雙核的舉動值得玩味。
豐富的多媒體功能
Nvidia同時賦予了Tegra K1許多額外的功能。這款芯片的圖像信號處理器(簡稱ISP,負責多種圖像任務(wù))得到了升級,數(shù)量也增加到了兩個。
每一個ISP都具備14位輸入下6億像素/秒的處理能力(Tegra 4為10位下4億像素/秒),降噪能力得到了提升,同時還能支持1億像素圖像感光元件。雙ISP的加入也讓雙攝像頭操作成為可能,我們也已經(jīng)在其他設(shè)備上看過了類似功能。和Tegra 4一樣,K1同樣支持通過HDMI輸出4K視頻內(nèi)容,但它的GPU能否處理4K 3D游戲讓人懷疑。
結(jié)語
Tegra K1終于體現(xiàn)出了Nvidia的真正實力,但從這一點上看,它就是一款讓人非常興奮的產(chǎn)品。K1也很有可能被加入到下一代Nvidia Shield當中。
對于Nvidia來說,擺在面前的最大障礙依然是找到足夠大的消費者基礎(chǔ)。在移動設(shè)備上獲得家用機的游戲質(zhì)量還不是普羅大眾所追求的。再過幾年后,像Steam OS這樣的項目可能會推動游戲在Linux平臺的發(fā)展,到那時,Android平臺的一款強大游戲芯片可能會更加誘人。
從技術(shù)角度看,Tegra K1很強大,但在休閑游戲所主導的移動市場,它可能并沒有看上去那么開創(chuàng)性。我們還需等待開發(fā)者們能夠利用Kepler給我們帶來些什么,以及Denver有沒有什么新內(nèi)容。