英偉達Tegra K1深度解讀：技術(shù)很牛

時間：2014-01-16 16:38:54

手機看文章

掃描二維碼
隨時隨地手機看文章

[導讀] 1月10日消息，在今年的CES展上，Nvidia為我們帶來了Tegra系列移動芯片當中的最新成員——Tegra K1。這款芯片將會把Nvidia苦苦掙扎的移動處理器業(yè)務(wù)和更為成功的桌面顯卡部門聯(lián)合在一起。根據(jù)Nvidia的說

1月10日消息，在今年的CES展上，Nvidia為我們帶來了Tegra系列移動芯片當中的最新成員——Tegra K1。這款芯片將會把Nvidia苦苦掙扎的移動處理器業(yè)務(wù)和更為成功的桌面顯卡部門聯(lián)合在一起。

根據(jù)Nvidia的說法，Tegra K1將會為移動設(shè)備帶來“下一代家用機的游戲圖形性能”，但功耗僅有2W。Nvidia是如何辦到這一切的呢？科技網(wǎng)站Android Authority日前就撰文對Tegra K1進行了深度介紹。文章內(nèi)容如下：

大量的CUDA核心

Tegra K1總共擁有192個顯卡處理核心（Tegra 4為72個），這無疑是這款芯片的一大亮點。顯卡的“血統(tǒng)”要比核心數(shù)量更為重要，而在這一點上，Tegra K1也沒有讓我們失望。不同于Tegra 4，Nvidia直接把Kepler架構(gòu)用在了Tegra K1身上，讓后者和GTX 680，Titan和780Ti這些桌面顯卡站在了同一水平線上。

雖然Nvidia并沒有對Tegra K1的Kepler架構(gòu)進行多少改動，但把它和上面這些頂級桌面顯卡放在一起比較的確有點不公平。Tegra K1只有單獨一個Nvidia SMX單元，其中包含了192個CUDA核心，8個紋理單元，4個光柵處理單元，這和Nvidia的頂級顯卡系列相比明顯少了很多。就拿GTX 680為例，這款顯卡擁有1536個CUDA核心，128個紋理單元，32個光柵處理單元。

Nvidia并未提及Tegra K1核心的時鐘頻率或者是帶寬，但在CES的展示當中，他們的確給出了Tegra K1的著色器性能峰值：365 GFLOPS。目前還很難去測算這款芯片的實際性能，但我們還是可以進行一些比較。比如說，定位低端的OEM版本GT630擁有192個CUDA核心，其著色器性能峰值為336 GFLOPS。

比較應(yīng)該已經(jīng)足夠了，那么Nvidia是如何把這一切放進一枚功耗僅有2W的芯片當中的呢？

從彼此獨立的芯片轉(zhuǎn)向單獨一枚SoC會帶來節(jié)能性上的明顯提升，而大幅縮減核心和光柵處理單元的數(shù)量也得以讓Tegra K1的功耗能夠低于Nvidia的Kepler筆記本芯片系列（已經(jīng)在20W以下了）。更大的128KB L2緩存也降低了消耗在片外存儲器訪問上的能源。

對于效率管理能耗的低級別優(yōu)化也應(yīng)該被給予特別的關(guān)注。門控電源和門控時鐘會快速識別出閑置的GPU核心，并降低時鐘頻率或者是徹底封閉這些區(qū)塊，以此達到降低功耗的目的。對于ASTC紋理壓縮的支持也會幫助降低UI和3D渲染的工作量。

無論是從圖形性能還是節(jié)能性上面，Tegra K1都是巨大的進步。但并非所有的提升都來自于硬件部分。

下一代API

要說在移動設(shè)備上提供下一代游戲體驗這方面，Tegra K1最顯著的新功能就是全面的圖形API支持了。也許你還記得，Tegra 4并不支持OpenGL、CUDA和DirectX 11這些常見的API，只是對部分游戲進行了優(yōu)化，這還要取決于開發(fā)者。Tegra K1在這方面得到了改善，帶來了對于OpenGL 4.4，微軟DirectX 11.2，OpenGL ES 3.0和Nvidia自家CUDA 6的全面支持。

新的API自然也帶來了圖形性能上的新提升，比如對于FXAA和TXAA抗鋸齒和Nvidia PhysX物理加速引擎的支持，還有Compute Shaders所帶來的一整套高級特效（比如環(huán)境光遮蔽）。Tegra K1同時也是市面上首款支持硬件曲面細分的移動顯卡，不過高通正在開發(fā)的Adreno 420同樣也會具備該功能。

這所帶來的好消息就是，PC和家用機游戲的開發(fā)者現(xiàn)在可以把自己的作品進行壓縮，然后放到移動設(shè)備上讓Tegra K1運行。考慮到這款芯片的性能據(jù)稱是要強過PlayStation 3和Xbox 360，所以跨平臺移植也不是沒有可能。Nvidia在展會現(xiàn)場已經(jīng)展示了Unreal Engine 4、《英雄薩姆3》和《三位一體2》的移植版，Tegra K1運行起來毫無問題。

兩種CPU設(shè)計

Tegra K1共有兩種CPU版本，針腳設(shè)計完全兼容，這也就意味著廠商可以輕松在兩者之間進行互換。第一種是我們所熟悉的四核+Cortex A15排布，架構(gòu)和Tegra 4幾乎完全相同。而第二種加入了Nvidia自己的雙核ARM CPU。

和Tegra 4一樣，Tegra K1的CPU共有4個滿速A15核心，用于處理繁重任務(wù)，額外的一個低性能A15“附屬核心”就負責一些簡單任務(wù)。每一個核心還可以被封閉以降低能耗，只有在需要時，額外的核心才會開啟。但K1和Tegra 4之間有一個細微的差別，那就是前者的CPU是基于新的第三版ARM Cortex A15核心設(shè)計。

第三版Cortex A15主要對門控時鐘進行了封閉，從而達到了提升節(jié)能性的目的。轉(zhuǎn)換到28nm HPM制程工藝也進一步降低了能耗，Nvidia也將時鐘速度提升了20%，從1.9GHz提高到了2.3GHz。

Tegra K1的A15處理器也要比Tegra 4的稍快一些，但提升程度并沒有Kepler顯卡那樣大。但是，這種久經(jīng)考驗的四核設(shè)計意味著Nvidia可以很快開始Tegra K1的生產(chǎn)，OEM廠商預計會在本季度收到供貨。

而代號為“Denver”的第二種CPU設(shè)計就完全不同了。Nvidia徹底放棄了附屬核心這種設(shè)計，而選擇了更加傳統(tǒng)的雙核配置。這兩個核心基于新的ARMv8架構(gòu)，同時支持64位和32位。Denver的最高時鐘頻率鎖定在2.5GHz，同時具備更大的128KB L1指令緩存和64KB L1數(shù)據(jù)緩存。不過遺憾的是，目前有關(guān)Denver的信息還非常有限，不過Nvidia放棄流行的四核設(shè)計而選擇雙核的舉動值得玩味。

豐富的多媒體功能

Nvidia同時賦予了Tegra K1許多額外的功能。這款芯片的圖像信號處理器（簡稱ISP，負責多種圖像任務(wù)）得到了升級，數(shù)量也增加到了兩個。

每一個ISP都具備14位輸入下6億像素/秒的處理能力（Tegra 4為10位下4億像素/秒），降噪能力得到了提升，同時還能支持1億像素圖像感光元件。雙ISP的加入也讓雙攝像頭操作成為可能，我們也已經(jīng)在其他設(shè)備上看過了類似功能。和Tegra 4一樣，K1同樣支持通過HDMI輸出4K視頻內(nèi)容，但它的GPU能否處理4K 3D游戲讓人懷疑。

結(jié)語

Tegra K1終于體現(xiàn)出了Nvidia的真正實力，但從這一點上看，它就是一款讓人非常興奮的產(chǎn)品。K1也很有可能被加入到下一代Nvidia Shield當中。

對于Nvidia來說，擺在面前的最大障礙依然是找到足夠大的消費者基礎(chǔ)。在移動設(shè)備上獲得家用機的游戲質(zhì)量還不是普羅大眾所追求的。再過幾年后，像Steam OS這樣的項目可能會推動游戲在Linux平臺的發(fā)展，到那時，Android平臺的一款強大游戲芯片可能會更加誘人。

從技術(shù)角度看，Tegra K1很強大，但在休閑游戲所主導的移動市場，它可能并沒有看上去那么開創(chuàng)性。我們還需等待開發(fā)者們能夠利用Kepler給我們帶來些什么，以及Denver有沒有什么新內(nèi)容。