當(dāng)前位置:首頁(yè) > 芯聞號(hào) > 充電吧
[導(dǎo)讀]提起NVIDIA,可能99%+的朋友第一反應(yīng)是“顯卡”和“GPU”。世界上兩大GPU巨頭之一、GPU領(lǐng)域絕對(duì)的霸主嘛,地球人都知道,前些天還剛剛發(fā)布了全新的Turing架構(gòu)和RTX 2080Ti/20

提起NVIDIA,可能99%+的朋友第一反應(yīng)是“顯卡”和“GPU”。世界上兩大GPU巨頭之一、GPU領(lǐng)域絕對(duì)的霸主嘛,地球人都知道,前些天還剛剛發(fā)布了全新的Turing架構(gòu)和RTX 2080Ti/2080/2070顯卡呢。

這其實(shí)也沒什么毛病,不過近幾年以來,人們?cè)诼槟居贜VIDIA GPU強(qiáng)大的同時(shí),似乎冥冥之中忽略了某件事情。NVIDIA的GPU強(qiáng)不?確實(shí)強(qiáng),爆炸強(qiáng),不管是PC端還是SoC上,有目共睹,人盡皆知……emmm,然后嘞?

直到前陣子看到了這樣一張圖:

顯然,這是一張對(duì)目前市面上主流SoC的簡(jiǎn)要概括,生動(dòng)形象簡(jiǎn)明易懂。不過看到最后一個(gè)的時(shí)候,我瞬間意識(shí)到了人們之前忽略了哪里:NVIDIA SoC的CPU怎么樣,真的是像圖上畫的一樣么?

CPU不行?這還真不服

實(shí)際上,NVIDIA對(duì)SoC的設(shè)計(jì)并不陌生,到目前為止他們已經(jīng)發(fā)布了7代Tegra系列SoC。NVIDIA一直在Tegra SoC中使用自家的GPU架構(gòu),但前幾代的CPU部分用的則是Arm公版CPU內(nèi)核。與同時(shí)期的高通三星聯(lián)發(fā)科處理器相比,除了“祖?zhèn)鳌钡腉PU外并無其他出彩之處。倒也有不少手機(jī)和平板電腦使用了Tegra處理器,還算差強(qiáng)人意。

然而即便時(shí)間僅止于此,我們似乎也挑不出NVIDIA SoC中的CPU有什么毛病。非要說的話,不知NVIDIA黃教主是否為蘋果喬幫主的鐵桿擁躉,這幾代Tegra均沒有集成neon協(xié)處理器,flash播放能力欠佳。至于使用Arm公版CPU內(nèi)核雖然不假,但是同時(shí)期的三星華為聯(lián)發(fā)科德州儀器用的也都是公版內(nèi)核。

更何況,NVIDIA在CPU上的野心和實(shí)力,遠(yuǎn)非人們的固有印象可以衡量。

在2011年的CES上,NVIDIA對(duì)外公布了Denver計(jì)劃,宣布將要開發(fā)基于64位Arm v8指令集的自研架構(gòu),用于從移動(dòng)設(shè)備到服務(wù)器等各種設(shè)備。短短三年后的2014年CES,NVIDIA便推出了使用自研Denver架構(gòu)的Tegra K1上,并依此成為了繼蘋果之后第二個(gè)發(fā)布基于Arm v8指令集的消費(fèi)級(jí)SoC的公司。

時(shí)間回退4個(gè)月,2013年9月,蘋果在其A7處理器上出人意料地使用了基于Arm v8指令集的Cyclone 架構(gòu)。此后的一年多時(shí)間里,市面上基于Arm v7指令集的Cortex A15公版架構(gòu)和高通Krait自研架構(gòu),甚至包括同樣基于Arm v8指令集的Cortex A57在內(nèi),所有其他同時(shí)期的CPU架構(gòu)均被Cyclone橫掃。

除了Denver。

傳統(tǒng)的CPU架構(gòu)設(shè)計(jì)分為兩種:順序執(zhí)行和亂序執(zhí)行。恰如其名,順序執(zhí)行體系嚴(yán)格按照接收順序執(zhí)行微指令,而亂序執(zhí)行體系允許在不改變指令運(yùn)算結(jié)果的前提下調(diào)整執(zhí)行順序。

一直以來,亂序執(zhí)行被認(rèn)為是順序執(zhí)行發(fā)展到極限后的一次進(jìn)化。CPU執(zhí)行的任務(wù)紛繁復(fù)雜,某些情況下RAM等周邊部件會(huì)阻塞指令的順序執(zhí)行,這時(shí)亂序執(zhí)行便可以明顯改善運(yùn)算的靈活性,有效提高吞吐量。

亂序執(zhí)行曾不止一次被提及,可見在這些高性能Arm內(nèi)核中,亂序執(zhí)行似乎已經(jīng)成為了不二的選擇。不過,換用亂序執(zhí)行需要增設(shè)亂序執(zhí)行窗口,有效識(shí)別可以重新排序的指令,確保指令可以安全的亂序執(zhí)行,這顯然會(huì)拉高架構(gòu)的復(fù)雜性,芯片尺寸和功耗都會(huì)明顯上升。

而NVIDIA在提升架構(gòu)性能方面則另辟蹊徑,認(rèn)為亂序執(zhí)行并不是解決問題的唯一方案。不光敢想,Denver真的放棄了Arm公版高性能架構(gòu)中主流的亂序執(zhí)行方式,轉(zhuǎn)而采用了低功耗處理器上常見的順序執(zhí)行,并為其配以一套高效的二進(jìn)制翻譯和代碼優(yōu)化方案。

NVIDIA的思路很簡(jiǎn)單:順序執(zhí)行體系面臨的基本問題很明確,無外乎內(nèi)存停滯等硬件問題,以及指令排序不良等軟件問題。那么這些問題一定要硬改架構(gòu)體系么,能否在“軟層面”中解決? 而這就是Denver的核心思想。


這個(gè)架構(gòu)不尋常

Denver一個(gè)不尋常的地方是,它內(nèi)部的指令格式與ARMv7或ARMv8大相徑庭。在具體的內(nèi)部結(jié)構(gòu)上,Denver使用了在GPU中頗為常見的VLIW(Very Long Instruction Word,超長(zhǎng)指令字)格式執(zhí)行指令(畢竟NVIDIA)。

而在架構(gòu)前端,Denver的指令解碼寬度達(dá)到了前無古人的7發(fā)射,比Cortex A15(3發(fā)射)、Cortex A57(4發(fā)射)和蘋果Cyclone(6發(fā)射)都要更寬。NVIDIA官方稱其為“7+”架構(gòu),其中的“+”指的是NVIDIA為Denver設(shè)計(jì)的DCO(動(dòng)態(tài)代碼優(yōu)化器)。


DCO的任務(wù)是將Arm代碼轉(zhuǎn)換為Denver的原生格式,并優(yōu)化此代碼以使其在Denver上運(yùn)行得更好。對(duì)于CPU整體而言,DCO是最關(guān)鍵的一個(gè)環(huán)節(jié),因?yàn)樗男阅軐⒅苯佑蒁CO決定。

長(zhǎng)期以來,一直有傳言稱Denver最初的設(shè)計(jì)意圖瞄準(zhǔn)的是x86,其底層設(shè)計(jì)和二進(jìn)制翻譯機(jī)制旨在不侵犯任何x86專利的前提下兼容x86指令的執(zhí)行。不管這傳言是不是真的,最終結(jié)果是NVIDIA在軟層面上有了驚人的成果,打造出了一套可以將硬件設(shè)計(jì)和指令集分離的架構(gòu)。

然而盡管DCO如此逆天,NVIDIA還是在其之外配備了一套Arm指令解碼器。雖然官方表示這個(gè)Arm解碼器并不是“備胎”,但實(shí)際來看顯然是“口嫌體正直”,Denver的大部分指令都來自二進(jìn)制翻譯,這個(gè)Arm解碼器只有區(qū)區(qū)2指令寬度(Cortex A8級(jí)別),只在二進(jìn)制翻譯無法高效處理時(shí)才會(huì)接手以直接解碼Arm指令。


與此同時(shí),由于NVIDIA選擇了在“軟層面”中解決問題的方式,Denver也擁有了其他架構(gòu)都不具備的可升級(jí)性,如果DCO有改進(jìn)的話,NVIDIA可以進(jìn)一步部署新版本的DCO。

而最終Denver的實(shí)際性能也足以用技驚四座來形容,在SPECint2000測(cè)試中,Denver相比Cortex A15有了35%的平均提升,最高提升幅度甚至高達(dá)67%:

更為具體一點(diǎn),使用Denver核心的Tegra K1性能完全壓過了同時(shí)期Cyclone核心的蘋果A7,相較于Intel Haswell核心的賽揚(yáng)2955U也是互有來回。

醉翁之意不在酒

看到這也許有朋友會(huì)疑惑,既然NVIDIA SoC的CPU不但不弱,反而也和GPU一樣是爆炸強(qiáng)的存在,為什么NVIDIA在手機(jī)和平板領(lǐng)域卻一直不得法,到最后干脆退出了呢?

很簡(jiǎn)單,因?yàn)槿思腋緵]想爭(zhēng)這塊啊……

和我們這些看熱鬧不怕事大的普通用戶不同,NVIDIA對(duì)自家SoC的情況再清楚不過了。作為剛?cè)刖值男氯?,在基帶、底包、SDK、節(jié)能降耗等方面均處于后發(fā)劣勢(shì),和市面上這些位根深蒂固的老黃牛拼力氣實(shí)為不智之舉。

沒見人家德州儀器都在2014年退出手機(jī)SoC領(lǐng)域了,Tegra出到第4代給小米3用用也算善始善終,交個(gè)朋友嘛……

很顯然,NVIDIA看到了SoC更好的應(yīng)用領(lǐng)域——AI等高性能移動(dòng)計(jì)算平臺(tái),說白了就是自動(dòng)駕駛和機(jī)器人。

經(jīng)歷了Tegra K1和Tegra X1的過渡,Tegra Parker(即NVIDIA Drive PX)終于帶著改良版的Denver2架構(gòu)成功登上了自動(dòng)駕駛的舞臺(tái)。而今年剛剛推出的NVIDIA Jetson Xavier平臺(tái)則更是帶來了強(qiáng)到?jīng)]朋友的自研架構(gòu)Carmel,其指令解碼達(dá)到了驚為天人的10寬度,在Denver的基礎(chǔ)上再次向前邁進(jìn)了一大步。

在眼下的AI芯片領(lǐng)域都在追求純AI運(yùn)算的精簡(jiǎn)設(shè)計(jì)時(shí),NVIDIA是唯一沒有放棄高性能CPU的一家,同時(shí)也是將CPU、GPU、AI三部分平衡做的最好的一家。

So,老鐵們,別再說NVIDIA“CPU不行GPI帶”了,NVIDIA真的不是CPU差,而是是在太強(qiáng)了,強(qiáng)到已經(jīng)超出了我們所熟知的這個(gè)次元。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國(guó)汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場(chǎng)的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開幕式在貴陽(yáng)舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營(yíng)業(yè)績(jī)穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤(rùn)率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長(zhǎng) 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競(jìng)爭(zhēng)力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競(jìng)爭(zhēng)優(yōu)勢(shì)...

關(guān)鍵字: 通信 BSP 電信運(yùn)營(yíng)商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國(guó)電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場(chǎng) NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長(zhǎng)三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡(jiǎn)稱"軟通動(dòng)力")與長(zhǎng)三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉