當(dāng)前位置:首頁 > 嵌入式 > 嵌入式動態(tài)
[導(dǎo)讀]任何事物一旦進入泡沫期,就不免讓人擔(dān)心什么時候會崩盤,而當(dāng)下的 AI 芯片已經(jīng)進入公認(rèn)的泡沫期。

任何事物一旦進入泡沫期,就不免讓人擔(dān)心什ô時候會崩盤,而當(dāng)下的 AI 芯片已經(jīng)進入公認(rèn)的泡沫期。

從 ASPLOS'14 上寒武紀(jì)的 DianNao,到當(dāng)下 Google 的 TPUv3,AI 芯片只花了五年時間就取得了巨大的成功。搭上 AI 算力爆發(fā)的快車道,叫嚷著摩爾定律終結(jié),Domain Specific Architecture(領(lǐng)域定制架構(gòu)) 似乎成了Ψ一的出·。

可是當(dāng)無數(shù)的巨頭和初創(chuàng)公司設(shè)計出一塊又一塊大同小異的 AI 芯片,我們需要回答這樣一個問題:真的需要這ô多 AI 芯片嗎?

軟件復(fù)雜度

AI 芯片的快速發(fā)展,其中一個回避不了的問題就是軟件復(fù)雜度的指數(shù)級提升。很多公司花了兩年甚至更短的時間做出一款芯片,卻發(fā)現(xiàn)需要更長的時間支持繁多的框架、緊跟算法的進步,適配從手機到數(shù)據(jù)中心的各類平臺。當(dāng)錯過了部署和量產(chǎn)的窗口期,即便做出了芯片也會很快落伍。

與設(shè)計通用架構(gòu)不同,設(shè)計 AI 芯片這樣的專用架構(gòu)需要同時考慮到軟件的設(shè)計和優(yōu)化。芯片公司往往樂觀估計了軟件適配和優(yōu)化的成本,指望通過中間件和編譯器來解決所有問題。事實上,從 Intel 到 Google 再到 Nvidia,大量的軟件工程師正被投入到適配各種平臺,手動優(yōu)化網(wǎng)絡(luò)性能當(dāng)中。而對于初創(chuàng)公司,芯片早已 tapeout 卻一再延期交付的問題比比皆是。

從本質(zhì)來看,當(dāng)我們開始不斷挖掘芯片架構(gòu)的潛力時,軟件層的抽象也會變的越來越困難,因為其不得不在上層抽象中引入底層的架構(gòu)的模型或參數(shù)?,F(xiàn)在的通常做法是做底層芯片架構(gòu)與上層軟件之間的中間件,然而開發(fā)這些中間件的代價也往往被低估。前段時間某芯片初創(chuàng)公司的同學(xué)咨詢我,開發(fā)一套類似 TensorRT 這樣的 Inference 中間件需要多少人力和多長時間?這并不是一個容易回答的問題,于是我反問他們有多少資源可以做這個項目。

令人意外的是,他的老板只給了三四個人頭,因為他們假設(shè)自己已經(jīng)有了一套底層的編譯器和一套上層的模型轉(zhuǎn)換工具,于是這樣一個用于架構(gòu)抽象的中間件并不需要太大力氣。我猜這樣的投入應(yīng)該可以做出一個功能完好的產(chǎn)品,但我不相信最終的產(chǎn)品在實際應(yīng)用中可以達到理想的性能指標(biāo),畢竟做芯片并不只是用來跑 ResNet-50 這樣的 Benchmark。

碎片化

只需要編寫一套代碼即可運行在不同平臺,是軟件工程師們的長久訴求。不同架構(gòu)的 AI 芯片帶來的碎片化會極大的打擊他們在實際軟件產(chǎn)品中應(yīng)用 AI 的積極性。與以往的經(jīng)驗不同,深度學(xué)習(xí)糟糕的解釋性會帶來許多意想不到的缺陷。比如這樣一個常見的困擾,一個私有的模型可以在本地 CPU 上得到滿意的結(jié)果,然而卻在部署到某款設(shè)備后性能大幅下降。如何調(diào)試這些問題,誰來負(fù)責(zé)調(diào)試,通過怎樣的工具來調(diào)試,甚至調(diào)試的工程師能否拿到私有的模型?這些問題都難以回答。

碎片化還表現(xiàn)在,專有架構(gòu)為了挖掘絕對性能往往會放棄向前兼容性。如上文提到的中間件,它的一端是碎片化的 AI 軟件框架,另一端則是一代又一代的芯片架構(gòu)。如何同時維護多個部分不兼容的指令集架構(gòu),并保證ÿ一次軟件更新都能完整的覆蓋所有的設(shè)備?除了投入更多的人力,別無他法。一個常見的論調(diào)是像當(dāng)下的消費級芯片一樣只保持一個短期的(2-3年的)軟件支持,然而當(dāng)下 AI 芯片的常見應(yīng)用領(lǐng)域,如智能攝像頭、工業(yè)智能、以及自動駕駛,一款芯片的生命周期可能長達十年。很難想象一家公司需要多大的量級才能提供持久的技術(shù)支持,如果預(yù)估一家初創(chuàng)公司活不過兩三年,如何才能放心的部署其產(chǎn)品到一款面向消費者的量產(chǎn)車上?

AI 芯片只是過渡期產(chǎn)物

從一個軟件工程師的角度,我個人堅信定制化的 AI 處理器只會是一個過渡期產(chǎn)物。一個統(tǒng)一的、可編程的、高并發(fā)的架構(gòu)才應(yīng)該是我們追求的方向?;叵脒^去的二十年,我們見證了專用架構(gòu)的小型機市場的萎縮,圖形處理器到通用向量處理器的發(fā)展,甚至連我們的手機和電腦的平臺都將趨于統(tǒng)一。有理由相信,現(xiàn)在再把資源投入到定制化的 AI 芯片絕不是一個好的投資。

本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險,如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉