當(dāng)前位置:首頁 > 工業(yè)控制 > 電子設(shè)計(jì)自動(dòng)化
[導(dǎo)讀]“隨著摩爾定律的放緩以及大數(shù)據(jù)、AI、5G、自動(dòng)駕駛等的發(fā)展,對(duì)于計(jì)算能力和帶寬提出了前所未有的要求,同時(shí)新的算法新的框架層出不窮,要應(yīng)對(duì)這一變化就需要靈活應(yīng)變的架構(gòu),而傳統(tǒng)芯片設(shè)計(jì)的周期已經(jīng)無法跟上創(chuàng)新的步伐。” Victor Peng強(qiáng)調(diào),“就像自然界的適者生存一樣,在數(shù)字世界靈活應(yīng)變的系統(tǒng)才是最可持續(xù)的?!?

摘要:雖然FPGA一直在數(shù)十億美元的小眾市場(chǎng)行走,在整個(gè)千億元級(jí)IC大盤中只占據(jù)一隅,但并不妨礙它的追逐之夢(mèng),而AI、自動(dòng)駕駛、5G等浪潮興起為它的夢(mèng)想插上了翅膀。就像1984年發(fā)明FPGA成為開創(chuàng)者一樣,賽靈思 ACAP(自適應(yīng)計(jì)算加速平臺(tái))首款產(chǎn)品系列Versal 的正式面世,使FPGA完成了從器件到平臺(tái)的蝶變,也因而賽靈思將直面英特爾、英偉達(dá)的競(jìng)爭(zhēng),面對(duì)規(guī)模高出數(shù)倍乃至數(shù)十倍的競(jìng)爭(zhēng)對(duì)手,Versal能否讓賽靈思開啟涅槃之旅?

一直在與自己賽跑的FPGA獨(dú)行俠——賽靈思(Xilinx),在其2018開發(fā)者大會(huì)(XDF)上重磅發(fā)布了業(yè)界7nm自適應(yīng)計(jì)算加速平臺(tái) (ACAP)首款產(chǎn)品——Versal。賽靈思總裁及CEO Victor Peng在解釋Versal名稱意義時(shí)說,Versal寓意Versatile (多樣化的)+ Universal(通用的), 代表集多樣性和通用性一體,是一款可面向所有應(yīng)用、面向所有開發(fā)者的平臺(tái)級(jí)產(chǎn)品。而Versal的面世表明賽靈思已不再是單純的FPGA公司,而轉(zhuǎn)變成平臺(tái)公司。這也意味著賽靈思將不再囿于FPGA做文章,而將染指CPU、GPU等占領(lǐng)的市場(chǎng),直面與英特爾、英偉達(dá)的競(jìng)爭(zhēng),Versal憑何給予賽靈思這樣的勇氣?

 

 

為何開發(fā)ACAP平臺(tái)?

或許這是大勢(shì)使然。

“隨著摩爾定律的放緩以及大數(shù)據(jù)、AI、5G、自動(dòng)駕駛等的發(fā)展,對(duì)于計(jì)算能力和帶寬提出了前所未有的要求,同時(shí)新的算法新的框架層出不窮,要應(yīng)對(duì)這一變化就需要靈活應(yīng)變的架構(gòu),而傳統(tǒng)芯片設(shè)計(jì)的周期已經(jīng)無法跟上創(chuàng)新的步伐。” Victor Peng強(qiáng)調(diào),“就像自然界的適者生存一樣,在數(shù)字世界靈活應(yīng)變的系統(tǒng)才是最可持續(xù)的。”

而這一靈活應(yīng)變的架構(gòu)就是異構(gòu)計(jì)算。賽靈思產(chǎn)品及技術(shù)營(yíng)銷高級(jí)技術(shù)總監(jiān)Kirk Saban認(rèn)為,一種架構(gòu)已無法獨(dú)自完成大量的數(shù)據(jù)處理,需要異構(gòu)計(jì)算。而從過去多年IC發(fā)展來看,計(jì)算引擎CPU單純采用“工藝縮放scaling”技術(shù)發(fā)展的道路遇到了很大的挑戰(zhàn),難以通過等量的計(jì)算提升換取等量的性能提升,迫使計(jì)算引擎變成并行趨勢(shì)。

為此,賽靈思啟動(dòng)代號(hào)為“Evest(珠穆朗瑪)”的計(jì)劃,意在打造一個(gè)具有靈活應(yīng)變能力的自適應(yīng)異構(gòu)計(jì)算加速平臺(tái),支持所有類型的開發(fā)者通過優(yōu)化的軟硬件來為應(yīng)用加速,同時(shí)具備靈活的應(yīng)變能力,Victor Peng笑言Versal是在業(yè)界需求最迫切的時(shí)刻雪中送炭。

當(dāng)然Versal要具備上述“魔力”,賽靈思也投入巨大,數(shù)十億美元、上千名工程師、歷時(shí) 4 年終才出手。 賽靈思軟件及IP產(chǎn)品執(zhí)行副總裁Salil Raje 對(duì)此表示,在開發(fā)過程中,Versal要解決諸多挑戰(zhàn),不只是硬件如處理器、AI引擎、收發(fā)器等整合,還有軟件、7納米FinFET工藝等,是一個(gè)非常大的系統(tǒng)工程。賽靈思花了幾千小時(shí)的人工來確保軟件工具的簡(jiǎn)單易用,對(duì)所有架構(gòu)進(jìn)行了重新布置,確保這一平臺(tái)能夠自上而下的軟件可編程,也進(jìn)一步提升了準(zhǔn)入門檻。

而在這一過程中,F(xiàn)PGA從最初的邏輯門到SoC、MPSoC、RFSoC芯片再進(jìn)化到ACAP,如在28納米時(shí)集成了編解碼處理器,在16納米級(jí)別加入了GPU之后,完成了從FPGA器件到平臺(tái)ACAP的蝶變,也將開啟賽靈思的新征程。

Versal的功力

被寄與厚望的Versal平臺(tái)究竟有何“功力”擔(dān)當(dāng)重任?

先來看其硬件。賽靈思產(chǎn)品及技術(shù)營(yíng)銷高級(jí)技術(shù)總監(jiān)Kirk Saban指出,異構(gòu)計(jì)算平臺(tái)必須要有多個(gè)不同類型的處理引擎,以應(yīng)對(duì)不同的工作負(fù)載。Versal平臺(tái)整合了三種類型的可編程處理器即標(biāo)量引擎雙Arm Cortex-A72和Cortex-R5處理器、自適應(yīng)引擎PL、智能引擎即AI引擎和DSP引擎,以及前沿的存儲(chǔ)器、高速收發(fā)器和多種接口技術(shù)等。

 

 

這些引擎形成一個(gè)緊密集成的異構(gòu)計(jì)算平臺(tái),并且各司其職。Kirk Saban介紹,Arm處理器通常用于控制應(yīng)用、操作系統(tǒng)、通信接口等;PL執(zhí)行數(shù)據(jù)操作和傳輸、非基于向量的計(jì)算和連接;AI引擎為基于向量的算法提供了高達(dá)五倍的計(jì)算密度。同時(shí),這一切與片上網(wǎng)絡(luò) (NoC) 連通,提供對(duì)所有三種處理單元類型的存儲(chǔ)器映射訪問,從而比任何一種單獨(dú)架構(gòu)都支持更高的定制和性能提升。

值得一提的是,賽靈思獨(dú)創(chuàng)的AI引擎是一種新型硬件模塊,包括用于定點(diǎn)和浮點(diǎn)運(yùn)算的向量處理器、標(biāo)量處理器、專用程序和數(shù)據(jù)存儲(chǔ)器、專用AXI 數(shù)據(jù)移動(dòng)通道以及 DMA 和鎖止。它針對(duì)計(jì)算和DSP進(jìn)行了優(yōu)化,可滿足高吞吐量和高性能計(jì)算要求。相對(duì)于業(yè)界領(lǐng)先的GPU,AI 推斷性能預(yù)計(jì)能提升3-8倍,功耗降低 50%。

在軟件層面,Kirk Saban提到,Versal平臺(tái)引入革新性的軟件堆棧即NoC平臺(tái)管理控制器,提供了無縫連接的功能,可直接通過軟件進(jìn)行編程和配置。同時(shí),符合業(yè)界標(biāo)準(zhǔn)設(shè)計(jì)流程的一系列工具、軟件、庫、IP等助力,使得Versal ACAP 的硬件和軟件均可由開發(fā)者進(jìn)行編程和優(yōu)化,而這在賽靈思的歷史上也是絕無僅有的。

由此,硬件和軟件的共同創(chuàng)新成就了Versal ACAP 這一顛覆性的異構(gòu)計(jì)算平臺(tái),實(shí)現(xiàn)了顯著的性能提升。Kirk Saban舉出了具體數(shù)字,其速度超過當(dāng)前最高速的FPGA 20倍、比當(dāng)今最快的CPU快100倍,同時(shí)可實(shí)現(xiàn)低于2ms的時(shí)延,相信數(shù)據(jù)中心、有線網(wǎng)絡(luò)、5G無線和ADAS等應(yīng)用將樂見其成。

據(jù)悉,Versal平臺(tái)組合包括Versal基礎(chǔ)系列(Versal Prime)、Versal旗艦系列(Versal Premium)和HBM系列,提供不同的性能、連接性、帶寬和集成功能。此外,還包括Versal AI系列,包括AI核心(AI Core)系列、AI邊緣系列和AI射頻系列。Versal Prime 系列和AI Core 系列將于2019年下半年上市。前者具廣泛的適用性,用于在線加速和各種工作負(fù)載;后者提供高計(jì)算性能和最低時(shí)延,實(shí)現(xiàn)突破性的 AI 推斷吞吐量和性能。

同時(shí),賽靈思還公布了發(fā)展路線圖,2020年將推出Premium和AI邊緣系列,下半年將上市AI射頻系列,而HBM將于2021年下半年面世。

其他架構(gòu)自求多福?

Versal橫空出世,其它選手如CPU、ASIC等如何應(yīng)對(duì)?

畢竟它們各有“苦衷”。Kirk Saban認(rèn)為,標(biāo)量處理單元(例如 CPU)在具有不同決策樹和廣泛庫的復(fù)雜算法中非常有效,但在性能擴(kuò)展方面受到限制。而在先進(jìn)制程后摩爾定律已經(jīng)不再有效,CPU已無法適應(yīng)最先進(jìn)的應(yīng)用了。

而矢量處理單元(如GPU)在并行計(jì)算上效率更高,但由于存儲(chǔ)器層級(jí)結(jié)構(gòu)不靈活,它們會(huì)受時(shí)延和效率的影響。它們可能在某一個(gè)功能領(lǐng)域的加速性能不錯(cuò),但靈活度不夠,無法適應(yīng)創(chuàng)新的速度。

并且,通用AI芯片不是正確的方向。Kirk Saban分析說,ASIC針對(duì)某個(gè)CNN、DNN來優(yōu)化形成固定功能,一旦有新的算法或者框架就需要重新設(shè)計(jì),在目前發(fā)展態(tài)勢(shì)下對(duì)于變量少的行業(yè)ASIC相對(duì)適用,如果變化快ASIC很快就會(huì)過時(shí),實(shí)際上連谷歌的TPU也概莫能外。

雖然GPU等有著相對(duì)完善的生態(tài)系統(tǒng),但Versal作為新興勢(shì)力,在生態(tài)的構(gòu)建上也在大張旗鼓,一方面Versal可軟硬件編輯,開發(fā)便利;另一方面,在著力與合作伙伴一起互惠共贏。 “Versal不會(huì)取代所有的GPU,但肯定會(huì)有越來越多的應(yīng)用采用靈活應(yīng)變的平臺(tái)。”這是Victor Peng的判斷也是寄望。

為何著重AI推斷?

需要指出的是,Versal看重的是AI推斷市場(chǎng)。

Salil Raje指出,AI有訓(xùn)練和推斷兩大階段。對(duì)于訓(xùn)練來說海量數(shù)據(jù)非常重要,但延遲和功耗都不那么重要。而無論是在邊緣端還是云端的推斷,數(shù)據(jù)量很少,實(shí)時(shí)響應(yīng)的性能非常重要,對(duì)延遲要求極高,而且對(duì)功耗也極為看重。

“AI訓(xùn)練和推斷的要求是不一的,不能把訓(xùn)練的解決方案直接應(yīng)用到推斷上。在過去幾年,全球關(guān)注的主要是AI訓(xùn)練,這是因?yàn)楸姸嘈碌腁I應(yīng)用需要應(yīng)用AI模型,但今后AI模型將大量應(yīng)用在云端和邊緣端,因而未來的模式更多的是AI推斷,而不是訓(xùn)練。”

由此亦帶來了新的挑戰(zhàn)。Salil Raje指出,挑戰(zhàn)在于一是AI創(chuàng)新的速度,就像要追隨移動(dòng)的靶子一樣。二是需要低時(shí)延、高帶寬和高性能,最大的挑戰(zhàn)是功耗。三是要實(shí)現(xiàn)整體的應(yīng)用加速,而不僅是機(jī)器學(xué)習(xí)的加速。

當(dāng)然,AI訓(xùn)練也是非常重要的市場(chǎng)。Salil Raje表示,賽靈思也在研發(fā)訓(xùn)練用FPGA方案,不排除進(jìn)入這一市場(chǎng)的可能性。

中國(guó)AI初創(chuàng)企業(yè)不應(yīng)熱衷于造芯

Versal平臺(tái)染指AI應(yīng)用,也預(yù)示著賽靈思要直面國(guó)內(nèi)火爆的AI造芯廠商的競(jìng)爭(zhēng),對(duì)于這一點(diǎn),賽靈思也有自己的見解。

“中國(guó)有大量AI初創(chuàng)企業(yè),也有很多廠商在投入造芯,但賽靈思認(rèn)為他們其實(shí)不一定要熱衷于造芯。因?yàn)樵O(shè)計(jì)AI芯片目前要采用16納米甚至7納米的工藝,所需的投入是巨大的,風(fēng)險(xiǎn)也很大。” Victor Peng提出了建議,“其實(shí)他們可在算法和框架方面深入研究,從這些層面來創(chuàng)造更多的價(jià)值;或者采用Versal平臺(tái)開發(fā)具體應(yīng)用,而不是投資幾億元去做芯片。”

“就像深鑒科技,兩年前就基于賽靈思產(chǎn)品做AI方面的開發(fā),因此在被收購(gòu)后其成果可迅速應(yīng)用到Versal平臺(tái)上,深鑒科技最為核心的就是DPU及神經(jīng)網(wǎng)絡(luò)壓縮編譯技術(shù),應(yīng)用此技術(shù)的Versal平臺(tái)可適應(yīng)不同精度不同位寬,并且時(shí)延大幅降低。”Salil Raje提及。

而對(duì)于華為、阿里都在打造屬于自有AI芯片的情形,Victor Peng表示,這表明目前正處于AI革命的早期,大家都在尋找不同的解決方案,這帶來了眾多機(jī)遇。可能有一些領(lǐng)域是適用于固定功能的芯片,但絕大多數(shù)應(yīng)用還將使用靈活平臺(tái)作為解決方案。

為何還要推出加速器卡?

除了打造Versal平臺(tái)之外,賽靈思也意識(shí)到在云端和數(shù)據(jù)中心的服務(wù)器中,F(xiàn)PGA作為一種服務(wù)即FaaS的部署正在加快。Victor Peng介紹說,F(xiàn)aaS最初是從亞馬遜開始部署,現(xiàn)已有8個(gè)國(guó)家在采用,今年賽靈思已培訓(xùn)超過14000名的開發(fā)者,實(shí)現(xiàn)了36個(gè)應(yīng)用。在XDF大會(huì)上,亞馬遜就面向中國(guó)開發(fā)者宣布AWS F1覆蓋區(qū)域數(shù)量翻番,并正式落地中國(guó)。

與之相呼應(yīng)的是,據(jù)分析,全球加速器卡的市場(chǎng)將達(dá)到120億美元,而中國(guó)市場(chǎng)占據(jù)半壁江山。

為此,賽靈思還推出了功能強(qiáng)大的加速器卡——Alveo,它的優(yōu)勢(shì)在于客戶可對(duì)硬件進(jìn)行重配置,針對(duì)工作負(fù)載、新標(biāo)準(zhǔn)和新算法進(jìn)行調(diào)整和優(yōu)化,并且更加易用,同時(shí)性能更加出色。

就機(jī)器學(xué)習(xí)而言,Alveo U250實(shí)時(shí)推斷吞吐量比高端 CPU高出20 倍,相對(duì)于高端GPU等,能讓2毫秒以下的低時(shí)延應(yīng)用性能提升4倍以上,堪稱全球最快的數(shù)據(jù)中心加速卡。

 

 

而且,目前Alveo得到了合作伙伴和 OEM 廠商生態(tài)系統(tǒng)的廣泛支持,有14 家合作伙伴開發(fā)完成的應(yīng)用可立即投入部署,國(guó)內(nèi)如華為、阿里云、浪潮等都已在合作,推出基于賽靈思的加速方案。此外,部分OEM芯片廠商將和賽靈思進(jìn)入更深入合作,認(rèn)證采用Alveo加速器卡的多個(gè)服務(wù)器SKU,包括Dell EMC、Fujitsu和IBM等。這些關(guān)鍵應(yīng)用涵蓋AI/ML、視頻轉(zhuǎn)碼、數(shù)據(jù)分析、金融風(fēng)險(xiǎn)建模、安全和基因組學(xué)等。

阿里云FPGA異構(gòu)計(jì)算研發(fā)總監(jiān)張振祥宣稱,阿里集團(tuán)采用Faas提升發(fā)效率,節(jié)省了成本,阿里集團(tuán)X項(xiàng)目每千片F(xiàn)PGA三年節(jié)約TCO成本40%。華為IT智能計(jì)算產(chǎn)品線副總裁張小華也提到,華為云與賽靈思緊密合作,實(shí)現(xiàn)了線上線下協(xié)同的FPGA加速解決方案,以視頻編解碼為例,在在線視頻廣播業(yè)務(wù)場(chǎng)景下可節(jié)約40%的帶寬和存儲(chǔ)空間,為客戶帶來了極大的價(jià)值。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國(guó)汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場(chǎng)的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營(yíng)業(yè)績(jī)穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤(rùn)率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長(zhǎng) 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競(jìng)爭(zhēng)力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競(jìng)爭(zhēng)優(yōu)勢(shì)...

關(guān)鍵字: 通信 BSP 電信運(yùn)營(yíng)商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國(guó)電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場(chǎng) NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長(zhǎng)三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡(jiǎn)稱"軟通動(dòng)力")與長(zhǎng)三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉