重磅!英特爾宣布多項(xiàng)重要技術(shù)進(jìn)展,加速實(shí)現(xiàn)XPU愿景
當(dāng)?shù)貢r間11月12日,英特爾公司宣布多項(xiàng)重要的技術(shù)進(jìn)展,這是英特爾多年來一直致力于通過統(tǒng)一的軟件體驗(yàn)打造跨架構(gòu)解決方案的又一里程碑。其中,英特爾® oneAPI Gold工具包將于今年12月正式交付;英特爾軟件棧推出新功能,作為公司軟硬件聯(lián)合設(shè)計(jì)方法的一部分;同時,英特爾正式發(fā)布其首款數(shù)據(jù)中心獨(dú)立圖形顯卡。該服務(wù)器GPU基于Xe-LP微架構(gòu),專為高密度、低時延的安卓云游戲和流媒體服務(wù)而設(shè)計(jì)。
英特爾高級副總裁、首席架構(gòu)師兼架構(gòu)、圖形與軟件部門總經(jīng)理Raja Koduri表示:“今天是英特爾oneAPI和XPU宏大計(jì)劃的重要時刻。隨著oneAPI Gold版本的發(fā)布,開發(fā)者編程體驗(yàn)將更加豐富,oneAPI不僅擁有開發(fā)者熟悉的CPU編程庫和工具,也包含“矢量-矩陣-空間”這種混合架構(gòu)的編程庫和工具。同時,我們還推出了基于Xe-LP微架構(gòu)的首款數(shù)據(jù)中心GPU,以滿足快速增長的云游戲和流媒體市場需求?!?/span>
重要性:隨著世界進(jìn)入到數(shù)十億智能設(shè)備的時代,數(shù)據(jù)呈指數(shù)級增長,需要將重心從單獨(dú)的CPU轉(zhuǎn)移到跨CPU、GPU、FPGA和其它加速器的混合架構(gòu),英特爾將其稱為“XPU”愿景。英特爾® 服務(wù)器GPU的推出,是英特爾在XPU時代擴(kuò)展產(chǎn)品組合的最新一步。
這個計(jì)算時代也需要全面的軟件棧。通過英特爾oneAPI工具包,開發(fā)者能夠使用一種通用、開放且基于行業(yè)標(biāo)準(zhǔn)的編程模型訪問英特爾XPU。這不僅能夠釋放底層硬件的性能潛力,同時能降低軟件開發(fā)和維護(hù)成本,并且在部署加速計(jì)算方面,英特爾® oneAPI工具包較在專用的、受限于特定廠商的方案風(fēng)險更低。
英特爾推出oneAPI Gold工具包:英特爾oneAPI行業(yè)計(jì)劃在SuperComputing 2019大會上首次提出,這是英特爾為實(shí)現(xiàn)統(tǒng)一、簡化的跨架構(gòu)編程模型所提出的愿景:能夠提供毫不妥協(xié)的性能,不受限于單一廠商專用的代碼限制,且能實(shí)現(xiàn)原有代碼的集成。借助oneAPI,開發(fā)者可以針對他們要解決的特定問題選擇最佳的加速器架構(gòu),且無需為新的架構(gòu)和平臺再次重寫軟件。
英特爾oneAPI工具包充分利用了先進(jìn)的硬件性能和指令,如用于CPU的英特爾® AVX-512(高級矢量擴(kuò)展)和英特爾® 深度學(xué)習(xí)加速(英特爾® DL Boost),以及XPU獨(dú)有的功能。oneAPI工具包基于經(jīng)受過長久考驗(yàn)的英特爾開發(fā)者工具,為開發(fā)者提供熟悉的編程語言和標(biāo)準(zhǔn),同時與現(xiàn)有代碼保持完全的連續(xù)性。
當(dāng)天,英特爾宣布,英特爾oneAPI Gold工具包將于12月在本地和英特爾DevCloud上免費(fèi)提供,同時還將提供包含英特爾技術(shù)咨詢工程師全球支持的商業(yè)版本。英特爾還會將英特爾® Parallel Studio XE和英特爾® System Studio工具套件遷移到oneAPI產(chǎn)品中。
此外,英特爾DevCloud平臺可供開發(fā)者在各種英特爾架構(gòu)上測試代碼和工作負(fù)載,現(xiàn)已增加了新的英特爾® 銳炬® Xe GPU硬件。英特爾銳炬Xe MAX圖形顯卡現(xiàn)在也可供公開訪問,同時Intel Xe -HP已開放給特定的開發(fā)者使用。
oneAPI得到了業(yè)界的支持,近期微軟Azure和谷歌的TensorFlow已經(jīng)宣布支持 oneAPI;眾多領(lǐng)先的研究機(jī)構(gòu)、公司和大學(xué)也支持 oneAPI。
圖:oneAPI生態(tài)合作伙伴
除此之外,伊利諾伊大學(xué)香檳分校的貝克曼高級科學(xué)技術(shù)研究所宣布,將建立一個新的oneAPI卓越中心(CoE)。他們正在使用oneAPI編程模型將生命科學(xué)應(yīng)用程序NAMD擴(kuò)展到其他計(jì)算環(huán)境。NAMD能夠模擬大型生物分子系統(tǒng),正在幫助解決諸如COVID-19這樣的全球性挑戰(zhàn)。這個卓越中心將和研究GROMACS的斯德哥爾摩大學(xué)(SERC)卓越中心,以及海德堡大學(xué)(URZ)卓越中心一道,共同研究如何為其它廠商的GPU提供oneAPI支持。
關(guān)于英特爾全新服務(wù)器GPU:通過首款面向數(shù)據(jù)中心的獨(dú)顯產(chǎn)品,英特爾在增強(qiáng)云游戲與媒體體驗(yàn)方面進(jìn)一步擴(kuò)展了豐富的平臺級創(chuàng)新。利用英特爾® 至強(qiáng)® 可擴(kuò)展處理器與全新英特爾服務(wù)器GPU的組合,加之開源和授權(quán)的英特爾軟件組件,即可以較低的總體擁有成本(TCO),為安卓云游戲以及OTT實(shí)時視頻直播的高密度媒體轉(zhuǎn)編碼提供高密度、低時延的解決方案。
英特爾服務(wù)器GPU采用英特爾能效最高的圖形架構(gòu)——英特爾Xe-LP微架構(gòu),擁有低功耗、獨(dú)立片上系統(tǒng)設(shè)計(jì),并配備128比特管道和8GB專用板載低功耗DDR4顯存。
圖:英特爾服務(wù)器GPU
通過將英特爾服務(wù)器GPU和英特爾® 至強(qiáng)® 可擴(kuò)展處理器強(qiáng)強(qiáng)聯(lián)合,服務(wù)提供商可在不改變服務(wù)器數(shù)量的情況下,單獨(dú)擴(kuò)展顯卡容量,以在每個系統(tǒng)上支持更多流和訂閱用戶,并同時實(shí)現(xiàn)較低的總體擁有成本(TCO)。通過新華三 XG310 X16 PCIe3.0 GPU 擴(kuò)展卡——在3/4長、全高尺寸內(nèi)封裝四顆英特爾服務(wù)器GPU芯片,即可在一個典型雙卡系統(tǒng)中支持超過100個安卓云游戲并發(fā)用戶。這一數(shù)量最高可擴(kuò)展至160個并發(fā)用戶,實(shí)際數(shù)量取決于具體的游戲和服務(wù)器配置。開發(fā)人員可利用目前Media SDK中的通用 API,這一API也將于明年遷移到oneAPI視頻處理庫當(dāng)中。目前,英特爾正在與包括Gamestream、騰訊和Ubitus在內(nèi)的諸多軟件和服務(wù)合作伙伴合作,共同將英特爾服務(wù)器GPU推向市場。
圖:新華三X G310 PCIe GPU擴(kuò)展卡
騰訊先游云游戲助理總經(jīng)理方亮表示:“英特爾是我們安卓云游戲解決方案上非常重要的合作伙伴。英特爾至強(qiáng)可擴(kuò)展處理器和英特爾服務(wù)器GPU,打造了一個高密度、低時延、低功耗、低TCO的解決方案,讓我們能夠在每臺雙卡服務(wù)器上生成超過100個游戲?qū)嵗?,諸如《王者榮耀》、《傳說對決》。”
基于Xe-LP微架構(gòu)的英特爾服務(wù)器GPU目前正在發(fā)貨。與近期推出的英特爾® 銳炬® Xe MAX獨(dú)顯一道,該GPU將隨著英特爾Xe架構(gòu)產(chǎn)品和軟件計(jì)劃的不斷深入發(fā)展進(jìn)一步為全球用戶提升視覺計(jì)算體驗(yàn)。
英特爾® 圖形軟件更新:英特爾將GPU從入門級圖形顯卡擴(kuò)展到高性能計(jì)算(HPC)的核心策略之一,就在于實(shí)施同一套代碼庫。為了實(shí)現(xiàn)這一目標(biāo),英特爾的軟件堆?,F(xiàn)在支持多代圖形顯卡,包括最近發(fā)布的第11代英特爾® 酷睿? 移動處理器集成的銳炬 Xe顯卡和英特爾銳炬Xe MAX獨(dú)立顯卡。擴(kuò)展代碼庫以支持Linux更為普遍的數(shù)據(jù)中心產(chǎn)品,是可擴(kuò)展的Xe架構(gòu)策略的下一個關(guān)鍵步驟。英特爾對Linux驅(qū)動程序進(jìn)行了優(yōu)化,將重點(diǎn)放在操作系統(tǒng)之間的代碼重用,并進(jìn)一步關(guān)注Linux 3D性能,目前提供了三個經(jīng)過充分驗(yàn)證和集成的發(fā)行版堆棧。
英特爾當(dāng)天宣布,英特爾創(chuàng)建了Project Flipfast來提升在Linux操作系統(tǒng)上的游戲體驗(yàn)。Flipfast??梢栽试S終端用戶在虛擬機(jī)上運(yùn)行圖形應(yīng)用,同時通過虛擬機(jī)和主機(jī)之間的零拷貝共享來保持本機(jī)GPU性能和主機(jī)集成完整性。Flipfast棧驅(qū)動器可提升游戲性能,該技術(shù)將可直接用于數(shù)據(jù)中心游戲流應(yīng)用程序。
此外,英特爾還宣布,英特爾® 隱式 SPMD程序編譯器(ISPC)將在底層硬件接口oneAPI零級別(Level Zero)之上運(yùn)行。oneAPI零級別是整個硬件抽象層,為oneAPI平臺中的設(shè)備量身定制,提供底層的、直接到硬件的接口。由oneAPI支持的ISPC是C編程語言的一種變體,支持單程序、多數(shù)據(jù)編程,用于在英特爾CPU上加速英特爾® Osray光線追蹤引擎。英特爾為ISPC增加了Xe支持,以無縫加速英特爾oneAPI渲染工具包組件(如Osray)。
下一步計(jì)劃:11月12-13日,在線上舉行的oneAPI開發(fā)者峰會上,創(chuàng)新者、研究人員和開發(fā)人員將展示40個使用oneAPI的合作和項(xiàng)目。主題涉及從COVID-19的藥物再利用測試,到作物產(chǎn)量預(yù)測等。在本周開始的SuperComputing 2020上,英特爾與業(yè)界領(lǐng)袖和研究機(jī)構(gòu)將通過主題演講、技術(shù)會議、爐邊對話、演示和其他活動,重點(diǎn)介紹oneAPI應(yīng)用和英特爾oneAPI工具。
英特爾oneAPI和圖形軟件棧的更新,以及英特爾服務(wù)器GPU的推出,標(biāo)志著英特爾向XPU架構(gòu)時代邁出里程碑式的一步?;谟⑻貭柫蠹夹g(shù)支柱創(chuàng)新以及異構(gòu)架構(gòu),并通過oneAPI中基于開放標(biāo)準(zhǔn)的統(tǒng)一可擴(kuò)展軟件抽象層來實(shí)現(xiàn),這些進(jìn)展為更佳的體驗(yàn)奠定了堅(jiān)實(shí)基礎(chǔ)。