亞馬遜推出AWS Inferentia芯片專門用于部署帶有GPU的大型AI模型

時間：2020-06-19 14:57:01

關(guān)鍵字： AI 亞馬遜芯片

手機(jī)看文章

掃描二維碼
隨時隨地手機(jī)看文章

[導(dǎo)讀] 亞馬遜宣布推出Inferentia，這是由AWS設(shè)計的芯片，專門用于部署帶有GPU的大型AI模型，該芯片將于明年推出。 InferenTIa將與TensorFlow和PyTor

亞馬遜宣布推出Inferentia，這是由AWS設(shè)計的芯片，專門用于部署帶有GPU的大型AI模型，該芯片將于明年推出。

InferenTIa將與TensorFlow和PyTorch等主要框架協(xié)同工作，并與EC2實(shí)例類型和亞馬遜的機(jī)器學(xué)習(xí)服務(wù)SageMaker兼容。

“你將能夠在每個芯片上獲得數(shù)百個TOPS；如果你愿意的話，你可以將它們捆綁在一起以獲得數(shù)千個TOPS，“AWS首席執(zhí)行官Andy Jassy今天在年度re：Invent會議上表示。

InferenTIa還將與ElasTIc Inference合作，這是一種加速使用GPU芯片部署AI的方法，這也是今天宣布的。

彈性推理適用于1到32 teraflops的數(shù)據(jù)范圍。InferenTIa檢測主要框架何時與EC2實(shí)例一起使用，然后查看神經(jīng)網(wǎng)絡(luò)的哪些部分將從加速中受益最多；然后將這些部分移動到彈性推理以提高效率。

Jassy說，今天推出AI模型所需的兩個主要流程是培訓(xùn)和推理，推理占了近90％的成本。

“我們認(rèn)為運(yùn)營成本可以通過Elastic Inference節(jié)省75％的成本，如果你將Inferentia放在其上，這是成本的另一個10倍的提升，所以這是一個重大的改變游戲規(guī)則，這兩個推出推斷我們的客戶，“他說。

Inferentia的發(fā)布是在周一首次亮相的一款芯片之后由AWS專門用于執(zhí)行通用工作流程。

Inferentia和Elastic Inference的首次亮相是今天發(fā)布的幾個AI相關(guān)公告之一。今天還宣布：推出AWS市場，供開發(fā)人員銷售他們的AI模型，以及DeepRacer League和AWS DeepRacer汽車的推出，該汽車在模擬環(huán)境中使用強(qiáng)化學(xué)習(xí)訓(xùn)練的AI模型上運(yùn)行。

今天預(yù)覽中還提供了許多不需要預(yù)先知道如何構(gòu)建或訓(xùn)練AI模型的服務(wù)，包括Textract用于從文檔中提取文本，Personalize用于客戶建議，以及Amazon Forecast，這是一種生成私有預(yù)測模型的服務(wù)。