亞馬遜發(fā)布首款云AI芯片—Inferentia!算力高達(dá)幾百TOPS
11月26日-30日,亞馬遜于賭城拉斯維加斯舉辦了AWS re:Invent 2018大會。作為全球最大的公有云廠商,AWS(亞馬遜云,Amazon Web Service)每一年的re:Invent大會都會吸引來自全球的數(shù)萬名開發(fā)者和業(yè)內(nèi)人士參加。
去年的re:Invent 2017大會上,亞馬遜云一口氣發(fā)布了22款重磅產(chǎn)品,而今年的好戲也逐一上演。
在前天推出首款自研ARM架構(gòu)云服務(wù)器CPU Graviton后,亞馬遜云CEO? Andy Jassy發(fā)布了其首款云端AI芯片——Inferentia。
據(jù)官方介紹,Inferentia定位于一款低成本、高性能、低延遲的機(jī)器學(xué)習(xí)推理(inference)芯片,將于2019年下半年正式上市。
關(guān)于芯片的詳細(xì)參數(shù)官方公布不多,只公布了一些核心賣點,比如其計算力將會高達(dá)幾百TOPS,多芯片組合后算力可達(dá)數(shù)千TOPS。此外,Inferentia支持FP16、INT8精度,并支持TensorFlow、Caffe2、ONNX等流行機(jī)器學(xué)習(xí)框架。
由此,亞馬遜云也成為谷歌、華為之后,第三家推出云端AI芯片的云服務(wù)廠商。
今年10月份,?華為發(fā)布了自研云端AI芯片“昇騰(Ascend )”系列,基于達(dá)芬奇架構(gòu),首批推出7nm的昇騰910以及12nm的昇騰310。
其中,昇騰910是目前單芯片計算密度最大的芯片,計算力遠(yuǎn)超谷歌和英偉達(dá)。昇騰910半精度(FP16)運(yùn)算能力為256TFLOPS,整數(shù)精度(INT8)512TOPS。
作為云計算市場的一哥,亞馬遜今年第三季度云業(yè)務(wù)營收高達(dá)66.8億美元,同比增長46%。
此次,亞馬遜云推出的云端AI芯片,目的想必也是進(jìn)一步鞏固其市場領(lǐng)導(dǎo)者地位,重新收回失去的市場份額。但接下來云計算這款大蛋糕的分配如何,還是未知數(shù)。