A100/H100 GPU需求激增,傳NVIDIA向臺積電下“超級急件”
傳全球GPU龍頭英偉達(dá)(NVIDIA)為了滿足大陸客戶激增的需求,近期對臺積電下了“超級急件(super hot runs)”訂單,計劃在美國管制其A100/H100 GPU產(chǎn)品銷往大陸的緩沖期之內(nèi)完成更多的交付。
據(jù)悉,此次NVIDIA以“超級急件”的方式要求臺積電提前生產(chǎn)了原訂于明年出貨的部分產(chǎn)品,總量約5,000片晶圓,由于是“超級急件”訂單,因此交期將大幅縮短,從原本預(yù)估的5-6個月,壓縮到了2-3個月。預(yù)計,這批產(chǎn)品最快10月底至11月初,將有望開始陸續(xù)交貨。
對此,NVIDIA表示,不評論市場傳聞。臺積電也拒絕評論單一客戶信息。今年8月31日晚間,業(yè)內(nèi)傳出消息稱,NVIDIA和AMD的面向數(shù)據(jù)中心的高端GPU對中國大陸的出口已經(jīng)被美國政府管制。
9月1日早間,NVIDIA確認(rèn),已接到美政府通知,未來向中國和俄羅斯出口A100和即將上市的H100芯片將需要新的許可證要求。這些規(guī)則也適用于DGX或任何其他包含A100或H100芯片和A10x的系統(tǒng);這些規(guī)則還涵蓋任何未來的芯片,其峰值性能和芯片間I/O性能均等于或大于大致等于A100的閾值,以及包括這些電路的任何系統(tǒng);新規(guī)則可能會影響公司及時完成H100開發(fā)或支持A100現(xiàn)有客戶的能力,并可能要求NVIDIA將某些業(yè)務(wù)轉(zhuǎn)移到中國境外。
NVIDIA 認(rèn)為,擁有一種共通的交換格式,將能推動軟體與硬體平臺的互動,進(jìn)而加快 AI 運(yùn)算發(fā)展。也因此,NVIDIA、Intel 和 Arm 攜手合作,共同撰寫 FP8 Formats for Deep Learning 白皮書,透過描述 8 位元浮點(diǎn)運(yùn)算規(guī)格,提供一個共同的交換格式加速 AI 訓(xùn)練、推理。
NVIDIA 進(jìn)一步解釋稱,F(xiàn)P8 規(guī)范有兩個版本,分別是 E5M2 和 E4M3,可最大限度減少與現(xiàn)有的 IEEE 754 浮點(diǎn)格式的偏差,能為 AI 訓(xùn)練、推理發(fā)展帶來更大的自由度,得以在硬件與軟件間取得良好平衡,以改善開發(fā)者的生產(chǎn)效率。
根據(jù)實(shí)驗(yàn)結(jié)果,在廣泛的訓(xùn)練架構(gòu)中,像是 Transformer,F(xiàn)P8 訓(xùn)練的準(zhǔn)確性都類似 16 位元結(jié)果,但卻有更好的效能。譬如 NVIDIA Hopper 便利用新的 FP8 格式,在 BERT 高精度模型上實(shí)現(xiàn)了 4.5 倍的加速。
黃仁勛、克里斯·馬拉科夫斯基和卡蒂斯·普里姆于1993年1月美國加州創(chuàng)辦了NVIDIA(隨后成為特拉華州企業(yè))。NVIDIA保持低調(diào)直到1997-1998年,當(dāng)時它發(fā)布了RIVA個人電腦繪圖處理器產(chǎn)品線。它于1999年1月在Nasdaq掛牌上市;同年5月,售出第一千萬個繪圖處理器。于2000年它收購了一代王者3dfx的知識產(chǎn)權(quán)。3dfx是九十年代中期其中一間最大的圖形處理器廠商。NVIDIA與很多OEM廠商,和一些組織創(chuàng)建起密切關(guān)系。2002年2月,NVIDIA售出第一億個繪圖處理器。
NVIDIA和 AMD供應(yīng)了市場上大部分獨(dú)立顯卡。NVIDIA最著名的GeForce繪圖處理器產(chǎn)品線于1999年首次亮相。GeForce產(chǎn)品線已擴(kuò)充至覆蓋桌面型和流動型電腦。手持式設(shè)備方面,NVIDIA擁有Tegra產(chǎn)品線。它能提供高效能同時,亦能保持低電源消耗。此類產(chǎn)品通常用于無線通信設(shè)備。
當(dāng)?shù)貢r間2022年8月31日,美國半導(dǎo)體公司英偉達(dá)(NASDAQ:NVDA)在向美國證券交易委員會(SEC)遞交的一份監(jiān)管文件中披露,美國政府已推出一項(xiàng)新的出口許可管制,將影響到英偉達(dá)向中國和俄羅斯出口兩款高性能GPU產(chǎn)品。
根據(jù)3DCenter的數(shù)據(jù)顯示,今年二季度獨(dú)立GPU出貨的總數(shù)量為 1040 萬件,銷售額約為 55 億美元。獨(dú)立顯卡的平均售價也從 2021 年第二季度的 1029 美元跌至 2022 年第二季度的 529 美元。下圖也展示了NVIDIA在獨(dú)立GPU市場的領(lǐng)頭羊地位。
techspot分析師 Mike Bruzzone還提供了每個供應(yīng)商的 GPU 市場份額和 GPU 系列市場份額細(xì)分?jǐn)?shù)據(jù)。據(jù)稱,供過于求的問題正在成為一個大問題,NVIDIA 可以通過他們的合作伙伴快速轉(zhuǎn)移他們的庫存。GPU 供應(yīng)商目前計劃在 9 月提供第二輪降價,這將進(jìn)一步降低價格。