業(yè)內知情人士透露,近日英偉達已開始接受經銷商預訂最新的中國特供(AI)芯片 H20。消息人士稱,H20 在某些關鍵領域的性能不如華為的 AI 芯片昇騰 910B。
報道稱,近幾周英偉達對中國分銷商的定價為一張 H20 芯片 12,000-15,000 美元(當前約合人民幣 86,310-107,888 元)。
然而,一些分銷商已經開始對英偉達 H20 進行加價宣傳,單張 H20 芯片的要價已經上升到了 15,320 美元(當前約合人民幣 110,189 元)。相比之下,華為 AI 芯片昇騰 910B 的售價約為人民幣 12 萬元。
一位消息人士稱,經銷商正在組裝 H20 服務器,該服務器預配置了 8 顆 H20 芯片,一臺的售價約為 140 萬元人民幣。相比之下,一年前同樣配置了 8 顆 H800 芯片的服務器售價在 200 萬元人民幣左右,從價格也能看出其性能 “減配” 的幅度不小。
消息人士還補充說,經銷商已通知客戶,2024 年第一季度開始小批量交付 H20 產品,第二季度開始大批量交付。
除了 H20 之外,專供中國市場的芯片還有兩款(L20 和 L2),H20 是這三款顯卡中性能最強的。據了解,這三款芯片原計劃于 2023 年 11 月推出,但由于服務器制造商在集成芯片時遇到了問題,所以被推遲到今年了。
從此前曝光的規(guī)格來看,H20 的內存容量 96 GB,運行速度 4.0 Tb/s,運算能力為 296 TFLOPs,使用了性能密度僅為 2.9 的 GH100 芯片。相比之下,H100 的運算能力理論上是 H20 的 6.69 倍,以 FP16 Tensor Core 的浮點計算能力(FP16 Tensor Core FLOPs)來看:
H100 SXM TF16(Sparsity)FLOPS = 1979
H20 SXM TF16(Sparsity)FLOPS = 296
而作為海外的版本,基于 Hopper 架構打造的 H200 處理速度 4.8TB/秒,擁有 141GB 的內存,與前代產品相比 H100 容量幾乎翻番,而且還與 H100 兼容。
值得一提的是,2023 年 10 月美國出臺了新的出口禁令,進一步限制了英偉達高性能 AI 芯片的出口,英偉達當即叫停A100、A800、H100、H800 及 L40S等產品的發(fā)貨。
無法放棄巨大的中國市場,英偉達不得不再一次推出特(jian)供(pei)芯片以應對美國的出口管制法規(guī)。據悉,HGX H20、L20 PCle 和 L2 PCle 三款芯片均基于英偉達 H100 削弱而來,H100 都因為算力太高被禁,這三款自然更低。
在法規(guī)限制之前,英偉達占據中國市場的份額已經超過了 90%,然而隨著中美科技限制的不斷加碼,英偉達在中國市場面臨著來自華為等本土競爭對手的強烈沖擊。
據了解,華為的昇騰 910B 是目前中國市場上最具競爭力的 AI 芯片,而且由于市場擔心美國進一步加碼限制的原因,該芯片正在變得越來越受市場歡迎。一位業(yè)內人士表示,規(guī)格上 H20 的 FP32 性能還不到昇騰 910B 的一半。
此前就有爆料稱,國內的互聯網巨頭百度、騰訊、阿里以及字節(jié)正逐步將一些先進芯片訂單轉移給本土公司,并且更多地依賴公司內部開發(fā)的芯片。
也有消息人士透露,H20 在互連速度方面似乎比 910B 更具優(yōu)勢,互連速度衡量的是芯片之間數據傳輸的速度。這意味著在需要將大量芯片連接在一起作為一個系統(tǒng)工作的應用中,H20 仍然比昇騰 910B 具有競爭力。
據報道,首席執(zhí)行官黃仁勛此前在元旦假期前參觀了該公司位于深圳、上海和北京的辦公室,并在年會上穿著東北大花扭秧歌,強調了中國市場對英偉達的重要性。
總的來說,盡管面臨激烈的競爭和性能上的挑戰(zhàn),英偉達在中國市場的布局仍在繼續(xù)深化,推出特供版芯片也是戰(zhàn)略布局的一部分。無論怎樣,擁有更多的選擇對中國市場來說總是更好的。
值得一提的是,受人工智能市場樂觀預期的影響,2024 年 1 月英偉達市值出現了破紀錄飆升,創(chuàng)下有史以來最大月度漲幅(約 2965.2 億美元),超過了去年 5 月創(chuàng)下的歷史高點,目前總市值達到了約 1.52 萬億美元。