ChatGPT爆火全球的速度讓人又驚又喜,而在AI大模型賽道上,不僅僅是國外大廠打得不可開交,就連國內企業(yè)也在瘋狂追趕。比如,今年3月百度發(fā)布的大語言模型“文心一言”,可謂是打響了國內ChatGPT第一槍;緊接著,360、阿里、商湯等科技企業(yè)也相繼推出了自己的AI大模型工具,徹底點燃了AIGC戰(zhàn)火。
在ChatGPT引發(fā)的新一輪技術浪潮之下,華為作為中國科技公司的代表,自然也不會輕易掉隊。近日有消息稱,華為將在7月7日舉行的HDC.Cloud 2023開發(fā)者大會上,推出一款全新的人工智能產品——盤古Chat。
據悉,這是一款與ChatGPT相媲美的多模態(tài)千億級大模型,可以實現自然語言理解、對話生成、圖像識別等功能。不過,該產品將主要面向To B/G政企端客戶,普通用戶在前期階段可能難以直觀體驗到該產品。
▲相關報道截圖
事實上,華為早在2020年就開始布局盤古大模型了,并于2021年4月正式發(fā)布,到2022年聚焦行業(yè)應用落地,其進化路徑可分為L0-L1-L2三個階段:
● L0階段是指基礎大模型,旨在利用海量數據進行預訓練,從而得到通用基礎模型,包括NLP(自然語言處理)大模型、CV(計算機視覺)大模型、多模態(tài)大模型、科學計算大模型,以及Graph(圖網絡)大模型。
● L1階段是指行業(yè)大模型,是在L0基礎上導入行業(yè)數據進行訓練后衍生出的模型,目前已經發(fā)布了盤古金融大模型、盤古礦山大模型、盤古電力大模型、盤古制造質檢大模型、盤古藥物分子大模型等。
● L2階段是指大模型迭代,是在L1基礎上結合行業(yè)細分場景得到的推理模型,比如金融OCR模型、電力巡檢模型等。以電力行業(yè)為例,華為云基于盤古電力大模型,針對無人機電力巡檢細分場景,通過一次“預訓練+下游任務”的微調,推出盤古電力巡檢大模型,解決了無人機智能巡檢系統(tǒng)(缺陷檢測)中的小樣本學習、主動學習、增量學習等問題,同時解決了海量數據標注工作量大和缺陷種類繁多的問題。
對于盤古大模型的定位,華為內部團隊確立了三項最關鍵的核心設計原則:一是模型要大,可以吸收海量數據;二是網絡結構要強,能夠真正發(fā)揮出模型的性能;三是具有優(yōu)秀的泛化能力,可以真正落地到各行各業(yè)的工作場景。
目前,盤古大模型已在100多個行業(yè)場景完成了驗證,包括能源、零售、金融、工業(yè)、醫(yī)療、環(huán)境、物流等,從行業(yè)及場景兩個維度能夠管窺盤古大模型的應用情況:
● 在行業(yè)方面,CV大模型可應用于工業(yè)質檢、物流倉庫監(jiān)控、時尚輔助設計等領域。NLP大模型可應用于智能文檔搜索、智能ERP、小語種大模型等領域;科學計算大模型可應用于氣象預報、海浪預測等領域。
● 在場景方面,盤古礦山大模型實現了綜采場景的全景視頻拼接等功能,保障安全生產;CV大模型實現了貨車故障軌旁圖像檢測系統(tǒng)精度超過人類檢測員;氣象大模型實現了精度超過傳統(tǒng)預報方式。
▲圖片來源:2021華為開發(fā)者大會
此前曾有券商披露,在訓練千億參數的盤古大模型時,華為團隊調用了超過2000塊的昇騰910芯片,進行了超過2個月的數據訓練能力。
據官網介紹,昇騰(HUAWEI Ascend)910是業(yè)界算力最強的AI處理器,基于自研華為達芬奇架構3D Cube技術,實現了業(yè)界最佳AI性能與能效,不僅架構靈活伸縮,還支持云邊端全棧全場景應用。在算力方面,昇騰910完全達到了設計規(guī)格,半精度(FP16)算力達到320 TFLOPS,整數精度(INT8)算力達到640 TOPS,功耗310W。
可以預見,華為入局AI大模型賽道,百度、阿里、騰訊等巨頭企業(yè)無疑將迎來最強勁對手。正如華為常務董事、華為云CEO張平安在《致全球開發(fā)者》的信中表示,AI技術風起云涌,百家爭鳴,激發(fā)新一輪百花齊放的應用創(chuàng)新,驅動千行百業(yè)的數字化轉型升級,“Al for Industries”將成為人工智能新的爆發(fā)點。
▲圖片來源:華為官方公眾號