業(yè)內(nèi)消息,近日由李開復博士(創(chuàng)新工場董事長兼CEO)親自下場創(chuàng)辦的零一萬物(01.ai)官宣正式發(fā)布了首款研發(fā)的最強開源人工智能中英文大模型系列 Yi-6B 和 Yi-34B,數(shù)據(jù)參數(shù)量分別為 60 億和 340 億。
“零一萬物堅定進軍全球第一梯隊目標,從招的第一個人,寫的第一行代碼,設計的第一個模型開始,就一直抱著成為世界第一的初衷和決心?!? 李開復表示:“我們組成了一支有潛力對標 OpenAI/Google等一線大廠的團隊,經(jīng)歷了近半年的厚積薄發(fā),交出了第一張極具全球競爭力的耀眼成績單。Yi-34B可以說不負眾望,一鳴驚人?!?
李開復強調(diào),本次發(fā)布選擇 6B/34B是因為這是當前對學術、開發(fā)者社區(qū)最友好的版本,34B 模型版本具備更優(yōu)越的知識容量、下游任務的容納能力和多模態(tài)能力,也達到了大模型 「涌現(xiàn)」的門檻。
而比起更大的 50B-70B,34B 是單卡推理可接受的模型尺寸的上限,訓練成本對開發(fā)者更友好,經(jīng)過量化的模型可以在一張消費級顯卡(如4090)上進行高效率的推理,對開發(fā)者操作服務部署有很大的優(yōu)勢。
李開復稱,在完成Yi-34B預訓練的同時已經(jīng)啟動下一個千億參數(shù)模型的訓練,零一萬物在持續(xù)進行千億參數(shù)規(guī)模的模型訓練并準備好了未來 18 個月所需的算力,在多模態(tài)方面已經(jīng)形成了十多人的技術團隊,在未來一兩個月內(nèi)就會有相關工作能夠?qū)ν夤_。
在線上發(fā)布環(huán)節(jié),李開復博士重點介紹了 Yi 系列大模型的三處性能亮點:
- 全球最長 200K 上下文窗口,免費開源
- 超強 Al Infra 實測訓練,成本下降40%
- 科學訓模自研「規(guī)?;柧殞嶒炂脚_」
Yi-34B 目前在各個基準測試中,都獲得了很好的表現(xiàn),據(jù)零一萬物提供的評測結(jié)果看來,Yi-34B 和 Yi-6B 均在 MMLU、BBH、C-Eval 取得了不錯的成績。