初創(chuàng)2個月,排名第八!深圳首個自研大模型上榜
7月26日,一條大模型上榜的消息首先刷爆了AI從業(yè)者的朋友圈。
上面AI從業(yè)者說的就是,在榜單上發(fā)現(xiàn)了一家且唯一一家大灣區(qū)團隊,而且一上榜即殺入前八。同屬大灣區(qū)的其它團隊,諸如華為的盤古、騰訊混元模型等均未進入到榜單,可以說這次是大灣區(qū)首家大模型團隊進入了該權威榜單,并且從評分上超過了ChatGPT和Claude-V1.3等實力選手。
GS-LLM-Alpha的開發(fā)者為共生矩陣科技(深圳)有限公司。從工商注冊信息來看,該公司是2023年5月10日注冊的新公司,且無公開融資信息。主創(chuàng)技術團隊是前深圳IDEA大模型技術成員,具備全要素大模型自主研發(fā)能力。相較于大廠和融資數(shù)億的明星大模型團隊,該團隊的突然出現(xiàn)成為AI大模型賽道的一個強勁黑馬,為本以為格局既定的大模型市場帶來更多變數(shù)。
到此,值得讓人思考的是,為什么這樣的團隊可以突出重圍?實現(xiàn)這樣前沿的技術需要什么?
新一代人工智能核心三要素是人、數(shù)據(jù)與算力。核心中的核心是人:有實際訓練與模型研發(fā)經(jīng)驗的人。國內(nèi)進入大模型賽道的玩家主要是兩撥人:互聯(lián)網(wǎng)大廠和具備大模型開發(fā)經(jīng)驗的創(chuàng)業(yè)團隊。前者優(yōu)勢是資本,后者像共生矩陣科技這樣的,優(yōu)勢是足夠強勢的技術人員。
大模型繁榮之下,其實是各種野蠻生長,具備自研能力團隊少之又少。就在年初ChatGPT出圈之前,國內(nèi)僅僅幾個團隊具備這樣的條件專注大模型研發(fā):清華智源/智譜團隊、復旦大學Moss團隊、深圳IDEA大模型團隊,掌握大模型研發(fā)技術的核心成員少于100人。在GPT大火之后,互聯(lián)網(wǎng)大廠快速跟進,但最難解決的是人才。大廠習慣的懟人和懟資源的模式,在研發(fā)大模型上體現(xiàn)了超出預期的成本,同時又面臨著開源模型和更強的模型出現(xiàn),那么競爭的意義何在?
以共生矩陣這樣初創(chuàng)團隊為例,在資源有限的情況下,通過短短數(shù)周的準備和訓練,就能實現(xiàn)高性能大模型,刷新小規(guī)模模型在C-Eval的評分。這足以說明新一代人工智能的競爭將是技術代差的競爭。
同時也簡單介紹一下市面上最權威的大模型測評:C-Eval,覆蓋內(nèi)容廣泛,包括STEM、社會科學、人文能力、和其它一些學科,成為大模型全球公認的客觀評分標準。
這些指標主要用在以下場景:
1. 評估大型語言模型(LLMs)的知識和推理能力:通過這些指標,可以全面評估LLMs在各個學科領域和不同難度級別的問題上的表現(xiàn)。
2. 分析大模型的優(yōu)缺點:通過這些指標,可以幫助研究人員了解基礎模型在哪些領域和問題上表現(xiàn)良好,以及在哪些方面還有待提高。
新一代人工智能將覆蓋日常生活與生產(chǎn)全過程,形成一個生態(tài)系統(tǒng)。每個智能模型都像森林中的一棵樹,互相影響,構成了一個多層次的和諧共生系統(tǒng)。希望共生矩陣科技這樣的行業(yè)推動者,讓人工智能融入日常生活與生產(chǎn),帶來解放、提升幸福。