當前位置:首頁 > 芯聞號 > 極客網(wǎng)
[導讀]最近谷歌組建一個新團隊,專門開發(fā)可以用來模擬物理世界的AI模型,也就是所謂的“世界模型”(World Models)。

最近谷歌組建一個新團隊,專門開發(fā)可以用來模擬物理世界的AI模型,也就是所謂的“世界模型”(World Models)。

蒂姆·布魯克斯(Tim Brooks)原本是OpenAI的一名高管,也是視頻生成工具Sora的主要開發(fā)者之一。去年10月,他加入谷歌DeepMind,成為新領導之一。模擬物理世界的AI模型團隊是谷歌DeepMind的一部分。

布魯克斯說:“DeepMind有著宏大的計劃,它準備開發(fā)巨大的生成式模型,可以模擬物理世界。我受聘之后將會成為新團隊的一員,努力幫公司達成新使命。”

新團隊將會與谷歌Gemini、Veo、Genie團隊合作,努力解決關鍵性新問題。Veo是谷歌自己的視頻生成模型;Gemini相當于谷歌的旗艦AI模型,它可以分析圖片,生成文本,可以模擬游戲、3D環(huán)境;最新的Genie版本于去年12月揭開面紗,它已經(jīng)可以生成巨大多變的可玩性3D世界。

“世界模型”是通往AGI的關鍵路徑

在新團隊招聘信息中能看到這樣的話:“我們相信在視頻、多模態(tài)方面擴大AI訓練規(guī)模是通往AGI的關鍵路徑?!?

AGI是頂尖AI企業(yè)共同追求的目標,它指的是AI可以像人一樣完成任何任務。

AI行業(yè)人士認為,世界模型就是AI的下一個大事件?!笆澜缒P汀边@個術語實際上是從人類心智派生出來的,它是人類自然進化而來。

人類大腦會從感官中抽象一些表征,從而加深對周圍世界的理解,形成所謂的“模型”,大腦會根據(jù)這些模型進行預測,繼而影響人對世界的感知。

棒球手打球時,只需要幾毫秒就能判斷如何擊球,耗費的時間比視頻信號傳到大腦還要短。人類之所以能擊中時速達到100公里的棒球,主要是因為我們能憑直覺判斷球的運動方向。

一些科學家認為,人類之所以擁有超常智力,主要是能夠在潛意識推理,這些推理是以世界模型作為基礎的。

一旦技術取得突破,世界模型將會為多個領域賦能,比如視覺推理、模擬、嵌入式智能體規(guī)劃、實時娛樂交互。

按照描述,新團隊將會開發(fā)實時交互生成工具,它以谷歌之前開發(fā)的模型作為基礎,新團隊開發(fā)的模型會考慮如何與現(xiàn)有多模態(tài)模型整合,比如與Gemini整合。

不少AI公司都在布局“世界模型”

很多創(chuàng)業(yè)公司和科技巨頭正在努力開發(fā)世界模型,比如李飛飛創(chuàng)建的World Labs,以色列Decart、Odyssey。大家相信,一旦世界模型獲得成功,可以創(chuàng)建交互性媒體內(nèi)容,比如游戲、電影,還可以為機器人搭建逼真的模擬環(huán)境。

對于這樣的新技術,創(chuàng)意界意見不統(tǒng)一。比如,動視暴雪積極進入AI工具,提高生產(chǎn)力,結果導致部分員工被裁。Animation Guild不久前發(fā)布的報告稱,在2026年之前,由于AI的應用,美國會有超過10萬個電影、電視、動畫職位被摧毀。

在“世界模型”開發(fā)領域,Odyssey算是新手,它宣稱要與創(chuàng)意專業(yè)人士一起開發(fā),并無替代創(chuàng)意人士的計劃。谷歌的物理世界模擬AI會不會替代創(chuàng)意人士?還有待觀察。

在版權方面,開發(fā)世界模型也存在障礙。有一些世界模型是根據(jù)視頻游戲片段訓練的,訓練時并沒有拿到版權,可能會引發(fā)糾紛。

谷歌是YouTube的所有者,它已經(jīng)獲得許可,準備用YouTube視頻訓練模型,只是現(xiàn)在還不知道具體會用到哪些視頻。

當然,除了這些問題,世界模型還有很多技術難題沒有解決,即使是谷歌,離成功也有不小的距離。

和所有AI模型一樣,世界模型也存在“幻覺”。如果用歐洲城市數(shù)據(jù)訓練模型,城市的天氣一直晴朗,可能無法理解下雪的亞洲城市。沒有充分的數(shù)據(jù),模型不可能深刻理解世界。

Runway的CEO Cristóbal Valenzuela不久前說,由于數(shù)據(jù)和工程方面的問題,想精準捕捉世界上的“居民”(比如動物和人)存在巨大挑戰(zhàn)。模型要為環(huán)境生成一致的地圖,要在環(huán)境中導航、交互。

雖然存在巨大挑戰(zhàn),不過如果問題得到解決,世界模型可以讓AI與真實世界更好聯(lián)系在一起,到時不只虛擬世界生成工具會取得突破,機器人、AI決策也會地大踏步前進。

聲明:該篇文章為本站原創(chuàng),未經(jīng)授權不予轉(zhuǎn)載,侵權必究。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務中斷的風險,如企業(yè)系統(tǒng)復雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務連續(xù)性,提升韌性,成...

關鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關鍵字: 華為 12nm EDA 半導體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權最終是由生態(tài)的繁榮決定的。

關鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務引領增長 以科技創(chuàng)新為引領,提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強核心競爭優(yōu)勢...

關鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術學會聯(lián)合牽頭組建的NVI技術創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術創(chuàng)新聯(lián)...

關鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關鍵字: BSP 信息技術
關閉