當(dāng)前位置:首頁(yè) > 芯聞號(hào) > 充電吧
[導(dǎo)讀]雷鋒網(wǎng)(公眾號(hào):雷鋒網(wǎng))消息,據(jù)外媒Venturebeat報(bào)道,F(xiàn)acebook、喬治亞理工學(xué)院和俄勒岡州立大學(xué)的研究人員在本周發(fā)表的一篇預(yù)印本論文中,描述了人工智能的一項(xiàng)新任務(wù)——通過(guò)聽(tīng)自然語(yǔ)言的指

雷鋒網(wǎng)(公眾號(hào):雷鋒網(wǎng))消息,據(jù)外媒Venturebeat報(bào)道,F(xiàn)acebook、喬治亞理工學(xué)院和俄勒岡州立大學(xué)的研究人員在本周發(fā)表的一篇預(yù)印本論文中,描述了人工智能的一項(xiàng)新任務(wù)——通過(guò)聽(tīng)自然語(yǔ)言的指令,在3D環(huán)境中導(dǎo)航(例如,“走下大廳,在木桌旁左轉(zhuǎn)”)。他們說(shuō),這可以為遵循自然語(yǔ)言指令的機(jī)器人助手奠定基礎(chǔ)。

研究人員的任務(wù),被稱(chēng)之為在連續(xù)環(huán)境中的視覺(jué)和語(yǔ)言導(dǎo)航(VLN-CE),是在Facebook的模擬器Habitat中進(jìn)行的,該模擬器可以訓(xùn)練機(jī)器人助手在模擬真實(shí)環(huán)境的環(huán)境中操作。直徑為0.2米、1.5米高的助手被放置在來(lái)自Matterport3D數(shù)據(jù)集的內(nèi)部,該數(shù)據(jù)集是通過(guò)10800多個(gè)全景圖和相應(yīng)的3D網(wǎng)格捕獲的90個(gè)環(huán)境的集合。

機(jī)器人助手必須在一條路徑上做四個(gè)動(dòng)作(向前移動(dòng)0.25米,左轉(zhuǎn)或右轉(zhuǎn)15度,或停在目標(biāo)位置)中的一個(gè),并學(xué)會(huì)避免被困在障礙物上,比如椅子和桌子上。

研究小組將這些環(huán)境提煉成4475條由4到6個(gè)節(jié)點(diǎn)組成的軌跡,這些軌跡對(duì)應(yīng)于在各個(gè)位置拍攝的360度全景圖像,顯示了導(dǎo)航能力。

他們用這個(gè)訓(xùn)練兩個(gè)人工智能模型:一個(gè)sequence-to-sequence模型,該模型由采取視覺(jué)觀察和指令表示的策略組成,并使用它們預(yù)測(cè)一個(gè)動(dòng)作;另一個(gè)是兩個(gè)網(wǎng)絡(luò)交叉模式注意模型,該模型跟蹤觀察結(jié)果,并根據(jù)指令和特征做出決策。

研究人員表示,在實(shí)驗(yàn)中,表現(xiàn)最好的機(jī)器人可以遵循“向左拐,進(jìn)入走廊”之類(lèi)的指令,盡管這些指令要求機(jī)器人在發(fā)現(xiàn)視覺(jué)路標(biāo)之前轉(zhuǎn)動(dòng)未知的次數(shù)。事實(shí)上,機(jī)器人在看不見(jiàn)的環(huán)境,大約三分之一的場(chǎng)景中導(dǎo)航到目標(biāo)位置,平均采取了88次行動(dòng)。

這些機(jī)器人偶爾也會(huì)失敗,根據(jù)合著者的說(shuō)法,這些失敗通常是由于機(jī)器人在視覺(jué)上丟失了指令中提到的對(duì)象。

“至關(guān)重要的是,VLN-CE為(研究)社區(qū)提供了一個(gè)測(cè)試平臺(tái),在這里可以進(jìn)行研究高級(jí)和低級(jí)控制界面的這類(lèi)集成實(shí)驗(yàn),”合著者寫(xiě)道。

Facebook投入了大量資源來(lái)解決自主機(jī)器人導(dǎo)航的問(wèn)題。

雷鋒網(wǎng)了解到,今年6月,在公布了一項(xiàng)訓(xùn)練六足機(jī)器人走路的計(jì)劃后,F(xiàn)acebook首次推出了PyRobot,一種用于PyTorch機(jī)器學(xué)習(xí)框架的機(jī)器人框架。2018年,F(xiàn)acebook推出了開(kāi)源人工智能,可以通過(guò)360度圖像在紐約市街道上導(dǎo)航。最近,F(xiàn)acebook的一個(gè)團(tuán)隊(duì)發(fā)表了一篇論文,描述了一個(gè)通過(guò)觀看視頻學(xué)習(xí)如何在辦公室里走動(dòng)的系統(tǒng)。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專(zhuān)欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車(chē)的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國(guó)汽車(chē)技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車(chē)工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車(chē)。 SODA V工具的開(kāi)發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車(chē) 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來(lái)越多用戶(hù)希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來(lái)越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場(chǎng)的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開(kāi)幕式在貴陽(yáng)舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國(guó)國(guó)際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱(chēng),數(shù)字世界的話(huà)語(yǔ)權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營(yíng)業(yè)績(jī)穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤(rùn)率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長(zhǎng) 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競(jìng)爭(zhēng)力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競(jìng)爭(zhēng)優(yōu)勢(shì)...

關(guān)鍵字: 通信 BSP 電信運(yùn)營(yíng)商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國(guó)電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場(chǎng) NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長(zhǎng)三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡(jiǎn)稱(chēng)"軟通動(dòng)力")與長(zhǎng)三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉