機器人中加入導(dǎo)航技術(shù)可以使其變得更智能
在不遠(yuǎn)的將來,機器人可能會作為最后一英里的運輸工具被派往你家門口,如果他們能找到門的話,就可以把你的外賣訂單、包裹或餐盒訂購單放到你家門口。
機器人導(dǎo)航的標(biāo)準(zhǔn)方法包括預(yù)先繪制一個區(qū)域的地圖,然后使用算法引導(dǎo)機器人朝向地圖上的特定目標(biāo)或GPS坐標(biāo)。雖然這種方法對于探索特定環(huán)境(如特定建筑的布局或計劃的障礙路線)可能是有意義的,但在最后一英里交付的情況下,這種方法可能會變得笨拙。
例如,想象一下,公司必須事先繪制機器人傳送區(qū)域內(nèi)每個鄰居的地圖,包括該鄰居內(nèi)每個房子的配置以及每個房子前門的特定坐標(biāo),這個任務(wù)量會讓人崩潰。同樣,這樣的任務(wù)額很難擴展到整個城市,特別是房屋的外觀經(jīng)常隨著季節(jié)的變化而變化(羨慕國外)。繪制每間房子的地圖也可能會遇到安全和隱私問題。
新技術(shù)
現(xiàn)在麻省理工學(xué)院的工程師已經(jīng)開發(fā)出一種導(dǎo)航方法,不需要事先繪制一個區(qū)域。相反,他們的方法使機器人能夠利用環(huán)境中的線索規(guī)劃到目的地的路線,這可以用一般的語義術(shù)語來描述,例如“前門”或“車庫”,而不是地圖上的坐標(biāo)。例如,如果一個機器人接到指令,要把包裹送到某人的前門,它可能會從馬路上開始,看到一條車道,經(jīng)過訓(xùn)練,它認(rèn)識到這條車道有可能通向人行道,而人行道又有可能通向前門。
這項新技術(shù)可以大大減少機器人在識別目標(biāo)之前探索一處房產(chǎn)的時間,而且它不依賴特定住宅的地圖。麻省理工學(xué)院機械工程系的研究生邁克爾·埃弗雷特(Michael Everett)說:“我們不想把我們需要去的每一棟建筑都繪制成地圖。”有了這項技術(shù),我們希望在任何車道的盡頭都能放下一個機器人,讓它找到一扇門?!?/p>
埃弗雷特將在本周的智能機器人和系統(tǒng)國際會議上介紹該技術(shù)的成果。這篇論文由麻省理工學(xué)院航空航天學(xué)教授喬納森·豪斯(jonathan how)和福特汽車公司(ford motor company)的賈斯汀·米勒(justin miller)共同撰寫,是“認(rèn)知機器人最佳論文”的最終入圍者。
“對事物的感覺”
近年來,研究人員致力于將自然的語義語言引入機器人系統(tǒng),訓(xùn)練機器人通過語義標(biāo)簽識別物體,這樣他們就可以將一扇門視為一扇門,而不僅僅是一個實心的矩形障礙物。
埃弗雷特說:“現(xiàn)在我們有能力讓機器人實時感知事物的本質(zhì)?!卑8ダ滋亍⒑浪购兔桌照谑褂妙愃频恼Z義技術(shù)作為他們的新導(dǎo)航方法的跳板,它利用預(yù)先存在的算法從視覺數(shù)據(jù)中提取特征以生成同一場景的新地圖,從而用語義線索或上下文進(jìn)行分析。
在他們的案例中,研究人員使用一種算法來建立機器人移動時的環(huán)境地圖,使用每個物體的語義標(biāo)簽和深度圖像這種算法稱為語義SLAM(同時定位和映射)。雖然其他語義算法使機器人能夠識別和映射環(huán)境中的對象,但它們不允許機器人在導(dǎo)航新環(huán)境的同時,在最有效的路徑上做出決策,以到達(dá)語義目的地,如“前門”,霍華德說:“以前,探索只是把一個機器人撲通一聲放下來,對它說‘走’,它會四處移動,雖然最終到達(dá)那里,但速度會很慢?!?/p>
去的代價
研究人員希望通過一個語義的、背景色的世界來加速機器人的路徑規(guī)劃。他們開發(fā)了一種新的“去代價估計器”,該算法將現(xiàn)有SLAM算法創(chuàng)建的語義映射轉(zhuǎn)換成第二個映射,表示任何給定位置接近目標(biāo)的可能性。
埃弗雷特說:“這是從一個圖像到另一個圖像的轉(zhuǎn)換中得到的靈感,在這里你拍下一只貓的照片,讓它看起來像一只狗。”同樣的想法也會在這里發(fā)生,以前你把一張看起來像世界地圖的圖像,可以變成另一張看起來像世界地圖的圖像,但現(xiàn)在是根據(jù)地圖上不同點與最終目標(biāo)的距離來著色的。”
這個成本地圖是彩色的,用灰度表示,把較暗的區(qū)域表示為遠(yuǎn)離目標(biāo)的位置,把較亮的區(qū)域表示為接近目標(biāo)的區(qū)域。例如,在語義地圖中用黃色編碼的人行道,可能會被cost-to-go算法轉(zhuǎn)換為新地圖中較暗的區(qū)域,而車道在接近前門時會逐漸變亮,這是新地圖中最亮的區(qū)域。
研究人員在Bing地圖的衛(wèi)星圖像上訓(xùn)練了這種新算法,這些圖像包含來自一個城市和三個郊區(qū)的77棟房屋。該系統(tǒng)將語義映射轉(zhuǎn)換為代價映射,并按照映射中較輕的區(qū)域映射出最有效的路徑,以達(dá)到最終目標(biāo)對于每個衛(wèi)星圖像,埃弗雷特都為典型前院的上下文特征指定語義標(biāo)簽和顏色,例如灰色表示前門,藍(lán)色表示車道,綠色表示樹籬。
在這個訓(xùn)練過程中,研究小組還對每幅圖像應(yīng)用了蒙版,以模擬機器人的相機在穿越院子時可能擁有的部分視圖?!拔覀兎椒ǖ囊徊糠衷E竅是(給系統(tǒng))提供許多部分圖像,”How解釋道。所以它必須弄清楚這些東西是如何相互關(guān)聯(lián)的,這正是這項工作得以穩(wěn)健開展的部分原因?!?/p>
然后,研究人員在訓(xùn)練數(shù)據(jù)集之外的一所全新房屋的圖像模擬中測試了他們的方法,首先使用預(yù)先存在的SLAM算法生成語義圖,然后使用其新的成本估算器生成第二張地圖和通往目標(biāo)的路徑(在這種情況下為前門)。
對比傳統(tǒng)的導(dǎo)航算法,該集團(tuán)的“去發(fā)現(xiàn)前車門”新技術(shù)更高效與低成本,這種算法比不考慮上下文或語義的經(jīng)典導(dǎo)航算法快189%,以往的方法花費了過多的步驟來探索不太可能接近目標(biāo)的領(lǐng)域。埃弗雷特說,研究結(jié)果說明了機器人是如何利用上下文來有效地定位目標(biāo),即使是在不熟悉的、未映射的環(huán)境中。
埃弗雷特說:“即使一個機器人正在把一個包裹送到一個它從未去過的環(huán)境中,也可能會有一些線索和它看到的其他地方一樣?!彼?,即便世界的布局可能有點不同,但必然可能有一些共同點。”我們要做的只是讓機器人發(fā)現(xiàn)和使用這些共通點!