小編與大家一起了解了機器人的起源發(fā)展和常見的種類。隨著機器人越來越多地參與到我們的生產(chǎn)生活中,它們的“類人”屬性逐漸凸顯,有時我們甚至產(chǎn)生它們擁有人的感官和思維的錯覺。它們可以靈巧躲避障礙物,甚至能聽會看可交流,逐漸成為了我們工作生活中不可或缺的伙伴。其實,機器人這一系列類人能力的背后離不開日益成熟的感知技術(shù)。今天與大家一起了解下機器人那些“神奇”的感知技術(shù)。
一、機器人是什么?你不知道的那些事兒二、形態(tài)各異、功能多樣,機器人種類知多少?
機器人感知系統(tǒng)的基礎(chǔ)硬件單元是由不同種類的傳感器構(gòu)成的,它們作為機器人身上的感覺器官,充當(dāng)了眼睛、耳朵、鼻子等重要角色。不同類型的傳感器用于收集不同的測量信息,經(jīng)過數(shù)據(jù)處理階段,輸送到不同的感知算法,為機器人后續(xù)的規(guī)劃、控制階段提供支持。
感知技術(shù)是機器人獲取和理解環(huán)境信息的基礎(chǔ),它可以給應(yīng)用層帶來更多可能。一般可分為視覺感知、聽覺感知和觸覺感知等大類。
視覺感知
機器人視覺感知技術(shù)包括硬件傳感器的研發(fā)、軟件算法的研發(fā)等。主流視覺傳感器系統(tǒng)包括單目、雙目立體、全景、混合等。依據(jù)不同的應(yīng)用場景選擇合適的傳感器配置,從而得到目標視覺信息的全周期、全覆蓋。
單目視覺系統(tǒng)僅使用一個攝像頭,由于三維空間的深度信息在成像過程中丟失,這種系統(tǒng)無法直接測量物體的距離,通常依靠其他技術(shù)或算法間接估計深度。單目系統(tǒng)的視角取決于攝像頭鏡頭的參數(shù),通常視角有限,但可以通過調(diào)整鏡頭來改變,廣泛應(yīng)用于目標跟蹤、室內(nèi)定位導(dǎo)航等不需要非常高精度深度信息的場合。
雙目視覺系統(tǒng)通過兩個攝像頭模仿人眼的體視功能,利用三角測量原理獲得場景的深度信息,可以比較準確地恢復(fù)視覺場景的三維形狀和位置。雙目系統(tǒng)的視角較寬,因為兩個攝像頭從不同角度捕獲圖像,有助于深度信息的獲取。用于需要高精度深度信息的應(yīng)用,如移動機器人的定位導(dǎo)航、避障和地圖構(gòu)建。
全景視覺系統(tǒng)是具有較大水平視場的多方向成像系統(tǒng),突出的優(yōu)點是有較大的視場,可以達到360度,全景視覺系統(tǒng)可以通過圖像拼接的方法或者通過折反射光學(xué)元件實現(xiàn),適合需要大范圍監(jiān)測的應(yīng)用,但本質(zhì)上是一種單目系統(tǒng),無法直接獲取深度信息。適用于機器人導(dǎo)航和某些監(jiān)控任務(wù),需要大范圍監(jiān)視但不需深度信息的場景。
混合視覺系統(tǒng)結(jié)合了多種視覺系統(tǒng)的優(yōu)點,例如單目或雙目視覺系統(tǒng)與其他傳感器如激光雷達的結(jié)合,能夠同時提供寬廣的視場和精確的深度信息?;旌舷到y(tǒng)的視角取決于組合的各個傳感器,可以實現(xiàn)廣角監(jiān)測同時也能精確測距。混合系統(tǒng)結(jié)構(gòu)配置復(fù)雜,需要多種傳感器的配合,多用于復(fù)雜的應(yīng)用環(huán)境,如自動駕駛,既需要廣闊的視野又需精確的障礙物檢測與測距。
觸覺感知
機器人的觸覺感知能力是實現(xiàn)與物體之間柔性交互的重要部分。觸覺感知技術(shù)是現(xiàn)代機器人領(lǐng)域中的關(guān)鍵技術(shù)進步,它模擬人類的觸覺,使機器人能夠更智能地與環(huán)境和人類進行交互。觸覺傳感器根據(jù)其信號轉(zhuǎn)換機制的不同,可以分為多種類型,每種類型具有不同的工作原理和應(yīng)用場景:
壓阻型傳感器:利用彈性體材料的電阻率隨壓力變化的性質(zhì)制成。當(dāng)外力作用在傳感器上時,彈性體發(fā)生形變,導(dǎo)致電阻變化,進而將機械刺激轉(zhuǎn)化為電信號。
電容型傳感器:利用兩極板間電容的變化來檢測受力信息。當(dāng)外力作用于傳感器時,兩極板間的相對位置或介質(zhì)厚度發(fā)生變化,導(dǎo)致電容值變化,通過檢測電容變化量來獲取受力信息。
壓電型傳感器:基于壓電效應(yīng),當(dāng)受到外力作用時,材料內(nèi)部發(fā)生電極化現(xiàn)象,從而產(chǎn)生電信號。常用的壓電材料如鋯鈦酸鉛因其高靈敏度和快速響應(yīng)被廣泛采用。
光電式傳感器:利用光學(xué)原理進行工作,通常由光源和光電探測器構(gòu)成。當(dāng)施加在界面上的壓力發(fā)生變化時,傳感器敏感元件的反射強度和光源頻率也會相應(yīng)變化。
磁導(dǎo)式傳感器:在外力作用下磁場發(fā)生變化,并把磁場變化轉(zhuǎn)換為電信號,以此感受接觸面上的壓力信息。
聽覺感知
機器人聽覺感知的應(yīng)用包括讓機器人能夠聽懂人說的話,此時需要在機器人系統(tǒng)上增加聲波傳感器、語音接口,對應(yīng)的傳感器陣列可以全面向接受聲音信息,解析復(fù)雜的聲波頻率,提取連續(xù)自然語言中單獨語音和詞匯,結(jié)合自然語言處理技術(shù)實現(xiàn)人機語音交互。自ChatGPT等大語言模型、語音智能、自然語言處理技術(shù)爆發(fā)以來,服務(wù)型機器人如引導(dǎo)服務(wù)機器人、迎賓機器人、展廳講解機器人、智能音箱等產(chǎn)品廣受推崇。
當(dāng)然機器人聽覺感知,不單單指對于人類語音的識別,還包括通過聲音傳感器對于一切物體發(fā)出聲音的判斷。相比較機器人視覺感知對于物體判斷的簡單直接,聽覺感知確實是人們一直忽略的領(lǐng)域。
在我們的日常生活場景中,其實除了用視覺來判斷物體的遠近、顏色和大小之外,我們通常也會用到聽覺來識別物體的距離遠近、質(zhì)地,推測事件的發(fā)生。聲源定位技術(shù)也是機器人主要的聽覺感知技術(shù)之一。例如在巡檢任務(wù)中,機器人的聽覺感知可以幫助其快速定位到異常聲源,實時監(jiān)測工業(yè)設(shè)備的噪聲狀態(tài)。
激光雷達
激光雷達成像可以簡單理解為使用激光發(fā)射部件向一定視場角FOV(Field OfView)內(nèi)發(fā)射光線,同時使用接收部件接收范圍內(nèi)反射回的光線,利用已知和獲取的發(fā)射光線與反射光線的相關(guān)信息,直接計算或推導(dǎo)出反射點的信息(速度、距離、高度、反射強度等)。
激光雷達探測技術(shù)可以分為TOF飛行時間法與相干探測法。
飛行時間(ToF)法:通過計算光波發(fā)射與返回的時間差來測量目標的距離。
相干探測法:與ToF直接測量時間不同,相干探測法通過測量發(fā)射電磁波與返回電磁波的頻率變化解調(diào)出目標的距離及速度。這種方法的優(yōu)勢在于其高精度和抗干擾能力,特別適用于需要長距離和高精度測量的領(lǐng)域。
FOV即視場角,指激光雷達能夠探測到的視場范圍,可以從垂直和水平兩個維度以角度來衡量范圍大小。
垂直FOV:常見的車載激光雷達通常在25°,形狀呈扇形:
水平FOV:常見的機械式激光雷達可以達到360°范圍,通常布置于車頂;常見的車載半固態(tài)激光雷達通??梢赃_到120“范圍,形狀呈扇形,可布置于車身或車頂。
多傳感器融合
在自動駕駛、移動機器人應(yīng)用里,當(dāng)機器人處于未知環(huán)境中,移動機器人的運動規(guī)劃前提是要有精確的自主定位和環(huán)境感知,雖然攝像頭和激光雷達都可以產(chǎn)生對環(huán)境進行信息感知,同時配置兩者在一定程度上可以做到信息互補,補完路況中不確定性。
將攝像頭與激光雷達產(chǎn)生的信息進行融合,利用冗余互補的信息形成更全面、更可靠的感知結(jié)果。目前比較常見的多模態(tài)傳感器數(shù)據(jù)融合的方法有如下三種:
1、數(shù)據(jù)級融合(前融合):直接將不同模態(tài)的原始數(shù)據(jù)在空間上對齊后進行融合。
2、特征級融合(深度融合):分別對不同模態(tài)的原始數(shù)據(jù)進行特征提取并在特征空間中將各模態(tài)特征混合在一起。
3、目標級融合(后融合):在每個模態(tài)都對目標進行預(yù)測,然后綜合不同模態(tài)的結(jié)果形成單一的目標輸出。這種方法可以當(dāng)成一種集成學(xué)習(xí)方法。
機器人感知技術(shù)的發(fā)展趨勢指向更加智能化、綜合化的方向。多模態(tài)感知融合技術(shù)將視覺、觸覺、聽覺等多種感知方式結(jié)合起來,使機器人在復(fù)雜多變的環(huán)境中具備更強的適應(yīng)性和決策能力。深度學(xué)習(xí)的應(yīng)用推動了感知技術(shù)的快速進步,通過大量的數(shù)據(jù)訓(xùn)練,機器人可以更準確地識別和處理復(fù)雜的感知信息。隨著研究的深入,未來的機器人將不僅僅是執(zhí)行命令的工具,而是成為能夠理解人類意圖和情感,與人類協(xié)同作業(yè)的智能伙伴。