當(dāng)前位置:首頁 > 智能硬件 > 機(jī)器人
[導(dǎo)讀] 從本科到研究生階段,再到2014年出來創(chuàng)業(yè)以后,這前后大概5年的時間里,我始終聚焦在視覺領(lǐng)域的學(xué)習(xí)。所以能夠比較清晰地看到,在這幾年時間里,以視覺為核心的,包括人臉識別、物體識別、空間定位、導(dǎo)航

從本科到研究生階段,再到2014年出來創(chuàng)業(yè)以后,這前后大概5年的時間里,我始終聚焦在視覺領(lǐng)域的學(xué)習(xí)。所以能夠比較清晰地看到,在這幾年時間里,以視覺為核心的,包括人臉識別、物體識別、空間定位、導(dǎo)航避障等在內(nèi)的感知層算法正在隨著底層人工智能的基礎(chǔ)型算法架構(gòu)(比如我們現(xiàn)在熟知的機(jī)器學(xué)習(xí)、深度學(xué)習(xí),以及最近很火的增強(qiáng)學(xué)習(xí))和硬件傳感器的發(fā)展產(chǎn)生著日新月異的變化。

在實(shí)驗(yàn)室的時候,我的主要研究方向是為特種機(jī)器,包括微小型的無人機(jī)、功能性的機(jī)器人構(gòu)建一套以視覺感知為主的機(jī)器人視覺系統(tǒng),而在2011年后發(fā)展起來的這一波感知層算法的進(jìn)步與傳感器硬件上面的推陳出新恰恰為這樣的研究提供了有利的支持,以至于到今天推動了整個資本市場上對于人工智能項(xiàng)目的大熱與追捧。

下面,我將從機(jī)器人視覺系統(tǒng)、視覺技術(shù)原理和未來發(fā)展趨勢三個方面,為大家講述我們是如何為機(jī)器人構(gòu)建起一個“三維世界”的。

機(jī)器人視覺系統(tǒng)發(fā)展與三維視覺的興起

我們知道“機(jī)器人”這一名詞是1920年一位捷克作家在一本科幻劇中提出的,到了1950年前后,另一位美國作家阿西莫夫才系統(tǒng)性的提出了“機(jī)器人學(xué)”這一概念,并給出了著名的機(jī)器人三定律。在那之后,從1970年,隨著計(jì)算機(jī)的興起,現(xiàn)代控制技術(shù)、傳感器技術(shù)的發(fā)展,機(jī)器人開始了真正的產(chǎn)品化的進(jìn)程。也正是從那個時候開始,搭載一顆基于CCD芯片攝像頭的機(jī)器人,可以為人們提供某一時刻的光學(xué)影像信息記錄,而這也形成了最早期的機(jī)器人視覺系統(tǒng)。值得一提的是,1969年美國的阿波羅登月飛船上搭載的正是基于CCD感光芯片的照相機(jī),為機(jī)器人視覺系統(tǒng)的硬件架構(gòu)提供了系統(tǒng)性的參照。由于具備一定的簡單的記憶存儲能力,那個時候的機(jī)器人可以進(jìn)行簡單的重復(fù)作業(yè),但是對周圍環(huán)境沒有任何感知與反饋控制能力,我們稱當(dāng)時的機(jī)器人為第一代機(jī)器人。

時間推進(jìn)到80年代,視覺傳感器、力觸覺傳感器、接近傳感器和計(jì)算機(jī)在這一時期進(jìn)入到了快速發(fā)展期,特別是摩爾定律的發(fā)現(xiàn)代表著信息技術(shù)的發(fā)展速度在這一時期確確實(shí)實(shí)到了頂峰。這一時期的機(jī)器人已經(jīng)具備了一定的感知能力,能夠獲取作業(yè)環(huán)境與作業(yè)對象的部分信息,并進(jìn)行一定的實(shí)時處理,引導(dǎo)機(jī)器人進(jìn)行作業(yè)。比如下圖我們看到的當(dāng)時美國斯坦福研究所開發(fā)實(shí)現(xiàn)的Shakey移動機(jī)器人,擁有電子攝像頭、測距儀等感知設(shè)備,建立了一套底層到頂層的分層控制機(jī)制和當(dāng)時最先進(jìn)的視覺系統(tǒng),用來幫助機(jī)器人在非結(jié)構(gòu)化的環(huán)境中進(jìn)行獨(dú)立的推理、運(yùn)動規(guī)劃與實(shí)時控制。這是當(dāng)時人工智能技術(shù)應(yīng)用于移動機(jī)器人最為成熟的成果之一,Shakey的誕生自此也揭開了智能移動機(jī)器人研究的大幕。

自此以后,世界各國都開始投入到了對移動機(jī)器人的研究上,而在這之中,視覺系統(tǒng)更是被公認(rèn)為是機(jī)器人走向智能的核心入口。因?yàn)樵谘芯康耐七M(jìn)中,人們需要機(jī)器人對環(huán)境擁有更完善的感知能力、邏輯思維能力、判斷決策能力,甚至是根據(jù)作業(yè)要求與環(huán)境信息進(jìn)行自主的工作。比如美國DARPA在90年代研究的ALV自主車可以選擇路標(biāo)識別實(shí)現(xiàn)導(dǎo)航,達(dá)到10km/h的移動虛度,還采用了立體視覺、衛(wèi)星導(dǎo)航等當(dāng)時的先進(jìn)技術(shù)。2004年NASA研制的火星探測器機(jī)遇號與勇氣號成功在火星表面登陸,搭載當(dāng)時最為先進(jìn)的圖像采集與立體視覺技術(shù),幫助探測器在復(fù)雜的星球表面完成各項(xiàng)未知任務(wù)。而也正是在這樣一個時期,三維視覺系統(tǒng)在移動機(jī)器人上的重要性被首次提出。

通過上面的介紹,不難發(fā)現(xiàn),從上個世紀(jì)六七十年代發(fā)展起來的機(jī)器人視覺系統(tǒng),到今天,實(shí)際上是建立在不同時期最先進(jìn)的算法技術(shù)和硬件傳感器的基礎(chǔ)之上的。在視覺系統(tǒng)的算法技術(shù)上,通過幾十年的發(fā)展,形成了用戶交互、識別感知、運(yùn)動決策和數(shù)據(jù)優(yōu)化4個層級,分別對應(yīng)實(shí)現(xiàn)體感識別、目標(biāo)跟隨、人眼跟隨;地圖構(gòu)建、場景理解、物體識別;定位定姿、自主導(dǎo)航、路徑規(guī)劃;圖像優(yōu)化、深度優(yōu)化、其他數(shù)據(jù)優(yōu)化等諸多今天大家耳熟能詳?shù)乃惴?。在硬件傳感器上,也主要分為前端傳感器表現(xiàn),集成處理芯片和嵌入式算法三個層級。在今天的鈦坦白分享課上,我會主要介紹一下三維視覺的主要實(shí)現(xiàn)原理。

在前面的介紹中,我們看到,機(jī)器人視覺系統(tǒng)一路走來,和光學(xué)傳感器的演進(jìn)密不可分??梢哉f視覺系統(tǒng)幾十年的發(fā)展史,就是光學(xué)傳感器的演進(jìn)史。今天,我們大體將機(jī)器人視覺系統(tǒng)中搭載的視覺傳感器分為三類:以單線激光雷達(dá)為代表的一維線陣傳感器,以嵌入式攝像頭為代表的二維面陣傳感器和以特殊光源為代表的三維深度傳感器。其中,以特殊光源為代表的三維深度傳感器是實(shí)現(xiàn)機(jī)器人三維視覺系統(tǒng)的最主要也是最關(guān)鍵的傳感器,三維數(shù)據(jù)的獲取質(zhì)量直接影響了移動機(jī)器人后端的算法結(jié)果與決策控制。

目前實(shí)現(xiàn)三維深度傳感器的主流技術(shù)大體在2010年后發(fā)展起來,路線有以下幾類:基于單目結(jié)構(gòu)光技術(shù)路線、基于雙目結(jié)構(gòu)光技術(shù)路線以及基于飛行時間法技術(shù)路線。速感科技在今年的11月份,面向服務(wù)機(jī)器人廠商推出的M-32三維傳感器就是基于其中的雙目結(jié)構(gòu)光原理實(shí)現(xiàn)的,且集成嵌入式視覺算法的視覺傳感器。結(jié)構(gòu)光的原理是利用激光的光學(xué)衍射原理,通過傳感器投射出特定的圖案,用以加速或輔助深度圖的獲取。其中特定的圖案可以分為規(guī)則、偽隨機(jī)或隨機(jī)點(diǎn)狀散斑和特殊圖形斑幾類,其優(yōu)勢在于精度高,刷新率快,但缺點(diǎn)是不適合在戶外強(qiáng)光下的環(huán)境進(jìn)行使用。飛行時間的原理也稱TOF原理,是利用調(diào)制光源在不同距離接收到的相位不同從而根據(jù)光的傳播速度反算距離這一原理實(shí)現(xiàn)的深度獲取,這一原理的優(yōu)勢測量精度不會隨著距離遞減,但劣勢是分辨率低且環(huán)境擾動大。


本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險,如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運(yùn)營商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團(tuán))股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉