當(dāng)前位置:首頁 > 汽車電子 > 汽車電子技術(shù)文庫
[導(dǎo)讀] 深度學(xué)習(xí)在無人駕駛領(lǐng)域主要用于圖像處理,也就是攝像頭上面。當(dāng)然也可以用于雷達(dá)的數(shù)據(jù)處理,但是基于圖像極大豐富的信息以及難以手工建模的特性,深度學(xué)習(xí)能最大限度的發(fā)揮其優(yōu)勢。 現(xiàn)在介紹一下全

深度學(xué)習(xí)無人駕駛領(lǐng)域主要用于圖像處理,也就是攝像頭上面。當(dāng)然也可以用于雷達(dá)的數(shù)據(jù)處理,但是基于圖像極大豐富的信息以及難以手工建模的特性,深度學(xué)習(xí)能最大限度的發(fā)揮其優(yōu)勢。

現(xiàn)在介紹一下全球攝像頭領(lǐng)域的巨擘,以色列的mobileye公司是怎么在他們的產(chǎn)品中運(yùn)用深度學(xué)習(xí)的。 深度學(xué)習(xí)可以用于感知,識(shí)別周圍環(huán)境,各種對車輛有用的信息;也可以用于決策,比如AlphaGo的走子網(wǎng)絡(luò)(Policy Network),就是直接用DNN訓(xùn)練, 如何基于當(dāng)前狀態(tài)作出決策。

環(huán)境識(shí)別方面,mobileye把他們識(shí)別方面的工作主要分為三部分,物體識(shí)別,可行駛區(qū)域檢測,行駛路徑識(shí)別。

物體識(shí)別

一般的物體識(shí)別是這樣子的:

有一個(gè)長方形框框能識(shí)別出來車在哪里,很好,很不錯(cuò),但是Mobileye出來的是這樣子的:

以及這樣子的:

很明顯的區(qū)別就是Mobileye可以實(shí)現(xiàn)非常準(zhǔn)確的車的正面以及側(cè)面的檢測,以及完全正確的區(qū)分左邊側(cè)面以及右邊側(cè)面(黃色和藍(lán)色)。

這兩種檢測結(jié)果的信息量是完全不同的,左邊這個(gè)檢測結(jié)果告訴我們什么位置大概有一輛車,但是他的具體位置,車的朝向信息完全沒有。但是從右邊的檢測結(jié)果,就可以相對精確的估算出來車的位置,行駛方向等重要信息,跟我們?nèi)丝吹胶罂梢酝茰y的信息差不多了。

這樣出眾的結(jié)果,對于較近距離的車,用其他基于幾何的方法,多跟蹤幾幀,可能可以做到接近的效果,但是留意遠(yuǎn)處很小的車,結(jié)果也完全正確,這就只可能是深度學(xué)習(xí)的威力了。可惜 Mobileye 創(chuàng)始人兼 CTO 總愛四處顯擺他們技術(shù)怎么怎么牛,之前也常發(fā)論文共享一些技術(shù),但是在車輛識(shí)別怎么建模神經(jīng)網(wǎng)絡(luò)可以輸出這么精確帶 orientaTIon 的 bounding box,他只是微微一笑,說這里面有很多 tricks ……

如果誰知道學(xué)術(shù)界有類似的工作,請私信告訴我, 拜謝

可行駛區(qū)域(free space)檢測

深度學(xué)習(xí)以前的可行駛區(qū)域檢測,有兩種方法,一是基于雙目攝像頭立體視覺或者 Structure from moTIon, 二是基于局部特征,馬爾科夫場之類的圖像分割。結(jié)果是這樣的:

綠色部分是可行駛區(qū)域檢測,看著還不錯(cuò)對不對? 但是注意左邊的綠色部分涵蓋了馬路 “ 倒鴨子 ”(雷鋒網(wǎng)按:路邊石)以及人行道部分,因?yàn)?“ 倒鴨子 ” 也就比路面高十厘米左右, 靠立體視覺是很難跟馬路區(qū)分開來的。而傳統(tǒng)的圖像分割也很困難,因?yàn)榫植刻卣魃希?ldquo; 倒鴨子 ” 上和路面的顏色極其接近。區(qū)分二者需要對環(huán)境整個(gè) context 的綜合理解。

自從有了深度學(xué)習(xí)可以做 scene understanding 之后,這個(gè)問題終于被攻克了:

綠色部分還是可行駛區(qū)域,馬路右邊的路肩跟路面的高度相差無幾,顏色 texture 也是一模一樣,用立體視覺的方法不可能區(qū)分開來。

而且不僅僅可行駛區(qū)域的邊界準(zhǔn)確檢測出來了,連為什么是邊界的原因也可以檢測出來:

紅色表示是物體跟道路的邊界,鼠標(biāo)位置那里表示的是 Guard rail ( 護(hù)欄 ) ,而上一張圖應(yīng)該是 Flat。這樣在正常情況下知道哪些區(qū)域是可以行駛的,而在緊急情況下,也可以知道哪里是可以沖過去的。

當(dāng)然,相較于第一部分,這一部分的原理是比較清楚的,就是基于深度學(xué)習(xí)的 scene understanding。學(xué)術(shù)界也有蠻不錯(cuò)的結(jié)果了,比如下圖 ( Cambridge 的工作 ) ,路面跟倒鴨子就分的很好 ( 藍(lán)色跟紫色 ) :

行駛路徑檢測

這一部分工作要解決的問題主要是在沒有車輛線或者車輛線狀況很差的情況下,車怎么開的問題。如果所有的路況都如下:

那當(dāng)然很完美,但是由于路況或者天氣,有些時(shí)候車輛線是很難檢測到的。

深度學(xué)習(xí)為此提供了一個(gè)解決辦法。我們可以用人在沒有車道線的路況下開車的數(shù)據(jù)來訓(xùn)練神經(jīng)網(wǎng)絡(luò),訓(xùn)練好之后,神經(jīng)網(wǎng)絡(luò)在沒有車道線的時(shí)候也能大概判斷未來車可以怎么開。這一部分原理也是比較清楚的,找一個(gè)人開車,把整個(gè)開車的過程攝像頭的錄像保存下來,把人開車的策略車輛的行駛路徑也保存下來。用每一幀圖片作為輸入,車輛未來一段時(shí)間(很短的時(shí)間)的路徑作為輸出訓(xùn)練神經(jīng)網(wǎng)絡(luò)。之前很火的 Comma 公司,黑蘋果手機(jī)那個(gè)創(chuàng)立的,做的無人駕駛就是這種思路,因?yàn)槠淇煽啃砸约霸瓌?chuàng)性還被 LeCun 鄙視了。

結(jié)果如下,可以看到神經(jīng)網(wǎng)絡(luò)提供的行駛路徑基本上符合人類的判斷:

更極端的情況:

綠色是預(yù)測的行駛路徑。沒有深度學(xué)習(xí),這種場景也是完全不可能的。當(dāng)然,我在最近的另外一個(gè)答案里面提到了,不能完全依靠神經(jīng)網(wǎng)絡(luò)來做路徑規(guī)劃,Mobileye 也是綜合傳統(tǒng)的車道線檢測,上面提到的場景分割檢測到的護(hù)欄等,這一部分的神經(jīng)網(wǎng)絡(luò)輸出等等,做信息融合最后得到一個(gè)穩(wěn)定的完美的行駛路徑。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運(yùn)營商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡稱"軟通動(dòng)力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉