計(jì)算機(jī)視覺:從圖像到人工智能
計(jì)算機(jī)視覺技術(shù)基于對視覺數(shù)據(jù)的自動(dòng)分析。遵循跨學(xué)科的方法,它結(jié)合了人工智能,圖像處理和計(jì)算機(jī)科學(xué),以使機(jī)器能夠獲取,解釋和理解圖像和視頻。近年來,這項(xiàng)技術(shù)已經(jīng)發(fā)展了很多,首先是由于不斷增長的計(jì)算能力和大型數(shù)據(jù)集的可用性而驅(qū)動(dòng)的。
傳感器獲取的圖像經(jīng)過一系列轉(zhuǎn)換和分析,以根據(jù)非常精確的步驟序列提取有用的信息,這些步驟可能包括圖像分割,關(guān)鍵特征檢測,對象或人識別,以對場景的語義解釋。實(shí)際上,在計(jì)算機(jī)視覺過程中,基本階段之一是圖像預(yù)處理,通常必須對從傳感器獲得的原始圖像進(jìn)行改進(jìn),這可能包括降低噪聲,變形校正或亮度平衡,以確保后續(xù)分析算法在高質(zhì)量數(shù)據(jù)上起作用。在實(shí)施嵌入式系統(tǒng)的情況下,在計(jì)算資源受到限制并且每個(gè)優(yōu)化直接影響整體性能的情況下,預(yù)處理階段尤為重要。
下一步是特征提取,這是系統(tǒng)從圖像中提取最重要信息的過程的階段。使用高級機(jī)器學(xué)習(xí)技術(shù),尤其是深層神經(jīng)網(wǎng)絡(luò),系統(tǒng)可以直接從數(shù)據(jù)中學(xué)習(xí),并了解哪些功能與特定任務(wù)相關(guān)。在這種情況下,卷積神經(jīng)網(wǎng)絡(luò)(CNN)已經(jīng)證明了在復(fù)雜圖像中識別對象的非凡能力,這要?dú)w功于它們能夠自動(dòng)提取特征層次結(jié)構(gòu)直接從原始像素開始。
計(jì)算機(jī)視覺技術(shù)的技術(shù)限制
盡管有機(jī)會(huì)和興趣,但在嵌入式設(shè)備中實(shí)施計(jì)算機(jī)視覺系統(tǒng),例如工業(yè)控制系統(tǒng),機(jī)器人技術(shù),無人機(jī)或物聯(lián)網(wǎng)設(shè)備,都引入了一些復(fù)雜的挑戰(zhàn)。首先,嵌入式設(shè)備的有限計(jì)算和內(nèi)存硬件功能需要仔細(xì)優(yōu)化計(jì)算機(jī)視覺算法。深度神經(jīng)網(wǎng)絡(luò)雖然非常有效,但在功率和記憶方面也可能非常昂貴。
要考慮的另一個(gè)方面是能源效率:許多嵌入式系統(tǒng)(例如無人機(jī)或遙控傳感器中使用的系統(tǒng))都在電池電源上運(yùn)行,因此在這些情況下,必須最大程度地減少處理器功耗。除此之外,視覺系統(tǒng)的魯棒性,尤其是在不受控制的環(huán)境中。盡管深度學(xué)習(xí)模型在定義明確的環(huán)境中表現(xiàn)出了出色的性能,并且在高質(zhì)量的數(shù)據(jù)集中表現(xiàn)出了出色的表現(xiàn),但它們可能容易受到環(huán)境條件的突然變化的影響,例如照明,攝像機(jī)角度或噪聲的變化,這在工業(yè)或室外場景中使用的嵌入式系統(tǒng)中尤其有問題,在此情況下,環(huán)境條件可能會(huì)發(fā)生巨大的變化。
基于計(jì)算機(jī)視覺的監(jiān)視設(shè)備還引起了人們對面部識別技術(shù)濫用或視覺數(shù)據(jù)收集的侵入性的擔(dān)憂。因此,必須采取計(jì)算機(jī)視覺系統(tǒng)設(shè)計(jì)師的措施,以確保按照隱私法規(guī)保護(hù)個(gè)人數(shù)據(jù)。
計(jì)算機(jī)視覺的應(yīng)用和解決方案
盡管有一些技術(shù)限制,如上所述,計(jì)算機(jī)視覺提供的機(jī)會(huì)卻是巨大的。制造業(yè)是該技術(shù)的最大受益者之一,該技術(shù)將計(jì)算機(jī)視覺用于質(zhì)量控制,過程自動(dòng)化和預(yù)測性維護(hù)。系統(tǒng)可以檢測到與人類相比,精度更高的機(jī)械中的產(chǎn)品或異常缺陷,降低成本并提高效率。
在醫(yī)療保健領(lǐng)域,計(jì)算機(jī)視覺正在改變醫(yī)療服務(wù),其應(yīng)用程序從醫(yī)療圖像的自動(dòng)診斷到使用攝像機(jī)的實(shí)時(shí)患者監(jiān)測。汽車行業(yè)還在利用計(jì)算機(jī)視覺的潛力,尤其是在自動(dòng)駕駛汽車的開發(fā)中,計(jì)算機(jī)視覺允許車輛“看到”其周圍環(huán)境,并識別障礙物,路標(biāo)和行人。
模擬設(shè)備提供了廣泛的計(jì)算機(jī)視覺產(chǎn)品和解決方案,專門為支持高級機(jī)器視覺應(yīng)用而設(shè)計(jì)。這些產(chǎn)品涵蓋了圖像處理的各個(gè)方面,并加速了智能機(jī)器視覺系統(tǒng)的開發(fā)。借助高級技術(shù)的全面投資組合,Analog設(shè)備如今已成為機(jī)器視覺市場中的關(guān)鍵參與者,具有用于眾多應(yīng)用,例如工業(yè)和自動(dòng)化,高級機(jī)器人技術(shù),汽車和自動(dòng)駕駛,醫(yī)療保健,醫(yī)療成像,遠(yuǎn)程醫(yī)療,遠(yuǎn)程醫(yī)療,診斷圖像分析),安全和消費(fèi)者的集成且可擴(kuò)展的解決方案。
該公司的關(guān)鍵產(chǎn)品包括針對LIDAR和RADAR系統(tǒng)的集成解決方案,該解決方案是為自動(dòng)駕駛汽車的計(jì)算機(jī)視覺應(yīng)用而設(shè)計(jì)的,以及將不同技術(shù)結(jié)合起來以改善周圍環(huán)境的感知,提供詳細(xì)的三維圖像的ADAS系統(tǒng)。對ADA解決方案的需求不斷增長,以將有效的電力管理結(jié)合在較小的足跡中,并結(jié)合高速連通性,復(fù)雜的互連和數(shù)據(jù)完整性。
高級駕駛員輔助系統(tǒng)(ADA)包括旨在在駕駛時(shí)協(xié)助駕駛員的技術(shù),從而提高了車輛的安全性和效率。 ADAS功能可以包括障礙物和行人檢測,自適應(yīng)巡航控制,交通標(biāo)志識別,車道保存,盲點(diǎn)監(jiān)控和自動(dòng)緊急制動(dòng)。 ADA使用傳感器,相機(jī),雷達(dá)和激光雷達(dá)來收集有關(guān)周圍環(huán)境的數(shù)據(jù),并協(xié)助駕駛員做出正確且安全的決策。在該區(qū)域中,模擬設(shè)備的雷達(dá)傳感器在檢測移動(dòng)物體方面的準(zhǔn)確性特別值得贊賞。
ADI的下一代ADAS體系結(jié)構(gòu)將AI和機(jī)器學(xué)習(xí)與計(jì)算機(jī)愿景相結(jié)合,以提高對象識別,場景理解和視頻分析,同時(shí)還可以更快地進(jìn)行市場。 ADAS系統(tǒng),包括精確傳感,智能電源管理,高速連接性和數(shù)據(jù)完整性,可以用少量的外部組件實(shí)現(xiàn)有效的設(shè)計(jì)。所有這些ADA功能都可以通過在整個(gè)汽車中分布的一組傳感器來啟用,并與I/O模塊,執(zhí)行器和控制器聯(lián)網(wǎng)。駕駛員監(jiān)視系統(tǒng),停車和自動(dòng)駕駛汽車攝像頭,電動(dòng)汽車的聲警告系統(tǒng)以及緊急車輛檢測完成了投資組合。
下一代ADAS系統(tǒng)的靈活性和可擴(kuò)展性旨在實(shí)現(xiàn)高效,精確的操作,降低設(shè)計(jì)的復(fù)雜性并加速開發(fā)時(shí)間。 ADI提供了精確的傳感,智能電源管理和連接性,這些連接支持相機(jī),雷達(dá)和激光雷達(dá)系統(tǒng)的傳感器融合和處理。
ADI還提供了針對捕獲高分辨率圖像的優(yōu)化圖像傳感器,其應(yīng)用程序從機(jī)器視覺到視頻獲取不等。傳感器支持諸如低光圖像處理和高動(dòng)態(tài)范圍之類的功能,并廣泛使用:
· 工業(yè)自動(dòng)化和機(jī)器人技術(shù)
· 醫(yī)學(xué)成像設(shè)備
· ADA和自動(dòng)駕駛汽車
還有具有低功耗嵌入式視覺功能的高級處理平臺和用于圖像處理的硬件加速器。所有模擬設(shè)備嵌入式視覺解決方案都提供了高級傳感器和高性能處理硬件的組合,適用于工業(yè),汽車和醫(yī)療保健環(huán)境。
例如,諸如Blackfin嵌入式視覺處理器之類的產(chǎn)品范圍旨在為視覺應(yīng)用提供優(yōu)化的處理能力。 ADI提供處理器和處理解決方案,以處理來自圖像傳感器的數(shù)據(jù)流,從而加速推理和視覺分析過程;其中包括針對機(jī)器視覺和深度學(xué)習(xí)進(jìn)行優(yōu)化的數(shù)字信號處理器(DSP)。
BlackFin ADSP-BF609處理器使用具有獨(dú)特的管道式視覺處理器(PVP)的雙核固定點(diǎn)DSP處理器進(jìn)行了優(yōu)化,用于嵌入式視覺和視頻分析應(yīng)用程序。 PVP是一組功能塊,與Blackfin核心一起設(shè)計(jì),旨在加速圖像處理算法并減少整體帶寬要求。其他處理器規(guī)格包括高級高性能基礎(chǔ)架構(gòu),較大的片上存儲器以及具有廣泛連接選項(xiàng)的功能豐富的外圍設(shè)置。 ADSP-BF609處理器非常適合許多嵌入式視覺應(yīng)用,例如汽車高級駕駛員輔助系統(tǒng)(ADAS),用于制造,安全性和監(jiān)視分析的機(jī)器視覺和機(jī)器人技術(shù)以及條形碼掃描儀。
ADSD3500是模擬設(shè)備TOF產(chǎn)品(例如ADTF3175和ADSD3030)的飛行時(shí)間(TOF)深度圖像信號處理器。 ADSD3500支持1024×1024分辨率的640×480分辨率和部分深度計(jì)算(前相結(jié)合)的完整深度,主動(dòng)亮度和置信度計(jì)算。數(shù)據(jù)流和處理通過集成的ARM Cortex-M33控制。使用專用的硬件和內(nèi)存進(jìn)行計(jì)算,從而實(shí)現(xiàn)低功率TOF深度ISP解決方案。
ADSD3500還控制圖像傳感器模塊的引導(dǎo),校準(zhǔn)數(shù)據(jù)的加載以及幀的觸發(fā)。它專為工作溫度范圍為-25°C至 +85°C,它涉及以下應(yīng)用程序字段:增強(qiáng)現(xiàn)實(shí)(AR)系統(tǒng),機(jī)器人技術(shù),建筑自動(dòng)化和機(jī)器視覺系統(tǒng)。 ADSD3500提供3.47mm x 3.47mm WLCSP軟件包。
ADI還提供了一系列高質(zhì)量的視頻采集和傳輸解決方案,包括高速視頻接口,編碼器,解碼器和收發(fā)器。
低成本平臺上的計(jì)算機(jī)視覺
對象檢測是人工智能的主要應(yīng)用之一,它既用于機(jī)器學(xué)習(xí)和深度學(xué)習(xí)水平。著名的單板計(jì)算機(jī)品牌Raspberry Pi對嵌入式計(jì)算機(jī)視覺領(lǐng)域產(chǎn)生了重大影響。由于其緊湊而強(qiáng)大的板,Raspberry Pi即使在低成本設(shè)備(例如Pi Camera模塊)上也可以運(yùn)行人造視覺算法,該設(shè)備與嵌入式視覺項(xiàng)目的平臺完美整合在一起,使其成為當(dāng)今的業(yè)余愛好者,學(xué)術(shù)研究人員和原始型和真實(shí)應(yīng)用程序的首選工具。
例如,可以通過Tensorflow在Raspberry Pi上實(shí)現(xiàn)實(shí)時(shí)自動(dòng)對象檢測和識別應(yīng)用程序,這是一個(gè)用于機(jī)器學(xué)習(xí)的開源平臺,旨在促進(jìn)機(jī)器學(xué)習(xí)和人工智能模型的構(gòu)建,培訓(xùn)和部署。為此,您所需要的只是一個(gè)常見的Raspberry Pi 3,一個(gè)用于獲取圖像的相機(jī)和SD存儲卡。
此外,可以訓(xùn)練神經(jīng)網(wǎng)絡(luò)在同一圖像中檢測特定的對象類別,從而將Raspberry Pi轉(zhuǎn)變?yōu)橛糜谟?jì)算應(yīng)用程序的高度定制的檢測系統(tǒng)。即使是具有無法匹配專業(yè)AI硬件的性能的低成本嵌入式平臺,也可以運(yùn)行具有可接受結(jié)果的對象識別模型。 Raspberry Pi憑借其多功能性和大型開發(fā)社區(qū)的支持,為嵌入式視覺應(yīng)用提供了堅(jiān)實(shí)的基礎(chǔ),使您可以將相機(jī),傳感器和硬件加速器集成到設(shè)計(jì)中。
結(jié)論和發(fā)展前景
當(dāng)今,計(jì)算機(jī)視野代表了現(xiàn)代技術(shù)最具動(dòng)態(tài)的前沿之一。計(jì)算機(jī)視覺系統(tǒng)的設(shè)計(jì)人員必須在圖像和視頻處理的計(jì)算資源管理,算法的魯棒性和預(yù)期結(jié)果的精確度之間實(shí)現(xiàn)良好的折衷,而不會(huì)忽視節(jié)能。得益于該行業(yè)中公司的創(chuàng)新,功能強(qiáng)大的硬件平臺的開發(fā)和實(shí)施現(xiàn)在更加易于使用,并為新領(lǐng)域以及越來越智能和執(zhí)行的解決方案打開了大門,即使在先進(jìn)的應(yīng)用程序和極端條件下也是如此。