計算機智能化圖像識別技術(shù)的探討
掃描二維碼
隨時隨地手機看文章
引 言
隨著社會與科學(xué)技術(shù)的進步發(fā)展,計算機圖像識別技術(shù)也越來越智能化,能夠很大程度地滿足人們對圖像的個性化需求。圖像識別技術(shù)將計算機技術(shù)、識別處理技術(shù)、智能化結(jié)合在一起,將輸入的圖像圖形信息轉(zhuǎn)換為計算機數(shù)字信號, 對這些多源數(shù)據(jù)信息進行分析處理,轉(zhuǎn)化成具有特征的信息, 進行分類匹配,得到最終的效果,這樣的方式顯著提升了圖像的處理速度和質(zhì)量 。計算機數(shù)字信號有抗干擾、信息量小、易存儲并能夠長期存儲的優(yōu)點,使得圖像識別容易被執(zhí)行操作 [2]。計算機圖像識別技術(shù)歷經(jīng)了幾個階段的發(fā)展演變, 早期只能對簡單的數(shù)字、文字信息進行識別處理,后來漸漸發(fā)展為可以對簡單的圖形圖像數(shù)字化信息進行識別處理,以及現(xiàn)在的稍復(fù)雜的二維圖像甚至三維立體圖像 [3]。現(xiàn)今的圖像識別系統(tǒng)大致可分為三種形式 :神經(jīng)網(wǎng)絡(luò)、結(jié)構(gòu)以及統(tǒng)計, 如圖 1所示。基于神經(jīng)網(wǎng)絡(luò)形式的圖像識別是一種新型的應(yīng)用廣泛的識別技術(shù),將傳統(tǒng)的圖像識別技術(shù)與先進的神經(jīng)網(wǎng)絡(luò)方法相結(jié)合,大大提升了識別率 [4]。
圖 1 圖像識別系統(tǒng)
計算機圖像識別處理與人類對圖像的感知識別是類似的,然而計算機識別能力更強,能處理的信息量更大。可以用來進行條形碼識別、人臉面部識別、指紋識別、身份認證、模型匹配等,一定程度上保障了人們?nèi)粘I畹陌踩浴:唵斡謴V泛的圖像識別應(yīng)用于智能手機方面,指紋識別、面部識別簡化了人們解鎖屏幕之前的繁瑣操作,大大縮短了解鎖時間,提升了使用效率?,F(xiàn)在的高端識別技術(shù)已經(jīng)可以實現(xiàn)當對象物體的位置、角度和距離等無論發(fā)生怎樣的改變,計算機都能識別其本質(zhì)的特點,對圖像的最終判斷不會產(chǎn)生影響 [5]。例如蘋果公司新推出的 iPhone X 手機的面部識別功能,無論是在黑夜,還是用戶戴眼鏡、臉上有疤痕等面部有些變化,其都能識別出并進行解鎖。學(xué)校、機關(guān)政府等使用的掃臉打卡機器同樣也使用到了此技術(shù)。
1 技術(shù)特征點
圖像本身可能會帶有大量的數(shù)據(jù)信息,在識別過程中還需要對圖像的信息進行比對分析,這就需要對大量的數(shù)據(jù)進行處理,信息量很龐大。圖像的最小單位是像素,一幅圖像是由眾多的像素組成,并且各像素之間有著緊密的關(guān)系。像素對應(yīng)圖像的信息,在一定程度上反映出圖像的內(nèi)容。像素與像素間、像素與圖像間的關(guān)聯(lián)性是很強的,在識別過程中有著重要的作用 [6]。
對圖像進行識別,首先要將圖像信息轉(zhuǎn)變?yōu)槎S數(shù)組, 即計算機可識別的數(shù)字信號,這樣任意精度間的轉(zhuǎn)換就需要高精度的數(shù)字化智能處理技術(shù) [7]。智能化的計算機圖像識別提升了圖像信息的精準度,識別結(jié)果更加接近于真實性,使得圖像受環(huán)境噪聲的影響較小,提升了抗干擾性 [8]。隨著科技的進步,圖像識別技術(shù)也更加的靈活,在圖像的轉(zhuǎn)換處理上方便快捷,識別率精確很多。圖像識別處理大都為了滿足人們的生產(chǎn)生活需求,人為地進行控制分析處理,有時會加 入個人喜好情感等因素,依個人要求改變最后的識別結(jié)果 [9]。
2 技術(shù)實現(xiàn)過程
計算機圖像識別的過程與人腦識別圖像的過程是類似的。首先將要識別的圖像對象輸入到計算機中,之后對其進行預(yù)處理和壓縮處理,對圖像的關(guān)鍵特征進行提取,之后進行分類,最后根據(jù)要求對圖像進行匹配 [6]。圖像識別過程如圖 2 所示。
圖中圖像預(yù)處理過程是最為關(guān)鍵的也是最復(fù)雜困難的一個環(huán)節(jié),會將圖像中一些不重要的數(shù)據(jù)信息去除,對圖像識別效果影響最大[10]。圖像預(yù)處理包括對圖像進行灰度化處理、二值化處理、平滑去噪及輪廓提取等操作。灰度化處理會將圖像中的各像素點的灰度值根據(jù)需求,經(jīng)某一灰度化公式處理后得到成像效果 [11]。二值化處理比較簡單,只需將圖像中像素點的灰度值均設(shè)置為 0 或 255 即可,最后圖像呈現(xiàn)的效果即為黑與白 [12]。去噪處理是將圖像中的一些噪聲及沒用的干擾信息去除,突出需要的圖像內(nèi)容,從而使人們能直觀清晰地看到需求信息。輪廓提取是突出目標圖像對象的邊緣輪廓信息,使人們可以僅從圖像中的形狀邊緣特征就看出圖像的信息內(nèi)容。
對圖像進行壓縮處理,將圖像多余的信息進行壓縮或刪減,可以減少圖像的占用空間,能夠更好的傳輸和存儲,但并不會影響圖像的可識別性。壓縮代碼及形式需根據(jù)實際情況來選擇 [9]。提取圖像的關(guān)鍵特征是系統(tǒng)根據(jù)圖像的主要特征點進行處理提取,如圖像的顏色特征、形狀特征、紋理特征及空間特征等。
3 存在問題及解決途徑
雖然我國智能化的圖像識別技術(shù)取得了迅速發(fā)展,識別效果不錯,但是我國對這項技術(shù)仍處于起步發(fā)展階段,還存在諸多的不足之處,識別技術(shù)存在一些瓶頸問題。現(xiàn)如今的技術(shù)只能對簡單的圖像進行識別處理,效果還比較好 ;然而當圖像一旦變得復(fù)雜,數(shù)據(jù)信息多的時候,計算量以及計算時間都會變大,識別率也會下降 [13]。圖像識別技術(shù)如圖 3 所示。
技術(shù)受限主要是由于以下幾方面的原因。我國的計算機軟硬件設(shè)備技術(shù)相對比較落后,當識別復(fù)雜的圖像時,任務(wù)量較大,計算機運行處理速度跟不上,無法及時地識別處理圖像,降低了識別精度和效率 [14]。同時也會造成我國的研究成果少于國外具有發(fā)達水平計算機軟硬件國家的研究成果。我國智能識別的圖像大多還是二維圖像,并且有時圖像的質(zhì)量不是很高,模糊或是有雜質(zhì),或受人為因素的任意性干擾限制,都會影響圖像的識別效率。
圖 3 識別技術(shù)
基于以上問題,大家還需要對其進行優(yōu)化提高,加大研究投入計算機軟硬件設(shè)備的開發(fā),多運用高性能的計算機來支撐識別處理圖像。并且將工作重心從二維圖像逐漸轉(zhuǎn)變?yōu)槿S圖像,未來甚至?xí)l(fā)展為多維 [15]。優(yōu)化完善識別技術(shù), 降低圖像質(zhì)量及環(huán)境噪聲對識別處理的影響,從而提升識別精度和分辨率。
4 應(yīng)用領(lǐng)域
如今圖像識別技術(shù)隨著高端先進的科學(xué)技術(shù)已經(jīng)漸漸深入到人們的生活中,應(yīng)用范圍領(lǐng)域廣泛,如交通領(lǐng)域、建筑工程領(lǐng)域、醫(yī)學(xué)領(lǐng)域、文學(xué)藝術(shù)領(lǐng)域、農(nóng)業(yè)領(lǐng)域等,被不斷推廣 [2],并且具有著較高的應(yīng)用價值與作用,靈活便捷智能的特點使其應(yīng)用普遍,十分有必要在各行業(yè)進行普及發(fā)展。
4.1 交通領(lǐng)域
要想富,先修路。隨著各城市經(jīng)濟的發(fā)展,城市交通設(shè)施也在不斷發(fā)展改變,道路四通八達,建設(shè)面積越來越大, 路況也越來越復(fù)雜,并且人們生活水平不斷提高,各家各戶都擁有了私家車,不論是節(jié)假日還是工作日都會駕車出行, 這就給道路交通帶來了不小的壓力。為了保證人們能高效地駕車出行,計算機圖像識別技術(shù)在交通設(shè)施領(lǐng)域方面就起到了很大的作用,它可以同時對路況信息和車輛信息進行檢測。各大城市都不斷地修道路,所以司機在駕駛時也會有很多道路不熟悉,無法準時準確地到達目的地。而圖像識別技術(shù)會為駕駛員提供實時可靠準確的路況信息,為駕駛員指引方向, 保障了道路、車輛以及駕駛員的雙重安全 [13]。圖像識別除了對道路檢測外還可以進行車輛檢測,通過車輛分割技術(shù)對車輛進行跟蹤與識別,檢測車速與車流量,判斷車輛是否有超速違規(guī)等現(xiàn)象,利于交通事故的處理,以及能有效地保障道路通暢運行。
4.2 醫(yī)學(xué)領(lǐng)域
身體是革命的本錢,擁有一個健康的身體才是無限財富的保證。如今人們對自己的健康問題越發(fā)重視了,我國醫(yī)療事業(yè)也飛速發(fā)展,醫(yī)療器械設(shè)備融入了計算機圖像識別技術(shù), 越來越智能化。醫(yī)生可以直接通過設(shè)備對病人進行拍片觀察診斷,針對性治療,清晰直觀,準確又高效。例如應(yīng)用于微創(chuàng)手術(shù)的手機導(dǎo)航技術(shù)、CT 技術(shù)、核磁共振以及 B 超、彩超等,醫(yī)生與患者可以通過圖像清晰直觀地看到病情狀況, 以此提出有針對性的治療方案,提高醫(yī)學(xué)技術(shù) [16]。
4.3 安防領(lǐng)域
天網(wǎng)恢恢,疏而不漏。人民安居樂業(yè)是保障國家繁榮昌盛的關(guān)鍵所在,如今科技的進步使得視頻監(jiān)控普及運用,能夠遍布各個角落,如天眼一般監(jiān)控著每個地方的一舉一動, 讓黑惡勢力無藏身之處,極大地保障了民生安全。安防設(shè)施的建設(shè)也日益嚴格,由傳統(tǒng)的人工視頻調(diào)查分析轉(zhuǎn)為智能化的計算機圖像識別技術(shù)分析,避免了人工可能引起的疏漏誤差,更加精準嚴格 [17]?,F(xiàn)在的視頻監(jiān)控分布廣雜,人工分析處理視頻信息不僅耗費大量的時間,還會耗費大量的人力物力,而且人為因素會造成很多信息的遺漏,速度慢、效率低 [18]。將視頻監(jiān)控自動化,通過計算機采集圖像,提取識別信息,將圖像中的信息數(shù)據(jù)一體化,精準度更高,大大降低了人工操作的工作量、工作時間,提高了效率。監(jiān)控視頻信息還可以作為事故鑒定的有效依據(jù)。
4.4 農(nóng)業(yè)領(lǐng)域
民以食為天。自古以來農(nóng)業(yè)在我國就有著舉足輕重的地位,糧食產(chǎn)量對經(jīng)濟有較大的影響,所以提高產(chǎn)量是我國農(nóng)業(yè)研究人員的研究關(guān)鍵。高科技不光應(yīng)用在人們的日常生活中,農(nóng)業(yè)領(lǐng)域也同樣引入了高科技,智慧農(nóng)業(yè)也不再是什么新鮮詞匯,智能化農(nóng)業(yè)引入計算機圖像識別技術(shù),可以實時觀測到植物的生長狀況,植物葉片的病蟲害研究,對植物進行實時全景監(jiān)控,還可以進行農(nóng)產(chǎn)品的質(zhì)檢。對研究植物表型, 影響植物生長因素以及研發(fā)植物新品種有科學(xué)指導(dǎo)意義 [19]。
4.5 文藝領(lǐng)域
圖像識別技術(shù)在文藝領(lǐng)域主要應(yīng)用于對圖像、聲音方面的識別處理,呈現(xiàn)出藝術(shù)性。通過智能化識別系統(tǒng)自動將無用信息過濾掉,保證信息的有效性,匹配性。還可以依據(jù)美學(xué)原理對圖像進行色彩調(diào)整,增強其藝術(shù)感,從而為人們呈現(xiàn)出更加美好的畫面,如日??吹降?3D 電影、3D 電視等所呈現(xiàn)出的震撼場景,超強的視覺效果給人們帶來一場場視覺盛宴 [19],讓人們身臨其境。
5 結(jié) 語
智能化的計算機圖像識別技術(shù)提取出圖像中有用有價值的信息給人們,以便更好地服務(wù)人們的生產(chǎn)、生活。其應(yīng)用價值非常廣泛,在提升人民經(jīng)濟發(fā)展的同時還能保障財產(chǎn)的安全,發(fā)展前景廣闊。然而還需要繼續(xù)研究提升識別精度, 不斷地創(chuàng)新完善技術(shù),使其更加多維化、智能化,為促進我國社會的智能化與可持續(xù)化發(fā)展做出貢獻。