當(dāng)前位置:首頁 > 汽車電子 > 汽車電子
[導(dǎo)讀]采用支持向量機(jī)方法實(shí)現(xiàn)車牌字符識(shí)別。根據(jù)車牌字符排列特征,構(gòu)造了漢字、數(shù)字、字母、數(shù)字+字母4個(gè)最佳分類器,通過車牌字符的序號對每個(gè)字符進(jìn)行對應(yīng)識(shí)別,再將識(shí)別結(jié)果組合得到車牌號碼。實(shí)驗(yàn)結(jié)果表明該方法具有較高的車牌字符整體識(shí)別率,達(dá)到了98.33%,識(shí)別時(shí)間僅為15ms,能夠滿足實(shí)際應(yīng)用。

1 引言
   
車牌識(shí)別是智能交通系統(tǒng)的一個(gè)重要研究課題,存在巨大的市場需求。車牌識(shí)別系統(tǒng)分車輛圖像的獲取、車牌的定位與字符分割、車牌字符識(shí)別3大部分。對于車牌字符識(shí)別,目前最常用的方法是基于模板匹配的方法和基于神經(jīng)網(wǎng)絡(luò)的方法兩大類。前者多利用了字符的輪廓、網(wǎng)格、投影等統(tǒng)計(jì)特征,相似字符區(qū)分能力差,且因特征數(shù)據(jù)維數(shù)過大會(huì)導(dǎo)致識(shí)別速度慢;而后者則存在網(wǎng)絡(luò)輸入數(shù)據(jù)的選擇和網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì)等問題。
    目前,普遍采用3類方法來提高字符的識(shí)別性能:第1類是尋找更好的分類識(shí)別算法;第2類是將幾種分類器結(jié)合起來,相互補(bǔ)充,根據(jù)不同方面的特征分類,如文獻(xiàn);第3類是抽取具有更強(qiáng)描述能力的特征,結(jié)合其它輔助特征來進(jìn)行分類,如文獻(xiàn)。
    本文采用支持向量機(jī)(SVM,support vector machine)的方法解決車牌字符識(shí)別問題,屬于第1類方法。SVM可以自動(dòng)尋找對分類有較好區(qū)分能力的支持向量,由此構(gòu)成的分類器可以最大化類間間隔,達(dá)到正確區(qū)分類別的目的;在解決有限樣本、非線性及高維模式識(shí)別問題中表現(xiàn)出了許多特有的優(yōu)越性能,且具有適應(yīng)性強(qiáng)和效率高的特點(diǎn)。

2 支持向量機(jī)簡介
    支持向量機(jī)(SVM)是Vapnik及其研究小組提出的針對二類別的分類問題而提出的一種分類技術(shù),是一種新的非常有發(fā)展前景的分類技術(shù)。支持向量機(jī)的基本思想是在樣本空間或特征空間,構(gòu)造出最優(yōu)超平面使超平面與不同類樣本集之間的距離最大,從而達(dá)到最大的泛化能力,其算法的詳細(xì)敘述可參考文獻(xiàn)。
    支持向量機(jī)方法根據(jù)Vapnik的結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則,盡量提高學(xué)習(xí)機(jī)的泛化能力,使有限少量訓(xùn)練樣本得到的決策規(guī)則對獨(dú)立的測試集仍能得到小的誤差。這樣只需有限的少量樣本參與訓(xùn)練,就可以保證訓(xùn)練產(chǎn)生的分類器具有很小的誤差。而車牌字符識(shí)別時(shí),相對于預(yù)測的樣本,只能有有限的少量樣本參與訓(xùn)練,支持向量機(jī)的方法可以使訓(xùn)練產(chǎn)生的分類器在識(shí)別車牌字符時(shí)只有小的誤差,并且大幅減少訓(xùn)練的時(shí)間。
    對于數(shù)據(jù)分類問題,通用的神經(jīng)網(wǎng)絡(luò)方法的機(jī)理可以簡單地描述為:系統(tǒng)隨機(jī)產(chǎn)生一個(gè)超平面并移動(dòng)它,直到訓(xùn)練集中屬于不同類別的點(diǎn)正好位于平面的不同側(cè)面。這種處理機(jī)制決定了神經(jīng)網(wǎng)絡(luò)方法最終獲得的分割平面并不是一個(gè)最優(yōu)超平面,只是一個(gè)局部的次優(yōu)超平面。而SVM將最優(yōu)超平面的求解問題轉(zhuǎn)換為一個(gè)不等式約束下的二次函數(shù)尋優(yōu)問題,這是一個(gè)凸二次優(yōu)化問題,存在唯一解,能保證找到的極值解就是全局最優(yōu)解。
    SVM通過一個(gè)非線性函數(shù)將輸入數(shù)據(jù)映射到具有高維甚至為無窮維的特征空間,并在這個(gè)高維特征空間進(jìn)行線性分類,構(gòu)造最優(yōu)分類超平面,但在求解最優(yōu)化問題和計(jì)算判別函數(shù)時(shí)并不需要顯式計(jì)算該非線性函數(shù),而只需計(jì)算核函數(shù),從而避免特征空間維數(shù)災(zāi)難問題。
    車牌字符識(shí)別問題中每個(gè)樣本為一個(gè)字符圖像,每個(gè)字符圖像由許多像素組成,具有高維的特點(diǎn)。SVM通過核函數(shù)的計(jì)算,避免了神經(jīng)網(wǎng)絡(luò)解決樣本空間的高維問題帶來的網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì)問題,使訓(xùn)練模型與輸入數(shù)據(jù)的維數(shù)無關(guān);并且每個(gè)字符的整幅圖像作為一個(gè)樣本輸入,不需要進(jìn)行特征提取,節(jié)省了識(shí)別時(shí)間。

3 車牌字符分類器的構(gòu)造
    我國標(biāo)準(zhǔn)車牌格式是:X1X2.X3X4X5X6X7,其中X1是各省、直轄市和自治區(qū)的簡稱,X2是英文字母,X3X4是英文字母或阿拉伯?dāng)?shù)字,X5X6X7是阿拉伯?dāng)?shù)字,并且對于不同的Xl,X2的取值范圍是不一樣的。X2和X3之間有一小圓點(diǎn)。
    針對車牌字符的排列特征,為了提高車牌整體的識(shí)別率,可以設(shè)計(jì)4個(gè)分類器來進(jìn)行車牌字符的識(shí)別,即漢字分類器、數(shù)字分類器、英文字母分類器、數(shù)字+字母分類器。根據(jù)車牌中字符的序號,選擇對應(yīng)的分類器進(jìn)行識(shí)別,然后將識(shí)別結(jié)果按字符序號進(jìn)行組合,就得到了整個(gè)車牌的識(shí)別結(jié)果。4個(gè)分類器如圖l所示。

    字符集中漢字有50多個(gè),其中31個(gè)為各省、直轄市和自治區(qū)的簡稱;英文字母全部為大寫字母,不含字母“I”,字母“o”歸為數(shù)字“0”,故英文字母集由24個(gè)大寫字母組成;數(shù)字為0~9的阿拉伯?dāng)?shù)字。
    支持向量機(jī)是針對二類別的分類而提出的,但車牌字符識(shí)別是多類別的分類問題,需要將二類別分類方法擴(kuò)展到多類別分類,本文采用了一一區(qū)分法實(shí)現(xiàn)。一一區(qū)分法(one—against—one method)是分別選取2個(gè)不同類別構(gòu)成一個(gè)SVM子分類器,這樣對于k類問題,共有k(k一1)/2個(gè)SVM子分類器。在構(gòu)造類別i和類別j的SVM子分類器時(shí),在樣本數(shù)據(jù)集中選取屬于類別i和類別j的樣本數(shù)據(jù)作為訓(xùn)練樣本數(shù)據(jù),并將屬于類別i的數(shù)據(jù)標(biāo)記為正,將屬于類別j的數(shù)據(jù)標(biāo)記為負(fù)。測試時(shí),將測試數(shù)據(jù)對k(k一1)/2個(gè)SVM子分類器分別進(jìn)行測試,并累計(jì)各類別的得分,選擇得分最高者所對應(yīng)的類別為測試數(shù)據(jù)的類別。

4 最佳參數(shù)模型的選擇
    本文從某一實(shí)際卡口系統(tǒng)采集到的768×576像素的汽車牌照圖片進(jìn)行車牌定位和字符分割后,將分割的每個(gè)車牌字符進(jìn)行二值化操作,字符筆劃對應(yīng)的像素置為l,背景像素置為0,再將每個(gè)字符歸一化到13x24像素,并根據(jù)每個(gè)字符在車牌中的位置,編上序號l~7。
    本文所選汽車牌照圖片共計(jì)132張,包括晚上、逆光、字符磨損厲害、牌照傾斜和牌照旁掛其它牌子等情況;有129張圖片可以實(shí)現(xiàn)車牌正確定位,車牌定位率為97.73%;120張圖片可以實(shí)現(xiàn)所有字符正確分割,字符分割完全正確率為93.02%。
    本文將每個(gè)字符作為一個(gè)樣本,每個(gè)樣本維數(shù)為312(13x24),根據(jù)其序號分成4類樣本。每類樣本分成兩部分,60%的樣本訓(xùn)練產(chǎn)生模型,另40%用于測試,核函數(shù)采用徑向基函數(shù)K(xi,x)=exp(-||x-xi||2/σ2),分別訓(xùn)練生成4類分類器,從中選擇最優(yōu)參數(shù)模型組成4類最佳分類器,用來進(jìn)行車牌字符的整體識(shí)別。
    為了求解最佳的分類器參數(shù)(C,σ2),本文選擇雙線性法來求解最佳參數(shù),對每類分類器模型采用以下步驟:
    第一步:根據(jù)識(shí)別正確率確定最佳參數(shù)C。首先假設(shè)C=10,取σ2=10-1,100,101,102,103,得到最高的識(shí)別正確率對應(yīng)的σ2,然后固定σ2,改變C的值,得到這時(shí)最高的識(shí)別正確率對應(yīng)的C值,作為最佳參數(shù)C。
    4類分類器的最高識(shí)別正確率對應(yīng)的(C,σ2)都為(10,100),確定最佳C=10。
    第二步:確定最佳參數(shù)(C,σ2)。固定最佳參數(shù)C,取σ2=l,10,100,200,300,400,500,600,700,800,900,1000,取最高識(shí)別正確率對應(yīng)的(C,σ2)為分類器模型的最佳參數(shù)。
    觀察發(fā)現(xiàn),4類分類器模型在σ2的值變?yōu)?00以下時(shí),對應(yīng)的識(shí)別正確率都逐漸減??;σ2的值變?yōu)?00以上時(shí),對應(yīng)的識(shí)別正確率先增大后減小,出現(xiàn)“峰值”,取“峰值”對應(yīng)的模型參數(shù)為最佳參數(shù)。4類最佳分類器如下表1所示。

    實(shí)驗(yàn)觀察分析,分類器識(shí)別時(shí)具有一定的偏向性,即參與訓(xùn)練的某類樣本數(shù)目多,預(yù)測樣本識(shí)別為該類的概率就大,如訓(xùn)練樣本中“浙”字較多,漢字分類器將預(yù)測樣本識(shí)別為“浙”的可能性較大,而實(shí)際上預(yù)測樣本中“浙”字?jǐn)?shù)目較多,這樣無形中就提高了識(shí)別正確率。

5 實(shí)驗(yàn)及結(jié)果
    本文用以上4類最佳分類器的組合分類器對所有車牌字符進(jìn)行整體識(shí)別,識(shí)別結(jié)果如表2所示。
    在實(shí)際運(yùn)用中,車牌字符正確數(shù)目在5個(gè)以上就能滿足要求,本文與相關(guān)文獻(xiàn)的車牌字符識(shí)別結(jié)果如表3所示。

    觀察分析發(fā)現(xiàn),影響識(shí)別效果的主要原因是相似字符的誤識(shí),如字符“D”和“0”、“B”和“8”等;還有漢字筆劃多,二值化操作易造成筆劃模糊,使?jié)h字誤識(shí)。

6 結(jié)論
    本文將SVM的方法引入車牌字符識(shí)別中,在詳細(xì)分析了車牌字符的排列特征的基礎(chǔ)上,構(gòu)造了用4個(gè)不同類別的SVM字符分類器;根據(jù)車牌字符的序號分別對應(yīng)識(shí)別,再將識(shí)別結(jié)果組合,就得到了整幅車牌的號碼。
    SVM方法采用核函數(shù)解決了高維樣本識(shí)別問題,不需要進(jìn)行模型網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì),并且不需進(jìn)行特征提取,只需要有限的樣本參入訓(xùn)練,節(jié)省了識(shí)別時(shí)間,這些都非常符合車牌字符識(shí)別的要求。本文采用一一區(qū)分法將SVM方法從二類別識(shí)別擴(kuò)展到了多類別識(shí)別,并取得了滿意的識(shí)別效果;但一一區(qū)分法需要保證訓(xùn)練樣本的充分性,需要所有類別的樣本都參加訓(xùn)練。
    試驗(yàn)結(jié)果表明,本方法有較好的實(shí)用性,而進(jìn)一步減少相似字符和漢字誤識(shí)是本工作以后努力的方向,其關(guān)鍵是加強(qiáng)圖像的預(yù)處理,改進(jìn)字符分割方法和二值化方法,使字符筆劃更清楚。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運(yùn)營商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡稱"軟通動(dòng)力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉