當(dāng)前位置:首頁 > 嵌入式 > 嵌入式教程
[導(dǎo)讀]基于ARM和Linux的字符采集與識(shí)別系統(tǒng)

傳統(tǒng)紙質(zhì)讀物的數(shù)字化以及諸如條碼識(shí)別等字符識(shí)別系統(tǒng)都離不開圖像的讀入與識(shí)別,然而目前廣泛使用的字符識(shí)別設(shè)備將這兩部分獨(dú)立開,即由圖像讀入設(shè)備(如掃描儀)和安裝于計(jì)算機(jī)上的識(shí)別軟件構(gòu)成,但這樣的設(shè)備構(gòu)成離不開安裝識(shí)別軟件的計(jì)算機(jī),造成成本上升和使用不便。隨著電子產(chǎn)品的普及,具有攝像功能的電子產(chǎn)品及其上的識(shí)別軟件也可以構(gòu)成一個(gè)字符識(shí)別系統(tǒng),但是這種識(shí)別系統(tǒng)的識(shí)別速度受到攝像頭調(diào)焦的限制,難以廣泛應(yīng)用。文中提出的便攜式字符采集和識(shí)別系統(tǒng),其硬件平臺(tái)是基于接觸式圖像傳感器(CIS)與ARM9處理器S3C2410,軟件平臺(tái)是基于嵌入式Linux系統(tǒng),可以克服以上兩種設(shè)備的缺點(diǎn),同時(shí)滿足方便性和快速性的要求。另一方面,由于設(shè)備基于Li-nux操作系統(tǒng),使得識(shí)別軟件的開發(fā)和擴(kuò)展可以脫離硬件,大大提高識(shí)別系統(tǒng)的通用性。

1 圖像采集模塊
   
字符識(shí)別系統(tǒng)主要由圖像采集模塊和圖像處理模塊組成,其中圖像采集模塊是整個(gè)系統(tǒng)的硬件核心,圖像采集的質(zhì)量直接影響系統(tǒng)的整體性能。線陣CIS每次掃描得到一行像素值,配合運(yùn)動(dòng)平臺(tái)的縱向運(yùn)動(dòng)可以完成一幅二維圖像的掃描。為保證圖像采集的質(zhì)量,必須精確控制運(yùn)動(dòng)平臺(tái)與CIS之間的工作匹配,本系統(tǒng)以CPLD作為圖像采集模塊的控制核心,CIS傳感器、步進(jìn)電機(jī)、ADC以及高速緩存FIFO在CPLD的控制協(xié)調(diào)下完成一幅圖像的采集、模數(shù)轉(zhuǎn)換和數(shù)據(jù)緩存。系統(tǒng)總體結(jié)構(gòu)框圖如圖1所示。


1.1 硬件平臺(tái)
    (1)ARM處理器
    采用三星公司的ARM9系列S3C2410A作為處理器,工作頻率可達(dá)203 MHz,片上資源豐富,可以滿足實(shí)時(shí)性要求,為圖像處理提供運(yùn)行平臺(tái)并配合CPLD完成圖像采集模塊的邏輯和讀寫控制。
    (2)圖像傳感器及運(yùn)動(dòng)平臺(tái)
    接觸式圖像傳感器(CIS)具有體積小、重量輕、功耗低、結(jié)構(gòu)緊湊、連接方便以及無阱深等優(yōu)點(diǎn),在掃描儀等領(lǐng)域被廣泛應(yīng)用。本系統(tǒng)采用SV643C10型CIS,其物理分辨率600 dpi(23.6 dot/mm),有效掃描寬度29.2 mm,共688個(gè)傳感器像素單元,其像素輸出頻率為5 MHz。
運(yùn)動(dòng)平臺(tái)由步進(jìn)電機(jī)和光電傳感器等組成,光電傳感器實(shí)現(xiàn)對(duì)進(jìn)紙的檢測(cè),啟動(dòng)掃描。步進(jìn)電機(jī)控制掃描件換行,配合CIS完成圖像的采集。
    (3)信號(hào)調(diào)理電路
    信號(hào)調(diào)理電路完成對(duì)CIS輸出模擬信號(hào)的差分、放大等,實(shí)現(xiàn)降噪和電壓匹配的作用。
    (4)高速A/D轉(zhuǎn)換器
    由于CIS的像素輸出頻率高于處理器內(nèi)部的A/D轉(zhuǎn)換器,所以本系統(tǒng)采用高速的外部ADC器件TLC5540,其最大采樣率40 MB·s-1,擁有8位分辨率。
    (5)數(shù)據(jù)緩存
    為了實(shí)現(xiàn)ADC和ARM的速度匹配,提高系統(tǒng)工作效率,在ADC與ARM處理器之間加一個(gè)FIFO存儲(chǔ)器作為高速數(shù)據(jù)緩存,選用Averlogic公司的1 MB×8 bit的AL4V8M440。
    (6)CPLD模塊
    實(shí)現(xiàn)圖像采集模塊的邏輯控制。為CIS傳感器提供的時(shí)鐘信號(hào)CP和行轉(zhuǎn)移信號(hào)SP。為ADC提供采集時(shí)鐘,為FIFO提供讀寫控制和寫時(shí)鐘等。本文的CPLD器件采用Ahera公司的EPM7128SLC84-15。
    (7)存儲(chǔ)器
    本系統(tǒng)采用三星公司的64 MB NAND Flash存儲(chǔ)器K9F1208作為程序和數(shù)據(jù)的存儲(chǔ)單元,采用兩片16位的HY57V561620CT-H(總?cè)萘?4 MB)SDRAM作為系統(tǒng)內(nèi)存,同時(shí)作為DMA方式讀取緩存數(shù)據(jù)的目的存儲(chǔ)器。其中Flash存儲(chǔ)器存儲(chǔ)空間分配情況如圖2所示。

[!--empirenews.page--]


1.2 軟件設(shè)計(jì)
   
圖像采集模塊的程序設(shè)計(jì)主要任務(wù)是實(shí)現(xiàn)該模塊各元器件的協(xié)調(diào)工作以及實(shí)現(xiàn)對(duì)圖像數(shù)據(jù)的讀取。主要分為3部分內(nèi)容。
    (1)CPLD上的邏輯設(shè)計(jì)。采用VHDL語言編寫,該程序?qū)⑼獠烤д竦?0 MHz輸入進(jìn)行分頻,為CIS、ADC、FIFO等提供時(shí)鐘和控制信號(hào),并為步進(jìn)電機(jī)提供工作時(shí)序。
    (2)嵌入式Linux系統(tǒng)的裁剪、配置和移植。本系統(tǒng)采用2.6內(nèi)核,宿主機(jī)環(huán)境為Ubuntu8.04。


    (3)Linux驅(qū)動(dòng)程序的編寫。由于采集模塊對(duì)于Linux系統(tǒng)來說可看作為一個(gè)設(shè)備,因此該部分程序應(yīng)作為嵌入式Linux設(shè)備驅(qū)動(dòng)程序來編寫,該驅(qū)動(dòng)程序通過CPLD間接實(shí)現(xiàn)采集模塊的邏輯控制和圖像數(shù)據(jù)的讀取,為應(yīng)用程序的開發(fā)提供底層硬件的接口。從FIFO緩存讀取圖像數(shù)據(jù)采用DMA方式,DMA的目的存儲(chǔ)器為ARM系統(tǒng)的SDRAM。
     圖像采集模塊工作流程圖和圖像采集效果分別如圖4和圖5所示。

             

[!--empirenews.page--]

2 圖像識(shí)別模塊
   
本文的目的是構(gòu)建一個(gè)通用的字符識(shí)別系統(tǒng),圖像采集模塊實(shí)現(xiàn)了對(duì)掃描件圖像數(shù)據(jù)的獲取。由于系統(tǒng)基于嵌入式Linux,使得后續(xù)的圖像處理與字符識(shí)別軟件設(shè)計(jì)可以脫離硬件系統(tǒng)獨(dú)立進(jìn)行,具有較高的通用性,可以根據(jù)實(shí)際應(yīng)用場(chǎng)合開發(fā)和擴(kuò)展不同的識(shí)別軟件,本文僅探討手寫體數(shù)字識(shí)別的應(yīng)用。
    識(shí)別算法:
    線性判別分析(Linearity Distinction Analysis,LDA)是有效的特征抽取方法之一,廣泛用于人臉識(shí)別和字符識(shí)別等領(lǐng)域。其基本思想是選擇使Fisher準(zhǔn)則函數(shù)達(dá)到極值的一組矢量作為最佳投影方向,樣本在該矢量集上投影后,達(dá)到最大的類間離散度和最小的類內(nèi)離散度。為找到投影軸,應(yīng)最大化類間離散矩陣Sb和類內(nèi)離散矩陣Sw的比值
   
    其中,c表示為模式的類別數(shù);μj表示為第j類的均值(其概率為Pj);μ0為全部樣本均值;*****為第j類模式i的h維向量;n是第j類的樣本數(shù);N是所有樣本數(shù)。μj和μ0定義為
   
    最優(yōu)化問題可以通過Sb和Sw的特征值的求解而獲得。如果在樣本離散矩陣中非目標(biāo)樣本占有比重較大,LDA并不能保證找到最優(yōu)子空間。LDA的最優(yōu)分類標(biāo)準(zhǔn)并不一定對(duì)分類準(zhǔn)確性最優(yōu),有可能使得已經(jīng)分開的鄰近類引起不必要的重迭。本文采用一種新的加權(quán)LDA方法(ILDA),其計(jì)算方法如下
   
    顯然,如果σ(△)是個(gè)常數(shù),在投影方向上,分別等同Sb和Sw。如果每一類的σ(△)是不同的,這將對(duì)臨近類的重迭樣本的分類產(chǎn)生影響??梢钥闯觯绻鱥j較大,則σ(△)較小。
    實(shí)驗(yàn)樣本取自手寫體通用數(shù)據(jù)庫UCI,在Bhattacharyya距離(BD)分類器下對(duì)加權(quán)線性判別分析與相應(yīng)的算法進(jìn)行實(shí)驗(yàn)比較和分析,取得較好的識(shí)別性能,證實(shí)了該方法提取的特征的有效性。

3 結(jié)束語
   
本文采用嵌入式Linux和ARM處理器軟硬件平臺(tái),利用CIS傳感器配合運(yùn)動(dòng)平臺(tái)實(shí)現(xiàn)了圖像的采集和存儲(chǔ),為嵌入式字符識(shí)別系統(tǒng)構(gòu)建了一個(gè)圖像采集平臺(tái)。在字符識(shí)別的應(yīng)用方面,探討了廣泛應(yīng)用的手寫數(shù)字識(shí)別算法,在已有的線性判別分析算法基礎(chǔ)上,提出了一種改進(jìn)的加權(quán)線性判別分析算法,并對(duì)該算法進(jìn)行了實(shí)驗(yàn)驗(yàn)證,獲得了較好的識(shí)別率。

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時(shí)1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動(dòng) BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時(shí)企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險(xiǎn),如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報(bào)道,騰訊和網(wǎng)易近期正在縮減他們對(duì)日本游戲市場(chǎng)的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會(huì)上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點(diǎn): 有效應(yīng)對(duì)環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實(shí)提質(zhì)增效舉措,毛利潤率延續(xù)升勢(shì) 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競(jìng)爭力 堅(jiān)持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競(jìng)爭優(yōu)勢(shì)...

關(guān)鍵字: 通信 BSP 電信運(yùn)營商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺(tái)與中國電影電視技術(shù)學(xué)會(huì)聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會(huì)上宣布正式成立。 活動(dòng)現(xiàn)場(chǎng) NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會(huì)上,軟通動(dòng)力信息技術(shù)(集團(tuán))股份有限公司(以下簡稱"軟通動(dòng)力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉