當(dāng)前位置:首頁 > 工業(yè)控制 > 工業(yè)控制
[導(dǎo)讀]設(shè)計了一種閱卷系統(tǒng),允許使用者使用任何顏色的圓珠筆、鋼筆或鉛筆在一般紙張的固定位置上涂寫如“√”、“╳”、“○”等手寫符號完成答題,由閱卷系統(tǒng)采用圖像識別技術(shù)對答題卡圖像進(jìn)行預(yù)處理、符號識別、統(tǒng)計判分,實現(xiàn)閱卷自動化。實驗表明,由于結(jié)構(gòu)方面的相似性,本閱卷系統(tǒng)識別錯誤集中在符號“√”、“╳”上,而對符號“○”的識別基本無誤。

高校學(xué)生的期末考試是普通高等學(xué)校管理的一項重要工作,它是根據(jù)國家對高等學(xué)校學(xué)生德智體全面發(fā)展的要求,按照統(tǒng)一的原則、方法和程序,對學(xué)生學(xué)習(xí)和行為的表現(xiàn)進(jìn)行階段和全程的質(zhì)量考核、記載、評價和處理。目前客觀題型較多的英語考試或計算機(jī)基礎(chǔ)考試均實現(xiàn)了閱卷自動化,無需教師干預(yù),既能加快試卷反饋的速度,又能保證公平公正。傳統(tǒng)的閱卷系統(tǒng)利用光學(xué)標(biāo)記閱讀機(jī)的光電變換原理,對填涂在答題卡上的內(nèi)容進(jìn)行高速采集,然后進(jìn)入計算機(jī)處理[1]。但是它對答題卡紙張和印刷質(zhì)量要求太高,如套印誤差和剪切誤差必須分別控制在0.1 mm和0.2 mm以內(nèi);對使用者涂寫要求太高,限制太多,如需要用專用鉛筆涂滿長方條,不得涂出長方條外,整張答題卡涂寫要深淺一致等;機(jī)械傳動機(jī)構(gòu)復(fù)雜、使用壽命短、維護(hù)量大、設(shè)備一致性差[2]。
 本文提出一種基于圖像識別的閱卷系統(tǒng),允許使用者使用任何顏色的圓珠筆、鋼筆或鉛筆在一般紙張的固定位置上涂寫如“√”、“╳”、“○”等手寫符號完成答題,由閱卷系統(tǒng)采用圖像識別技術(shù)自動識別答題卡信息,實現(xiàn)閱卷自動化。本系統(tǒng)與傳統(tǒng)的光學(xué)標(biāo)記閱讀機(jī)閱卷系統(tǒng)的不同之處在于,本閱卷系統(tǒng)對答題卡紙張和填涂符號均無特殊要求,無需特制答題卡,無特殊涂寫要求[3]。
1 系統(tǒng)實現(xiàn)流程及模塊組成
 (1)設(shè)計和定義答題卡,將允許用戶填寫的手寫符號限定在一定的矩形區(qū)域內(nèi);
   (2)通過CCD采像設(shè)備采集答題卡圖像,經(jīng)掃描、采樣、量化等過程,同時將答題卡圖像以JPG格式保存在主機(jī)內(nèi)存和硬盤里;
 (3)對答題卡圖像進(jìn)行預(yù)處理,包括粘連字符分割、灰度變換、二值化、圖像偏斜糾正、平滑和細(xì)化等過程,以將答題卡固有的紙張問題、書寫不規(guī)范、答題卡傳動機(jī)械定位精度所帶來的干擾因素排除掉,并為后續(xù)的識別工作做好準(zhǔn)備[4];
 (4)對答題卡信息進(jìn)行識別。通過圖像分析抽取圖像,并經(jīng)過綜合特征提取,結(jié)合答題卡表格的邏輯結(jié)構(gòu)和幾何結(jié)構(gòu),準(zhǔn)確識別填涂在矩形塊位置上的“√”、“╳”、“○”等手寫符號得到答題信息。答題卡識別算法的優(yōu)劣決定了整個系統(tǒng)的性能(如識別的精度、可靠性等),是整個軟件系統(tǒng)中最重要的部分;
 (5)對識別的答題信息進(jìn)行加工、整理、分析和統(tǒng)計,結(jié)合軟件的設(shè)置對答題卡信息進(jìn)行判分。
 綜上所述,系統(tǒng)實現(xiàn)流程如圖1所示。

 為了便于學(xué)生和教師查詢和分析閱卷結(jié)果,本閱卷系統(tǒng)還設(shè)置了用戶登錄模塊、學(xué)生信息管理模塊、課程基本信息管理模塊、試卷分析模塊、成績查詢模塊、答題卡圖像查詢模塊、報表打印模塊和補(bǔ)考管理模塊。其中試卷分析模塊對試卷的各項數(shù)據(jù)進(jìn)行分析和統(tǒng)計,包括最高分、最低分、平均數(shù)、及格率方差、標(biāo)準(zhǔn)差等,完成試卷分析功能;答題卡圖像查詢模塊允許學(xué)生通過姓名查詢存儲在硬盤中的答題卡圖片;補(bǔ)考管理模塊統(tǒng)計不及格、缺考或舞弊學(xué)生信息,生成補(bǔ)考表;報表打印模塊完成答題卡圖片、成績報告單、試卷分析報告和補(bǔ)考表等的打印功能。系統(tǒng)模塊組成如圖2所示。

2 系統(tǒng)主要實現(xiàn)技術(shù)
2.1答題卡設(shè)計

 答題卡設(shè)計成表格的形式,由試卷答題卡基本信息、考生基本信息、答題卡填寫說明及題目選項列表組成,考生用“√”、“╳”、“○”等手寫符號在相應(yīng)的矩形框中選擇答案。答題卡示例如圖3所示。

 答題卡版面與普通表格一樣具有幾何結(jié)構(gòu)和邏輯結(jié)構(gòu),幾何結(jié)構(gòu)反映了所填寫的信息區(qū)域的位置和大小,邏輯結(jié)構(gòu)則表示答題卡中所填寫信息的實際意義以及填寫信息與填寫項之間的對應(yīng)關(guān)系。
 在傳統(tǒng)的光學(xué)標(biāo)記閱讀機(jī)閱卷系統(tǒng)中,答題卡的幾何結(jié)構(gòu)大部分都是采用定位標(biāo)記塊進(jìn)行描述,這種描述方法具有很多缺點,如浪費(fèi)版面空間、缺乏靈活性、版面設(shè)計比較復(fù)雜、對印刷質(zhì)量要求高、不便于修改等,而且定位標(biāo)記塊看起來也不美觀。在本系統(tǒng)答題卡版面中,填寫信息在幾何結(jié)構(gòu)上可以看成由若干個互不相交的矩形塊組成,它們組成了答題卡版面的最小單位[5],可以以答題卡的邊框線建立二維坐標(biāo)系,以矩形的對角頂點坐標(biāo)來描述矩形塊的位置和大小,完成對答題卡的幾何結(jié)構(gòu)描述,該方法簡潔、靈活,便于識別。
  答題卡的邏輯結(jié)構(gòu)描述是定義矩形塊的屬性。矩形塊的屬性包括對填寫項以“√”、“╳”、“○”表示的選擇或者不選擇。
  本系統(tǒng)采用文檔結(jié)構(gòu)描述語言同時對幾何結(jié)構(gòu)和邏輯結(jié)構(gòu)進(jìn)行描述。設(shè)一張答題卡包含n個填寫有信息的矩形塊B1,B2,...,Bn, 矩形塊之間存在著上下結(jié)構(gòu)和左右結(jié)構(gòu)的幾何位置關(guān)系,其邏輯順序一般是從上到下、從左到右,在描述文檔結(jié)構(gòu)時也采用這種順序,則文檔結(jié)構(gòu)描述語言DDL 表示如下:

其中i 是答題卡的序號;n是矩形塊的總數(shù);xi為矩形塊在水平方向的位置;yi為矩形塊在垂直方向的位置;li為矩形塊的長度;wi為矩形塊的寬度;attri表示矩形塊的屬性,當(dāng)attri為0時,表示該矩形塊的填寫內(nèi)容為待識別的字符,attri為1時,矩形塊作為圖像保存。
 將答題卡設(shè)計成常見的表格形式,一方面它和一般考試用到的答題卡的形式類似,符合人們的使用習(xí)慣和書寫習(xí)慣;另一方面可以利用文檔描述語言對它的幾何結(jié)構(gòu)和邏輯結(jié)構(gòu)進(jìn)行描述,以便更好地對矩形框內(nèi)的字符特征進(jìn)行提取與識別,辨別矩形框中的字符,與標(biāo)準(zhǔn)答案比對,對考生客觀題進(jìn)行判分。
2.2 答題卡信息識別
 本系統(tǒng)采用漢字識別方法中的統(tǒng)計決策方法對手寫字符進(jìn)行識別,如圖4所示,首先提取字符特征,對字符進(jìn)行分類判別,經(jīng)過訓(xùn)練和識別兩個階段,最后識別出字符[6]。訓(xùn)練階段,收集日常人們習(xí)慣的手寫符號為樣本,經(jīng)過篩選分類建立樣本庫,以便對待識別字符進(jìn)行分類和識別。識別階段,將待識別符號的特征與訓(xùn)練階段中所建立的標(biāo)準(zhǔn)樣本特征比較,計算最大相似度以判別該手寫符號所屬的類別[7]。

2.2.1 字符特征提取
 學(xué)生在答題過程中由于緊張和個人原因,寫出的√、╳、○等答題符號往往千變?nèi)f化。為準(zhǔn)確識別這些手寫符號,需要進(jìn)行字符結(jié)構(gòu)特征提取,將最能體現(xiàn)這個字符特點和字符間差異的結(jié)構(gòu)特征提取出來。本系統(tǒng)提取的特征是以下特征的組合。
 (1)點特征
 點特征是一種重要的結(jié)構(gòu)特征,是指字符筆畫中的端點。端點反映了字符中筆畫的起點和終點信息,與該點相連的點數(shù)為 1。
 (2)筆畫密度特征
 筆畫密度特征是取得符號水平方向筆畫密度函數(shù)d(x)和垂直方向的筆畫密度函數(shù)d(y),然后進(jìn)行相同項合并[1]。如圖5所示,符號“○”水平方向筆劃密度函數(shù)d(x)和垂直方向的筆劃密度函數(shù)d(y)分別是: d(x)=(1,...,1,2,...,2,1,...,1),d(y)=(1,...,1,2,...,2,1,...,1),則合并后筆畫密度可表示為d(x)=d(y)=(1,2,1)。

    (3)基于鏈碼方法的結(jié)構(gòu)特征
 從曲線起點開始與其相連的像素點有8種可能的方向:k×45°(k=0,1,…,7),如圖6所示, 如果兩個像素點間的連線方向為k×45°,就用“k”作為這條連線的代碼,則一條曲線最終可近似地用下式表示:
    An=a1a2…an,ai∈{0,1,2,…,7}, i=1,2,…,n

    (4)孔洞特征
 在二值圖像中,被目標(biāo)像素1包圍的背景像素0(的集合)稱為孔洞(hole)。在字符的骨架線的鏈碼形成過程中,若搜索到的下一點就是該骨架線的搜索起始點,同時己形成的骨架鏈碼碼長超過了一定的閾值,則認(rèn)為搜索到一個孔洞[5]。
 (5)橫豎方向交叉特征
 橫向或縱向掃描字符,某一行或列的像素由白變黑的次數(shù)就是該行或列的橫或縱向交叉特征。本系統(tǒng)將橫豎兩個方向距離不等的7條線作用于字符,計算水平和垂直方向與字符的交叉數(shù),如圖7所示。

2.2.2 符號模型庫建立
 答題卡信息識別的訓(xùn)練階段需要建立符號模型庫,以便對待識別手寫符號進(jìn)行分類和識別。符號模型庫建立的好壞直接影響分類器的應(yīng)用,從而影響手寫符號識別效果[5]。
 由于手寫符號的多樣性,需要選擇某一類手寫符號中具有代表性的多個樣本來構(gòu)造標(biāo)準(zhǔn)樣本,本系統(tǒng)采用手寫字符樣本特征向量的均值來描述類目標(biāo)。設(shè)有n個符號類,每個符號類中有a個訓(xùn)練樣本,每個樣本有b個符號特征,每個符號類中樣本的特征記為fkj,k為樣本特征序號,j為各個手寫符號的樣本序號,則第i個目標(biāo)類特征的均值為P(i),即:

 每次計算Pik時,k為大于等于1小于等于b的固定值。Pik為對于第i個目標(biāo)類中a個樣本中各個樣本對應(yīng)第k個特征值的均值。
2.2.3 手寫符號識別
 對答題卡中矩形框信息識別包括兩個方面,一是識別矩形框中是否有字符,二是識別具體是哪種字符。其中識別是否書寫了字符比較簡單,只要比較增強(qiáng)對比度后的矩形框圖像與已知填有信息的矩形框的均方差大小,即可識別是否有字符,因為空白的矩形框和被書寫的矩形框均方差差別很大。下面主要介紹怎樣識別矩形框中的具體字符。
 手寫符號識別就是在提取到符號的特征向量之后,依據(jù)一定的判別函數(shù)來判定出某一圖形點陣具體代表的是哪一個手寫符號。
 判別函數(shù)可以先簡單地作如下定義:考慮有P1,P2,...,Pm個符號類別,假使每類有一個標(biāo)準(zhǔn)樣本,則共有m個標(biāo)準(zhǔn)樣本,分別表示為k1,k2,...,km。任意一符號特征向量X和第i個(i=1,2,...,m)標(biāo)準(zhǔn)樣本間的“相似度”為Ri。計算待識別的符號特征向量X與每類標(biāo)準(zhǔn)樣本之間的“相似度”[7],并將X分到與它“相似度”最大的類別,即對所有的j不等于i,若Di>Dj,則X就屬于Pi類符號。
 系統(tǒng)采用基于最鄰近域分類器的模板匹配算法來對手寫符號進(jìn)行識別。
 首先定義字符特征向量,經(jīng)過前面的特征提取分析,該特征向量為一個16維向量,X={x1,x2,..,x16},具體定義為:
 x1:孔洞數(shù);
 x2:端點數(shù);
 x3~x9:7條水平線與字符的交叉次數(shù);
 x10~x16:7條豎直線與字符的交叉次數(shù)。
 通過度量待識別字符和樣本庫中樣本字符的接近程度,確立最近分類的一個準(zhǔn)則。在最鄰近分類中,經(jīng)常使用的是相似度。如圖8所示,在提取了待識字符的特征向量并建立了字符庫后,將待識別字符和樣本庫中第i個樣本的特征向量之間求近似度R(X,G)。R(X,G)定義如下:

式中,xi為待識別符號特征向量的第i個分量,gik為樣本庫中第i個標(biāo)準(zhǔn)樣本的第k個分量,m為樣本類別數(shù)。分子為向量X,G之間的內(nèi)積,分母分別為向量X、G的模。α是向量X,G在m維空間的夾角。顯然,當(dāng)X、G兩個向量完全相同時,其夾角為0,R(X,G)=1,它們的距離D(X,G)=0,即相似度最大。求出最大Rr(X,G),若Rr(X,G)≥給定閾值,即可找到與待識別字符最接近的樣本類別,否則人工干預(yù)并修改樣本庫[7]。
3 實驗結(jié)果與分析
 實驗采用CCD攝像頭采集答題卡圖像,經(jīng)圖像預(yù)處理、若干特征提取、信息識別等過程,判定矩形框中有無字符、是什么字符,最后對答題卡信息分析和統(tǒng)計。實驗采用100份試卷作為樣本,對20份試卷進(jìn)行測試,結(jié)果發(fā)現(xiàn)識別錯誤的手寫符號主要是“√”和“╳”,原因在于這兩者在結(jié)構(gòu)方面相似,而符號“○”的識別率達(dá)到100%。
 本系統(tǒng)將圖像預(yù)處理、字符特征提取與圖像識別等技術(shù)應(yīng)用于閱卷系統(tǒng)的開發(fā),實現(xiàn)了閱卷自動化,加快了成績考核的速度,改善了教學(xué)管理環(huán)境。相比于傳統(tǒng)的基于光學(xué)標(biāo)記閱讀機(jī)的閱卷系統(tǒng),本系統(tǒng)利用圖像識別技術(shù)實現(xiàn)閱卷自動化,不需要特殊的答題卡,考生也可以隨意使用各種“√”、“╳”、“○”等手寫符號進(jìn)行答題,不必用指定的2B鉛筆填涂矩形塊,更符合人們的習(xí)慣。
參考文獻(xiàn)
[1] 王虎.基于圖像識別的標(biāo)記閱讀機(jī)及選舉計票系統(tǒng)研究[D].合肥:安徽大學(xué),2006.
[2] 張婷.基于圖像識別技術(shù)的光學(xué)標(biāo)記閱讀機(jī)的研究與應(yīng)用[D].合肥:安徽大學(xué),2007.
[3] 吳元君,張婷,雷驚鵬.一種改進(jìn)的OMR 技術(shù)在標(biāo)準(zhǔn)化考試中的應(yīng)用[J].計算機(jī)教育,2007(13):250-272.
[4] 丁慧東.脫機(jī)手寫體漢字識別研究[D].長春:東北師范大學(xué),2006.
[5] 龐東虎,金偉杰.英文字符特征提取系統(tǒng)[J].計算機(jī)仿真,2007,24(12):208-210.
[6] 楊玲,毛以芳,吳天愛.基于多特征多分類器的脫機(jī)手寫漢字識別研究[J].計算機(jī)與網(wǎng)絡(luò),2008(01):217-217.
[7] 覃勝,劉曉明.基于圖像的OMR技術(shù)的實現(xiàn)[J].電子技術(shù)應(yīng)用,2003,29(10):17-19.
[8] 翁功平.光標(biāo)閱讀機(jī)OMR原理的設(shè)計與實現(xiàn)[J].工業(yè)控制計算機(jī),2010,23(04):61-62.

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫?dú)角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認(rèn)證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務(wù)能7×24不間斷運(yùn)行,同時企業(yè)卻面臨越來越多業(yè)務(wù)中斷的風(fēng)險,如企業(yè)系統(tǒng)復(fù)雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務(wù)連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導(dǎo)體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務(wù)董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機(jī) 衛(wèi)星通信

要點: 有效應(yīng)對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務(wù)引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強(qiáng)核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運(yùn)營商 數(shù)字經(jīng)濟(jì)

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學(xué)會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團(tuán))股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉