要曙麗,王少榮,2,蓋 孟,王 震
一種答題卡客觀題識別算法
要曙麗1,王少榮1,2,蓋 孟2,3,王 震4
(1. 北京林業(yè)大學(xué)信息學(xué)院,北京 100083;2. 北京市虛擬仿真與可視化工程技術(shù)研究中心,北京 100871;3. 北京大學(xué)信息科學(xué)技術(shù)學(xué)院,北京 100871;4. 沈陽理工大學(xué)藝術(shù)設(shè)計(jì)學(xué)院,遼寧 沈陽 110159)
在保證閱卷質(zhì)量的前提下,網(wǎng)上閱卷系統(tǒng)不僅極大地減少了教師的工作量,而且降低了對試卷紙張質(zhì)量的要求,節(jié)約能源。但是,網(wǎng)上閱卷系統(tǒng)中的客觀題識別效果對答題卡圖像質(zhì)量和排版有很強(qiáng)的依賴。為此,提出一種魯棒的客觀題識別算法。首先,考慮到用戶填涂時可能偏離填涂區(qū)域,或者用戶圖像和模板圖像位置匹配出現(xiàn)的誤差,提出了滑動窗口策略重新定位實(shí)際的填涂區(qū)域,消除相關(guān)的偏差。然后,通過分析各選項(xiàng)的直方圖,并引入加權(quán)平均灰度消除單個選項(xiàng)中填涂不均勻的影響。對同一題下的每個選項(xiàng)進(jìn)行比較,使得識別算法有很強(qiáng)的局部適應(yīng)性,克服使用全局識別策略帶來的參數(shù)選擇困難。實(shí)驗(yàn)結(jié)果表明,該算法兼容性好,可以適用于不同排版類型的答題卡客觀題識別,魯棒性強(qiáng),識別精度高,適用于各種掃描質(zhì)量和不同填涂質(zhì)量的答題卡。
網(wǎng)上閱卷系統(tǒng);客觀題識別算法;滑動窗口;加權(quán)平均灰度
傳統(tǒng)的手工閱卷方式成本高、效率低且閱卷誤差大,網(wǎng)上閱卷方式不僅快速準(zhǔn)確,而且可以方便地記錄和匯總考生數(shù)據(jù)[1]。客觀題識別算法是網(wǎng)上閱卷系統(tǒng)的核心算法之一。大部分的網(wǎng)上閱卷系統(tǒng)對答題卡圖像質(zhì)量等有嚴(yán)格要求[2];當(dāng)答題卡圖像噪聲較多,或者存在填涂不均勻、擦除不干凈等情況時,其識別算法的正確率會大大降低。劉志方[3]將系統(tǒng)通過設(shè)置同步頭等方法輔助識別,但對答題卡的排版有嚴(yán)格的要求。
為了解決以上問題,本文提出一種魯棒的客觀題識別算法。考慮到用戶填涂時可能偏離填涂區(qū)域,或者用戶圖像和模板圖像位置匹配出現(xiàn)的誤差,滑動窗口算法的策略重新定位考生的填涂區(qū)域,消除相關(guān)的偏差。在識別過程中,已有算法往往通過計(jì)算填涂比例來進(jìn)行判別,通過分析選項(xiàng)區(qū)域的直方圖,并引入加權(quán)平均灰度,以消除單個選項(xiàng)中填涂不均勻的影響。對同一題下的每個選項(xiàng)進(jìn)行比較,使得該算法有很強(qiáng)的局部適應(yīng)性,克服使用全局識別策略帶來的參數(shù)選擇困難。
本文算法具備以下優(yōu)點(diǎn):①兼容性好,可以適用于不同排版類型的答題卡客觀題識別。②識別準(zhǔn)確率高,魯棒性好,適用于各種掃描質(zhì)量和不同填涂質(zhì)量的答題卡。
本文將制作模板的答題卡圖像定義為模板圖像,將需要識別的考生填涂的答題卡圖像稱為用戶圖像。
答題卡客觀題的識別流程主要包括答題卡格式描述文件的載入、用戶圖像矯正、填涂識別等。
制作答題卡格式描述文件需要用戶手動設(shè)置答題卡信息。文獻(xiàn)[3]需要用戶手動標(biāo)定答題卡的定位信息和填涂信息,用戶通過鼠標(biāo)左鍵點(diǎn)擊和拖曳實(shí)現(xiàn)框選區(qū)域的功能。阮少林[4]制作答題卡模板時,首先將卡片上所有的填涂區(qū)域全部填涂,然后掃描輸入,對輸入圖像進(jìn)行預(yù)處理,提取所有的目標(biāo)點(diǎn);手動分類劃分題組。
圖像矯正操作是答題卡正確識別的前提。文獻(xiàn)[3]基于圖像的偏轉(zhuǎn)角度進(jìn)行糾偏,首先計(jì)算偏轉(zhuǎn)量,然后矯正圖像。吳軍[5]介紹了基于圖像傾斜角的矯正算法,提出了全新的邊界特征點(diǎn)檢測算法和邊界傾斜角度故計(jì)算法。白士御[6]提出了一種基于連通域分析和Hough變換的傾斜校正方法,通過連通域分析預(yù)估傾角,以較長的連通域?yàn)橐罁?jù)劃分出文本區(qū)域,結(jié)合經(jīng)邊緣檢測處理后的版面區(qū)域,以不同角度步長分別進(jìn)行Hough變換,得到最終精確的傾角。在已有模板圖像的信息,文獻(xiàn)[3]取用戶圖像中3個定位塊的中心坐標(biāo)和模板中對應(yīng)區(qū)域的中心位置求其坐標(biāo)變換矩陣,然后對用戶圖像進(jìn)行幾何變換來進(jìn)行矯正。
判斷考生選擇結(jié)果有2種方式:判斷填涂點(diǎn)和判斷考生手寫的英文字符。對于不同的填涂點(diǎn)識別算法,填涂率都是判斷某區(qū)域是否填涂的重要指標(biāo)。文獻(xiàn)[4]通過給定一個閾值,計(jì)算二值圖像中某區(qū)域中黑色像素的數(shù)量與該區(qū)域面積的比值,通過比較該值和閾值來判斷是否填涂。相對于僅依靠圖像的灰度信息或填涂面積等單一信息進(jìn)行判斷的算法,文獻(xiàn)[3]提出了基于圖像綜合特征的填涂點(diǎn)識別算法。先對圖像進(jìn)行灰度級形態(tài)學(xué)和自適應(yīng)二值化等預(yù)處理操作以后,然后去除圖像中干擾輪廓,再根據(jù)選項(xiàng)的平均灰度、灰度和、填涂面積和方差等信息計(jì)算出評價(jià)指標(biāo),最后再根據(jù)評價(jià)指標(biāo)進(jìn)行填涂結(jié)果的判斷。識別手寫字符方法的一般流程為:首先定位答題區(qū)域,然后利用神經(jīng)網(wǎng)絡(luò)分類器識別英文字符。SIMONYAN和ZISSERMAN[7]提出VGG卷積神經(jīng)網(wǎng)絡(luò),更精確地完成圖像分類工作。SZEGEDY等[8]提出一個22層深的網(wǎng)絡(luò)GoogLeNet,提高了網(wǎng)絡(luò)識別率。HE等[9]提出了深度為VGG網(wǎng)絡(luò)的8倍,但仍然具有較低的復(fù)雜度的ResNet。本文通過識別填涂點(diǎn)完成選項(xiàng)判斷工作。
本文使用的答題卡格式描述文件通過用戶交互制作而成。答題卡格式描述文件主要包括定位塊的位置信息和客觀題組織結(jié)構(gòu)的信息。
圖1為答題卡識別流程,首先載入答題卡格式描述文件,自動識別輸入的用戶圖像。算法同時接收一張答題卡的正、反面2張圖像作為輸入,在閱卷之前,首先判斷用戶圖像的正反面,同時調(diào)整圖像的上下方向;然后根據(jù)定位塊信息完成矯正操作,最后根據(jù)答題卡格式描述文件中的客觀題區(qū)域進(jìn)行填涂識別,輸出判斷結(jié)果。
圖1 答題卡識別流程
答題卡識別時,根據(jù)制作好的答題卡格式描述文件對用戶圖像的對應(yīng)區(qū)域進(jìn)行識別。一組用戶圖像包括一張答題卡的正、反面2張圖像,由于人工因素和掃描儀設(shè)置,這2張圖像的正反順序和上下方向都可能出現(xiàn)錯誤。因此,輸入2張圖像后,首先需要完成正反面和上下方向的判斷,然后根據(jù)定位塊信息進(jìn)行矯正,完成客觀題判斷。
答題卡格式描述文件的制作是答題卡客觀題識別的首要問題[3],主要通過用戶交互編輯完成。
圖2為答題卡格式描述文件的部分信息。其中紫色矩形框區(qū)域?yàn)闃?biāo)題,標(biāo)題只出現(xiàn)一次,且位于答題卡第一頁,因此本文使用標(biāo)題完成答題卡正反面判斷;紅色矩形框?yàn)槎ㄎ粔K,用于用戶圖像矯正;藍(lán)色矩形框?yàn)轭}號,綠色矩形框?yàn)檫x項(xiàng),黃色矩形框?yàn)榭陀^題的一道小題,包含題號和選項(xiàng)。
圖2 答題卡格式描述文件的部分信息
如圖2所示,比較標(biāo)題區(qū)域與其他區(qū)域的字號,標(biāo)題區(qū)域的字號明顯相對較大,故可通過檢測標(biāo)題完成答題卡正反面的判斷,同時調(diào)整用戶圖像的方向。答題卡格式描述文件中保存有模板圖像的長寬信息和標(biāo)題矩形r。標(biāo)題檢測算法如下:
(1) 將當(dāng)前圖像旋轉(zhuǎn)調(diào)整到與模板圖像具有相同的長寬比,在模板圖像上截取矩形r:將矩形r的坐標(biāo)往左右各擴(kuò)張個像素的長度,往上下各擴(kuò)張個像素的長度(=50,=30)。
(2) 截取r區(qū)域圖像,首先進(jìn)行二值化和反相操作,然后檢索輪廓,計(jì)算輪廓的包圍盒并將包圍盒從左到右排序。自左側(cè)的包圍盒開始,當(dāng)2個包圍盒的距離不超過閾值時,合并包圍盒;最終,在方向形成一個矩形r圖3(a)中藍(lán)色矩形框?yàn)楦鱾€輪廓的包圍盒,紅色矩形框?yàn)?i>r。
(3) 圖3(b)中紅色矩形框即為上述的r。由于噪聲影響,紅框所示的r與r形態(tài)差距較大。因此,當(dāng)r.h/r.h≥時,重新計(jì)算r.b:將包圍盒的下邊界由低到高排序,計(jì)算隊(duì)列中從1/3到2/3的平均值作為r.b。結(jié)果如圖3(c)所示。
(a) 輪廓包圍盒和初始的r檢測結(jié)果圖
(b) 存在噪聲的r檢測結(jié)果圖
(c) 更新的rpt結(jié)果圖
輸入一張答題卡的正反面2張圖像,存在4種可能的組合,計(jì)算每種組合下的r,存入隊(duì)列l。通過綜合比較r和r的屬性,將與r相似度最高的r所在組合作為正確結(jié)果。相似度計(jì)算過程如下:
(1) 基于矩形圖像的特征,需計(jì)算2個圖像的高度、寬度、位置偏差和灰度均值的差值,分別用d,d,d,d表示,即
其中,g為圖像的平均灰度。
(2) 定義式(6)的相似度函數(shù),w(=0,1,2,3)是平衡條件(1)中多個度量的權(quán)重。也就是選擇值最小的r作為用戶圖像的標(biāo)題區(qū)域,即
其中,和分別為用戶答題卡上點(diǎn)的和坐標(biāo);(,)為圖像在點(diǎn)的像素值;,,,分別為矩形的左、右、上、下邊界。
3.3.1 定位塊的尋找
答題卡格式描述文件中保存了多個定位塊b(=1,···,),設(shè)r為每個定位塊的最小外接圓半徑。在用戶圖像中,在以b的中心為中心,r+(=50)為半徑的圓形區(qū)域中提取對應(yīng)的定位塊。將該區(qū)域內(nèi)符合條件的所有定位塊都壓入定位塊候選隊(duì)列l。本文結(jié)合輪廓檢測和區(qū)域檢測2種途徑提取定位塊,具體步驟如下:
步驟1.采用文獻(xiàn)[3]提出的定位塊識別算法:對上述區(qū)域圖像執(zhí)行二值化和形態(tài)學(xué)操作,然后進(jìn)行輪廓查找,判斷輪廓是否為矩形,如果符合條件,則將其存入l。
步驟2. 對于圖4所示的用戶圖像的定位塊灰度不均勻或與其他元素粘連,無法獲取其完整輪廓的情況,步驟1無法處理。因此,本文繼續(xù)執(zhí)行模板匹配算法在該圓形區(qū)域上尋找與定位塊圖像最相似的區(qū)域,將該區(qū)域的矩形數(shù)據(jù)壓入l。
通過以上2個步驟之后,可尋找該區(qū)域上所有可能的定位塊。
(a) 標(biāo)定塊不均勻情況
(b) 標(biāo)定塊與其他元素粘連情況
圖4 特殊定位塊圖像
3.3.2 定位塊的匹配及選擇
每個定位塊b均得到候選列表l,因此可能存在多種組合。在執(zhí)行矯正操作之前,需要對模板中的每個定位塊從用戶圖像中選擇相應(yīng)的定位塊進(jìn)行匹配,定位塊匹配算法流程如下:
(1)l長度為1的b存在唯一確定的組合,將匹配結(jié)果保存到集合;
(2) 對剩余的候選列表大于1的定位塊:對于中的每一個元素,計(jì)算定位塊相對于模板定位塊在和方向的平均偏移值。將當(dāng)前定位塊的位置減去偏移值得到其應(yīng)該存在的位置,從候選列表中選擇與該位置最接近的定位塊作為匹配結(jié)果;
(3) 如果初始時不存在唯一匹配的情況,每個b選擇與其最接近的定位塊作為正確匹配。
算法得到集合之后,如果集合的長度大于3,如圖5所示,需要從中選取不在同一直線上的3組定位塊。
圖5 4個定位塊的答題卡圖像
部分答題卡的定位塊個數(shù)存在小于3的情況,或者,由于印刷原因,定位塊被遺漏或者濃度很低,實(shí)際用于矯正的定位塊數(shù)量會少于3個。因此,本文根據(jù)集合的長度選擇不同的矯正算法。
3.3.3 圖像矯正
本文根據(jù)對答題卡圖像執(zhí)行矯正操作進(jìn)行討論:
(1) 當(dāng)=3時,本文采取仿射變換方法來實(shí)現(xiàn)圖像矯正[3,10]。
(2) 當(dāng)=2時,假設(shè)模板和用戶圖像之間的變換只包含縮放和平移,即
根據(jù)式(7),利用最小二乘法,解線性方程組,即
在得到,t和t的值之后,構(gòu)造轉(zhuǎn)換矩陣,將當(dāng)前的用戶答題卡圖像轉(zhuǎn)換成矩陣與轉(zhuǎn)換矩陣相乘,則可以得到矯正之后的圖像。
(3) 當(dāng)=1時,可以假設(shè)模板和用戶圖像之間只包含平移變換,即
其中,和分別為用戶答題卡上點(diǎn)的和坐標(biāo);和分別為模板答題卡上對應(yīng)點(diǎn)的和坐標(biāo);為和方向的伸縮量;t和t分別為點(diǎn)在和方向的平移量;、分別為和方向的偏移量。
經(jīng)過矯正后的用戶圖像中的客觀題區(qū)域與模板圖像的基本一致,但依然可能存在一定偏差,因此首先采用滑動窗口算法消除誤差,然后計(jì)算該區(qū)域圖像的灰度指標(biāo),綜合判斷考生的填涂結(jié)果。
3.4.1 填涂區(qū)域定位
為了消除用戶圖像與模板圖像中選項(xiàng)的坐標(biāo)位置可能存在的偏差,本文提出一種消除偏移影響的滑動窗口算法?;瑒哟翱谒惴ㄈ缦拢?/p>
(1) 以答題卡格式描述文件中的選項(xiàng)位置作為初始窗口(圖6(a)中綠色矩形區(qū)域),計(jì)算該窗口在和方向可移動的最大距離,本文取值為相鄰選項(xiàng)之間相距最近的橫向距離和縱向距離。搜索窗口為(圖6(a)中藍(lán)色虛線框)。
(2) 如圖6(a)所示,初始窗口首先在方向上移動,尋找灰度總和最小的區(qū)域,作為下一步檢測的初始窗口,即棕色矩形框包圍區(qū)域。
(3) 如圖6(b)所示,控制尋找到的棕色窗口在方向上下移動,尋找灰度總和最小的區(qū)域,定位到黃色矩形框所在位置。
(4) 計(jì)算圖6(c)中黃色窗口區(qū)域的平均像素值g,從窗口邊緣向內(nèi)進(jìn)行次(=2)收縮操作,若第層的像素平均值小于g,則停止收縮;直到=。4邊都停止收縮得到的窗口即為本文所求的實(shí)際填涂區(qū)域,也就是圖6(c)中紅色矩形框包圍的區(qū)域。
(a) 初始窗口
(b)方向移動結(jié)果
(c) Y方向移動結(jié)果
結(jié)果如圖7所示,綠色矩形框?yàn)榇痤}卡格式描述文件上選項(xiàng)所對應(yīng)的參考位置,紅色矩形框?yàn)楸疚乃惴ǖ挠?jì)算結(jié)果。面對不同情況,本文提出的滑動窗口算法都可以定位到考生實(shí)際的填涂區(qū)域。
圖7 填涂區(qū)域定位結(jié)果
3.4.2 填涂區(qū)域的簡單灰度特征
選項(xiàng)是否被填涂主要由此區(qū)域內(nèi)數(shù)量最多的同類像素的灰度特征決定,由于考生填涂不均勻,所以本文統(tǒng)計(jì)選項(xiàng)的256色圖像的直方圖,計(jì)算圖像中像素聚集區(qū)間的灰度特征。
本文首先將修正的填涂區(qū)域灰度圖像分成個等級(=12),統(tǒng)計(jì)各個等級內(nèi)的像素?cái)?shù)量。為了消除噪聲的影響,統(tǒng)計(jì)包含像素最多的灰度等級及其相鄰等級中的灰度總和g與像素個數(shù)g,計(jì)算像素平均值g=g/g。
圖8為一組截自用戶答題卡的4個選項(xiàng),其屬于同一選擇題。圖9為圖8選項(xiàng)對應(yīng)的直方圖,圖中藍(lán)色豎線為g所在區(qū)間。其中橫軸代表灰度等級,縱軸代表像素?cái)?shù)量;圖中每個柱子的寬度為(=256/),高度為該灰度等級內(nèi)像素?cái)?shù)量。選項(xiàng)A,C,D都為未填涂的選項(xiàng),直方圖集中在230~255像素區(qū)間內(nèi);選項(xiàng)B為填涂項(xiàng),像素主要分布在60~80區(qū)間。
圖8 選項(xiàng)樣例
圖9 統(tǒng)計(jì)直方圖
3.4.3 填涂區(qū)域的加權(quán)灰度特征
由于考生具有不同的填涂習(xí)慣,因此被填涂區(qū)域的g處于跨度較大的灰度區(qū)間,如圖10所示。因此,如果把g作為選項(xiàng)是否被填涂的度量,則當(dāng)選項(xiàng)滿足條件g≤(≥185),則認(rèn)為該選項(xiàng)被填涂。但是,圖11中已經(jīng)被擦除的選項(xiàng)B的g<185,此種情況下此度量難以完成正確的判斷。
圖10 考生填涂的原圖像和選項(xiàng)gm的可視化
(a) 考生擦除選項(xiàng)B (b) 選項(xiàng)gm的可視化
同時,上述算法計(jì)算得到的g值可能比考生實(shí)際填涂的灰度值低很多,因而不能反映選項(xiàng)的填涂情況,如圖10(a)的A選項(xiàng),視覺判斷其g不能表示經(jīng)過用戶填涂的A選項(xiàng)。
因此,本文引入新的選項(xiàng)填涂識別度量:帶權(quán)重的灰度均值g和帶權(quán)重的前景比例r。
具體的計(jì)算過程如下:
(1) 對選項(xiàng)區(qū)域進(jìn)行二值化操作,搜索輪廓,將輪廓包圍的像素面積小于等于的區(qū)域中的所有像素的像素值的灰度降低(=3),此步驟填補(bǔ)用戶填涂不均勻?qū)е碌目障?。將填充后的二值圖像的黑色像素的比例作為前景比例r,白色像素的比例作為背景比例r。
圖12為圖8各個選項(xiàng)r可視化的圖像,圖13為圖8各個選項(xiàng)r可視化的圖像。
圖12 選項(xiàng)rf的可視化圖像
圖13 選項(xiàng)rb的可視化圖像
(2) 根據(jù)圖像的灰度值,采用分段線性的方式計(jì)算選項(xiàng)中各個像素的權(quán)重,即
(3) 根據(jù),計(jì)算選項(xiàng)的g,即
其中,和分別為用戶答題卡上點(diǎn)的和坐標(biāo);(,)為圖像在點(diǎn)的像素值;為圖像的寬度;為圖像的高度。
(4) 統(tǒng)計(jì)選項(xiàng)區(qū)域內(nèi)像素值小于g的像素所占比例,此值為r。
圖14為圖8各個選項(xiàng)r可視化的圖像,圖15為圖8各個選項(xiàng)g可視化的圖像。
圖14 選項(xiàng)rwf的可視化圖像
圖15 選項(xiàng)gwm的可視化圖像
結(jié)果如圖16所示,可以明顯觀察到圖16(b)中4個選項(xiàng)的灰度與圖10(a)中原圖像的4個選項(xiàng)的灰度相近;而r又體現(xiàn)了填涂區(qū)域和未填涂區(qū)域的前景比例的差別。
(a) 選項(xiàng)r的可視化
(b) 選項(xiàng)g的可視化
圖16 圖10中(a)組的參數(shù)信息
3.3.4 填涂結(jié)果判定
設(shè)客觀題題目個數(shù)為n。對客觀題的選項(xiàng)完成上述操作之后,將所有選項(xiàng)按照g從小到大排序,將前n個選項(xiàng)作為統(tǒng)計(jì)數(shù)據(jù),計(jì)算其平均灰度作為圖像的前景值g。
若g大于等于某個給定閾值(本文取240),即整體選項(xiàng)的前景像素接近255,那么將所有選項(xiàng)都判定為未填涂。
在判斷填涂結(jié)果時,本文以一個小題為單位,橫向比較該題目下的所有選項(xiàng)以判斷考生的填涂結(jié)果。算法如下:
算法1.將此題目中的每個選項(xiàng)逐個判斷,當(dāng)選項(xiàng)的r≥0,直接認(rèn)為該選項(xiàng)未被填涂;當(dāng)r≥1,將該選項(xiàng)的識別標(biāo)記記作1。本文0=0.43,1=0.4。
算法2.將>0的選項(xiàng)根據(jù)g從小到大排序,去除序列中g>T0的選項(xiàng),然后將第一個選項(xiàng)的r和g保存,分別用′和′表示。若選項(xiàng)滿足g–′≤D0且′–r≤D0或者′<r的條件,則將此選項(xiàng)視作填涂項(xiàng)。更新′為填涂項(xiàng)r的平均值。本文T0=180,D0=30,D0=0.12。
填涂判斷結(jié)果如圖17所示,矩形框選中的區(qū)域代表算法將此選項(xiàng)判定為填涂項(xiàng)。針對上述的用戶圖像,本文算法的識別結(jié)果全部正確。
(a) 填涂過淺的識別效果
(b) 填涂未滿的識別效果
(c) 填涂不均勻的識別效果
(d) 涂擦不干凈的識別效果
(e) 填涂區(qū)域過大的識別效果
(f) 卷
(g) 卷面存在折痕干擾的識別效果
本文的測試圖片由四川生學(xué)教育科技有限公司提供,所用答題卡圖像均為考試實(shí)際掃描得到的圖像。
程序的運(yùn)行環(huán)境為:Windows10×64,Intel i7 8700,16 G RAM。對于分辨率為3105×2163的圖像,識別速度大約6張/秒。
本文在5套不同掃描質(zhì)量的答題卡圖像的數(shù)據(jù)集上測試系統(tǒng)的識別準(zhǔn)確率。測試數(shù)據(jù)集來自不同學(xué)校,使用不同掃描儀;包含紙張、印刷質(zhì)量、填涂質(zhì)量各不相同的答題卡。本文算法都能得到99.98%以上的識別率。表1為四川省三臺高中高二2018年9月的月考的各科目的答題卡識別結(jié)果統(tǒng)計(jì)。
表1 四川省綿陽市三臺縣三臺高中高二2018年 9月月考的答題卡識別結(jié)果統(tǒng)計(jì)表
(注:PN為答題卡總數(shù);TN為題目總數(shù);PE為識別錯誤的答題卡數(shù)目;TE為識別錯誤的題目;PER為識別錯誤的答題卡所占比例;TER為識別錯誤的題目所在比例;Acc為識別正確率,即正確識別的答題卡比例)
db_1到db_5表示5次考試的數(shù)據(jù)集,分別為三臺高一2018年12月、三臺高二2018年12月、三臺高三2018年12月、綿陽一診和三臺高三2019年2月考試產(chǎn)生的數(shù)據(jù)集。GS,LZF,LSQ,ZY,ZL表示文獻(xiàn)[2-3, 11-13]提出的答題卡自動識別軟件。其中,LZF,GS和本文提出的識別算法都采用計(jì)算多個評價(jià)指標(biāo)綜合比較的方法;LSQ,ZY和ZL的識別算法都是通過比較選項(xiàng)內(nèi)黑色像素的數(shù)量和固定閾值的方法來判斷選項(xiàng)是否填涂,識別率很大程度上依賴于閾值的選取。因此,本文認(rèn)為綜合多個評價(jià)指標(biāo)的識別算法產(chǎn)生的結(jié)果可能更好。圖18為本文算法和上述2個系統(tǒng)的算法在5個數(shù)據(jù)集上各科目的平均識別率的曲線圖。其中,db_5的紙張印刷質(zhì)量比其他數(shù)據(jù)集差,所有算法的識別率均有所降低,但是本文算法的識別率仍然能夠達(dá)到99.98%以上。由圖5可見,本文算法具有較高的識別率且魯棒性強(qiáng)。
圖18 識別率的曲線圖
如圖19所示,當(dāng)遇到第49題的情況時,即考生在實(shí)際選擇的選項(xiàng)C中填涂較淺且填涂面積過小,同時,其他選項(xiàng)A存在擦除,2個選項(xiàng)的g和r計(jì)算結(jié)果在給定范圍內(nèi),如圖19(b)和(c)所示。識別結(jié)果可能會出現(xiàn)錯誤,算法將A選項(xiàng)也視為填涂項(xiàng),圖19(a)中紅色矩形框表示識別錯誤,也是下一步工作的研究重點(diǎn)之一。
(a) 填涂識別結(jié)果(b) rwf可視化(c) gwm的可視化
本文實(shí)現(xiàn)了一個答題卡客觀題的高效識別算法。首先根據(jù)答題卡格式描述文件完成正反面的判斷,執(zhí)行圖像矯正操作,然后使用滑動窗口算法消除偏差,根據(jù)各選項(xiàng)區(qū)域的灰度特征完成客觀題區(qū)域的識別。實(shí)驗(yàn)結(jié)果證明了本文算法的有效性。
[1] ZHOU J X, YANG J C, SONG H B, et al. An online marking system conducive to learning [J]. Journal of Intelligent and Fuzzy Systems, 2016, 31(5): 2463-2471.
[2] 郭崧.答題卡圖像識別系統(tǒng)研究與實(shí)現(xiàn)[D]. 沈陽: 遼寧大學(xué), 2017.
[3] 劉志方. 基于數(shù)字圖像處理的答題卡自動識別軟件[D]. 廣州: 華南理工大學(xué), 2015.
[4] 阮少林. 網(wǎng)上閱卷中信息提取與識別技術(shù)研究[D]. 成都: 電子科技大學(xué), 2010.
[5] 吳軍. 掃描文檔圖像的處理方法的研究和應(yīng)用[D]. 濟(jì)南: 山東師范大學(xué), 2015.
[6] 白士御. 基于SVM的印刷體數(shù)學(xué)公式識別方法研究與系統(tǒng)設(shè)計(jì)[D]. 沈陽: 沈陽工業(yè)大學(xué), 2015.
[7] SIMONYAN K, ZISSERMAN A. Very deep convolutional networks for large-scale image recognition [EB/OL]. (2015-04-10). [2019-09-18]. https://arxiv.org/abs/1409.1556.
[8] SZEGEDY C, LIU W, JIA Y, et al. Going deeper with convolutions [C]//2015 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). New York: IEEE Press, 2015: 1-9.
[9] HE K M, ZHANG X Y, REN S Q, et al. Deep residual learning for image recognition [C]//2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). New York: IEEE Press, 2016: 770-778.
[10] 李春陽. 基于同源圖像配準(zhǔn)算法的研究及系統(tǒng)設(shè)計(jì)[D]. 長春: 吉林大學(xué), 2016.
[11] 劉勝強(qiáng). 紙卷數(shù)字化和圖像識別在網(wǎng)上閱卷中的應(yīng)用[D]. 成都: 電子科技大學(xué), 2010.
[12] 趙洋. 基于OpenCV的網(wǎng)上閱卷技術(shù)的研究[D]. 濟(jì)南: 山東大學(xué), 2009.
[13] 張玲. 基于圖像工程的網(wǎng)上閱卷系統(tǒng)的研究與設(shè)計(jì)[D]. 濟(jì)南: 山東大學(xué), 2010.
A Novel Recognition Algorithm of Objective Questions for Exam Answer Sheets
YAO Shu-li1, WANG Shao-rong1,2, GAI Meng2,3, WANG Zhen4
(1. School of Information Science and Technology, Beijing Forest University, Beijing 100083, China; 2. Beijing Virtual Simulation and Visualization Engineering Center, Beijing 100871, China; 3. School of Electronics and Computer Science, Peking University, Beijing 100871, China; 4. Shenyang Ligong University, School of Art and Design, Shenyang Liaoning 110159, China)
Under the premise of ensuring the quality of the marking, the online marking system not only greatly reduces the workload of the teachers, but also lowers the requirement of high quality exam paper and saves energy. However, the results produced by automatic judgment by the online marking system for objective questions heavily depends on the image quality of high-speed scanning and layout of the exam answer sheets. This article proposes a robust recognition algorithm of objective questions for exam answer sheets. Firstly, considering the possibility that the user may deviate from the filling area, or the possible error in the match between the present image and template image, a sliding window strategy is proposed to relocate the practical filling area in order to eliminate the related deviation. Then the histogram of each option is calculated, and a weighted average intensity is introduced to remove the effect of the uneven filling between different options. The comparison between each option for the same question enables the recognition algorithm to have strong local adaptability. At the same time, this strategy overcomes the difficulty of parameter selection caused by the global recognition strategy. The experimental results show that owing to good compatibility, our algorithm is suitable for different typesetting types of exam answer sheets in the recognition of objective questions. In addition, the algorithm is characteristic of high recognition accuracy as well as strong robustness, thus applicable to exam answer sheets of varying scanning quality and different filling quality.
online marking system; recognition algorithm of objective questions; sliding window; weighted average intensity
TP 391
10.11996/JG.j.2095-302X.2019050900
A
2095-302X(2019)05-0900-08
2019-04-11;
定稿日期:2019-05-01
國家重點(diǎn)研發(fā)計(jì)劃項(xiàng)目(2017YFB1002705);中央高校基本科研業(yè)務(wù)費(fèi)專項(xiàng)基金(2015ZCQ-XX);北京林業(yè)大學(xué)“北京市大學(xué)生科學(xué)研究與創(chuàng)業(yè)行動計(jì)劃”項(xiàng)目(S201710022068)
要曙麗(1996-),女,山西壽陽人,本科生。主要研究方向?yàn)閳D形圖像處理、計(jì)算機(jī)視覺等。E-mail:shuliyao@outlook.com
王少榮(1975-),男,江西永豐人,講師,博士。主要研究方向?yàn)閳D像處理、計(jì)算機(jī)圖形學(xué)等。E-mail:shaorongwang@hotmail.com