◆白雪松 李娜 黃凌霄
答題卡識別技術(shù)的算法系統(tǒng)研究與實現(xiàn)
◆白雪松 李娜 黃凌霄通訊作者
(寧夏大學(xué)信息工程學(xué)院 寧夏 750021)
隨著國民經(jīng)濟水平的飛速發(fā)展,家長對于孩子的教育越來越重視。由于現(xiàn)在的教育信息化的發(fā)展,云計算、大數(shù)據(jù)、物聯(lián)網(wǎng)等技術(shù)的完善成熟,各個學(xué)校的教育硬件資源越來越豐富,可在考試方面,普通的學(xué)校和老師無法完全使用答題卡進行考試,大量的閱卷無法避免,教師費神勞力卻不能得到解決。本文對拍照實現(xiàn)答題卡圖像的采集,對圖像的識別流程、圖像預(yù)處理中的對比度處理、圖像濾波、灰度化以及二值化進行研究和實現(xiàn)。其次,對答題卡圖像的校正進行重點研究,使用Hough變化、Radon變化、最長直線方程三種方法對傾斜的答題卡圖像進行校正。
答題卡識別;傾斜矯正;Hough變化;Radon變化
“十三五”期間,國家對加快教育信息化普及,全面提高教育質(zhì)量,促進高等教育公平提出了更高的要求。為了緊跟中國教育的步伐,所有初中和高中都需要合理利用各種相關(guān)的信息技術(shù)來組織學(xué)生的考試。使用答題卡在日常教育工作中有很多便利。在一定程度上,學(xué)校和教師可以更好地開展教育工作,可以有更多的方案讓教師根據(jù)學(xué)生的發(fā)展改變教學(xué)計劃。隨著中國信息技術(shù)的進步,所有學(xué)校都開始使用答題卡進行考試。在客觀題的批改中,能保證準確無誤,減少教師批改的工作量,節(jié)省批改時間。教師可以利用這些時間做更多有利于教育的工作。因此,答題卡識別技術(shù)的算法系統(tǒng)能夠更好地滿足人們對教育的普遍需求。
在使用普通相機或手機相機拍攝答題卡時,需將答題卡放在平坦的地方,底部桌面最好為白色,拍照時相機與答題卡盡可能平行,使答題卡位于中心。拍照時,光線應(yīng)盡量為白色且充足。最好不要使用曝光。根據(jù)拍攝過程中可能出現(xiàn)的許多情況需要增強圖像的對比度[1]。為了防止由于圖像對比度不足而突出顯示關(guān)鍵信息,圖像歸一化也可用于圖像預(yù)處理。歸一化[2]是一種簡化計算的方法,也就是說,將維度表達式表示為無量綱表達式,這將成為標量。在變化過程中,根據(jù)圖像不變矩的規(guī)定,可以使用一組參數(shù)來保證其他函數(shù)的變化不會改變原始圖像。
噪聲是圖像中一些非常突出的像素點或像素塊,會使圖像模糊,不利于觀察圖像的細節(jié)。該系統(tǒng)主要處理高斯噪聲的影響。高斯噪聲中的噪聲是隨機產(chǎn)生的,噪聲的深度也是隨機的。其概率密度函數(shù)服從高斯分布,即噪聲服從正分布。高斯分布的公式為:
公式中σ是標準差,在高斯分布中又稱為高斯半徑,是均值,即期望。高斯半徑越小,曲線越高、越尖銳,概率分布越集中。圖像中的高斯半徑越小,圖像的變化越大,曲線越陡。如果圖像中產(chǎn)生高斯噪聲,最直觀的表示是會影響圖像的層次結(jié)構(gòu),并且邊緣邊界模糊。
對于受到了高斯噪聲影響的圖像處理過程中,二維高斯函數(shù)通常用作平滑濾波器,對于二維高斯分布的函數(shù)為:
根據(jù)高斯函數(shù)的性質(zhì)可以得出σ決定著平滑程度,σ越大,高斯濾波器的頻帶就越寬,平滑程度就越好。高斯濾波后圖像的平滑程度取決于標準差σ,標準差決定了高斯函數(shù)的寬度。其處理過程是像素與其他相鄰區(qū)域中的像素之間的像素的加權(quán)平均。像素離中心越近,權(quán)重越高。
由于彩色的答題卡的彩色圖像包含的信息比灰度圖像[3]更復(fù)雜、更無序,導(dǎo)致彩色圖像所需的存儲空間更大,計算機的處理工作更多。在RGB[4]的顏色范圍內(nèi),每種顏色的值范圍為0-255,表示從暗到亮的顏色。對圖像進行灰度化處理不僅不會影響答卷的識別,還可以降低圖像復(fù)雜度,優(yōu)化識別效果。目前,使用加權(quán)平均法對圖像進行灰度化,公式為:
圖像的二值化[5]處理是將已經(jīng)處理為灰度的圖像再次處理,使其只顯示為黑白兩種顏色。經(jīng)過測試設(shè)置一個閾值,將圖像中閾值以下的灰度像素設(shè)置為0,將閾值以上的像素值設(shè)置為最大值255,即整張圖像呈現(xiàn)為黑白兩種顏色。二值化處理的公式為:
其中(,)表示的是圖像經(jīng)過二值化處理之后顯示出來的像素值,(,)表示的是已經(jīng)經(jīng)過圖像對比度增強、圖像濾波和圖像灰度化之后圖像的像素值,代表設(shè)定的閾值,閾值可以將圖像需要重點體現(xiàn)的信息和圖像的背景區(qū)分出來,在閾值規(guī)定的數(shù)值下對圖像進行二值化的操作,既可以顯示準確信息,也能有效降低噪聲的干擾。
(1)Hough變換
Hough變換最初用于檢測圖像中的直線,而斜截距用于確定直線的參數(shù)。Hough變換可以定義直線和其他圖形,適用于各種幾何圖形。使用Hough變換檢測圖像中的直線的過程主要是將直線定義為一組具有參數(shù)分布的點來定位直線,即分析直線中的多個點,最后定位直線的位置。通常的Hough變換在二值化后檢測圖像中的直線,Hough變換可以忽略圖像中的噪聲,對圖像進行檢測和分析。
Hough變換中的直線表達式為:
最后將原圖像按照下述公式進行校正,完成使用Hough變換對傾斜圖像的校正。
(2)Radon變換
(3)計算最長直線方程
在圖像處理過程中,對答題卡進行了二值化處理。在這種傾斜校正方法中,需要連接所有邊界。根據(jù)答題紙的布局,可以發(fā)現(xiàn)在答案的邊界處有特殊的定位標記。連接這些標記,記錄所有連接的線,然后比較它們以找到最長的線。將直線方程擬合到已找到的最長直線上,計算直線的傾斜角度,根據(jù)傾斜角度確定答題卡是否需要傾斜校正,然后將直線控制在垂直于或平行于水平方向的位置。將圖像和最長直線作為一個整體進行處理,并根據(jù)直線傾角的變換一起改變圖像,從而完成圖像的傾斜校正。
形態(tài)學(xué)濾波字面上是指利用形態(tài)學(xué)方法消除噪聲,從而降低識別過程中的壓力。在形態(tài)濾波過程中,要注意對圖像的操作。我們需要先對圖像進行擴展,然后對擴展后的圖像進行腐蝕,這樣可以有效地消除圖像中的噪聲。如果顛倒上述操作,圖像中的噪聲將被完全消除,即先腐蝕圖像,然后擴展圖像。展開操作的目的是放大圖像中每個形狀,有效彌合形狀之間差距,消除無用信息并突出圖像的焦點。蝕刻操作的目的是去除圖像中的凸起或小污垢。形態(tài)學(xué)濾波不僅可以消除圖像中的噪聲,而且可以提高圖像的信噪比。對于需要定位的答題紙識別操作,形態(tài)濾波還可以提高圖像定位的精度,更容易、更快速地獲取信息,這與形態(tài)濾波靈活、彈性的數(shù)學(xué)變換有很大關(guān)系。
答題卡不僅包含多項選擇題的填寫部分,還包含考生的信息填寫部分,比如姓名,準考證號,以及考試科目這種必不可少的選擇部分。對于這種排版就需要對答題卡進行分割。本系統(tǒng)中圖像分割是將整個答題卡分為兩大部分,分別為基本信息填涂區(qū)和答案填涂區(qū),為了方便對基本信息的處理,所以將基本信息填涂區(qū)又分為兩大部分,分別為考試科目代號區(qū)域和準考證填涂區(qū)域。接下來定位網(wǎng)格線,生成網(wǎng)格線,將所有的填涂區(qū)域都進行分割,在對答題卡做了網(wǎng)格線的分割之后,就可以對網(wǎng)格線中的標記進行分析,最后生成結(jié)果。
答題卡識別技術(shù)的算法系統(tǒng)的界面將Hough變換、Radon變換、計算最長直線方程三種圖像傾斜校正方法集合在同一界面,使用者可根據(jù)需求自行選擇校正方式進行圖像校正處理。
界面設(shè)有狀態(tài)顯示模塊與系統(tǒng)功能模塊。狀態(tài)顯示模塊有四個相等的面板,分別對應(yīng)顯示讀取答題卡的圖像,圖像預(yù)處理的不同過程,圖像校正過后顯示的正確的圖像,以及最后區(qū)域分析顯示框。系統(tǒng)功能模塊對應(yīng)讀取答題卡、圖像預(yù)處理、傾斜校正等操作。在系統(tǒng)功能模塊中將圖像預(yù)處理過程的各個步驟分開來進行按鈕的設(shè)置,這樣在進行操作的時候圖像的每一步變化都可以清楚地顯示出來。在傾斜校正方面可以選擇三種不同的傾斜校正的算法。
使用者在使用時首先點擊讀取答題卡,將拍好的照片傳入答題卡識別系統(tǒng),然后進行對比度增強、圖像濾波、灰度化、二值化一系列操作,然后選擇適當(dāng)方法進行傾斜校正、形態(tài)學(xué)濾波、區(qū)域分析等一系列操作,即可顯示掃描結(jié)果。
對于大多數(shù)學(xué)校來說,不可能每次考試都使用光標閱讀器。因此,為了避免使用價格昂貴、操作困難、維護困難的光標閱讀器,本系統(tǒng)中每個普通教師都可以使用普通的攝影技術(shù)來實現(xiàn)對客觀題的分析和識別,最大限度地減少教師的工作量。在本系統(tǒng)中,老師只需要給每個學(xué)生的答題卡拍照。對攝像設(shè)備、拍攝地點、拍攝環(huán)境沒有太高的要求。在該系統(tǒng)中,還可以準確地實現(xiàn)圖像預(yù)處理、傾斜校正、試卷分割等方面的功能。只需要老師對最終的答案進行統(tǒng)計就可以完成一次試卷的批閱。
在本系統(tǒng)中,基本功能都可以實現(xiàn)。但是,由于筆者自己的技術(shù)所限,沒有辦法使本系統(tǒng)更加完善,更加符合當(dāng)前教師的需求以得到廣泛的應(yīng)用。例如,雖然可以通過拍照將圖片導(dǎo)入系統(tǒng)實現(xiàn)答案的識別,但無法輸入正確的答案表選項,無法直接生成分數(shù),這是當(dāng)前識別系統(tǒng)中最大的問題。在這些方面,我們還需要進一步的研究和更改,使答題卡識別系統(tǒng)能夠充分應(yīng)用到教師的日常閱卷中,這不僅可以減輕教師的壓力,而且可以使當(dāng)前的教育信息化水平更加完善。
[1]劉嘉鑫.基于matlab的圖像對比度增強處理的算法的研究與實現(xiàn)[J].中國新通信,2019,21(24):160.
[2]孫俞超,李德.基于圖像歸一化和NSST的魯棒零水印算法[J].延邊大學(xué)學(xué)報(自然科學(xué)版),2017,43(01):43-50.
[3]張菲菲. 基于計算機視覺的答題卡識別系統(tǒng)的設(shè)計與實現(xiàn)[D].西北大學(xué),2019.
[4]袁鵬. 基于圖像處理的答題卡自動閱卷系統(tǒng)的設(shè)計與實現(xiàn)[D].東北大學(xué),2015.
[5]杜聰. 基于圖像處理技術(shù)的答題卡智能識別研究[D].石家莊鐵道大學(xué),2018.
2021年大學(xué)生創(chuàng)新創(chuàng)業(yè)訓(xùn)練計劃校級項目(答題卡識別技術(shù)的算法系統(tǒng)研究與實現(xiàn))