劉洋++黃欣
摘 要
在網(wǎng)上閱卷系統(tǒng)中,需要將紙質(zhì)的試卷和答題卡掃描成數(shù)字化圖像數(shù)據(jù),以此提取考生答題及其個(gè)人的信息特征。本文針對(duì)掃描后的數(shù)字化圖像數(shù)據(jù),運(yùn)用Hough變換,提出一種新的圖像傾斜角檢測(cè)算法,以此為基礎(chǔ),對(duì)網(wǎng)上閱卷系統(tǒng)進(jìn)行重新設(shè)計(jì),將系統(tǒng)核心功能分為答題卡圖像信息預(yù)處理和答題卡信息識(shí)別兩大模塊。該系統(tǒng)的設(shè)計(jì),能夠有效地降低評(píng)卷誤差,提高系統(tǒng)的檢測(cè)率,促進(jìn)了評(píng)卷的科學(xué)化和規(guī)范化。
【關(guān)鍵詞】圖像識(shí)別 網(wǎng)上閱卷系統(tǒng) 圖像處理技術(shù) Hough變換
1 引言
網(wǎng)上閱卷是借助計(jì)算機(jī)網(wǎng)絡(luò)技術(shù),將紙質(zhì)的試卷和答題卡通過電子掃描技術(shù)和圖像處理技術(shù)轉(zhuǎn)化為數(shù)字化的形式,呈現(xiàn)給特定的教師進(jìn)行評(píng)閱,已經(jīng)成為高效、準(zhǔn)確、公平的現(xiàn)代化閱卷方式。較之傳統(tǒng)閱卷方式,網(wǎng)上閱卷具有很多優(yōu)點(diǎn),比如成績(jī)“多評(píng)制”、全程計(jì)算機(jī)管理、實(shí)時(shí)高效監(jiān)控和管理閱卷的質(zhì)量和進(jìn)度、實(shí)現(xiàn)了考試信息的數(shù)字化和閱卷工作的科學(xué)化管理。本文針對(duì)掃描后的數(shù)字化圖像數(shù)據(jù),提出了一個(gè)新的基于圖像邊緣檢測(cè)的傾斜角檢測(cè)算法,以此為基礎(chǔ)對(duì)網(wǎng)上閱卷系統(tǒng)進(jìn)行設(shè)計(jì),構(gòu)建了基于圖像識(shí)別的網(wǎng)上閱卷系統(tǒng)。
2 相關(guān)技術(shù)
2.1 網(wǎng)上閱卷的核心分析
網(wǎng)上閱卷的流程與傳統(tǒng)閱卷非常相似,有所不同的是需要對(duì)圖像化的試卷進(jìn)行切割處理,以便實(shí)現(xiàn)任務(wù)的分發(fā)和指配。其核心流程如圖1所示。
下面對(duì)這些核心步驟進(jìn)行說明:
2.1.1 圖像數(shù)字化
在網(wǎng)上閱卷中,通過網(wǎng)絡(luò)傳輸?shù)氖菙?shù)字化的圖像信息,所以,首先需要借助掃描設(shè)備對(duì)紙質(zhì)的考生試卷和答題卡進(jìn)行掃描,生成數(shù)字化的圖像信息。
2.1.2 圖像預(yù)處理
為了后續(xù)的處理,需要對(duì)圖像進(jìn)行預(yù)處理,包括消除圖像中無關(guān)的信息、增強(qiáng)圖像信息的可檢測(cè)性等。
2.1.3 獲取圖像信息
通過對(duì)圖像進(jìn)行分析處理,以確定不同圖像信息代表不同的考試信息數(shù)據(jù)。
2.1.4 信息處理
在上述工作的基礎(chǔ)上,對(duì)圖像信息進(jìn)行加工、匹配、整理,完成圖像信息的處理。
2.1.5 特征提取
通過閱卷系統(tǒng)建立的標(biāo)識(shí)信息,從而正確地獲取試卷信息和答題卡信息等之間的對(duì)應(yīng),實(shí)現(xiàn)圖像信息的特征提取。
2.2 數(shù)字圖像處理
數(shù)字圖像處理是計(jì)算機(jī)研究領(lǐng)域一個(gè)非常重要的內(nèi)容,主要是對(duì)圖像進(jìn)行去噪、增強(qiáng)、復(fù)原等操作所涉及到的具體技術(shù)和方法,其主要目的是提高圖像的視感質(zhì)量、獲取圖像的特殊信息以及圖像的編碼壓縮。在實(shí)際應(yīng)用中,數(shù)字圖像處理常用的方法有:圖像編碼壓縮、圖像增強(qiáng)和旋轉(zhuǎn)、圖像分割、和圖像識(shí)別等。
3 圖像邊緣檢測(cè)算法的設(shè)計(jì)
將答題卡通過掃描生成數(shù)字圖像后,數(shù)字圖像或多或少會(huì)產(chǎn)生一定角度的傾斜,為了確保后續(xù)工作的正確性,需要對(duì)數(shù)字圖像進(jìn)行傾斜角度檢測(cè)和圖像矯正處理。目前,在圖像傾斜角檢測(cè)上,應(yīng)用較多的是以Hough變換為基礎(chǔ)的系列優(yōu)化算法,在功能和性能上都有不錯(cuò)的表現(xiàn)效果。為了最大程度的保證邊緣點(diǎn)的平滑,本節(jié)提出基于圖像邊緣檢測(cè)的傾斜檢測(cè)算法,以達(dá)到優(yōu)化圖像矯正流程的目的,能夠滿足實(shí)際應(yīng)用的要求。
3.1 基于圖像邊緣檢測(cè)的傾斜檢測(cè)研究
本節(jié)在基于垂直邊緣提取的Hough優(yōu)化算法和基于鄰域統(tǒng)計(jì)分析的Hough優(yōu)化算法的基礎(chǔ)上,結(jié)合兩種算法的優(yōu)點(diǎn),實(shí)現(xiàn)圖像邊緣的傾斜檢測(cè)。
3.1.1 圖像的邊緣檢測(cè)
邊緣檢測(cè)主要目的是利用導(dǎo)數(shù)及微分的性質(zhì),確定圖像上的一組曲線,即圖像的邊緣,該邊緣是圖像上那些在亮度上急劇變化、中間有間斷的像素點(diǎn)所形成的集合,通過此邊緣可以提取圖像的一些關(guān)鍵信息,比如圖像表面方向的不連續(xù)等,在一定程度上簡(jiǎn)化了圖像的處理過程。以答題卡定位區(qū)域?yàn)槔?,如圖2所示。
通過對(duì)該區(qū)域的分析就可以判定考生個(gè)人信息和其答題區(qū)域。通過對(duì)圖像的邊緣進(jìn)行檢測(cè),可以大大降低計(jì)算量,有效彌補(bǔ)基于鄰域統(tǒng)計(jì)分析的Hough優(yōu)化算法計(jì)算量大的缺點(diǎn)。
3.1.2 圖像的邊緣檢測(cè)方法
圖像邊緣檢測(cè)的步驟一般包含濾波、增強(qiáng)、檢測(cè)、定位。從目前的檢測(cè)方法來看,大部分基于圖像亮度之上的導(dǎo)數(shù)計(jì)算,以此來判定圖像中的邊緣位置。該方法對(duì)于圖像邊緣的檢測(cè)跟設(shè)定的閥值有關(guān)系,閥值大小會(huì)影響到判定結(jié)果。事實(shí)上,邊緣檢測(cè)是通過算法來提取圖像中對(duì)象和背景間的交界線,通過圖像灰度分布的梯度來獲得邊緣檢測(cè)算子。以下是幾種常見的圖像邊緣檢測(cè)算子:
(1)Roberts算子:Roberts 算子是一種最簡(jiǎn)單的算子,適用于邊緣明顯且噪聲較少的圖像分割,對(duì)具有陡峭的低噪聲的圖像效果最好,但處理后結(jié)果邊緣不是很平滑。
(2)Prewitt算子:利用像素點(diǎn)上下、左右鄰點(diǎn)的灰度差,在邊緣處達(dá)到極值檢測(cè)邊緣,去掉部分偽邊緣,對(duì)噪聲具有平滑作用。該算子對(duì)噪聲有抑制作用,但對(duì)邊緣的定位仍不夠理想。
(3)Sobel算子:是一個(gè)離散的一階差分算子,對(duì)靠近中心的點(diǎn)加權(quán)以突出邊緣點(diǎn)。該算子通過梯度與差分原理實(shí)現(xiàn),用來運(yùn)算圖像亮度函數(shù)的梯度的近似值。當(dāng)精度要求很高時(shí),該算子提取的圖像輪廓仍然不甚理想。
(4)Canny算子:是一個(gè)多階段的優(yōu)化算子,在濾波、增強(qiáng)和檢測(cè)方面要優(yōu)于其他的算子,是一種既能抗噪又能保持弱邊緣的算子,但實(shí)現(xiàn)起來較為麻煩。
3.2 基于圖像邊緣檢測(cè)的傾斜檢測(cè)算法
3.2.1 矩形連通域檢測(cè)
在檢測(cè)圖像的傾斜角度時(shí),需要提取一個(gè)典型的定位塊,以此定位塊來分析整個(gè)答題卡的傾斜角度。這里采用鄰域跟蹤法識(shí)別出一個(gè)完整的矩形連通區(qū)域,其工作過程如下:
(1)以從上到下和從左到右的順序以此掃描二值化圖像,這里令起始邊界點(diǎn)為W(x0,y0),以此點(diǎn)為基礎(chǔ)跟蹤下一個(gè)邊界點(diǎn)。為了下面描述的方面,這里假定首次跟蹤?quán)徲蚍较驗(yàn)閐=0。
(2)在W的鄰域內(nèi)判斷是否有跟W同像素的點(diǎn)(這里假定W為黑色像素),如果沒有,調(diào)整跟蹤方向d=(d+1) mod 8,如果有,則該點(diǎn)為下一個(gè)邊界點(diǎn)。在跟蹤方向的選定上,如果(d mod 2)==0,則調(diào)整方向d=(d + 6) mod 8;否則,d=(d + 7)mod 8。
(3)重復(fù)步驟(2),直到找到四個(gè)矩形邊界點(diǎn)為止,那么該矩形塊就是一個(gè)完好的定位塊。
3.3 矩形邊緣Hough檢測(cè)
利用Hough變換,能快速實(shí)現(xiàn)傾斜角的檢測(cè)和圖像矯正。其思想是把圖像平面上的點(diǎn)對(duì)應(yīng)到參數(shù)平面上的線,對(duì)原始圖像子抽樣處理和邊緣線提取,最后通過統(tǒng)計(jì)特性來解決問題。
3.4 圖像傾斜矯正
通過Hough變換找到圖像傾斜角度θ后,就可以進(jìn)行坐標(biāo)的變換,實(shí)現(xiàn)圖像傾斜的矯正。其變換公式為:
4 基于圖像掃描識(shí)別的網(wǎng)上閱卷系統(tǒng)的處理流程設(shè)計(jì)
作為網(wǎng)上閱卷系統(tǒng)而言,要在短時(shí)間內(nèi)實(shí)現(xiàn)大批量的閱卷,這對(duì)系統(tǒng)要求很高,需要具備準(zhǔn)確性、穩(wěn)定性、可靠性、易用性、實(shí)時(shí)性和安全性等特征。在功能上,要求對(duì)掃描后的數(shù)字化圖像文件進(jìn)行存儲(chǔ)、切割,以便實(shí)現(xiàn)試卷的評(píng)閱。本文側(cè)重網(wǎng)上閱卷系統(tǒng)的基礎(chǔ)數(shù)據(jù)收集部分,主要是通過圖像識(shí)別完成對(duì)掃描后的數(shù)字化圖像數(shù)據(jù)的加工處理,這也是網(wǎng)上閱卷系統(tǒng)的核心。因此,可以將系統(tǒng)分為兩大核心模塊,分別是答題卡圖像信息預(yù)處理和答題卡信息識(shí)別,二者在業(yè)務(wù)流程上是相互關(guān)聯(lián)的。在圖像存入緩存后,流程會(huì)轉(zhuǎn)向答題卡圖像預(yù)處理,預(yù)處理完成之后才轉(zhuǎn)向答題卡信息識(shí)別模塊處理,需要說明的是,二者處理完后都需要進(jìn)行異常的檢測(cè)。
其中,答題卡圖像預(yù)處理包括一系列的過程,比如圖像的灰度化處理、二值化處理、去噪處理和圖像矯正,以增強(qiáng)答題卡圖像特征信息可分辨能力和可提取能力,預(yù)處理的結(jié)果最終得到一幅經(jīng)過Hough變換后的二值化圖像;而答題卡信息識(shí)別主要是利用圖像定位技術(shù),根據(jù)答題卡模板中的設(shè)置對(duì)答題卡圖像進(jìn)行區(qū)域分割,以便完成考生基本信息識(shí)別、客觀題識(shí)別、主觀題識(shí)別等操作。
5 結(jié)束語
本文對(duì)基于圖像識(shí)別的網(wǎng)上閱卷系統(tǒng)進(jìn)行了設(shè)計(jì),包括算法和系統(tǒng)兩個(gè)方面的設(shè)計(jì)。通過圖像識(shí)別和圖像處理技術(shù),可以準(zhǔn)確地對(duì)掃描后的數(shù)字化圖像數(shù)據(jù)進(jìn)行切割,高效完成答題卡及試卷上不同信息的識(shí)別。由于網(wǎng)上閱卷系統(tǒng)主要是對(duì)數(shù)字化圖像數(shù)據(jù)進(jìn)行處理,所以本文運(yùn)用Hough變換,提出了一種基于圖像邊緣檢測(cè)的傾斜角檢測(cè)算法,以此為基礎(chǔ)設(shè)計(jì)系統(tǒng)的業(yè)務(wù)處理流程。該系統(tǒng)的設(shè)計(jì),使得閱卷工作更加規(guī)范化、制度化、科學(xué)化、現(xiàn)代化,有效提高閱卷的效率和準(zhǔn)確性。
參考文獻(xiàn)
[1]滕今朝,邱杰.利用Hough變換實(shí)現(xiàn)直線的快速精確檢測(cè)[J].中國(guó)圖象圖形學(xué)報(bào),2008(02).
[2]李清.基于圖像識(shí)別的網(wǎng)上閱卷系統(tǒng)的設(shè)計(jì)實(shí)現(xiàn)與優(yōu)化[D].長(zhǎng)春:東北師范大學(xué),2013.
[3]張站,劉政怡,吳建國(guó)等.基于圖像識(shí)別的閱卷系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].微型機(jī)與應(yīng)用,2011(04).
[4]楊青燕,彭延軍.基于灰度圖像的答題卡識(shí)別技術(shù)[J].山東科技大學(xué)學(xué)報(bào)(自然科學(xué)版),2009(03).
作者單位
1.長(zhǎng)春工業(yè)大學(xué)信息化建設(shè)工作辦公室 吉林省長(zhǎng)春市 130012
2.中國(guó)移動(dòng)通信集團(tuán)吉林有限公司長(zhǎng)春分公司 吉林省長(zhǎng)春市 130000