劉 磊 周天愿 俞傳濤 文 豪 葛鎖良 唐 昊
(合肥工業(yè)大學(xué)電氣與自動(dòng)化工程學(xué)院,安徽 合肥230009)
網(wǎng)上閱卷方式起自二十世紀(jì)九十年代著手推進(jìn)的標(biāo)準(zhǔn)化考試改革,是以計(jì)算機(jī)領(lǐng)域的網(wǎng)絡(luò)技術(shù)和掃描技術(shù)為依托,結(jié)合人工閱卷經(jīng)驗(yàn)和新興技術(shù)的一種高效閱卷模式[1]。這次改革標(biāo)志著傳統(tǒng)閱卷從紙質(zhì)介質(zhì)方式向電子化文檔的網(wǎng)絡(luò)化方式轉(zhuǎn)變,在高考等大型國(guó)家性統(tǒng)一考試中得到廣大考生和社會(huì)的認(rèn)可。但此類(lèi)閱卷方式僅是試卷形式的改變且勞煩人力,對(duì)答題卡制作及專(zhuān)用識(shí)別設(shè)備有較高的硬性要求,不適用于高校閱卷的中小型、多科目閱卷。
隨著圖像識(shí)別技術(shù)迅速發(fā)展,一些教育和計(jì)算機(jī)領(lǐng)域?qū)W者開(kāi)始關(guān)注基于圖像識(shí)別的自動(dòng)閱卷系統(tǒng)[2]。文獻(xiàn)[3]提出了一種自適應(yīng)的維納濾波算法,其適應(yīng)面較廣,但不適合處理噪聲方差較大的信號(hào),也不能實(shí)現(xiàn)非平穩(wěn)隨機(jī)過(guò)程濾波。文獻(xiàn)[4]提出了自動(dòng)選取閾值的二值化算法,消除了圖像對(duì)比度的影響,但不適用于背景灰度反差過(guò)大的情況。文獻(xiàn)[5]采用模式識(shí)別技術(shù)解決了光標(biāo)閱讀方式運(yùn)行速度慢的缺點(diǎn),但在特征匹配時(shí)會(huì)放大誤差。文獻(xiàn)[6]提出了一種高效的深度特征融合分類(lèi)系統(tǒng),使識(shí)別錯(cuò)誤率降低50%左右,但可能造成綜合評(píng)價(jià)函數(shù)意義不明確。文獻(xiàn)[7]采用了最近鄰分類(lèi)算法有效的完成了對(duì)手寫(xiě)數(shù)字的識(shí)別,但當(dāng)特征屬性較多而且樣本容量較大時(shí),其分類(lèi)效率將大大降低。文獻(xiàn)[8]采用了基于PCA 的神經(jīng)網(wǎng)絡(luò)進(jìn)行識(shí)別手寫(xiě)數(shù)字識(shí)別,雖然簡(jiǎn)化了特征向量,但易受干擾影響。
本文設(shè)計(jì)并實(shí)現(xiàn)了一種基于圖像識(shí)別的閱卷平臺(tái),面向廣大教育機(jī)構(gòu)及師生用戶群體、應(yīng)用于智能移動(dòng)終端,既減輕了教師閱卷的負(fù)擔(dān),又消除了人為誤差,極大地提升了教師的閱卷效率。
基于圖像識(shí)別的閱卷平臺(tái)主要由四層結(jié)構(gòu)組成,即用戶層、應(yīng)用層、數(shù)據(jù)層及基礎(chǔ)設(shè)施層,系統(tǒng)結(jié)構(gòu)如圖1 所示。用戶層通過(guò)智能移動(dòng)終端向云端發(fā)送數(shù)據(jù)、服務(wù)請(qǐng)求;應(yīng)用層為用戶提供閱卷識(shí)別、數(shù)據(jù)存取服務(wù);管理層用于閱卷平臺(tái)及用戶軟件的資源管理、維護(hù)更新;應(yīng)用層、管理層、數(shù)據(jù)層、基礎(chǔ)設(shè)施層為閱卷平臺(tái)提供運(yùn)行環(huán)境和數(shù)據(jù)支持。
圖1 基于圖像識(shí)別的閱卷平臺(tái)的系統(tǒng)結(jié)構(gòu)
基于圖像識(shí)別的閱卷平臺(tái),是一個(gè)以卷積神經(jīng)網(wǎng)絡(luò)為框架、以服務(wù)器為核心的閱卷平臺(tái),其工作流程如圖2 所示。閱卷平臺(tái)基于云計(jì)算和計(jì)算機(jī)視覺(jué)技術(shù),為教師提供輔助閱卷服務(wù),為學(xué)生提供查詢(xún)和反饋服務(wù)。教師固定移動(dòng)設(shè)備后,使用教師端APP實(shí)現(xiàn)掃描功能,學(xué)生試卷傳送至云服務(wù)器后自動(dòng)進(jìn)行計(jì)分區(qū)域的捕捉及手寫(xiě)數(shù)字識(shí)別以統(tǒng)計(jì)得分,處理后反饋數(shù)據(jù)給教師及云端備份,教師擁有修改數(shù)據(jù)的權(quán)限。學(xué)生端APP 可向平臺(tái)請(qǐng)求成績(jī)讀取,獲得試卷總分及計(jì)分區(qū)域圖像,可提交查分申請(qǐng),擁有問(wèn)題反饋接口。
圖2 基于圖像識(shí)別的閱卷平臺(tái)的工作流程
圖像預(yù)處理是對(duì)手機(jī)拍照后的圖像數(shù)據(jù)進(jìn)行處理,獲得用于圖像識(shí)別的高信噪比數(shù)據(jù)。圖像預(yù)處理主要分為二值化處理、圖像去噪兩個(gè)階段。
二值化處理基本過(guò)程如下:全局閾值算法[9]確定合適閾值,對(duì)像素灰度值大于閾值的設(shè)為255,低于閾值則設(shè)為0。為克服光照對(duì)算法閾值的影響,閾值選取應(yīng)考慮到環(huán)境光照條件。具體過(guò)程是:遍歷圖像空間,計(jì)算得出平均灰度水平,在此基礎(chǔ)上加一個(gè)合適偏差得到動(dòng)態(tài)閾值。
圖像去噪過(guò)程主要針對(duì)二值化后的孤立黑點(diǎn)。算法的思想是,以像素點(diǎn)為中心,構(gòu)造矩形,檢測(cè)矩形中黑點(diǎn)個(gè)數(shù)。若黑點(diǎn)過(guò)少,則認(rèn)為是噪聲,反之是有效數(shù)據(jù)點(diǎn)。對(duì)比圖3 和圖4 可知,經(jīng)預(yù)處理后,可獲得期望的灰度圖。
圖4 經(jīng)預(yù)處理后的圖像
在拍攝計(jì)分區(qū)域前,雖然已通過(guò)人為調(diào)整使試卷與掃描設(shè)備保持同一水平,但仍存在小角度傾斜,因此需進(jìn)行傾斜校正。傾斜校正主要包括兩個(gè)環(huán)節(jié),一是利用霍夫變換檢測(cè)直線[10],二是圖像旋轉(zhuǎn)校正。
圖5 霍夫變換
圖6 直線檢測(cè)及傾斜角計(jì)算
圖7 旋轉(zhuǎn)校正
如圖6 所示,經(jīng)傾斜角計(jì)算后,利用圖像旋轉(zhuǎn)函數(shù),將計(jì)分區(qū)域調(diào)正,并把因旋轉(zhuǎn)造成的空缺區(qū)域填充成白色,可獲得如圖7 所示的圖像。
由于計(jì)分區(qū)域中含有多個(gè)題目的得分,因此需要將每個(gè)題目的得分分割成多張圖像,其中每張圖像僅含一個(gè)題目的得分。由于計(jì)分欄的上下邊框幾乎處于水平狀態(tài),因此只需依次按行(列)遍歷像素點(diǎn),當(dāng)某行(列)突然出現(xiàn)白點(diǎn)所占比例遠(yuǎn)大于該行中黑點(diǎn)所占比例時(shí),分割圖像。將分割后的計(jì)分欄按照題號(hào)順序依次命名保存,如圖8 所示。
圖8 分割后按題號(hào)順序保存的圖像
卷積神經(jīng)網(wǎng)絡(luò)的圖像分類(lèi)過(guò)程可分為三個(gè)過(guò)程:卷積、池化、全連接,如圖9 所示。
圖9 卷積神經(jīng)網(wǎng)絡(luò)原理
經(jīng)預(yù)處理后的圖片是一個(gè)非0 即255 的矩陣,但它保留了自然圖形的特征,由于自然圖像具有統(tǒng)計(jì)特性相似性[11],可利用卷積操作,把圖片提取到的特征作為濾波器,減少參數(shù)的計(jì)算難度,同時(shí)保證稀疏性,防止過(guò)擬合。
理論上可以將卷積層提取到的所有特征送入全連接層進(jìn)行分類(lèi)預(yù)測(cè),不過(guò)對(duì)于計(jì)算機(jī)有限的計(jì)算能力而言,卷積操作提供的數(shù)據(jù)量還是太多,這將會(huì)帶來(lái)巨大的計(jì)算負(fù)荷。通過(guò)池化操作可大量減少參數(shù)矩陣的維度,以減少輸入全連接層參數(shù)。池化還能使模型更加關(guān)注特征的存在而不是位置,它能將不同位置的特征映射到特征矩陣的相同位置,比如拍攝的圖片可能有所傾斜,或者不在圖片中心等,池化步驟可以有效的抵消這些干擾,將圖形修正到正常位置。
經(jīng)過(guò)池化后,最初的圖像變成了一些高度抽象化的數(shù)字特征,將這些特征輸入全連接層,完成數(shù)字分類(lèi)。全連接層的核心就是向量和矩陣乘積運(yùn)算,相當(dāng)于對(duì)卷積提取的抽象化特征進(jìn)行整合。全連接網(wǎng)絡(luò)會(huì)根據(jù)輸入圖片的特征與樣本空間進(jìn)行比對(duì),最后對(duì)各種分類(lèi)標(biāo)簽輸出一個(gè)概率,分類(lèi)器可以根據(jù)概率進(jìn)行結(jié)果預(yù)測(cè)。
基于上述關(guān)鍵技術(shù),依托智能移動(dòng)終端,實(shí)現(xiàn)了基于圖像識(shí)別的閱卷平臺(tái)。其中教師端APP 支持輔助閱卷、成績(jī)上傳等功能,如圖10 所示;學(xué)生端APP 支持成績(jī)查詢(xún)、成績(jī)校核、查分申請(qǐng)等功能,如圖11 所示。
圖10 基于圖像識(shí)別的閱卷平臺(tái)——教師端APP
圖11 基于圖像識(shí)別的閱卷平臺(tái)——學(xué)生端APP
在實(shí)際測(cè)試中采用了500 份計(jì)分欄成績(jī),分別在不同光照、傾斜程度下進(jìn)行識(shí)別實(shí)驗(yàn)。由表1 可知,隨著卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練輪數(shù)的增加,訓(xùn)練準(zhǔn)確率逐漸提高,但由于模型本身限制,最終穩(wěn)定在0.998 左右,且實(shí)際準(zhǔn)確率由于受環(huán)境影響略低于訓(xùn)練準(zhǔn)確率。
表1 卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練輪數(shù)對(duì)準(zhǔn)確率的影響
由表2 可知,在正常、曝光、昏暗及有明顯陰影的環(huán)境條件下實(shí)驗(yàn),實(shí)際準(zhǔn)確率受曝光影響小,但受昏暗影響較大,且當(dāng)計(jì)分區(qū)域存在明顯陰影時(shí),實(shí)際準(zhǔn)確度很低,其原因是圖像預(yù)處理部分對(duì)不同光照條件的適應(yīng)能力不同。
表2 不同光照條件對(duì)實(shí)際準(zhǔn)確率的影響
表3 計(jì)算傾斜角的準(zhǔn)確率
由表3 可知,在不同計(jì)分欄傾斜角下,經(jīng)傾斜校正算法計(jì)算出的傾斜角與計(jì)分欄傾斜角誤差很小。
本文實(shí)現(xiàn)了基于圖像識(shí)別的閱卷平臺(tái)設(shè)計(jì),采用卷積神經(jīng)網(wǎng)絡(luò),測(cè)試中實(shí)際準(zhǔn)確率可達(dá)99.2%,并針對(duì)計(jì)分區(qū)域圖像采集時(shí)存在的光照、噪點(diǎn)、傾斜等問(wèn)題進(jìn)行了算法改進(jìn)。采用自適應(yīng)算法選取合適閾值,經(jīng)二值化處理后能適應(yīng)多數(shù)光照環(huán)境。在對(duì)噪點(diǎn)的處理上,通過(guò)遍歷抓取孤立噪點(diǎn),以消除噪聲干擾。針對(duì)圖像傾斜問(wèn)題,通過(guò)霍夫變換檢測(cè)圖像中的計(jì)分區(qū)域的上下邊框,取多點(diǎn)計(jì)算平均傾斜角加以校正,在計(jì)分區(qū)域傾斜時(shí)仍具備較強(qiáng)的適應(yīng)性。最后,通過(guò)云服務(wù)器搭建起了端對(duì)端的信息傳遞平臺(tái),實(shí)現(xiàn)了閱卷平臺(tái)的設(shè)計(jì)。