陳 思,張濤川,彭一航
(佛山職業(yè)技術(shù)學(xué)院 機(jī)電工程學(xué)院,廣東 佛山528137)
近年來,光學(xué)字符識別技術(shù)被廣泛用于車牌號碼識別、票據(jù)識別、卡片識別等領(lǐng)域[1]。隨著計算機(jī)技術(shù)的不斷發(fā)展,市場上不斷推出先進(jìn)的機(jī)器視覺開發(fā)平臺,促進(jìn)了光學(xué)字符識別技術(shù)的發(fā)展及推廣。HALCON平臺提供成熟的圖像處理算法包及大量開放式結(jié)構(gòu)的功能模塊,有助于快速開發(fā)光學(xué)字符識別系統(tǒng),具有開發(fā)效率高、開發(fā)成本低廉的特點(diǎn)。
HALCON能夠快速連接圖像采集器,完成圖像采集任務(wù),提供了多種圖像增強(qiáng)和圖像分割的算法[2],用戶根據(jù)實(shí)際應(yīng)用的需要通過選用合適的算子來調(diào)用算法;提供了OCR助手,用戶使用助手能快速制作樣本訓(xùn)練集文件和對分類器進(jìn)行訓(xùn)練,提高了光學(xué)字符識別系統(tǒng)開發(fā)的效率。
復(fù)雜背景下的光學(xué)字符識別,需要適當(dāng)選用圖像增強(qiáng)方法[3],突出字符區(qū)域空間,抑制不感興趣的背景空間。為了突出圖像中的目標(biāo)區(qū)域和灰度空間,HALCON平臺提供了大量基于空域的非線性的灰度變換算法包,例如對數(shù)變換、指數(shù)變換算法包等,也提供大量基于頻域的圖像運(yùn)算算法包,例如頻域低通濾波器、頻域高通濾波器算法包。用戶通過算子輕松調(diào)用復(fù)雜的算法包,對圖像進(jìn)行變換運(yùn)算。
1.1.1 對數(shù)變換與指數(shù)變換
灰度圖像的對數(shù)變換和指數(shù)變換是典型的非線性變換方法,變換函數(shù)分別如式(1)和式(2)所示,對數(shù)變換方法可以擴(kuò)張低灰度像素的灰度跨度,壓縮高灰度值像素的灰度跨度,而指數(shù)變換通過設(shè)置參數(shù)γ能得到選擇性高灰度值或者低灰度值像素的灰度跨度。
公式(1)中,f0(x,y)是原圖像,g1(x,y)是對數(shù)變換后的圖像。公式(2)中的g2(x,y)是指數(shù)變換后的圖像,γ為伽馬系數(shù),當(dāng)γ<1時,增大低灰度區(qū)域像素的灰度跨度,當(dāng)γ>1時,增大高灰度區(qū)域像素的灰度跨度。圖1為對數(shù)變換和指數(shù)變換的示例,對應(yīng)的灰度直方圖如圖2所示。
圖2 灰度直方圖
1.1.2 頻域高通濾波
圖像的頻域變換方法,需要對原圖像進(jìn)行傅里葉變換得到圖像的頻譜圖,對頻譜圖進(jìn)行修改,再通過反傅里葉變換得到空域圖像[4],基于頻域的圖像變換原理示意圖如圖3所示,其中f(x,y)為輸入的原灰度圖像,經(jīng)過傅里葉變換后得到F(u,v),經(jīng)過高通濾波器得到圖像G(u,v),再經(jīng)過反傅里葉變換,得到圖像g(x,y)。由于空域圖像輪廓部分對應(yīng)于頻域圖像的高頻部分,為了突顯空域圖像的輪廓線,將高通濾波傳遞函數(shù)作用于頻譜圖,再將經(jīng)過高通濾波處理后的頻譜圖還原到空域空間。示例如圖4所示,對圖1(d)的圖片進(jìn)行頻域高通濾波處理。
圖1 對數(shù)變換和指數(shù)變換示例
圖3 基于頻域的圖像變換原理示意圖
圖4 頻域高通濾波示例
目標(biāo)提取與字符分割是光學(xué)字符識別的重要步驟,主要應(yīng)用輪廓提取、閾值分割、區(qū)域生長等圖像分割方法。閾值分割是設(shè)置灰度閾值將灰度圖像進(jìn)行區(qū)域分割[5-6],這種方法適用于目標(biāo)區(qū)域和背景區(qū)域的灰度值都分布比較均勻的情況。如果背景區(qū)域復(fù)雜,存在的干擾區(qū)域很多,則不適合使用閾值分割方法。如果目標(biāo)區(qū)域的輪廓有明顯的特征,如車牌架的輪廓具有邊緣灰度值相近且矩形度較高的特征,可以通過輪廓線特征來分割圖像,提取目標(biāo)區(qū)域。當(dāng)提取了目標(biāo)區(qū)域,減少了背景區(qū)域的干擾后,可以結(jié)合閾值分割法來提取最終的目標(biāo)區(qū)域[7-8]。對圖4(d)的車牌號碼圖像進(jìn)行目標(biāo)提取與字符分割,結(jié)果如圖5所示。
圖5 對圖4(d)進(jìn)行目標(biāo)提取與字符分割的結(jié)果
HALCON平臺針對工業(yè)文本、文檔文本、證件文本、點(diǎn)打印文本和手寫文本中的大寫字母和數(shù)字識別[6],提供了的二十多個分類器模板供用戶選擇使用,也提供了開放結(jié)構(gòu)的分類器,如BOX分類器、神經(jīng)網(wǎng)絡(luò)分類器、支持向量機(jī)分類器等。用戶可以使用開放結(jié)構(gòu)的分類器,通過添加樣本及訓(xùn)練分類器,能快速開發(fā)識別字母、數(shù)字、中文、日文、德文等文字的光學(xué)字符識別系統(tǒng)?;贖ALCON平臺提供的OCR訓(xùn)練器光學(xué)字符識別流程如圖6所示。
圖6 基于HALCON平臺OCR訓(xùn)練器字符識別流程圖
HALCON平臺提供了多種文本字體的OCR分類器模板,供用戶直接使用,能識別多種字體的大寫字母和數(shù)字及手寫數(shù)字,操作方便,有助于快速開發(fā)光學(xué)字符識別產(chǎn)品。HALCON也提供了開放式結(jié)構(gòu)的分類器,具有適用范圍廣、二次開發(fā)效率高的優(yōu)點(diǎn)。分類器訓(xùn)練流程如圖7所示。在HALCON平臺創(chuàng)建的開放式分類器模板,需要經(jīng)過訓(xùn)練集的訓(xùn)練,從訓(xùn)練集中計算字符的特征向量,訓(xùn)練集是由大量的字符樣本組成。HALCON平臺的字庫提供了簡體中文、繁體中文、希臘文字、日本文字等文字,可以直接在字庫選取字符作為樣本,也可以從圖像上提取樣本,建立的樣本集盡可能代表實(shí)際應(yīng)用中可能出現(xiàn)的情況,有助于提高識別系統(tǒng)的識別精度,缺點(diǎn)是其工作量大。實(shí)際上,字符訓(xùn)練集還應(yīng)該存在噪音干擾、筆畫尺寸、形狀發(fā)生畸變等情況,HALCON平臺提供的OCR助手具有生成變形樣本字符的功能,減少了制作樣本集的工作量,非常有助于快速開發(fā)光學(xué)字符識別系統(tǒng)。
圖7 分類器訓(xùn)練流程圖
HALCON提供了成熟的光學(xué)字符識別系統(tǒng)開發(fā)平臺,具有功能強(qiáng)大、節(jié)約開發(fā)成本及操作簡單的優(yōu)點(diǎn)。HALCON提供的光學(xué)字符識別分類器模板對部分打印字體大寫字母和數(shù)字具有較高的識別準(zhǔn)確度,提供的OCR助手有助于快速制作樣本訓(xùn)練集文件,提供的開放式光學(xué)字符分類器有助于用戶快速開發(fā)光學(xué)字符識別系統(tǒng)。