郁 巖
(江蘇安全技術(shù)職業(yè)學院 機械工程學院,江蘇 徐州 221000)
輪胎、軸承、鋼材、模具等工業(yè)產(chǎn)品出廠前被印制了一些產(chǎn)品字符,其內(nèi)容記錄著產(chǎn)品的重要信息,所以準確、高效地識別壓紋字符是企業(yè)智能化制造必須滿足的基本要求[1]。因此,如何快速識別產(chǎn)品上的字符信息已成為企業(yè)向信息化發(fā)展的掣肘。
壓紋字符相較于其他印刷字符而言更加立體,且字符與其背景之間無色差[2]。因此用于識別壓紋字符的算法與識別其他光學字符的算法相比存在明顯區(qū)別。本文重點探究光學字符識別(OCR)中對圖像單個字符分割和分割后的訓練集學習識別任務[3]。
本次實驗平臺由相機支架、大恒MER500黑白相機、日本COMPUTAR 25 mm焦距鏡頭、OPT同軸光源、LINGD2001-T型光源控制器和PC機組成[4],待識別字符是在環(huán)形鑄件表面用模具直接沖壓形成的字符,如圖1所示。相機固定在被測物的正上方,光源由固定支架夾持,保證通過同軸光源半透半返的光線垂直且均勻的照射在零件表面。被測零件置于實驗平臺下方,通過VisionPro軟件采集圖像。
圖1 待測零件上表面
壓紋字符是利用模具直接在零件表面沖壓形成的字符,所以字符周圍的顏色和背景區(qū)域的顏色無差別,因此實驗采用15°環(huán)形角度光源采集圖像[5]。
金屬壓紋字符呈圓周狀分布在環(huán)形區(qū)域內(nèi),不利于后期的字符識別。為了使環(huán)形區(qū)域內(nèi)的壓紋字符呈水平方向排列,需對圖像進行校正,如圖2所示。
圖2 極坐標轉(zhuǎn)換
圖2(a)為環(huán)形區(qū)域,圖2(b)為轉(zhuǎn)換后的矩形區(qū)域。環(huán)形區(qū)域的頂點A、B、C、D分別對應轉(zhuǎn)換后矩形區(qū)域的頂點A、B、C、D。設P點為環(huán)形區(qū)域中的像素點,空間坐標為(x, y),矩形區(qū)域與其對應的點是P',空間坐標為(x', y'),變換中心為點O(xO, yO)。
環(huán)形區(qū)域內(nèi)P點在極坐標系中的角度值β3計算如下:
ROP的長度計算公式為:
P'空間坐標(x',y')由極坐標變換得到:
因點P'的空間坐標(x',y')一般為實數(shù),所以只能插值獲得點P'的灰度值。圖3(a)表示輸出圖像中某一像素已被變換回輸入圖像中,但經(jīng)轉(zhuǎn)換后該像素的中心點處于與之相鄰的4個像素的中心點之間,且為非整數(shù)位置。算法采用最近鄰域插值法,首先對變換后的像素中心的數(shù)據(jù)取整處理,從而確定在4個相鄰像素點中心位置和該坐標最近的一個,接著把該像素的灰度值當作輸出圖像中相對應像素點的灰度值,如圖3(b)所示。
圖3 插值法計算
為減少圖像處理時的數(shù)據(jù)量,對極坐標變換后的圖像進行二值化處理,即利用IPOneImage工具中的量化算法進行處理[6],如圖4(a)所示。此算法減少了圖像背景的數(shù)據(jù),使得目標輪廓更加突出,大大提高了識別效率[7]。但圖像二值化處理后灰度級分布不均勻,所以還需對二值化圖像進行均衡化處理,如圖4(b)所示。
圖4 字符圖像優(yōu)化處理
建立一個字符訓練數(shù)據(jù)集,如圖5所示。本訓練集由一些特征向量的范例和已知字符種類組成,訓練集的字符包含油污、缺角、壓紋較淺、表面銹斑等工況,還包含實際工況采集圖像時,出現(xiàn)噪聲、圖像強度不均勻等現(xiàn)象[8-9]。通常情況下獲得變化的訓練集比較困難,所以在圖像處理時采取一些措施對已收集的字符范例進行拓展訓練,本訓練集也經(jīng)過了人為處理。
圖5 部分訓練集樣本
圖6列舉了被測零件的部分壓紋字符在4種工況下利用OCR和訓練集集合算法分割字符,圖6(c)被潤滑油侵蝕過,圖像質(zhì)量最差,只有微小的邊緣信息,此時人為將預先定義的良品壓紋字符加入訓練集中,圖中可以看出,SSE字符被準確分割出來,且藍色的矩形緊貼字符邊緣。
圖6 被測零件部分壓紋字符
從實驗運行結(jié)果來看,OCR和訓練集集合算法可以在復雜的工況下分割壓紋字符,此算法不僅可以對較淺的壓紋進行識別,還能適應多油、銹斑等復雜條件下的檢測,大大提高了傳統(tǒng)OCR字符識別的準確率,且算法響應速度更快。