摘要:在數(shù)字符號圖像骨架的識別中,對于數(shù)字符號圖像骨架的多樣性和復雜性,尚缺乏一種準確和通用的識別方法,對此提出了基于形態(tài)學的數(shù)字符號圖像骨架的特征值提取方法。該方法定義了骨架中的端點、節(jié)點等概念,利用數(shù)學形態(tài)學的方法識別圖像骨架。計算機仿真表明,該方法不僅具有通用性,而且具有很高的準確性。
關鍵詞:數(shù)字符號;圖像骨架特征值;數(shù)學形態(tài)學;識別方法
0 引言
圖像骨架特征提取是圖像處理的重要內容。圖像骨架往往反應了圖像的重要特征,提取骨架的特征值,是要使目標圖像更加準確地被反應出來,特征值提取的好壞,會直接影響圖像識別的正確率。但是,由于圖像的復雜性和不確定性,對圖像骨架的特征值提取,會受到骨架結構特征的影響。
圖像識別方法已初步形成三大類:統(tǒng)計識別、結構識別、人工神經(jīng)網(wǎng)絡識別等。具體到統(tǒng)計決策識別,句法結構識別和人工神經(jīng)網(wǎng)絡識別這三種方法它們各具優(yōu)缺點。結構法采用分而治之的方法,把一個復雜的任務分解為若干個復雜程度較低的子任務。這種方法對細節(jié)特征敏感,容易區(qū)分相似文字,文字變形后適應性好。缺點是需要進行筆劃抽取,在圖像質量不佳的情況下,結構特征難以抽取,且不穩(wěn)定。
本文主要研究數(shù)字儀表表盤數(shù)字的識別。數(shù)字圖像的骨架結構比較簡單,圖像都是在比較好的室內條件下拍攝,經(jīng)過圖像的前期處理后,數(shù)字符號圖像骨架都能比較好地反應數(shù)字符號的特征,因此,采用結構法識別對數(shù)字圖像符號,可以盡可能地發(fā)揮方法的優(yōu)點。結構識別我們將通過數(shù)學形態(tài)學方法。實現(xiàn)。
1 基于數(shù)學形態(tài)學的特征值提取方法介紹
形態(tài)學圖像處理是以幾何學為基礎的,其基本思想是:利用一個稱作結構元素的“探針”收集圖像的信息,當探針在圖像中不斷移動時,便可考察圖像各個部分間的相互關系,從而了解圖像的結構特征。
本文主要是利用形態(tài)學對圖像骨架的端點進行識別。本文定義了圖像骨架端點:表示8連同域中,只用—個像素與其相鄰,我們稱之為端點。如2,5,7,6,9的端點數(shù)是2;而3,4的端點數(shù)是3,表示8連同域中,只用—個像素與其相鄰,我們稱之為端點。
在考察分析圖像時,要設計一種收集圖像信息的探針,稱為結構元素s。它是E(n),或其子空間E(m)(ffKn)中的一個集合。結構元素可以設置為一定的幾何形狀,如菱形、正方形、圓形、線段等的集合。設計者通過對圖像的分析和理解,選擇合理的結構元素,在圖像中不斷移動結構元素便可以考察圖像中各個部分之間的關系,從而分析圖像中圖像背景、目標圖像等各種區(qū)域之間的關系。結構元素s在形態(tài)學運算中的作用類似于在信號處理時的“濾波窗口”或一個參考模板。
根據(jù)本文的定義,我們可以選取8連同域中,只用一個像素與其相鄰的結構元素。這樣的結構元素有8個。這樣我們可以對端點進行統(tǒng)計和定位。
2 數(shù)字符號圖像的特征值提取
為了使數(shù)字能夠區(qū)分出來,本文采用了以下幾個特征表示參數(shù):歐拉系數(shù)(Enul),斜率(K),端點數(shù)(N),端點集中區(qū)域(D)。
在對數(shù)字圖像處理后的細化二值圖像的辨識上,上面給出的幾個特征參數(shù)是本文所述數(shù)字圖像識別技術的亮點之一。借助于這些參數(shù)克服了以前數(shù)字匹配識別、特征提取識別等方法容錯能力和通用性較差的弊端。通過對數(shù)字符號骨架圖的分析我們可以對圖像特征作如下的區(qū)分:
(1)小數(shù)點、1和其他數(shù)字的區(qū)分
小數(shù)點和1在分割原始圖像的時候,它們的水平寬度是小于其他的數(shù)字的,從而,我們可以把小數(shù)點和1與其他的數(shù)字進行區(qū)分。1和小數(shù)點的區(qū)別在于它們的水平投影是不同的。因此,我們可以區(qū)分小數(shù)點、數(shù)字1和其他數(shù)字。
(2)歐拉系數(shù)區(qū)分
歐拉系數(shù)是用來表示骨架途中圓形環(huán)與骨架整體數(shù)目之差的值。例如2,3,5,7的歐拉系數(shù)是1;而4,6,9的歐拉系數(shù)是0;8的歐拉系數(shù)是-1。
(3)端點數(shù)區(qū)分
定義端點如4.3節(jié)中,表示8連同域中,只用一個像素與其相鄰,我們稱之為端點。如2,5,7,6,9的端點數(shù)是2,而3,4的端點數(shù)是3。
(4)端點分布域
首先把單個數(shù)字分成上左、上右和下左、下右四個域。端點分布域是指端點落在我們分好的一個域中。如6和9的區(qū)份是:6的端點是分布在上域中,而9的端點分布在下域中。這樣我們就可以很容易區(qū)分6和9的區(qū)別了。2和5的區(qū)分是:2的端點分布在上左和下右兩個區(qū)域,5的端點分布在上右和下左兩個域中,這樣我們就能區(qū)分2和5了。
(5)2和7的區(qū)分
由于7的寫法不一樣,因此,我們只能用垂直面投影法來區(qū)分2和7。顯然,7的投影上部分像素點與下部分像素點的比值是不一樣的。
1 2 3 4 5 6 7 8 90
1 2 3 4 5 6 7 8 9 0
圖1儀表數(shù)字的數(shù)字與字體顯示形式
從上面的分析中,我們發(fā)現(xiàn)最常見的上面的兩種數(shù)字顯示形式(圖1所示),都符合上述的區(qū)分方法。
3 試驗仿真及結果
本文所采用的數(shù)字圖像是對儀表表盤的數(shù)字和漢字進行識別時候的圖像。
圖3是圖2經(jīng)過細化后的得到圖像。在利用上述的方法進行識別的時候都能得到滿意的識別結果,識別率達到98%以上;而且我們通過圖1可以看出,在工業(yè)現(xiàn)場遇到的數(shù)字的形式也是多樣的和復雜的。這說明本文的方法具有兼容性強,準確率高的特點。通過使用matlab試驗進行識別顯示,運算的速度也比其他的方法快,具有一定的實用性。
參考文獻:
[1]張晉陽等.手背靜脈圖像骨架特征提取的算法[J].計算機應用,2007.27(1):152-154.
[2]楊志平.數(shù)學彬態(tài)學在空間格局圖像骨架提取中的應用[J].地球信息學,2003.32(5):411~413.
[3]黃鳳崗,楊國,宋克歐.柔性形態(tài)學在圖象邊緣檢測中的應用[J].中國園像圖形學報,2000.5(A).4:254~287.
[4]徐志平.基于交叉視覺皮質模型二值圖像形態(tài)學算法[J].計算機輔助設計與國形學學報,2007.19(8):990~994.
[5]戴汝為,郝紅衛(wèi),肖旭紅.漢字識別的系統(tǒng)與集成[M].浙江科學技術出版社,1998.
[6]趙春暉,張兆禮,梅曉丹.現(xiàn)代圖像處理技術及Matlba實玩[M].人民郵電出版社,2001.