張鴻鋒++李婉琪++曾昭君++麥志杰
摘 要:Hu不變矩是圖像的一種統(tǒng)計特征,因其具有平移、旋轉(zhuǎn)與比例不變性而被廣泛應(yīng)用于圖像識別領(lǐng)域。該文以MATLAB作為技術(shù)實現(xiàn)平臺,以Hu不變矩作為判斷依據(jù),配合數(shù)字形態(tài)學(xué)、歐氏判據(jù)等數(shù)學(xué)方法,通過基于MATLAB的算法進行程序設(shè)計,實現(xiàn)區(qū)域圖像特征數(shù)據(jù)獲取,并與庫內(nèi)圖像特征數(shù)據(jù)進行對比,選出與最接近的一組數(shù)據(jù),實現(xiàn)圖像識別的目的。計算機模擬結(jié)果表明該方法的有效性和可行性。
關(guān)鍵詞:Hu不變矩 圖像特征 模式識別 應(yīng)用
中圖分類號:TP391 文獻(xiàn)標(biāo)識碼:A 文章編號:1672-3791(2014)10(c)-0005-04
模式識別,指使用計算機利用數(shù)學(xué)技術(shù)方法,對表征事物或現(xiàn)象的各種形式的(數(shù)值的、文字的和邏輯關(guān)系的)信息進行處理和分析,以對事物或現(xiàn)象進行描述、辨認(rèn)、分類和解釋的過程。其中,我們把環(huán)境與客體統(tǒng)稱為“模式”。該文討論對數(shù)字圖像進行模式識別,包含對圖像進行特征提取與匹配的過程。
圖像特征有兩類表示方法,一類是輪廓特征,另一類是區(qū)域特征。圖像的輪廓特征主要針對物體的外邊界,常使用鏈碼,傅里葉描述子、Hough變換進行描述;圖像的區(qū)域特征則關(guān)系到整個形狀區(qū)域,常用邊界特征法、傅里葉形狀描述符法、幾何參數(shù)法、形狀不變矩法和小波描述符(Wavelet Deor)等方法描述。而圖像特征匹配是指將待檢測圖像的圖像特征與給定圖像的數(shù)據(jù)進行比對,使用如互相關(guān)性、歐氏判據(jù)等方法,判斷兩者是否使用同一類型圖像的操作。
Hu不變矩作為形狀不變矩的其中一種計算方式,具有平移、比例和旋轉(zhuǎn)不變性,這使其在在圖像識別的過程中,能減少如待測圖像的大小歸一化與位置居中等預(yù)處理步驟,降低運算成本,提高運算速率。本文將使用Matlab平臺,應(yīng)用Hu不變矩作為特征提取技術(shù),結(jié)合數(shù)學(xué)形態(tài)學(xué)、歐氏判據(jù)等運算方法,實現(xiàn)圖像識別功能。
1 Hu不變矩的定義與計算方式
M.K.Hu在1962年提出了Hu不變矩。Hu不變矩是指以圖像的低階(二階和三階)歸一化中心矩的非線性組合構(gòu)成的七個量值。Hu不變矩自提出至今,已被廣泛應(yīng)用到圖像、字符識別以及工業(yè)質(zhì)量檢測等領(lǐng)域。下面敘述Hu不變矩的計算方式。
設(shè)二維數(shù)字圖像用表示,則其階矩定義為:
(1)
階中心矩定義為:
(2)
其中。對于二維數(shù)字圖像,為其質(zhì)心坐標(biāo),表示圖像灰度在水平方向上的灰度質(zhì)心,表示圖像灰度在水平方向上的灰度質(zhì)心。
階歸一化中心矩定義為:
,其中
M.K.Hu將以上代數(shù)不變量理論應(yīng)用于尺度規(guī)范化矩,最終構(gòu)造出下列所示的7個矩不變量,稱為Hu不變矩,并驗證其對圖像的平移、選擇和比例具有不變性[1]。以下是7個不變矩的計算公式:
(3)
(4)
(5)
(6)
(7)
(8)
(9)
綜上所述,Hu不變矩可以應(yīng)用以上(3)~(9)所示公式得出結(jié)果[2]。
2 統(tǒng)設(shè)計與實現(xiàn)
該文應(yīng)用基于上文公式(3)~(9)編寫的Hu不變矩特征提取程序?qū)?jīng)過預(yù)處理后的圖像進行特征提取,使用歐氏判據(jù)作為判斷依據(jù),將輸入圖所得矩值與數(shù)據(jù)庫內(nèi)模板進行比對,實現(xiàn)圖像匹配,最后輸出判斷結(jié)果并計數(shù)。圖1是系統(tǒng)流程圖,下面分別敘述系統(tǒng)處理過程。
2.1 預(yù)處理
圖像分割,是指將圖像中相連的區(qū)域進行劃分并將兩個不同區(qū)域進行分離。而標(biāo)記是指把圖像矩陣中各個不相連的區(qū)域通過賦予不同的數(shù)值,便于對各區(qū)域進行提取、計數(shù)等操作。為實現(xiàn)以上目的,需要使用數(shù)學(xué)形態(tài)學(xué)方法對目標(biāo)圖像進行操作。由于該文中使用二值數(shù)字形態(tài)學(xué),必須對輸入的圖像進行灰度化處理。已知彩色圖片由三個數(shù)值矩陣合成所得,則應(yīng)有彩色圖像變換為灰度圖像有固定公式如下:
(10)
此后對灰度圖像進行灰度二值化處理,為實現(xiàn)自動獲取合適的二值化閾值,實現(xiàn)圖像背景與目標(biāo)圖像的分離,降低誤判率,該文使用調(diào)用garythresh函數(shù),應(yīng)用最大類間方差法進行閾值獲取。
對于完成以上預(yù)處理操作的圖像,開始進行二值數(shù)學(xué)形態(tài)學(xué)操作。數(shù)學(xué)形態(tài)學(xué)中二值圖像的形態(tài)變換是一種針對集合的處理過程。其形態(tài)算子的實質(zhì)是表達(dá)物體或形狀的集合與結(jié)構(gòu)元素間的相互作用,結(jié)構(gòu)元素的形狀就決定了這種運算所提取的信號的形狀信息。形態(tài)學(xué)圖像處理是在圖像中移動一個結(jié)構(gòu)元素,然后將結(jié)構(gòu)元素與下面的二值圖像進行交、并等集合運算。例如,如圖2所示,假設(shè)B(x)代表了結(jié)構(gòu)元素,X代表工作空間,就是用B(x)對E進行腐蝕的結(jié)果就是把結(jié)構(gòu)元素B平移后使B包含于X的所有點構(gòu)成的集合。此時,就是把二值圖像各1像素連接成分的邊界點去掉從而縮小一層,實現(xiàn)提取骨干信息,去掉毛刺,去掉孤立的0像素的目的,并實現(xiàn)相連區(qū)域的分割[3]。該文調(diào)用strel函數(shù),用于創(chuàng)建膨脹腐蝕及開閉運算等操作的結(jié)構(gòu)元素對象,且結(jié)構(gòu)元素可根據(jù)系統(tǒng)需要修改大小、形狀等參數(shù)。
在完成了腐蝕后,系統(tǒng)需要對所得圖像進行膨脹操作。因為腐蝕操作在運行時,會引起一定的圖像邊緣信息缺失,為了減少此類信息丟失的影響,系統(tǒng)需要進行膨脹操作。如圖3所示,膨脹是數(shù)學(xué)形態(tài)學(xué)上面的一個概念,屬于腐蝕的逆操作,可認(rèn)為是把二值圖像各1像素連接成分的邊界擴大一層,常用于填充邊緣或0像素內(nèi)部的孔。此處應(yīng)該注意,所用的結(jié)構(gòu)元素必須要與上一步的復(fù)式操作相同,使目標(biāo)圖像的信息丟失量降低。
該文先進行了數(shù)學(xué)形態(tài)學(xué)的腐蝕操作,而后再進行了數(shù)學(xué)形態(tài)學(xué)的膨脹操作,可實現(xiàn)去除圖像中孤立點、去除圖像毛刺、分割粘連區(qū)域的目的。
2.2 特征提取
在上文已經(jīng)對Hu不變矩的歷史與相關(guān)公式進行了詳細(xì)的介紹,此處則不再贅述。本文根據(jù)公式(3)~(9)編寫不變矩計算程序,并對所得不變矩矩值進行取對數(shù)操作。
2.3 特征匹配
該文使用歐氏距離作為判定依據(jù),根據(jù)最近鄰分類器的方法對待測圖像Hu不變矩信息與數(shù)據(jù)庫中Hu不變矩信息進行運算,實現(xiàn)模式識別的功能。以下對歐氏距離與最近鄰分類器進行介紹。
歐氏距離(Euclidean distance)也稱歐幾里得距離,它是一個通常采用的距離定義,它是在m維空間中兩個點之間的真實距離。歐氏距離可看作信號的相似程度。
歐氏距離的公式如下所示:
(11)
表示第一個點的第維坐標(biāo),表示第二個點的第維坐標(biāo);
維歐氏空間是一個點集,它的每個點可以表示,其中是實數(shù),稱為的第個坐標(biāo),兩個點和之間的距離定義為上面的公式。
通過計算各個圖像不變矩與給定圖像模板的不變矩之間的歐式距離,可以判斷圖像與各個模板間的相似程度。對輸入的數(shù)字圖像與給定的數(shù)字圖像模板進行對比,可實現(xiàn)自動分辨輸入圖像是否輸入給定模板的同類圖像,并選出其最可能的形狀類型。
根據(jù)以上的計算公式與判斷依據(jù),編寫了本系統(tǒng)的模式識別操作模塊。通過循環(huán)結(jié)構(gòu),使輸入數(shù)據(jù)與數(shù)據(jù)庫里的數(shù)據(jù)進行比對,實現(xiàn)模塊功能,并實現(xiàn)計數(shù)功能。
綜上所述,該文所用測試程序可實現(xiàn)圖像識別的功能,下面將進行程序測試與功能驗證。
3 系統(tǒng)測試與驗證
為驗證Hu不變矩在圖像識別中的應(yīng)用優(yōu)勢,下面以一實驗圖像作輸入,并輸出各步操作后的結(jié)果圖像與數(shù)據(jù)。
圖4為帶有椒鹽噪聲,各區(qū)域有黏連的彩色實驗圖像。以圖四作為程序的輸入,經(jīng)濾波、去噪與灰度化操作后,獲得圖5。
調(diào)用基于最大類間方差法的函數(shù)garythresh獲取合適的閾值,對圖五進行灰度二值化,獲得圖6。應(yīng)用數(shù)字形態(tài)學(xué)開運算,把黏連區(qū)域進行分割獲得圖7。
最后引入bwlabel函數(shù),對二維二值圖像中各個分離部分進行標(biāo)注,并獲得最佳圖像截取圖8。圖8中由左往右分別為待測圖像A、B、C、D。
此時,調(diào)用圖像特征提取程序,獲得各待測圖像的Hu不變矩數(shù)值,結(jié)果如表1所示,并將各圖像矩值與數(shù)據(jù)庫內(nèi)模板數(shù)值進行歐氏距離計算,結(jié)果如表2所示。通過將所得歐氏距離進行排序,獲得結(jié)論如下:圖A、B、C、D分別是星型、圓形、矩形、三角形,結(jié)果與實際相符。程序運行總時間為0.8 s。
4 結(jié)論
該文以Hu不變矩為判斷依據(jù),配合數(shù)字形態(tài)學(xué)、歐式判據(jù)等數(shù)學(xué)方法,以Matlab為平臺實現(xiàn)了圖像識別的功能。通過實驗可看出,基于Hu不變矩的圖像識別程序具有準(zhǔn)確率高,運算速度快的特點,說明Hu不變矩在圖像識別應(yīng)用中的優(yōu)勢。
參考文獻(xiàn)
[1] M.K.Hu.Visual Pattern Recognition by Moment Invariant[J].IRE Transactions on Information Theory,1962(8):179-187.
[2] 甘俊英.基于不變矩特征和神經(jīng)網(wǎng)絡(luò)的人臉識別模型[J].計算機工程與應(yīng)用, 2002(7):53-56.
[3] 吳丹,劉修國,尚建嘎.數(shù)學(xué)形態(tài)學(xué)在圖像處理與分析中的應(yīng)用及展望[J].工程圖學(xué)學(xué)報,2003(2):120-125.