張 琪,屈 嚴,董志芳
(東南大學電子科學與工程學院,南京 210096)
當今社會,圖像識別與檢索已經(jīng)成為我們正常生活中如影隨形的一項技術。但是由于在圖像獲取及傳輸過程中的數(shù)據(jù)丟失,圖像一定程度上會發(fā)生畸變,故而直接基于灰度圖的圖像識別早已不能滿足當今時代的要求。Hu 于1962年提出了用于區(qū)域形狀識別的連續(xù)函數(shù)不變矩[1],不變矩特征由于其在圖像平移、伸縮、旋轉時均保持不變,而且具有全局特性,已成為圖像識別的主要方法之一。但是,在離散狀態(tài)下Hu 矩的比例不變性并不成立[4],針對這一問題,許多學者進行了相應的研究工作。首先,由Chen 實現(xiàn)了離散狀態(tài)下的比例不變性[2],但是對邊界情況沒有考慮;之后,杜亞娟、王波濤、徐學強等人又相繼在前人的基礎上提出了改善的不變矩算法[3-7],最終將區(qū)域、邊界和離散狀態(tài)都考慮在內。但是,徐學強等人的算法在圖像識別的效率上具有一定的局限性,因而,我們在文獻5 的基礎上進行了優(yōu)化。經(jīng)過大量的識別實驗,結果表明,本文的不變矩算法具有良好的不變性,同時提高了圖像在尺度變換中識別率,同時針對圖像旋轉變換的特點[8],通過引入權向量一定程度上消除了識別的誤差,進一步提高了旋轉變換后的識別率,是一種更加穩(wěn)定的不變矩算法。
一幅M×N 圖像f(x,y)的(p+q)階原點矩和(p+q)階中心矩分別定義為:
其中,(ˉx,ˉy)為圖像f(x,y)灰度質心。
歸一化的中心距定義為:
Hu 利用歸一化的二階和三階中心距構造了7個不變矩函數(shù)值式,這7個函數(shù)式對于平移、旋轉、尺度變換都具有不變性。為了方便計算我們只取前4個不變矩,分別用φ1、φ2、φ3、φ4表示。
文獻[5]證明了在離散狀態(tài)下,Hu 定義的7個不變矩的比例不變性是不成立的。因此需要對Hu進行改進,但該方法在應用中具有一定的局限性,因此我們改進了文獻[5]的統(tǒng)一Hu 矩,構造出新的,但同樣適用基于區(qū)域矩、邊界矩、離散狀態(tài)的歸一化中心矩,具體如下所示:
其中k值表征的是尺度變換后新坐標點相對于原坐標點的伸縮的倍率。
根據(jù)k值表征的意義,要得到離散狀態(tài)下不變矩,就必須消去此伸縮倍率?;谶@種思想,我們在文獻[5]中的統(tǒng)一Hu 矩的基礎上,進一步改進的不變矩如下:
可以證明:對于區(qū)域、邊界、離散的情況,不變矩的公式是統(tǒng)一的,但由于篇幅所限這里不作證明。
上文已經(jīng)說明,在區(qū)域、邊界、離散情況下,不變矩的公式是統(tǒng)一的,于是我們在圖像的識別上就不考慮邊界效應的影響,因此對于圖像的識別就集中在對統(tǒng)一Hu 中5個參數(shù)的利用和判別上。
在原點矩和中心距的定義式(1)、式(2)中,圖像經(jīng)過角度θ(初始角度設為θ0,(ˉx,ˉy)為灰度質心,Δx,Δy 表示待旋轉點相對于質心的坐標)的旋轉后,新圖像變?yōu)閒(x′,y′),于是我們可以得到:
根據(jù)μpq的定義可得:
其中F1=p1×cos(α);F2=p2×sin(α),并合并為F=p×cos(α+φ)。
故μpq將包含有Fp+q+1,F(xiàn)p+q兩項,而μ00則只包含有F 的1 次方項。對于前一項,在歸一化中心距的計算中由于和μ00的階數(shù)相同,因而在歸一化中心距的計算中會消去,因此不予考慮。對于第二項,在歸一化中心距的計算中會留下F-1項,導致后邊的計算產生誤差。為了消除誤差,引入權向量A,根據(jù)各矩所需的需消誤差來分配權值。
對A* 歸一化即可得到權向量A。
在行業(yè)交流方面,聯(lián)盟共舉辦三屆“全國BIM聯(lián)盟聯(lián)席會”,邀請各省市BIM聯(lián)盟參加,通過每年舉辦一屆聯(lián)席會,加強全國各BIM聯(lián)盟之間交流;走訪聯(lián)盟觀察員單位,與裝配式鋼結構民用建筑產業(yè)技術創(chuàng)新戰(zhàn)略聯(lián)盟進行工作交流;受香港科技大學(The Hong Kong University of Science and Technology, HKUST)和香港建造業(yè)議會(The Construction Industry Council,CIC)的邀請參加“全球BIM標準現(xiàn)狀”技術論壇。
每個統(tǒng)一矩對于相似度的貢獻自然不同,根據(jù)實際應用的同一類圖像在得到圖像旋轉各個角度的矩后,除以原圖像的各個矩的值進行歸一化處理,然后每個矩用最大值減去平均值可以近似的得到a值。于是我們得到了5個a值a1,a2,a3,a4,a5,也得到了向量A*,歸一化后得A。
定義圖像識別的目標函數(shù)為:
S 用以表征圖像間的相似度,越小表示相似度越高,識別性越好。
為了驗證改進的統(tǒng)一Hu 矩對圖像識別的有效性,我們選用圖1所示的4 類圖像進行類間圖像識別實驗,通過比較其目標函數(shù)的大小來進行圖像識別。每副圖又分別經(jīng)過平移、旋轉和尺度變換各產生26副實驗樣本圖像,繼而進行類內相似度匹配實驗。
圖1 四幅不同類型的圖像
圖1為4 類樣本的基準圖,表1 給出了相應的矩不變量,及另外3 幅圖與目標圖像的相似度比較。
對于目標圖像可以選取圖像的權向量為:
表1 類間目標特征差異實驗數(shù)據(jù)
分析表1 數(shù)據(jù),可以看出,不同圖像之間統(tǒng)一Hu 矩的差異明顯。由于S 越接近0,相似度越高,G1、G2、G3與目標圖像的相似度差異在0.05 以上,完全可以將目標圖像從其他圖像中識別出來。
采用了圖1 的目標圖像進行識別實驗。每一種基準圖像分別以旋轉,平移和尺度變換產生3 組圖像,共計26 副圖像。目標圖像經(jīng)過平移、旋轉和尺度變換后相似度檢測,得到表2。
表2 目標圖像在平移、旋轉和尺度變換后的相似度比較
當相似度閾值設定為0.015 時,有5個沒有識別出來,識別率為80.76%。當相似度閾值設為0.025 時,26個樣本中僅有一個樣本沒有識別出來,識別率為96.15%。另外,在尺度變換中相似度S值在0.01 以下,具有很好的識別效果,經(jīng)分析得到是對統(tǒng)一Hu 矩φ3改進后的效果。
為了對比改進后的效果,我們做出下表來進行說明。
在0.025為閾值的條件下的識別度見表3。
表3 閾值為0.025 時的識別百分比
在0.015為閾值的條件下的識別度見表4。
表4 閾值為0.015 時的識別百分比
通過對比可以發(fā)現(xiàn),改進后的算法在圖像旋轉和尺度變換的識別上有很大幅度的提高,其中尺度變換的矩不變性在實驗中很好的表現(xiàn)了出來。
本文對離散狀態(tài)下歸一化中心距和統(tǒng)一Hu 矩進行了改進,使得在尺度變換中統(tǒng)一Hu 矩的識別率顯著提高,并證明了改進后的統(tǒng)一Hu 矩同樣具有區(qū)域、邊界、離散狀態(tài)下的不變性。但同時發(fā)現(xiàn)了其對于旋轉的識別效果仍需提高,所以經(jīng)過誤差分析后提出了權向量的改進方法,大幅度提高了圖像經(jīng)過旋轉變換后的識別率,具有更好地應用前景。
[1]丁明躍.不變矩算法研究[J].數(shù)據(jù)采集于處理,1992,7(1):1-9.
[2]Chen C C.Improved Moment Invariants for Shape Discrimination[J].Patten Recognition,1993,26(5):683-686.
[3]杜亞娟,潘泉,張洪才.一種新的不變矩特征在圖像識別中的應用[J].系統(tǒng)工程與電子技術,1999,21(10):71-74.
[4]王波濤,孫景鰲,蔡安妮.相對矩及在幾何形狀識別中的應用[J].中國圖像圖形學報,2001,6(3):296-300.
[5]徐學強,汪渤,賀鵬.統(tǒng)一Hu 矩及在電視圖像目標識別中的應用[J].計算機工程與應用,2006,29:213-214.
[6]肖家慶,盧凌,李晟,等.基于矩不變量的圖像識別[J].武漢理工大學學報,2006,30(4):696-699.
[7]柳林霞,陳杰,竇麗華.不變矩理論及其在目標識別中的應用[J].火力與指揮控制,2003,28(2):13-14.
[8]程波,楊陽,沈田雙.一種基于不變矩和SVM 的圖像目標識別方法[J].儀器儀表學報,2006,27(6):2093-2093.