朱 明,孫繼剛,2,郭立強(qiáng)
(1.中國(guó)科學(xué)院長(zhǎng)春光學(xué)精密機(jī)械與物理研究所,吉林長(zhǎng)春130033; 2.中國(guó)科學(xué)院 研究生院,北京100039)
圖像矩函數(shù)的定義及其不變性的研究始于上個(gè)世紀(jì)60年代,發(fā)展于80、90年代。從圖像中計(jì)算出來(lái)的矩不變量集合描述了圖像的全局特征,并提供了該圖像區(qū)別于其它圖像所特有的幾何信息,圖像矩不變量的這種特征描述能力被廣泛地應(yīng)用于圖像匹配和模式識(shí)別領(lǐng)域中。從仿生學(xué)角度來(lái)講,圖像的矩不變量反映了視覺(jué)信息在某些變換下所具有的不變性,即不同模式之間的本質(zhì)差別。從數(shù)學(xué)角度來(lái)講,矩不變量是一類代數(shù)不變量。
有關(guān)矩不變量的開拓性工作由Hu提出[1],他利用代數(shù)不變量理論推出了7個(gè)相似矩不變量并把它們應(yīng)用于目標(biāo)識(shí)別中。但相似變換只是圖像幾何形變中較小的一類,在實(shí)際的工程應(yīng)用中需要構(gòu)造仿射變換下的矩不變量。目前,國(guó)內(nèi)外有關(guān)仿射不變量的研究論文有百余篇,研究方法也比較多,一些經(jīng)典的方法,如:基于小波的仿射不變量研究[3]、互權(quán)重矩方法[4](cross-weighted moments)、多尺度自卷積方法[5]及基于trace變換的仿射不變量構(gòu)造[6]等。此外還有基于矩技術(shù)的仿射不變量研究,如:Flusser和Reiss分別獨(dú)立構(gòu)造了仿射矩不變量[2,7]。文獻(xiàn)[7-8]中討論了仿射矩不變量在目標(biāo)識(shí)別中的應(yīng)用。文獻(xiàn)[9]把仿射矩不變量用于圖像匹配。文獻(xiàn)[10]構(gòu)造了模糊條件下的仿射矩不變量。文獻(xiàn)[11]利用仿射矩不變量對(duì)發(fā)生仿射形變的圖像進(jìn)行配準(zhǔn)。文獻(xiàn)[12]研究了基于Hu矩構(gòu)造仿射矩不變量的方法。文獻(xiàn)[13]采用圖論的方法構(gòu)造了高階仿射矩不變量。文獻(xiàn)[14]在傅里葉變換域中構(gòu)造了仿射矩不變量并用于對(duì)稱圖像的識(shí)別。
盡管關(guān)于仿射不變量的研究論文很多,但研究的對(duì)象都是灰度圖像,有關(guān)彩色圖像矩不變量的研究卻很少。這主要是由于矢量信號(hào)處理理論尚未完全建立起來(lái),目前針對(duì)彩色圖像處理的算法多是以分通道的形式來(lái)處理的。
本文以四元數(shù)矩陣來(lái)對(duì)彩色圖像進(jìn)行建模,定義了四元數(shù)矩并構(gòu)造了該矩函數(shù)的仿射不變量?;谒脑獢?shù)矩的仿射不變量研究為彩色圖像的不變量理論提供了一個(gè)新的方法。實(shí)驗(yàn)結(jié)果表明,本文所提出的算法要優(yōu)于分通道處理的方法。
這里簡(jiǎn)要介紹有關(guān)四元數(shù)的基礎(chǔ)知識(shí)。
四元數(shù)是復(fù)數(shù)的推廣,是由1個(gè)實(shí)部和3個(gè)虛部構(gòu)成,即:
其中,3個(gè)虛部滿足如下乘法規(guī)則:
若四元數(shù)q的實(shí)部為零,稱q為純四元數(shù)。
四元數(shù)的共軛為:
四元數(shù)的范數(shù)為:
四元數(shù)的逆為:
若純四元數(shù)q的范數(shù)為1,稱q為單位純四元數(shù)。
設(shè)μ為單位純四元數(shù),四元數(shù)的歐拉公式為:
對(duì)于一幅彩色圖像f(x,y),把它以純四元數(shù)的形式進(jìn)行表示:
其中:fR(x,y),fG(x,y)和fB(x,y)分別代表彩色圖像的R、G和B分量,x和y分別代表像素所在圖像矩陣的行號(hào)和列號(hào)。這樣,一幅彩色圖像就可以用四元數(shù)矩陣來(lái)表示?;谒脑獢?shù)的彩色圖像處理就是直接對(duì)這個(gè)四元數(shù)矩陣來(lái)處理的,相對(duì)于傳統(tǒng)的分通道或是變換成灰度圖像后再處理的方法而言,四元數(shù)方法更能體現(xiàn)出彩色圖像的整體性,為實(shí)際的工程應(yīng)用提供了一個(gè)新的突破點(diǎn)。
從數(shù)學(xué)角度來(lái)講,矩函數(shù)(嚴(yán)格意義上講是泛函)是一個(gè)積分變換,把圖像f(x,y)投影到核函數(shù)上,對(duì)積分結(jié)果進(jìn)行適當(dāng)?shù)奶幚韥?lái)構(gòu)造相應(yīng)變換下的不變量。本節(jié)給出了基于四元數(shù)的彩色圖像矩函數(shù)表達(dá)式。由于四元數(shù)乘法不滿足交換律,因此它有3種表達(dá)式。
設(shè)彩色圖像為f(x,y),(m+n)階左四元數(shù)矩定義如下:
右四元數(shù)矩定義如下:
雙邊四元數(shù)矩定義如下:
其中,μ為任意單位純四元數(shù),這里μ的取值為:
盡管四元數(shù)矩的表達(dá)式有3種,但在描述彩色圖像幾何形變的能力上是一樣的[17]。為了下文論述方便起見(jiàn),本文中四元數(shù)矩是指左四元數(shù)矩。四元數(shù)矩的離散化形式如下:
仿射變換由旋轉(zhuǎn)、尺度、剪切和平移變換構(gòu)成:
其中,α≠β,δ≠0。
接下來(lái)研究在上述4個(gè)變換下的不變量,最終實(shí)現(xiàn)仿射不變量的構(gòu)造。首先把式(9)變換到極坐標(biāo)系下:
設(shè)f(r,θ+φ)是原始彩色圖像f(r,θ)旋轉(zhuǎn) φ角度得到的,把f(r,θ+φ)帶入到式(15)中得到:
對(duì)式(16)兩端取范數(shù),得:
式(17)表明,四元數(shù)矩函數(shù)的范數(shù)具有旋轉(zhuǎn)不變性。接下來(lái)利用二項(xiàng)式定理把式(15)的積分核展開:
其中:
Hp,q的形式與傳統(tǒng)的Hu矩一樣,惟一不同的是Hp,q中被積函數(shù)f(x,y)是四元數(shù)值函數(shù),相應(yīng)地積分值也是四元數(shù)。這里利用文獻(xiàn)[18]中的歸一化方法來(lái)構(gòu)造Hp,q在尺度和剪切變換下的不變量。
對(duì)于剪切變換,x'=x+ δx,y'=y:
由上式知:
令H'1,1=0,可得,把它帶入式(19)中,可以得到具有剪切不變性的函數(shù):
對(duì)于尺度變換x'= αx,y'=βy,有:
接下來(lái)在式(21)和式(22)的基礎(chǔ)上構(gòu)造具有尺度不變性的矩函數(shù):
由式(23)得到如下方程組:解該方程組得:把式(25)帶入式(23)中得到具有剪切和尺度不變性的矩函數(shù):
平移不變性的獲取是通過(guò)把彩色圖像的坐標(biāo)原點(diǎn)平移到彩色圖像的重心實(shí)現(xiàn)的。最終,可以構(gòu)造出基于四元數(shù)矩的仿射不變量:
圖1 仿射變換前后的8幅圖像Fig.1 Color images and their affine transformed versions
本節(jié)給出了四元數(shù)矩仿射不變量的數(shù)值結(jié)果,并與文獻(xiàn)[15]中所提出的彩色矩仿射不變量進(jìn)行對(duì)比。圖1中,第1幅圖像為原始圖像,其余7幅圖像是經(jīng)過(guò)仿射變換后的圖像,仿射變換的參數(shù)隨機(jī)選定。在圖像的下方有該圖像的尺寸參數(shù)。
利用式(27)計(jì)算各幅圖像的低階仿射不變矩,其結(jié)果見(jiàn)表1。表2是彩色矩仿射不變量的實(shí)驗(yàn)結(jié)果。
F.Mindru等人對(duì)Hu矩進(jìn)行推廣,定義了彩色矩仿射不變量:
這里只列舉了該文獻(xiàn)中的兩個(gè)不變量,在表2中,各個(gè)不變量的具體表達(dá)式以及這方面更詳細(xì)的內(nèi)容可參見(jiàn)文獻(xiàn)[15]。
本文采用標(biāo)準(zhǔn)差與期望之比(σ/u)來(lái)對(duì)不變量的穩(wěn)定性進(jìn)行量化。由于標(biāo)準(zhǔn)差刻畫了樣本偏離均值上下波動(dòng)的程度,σ相對(duì)于u越小,則說(shuō)明樣本越穩(wěn)定。
對(duì)比表1和表2,本文所提出的不變量的σ/u值比彩色矩仿射不變量的穩(wěn)定性提高了2個(gè)數(shù)量級(jí)。文獻(xiàn)[15]中彩色矩的表達(dá)式對(duì)彩色圖像的RGB通道分別進(jìn)行了冪運(yùn)算處理。以彩色矩為基礎(chǔ)的不變量構(gòu)造還可能只涉及某一個(gè)或兩個(gè)通道的數(shù)據(jù)。本文所提出的四元數(shù)矩,彩色圖像以純四元數(shù)的形式參與運(yùn)算,并不涉及通道數(shù)據(jù)的冪運(yùn)算,數(shù)值穩(wěn)定性會(huì)高一些??傊?,本文所提出的四元數(shù)矩仿射不變量可以作為模式識(shí)別中彩色目標(biāo)的特征描述子。
表1 四元數(shù)矩仿射不變量Tab.1 Quaternion moment invariants
表2 彩色矩仿射不變量Tab.2 Color moment invariants
本文把傳統(tǒng)灰度圖像的復(fù)數(shù)矩推廣到四元數(shù)層面,提出了四元數(shù)矩的定義,構(gòu)造了基于四元數(shù)
矩的彩色圖像仿射不變量。實(shí)驗(yàn)結(jié)果表明:本文所提出的不變量的穩(wěn)定性要優(yōu)于L.V.Gool等人提出的彩色矩仿射不變量[15],其σ/u值提高了2個(gè)數(shù)量級(jí)。未來(lái)的工作主要是研究利用本文所提出的四元數(shù)矩不變量進(jìn)行彩色目標(biāo)識(shí)別。
[1]HU M K.Visual pattern recognition by moment invariants[J].IRE Trans.Inf.Theory,1962,8(2):179-187.
[2]REISS T H.The revised fundamental theorem of moment invariants[J].IEEE Trans.PAMI,1991,13(8):830-834.
[3]TIENG Q M,BOLES W W.Wavelet-based affine invariant representation:a tool for recognition planar objects in 3D space[J].IEEE Trans.PAMI.,1997,19(8):846-857.
[4]YANG ZH W,COHEN F S.Cross-weighted moments and affine invariants for image registration and matching[J].IEEE Trans.PAMI.,1999,21(8):804-814.
[5]HEIKKIL? J.Multi-scale autoconvolution for affine invariant pattern recognition[C].Proceedings of the 16th International Conference on Pattern Recognition(ICPR'02),Quebec,Canada,11-15 Aug,2002:119-122.
[6]PETRON M,KADYROV A.Affine invariant features from the trace transform[J].IEEE Trans.PAMI.,2004,26(1):30-44.
[7]FLUSSER J,SUK T.Affine moment invariants:a new tool for character recognition[J].Pattern Recog.Lett.,1994,15(4):433-436.
[8]MEI Y,ANDROUTSOS D.Robust affine invariant region-based shape descriptor:the ICA Zernike moment shape descriptor and the whitening Zernike moment shape descriptor[J].IEEE Trans.Signal Proc.,2009,16(10):877-880.
[9]HEIKKILA J.Pattern matching with affine moment descriptors[J].Pattern Recogn.Lett.,2004,37(9):1825-1834.
[10]SUK T,F(xiàn)LUSSER J.Combined blur and affine moment invariants and their use in pattern recognition[J].Pattern Recogn.Lett.,2003,36(2):2895-2907.
[11]FLUSSER J,SUK T.A moment-based approach to registration of images with affine geometric distortion[J].IEEE Trans.Geoscience and Remote Sensing,1994,32(2):382-387.
[12]LIU J,LI D,TAO W,et al.An automatic method for generating affine moment invariants[J].Pattern Recogn.Lett.,2007,28(16):2295-2304.
[13]SUK T,F(xiàn)LUSSER J.Graph method for generating affine moment invariants[C].Proceedings of the 17th International Conference on Pattern Recognition(ICPR'04),Cambridge,UK,23-26 Aug,2004:192-195.
[14]WEN CH Y,ZHANG Y,ZHANG Y N.Recognition of symmetrical images using affine moment invariants in both frequency and spatial domains[J].Pattern Anal Appl,2002,5(3):316-325.
[15]MINDRU F,TUYTELAARS T,GOOL L V,et al.Moment invariants for recognition under changing viewpoint and illumination[J].Computer Vis.Image Und.,2004,94(1-3):3-27.
[16]KANTOR I L,SOLODOVNIKOV A S.Hypercomplex Number:An Elementary Introduction to Algebras[M].NewYork:Springer-Verlag,1989.
[17]郭立強(qiáng).基于四元數(shù)的彩色圖像處理算法研究[D].北京:中國(guó)科學(xué)院研究生院,2011.GUO L Q.The study of color image processing algorithms based on quaternion[D].Beijing:Graduate University of Chinese Academy of Sciences,2011.(in Chinese)
[18]ROTHE I,SUSSE H,VOSS K.The method of normalization to determine invariants[J].IEEE Trans.PAMI,1996,18
(4):366-376.