蔡小帥,張榮國,李富萍,劉小君
(1.太原科技大學計算機科學與技術學院,太原030024;2.合肥工業(yè)大學機械與汽車工程學院,合肥230009)
基于Zernike矩的模糊與仿射混合不變量研究
蔡小帥1,張榮國1,李富萍1,劉小君2
(1.太原科技大學計算機科學與技術學院,太原030024;2.合肥工業(yè)大學機械與汽車工程學院,合肥230009)
Zernike矩作為形狀描述子,其信息冗余度低且對噪聲不敏感,在圖像特征提取和模式識別中得到了廣泛應用。為提高Zernike矩對含有模糊和仿射圖像的形狀描述能力,提出一種基于Zernike矩的形狀描述子,該描述子使用規(guī)范化方法構造Zernike矩的仿射不變量,結合Zernike矩的模糊不變量得到Zernike矩的模糊和仿射混合不變量。將該矩混合不變量作為形狀描述子描述圖像的形狀特征,并與幾何矩模糊和仿射混合不變量進行對比實驗,結果表明,Zernike矩的模糊和仿射混合不變量在混合形變下形狀描述能力較強,具有不變性,并且對噪聲的魯棒性較好。
Zernike矩;形狀描述子;規(guī)范化方法;點擴展函數(shù);仿射不變量;模糊不變量
在圖像的實際采集過程中,由于對焦錯誤、設備移動、環(huán)境及其他方面的影響,使采集到的圖像往往有不同程度降質,其中包括模糊形變和仿射形變。傳統(tǒng)的形狀描述子對這類圖像的描述能力弱,因此對這些降質圖像中物體的形狀描述成為計算機視覺、模式識別及醫(yī)學成像等領域的重要任務。近年來,國內外對模糊和仿射形變圖像的形狀描述及識別方法研究較為廣泛和深入的是矩不變量方法[1]。對于仿射不變量,文獻[2]采用代數(shù)不變量的理論獲得了幾何矩仿射不變量;文獻[3]提出了采用規(guī)范化方法構建仿射不變量。在模糊不變量方面,文獻[4]引入點擴展函數(shù)法得到幾何矩模糊不變量。后來,文獻[5]提出利用點擴展函數(shù)的相關理論得到同時對模糊和仿射變換具有不變性的矩混合不變量;文獻[6]采用直接構造法和規(guī)范化方法得到了幾何矩模糊和仿射混合不變量。然而幾何矩都是非正交的,有一定的信息冗余且噪聲敏感度高。文獻[7]認為正交矩的形狀描述能力強、噪聲魯棒性好且信息冗余度低。因此,文獻[8]提出了Legendre矩的模糊和仿射混合不變量;文獻[9]構造了一種Techebichef矩的模糊和仿射混合不變量。雖然Zernike矩的各階矩相互獨立、信息冗余度小且抗噪能力強,得到了廣泛的應用和研究。但除了文獻[10]提出的Zernike矩的模糊和旋轉混合不變量和文獻[11]介紹的Zernike矩的相似和模糊混合不變量外,還沒有看到同時對模糊和仿射形變具有不變性的不變量的相關報道,因此構造相應的Zernike矩不變量處理含有混合形變的圖像有一定的研究價值。
在上述研究工作的基礎上,本文提出一種基于Zernike矩的形狀描述子,該描述子采用規(guī)范化方法消除仿射變換中仿射參數(shù)的影響,利用點擴展函數(shù)相關理論得到模糊不變量,通過兩者結合得到同時對模糊和仿射變換具有不變性的Zernike矩,并通過實驗進行了驗證。
2.1 Zernike矩的定義
p階的Zernike多項式為定義在極坐標系下單位圓上的復數(shù)多項式Vpq(x,y),表達式如下:
令k=p-2s,Rpq(ρ)關于ρ的冪級數(shù)形式如下:
其中,(n-k)為偶數(shù)。
以正交Zernike多項式為核的階數(shù)為p,重復度為q的Zernike矩的定義為:
由式(4)和式(3)可以得到Zernike矩與幾何矩的關系如下[12]:
其中,t=(k-q)/2,且p-k為偶數(shù)。
2.2 幾何矩的定義
令f(x,y)為圖像的密度函數(shù),則它的(p+q)階幾何矩函數(shù)的定義如下:
(p+q)階中心矩表示為:
其中,p,q=0,1,…,∞且x0=m10/m00,y0=m01/m00。
3.1 Zernike矩的模糊不變量
圖像的模糊形變過程可以表示為原圖像f(x,y)和一個任意中心對稱的點擴展函數(shù)(PFS)h(x,y)的卷積,即:
該點擴展函數(shù)h(x,y)具有如下性質:
針對這個點擴展函數(shù) h(x,y),可以構造出Zernike矩的模糊不變量,表示如下[11]:
3.2 Zernike矩的仿射不變量
仿射變換是一種從空間坐標(x,y)變換到新的坐標(u,v)的線性變換,可寫成如下矩陣表示形式:
本文運用中心矩代替幾何矩消除平移變換的影響,然后運用由Rothe提出的XSR分解法把矩陣A分解成為1個x剪切矩陣,1個均勻縮放矩陣和1個旋轉矩陣3個矩陣,其表示如下:
(1)x剪切不變量
(2)均勻縮放不變量
(3)旋轉不變量
把下面的方程規(guī)范化為0得到變換參數(shù)θ:
3.3 Zernike矩模糊和仿射混合不變量
仿射不變量的任意線性函數(shù)仍是仿射不變的。使用式(15)替代式(9)中的Zernike矩函數(shù),即可獲得 Zernike矩模糊和仿射混合不變量,表示如下:
下面的實驗用來說明并驗證本文所提出的Zernike矩模糊和仿射混合不變量(ZCMI)的圖像描述能力、對模糊和仿射變換的不變性及噪聲魯棒性。
4.1 圖像描述能力分析
本文實驗平臺為:Windows XP,Matlab R2012(a), CPU:Intel Celeron(R),1.86 GHz,ROM:1 GB。
首先測試ZCMI對于退化圖像(包括仿射和模糊)的描述性能,如圖1、圖2所示。圖像lena和圖像birthday,圖1(a)和圖2(a)為圖像的原始圖像,圖1(b)和圖2(b)為僅發(fā)生了仿射變換后的圖像,圖1(c)~圖1(e)和圖2(c)~圖2(e)為不僅發(fā)生了仿射變換并且分別同時加入了模糊參數(shù)為[3 3]的平均模糊、模糊參數(shù)為[5 5]的高斯模糊、模糊參數(shù)為5的圓形區(qū)域均值模糊及模糊參數(shù)為9的運動模糊,其中仿射變換中仿射矩陣各元素值為a11=1.483,a12=2,158,a13= -0.723,a14= 0.850。為了測試ZCMI對退化圖像的描述能力,將分別通過對圖1和圖2中各圖的矩不變量值對此予以驗證。表 1和表 2分別為圖 lena和圖birthday各變換圖像的8個矩不變量值,其中,μ代表6幅圖像各階矩的矩平均值,σ代表平均誤差, σ/μ(%)代表平均誤差率。從表1和表2可以看出,經過模糊和仿射變換的各圖像的矩不變量值并不是恒定不變的,而是在一定的范圍內波動,但平均誤差率低,整體較為穩(wěn)定,說明這些矩不變量值的波動程度是可以接受的,驗證了ZCMI對退化的圖像具有較好的形狀描述能力。
圖1 圖像lena的仿射和模糊圖像
圖2 圖像birthday的仿射和模糊圖像
表1 圖像lena的ZCMI矩不變量
表2 圖像birthday的ZCMI矩不變量
4.2 不變性驗證及噪聲魯棒性
本文實驗用來驗證ZCMI對模糊和仿射形變的不變性以及對噪聲的魯棒性。實驗圖像為圖像lena,圖1(a)為原始圖像,圖1(c)~圖1(f)分別對圖像加入了仿射和模糊形變。為了測試本文提出的描述子對噪聲的魯棒性,圖 1(c),圖 1(d)和圖1(e),圖1(f)中分別加入了不同密度的高斯噪聲和椒鹽噪聲,其噪聲密度為0.01~0.20;兩幅圖像的矩不變量值之間的相對誤差可以表示為:
其中,f和g分別用來表示原始圖像和其發(fā)生某種形變后的圖像。相對誤差在此用來衡量形狀描述子的不變性。其中,~(p)及I(p)為向量;,,p≥ 0,且I(p,q)在式(16)中已給出定義。
圖3為分別使用本文提出ZCMI和Zhang等提出的幾何矩模糊和仿射不變量(GCMI)計算出的原始圖像和形變圖像的矩不變量值之間相對誤差的變化情況。圖3的2條曲線分別表示使用GCMI和本文提出的ZCMI獲得的相對誤差。由圖3(a)、圖3(c)、圖3(d)可以看出,在圖像包含有仿射形變和不同模糊形變的條件下,加入不同密度的噪聲時,與GCMI相比,隨著噪聲密度的增大,ZCMI仍能夠獲得較小的相對誤差;雖然圖3(b)中出現(xiàn)個別不穩(wěn)定現(xiàn)象,但整體相對誤差仍然相對較小。因此,實驗結果表明在不同的混合形變和不同的噪聲作用下,與GCMI相比,本文提出ZMCI不變性及噪聲的魯棒性較好。
圖3 不同矩混合不變量的相對誤差
本文提出一種基于Zernike矩的模糊和仿射形變具有不變性的形狀描述子。該描述子采用規(guī)范化方法消除仿射變換的影響,得到Zernike矩仿射不變量;將其與用中心對稱點擴展函數(shù)方法得到的Zernike矩模糊不變量相結合構造出Zernike矩模糊和仿射混合不變量。實驗結果表明,與幾何矩模糊和仿射混合不變量相比,本文提出的Zernike矩模糊和仿射不變量描述能力強、不變性好,且對噪聲敏感度小。
[1] Flusser J,Suk T.Moment and Moment Invariants in Pattern Recognition[M].Oxford,UK:John Willey& Sons,2009:1-5.
[2] Flusser J,Suk T.Pattern Recognition by Affine Moment Invariants[J].Pattern Recognition,1993,26(1): 167-174.
[3] Rothe I,Susse H,Voss K.The Method of Normalization to Determine Invariants[J].IEEE Transactions on Pattern Anal.Mach.Intel.,1996,18(4):366-375.
[4] Flusser J,Suk T.Degraded Image Analysis:An Invariant Approach[J].IEEE Transactions on Pattern Anal.Mach.Intell.,1998,20(6):590-603.
[5] Suk T,Flusser J.Combined Blur and Affine Moment Invariants and Their use in Pattern Recognition[J].Pattern Recognition,2003,36(12):2895-2907.
[6] Zhang Y N,Wen C Y,Zhang Y,et al.Determination of Blur and Affine Combined Invariants by Normalization[J].Pattern Recognition,2002,35(1):211-221.
[7] Shu H Z,Zhou J,Han G N,et al.Image Reconstruction from Limited Range Projections Using Orthogonal Moments[J].Pattern Recognition,2007,40(2):670-680.
[8] 戴修斌,張 輝,舒華忠,等.基于正交矩模糊和仿射混合不變量的圖像識別算法[J].東南大學學報:自然科學版,2011,41(1):52-57.
[9] Li Q,Zhu H Q,Liu Q.Image Recognition by Combined Affine and Blur Tchebichef Moment Invariants[C]// Proceedings of the 4th International Congress on Image and Signal Processing.[S.1.]:IEEE Press,2011: 1517-1521.
[10] Zhu H Q,Liu M.Combined Invariants to Blur and Rotation Using Zernike Moment Descriptors[J].Pattern Analysis and Applications,2010,13(1):309-319.
[11] Chen B J,Shu H Z.Combined Invariants to Similarity Transformation and to Blur Using Orthogonal Zernike Moments[J].IEEE Transactions on Image Processing, 2011,20(2):345-360.
[12] Teague M R.Image Analysis via the General Theory of Moments[J].Journal of Optimal Society of American, 1980,70(8):920-930.
編輯 索書志
Study on Blur and Affine Combined Invariants Based on Zernike Moment
CAI Xiaoshuai1,ZHANG Rongguo1,LI Fuping1,LIU Xiaojun2
(1.School of Computer Science and Technology,Taiyuan University of Science and Technology,Taiyuan 030024,China;
2.School of Mechanical and Automotive Engineering,Hefei University of Technology,Hefei 230009,China)
Zernike moment,as a shape descriptor,has been widely used in image characteristics extraction and pattern recognition.It is low information redundancy and not sensitive to noise.To improve the shape description capability of the images which are degraded by combined blur and affine transformation,a new shape descriptor based on Zernike moment is proposed.The normalization method is used to construct affine invariants of Zernike moment.The combined blur and affine moment invariants of Zernike moment is achieved by the help of the blur invariants.The combined moment invariants is used as the shape descriptor to describe the shape feature of images,and is implemented comparison with the combined affine and blur invariants based on geometric moment with relative error.Experimental results show that the combined blur and affine invariants of Zernike moment can get better shape description and invariance in combined degrades,and robustness to noise.
Zernike moment;shape descriptor;normalization method;point spread function;affine invariant; blur invariant
1000-3428(2014)11-0215-05
A
TP391
10.3969/j.issn.1000-3428.2014.11.042
國家自然科學基金資助項目(51075113);山西省自然科學基金資助項目(2013011017);高等學校博士基金資助項目(20122025);太原科技大學校研究生創(chuàng)新基金資助項目(20125024)。
蔡小帥(1987-),女,碩士研究生,主研方向:圖形圖像處理;張榮國,教授;李富萍,講師;劉小君,教授、博士生導師。
2013-11-05
2013-12-31E-mail:zhrgty@163.com
中文引用格式:蔡小帥,張榮國,李富萍,等.基于Zernike矩的模糊與仿射混合不變量研究[J].計算機工程,2014, 40(11):215-219.
英文引用格式:Cai Xiaoshuai,Zhang Rongguo,Li Fuping,et al.Study on Blur and Affine Combined Invariants Based on Zernike Moment[J].Computer Engineering,2014,40(11):215-219.