阿卜杜如蘇力·奧斯曼,吐爾洪江·阿布都克力木,馬麗亞木·阿布來(lái)孜ABDURUSUL Osman,MARYAMGULAbliz,TURGHUNJAN Abdukirimturki
新疆師范大學(xué) 數(shù)學(xué)科學(xué)學(xué)院,烏魯木齊 830054
綜合顏色特征與形狀特征的圖像檢索算法
阿卜杜如蘇力·奧斯曼,吐爾洪江·阿布都克力木,馬麗亞木·阿布來(lái)孜ABDURUSUL Osman,MARYAMGULAbliz,TURGHUNJAN Abdukirimturki
新疆師范大學(xué) 數(shù)學(xué)科學(xué)學(xué)院,烏魯木齊 830054
由于小波變換具有良好的局部特性與多尺度特性,能多尺度逼近邊緣,這使得它在圖像奇異性檢測(cè)和特征提取方面得到了廣泛的應(yīng)用。采用二次樣條二進(jìn)小波變換進(jìn)行邊緣檢測(cè),用邊緣梯度方向直方圖表示圖像形狀特征,用顏色直方圖表示圖像顏色特征,提出了綜合顏色特征和形狀特征的圖像檢索算法。實(shí)驗(yàn)結(jié)果表明,該算法不僅具有較好的檢索性能,而且對(duì)圖像中存在的光照變化和幾何變化(尺度、平移、旋轉(zhuǎn)等)具有較強(qiáng)的魯棒性。
圖像檢索;二進(jìn)小波變換;邊緣檢測(cè);顏色特征;形狀特征
隨著數(shù)據(jù)庫(kù)技術(shù)、多媒體技術(shù)、網(wǎng)絡(luò)技術(shù)的迅速發(fā)展,人們?cè)絹?lái)越多地接觸到大量的數(shù)字圖像數(shù)據(jù)庫(kù),為了對(duì)圖像庫(kù)進(jìn)行有效管理,高效的圖像檢索系統(tǒng)為人們所需要[1]。傳統(tǒng)的基于文本的圖像檢索方法已經(jīng)不能滿足實(shí)際的需求。為了克服傳統(tǒng)檢索方法的局限性,基于內(nèi)容的圖像檢索技術(shù)應(yīng)運(yùn)而生。因此基于內(nèi)容的圖像檢索技術(shù)已迅速成為圖像數(shù)據(jù)庫(kù)技術(shù)中的研究熱點(diǎn)之一,并得到了國(guó)內(nèi)外信息領(lǐng)域科技人員的廣泛重視和研究。自從1992年Kato提出基于內(nèi)容的圖像檢索一詞以來(lái),使這一方面的研究和應(yīng)用開始快速發(fā)展并已取得了很多令人矚目的成果。如IBM公司的QBIC系統(tǒng)[1]和Virage公司的VIR圖像工程系統(tǒng),基于區(qū)域特征的如UCSB的Netra系統(tǒng)[2]等。國(guó)內(nèi)從1994年開始關(guān)注這方面的研究,清華大學(xué)計(jì)算機(jī)系于1997年研制了一個(gè)Intemet上基于內(nèi)容檢索的原型系統(tǒng),國(guó)防科大多媒體開發(fā)中心設(shè)計(jì)開發(fā)了一個(gè)基于內(nèi)容的視頻新聞節(jié)目瀏覽檢索系統(tǒng),各類新的基于內(nèi)容的檢索系統(tǒng)也不斷出現(xiàn)。
基于內(nèi)容的圖像檢索[3-4]主要使用圖像的顏色、紋理、形狀和空間位置關(guān)系等底層特征進(jìn)行檢索。顏色是圖像中最直接和最簡(jiǎn)單的特征,它對(duì)圖像本身的尺寸、方向、旋轉(zhuǎn)等的依賴性較小,因此利用圖像顏色特征來(lái)檢索是基于內(nèi)容的圖像檢索技術(shù)中最常用的基本方法。但是顏色特征對(duì)亮度變化比較敏感,而且以直方圖作為顏色特征沒有包含任何顏色的空間布局信息,而形狀特征作為物體本質(zhì)特征之一,它不隨周圍和亮度等環(huán)境的變化而變化,是物體穩(wěn)定的特征,相對(duì)于顏色和紋理特征顯得更為直觀,并且攜帶了一定的空間布局信息。形狀特征本身的優(yōu)點(diǎn)使得它可以將不同的圖像目標(biāo)區(qū)分開,因此采用顏色和形狀特征相結(jié)合的方法進(jìn)行圖像檢索,彌補(bǔ)了只用單一特征進(jìn)行圖像檢索的不足。對(duì)于顏色特征本文采用性能較好的HSV[5]顏色空間的直方圖,對(duì)于形狀特征利用二次樣條二進(jìn)小波多尺度變換模極大值進(jìn)行邊緣檢測(cè),用邊緣梯度方向直方圖表示圖像形狀特征。實(shí)驗(yàn)結(jié)果表明該算法不僅具有對(duì)圖像光照變化和幾何變化較強(qiáng)的魯棒性,同時(shí)具有較好的檢索性能。
利用小波變換提取邊緣方法優(yōu)點(diǎn)是具有“變焦”的功能,由于小波變換具有良好的局部特性與多尺度特性[6],能多尺度逼近邊緣,所以應(yīng)用小波變換提取邊緣被認(rèn)為是一種最為有效、最有前途的方法。1992年Mallat提出了二進(jìn)小波變換多尺度的邊緣分析方法[7]。由于二進(jìn)小波介于連續(xù)小波和離散小波之間,是一種本身帶有強(qiáng)烈方向性的小波函數(shù),這使得它在圖像奇異性檢測(cè)和特征提取方面得到了廣泛的應(yīng)用。
對(duì)于二維小波變換的圖像邊緣檢測(cè),設(shè)二維平滑函數(shù)θ(x,y)且滿足條件,將其沿 x、y兩個(gè)方向上的一階導(dǎo)數(shù)作為兩個(gè)基本小波:
則對(duì)任意的 f(x,y)∈L2(R2),其在尺度s=2j上的沿水平方向和垂直方向的二進(jìn)小波變換包括兩個(gè)分量:
分別是圖像灰度沿x、y方向的梯度。由此可得圖像 f(x,y)在尺度2j下的二進(jìn)小波變換模值和幅角:
若Msf(x,y)在點(diǎn)(x0,y0)達(dá)到極大值,則函數(shù) f*θs(x,y)認(rèn)為是 f(x,y)在 (x0,y0)處具有最大的方向?qū)?shù),從而f(x,y)在該點(diǎn)處的函數(shù)值有突變,而突變發(fā)生的方向是沿著 Asf(x,y)所指的方向。由此可以認(rèn)為(x0,y0)是圖像的邊緣點(diǎn),于是,計(jì)算一個(gè)光滑函數(shù)沿著梯度方向的模極大值等于計(jì)算小波變換的模極大值。由于模極大值對(duì)應(yīng)圖像的邊緣位置,所以在邊緣信息提取時(shí)先找出模的極大值,再選擇某一閾值以除去較小的模極大值,然后將相鄰的具有相近的模極大值和相近的幅角的極大值點(diǎn)連接起來(lái)得到邊緣鏈,選一個(gè)閾值以濾出噪音點(diǎn)即可得到圖像的邊緣。
3.1 顏色特征提取
顏色是圖像最顯著的特征之一,相對(duì)于其他特征,由于它非常穩(wěn)定,即其對(duì)于旋轉(zhuǎn)、平移、尺度變化具有相當(dāng)強(qiáng)的魯棒性,而且計(jì)算簡(jiǎn)單,因此成為現(xiàn)有檢索系統(tǒng)中應(yīng)用最廣泛的特征。在實(shí)際應(yīng)用中常用的顏色空間模型很多,選取什么樣的顏色模型對(duì)檢索結(jié)果影響很大。RGB顏色模型是最基礎(chǔ),最常用的顏色模型,數(shù)字圖像一般都采用RGB顏色模型來(lái)表示,但是RGB顏色模型不符合人對(duì)顏色的感知心里,而HSV顏色模型能夠較好地符合人眼的感知特征,同時(shí)可以分別提取出圖像的色調(diào)H和亮度V以及飽和度S信息,因此本文采用的是HSV顏色空間模型。
由于一般情況下獲取的圖像都是在RGB顏色空間描述的,為了計(jì)算的方便經(jīng)常要做顏色空間的轉(zhuǎn)換。從RGB顏色模型到HSV顏色模型的轉(zhuǎn)換公式如下:
其中:
按照人的視覺分辨能力,根據(jù)色彩的不同范圍將h、s、v分量進(jìn)行非等間隔的量化,把色調(diào)h分成16份,飽和度s和亮度v分別分成4份,與之對(duì)應(yīng)的量化后的色調(diào),飽和度和亮度值分別為H、S、V。
對(duì)于量化后的各分量,將它們合成為一維特征矢量,即G=HQsQv+SQv+V,其中Qs、Qv分別是分量的量化級(jí)數(shù),通常取Qs=4,Qv=4,則G=16H+4S+V,相當(dāng)于取色調(diào)H的權(quán)值為16,取飽和度S的權(quán)值為4,取亮度V的權(quán)值為1,G的取值范圍為[0,255],計(jì)算G獲得256柄的一維直方圖矢量。即圖像的顏色特征向量Vcolor表示如下:
其中,i表示灰度級(jí),L表示灰度級(jí)種類數(shù),ni表示圖像中具有灰度級(jí)i的像素總數(shù),N表示圖像總的像素?cái)?shù)。
3.2 形狀特征提取
邊緣上每一像素都對(duì)應(yīng)此處一個(gè)邊緣梯度方向,邊緣可以看做由具有特定方向的邊緣像素點(diǎn)構(gòu)成,對(duì)邊緣像素點(diǎn)的梯度方向的統(tǒng)計(jì)能夠更好地表征物體的形狀信息。在建立邊緣梯度方向直方圖時(shí),首先利用2次樣條二進(jìn)小波模極大值方法提取邊緣,然后根據(jù)式(6)計(jì)算出邊緣圖像的梯度方向角 Asf(x,y),同時(shí)將 Asf(x,y)由弧度轉(zhuǎn)換為度,根據(jù)其所在象限轉(zhuǎn)換到[0°~360°],最后對(duì)邊緣像素點(diǎn)的梯度方向角進(jìn)行統(tǒng)計(jì)建立邊緣梯度方向直方圖H(i)。具體實(shí)現(xiàn)的方法為將梯度方向角Asf(x,y)∈[0°~360°]均勻的量化為L(zhǎng)個(gè)區(qū)間,即n(i)的取值范圍為0,1,…,L-1定義為:
為了使邊緣梯度方向直方圖對(duì)圖像光照變化、平移變化、尺度變化具有不變性,最后用邊緣像素的總數(shù)得到歸一化的邊緣梯度方向直方圖H(i)。L值越大,角度量化的單位個(gè)數(shù)越多,計(jì)算量就會(huì)增加,但是圖像庫(kù)中有些圖像邊緣信息多。對(duì)于數(shù)字化圖像,每個(gè)像素點(diǎn)的周圍只有8個(gè)鄰接點(diǎn),它將一個(gè)平面分成8個(gè)扇區(qū)[8],因此每個(gè)點(diǎn)處只有8個(gè)方向可作為梯度方向,考慮到既要包括足夠的信息用以提高檢索精度,又要使邊緣梯度方向直方圖特征向量的數(shù)據(jù)量盡可能少以便提高檢索速度最后選擇L=8。由此繪制邊緣梯度方向直方圖H(i),其橫坐標(biāo)代表8個(gè)量化的角度單位,每一個(gè)單位45°,縱坐標(biāo)代表對(duì)應(yīng)角度單位內(nèi)的像素個(gè)數(shù)在所有邊緣像素點(diǎn)中的比列,得到一維的邊緣梯度方向直方圖。其函數(shù)如下:
其中,ni表示邊緣梯度方向角在i×45°~(i+1)×45°之間的像素個(gè)數(shù),N為邊緣像素點(diǎn)的總數(shù)。
4.1 相似性匹配
基于內(nèi)容的圖像檢索主要采用相似性的檢索方法,即通過(guò)特征向量之間的相似性來(lái)判斷兩幅圖像的相似程度,然后給出與查詢圖像最相似的若干圖像。本文采用顏色直方圖來(lái)表示圖像顏色特征,邊緣梯度方向直方圖來(lái)表示圖像形狀特征,因此圖像之間的相似性通過(guò)比較顏色和形狀特征向量之間的相似性進(jìn)行度量,采用Euclidean距離[9]來(lái)度量特征向量之間的距離,并且采用根據(jù)不同向量的重要程度設(shè)定權(quán)值的方法來(lái)提高檢索精確度。
Euclidean距離為:
式中,fi為數(shù)據(jù)庫(kù)中圖像的特征向量,fqi為待查詢圖像的特征向量,n為特征向量空間維數(shù)。
利用公式(13)計(jì)算兩幅圖像顏色和形狀特征相似度分別為Dc和Ds,則任意兩幅圖像的相似度為:
式中,Wc、Ws分別為顏色和形狀特征不同重要程度設(shè)定的權(quán)值,Wc+Ws=1。
4.2 檢索實(shí)驗(yàn)結(jié)果與分析
為了對(duì)本文圖像檢索的性能進(jìn)行測(cè)試,從華盛頓大學(xué)網(wǎng)站(http://www.cs.washington.edu/research/imagedatabase)及Corel圖像庫(kù)中收集約1 120多幅圖像,包括動(dòng)物、花、汽車、建筑、自然風(fēng)景等5類。各類圖像相似數(shù)目超過(guò)20幅。在相同的軟硬件環(huán)境下對(duì)本文算法和文獻(xiàn)[10]算法進(jìn)行性能比較(文獻(xiàn)[10]是用綜合不變矩和canny算子進(jìn)行邊緣檢測(cè),再得到相應(yīng)的邊界方向直方圖作為圖像特征來(lái)進(jìn)行檢索的方法)。在比較不同方法的檢索性能時(shí),采用查準(zhǔn)率與查全率作為檢索效率的性能指標(biāo),具體步驟:上述圖像庫(kù)中每一類圖像中隨機(jī)抽取10幅組成一個(gè)新的圖像庫(kù),對(duì)每類圖像進(jìn)行10次查詢,并將其作為該類圖像的平準(zhǔn)查準(zhǔn)率和平均查全率,結(jié)果如表1所示。
表1 平均查全率和平均查準(zhǔn)率 (%)
圖1和圖2給出了本文方法和文獻(xiàn)[10]的方法在建筑類的一次檢索結(jié)果中的前16幅圖像,其中左上角第一幅為示例圖像,檢索結(jié)果按相似性大小排列。
圖1 本文方法對(duì)建筑類檢索結(jié)果圖
圖2 文獻(xiàn)[10]方法對(duì)建筑類檢索結(jié)果圖
實(shí)驗(yàn)結(jié)果表明,本文方法具有較好的檢索性能,檢索準(zhǔn)確率高于結(jié)合不變矩和用Canny算子進(jìn)行邊緣檢測(cè),再得到相應(yīng)的邊界方向直方圖作為圖像特征來(lái)進(jìn)行檢索的方法,檢索效果更符合人眼的視覺感受。
小波變換具有良好的局部特性與多尺度特性,能多尺度逼近邊緣,這使得它在圖像奇異性檢測(cè)和特征提取方面得到了廣泛的應(yīng)用。本文采用二次樣條二進(jìn)小波變換進(jìn)行邊緣檢測(cè),用邊緣梯度方向直方圖表示圖像形狀特征,用顏色直方圖表示圖像顏色特征,綜合顏色特征和形狀特征來(lái)進(jìn)行檢索。實(shí)驗(yàn)結(jié)果表明,本文方法不僅具有較好的檢索性能,而且對(duì)圖像中存在的光照變化和幾何變化(尺度、平移、旋轉(zhuǎn)等)具有較強(qiáng)的魯棒性。檢索準(zhǔn)確率高于綜合不變矩和用Canny算子進(jìn)行邊緣檢測(cè),再得到相應(yīng)的邊界方向直方圖作為圖像特征來(lái)進(jìn)行檢索的方法。今后研究重點(diǎn)是進(jìn)一步改善基于圖像底層特征檢索的性能,進(jìn)行基于圖像的高層次特征的提取和檢索研究。
[1]Flckner M,Sawhney H,Niblack W,et al.Query by image and video content:the QBIC system[J].IEEE Computer,1995,28(9):23-32.
[2]Smith J,Chang S F.Visual SEEK:a fully automated contentbased image query system[C]//Proceedings of the 4th ACM Multimdia Conference,Boston,Nov 1996:87-98.
[3]Cheol H H,Sim K B.Real-time face detection using AdaBoot algorithm[C]//Proceedings of Control,Automation and Systems-ICCAS,Seoul,Korea,2008:1892-1895.
[4]孫文波,吳錫生.綜合顏色紋理形狀特征的圖像檢索[J].計(jì)算機(jī)工程與設(shè)計(jì),2009,30(21):4904-4906.
[5]李國(guó)輝,柳偉,曹莉花.一種基于顏色特征的圖像檢索方法[J].中國(guó)圖象圖形學(xué)報(bào),1999,4(3):249-255.
[6]成禮智,王紅霞,羅永.小波的理論與應(yīng)用[M].北京:科學(xué)出版社,2004.
[7]Mallat S.A theory for multiresolution signal decomposition[J]. IEEE Trans on PAML,1989,11(7):674-693.
[8]Cohen A.Biorthogonal wavelets and dual filter[M]//Barland M. Wavelets in Image Communication.Germany:Elsevier,2004:1-26.
[9]傅蓉,許宏麗.基于小波多尺度分析的彩色圖像檢索方法[J].中國(guó)圖象圖形學(xué)報(bào),2004,9(11):1326-1330.
[10]樊亞春,耿國(guó)華,周明全.用不變矩和邊界方向進(jìn)行形狀檢索[J].小型微型計(jì)算機(jī)系統(tǒng),2004,25(4):659-662.
College of Mathematical Sciences,Xinjiang Normal University,Urumqi 830054,China
Because of the wavelet transform has good local characteristics and multi-scale characteristic,it can be multi-scale edge approximation,this makes it wide range of applications in image singularity detection and feature extraction.Using dyadic wavelet transform on edge detection,use of edge gradient direction histogram express shape features,use of HSV color model express image color features,this paper puts forward an algorithm that image retrieval approach combining color feature and shape feature.The experimental results show that the algorithm not only has a strong robustness to the image illumination change,and geometry change,and has a good retrieval performance.
image retrieval;dyadic wavelet transform;edge detection;color feature;shape feature
A
TP391.41
10.3778/j.issn.1002-8331.1202-0115
ABDURUSUL Osman,MARYAMGUL Abliz,TURGHUNJAN Abdukirimturki.Image retrieval approach combining color feature and shape feature.Computer Engineering and Applications,2013,49(7):167-170.
新疆維吾爾自治區(qū)自然科學(xué)基金(No.200721104);國(guó)家自然科學(xué)基金(No.10661010,No.11261061);新疆師范大學(xué)2012年大學(xué)生課外學(xué)術(shù)科技作品項(xiàng)目。
阿卜杜如蘇力·奧斯曼(1987—),男,碩士研究生,研究方向?yàn)樾〔ǚ治黾捌鋺?yīng)用;吐爾洪江·阿布都克力木(1962—),通訊作者,男,教授,博士,研究方向?yàn)樾〔ǚ治雠c模式識(shí)別;馬麗亞木·阿布來(lái)孜(1987—),女,碩士研究生,研究方向?yàn)樾〔ǚ治黾捌鋺?yīng)用。E-mail:thj@xjnu.edu.cn
2012-02-07
2012-03-30
1002-8331(2013)07-0167-04
CNKI出版日期:2012-06-15 http://www.cnki.net/kcms/detail/11.2127.TP.20120615.1727.053.html