劉 晙, 茹慶云
(河南機(jī)電高等??茖W(xué)校計(jì)算機(jī)科學(xué)與技術(shù)系,河南 新鄉(xiāng) 453000)
基于快速小波變換的高適應(yīng)性圖像檢索技術(shù)研究
劉 晙, 茹慶云
(河南機(jī)電高等??茖W(xué)校計(jì)算機(jī)科學(xué)與技術(shù)系,河南 新鄉(xiāng) 453000)
在目前已有的研究工作中,基于自適應(yīng)小波的圖像特征在基于內(nèi)容的圖像檢索領(lǐng)域獲得了廣泛的應(yīng)用。但這些方法存在一個(gè)共同問題,即采用相同的小波基描述不同的查詢圖像。為了提高圖像檢索技術(shù)的自適應(yīng)能力,本文對(duì)不同的查詢圖像設(shè)計(jì)不同的小波基表示,從而實(shí)現(xiàn)用可調(diào)整的距離測(cè)度表征不同類別圖像的特征改變。為了進(jìn)一步降低表征圖和表征導(dǎo)數(shù)圖的求取時(shí)間,該文使用了近似泰勒展開。實(shí)驗(yàn)結(jié)果表明,這種新的圖像檢索技術(shù)具有高度的自適應(yīng)能力,檢索性能也大幅度提高。
圖像檢索;小波變換;小波基;自適應(yīng)
自適應(yīng)小波已經(jīng)在基于內(nèi)容的圖像檢索中取得了廣泛的應(yīng)用,這在計(jì)算機(jī)科學(xué)領(lǐng)域已經(jīng)成為一個(gè)熱點(diǎn)研究[1]。基于內(nèi)容的圖像檢索使用圖像特征來捕捉兩幅圖像的相似性,并依據(jù)查詢圖像的特征在參考數(shù)據(jù)集中實(shí)現(xiàn)自動(dòng)的檢索[2]。
早期的圖像檢索系統(tǒng),主要依賴機(jī)器語言和用戶感知來建立低級(jí)圖像特征[3]。小波變換應(yīng)用于圖像檢索技術(shù)后,圖像特征的建立手段更加豐富了[4]。另外,小波變換在圖像檢索中還具有一個(gè)明顯的優(yōu)勢(shì),那就是它可以靈活地調(diào)整表征圖像特征的小波基,從而使得圖像檢索方法的適用性更加靈活[5]。
但從目前的使用情況看,對(duì)于一個(gè)圖像檢索系統(tǒng),查詢圖像的小波基構(gòu)建方法基本固定,當(dāng)檢索開始后再無更改的可能,從而沒有把小波變換的靈活性最大限度地發(fā)揮出來[6-7]。實(shí)際上,對(duì)不同查詢圖像的圖像特征采用統(tǒng)一的小波基構(gòu)建方法,勢(shì)必會(huì)降低整個(gè)圖像檢索系統(tǒng)的性能[8-9]。
為此,要進(jìn)一步提高基于小波變換的圖像檢索技術(shù)的適應(yīng)性和整個(gè)圖像檢索系統(tǒng)的性能,就應(yīng)該為每一幅不同的查詢圖像量身定制小波濾波器。本文所作的研究工作,正是在這樣的出發(fā)點(diǎn)下展開的。
根據(jù)定義,I在任意位置 (i, j)、任意分析范圍s∈ Ν*的小波變換的系數(shù),可用下面的公式計(jì)算:
利用公式(1),對(duì)公式(2)進(jìn)行改造,可以得到下面的公式:
我們可以用標(biāo)準(zhǔn)矩描述小波系數(shù)(xi,j,s)i=0,…,M-1,j=0,…,N-1的分布特征。在紋理圖像的特定情況下,可以使用非傾斜均值廣義高斯函數(shù)來模仿任意尺度的小波系數(shù)分布模型。這個(gè)廣義高斯函數(shù)有兩個(gè)參數(shù):α和β,它們即分別為規(guī)模和形狀參數(shù)。則標(biāo)準(zhǔn)矩 (μ ,σ ,ν,κ)與α和β相關(guān),并且可以按照公式(4)~(6)計(jì)算。
這里Γ是伽瑪函數(shù),σ 、κ 分別與 α、β 密切相關(guān)。根據(jù)標(biāo)準(zhǔn)偏差σs,K,L(I )及其峰值κs,K,L(I ),我們可以描述任意小波系數(shù)的特征分布。當(dāng)I、 K 、 L為已知時(shí), σs,K,L(I )和 κs,K,L(I )可以分別簡記為σs和 κs,其具體計(jì)算如下:
這里 ms,d是 I的小波變換的一個(gè)多項(xiàng)式函數(shù),其具體表達(dá)如下:
如果 IS和 JS分別表示集合和那么上述公式所反映出圖像特征的復(fù)雜性應(yīng)為O(MNKL/s2)。
2.1 小波濾波器空間
讓 WK,L表示所有支持 (2 k+ 1)×(2L+1)的小波濾波器的空間,讓D表示它的維數(shù)。因?yàn)楦鶕?jù)式(1)各濾波器 w ∈ WK,L中心系數(shù)被限制,
2.2 表征圖和表征導(dǎo)數(shù)圖
根據(jù)小波自適應(yīng)的構(gòu)建目的,我們對(duì)于一個(gè)給定的分析規(guī)模 s∈ N*和每個(gè)過濾器 w ∈WK,L計(jì)算I的表征 (σs,κs),由此產(chǎn)生的一系列特征被稱為I的表征圖,它也用于計(jì)算表征的一階導(dǎo)數(shù)。由此產(chǎn)生的表征導(dǎo)數(shù)稱為I的表征導(dǎo)數(shù)圖。
據(jù)前所述,用小波濾波器提取圖像特征具有O(MNKL/s2)的復(fù)雜度,因此需要大量的時(shí)間。為此,我們使用近似表征圖和表征導(dǎo)數(shù)圖。
2.3 近似表征圖
本文使用泰勒展開的近似表征圖和表征導(dǎo)數(shù)圖,這是一種全新的應(yīng)用。通過一個(gè)有限集的小波濾波器計(jì)算表征和表征導(dǎo)數(shù),這被稱為關(guān)鍵小波濾波器,其余每個(gè)圖使用泰勒展開近似。一套關(guān)鍵小波濾波器用來表示,假設(shè)是關(guān)鍵小波濾波器。在 w處,函數(shù)f(無論是還是的泰勒展開如下所示。
這里 nT表示順序泰勒展開的階數(shù),表示二階。
2.4 表征圖及其導(dǎo)數(shù)的不變性
首先,如果小波濾波器 w ∈ WK,L乘以一個(gè)正實(shí)數(shù) λ∈ R+,根據(jù)公式(3)和式(9),有δs,d(k ,l )和ms,d乘以 λd,? s, k和l。因此,如果w乘以λ,然后σs乘以λ, ks不變。至于導(dǎo)數(shù),如果w乘以λ, (? σs/?wk,l)不變和 (? ks/?wk,l)除以λ。這個(gè)不變性分析意味著,我們只需要在單位球面內(nèi)對(duì)小波濾波器計(jì)算表征圖及其導(dǎo)數(shù)。
其次,如果w乘以-1,有δs,d(k ,l )和ms,d乘以(- 1)d,? s , k和l。因此,如果w乘以-1,那么σs和 ks不變, (? σs/?wk,l)和 (? ks/?wk,l)乘以-1。這個(gè)不變性分析意味著,我們只需要在單位半球面內(nèi)對(duì)小波濾波器計(jì)算表征圖及其導(dǎo)數(shù)。
2.5 表征圖像的建立步驟
整個(gè)表征圖的構(gòu)建過程如圖1所示。圖1中,橫軸代表第一個(gè)無約束的小波濾波器系數(shù)的值,實(shí)心弧代表表征圖的泰勒展開。
第三步,是計(jì)算特征和特征導(dǎo)數(shù)在 WK,L集出的差,如圖1(c)所示。讓?duì)嗽诩咸幈欢Aw過濾器過濾。讓是一個(gè)變量顯示,( w /λ)屬于( δ=1)或( δ=-1)半個(gè)單位球體。
圖1 表征圖構(gòu)建過程
如果用 Iq代表查詢圖像,R代表參考圖像數(shù)據(jù)集。在圖像檢索過程中,表征圖是用來計(jì)算I∈ R 的圖像相似度排名,將形成 I1(Iq),I2(Iq),…IK(Iq)的檢索結(jié)果,其中 K∈ N*。
我們建議將每個(gè)圖像用S(I)=(σs,K,L(I ),κs,K,L(I))s∈N*,K∈N,L∈N標(biāo) 注 , 在 標(biāo) 注 S (I), 特 征σs,K(,LI ) 和κs,K,L(I)在分析規(guī)模s處提取分析表,使用支持 (2 K + 1)×(2L+1)的濾波器 ws,K,L?;谶@些明顯特征, Iq和另一幅圖像 I∈ R之間的距離定義如下:
假設(shè) dH(Iq,I)表示 Iq和I之間強(qiáng)度直方圖的二階距離, dH(Iq,I)是用 Iq和I的低頻成分。每一部分的距離測(cè)度被實(shí)數(shù)加權(quán):假設(shè)和則或
從已有的圖像檢索方案來看,一般都是使用單一的距離參數(shù)來評(píng)價(jià)查詢圖像和各幅參考圖像之間的相似性。而本文利用公式(12)所示的距離定義函數(shù),根據(jù)前面所述的不同表征圖和表征導(dǎo)數(shù)圖,可以根據(jù)不同查詢圖像的特征,有針對(duì)性地調(diào)整距離測(cè)度,從而極大地提高圖像檢索過程的自適應(yīng)性。
在這種高度自適應(yīng)的圖像檢索方法中,不同的距離參數(shù)集用于每個(gè)查詢圖像。確切地說,距離參數(shù)(小波濾波器系數(shù)權(quán)重)可以在不同的特征空間使用。
為了驗(yàn)證本文提出的基于快速小波變換的高自適應(yīng)圖像檢索方法的有效性,實(shí)驗(yàn)使用的測(cè)試圖像是以從http://www.wang.st.psu.edu/IMAGE下載的包含10000 幅測(cè)試圖像的圖像庫,這個(gè)數(shù)據(jù)平臺(tái)共有分辨率大小為 126×85 或85×126兩種規(guī)格。圖像內(nèi)容涉及了山水、花草、昆蟲、動(dòng)物、建筑。實(shí)驗(yàn)過程采用了主頻為2.6GHz的酷睿雙核CPU,存儲(chǔ)空間為8G的內(nèi)存,顯存為2G的獨(dú)立顯卡的計(jì)算機(jī)。軟件編譯平臺(tái)為 Visual C++.net 2005平臺(tái)。為便于比較,在相同的軟硬件平臺(tái)上進(jìn)行二組實(shí)驗(yàn),分別實(shí)現(xiàn)了文獻(xiàn)[5]、文獻(xiàn)[8]中的檢索方法和本文提出的檢索方法,采用檢索結(jié)果的檢索時(shí)間、查全率、查準(zhǔn)率作為檢索的評(píng)價(jià)準(zhǔn)則。
4.1 牡丹圖像的檢索實(shí)驗(yàn)
為了形象地說明本文算法的實(shí)現(xiàn)流程,首先采用了兩幅牡丹圖像作為查詢圖像,進(jìn)行了表征圖提取,其結(jié)果如圖2所示。
圖2 不同“牡丹”查詢圖像的表征圖提取過程
圖2中,我們利用小波變換技術(shù),對(duì)兩幅不同的“牡丹”查詢圖像進(jìn)行了表征圖求解。其中分別展示了 H2、H4、V2、V4等小波分解級(jí)次在σ、 K計(jì)算尺度下的表征圖。從圖2中明顯可以看出,不同的查詢圖像所對(duì)應(yīng)的表征圖并不相同,如果用相同的小波基表征形式進(jìn)行后續(xù)查詢和檢索,會(huì)降低檢索性能。進(jìn)一步用本文所提的方法進(jìn)行圖像檢索性能測(cè)試實(shí)驗(yàn),檢索結(jié)果如圖3所示。從圖2以及圖3可以看出,通過本文方法的設(shè)計(jì),可以為不同查詢圖像設(shè)計(jì)不同的表征圖,從而使整個(gè)檢索過程的自適應(yīng)性大大提高。
圖3 牡丹圖像查詢結(jié)果
表1是實(shí)驗(yàn)一中3種方法檢索時(shí)間以及查全率的比較,可以看出由于本文算法和文獻(xiàn)[8]中的檢索方法都是建立在圖像特征庫的基礎(chǔ)上,使得查詢不相關(guān)圖像大為減少,從而使檢索時(shí)間較文獻(xiàn)[5]檢索大大縮短。另外,本文算法從查詢時(shí)間上看,從10000幅圖像構(gòu)成的圖像庫中進(jìn)行“牡丹”圖像的查詢,僅花費(fèi) 0.28s,并沒有因?yàn)楸碚鲌D的計(jì)算導(dǎo)致檢索時(shí)間的增加。并且隨著數(shù)據(jù)庫規(guī)模增大,檢索速度提高的更加顯著。在查全率、查準(zhǔn)率方面也比上面兩種方法更具優(yōu)勢(shì)。
表1 3種算法查全率、查準(zhǔn)率、檢索時(shí)間統(tǒng)計(jì)對(duì)比
4.2 日出圖像的檢索實(shí)驗(yàn)
為了測(cè)試本文算法的魯棒性,本文還采用了兩幅日出圖像作為查詢圖像,進(jìn)行了表征圖提取,其結(jié)果如圖4所示。
圖4 不同“日出”圖像的表征圖提取過程
我們?nèi)匀徊捎煤偷谝唤M實(shí)驗(yàn)一樣的方法,先來求解兩幅不同的“日出”圖像的表征圖像。這里 , 也 分 別 計(jì) 算 了 在 σ、 K下 的H2、H4、V2、V4小波分解級(jí)次圖像。從圖4中可以看出,和“牡丹”圖像的結(jié)果一樣,不同的“日出”圖像所對(duì)應(yīng)的表征圖也有很大差異。利用本文方法,對(duì)“日出”圖像執(zhí)行的最終檢索結(jié)果如圖5所示。
圖5 日出圖像查詢結(jié)果
表 2是第二組實(shí)驗(yàn) 3種方法檢索時(shí)間的比較,可以看出同樣本文算法和文獻(xiàn)[8]檢索時(shí)間較文獻(xiàn)[5]檢索大大縮短。另外利用本文方法執(zhí)行“日出”圖像的查詢,耗時(shí)為 0.34s,也表現(xiàn)出較快的檢索速度。從以上分析可以看出,應(yīng)用本文的小波分解思路,在一定程度上可以提高檢索的適應(yīng)性能和精確性,同時(shí)在時(shí)間消耗沒有明顯的增加。
表2 3種算法查全率、查準(zhǔn)率、檢索時(shí)間統(tǒng)計(jì)對(duì)比
為了說明本文方法的查全率、查準(zhǔn)率,分別用本文方法的查全率、查準(zhǔn)率與文獻(xiàn)[5],[8]的兩種方法進(jìn)行了比較。比較結(jié)果的曲線圖如圖5所示。
圖6中,橫坐標(biāo)為要檢索出圖像數(shù)目占圖像總數(shù)的百分比,縱坐標(biāo)為檢索精度,三條曲線分別代表了本文方法、文獻(xiàn)[5]、文獻(xiàn)[8]的方法。從這個(gè)結(jié)果可以看出,本文方法的檢索精度要遠(yuǎn)遠(yuǎn)高于文獻(xiàn)中兩種方法。
圖6 3種圖像檢索方法的對(duì)比
對(duì)于不同查詢圖像,使用同一小波分解策略并執(zhí)行統(tǒng)一的相似性比較,顯然會(huì)降低圖像檢索的性能。本文針對(duì)此問題,對(duì)不同查詢圖像進(jìn)行了不同表征圖像的提取,并通過對(duì)小波分解過程的泰勒函數(shù)近似展開,來有效降低這種處理過程的時(shí)間消耗。實(shí)驗(yàn)結(jié)果表明,本文所設(shè)計(jì)的圖像檢索方法,具有高度的自適應(yīng)能力,可以提高針對(duì)不同查詢圖像的檢索性能,而時(shí)間上的消耗也沒有明顯的增加。
[1] 李向陽, 莊越挺, 潘云鶴. 基于內(nèi)容的圖像檢索技術(shù)與系統(tǒng)[J]. 計(jì)算機(jī)研究與發(fā)展, 2001, 38(3): 344-354.
[2] 齊 恒. 基于內(nèi)容圖像檢索的關(guān)鍵技術(shù)研究[D]. 大連: 大連理工大學(xué), 2012.
[3] 莊 凌, 莊越挺, 吳江琴, 葉振超, 吳 飛. 一種基于稀疏典型性相關(guān)分析的圖像檢索方法[J]. 軟件學(xué)報(bào), 2012, 23(5):1295-1304.
[4] Bian Wei, Tao Dacheng. Biased discriminant Euclidean embedding for content-based image retrieval [J]. IEEE Transactions on Image Process, 2010, 19(2): 545-554.
[5] 傅啟明, 劉 全, 王曉燕, 張 樂. 遺傳反饋的多特征圖像檢索[J].中國圖象圖形學(xué)報(bào), 2011, 16(10): 1858-1865.
[6] 溫 超, 耿國華, 李 展. 基于 K均值聚類和多示例學(xué)習(xí)的圖像檢索方法[J]. 計(jì)算機(jī)應(yīng)用, 2011, 31(6): 1546-1549, 1568.
[7] Ferecatu M, Geman D. A statistical framework for image category search from a mental picture [J]. IEEE Trans. Pattern Anal. Mach. Intell, 2009, 31(6): 1087-1101.
[8] 史習(xí)云, 薛安榮, 劉艷紅. 改進(jìn)k-means聚類算法在圖像檢索中的應(yīng)用研究[J]. 計(jì)算機(jī)工程與應(yīng)用, 2011, 47(10): 193-197, 248.
[9] 李宗民, 唐志輝. 九宮格空間框架的圖書圖像檢索[J].中國圖象圖形學(xué)報(bào), 2013, 18(3): 325-329.
Highly Adaptive Image Retrieval Technology Based on Fast Wavelet Transform
Liu Jun, Ru Qingyun
(Department of Computer Science and Technology, Henan Mechanical and Electrical Engineering College, Xinxiang Henan 453000, China)
In the existing research in the field of content-based image retrieval, image features obtained by adaptive wavelet transform have a wide range of applications. There is a common problem in these methods that different query images are described with the same wavelet basis. In order to improve the adaptive capacity of image retrieval techniques, different wavelet bases are designed for different query images. Different wavelet bases can be used in adjusting retrieval performance for different query images, and the extraction time does not significantly increase. The experimental results show that this new image retrieval technology has a high adaptive capacity and its retrieval performance is also greatly improved.
image retrieval; wavelet transform; wavelet basis; adaptive
TP 393
A
2095-302X (2014)02-0262-06
2013-05-21;定稿日期:2013-07-21
河南省基礎(chǔ)與前沿技術(shù)研究計(jì)劃基金資助項(xiàng)目(082300410390);河南省高等學(xué)校教學(xué)工程項(xiàng)目——教學(xué)團(tuán)隊(duì)(豫教高2012[1099]號(hào))、精品資源共享課程(豫教高2012[1185]號(hào))
劉 晙(1981-),男,湖北天門人,講師,碩士。主要研究方向?yàn)閳D形圖像、軟件技術(shù)及數(shù)據(jù)庫。E-mail:liujun20100@163.com
茹慶云(1958-),男,河南新鄉(xiāng)人,副教授,碩士。主要研究方向?yàn)樾〔皥D像方面的應(yīng)用。E-mail:ddnt@163.com