詹洪陳+王懷登+何菁+袁杰
摘 要: 主要圍繞基于內(nèi)容的圖像檢索的相關(guān)技術(shù)進(jìn)行了研究。設(shè)計(jì)分析了基于內(nèi)容的圖像檢索系統(tǒng)的具體結(jié)構(gòu),研究了結(jié)構(gòu)中各模塊的具體內(nèi)容。并且用Matlab軟件工具基本實(shí)現(xiàn)了基于內(nèi)容的圖像檢索,以手機(jī)圖像為例,驗(yàn)證了算法的正確性。
關(guān)鍵詞:圖像檢索; 特征提??; 相似性度量; Matlab軟件
中圖分類(lèi)號(hào): TN957.52?34 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 1004?373X(2014)07?0068?03
Content?based image retrieval
ZHAN Hong?chen1, WANG Huai?deng1, HE Jing1, YUAN Jie2
(1. Jinling College of Nanjing University, Nanjing 210089, China; 2. School of Electronic Science and Engineering, Nanjing University, Nanjing 210093, China)
Abstract: Correlative techniques of CBIR are studied. The physical structure of CBIR system is designed and analyzed, and the concrete content of the modules is researched. Matlab is used to realize the CBIR. Taking the mobile telephone images as the example, the algorithm is proved to be correct.
Keywords: image retrieval; feature extraction; similarity measurement; Matlab
0 引 言
隨著大規(guī)模數(shù)字圖像庫(kù)的出現(xiàn),傳統(tǒng)的圖像檢索技術(shù)存在的問(wèn)題越來(lái)越突出,為了解決這些問(wèn)題,人們提出了基于內(nèi)容的圖像檢索技術(shù)(Content?based Image Retrieval,CBIR)[1]。其主要方法是提取每幅圖像的視覺(jué)內(nèi)容特征,如顏色、紋理、形狀及空間關(guān)系等,建立圖像的特性矢量作為其索引,按查詢(xún)圖像和目標(biāo)圖像特征的相似性匹配進(jìn)行圖像檢索。相對(duì)于文本方式,CBIR主要具有以下特點(diǎn):直接對(duì)圖像進(jìn)行分析并提取特征,使得檢索更加接近圖像對(duì)象;提取特征的方式多樣化;特征提取和索引建立可由計(jì)算機(jī)自動(dòng)實(shí)現(xiàn);用戶(hù)能夠參與檢索過(guò)程,具有人機(jī)交互性[2?3]。
1 基于內(nèi)容的圖像檢索系統(tǒng)結(jié)構(gòu)
基于內(nèi)容的圖像檢索系統(tǒng)通常由兩個(gè)模塊構(gòu)成:圖像庫(kù)建立模塊和圖像庫(kù)檢索模塊。本文在Matlab軟件環(huán)境下開(kāi)發(fā)實(shí)現(xiàn)了一個(gè)基于內(nèi)容的圖像檢索系統(tǒng),主要用于驗(yàn)證形狀特征和顏色特征提取算法的可行性和有效性以及相似性度量的性能。其具體結(jié)構(gòu)如圖1所示。
圖1 基于內(nèi)容的圖像檢索系統(tǒng)結(jié)構(gòu)圖
2 系統(tǒng)模塊功能
2.1 圖像庫(kù)建立模塊
圖像庫(kù)建立模塊的主要功能是圖像預(yù)處理及圖像特征提取,其核心是圖像特征提取技術(shù)。
(1) 圖像預(yù)處理
圖像預(yù)處理:讀取圖像數(shù)據(jù),包括圖像的模式、大小等,對(duì)圖像進(jìn)行色彩空間轉(zhuǎn)換、尺寸比例調(diào)整等,還包括對(duì)圖像進(jìn)行直方圖均衡化、銳化濾波等,以增強(qiáng)圖像對(duì)比度,提升圖像亮度,突出使物體的邊緣輪廓清晰[4]。
(2) 圖像特征提取
本文設(shè)計(jì)的圖像檢索系統(tǒng)主要是提取圖像的形狀和顏色特征。在進(jìn)行特征提取時(shí),首先需對(duì)圖像進(jìn)行分割,這里采用的是邊緣檢測(cè)法[5],即提取圖像的邊界,然后對(duì)各個(gè)連通域進(jìn)行特征提取,包括顏色特征和一些基于區(qū)域的形狀特征。
2.2 圖像庫(kù)檢索模塊
圖像庫(kù)檢索模塊主要負(fù)責(zé)度量查詢(xún)圖像與特征數(shù)據(jù)庫(kù)中對(duì)應(yīng)的各個(gè)圖像之間的相似度,其核心部分是特征匹配[6],這里在進(jìn)行特征匹配時(shí)通過(guò)計(jì)算兩個(gè)特征向量之間的相關(guān)系數(shù)度量其相似性。經(jīng)過(guò)匹配,系統(tǒng)最后按照相似度大小順序輸出檢索結(jié)果。
3 基于內(nèi)容的圖像檢索的具體實(shí)現(xiàn)
本文在Matlab軟件環(huán)境下以手機(jī)圖片庫(kù)為例,實(shí)現(xiàn)基于內(nèi)容的圖像檢索。
3.1 圖像特征提取的算法流程
如圖2所示,在算法實(shí)現(xiàn)的具體過(guò)程中,需注意以下幾個(gè)步驟:
圖2 圖像特征提取的算法流程圖
(1) 圖像分割
采用邊緣檢測(cè)法進(jìn)行圖像分割,即利用邊緣檢測(cè)算子提取圖像邊界[7],這里采用Canny算子。用邊緣檢測(cè)法提取的圖像邊界可能會(huì)不連續(xù),丟失一部分邊界點(diǎn)信息,故可先用灰度閾值法將圖像二值化,這里灰度閾值[T]可以用Qtsu 法直接求得,再用邊緣檢測(cè)法進(jìn)行圖像的邊界提取。
(2) 連通域標(biāo)記
區(qū)分連通區(qū)域,表示連通域個(gè)數(shù)。即對(duì)屬于同一個(gè)像素連通區(qū)域的所有像素分配相同的編號(hào),對(duì)不同的連通區(qū)域分配不同的編號(hào)。
(3) 對(duì)連通域提取形狀特征[8]
形狀特征表達(dá)用基于區(qū)域的描述方法,提取區(qū)域面積、橫縱對(duì)比度、各連通域所占比例等參數(shù)作為形狀特征向量[9]。
(4) 對(duì)連通域提取顏色特征[10]
提取顏色特征時(shí)選取的是RGB顏色空間,顏色量化采用均勻量化的方法[11]。具體過(guò)程為:將[0,255]劃分為四個(gè)均勻的小區(qū)間,令:
[R=1,R∈[0,63]2,R∈[64,127]3,R∈[127,190]4,R∈[191,255]G=1,G∈[0,63]2,G∈[64,127]3,G∈[127,190]4,G∈[191,255]B=1,B∈[0,63]2,B∈[64,127]3,B∈[127,190]4,R∈[191,255]]
3.2 圖像檢索的具體算法流程
如圖3所示,在算法實(shí)現(xiàn)的具體過(guò)程中,需注意以下幾個(gè)步驟:
(1) 相似計(jì)算[12]
特征匹配過(guò)程中通過(guò)計(jì)算相關(guān)系數(shù)來(lái)度量?jī)煞鶊D像之間的相似性,在提取出目標(biāo)圖像的特征矩陣后,將其與特征庫(kù)中對(duì)應(yīng)各圖像的特征矩陣進(jìn)行相似度計(jì)算。特征矩陣由所提取的形狀特征和顏色特征構(gòu)成,其每個(gè)行向量代表不同的特征描述,故計(jì)算相似度時(shí)先分別計(jì)算兩特征矩陣各對(duì)應(yīng)行向量的相關(guān)系數(shù),這里由于各個(gè)行向量描述不同的特征,需考慮它們之間應(yīng)有不同的權(quán)重,再綜合得到兩矩陣的相似度,以衡量圖像之間的相似性。
(2) 檢索結(jié)果輸出
特征匹配后找出最相似的[N]幅圖像,將其按相似度由大到小順序輸出圖像。
圖3 圖像檢索的算法流程
3.3 檢索結(jié)果示例
以手機(jī)圖片檢索為例,輸出與輸入圖像最相似的3幅圖像,并按相似度大小順序輸出,如圖4所示。
4 結(jié) 語(yǔ)
本文實(shí)現(xiàn)了基于內(nèi)容的圖像檢索,首先建立圖像特征庫(kù),即通過(guò)對(duì)圖像分割找出圖像各連通域,分別進(jìn)行形狀和顏色特征提取,得到圖像的特征矩陣存入圖像特征庫(kù);然后,提取出目標(biāo)圖像的特征矩陣,并與庫(kù)中各圖像特征矩陣進(jìn)行匹配,算出相似度;最后根據(jù)匹配結(jié)果找出最相似的[N]幅圖像,按相似度由大到小將圖像順序顯示。以手機(jī)圖像檢索為例,得到了正確的檢索結(jié)果,驗(yàn)證了算法的正確性和有效性。
圖4 手機(jī)圖片檢索示例
注:本文通訊作者為袁杰。
參考文獻(xiàn)
[1] 張騫.基于文本的與基于內(nèi)容的圖像檢索技術(shù)比較研究[J].情報(bào)探索,2012(1):111?113.
[2] 馬玉國(guó),武栓虎,宋宜斌.基于多特征抽取的商標(biāo)圖像檢索[J].計(jì)算機(jī)工程與應(yīng)用,2008,44(18):172?174.
[3] 阿斯艷·哈米提,阿不都熱西提·哈米提.基于文本的圖像檢索與基于內(nèi)容的圖像檢索技術(shù)的比較研究[J].首都師范大學(xué)學(xué)報(bào):自然科學(xué)版,2012,33(4):6?9.
[4] 霍宏濤.數(shù)字圖像處理[M].北京:北京理工大學(xué)出版社,2011.
[5] 葉青,唐鵬舉.基于內(nèi)容的圖像檢索方法研究與實(shí)現(xiàn)[J].懷化學(xué)院學(xué)報(bào),2011,30(8):31?35.
[6] 周明全,耿國(guó)華,韋娜.基于內(nèi)容圖像檢索技術(shù)[M].北京:清華大學(xué)出版社,2007.
[7] 孫振權(quán),肖詩(shī)賦,呂學(xué)強(qiáng).基于內(nèi)容圖像檢索的特征融合技術(shù)研究[J].圖像圖形技術(shù)研究與應(yīng)用, 2010(1):156?161.
[8] 沈金科.基于內(nèi)容的圖像檢索方法研究與實(shí)踐[D].武漢:武漢工程大學(xué),2011.
[9] 李星.基于內(nèi)容的圖像檢索技術(shù)研究與應(yīng)用[D].北京:北京交通大學(xué),2008.
[10] 姜亞莉.基于內(nèi)容的圖像檢索系統(tǒng)分析[J].測(cè)繪與空間地理信息,2012,35(1):119?123,126.
[11] 黃晶,倪林.基于顏色塊的半徑和角度直方圖的圖像檢索[J].計(jì)算機(jī)工程,2008,34(10):202?204,234.
[12] 武燕燕.基于內(nèi)容的圖像檢索技術(shù)研究[D].南京:南京航空航天大學(xué),2010.
[R=1,R∈[0,63]2,R∈[64,127]3,R∈[127,190]4,R∈[191,255]G=1,G∈[0,63]2,G∈[64,127]3,G∈[127,190]4,G∈[191,255]B=1,B∈[0,63]2,B∈[64,127]3,B∈[127,190]4,R∈[191,255]]
3.2 圖像檢索的具體算法流程
如圖3所示,在算法實(shí)現(xiàn)的具體過(guò)程中,需注意以下幾個(gè)步驟:
(1) 相似計(jì)算[12]
特征匹配過(guò)程中通過(guò)計(jì)算相關(guān)系數(shù)來(lái)度量?jī)煞鶊D像之間的相似性,在提取出目標(biāo)圖像的特征矩陣后,將其與特征庫(kù)中對(duì)應(yīng)各圖像的特征矩陣進(jìn)行相似度計(jì)算。特征矩陣由所提取的形狀特征和顏色特征構(gòu)成,其每個(gè)行向量代表不同的特征描述,故計(jì)算相似度時(shí)先分別計(jì)算兩特征矩陣各對(duì)應(yīng)行向量的相關(guān)系數(shù),這里由于各個(gè)行向量描述不同的特征,需考慮它們之間應(yīng)有不同的權(quán)重,再綜合得到兩矩陣的相似度,以衡量圖像之間的相似性。
(2) 檢索結(jié)果輸出
特征匹配后找出最相似的[N]幅圖像,將其按相似度由大到小順序輸出圖像。
圖3 圖像檢索的算法流程
3.3 檢索結(jié)果示例
以手機(jī)圖片檢索為例,輸出與輸入圖像最相似的3幅圖像,并按相似度大小順序輸出,如圖4所示。
4 結(jié) 語(yǔ)
本文實(shí)現(xiàn)了基于內(nèi)容的圖像檢索,首先建立圖像特征庫(kù),即通過(guò)對(duì)圖像分割找出圖像各連通域,分別進(jìn)行形狀和顏色特征提取,得到圖像的特征矩陣存入圖像特征庫(kù);然后,提取出目標(biāo)圖像的特征矩陣,并與庫(kù)中各圖像特征矩陣進(jìn)行匹配,算出相似度;最后根據(jù)匹配結(jié)果找出最相似的[N]幅圖像,按相似度由大到小將圖像順序顯示。以手機(jī)圖像檢索為例,得到了正確的檢索結(jié)果,驗(yàn)證了算法的正確性和有效性。
圖4 手機(jī)圖片檢索示例
注:本文通訊作者為袁杰。
參考文獻(xiàn)
[1] 張騫.基于文本的與基于內(nèi)容的圖像檢索技術(shù)比較研究[J].情報(bào)探索,2012(1):111?113.
[2] 馬玉國(guó),武栓虎,宋宜斌.基于多特征抽取的商標(biāo)圖像檢索[J].計(jì)算機(jī)工程與應(yīng)用,2008,44(18):172?174.
[3] 阿斯艷·哈米提,阿不都熱西提·哈米提.基于文本的圖像檢索與基于內(nèi)容的圖像檢索技術(shù)的比較研究[J].首都師范大學(xué)學(xué)報(bào):自然科學(xué)版,2012,33(4):6?9.
[4] 霍宏濤.數(shù)字圖像處理[M].北京:北京理工大學(xué)出版社,2011.
[5] 葉青,唐鵬舉.基于內(nèi)容的圖像檢索方法研究與實(shí)現(xiàn)[J].懷化學(xué)院學(xué)報(bào),2011,30(8):31?35.
[6] 周明全,耿國(guó)華,韋娜.基于內(nèi)容圖像檢索技術(shù)[M].北京:清華大學(xué)出版社,2007.
[7] 孫振權(quán),肖詩(shī)賦,呂學(xué)強(qiáng).基于內(nèi)容圖像檢索的特征融合技術(shù)研究[J].圖像圖形技術(shù)研究與應(yīng)用, 2010(1):156?161.
[8] 沈金科.基于內(nèi)容的圖像檢索方法研究與實(shí)踐[D].武漢:武漢工程大學(xué),2011.
[9] 李星.基于內(nèi)容的圖像檢索技術(shù)研究與應(yīng)用[D].北京:北京交通大學(xué),2008.
[10] 姜亞莉.基于內(nèi)容的圖像檢索系統(tǒng)分析[J].測(cè)繪與空間地理信息,2012,35(1):119?123,126.
[11] 黃晶,倪林.基于顏色塊的半徑和角度直方圖的圖像檢索[J].計(jì)算機(jī)工程,2008,34(10):202?204,234.
[12] 武燕燕.基于內(nèi)容的圖像檢索技術(shù)研究[D].南京:南京航空航天大學(xué),2010.
[R=1,R∈[0,63]2,R∈[64,127]3,R∈[127,190]4,R∈[191,255]G=1,G∈[0,63]2,G∈[64,127]3,G∈[127,190]4,G∈[191,255]B=1,B∈[0,63]2,B∈[64,127]3,B∈[127,190]4,R∈[191,255]]
3.2 圖像檢索的具體算法流程
如圖3所示,在算法實(shí)現(xiàn)的具體過(guò)程中,需注意以下幾個(gè)步驟:
(1) 相似計(jì)算[12]
特征匹配過(guò)程中通過(guò)計(jì)算相關(guān)系數(shù)來(lái)度量?jī)煞鶊D像之間的相似性,在提取出目標(biāo)圖像的特征矩陣后,將其與特征庫(kù)中對(duì)應(yīng)各圖像的特征矩陣進(jìn)行相似度計(jì)算。特征矩陣由所提取的形狀特征和顏色特征構(gòu)成,其每個(gè)行向量代表不同的特征描述,故計(jì)算相似度時(shí)先分別計(jì)算兩特征矩陣各對(duì)應(yīng)行向量的相關(guān)系數(shù),這里由于各個(gè)行向量描述不同的特征,需考慮它們之間應(yīng)有不同的權(quán)重,再綜合得到兩矩陣的相似度,以衡量圖像之間的相似性。
(2) 檢索結(jié)果輸出
特征匹配后找出最相似的[N]幅圖像,將其按相似度由大到小順序輸出圖像。
圖3 圖像檢索的算法流程
3.3 檢索結(jié)果示例
以手機(jī)圖片檢索為例,輸出與輸入圖像最相似的3幅圖像,并按相似度大小順序輸出,如圖4所示。
4 結(jié) 語(yǔ)
本文實(shí)現(xiàn)了基于內(nèi)容的圖像檢索,首先建立圖像特征庫(kù),即通過(guò)對(duì)圖像分割找出圖像各連通域,分別進(jìn)行形狀和顏色特征提取,得到圖像的特征矩陣存入圖像特征庫(kù);然后,提取出目標(biāo)圖像的特征矩陣,并與庫(kù)中各圖像特征矩陣進(jìn)行匹配,算出相似度;最后根據(jù)匹配結(jié)果找出最相似的[N]幅圖像,按相似度由大到小將圖像順序顯示。以手機(jī)圖像檢索為例,得到了正確的檢索結(jié)果,驗(yàn)證了算法的正確性和有效性。
圖4 手機(jī)圖片檢索示例
注:本文通訊作者為袁杰。
參考文獻(xiàn)
[1] 張騫.基于文本的與基于內(nèi)容的圖像檢索技術(shù)比較研究[J].情報(bào)探索,2012(1):111?113.
[2] 馬玉國(guó),武栓虎,宋宜斌.基于多特征抽取的商標(biāo)圖像檢索[J].計(jì)算機(jī)工程與應(yīng)用,2008,44(18):172?174.
[3] 阿斯艷·哈米提,阿不都熱西提·哈米提.基于文本的圖像檢索與基于內(nèi)容的圖像檢索技術(shù)的比較研究[J].首都師范大學(xué)學(xué)報(bào):自然科學(xué)版,2012,33(4):6?9.
[4] 霍宏濤.數(shù)字圖像處理[M].北京:北京理工大學(xué)出版社,2011.
[5] 葉青,唐鵬舉.基于內(nèi)容的圖像檢索方法研究與實(shí)現(xiàn)[J].懷化學(xué)院學(xué)報(bào),2011,30(8):31?35.
[6] 周明全,耿國(guó)華,韋娜.基于內(nèi)容圖像檢索技術(shù)[M].北京:清華大學(xué)出版社,2007.
[7] 孫振權(quán),肖詩(shī)賦,呂學(xué)強(qiáng).基于內(nèi)容圖像檢索的特征融合技術(shù)研究[J].圖像圖形技術(shù)研究與應(yīng)用, 2010(1):156?161.
[8] 沈金科.基于內(nèi)容的圖像檢索方法研究與實(shí)踐[D].武漢:武漢工程大學(xué),2011.
[9] 李星.基于內(nèi)容的圖像檢索技術(shù)研究與應(yīng)用[D].北京:北京交通大學(xué),2008.
[10] 姜亞莉.基于內(nèi)容的圖像檢索系統(tǒng)分析[J].測(cè)繪與空間地理信息,2012,35(1):119?123,126.
[11] 黃晶,倪林.基于顏色塊的半徑和角度直方圖的圖像檢索[J].計(jì)算機(jī)工程,2008,34(10):202?204,234.
[12] 武燕燕.基于內(nèi)容的圖像檢索技術(shù)研究[D].南京:南京航空航天大學(xué),2010.