【摘要】 隨著互聯(lián)網(wǎng)及多媒體技術(shù)的高速發(fā)展,傳統(tǒng)的文字搜索漸漸難以滿足用戶獲取信息的需求。本文介紹了幾種基礎(chǔ)的圖像檢索理論,通過(guò)一個(gè)簡(jiǎn)單的多特征加權(quán)系統(tǒng),比較了不同系統(tǒng)的檢索結(jié)果?!娟P(guān)鍵字】 圖像檢索 CBIR 理論一、引言基于內(nèi)容的圖像檢索(Content-Based Image Retrieval,簡(jiǎn)寫(xiě)為CBIR)是通過(guò)使用圖像自身的視覺(jué)內(nèi)容,比如顏色、紋理、形狀等來(lái)檢索相似圖片的","Introduction":"","Columns":"新技術(shù)","Volume":"","Content":"
【摘要】 隨著互聯(lián)網(wǎng)及多媒體技術(shù)的高速發(fā)展,傳統(tǒng)的文字搜索漸漸難以滿足用戶獲取信息的需求。本文介紹了幾種基礎(chǔ)的圖像檢索理論,通過(guò)一個(gè)簡(jiǎn)單的多特征加權(quán)系統(tǒng),比較了不同系統(tǒng)的檢索結(jié)果。
【關(guān)鍵字】 圖像檢索 CBIR 理論
一、引言
基于內(nèi)容的圖像檢索(Content-Based Image Retrieval,簡(jiǎn)寫(xiě)為CBIR)是通過(guò)使用圖像自身的視覺(jué)內(nèi)容,比如顏色、紋理、形狀等來(lái)檢索相似圖片的一種技術(shù)。CBIR的提出改變了一直以來(lái)對(duì)圖片標(biāo)注關(guān)鍵詞的窘境。無(wú)論是人工標(biāo)注或是采用大數(shù)據(jù)分析,用關(guān)鍵詞代替圖片的過(guò)程一定伴隨著信息的大量丟失。CBIR以圖片本身來(lái)進(jìn)行檢索,避免了此種損失,是將來(lái)圖片搜索的發(fā)展方向。
二、CBIR技術(shù)簡(jiǎn)介
一般說(shuō)來(lái),建立一個(gè)CBIR系統(tǒng)分為兩步:第一步,建立數(shù)據(jù)庫(kù)。使用某種方法提取圖像特征,將待檢索圖片集的特征提取出來(lái)存在數(shù)據(jù)庫(kù)中。第二步,檢索。當(dāng)需要檢索時(shí),對(duì)檢索圖片提取特征,和數(shù)據(jù)庫(kù)中特征比較。特征相似的圖片視覺(jué)上也應(yīng)當(dāng)相似。CBIR涉及到的核心技術(shù)主要在兩點(diǎn):特征提取和相似性度量。
2.1特征提取
特征提取是CBIR的基礎(chǔ)。特征要能切實(shí)的反應(yīng)出圖像的性質(zhì):特征相似的圖像,人眼看上去也應(yīng)該覺(jué)得相似,較為通用的特征一般有顏色、紋理等。
2.1.1顏色特征
由于顏色往往和圖像中所包含的物體或場(chǎng)景十分相關(guān);且顏色特征提取相對(duì)容易,對(duì)圖像本身尺寸、方向和視角的依賴性也較小[1],顏色特征成為了圖像檢索中應(yīng)用最廣泛的視覺(jué)特征。在實(shí)際的CBIR系統(tǒng)中,顏色往往被當(dāng)作主特征使用。
2.1.2紋理特征
紋理是一種不依賴于顏色和亮度的反映圖像同質(zhì)現(xiàn)象的視覺(jué)特征,體現(xiàn)了物體表面共有的內(nèi)在聯(lián)系;同時(shí),紋理還包含了物體表面組織結(jié)構(gòu)排列的重要信息以及它們與周?chē)h(huán)境的聯(lián)系。因此,紋理特征在基于內(nèi)容的圖像檢索中也得到了廣泛的應(yīng)用。
2.2相似性比較
提取了特征向量之后,就要將檢索圖片和圖片集中圖片的特征向量進(jìn)行比較,來(lái)判定圖像之間的相似性。常用匹配方法有以下幾種[2]。
2.2.1 Minkowsky距離
Minkowsky距離是基于LP范數(shù)定義的,其數(shù)學(xué)描述為:
三、實(shí)驗(yàn)說(shuō)明
圖像測(cè)試集方面,本領(lǐng)域并沒(méi)有一個(gè)統(tǒng)一的標(biāo)準(zhǔn)。這主要是因?yàn)閳D像是否相似,本身就有很大的主觀性。另一方面,不同的算法對(duì)不同類(lèi)型的圖片也會(huì)有著明顯不同的檢索率。本次測(cè)試集共有1000張圖片,文件名從0~999,共分十類(lèi),每類(lèi)圖片為相鄰文件名的100張。測(cè)試時(shí),從每類(lèi)圖像中選擇前三張(文件名為X00,X01,X02)進(jìn)行檢索,將檢索結(jié)果中得分最高的前100張圖片中出現(xiàn)該類(lèi)別圖片數(shù)目作為該張圖片檢索得分。方案的最終得分取30張圖片得分平均值。實(shí)驗(yàn)分別采用了單特征檢索與混合特征檢索。單特征檢索包含了顏色特征的RGB顏色累加直方圖、HSV直方圖、HSV直方圖(空間顏色特征)以及紋理特征的顏色值共生矩陣和Gabor紋理特征?;旌咸卣鳈z索以上述特征以3,5,5,3,2進(jìn)行乘法加權(quán)進(jìn)行計(jì)算。
四、結(jié)論
最終混合特征以微弱優(yōu)勢(shì)勝出。單特征檢索中,符合人眼視覺(jué)特性的HSV相關(guān)特性有著不錯(cuò)的檢索結(jié)果?;旌咸卣髦辛硗鈹?shù)種輔助特征則幫忙篩選掉了部分HSV相關(guān)特征中的錯(cuò)誤結(jié)果,一定程度提升了檢索率。另外,混合結(jié)果的高分結(jié)果(排序在前)精確度遠(yuǎn)超單特征檢索。因此,混合特征更適合實(shí)際檢索的需求。
參 考 文 獻(xiàn)
[1] 周明全,耿國(guó)華,韋娜.基于內(nèi)容圖像檢索技術(shù).清華大學(xué)出版社.2007.17.
[2] 孫君項(xiàng),趙珊.圖像低層特征提取與檢索技術(shù).電子工業(yè)出版社.2009.35-37.