邢 雪
(商洛學(xué)院經(jīng)管學(xué)院,陜西商洛,726000)
基于顏色特征的圖像檢索技術(shù)的研究與應(yīng)用
邢 雪
(商洛學(xué)院經(jīng)管學(xué)院,陜西商洛,726000)
網(wǎng)絡(luò)技術(shù)的發(fā)展使互聯(lián)網(wǎng)中圖像的數(shù)量也飛速增長,這使快速有效的檢索變得迫切,研究者們根據(jù)互聯(lián)網(wǎng)使用者們的需求提出了各種各樣檢索圖像的新技術(shù)。該文闡述了圖像檢索技術(shù)的發(fā)展歷程;分析了圖像檢索技術(shù)的主要顏色特征即顏色直方圖、顏色矩、顏色集的表示方法,然后介紹了HSV模型和RGB模型,并且根據(jù)顏色直方圖的缺陷(同一個(gè)事物極有可能會(huì)因?yàn)楸尘暗牟煌辉u(píng)為不相似),做了一個(gè)把全局顏色直方圖和分塊關(guān)鍵直方圖相結(jié)合的系統(tǒng)設(shè)計(jì)。
顏色特征;圖像檢索;顏色直方圖
當(dāng)今科技的發(fā)展不僅帶動(dòng)網(wǎng)絡(luò)技術(shù)革命性進(jìn)步還使圖像信息變得越來越重要,互聯(lián)網(wǎng)中圖像數(shù)量的飛速增長導(dǎo)致圖像檢索越來越麻煩,所以,大部分的行業(yè)對圖像檢索技術(shù)的要求也變得越來越高,比如數(shù)字圖書館系統(tǒng)、衛(wèi)星遙感圖像、醫(yī)療圖像的分析和檢索。
因?yàn)槿找纨嫶蠖媾R前所未有挑戰(zhàn)的圖像數(shù)據(jù)庫壓力也越來越大,對圖像內(nèi)容的組織、表達(dá)、存儲(chǔ)、管理、查詢和檢索是一個(gè)非常麻煩和復(fù)雜的過程,在這個(gè)過程中圖像數(shù)據(jù)庫發(fā)揮著無與倫比的作用,為了減輕圖像數(shù)據(jù)庫的壓力,幫助人們快速、便捷的獲得檢索的圖像,許多研究者投入了自己的心血。
ToshikazuKato在1992年提出基于內(nèi)容的圖像檢索,隨后,國內(nèi)外許多學(xué)者開展了圖像檢索技術(shù)的研究,使這方面的研究和應(yīng)用得到進(jìn)展。這為迫切需要解決的問題人們帶來了希望。
圖像檢索技術(shù)從被提出到目前為止就只是從基于文本的圖像檢索發(fā)展到基于內(nèi)容的圖像檢索。
1.1 基于文本的圖像檢索
上個(gè)世紀(jì)的70年代基于文本的圖像檢索出現(xiàn)了萌芽,它的特征就是在原有圖像的研究基礎(chǔ)上加上了關(guān)鍵字,這樣檢索起來翻遍了很多,但是他有一個(gè)致命的缺點(diǎn)那就是:被檢索的圖像必須有和它相對應(yīng)的關(guān)鍵字,這些關(guān)鍵字還要和存儲(chǔ)路徑相對應(yīng),只有這樣才能夠被基于文本的數(shù)據(jù)庫管理系統(tǒng)檢索出來,這種檢索行為的實(shí)質(zhì)就是把圖像轉(zhuǎn)換為與該圖像對應(yīng)的文本然后進(jìn)行檢索,對這項(xiàng)技術(shù)有較為全面綜述的學(xué)者非Gudivada莫屬。
伴著網(wǎng)絡(luò)技術(shù)的發(fā)展,互聯(lián)網(wǎng)中圖像信息的數(shù)量也飛速增長, 這使人們在大量的圖像信息中進(jìn)行快速并且有效的檢索變得迫切,然而基于文本標(biāo)注的檢索技術(shù)就顯現(xiàn)出問題來了:首先,每一幅圖像都包含萬千信息,定性的文本描述是很難全面體現(xiàn)其意義的;其次,文字描述的手工輸入耗費(fèi)巨大,大型的多媒體信息庫無法被滿足;最后,人們由于各種原因?qū)κ挛锏恼J(rèn)識(shí)是不一樣的,甚至有些人的認(rèn)識(shí)都是不正確的,所以人們對圖像的理解和文字描述也極有可能不準(zhǔn)確,在圖像檢索過程中這種主觀性的理解必然導(dǎo)致錯(cuò)誤匹配。由此可見,基于文本的圖像檢索在這個(gè)網(wǎng)絡(luò)飛速發(fā)展的時(shí)代已經(jīng)不能滿足人們的需要了,基于內(nèi)容的圖像檢索( CBIR, Content- based image retrieval)也就應(yīng)運(yùn)而生了。
1.2 基于內(nèi)容的圖像檢索
網(wǎng)絡(luò)正處于高速發(fā)展的20世紀(jì)90年代,基于內(nèi)容的圖像檢索這一新技術(shù)興起,這個(gè)被國內(nèi)外作為熱門研究課題的技術(shù)有著直觀、通用、高效等特點(diǎn)。CBIR是把上下文內(nèi)容和圖像的視覺特征相互聯(lián)系起來檢索的,這也是這項(xiàng)技術(shù)的基本思想。其中,被檢索的圖像的內(nèi)容是通過特征來反映的,而圖像的特征又分為兩大類,即是:低層物理特征和高層語義特征,這低層物理特征就是指用肉眼可以明確的看出來的特性,如:顏色、形狀、輪廓、紋理等;高層語義特征就是人們對圖像內(nèi)容的反映,也就是文字性的描述。
目前,CBIR突破了關(guān)鍵字檢索的局限,對圖像內(nèi)容直接進(jìn)行分析和特征提取,由此建立索引?,F(xiàn)在,國內(nèi)外很多學(xué)者都在做相關(guān)的研究,還推出了IBM的QBIC和 MIT的PhotoBook的一系列產(chǎn)品。CBIR的系統(tǒng)結(jié)構(gòu)圖,如下圖1所示:
圖1 CBIR的系統(tǒng)結(jié)構(gòu)
基于內(nèi)容的圖像檢索技術(shù)里面被應(yīng)用的最為廣泛的特征之一就是顏色特征,顏色特征對圖像的依賴性較小,具有較高的魯棒性。在此,我們主要討論顏色直方圖、顏色矩、顏色集這三個(gè)特征的表示方法。
2.1 顏色直方圖
顏色直方圖在圖像檢索系統(tǒng)中被采用的最為廣泛,顏色直方圖的側(cè)重點(diǎn)在于圖像中不同色彩所占的比例,因?yàn)樗荒軌驅(qū)D像中的對象進(jìn)行描述,所以不能對圖像自動(dòng)進(jìn)行分割。
雖然顏色直方圖不能夠表達(dá)空間關(guān)系,但是也是能夠用空間和坐標(biāo)系來表達(dá)的,數(shù)字圖像大部分都能夠用RGB顏色空間來表達(dá),顏色直方圖也不例外。因?yàn)?,人們對具有相似性顏色的主觀判斷并不符合RGB空間結(jié)構(gòu),所以基于HSV空間的顏色直方圖、基于Lab空間的顏色直方圖、基于Luv空間的顏色直方圖被相關(guān)學(xué)者提出來了,這3種顏色直方圖里面屬HSV空間顏色直方圖是最常用的顏色空間直方圖,它由色彩(Hue)、飽和度(Saturation)和值(Value)這三個(gè)分量組成。
把顏色空間分為一些比較小的區(qū)間,然后每個(gè)區(qū)間有成為直方圖的一個(gè)bin,這就是顏色直方圖的計(jì)算方式。這個(gè)過程稱為顏色量化(color quantization)。顏色直方圖是通過計(jì)算每個(gè)小區(qū)間內(nèi)顏色像素?cái)?shù)量得到的.顏色量化的方法有許多,如:聚類方法、向量量化、神經(jīng)網(wǎng)絡(luò)方法。
聚類方法的技術(shù)就是平均分割顏色空間的維度,這個(gè)算法的特性就是依據(jù)空間中圖像顏色特征的分布情況,這還能夠得到有效的量化,因?yàn)閳D像像素?cái)?shù)量特別稀疏的bin已經(jīng)被避免了。例如:對RGB格式和HSV空間的圖像進(jìn)行計(jì)算,就需要對進(jìn)行RGB空間和HSV空間的量化,這樣就可以對直方圖加快計(jì)算過程。
用顏色量化的方法來研究會(huì)產(chǎn)生些許的問題。試想一下:兩幅顏色直方圖比較相似的圖像只是一個(gè)bin互相錯(cuò)開了,我們采用L1距離和歐拉距離計(jì)算時(shí)會(huì)得到相似度很小的相似度值。這個(gè)缺陷需要被克服,那相似但不相同的顏色的相似度該如何去處理呢?像這樣的情況有兩種處理方式,二次式距離和顏色直方的平滑過濾處理。顏色直方的平滑過濾處理也是可以處理相似圖像的相似度。
直方圖對顏色分辨的強(qiáng)弱與顏色小區(qū)的數(shù)目成正比,所以,一般情況下,對顏色分辨能力越強(qiáng)越有利于計(jì)算,因?yàn)橹狈綀Dbin數(shù)目太大計(jì)算起來會(huì)比較麻煩,并且這種情況在在大型的圖像庫中索引也是很不利的。但是,有時(shí)候直方圖的顏色空間劃分的太細(xì)對于搜索來說卻是一個(gè)麻煩,特別是對于檢索效果要求嚴(yán)格,不能出現(xiàn)一點(diǎn)錯(cuò)漏的應(yīng)用,精細(xì)的劃分不能夠達(dá)到提高檢索效果的目的。
要有效減少直方圖bin的數(shù)目,還可以選用那些數(shù)值最大(即像素?cái)?shù)目最多)的bin來構(gòu)造圖像特征,這樣做的原因是:圖像的主要像素的顏色可以被bin表達(dá)出來,這種方法也被適應(yīng)有效的證明了不會(huì)把顏色直方圖的檢索效果減低。其實(shí),有時(shí)候,太精確表達(dá)反而達(dá)不到檢索的效果,大范圍的檢索,才能從中尋找自己需要的圖片。主要顏色構(gòu)造直方圖的方法在文獻(xiàn)[4]和[5]中可以找到。
2.2 顏色矩
顏色矩(color moments)就是用來表示圖像中顏色分布均的矩,這種簡單而有效的顏色特征是Stricker和Orengo所提出的。顏色分布信息最為集中的地方就是矩的低階,這可以采用顏色一階矩(mean)、顏色二階矩(variance)和顏色三階矩(skewness)來表達(dá)圖像的顏色分布。顏色矩相比較顏色直方圖還有一個(gè)好處就是對特征不需要進(jìn)行向量化。
例如,假設(shè)q(i,j)圖像的像素值,N為像素?cái)?shù),則:Mean=(sum(q(I,j)))/N
Variance=sqrt(sum(q(I,j)-mean)^2/N)
Skewness=Variance=(sum(q(I,j)-mean)^3/N)^1/3
從上面的例子可以看出顏色矩一般都有9個(gè)分量,其中3個(gè)顏色分量,每個(gè)分量上3個(gè)低階矩,顏色矩就是用這幾個(gè)少數(shù)的矩來表達(dá)的,這可以看出顏色矩的簡潔。然而,這在現(xiàn)實(shí)生活中運(yùn)用的時(shí)候,卻是需要讓此矩與其余的特征相結(jié)合著使用,這是由于此矩的分辨能力較弱,先用它可以過濾顏色縮小范圍(narrow down),這樣在使用其它特征就可以起到作用了。
2.3 顏色集
顏色集是被Smith和Chang提出來用于提高檢索的速度的方法。它的應(yīng)用分為兩步,第一步是量化,所謂量化就是把RGB顏色空間轉(zhuǎn)換成量化成若干個(gè)bin的視覺均衡的顏色空(HSV);第二步是分區(qū),所謂分區(qū)就是把圖像分為很多個(gè)區(qū)域,這不是胡亂的劃分,而是運(yùn)用顏色自動(dòng)分割技術(shù)來對圖像進(jìn)行分割,把那些分出來的區(qū)域量化,用顏色空間的顏色分量來進(jìn)行索引,然后把圖像用二進(jìn)制的顏色索引表顯示出來。圖像匹配的過程中,就是通過表和表的匹配,對不同圖像顏色集之間的距離和顏色區(qū)域的空間關(guān)系進(jìn)行比較,這需要構(gòu)造二分查照樹,這樣檢索速度將被加快,對大規(guī)模的圖像集合是非常有利的。
模型的建立是為了正確地使用顏色。
圖2 RGB彩色空間
3.1 RGB模型
用紅、綠、藍(lán)三種顏色的亮度值大小來限定范圍的模型就是RGB空間模型。它和笛卡爾的坐標(biāo)系統(tǒng)是相對應(yīng)的,三個(gè)軸分別為R、G、B。對應(yīng)原點(diǎn)的是黑色,離原點(diǎn)最遠(yuǎn)的點(diǎn)是白色。所有的R、G、B值都在區(qū)間[0,1]中,他們都是被假定標(biāo)準(zhǔn)化的。如下圖2所示:
3.2 HSV顏色模型
HSV(HueSaturationValue)空間模型是最被人們常用的空間模型,他是由RGB空間轉(zhuǎn)換而來的,HSV模型的三個(gè)量分別代表色彩(Hue)、飽和度(Saturation)和亮度值(Value)。其中H屬于感知屬性,它的表面顏色較為復(fù)雜:黃、綠、藍(lán)、紅等的一種或幾種;S代表的是白光的程度;V是指明暗性。
HSV顏色空間相似于倒置的圓錐形,長軸表示亮度V,它表示光線的明暗程度從黑到白(0%—100%);離開長軸的距離則是飽和度S,它表示顏色的統(tǒng)一純度從零到完全飽和(0%—100%);從V到S的角度是色調(diào)H,它的色調(diào)對人類的視覺判斷起決定作用,它用800~1800或00~3600度量來表示。如下圖3所示:
圖3 HSV顏色模型
HSV 顏色模型的特點(diǎn):
第一:V分量與圖像的彩色信息無關(guān)
第二:H、S分量和人感知顏色的方式緊密相關(guān)
從HSV 顏色模型特性可以看出它非常適合借助視覺系統(tǒng)來感知顏色特征的圖像的處理算法。
HSV 顏色模型的優(yōu)點(diǎn):
第一:與RGB色彩空間相比,和人的視覺特性更符合,利于色彩的識(shí)別和處理
第二:HSV 顏色空間的坐標(biāo)是獨(dú)立的,人可以感知各顏色分量的獨(dú)立變化
第三: HSV 顏色空間是均勻的顏色模型,顏色的距離和坐標(biāo)點(diǎn)的歐幾里德距離成正比
第四:HSV模型的顏色特征比較穩(wěn)定,具有一定的魯棒性,是較好的顏色
圖4 基于顏色特征的圖像檢索系統(tǒng)業(yè)務(wù)流程
4.1 基于顏色特征的圖像檢索系統(tǒng)結(jié)構(gòu)
系統(tǒng)的整個(gè)業(yè)務(wù)流程如下圖4所示:
(1)特征提取
能夠根據(jù)用戶的喜好對圖像的數(shù)據(jù)提取用戶有興趣并且適合要求的特征,RGB實(shí)現(xiàn)顏色空間,全局顏色直方圖是可以對于圖像全局的特征進(jìn)行表達(dá),局部累計(jì)直方圖則是可以對圖像局部的特征表達(dá)
圖5 直方圖
(2)匹配圖像
有了適合的特征之后,我們需要恰如其分的判別準(zhǔn)則,在數(shù)據(jù)庫中才能夠準(zhǔn)確、有效的判斷出與圖像的特征最相似的圖像。這種方法就是歐氏距離法。
(3)輸出結(jié)果
把滿足這些條件的候選結(jié)果按照相似度的大小輸出給用戶。
圖6 老虎的搜索結(jié)果
4.2 算法分析
某一個(gè)事物極有可能會(huì)因?yàn)楸尘暗牟煌辉u(píng)為不相似,這就是顏色直方圖存在的缺陷,這個(gè)缺陷導(dǎo)致背景不同的同一個(gè)事物在相似度的計(jì)算時(shí)出現(xiàn)錯(cuò)誤,特別是這一事物的比例偏少時(shí)更為明顯。顏色直方圖中,把中間部分的圖像默認(rèn)為重要部分圖像,四周圖像被默認(rèn)為背景圖像。而解決這一難題的方法就是把全局顏色直方圖和分塊關(guān)鍵直方圖相結(jié)合,這樣可以把圖像平均分配,但是圖像正中的重點(diǎn)部分具有較大的權(quán)值。老虎的直方圖,如圖5所示:
上述的基于顏色直方圖的劃分位置且給予權(quán)重的模型建立的步驟如下:
(1)根據(jù)上述的方法對進(jìn)圖像行分塊,并且對中心區(qū)直方圖的關(guān)鍵顏色H1進(jìn)行計(jì)算
(2)對圖像的整幅直方圖H2進(jìn)行計(jì)算,顏色直方圖新的表達(dá)式是:
H=4×H2/9+6×H1
這就突出了取值的目的,也把中間位置的重要性突出來了,中間位置的突出就相對弱化了背景圖像的像素,這也就達(dá)到了位置不同的圖像像素權(quán)重的分配,權(quán)值也就根據(jù)圖像位置的重要程度來分配。
4.3 系統(tǒng)性能分析
此次設(shè)計(jì)的開發(fā)環(huán)境是: VisualC++6.0,下載J.Z.Wang的SIMPLIcity系統(tǒng)測試庫,我們在該庫的1000幅圖片抽取100張圖片作為測試庫,根據(jù)歐式距離升序排列前16個(gè)樣本。該系統(tǒng)的實(shí)現(xiàn),直接以文件夾的形式調(diào)用圖像庫。如下圖6和圖7所示:
圖7 鮮花的搜索結(jié)果
查準(zhǔn)率=n/T
n表示查詢相關(guān)圖像
N表示圖像庫中與查詢圖像相關(guān)的總的圖像
T表示列表出的圖像數(shù)目
該文從老虎、鮮花、大象、公交、馬匹、恐龍等4個(gè)圖庫中各抽取16張組成一個(gè)96張的檢索庫。因此N=16,T=96。
如表1所示:
上面講的這個(gè)方法準(zhǔn)確的表達(dá)了圖像顏色的概率信息,但是圖像顏色的空間信息卻沒有被表達(dá)出來,所以顏色特征相同卻極有可能表示不同的圖像。對此,又有人提出局部顏色特征索引這一概念,它是顏色索引的進(jìn)一步改進(jìn)。
表1 檢索庫
CBIR現(xiàn)在正處于發(fā)展的起始階段,目前難點(diǎn)也比較多,基于顏色特征的圖像檢索是就是它的難點(diǎn)之一,圖像的顏色特征難在于顏色本身的特殊性,但是顏色特征卻又有很好的檢索效果,所以對圖像顏色特征檢索的研究也在如火如荼的展開著?,F(xiàn)階段顏色特征的探索性研究是非常多的,例如:多媒體數(shù)字圖書館系統(tǒng)、醫(yī)療圖像的分析、衛(wèi)星遙感圖等這些技術(shù)項(xiàng)目都促使著基于顏色特征的圖像檢索被學(xué)者研究。
[1]Kato T.Database architecture for content-based image re ?trieval[J].SPIE,1992(1662):112-123.
[2]Rui Yong,Huang T S,Chang Shih-Fu.Image RetrievalCurrent Techniques,Promising Directions and Open Issues[J].Journal of Visual Communication and Image Representation,1999,10(3):39-62.
[3]Gudivada V N,Raghavan V V.Content- Based Image Re ?trieval System[J].IEEE Computer,1995,9:18-22.
[4]IBM s Query By Image Content.[EB/OL].2003-06.231,第11期
[5]付瑋等.基于形狀特征的圖像檢索技術(shù)研究[J].1994(2185): 2- 14.
[6] Pentland A P,Picard R,Sclaroff S.Photobook:Content -based manipulation of image databases[J]. International Jour?nalof Computer Vision,2002, 18(3):233- 254.
[7]斯欽.基于內(nèi)容的圖像檢索技術(shù)的應(yīng)用研究[M],西安電子科技大學(xué)出版社.2005,12(3):14-16
[8]求是科技,蘇彥華等.《Visual C++ 數(shù)字圖像識(shí)別技術(shù)典型案例》[M],人民郵電出版社.2005.2:30-33
[9]求是科技.《Visual C++ 數(shù)字圖像處理典型算法及實(shí)現(xiàn)》[M],人民郵電出版社.2004.2:86-88.
Research and Application of Color Image Retrieval Based
Xing Xue
(Shangluo University SEM,Shanxi Shangluo,726000)
The development of network technology to make the number of Internet images are also growing rapidly, which makes fast and effective retrieval becomes urgent, the researchers based on the needs of Internet users have raised a variety of new technologies to retrieve images. This paper describes the development process of image retrieval technology; analysis of the main characteristics of color image retrieval technology means that the method of color histogram, color moment, color set, and then introduced the HSV model and the RGB model, and based on the histogram color defects (the same thing is likely to be due to different backgrounds and were rated not similar), to design a system to do the global color histogram and histogram block key combination.
color feature; image retrieval; color histogram
TP3
A
基于WebGIS的商洛尾礦資源信息可視化研究及開發(fā),項(xiàng)目編號(hào):SK2014-01-21