李新磊 河南師范大學(xué)圖書(shū)館,河南新鄉(xiāng) 453007
一種基于貼近度的圖片內(nèi)容檢索技術(shù)研究
李新磊 河南師范大學(xué)圖書(shū)館,河南新鄉(xiāng) 453007
基于內(nèi)容檢索的實(shí)質(zhì)是將圖像的底層特征進(jìn)行采集提取,而后對(duì)提取的圖像特征進(jìn)行檢索,當(dāng)然提取特征與特征檢索手段多種多樣。為了刻畫(huà)兩幅圖像相似特征集合之間的相似與接近程度問(wèn)題,對(duì)若干相似性度量標(biāo)準(zhǔn)之間的關(guān)系進(jìn)行了討論,提出解決方案并最終實(shí)現(xiàn)。
貼近度;相似性度量;圖像檢索
將一幅圖片的所有像素點(diǎn)作為一個(gè)研究對(duì)象,將其特征提取特征集合,討論圖像內(nèi)容的相似程度,也就是考慮兩個(gè)特征集合的相似程度。一般的相似度都是基于“距離”的概念來(lái)構(gòu)建的,所以我們?cè)谑褂觅N近度前首先要對(duì)距離有明確的定義:
有集合P和集合Q,定義集合P和Q的距離為:
從集合的距離來(lái)定義它們之間的貼近度,在考慮P相似于Q的問(wèn)題上設(shè)有集合P和集合Q,定義P和Q的集合貼近度為:
特別地,若P=Q,則P和Q的集合貼近度達(dá)到最大值1,即P和Q完全貼近。若P≠Q(mào)且P∩Q=Φ,則P和Q的集合貼近度達(dá)到最小值0,即P和Q完全不貼近。由此可見(jiàn),集合貼近度反映了集合之間的相貼近的程度。并且n越大,表明集合之間越貼近;n越小,表明集合之間越不貼近。
由于貼近度是在距離的基礎(chǔ)上定義出來(lái)的,它們之間的聯(lián)系是緊密的,設(shè)S=(U,A)是一個(gè)信息系統(tǒng),P,Q 屬于A ,則,這表明,在距離定義和貼近度定義的意義下,集合距離和集合貼近度之間有著嚴(yán)格的互補(bǔ)關(guān)系。n越大,表明集合之間距離越??;D越大,表明集合之間距離越大。反之亦然,n越大,表明集合之間貼近度越大(即越相似);D越大,表明集合之間貼近度越小(即越不相似)。
HSI顏色空間是以人眼的視覺(jué)特征為基礎(chǔ),利用三個(gè)相對(duì)獨(dú)立、容易預(yù)測(cè)的顏色心理屬性:色度(H ue)、光強(qiáng)度(In tensity)和飽和度(Saturation)來(lái)表示顏色,反映了人的視覺(jué)系統(tǒng)觀察彩色的格式。色度是由物體反射光線(xiàn)中占優(yōu)勢(shì)的波長(zhǎng)來(lái)決定,不同的波長(zhǎng)產(chǎn)生不同的顏色感覺(jué),如紅、橙、黃、綠、青、藍(lán)、紫等。它是彩色最為重要的屬性,是決定顏色本質(zhì)的基本特性。 顏色飽和度是指一個(gè)顏色的鮮明程度,飽和度越高,顏色越深,如深紅、深綠等。在物體反射光的組成中,白色光愈少,色飽和度愈大;顏色中的白色或灰色愈多,其飽和度就越小。光強(qiáng)度是指光波作用于感受器所發(fā)生的效應(yīng),其大小是由物體反射系數(shù)來(lái)決定,反射系數(shù)越大,物體的光強(qiáng)度愈大,反之愈小,如圖2-1所示。
HSI彩色模型更加容易描述人類(lèi)眼睛的視覺(jué)習(xí)慣,其中H代表色調(diào),表示顏色,與波長(zhǎng)有關(guān), 是當(dāng)人眼看一種或多種波長(zhǎng)的光時(shí)所產(chǎn)生的彩色感覺(jué),它反映顏色的種類(lèi),是決定顏色的基本特性,紅色、綠色等都是指色調(diào);S代表飽和度,表示顏色純度,即單色光中滲入白光的程度,對(duì)于同一色調(diào)的彩色光,飽和度越高,顏色越鮮明,說(shuō)明越純。從黑到白整個(gè)紡錘體的中心軸,就表示像素的不同灰度。它從明度、色相和飽和度三個(gè)視覺(jué)心理屬性來(lái)描述圖像所反映的顏色信息,在人心理感知上更容易被接受。假設(shè)基色測(cè)量已標(biāo)準(zhǔn)化,即,根據(jù)如下公式將RGB顏色模型轉(zhuǎn)換為HSI顏色模型,從而得到了由明度、色相和飽和度所組成的彩色圖像顏色信息。
由顏色感覺(jué)空間的幾何模型圖易知,雙錐體水平面的圓周上,各點(diǎn)的位置表示了光譜上各種不同的色相的顏色屬性(紅黃綠青藍(lán)紫),其值分布在H[)之間,人眼能夠感知的顏色其過(guò)渡是連續(xù)的,引入粒計(jì)算機(jī)制對(duì)每個(gè)像素的色相值進(jìn)行粒度量化,對(duì)應(yīng)得到M個(gè)關(guān)于顏色的粒度區(qū)間,顏色信息特征可以描述為:H={Red,Yellow,Green,Cyan,Blue,Magenta},其中每一個(gè)顏色特征的隸屬度都由圖2-2的三角函數(shù)所示[3]。
人眼能夠感知的顏色其過(guò)渡是連續(xù)的,每個(gè)像素的顏色其過(guò)渡是連續(xù)的,引入粒計(jì)算機(jī)制對(duì)每個(gè)像素的色相H ue值進(jìn)行粒化。設(shè)圖庫(kù)中所有圖為論域U,每一幅圖像為研究對(duì)象,圖像的各屬性值為相應(yīng)知識(shí)。在對(duì)圖像進(jìn)行分類(lèi)的過(guò)程中,我們沒(méi)有必要考慮所有顏色,往往只考慮一部分指定顏色即可以得到較好的分類(lèi)效果。
根據(jù)圖像得到一系列屬性:a1,a2,…,an。對(duì)于圖像x,y。如果圖像x的顏色與y的顏色種類(lèi)不一致(這是常常發(fā)生的),極端的情況例如x只有一種顏色,但我們已將其離散化為6種(如何表示我們?cè)谙旅鎸⒃敿?xì)討論),對(duì)應(yīng)得到六個(gè)關(guān)于顏色的區(qū)間,顏色信息特征可以構(gòu)成新的粒集,描述為H ue={Red,Yellow,Green,Cyan,Blue,Magenta},繼而圖像中的像素顏色信息都可以與粒集Hue中的值對(duì)應(yīng)。其中每一個(gè)顏色特征的隸屬度都由圖3-3函數(shù)所示。
圖像的顏色直方圖反映了像素顏色在所給出圖像中出現(xiàn)的頻率,它可以由向量H表示:H={H[1], H[2],…, H[c],…, H[M],}其中i表示某一種顏色,H[i]表示圖像中顏色i的像素個(gè)數(shù),M表示顏色直方圖中顏色種類(lèi)。
為了便于比較和檢索數(shù)據(jù)庫(kù)中不同尺寸的圖像數(shù)據(jù),向量H應(yīng)該進(jìn)行規(guī)格化,使其特征值在0~1之間,一種常用的規(guī)格方法如下,得到規(guī)格化的向量H#:H#={H*[1], H*[2],…, H*[i],…, H*[M] },其中 H*[i]=H[i]/P,P表示了圖像中像素總數(shù)。
按照粒計(jì)算的理論,上式中H*[i]反映了顏色i在圖像中出現(xiàn)的概率(粒計(jì)算隸屬度),那么規(guī)格化向量H#本身即為一個(gè)粒集。特別地,圖像中出現(xiàn)頻率較高的N種顏色可以視為圖像的主色,若定義N種主色在圖像中的隸屬度為1,那么得到規(guī)格化的粒化的顏色直方圖向量:表示了圖像中表現(xiàn)為所有顏色的像素點(diǎn)總數(shù),這里=1。
所提取圖像顏色特征,其粒集顏色直方圖將由圖像的顏色信息在圖像中的出現(xiàn)頻率構(gòu)成,按照上述方法,對(duì)圖像數(shù)據(jù)庫(kù)中的所有圖像,根據(jù)上式可以得到每一幅圖像所對(duì)應(yīng)的規(guī)格化的粒的直方圖向量。
假設(shè)給定一幅圖,依據(jù)上面的方法容易構(gòu)建與圖像數(shù)據(jù)庫(kù)中圖像對(duì)應(yīng)的特征數(shù)據(jù)的粒集,可將黑、紅、黃、綠、青、藍(lán)、紫、白八種顏色的隸屬度進(jìn)行歸一化后構(gòu)成粒集S:
顏色特征集對(duì)照表
利用貼近度理論計(jì)算得出:
[1]汪培莊.模糊集合論及其應(yīng)用[M].上海:上??茖W(xué)技術(shù)出版社.1983
[2]孫超,韓捷,關(guān)惠玲.模糊集的貼近度及多維綜合貼近度[J].鄭州:河南科學(xué).2004,22(02):143- 166
[3]Y Rui, T S Huang, M Ortega et al.Relevance feedback: a power tool for interactive content-based image retrieval[J]. IEEE Trans on Circuits and Systems for Video Technology,1998
[4]章毓晉.基于內(nèi)容的視覺(jué)信息檢索[M].北京:科學(xué)出版社.2003,3-10
[5]徐久成,孫林.基于粒計(jì)算貼近度的理論研究.計(jì)算機(jī)科學(xué)[J]. 2006,33(11A):114-115
10.3969/j.issn.1001-8972.2011.10.070
本文系河南師范大學(xué)青年科學(xué)基金項(xiàng)目《基于貼近度的統(tǒng)計(jì)特征模型在圖像檢索中的應(yīng)用》階段性成果
李新磊(1 9 7 8—),男,工程師,碩士,畢業(yè)于鄭州大學(xué)河南省信息網(wǎng)絡(luò)重點(diǎn)實(shí)驗(yàn)室,現(xiàn)就職于河南師范大學(xué)圖書(shū)館,研究方向:計(jì)算機(jī)網(wǎng)絡(luò)。