【摘 要】如何實(shí)現(xiàn)圖像的快速瀏覽和查詢使得基于內(nèi)容圖像檢索的應(yīng)用受到了很大限制。針對(duì)這一問(wèn)題,本文提出在檢索之前,先對(duì)圖像庫(kù)進(jìn)行基于內(nèi)容自組織的結(jié)構(gòu)劃分,給出了一種新的確定模糊權(quán)值的定義。實(shí)驗(yàn)結(jié)果表明,該算法能夠大大縮短檢索的時(shí)間。
【關(guān)鍵詞】基于內(nèi)容的圖像檢索 模糊c均值(FCM) 自組織結(jié)構(gòu)劃分 聚類
一、引言
九十年代早期,由于大規(guī)模圖像數(shù)據(jù)庫(kù)的出現(xiàn),由手工進(jìn)行圖像標(biāo)注基于文本的圖像檢索所帶來(lái)的問(wèn)題變得十分明顯,為了克服這一困難,研究者們提出了基于內(nèi)容的圖像檢索(Content-Based Image Retrieval, CBIR)對(duì)圖像內(nèi)容進(jìn)行機(jī)器自動(dòng)分析,直接根據(jù)圖像內(nèi)容特征信息建立索引,并且通過(guò)圖像特征向量間的近似度量進(jìn)行圖像相似性匹配,從而實(shí)現(xiàn)圖像的檢索。
伴隨著時(shí)代的發(fā)展,科技的進(jìn)步,圖像的資源越來(lái)越豐富,圖像庫(kù)中的圖像往往也是海量的,這就給人們使用圖像庫(kù)帶來(lái)了不便,那么我們?nèi)绾螐暮A康膱D像庫(kù)中能夠方便的找到自己想要的圖像呢?本文提出了對(duì)圖像庫(kù)進(jìn)行基于內(nèi)容自組織的結(jié)構(gòu)劃分,使無(wú)序的圖像庫(kù)變成有一定的規(guī)律,現(xiàn)在基于內(nèi)容的圖像檢索技術(shù)還主要是靠圖像的底層特征(如顏色、紋理、形狀、空間關(guān)系等)來(lái)進(jìn)行的。本文中應(yīng)用模糊c均值聚類來(lái)對(duì)圖像庫(kù)進(jìn)行分類的。模糊c均值聚類關(guān)鍵的就是模糊權(quán)值的確定,常用的算法是利用特征向量間的距離計(jì)算模糊權(quán)值,但是當(dāng)某一向量與兩個(gè)質(zhì)心距離相等時(shí),則不論兩個(gè)類別的分布情況如何,模糊權(quán)均相等不能得到準(zhǔn)確的分類,為了解決這一問(wèn)題,更好的反映聚類的分布,本文給出了一種新的確定模糊權(quán)值的定義。圖像庫(kù)經(jīng)過(guò)基于內(nèi)容相似性的劃分后,使圖像在圖像庫(kù)中存放的位置有了一定的規(guī)律,如果這時(shí)再查找自己想要的圖像,就不必對(duì)圖像庫(kù)進(jìn)行逐幅查找了,而只要找到跟示例圖像距離最近的類的中心,然后在該類中進(jìn)行查找就可以了,最后把檢索結(jié)果輸出給用戶。
本文在第二部分給出了基于內(nèi)容自組織檢索系統(tǒng)的框圖,第三部分詳細(xì)介紹了改進(jìn)的模糊C均值聚類算法,最后是實(shí)驗(yàn)結(jié)果和結(jié)論。
二、系統(tǒng)框圖
目前,基于內(nèi)容的圖像檢索是通過(guò)計(jì)算示例圖像與圖像庫(kù)中圖像之間的視覺(jué)特征的相似度來(lái)完成的,而且所提取的特征大都可以表示成向量的形式,即可以把圖像表示為向量形式,所以可以把它們看作是特征空間中的點(diǎn),而檢索的過(guò)程實(shí)質(zhì)上就是尋找特征空間中離查詢向量最近的那些點(diǎn)所對(duì)應(yīng)的圖像。
對(duì)圖像庫(kù)中的圖像進(jìn)行基于內(nèi)容的自組織結(jié)構(gòu)劃分實(shí)際上就是對(duì)特征空間中的點(diǎn)進(jìn)行劃分,即模式識(shí)別中的數(shù)據(jù)聚類問(wèn)題。
三、改進(jìn)的模糊c均值(FCM)算法
模糊聚類是無(wú)監(jiān)督模式識(shí)別的一個(gè)重要分支,在模式分類、圖像處理和模糊規(guī)則提取等眾多的領(lǐng)域中獲得了廣泛的應(yīng)用。在眾多的聚類算法中,模糊c均值(FCM)算法是最重要也是最為人們熟悉的方法之一。
該算法實(shí)質(zhì)上是通過(guò)對(duì)目標(biāo)函數(shù)的迭代優(yōu)化實(shí)現(xiàn)集合劃分,它可以表示出各個(gè)象素屬于不同類別的程度,與此對(duì)應(yīng)的硬c均值聚類算法則將每個(gè)象素都直接和唯一的劃分到某個(gè)類別中去。本文中采取聚類算法的基本思想是:若Q為圖像庫(kù)中的圖像數(shù)目,N為特征向量維數(shù),則整個(gè)圖像庫(kù)可表示為Q個(gè)N維特征向量。首先,選取K個(gè)類中心,將庫(kù)內(nèi)圖像與每個(gè)類中心求歐氏距離,然后按最小距離原則分配給相應(yīng)的類中心,這樣每個(gè)類別中平均包含Q/K幅圖像。聚類算法如下:
(一)初始聚類數(shù)K與初始類中心的確定
1.初始聚類數(shù):
根據(jù)經(jīng)驗(yàn)理論和實(shí)驗(yàn)數(shù)據(jù),很容易得到初始聚類數(shù)
2.初始聚類中心:
首先從圖像的特征數(shù)據(jù)庫(kù)中選取距離最遠(yuǎn)的兩個(gè)特征向量作為第一、二初始類中心,假設(shè)已經(jīng)確定了k個(gè)初始類中心,則第k+1個(gè)初始類中心是與前k個(gè)類中心距離累加和最大的特征向量,如此得到K個(gè)初始類中心。
3.樣本初步分配
初始模糊權(quán)?。?-1)之間的隨機(jī)數(shù)。然后將其進(jìn)行規(guī)一化
根據(jù)初始模糊權(quán) 將庫(kù)內(nèi)樣本與各初始聚類中心進(jìn)行比較,歸入距離最近的類中心。
4.樣本合并
若兩初始聚類中心間距離小于閾值T,兩樣本中心合并。
count[k]:每類中所包含圖像個(gè)數(shù)。
5、更新聚類中心
將各類成員的質(zhì)心作為新聚類中心。
(二)圖像樣本隸屬度的權(quán)值確定
從上面的分析可以看出常用的FCM算法采用特征向量間的距離計(jì)算模糊權(quán)值(如式3.3),如果圖像與聚類中心之間距離越遠(yuǎn),那么該圖像屬于這一類的隸屬程度就會(huì)越小,但當(dāng)某一向量與兩個(gè)質(zhì)心距離相等時(shí),則不論兩個(gè)類別的分布情況如何,模糊權(quán)均相等不能得到準(zhǔn)確的分類。下面就這一問(wèn)題本文進(jìn)行了深入的研究,給出了一種新的確定模糊權(quán)值的定義。
定義1:給定圖像序列,其中Q是圖像庫(kù)中圖像的數(shù)目,初始聚類中心序列,其中K是初始聚類的數(shù)目,則圖像屬于第k類的模糊權(quán)值定義為:
(三)樣本分配
經(jīng)過(guò)迭代后,新的聚類中心已經(jīng)確定。然后再根據(jù)(4)把圖像歸入距離最近的聚類中心。
(四)聚類的融合
若兩聚類間的距離小于閾值,同時(shí)分別屬于類的樣本比例均超過(guò),則對(duì)兩聚類進(jìn)行融合處理。
1.首先找出距離最近的兩聚類中心。如果聚類數(shù)為K,則距離對(duì)個(gè)數(shù)
4.計(jì)算各聚類中心之間距離的平均值
(15)
5.如,同時(shí)滿足 ,則兩類進(jìn)行融合處理。
四、實(shí)驗(yàn)結(jié)果及結(jié)論
圖像庫(kù)中的圖像經(jīng)過(guò)聚類后,內(nèi)容相似的圖像被分到同一類中,這樣在檢索的時(shí)候,只需比較示例圖像與各個(gè)類中心的距離,而不需要示例圖像與圖像庫(kù)中的每一幅圖像進(jìn)行比較,大大縮減了搜索的空間,減少了初步檢索的時(shí)間,實(shí)驗(yàn)結(jié)果表明,該過(guò)程使基于內(nèi)容的圖像檢索過(guò)程更加合理,更加適應(yīng)人們?cè)趯?shí)際中的需要。
參考文獻(xiàn):
[1]章毓晉.基于內(nèi)容的視覺(jué)信息檢索. 科學(xué)出版社, 2003年5月,第1版.
[2]莊越挺,潘云鶴,吳飛.網(wǎng)上多媒體信息分析與檢索. 清華大學(xué)出版社, 2002.
[3]張建東, 蘇鴻根. 基于內(nèi)容的圖像檢索關(guān)鍵技術(shù)研究. 計(jì)算機(jī)工程, Vol.30, No 14,2004,7:119-121.
[4] Colombo C, Bimbo A, Castelli V, and Bergman L D. Visible image retrieval. In: Image Databases---Search and Retrieval of Digital Imagery, 2002, Inc. Ch.2, 11-33.
[5]高新波.模糊聚類分析及其應(yīng)用. 西安電子科技大學(xué)出版社, 2004年1月, 第1版
作者簡(jiǎn)介:
趙建敏(1978.11-)碩士研究生學(xué)歷,2006年畢業(yè)于吉林大學(xué)通信工程學(xué)院,主要從事圖像與視頻信號(hào)的識(shí)別與檢索系統(tǒng)的研究,發(fā)表論文數(shù)篇,參與發(fā)明專利一項(xiàng)。