裴志松 唐昌華
(長(zhǎng)春工業(yè)大學(xué)人文信息學(xué)院,吉林 長(zhǎng)春 130122)
基于區(qū)域的圖像檢索技術(shù)是一門被廣泛研究的信息檢索技術(shù)。該項(xiàng)檢索技術(shù)由系統(tǒng)對(duì)圖像進(jìn)行提取與識(shí)別,解決了傳統(tǒng)的基于關(guān)鍵詞檢索中的各種問題。特別是隨著網(wǎng)絡(luò)技術(shù)與多媒體技術(shù)、數(shù)據(jù)庫技術(shù)相互融合,檢索系統(tǒng)開發(fā)需求的不斷擴(kuò)大,是一個(gè)頗具生命力的研究方向,針對(duì)這一方向深入研究,將具有很大的理論價(jià)值和廣泛的應(yīng)用前景。
常用的圖像檢索技術(shù)大致可以分為基于邊界檢測(cè)和基于區(qū)域兩種方法。包括:邊界檢測(cè)分割法和區(qū)域檢測(cè)法。邊界法先檢測(cè)出圖像中的邊緣點(diǎn),然后按照一定的策略把這些邊緣點(diǎn)連接成輪廓,封閉邊界所包圍的像素就組成了相應(yīng)的區(qū)域。
基于區(qū)域的方法是把圖像中的各個(gè)像素依據(jù)一定的規(guī)則分到各個(gè)區(qū)域中,這些區(qū)域的外圍像素就會(huì)構(gòu)成了區(qū)域的邊界,所以關(guān)鍵是如何確定像素分類的規(guī)則。實(shí)際規(guī)則中應(yīng)用的區(qū)域分割技術(shù)主要有兩種:一種是閾值化算法,另一種是特征空間聚類。特征空間聚類的方法是對(duì)閾值分割的一種推廣方式。它采用特征空間點(diǎn)來表示圖像空間中的元素,通過將特征空間的點(diǎn)聚集成團(tuán),然后再將它們映射回原圖像空間,來達(dá)到取得分割的結(jié)果。通常在高維特征空間的聚類,如果只用一個(gè)特征往往不能解決的問題,所以,特征空間聚類通常采用多個(gè)特征。通常采用的方法有K-均值、模糊聚類、ISODATA 聚類、概率聚類等。區(qū)域分割技術(shù)有兩種基本形式,一種是根據(jù)單個(gè)像素,逐漸合并以形成所需的分割區(qū)域,另一種是從全局的出發(fā),逐漸分裂切割到所需的分割區(qū)域,對(duì)應(yīng)的兩種典型算法分別是區(qū)域生長(zhǎng)和分裂合并。
在眾多提取參數(shù)中,可以選擇顏色特征作為K-均值聚類的中心,根據(jù)每一個(gè)小的區(qū)域的顏色的均值和標(biāo)準(zhǔn)差的平均值,可以計(jì)算出它的紋理特征,進(jìn)而對(duì)圖像進(jìn)行提取,計(jì)算的步驟如下:
(1)在圖像中,選擇一個(gè)點(diǎn)作為提取點(diǎn),然后將其他點(diǎn)都設(shè)置為黑色。
(2)通過轉(zhuǎn)換,將圖像的顏色模式轉(zhuǎn)變成灰度圖像。
(3)在剛才的灰度圖像上,根據(jù)算法,作四層小波變換。
(4)在變換后的每個(gè)高頻子帶上,計(jì)算他們的平均能量,如公式1所示。
(5)做四層小波變換后,獲得的12個(gè)能量值,用合適的比例,組成一個(gè)紋理特征向量。
式中,X(i,j)表示紋理圖像,E 表示能量,M、N 是紋理圖像的維數(shù)。
每一個(gè)單體特征可以定義為,如公式2 所示:
式中,rij表示在區(qū)域j 特征i 的向量,維數(shù)為K。
圖像的特征定義為,如公式3 所示:
在進(jìn)行圖像匹配的時(shí)候,可以獲得各種不同的特征值,但是對(duì)于圖像檢索的共享大小不同,所以我們需要對(duì)他們進(jìn)行進(jìn)一步的歸一化處理,規(guī)定相似度S 都在0 到1 之間,并且在某個(gè)特征rij內(nèi)部進(jìn)行。并且,在計(jì)算S 之前,同時(shí)要求將特征向量的各分量rijk(表示第i 種方法,第j個(gè)區(qū)域,第k個(gè)分量)統(tǒng)一進(jìn)行歸一化操作,否則采用S 的線性組合來計(jì)算總體相似度S 就變得沒有意義。把這種對(duì)rijk的歸一化稱為特征內(nèi)的歸一化。
特征內(nèi)部的歸一化可以使特征向量rij與的各分量與rijk具有同等的重要性。因?yàn)樘卣飨蛄康牟煌至?,都具有不太相同的含義,所以,經(jīng)過歸一化之后,它們各自的變化幅度也可能有很大不同,如果直接用來計(jì)算相似度就會(huì)引起很大偏差。所以必須要將特征向量的各分量,都統(tǒng)一的歸一化到一定的范圍中去。所以,我們定義特征向量V=rij,則每一特征向量rij的歸一化過程可以如下:
假設(shè)數(shù)據(jù)庫中共M 幅素材,而m 為素材的索引值,可以這樣定義,如公式4 所示:
表示第m 幅素材的特征向量,而K 是特征向量V=rij的維數(shù)。如果我們將所有素材的Vm累積在一起,就能獲得維數(shù)為M×K 的矩陣,如公式5 所示:
其中vm,k是特征向量Vm(對(duì)應(yīng)于第m 幅素材)的第k個(gè)分量。為了保證個(gè)分量能有相同的重要性,矩陣的第k 列是維數(shù)為M 的一個(gè)列向量,記為vk。最終將每列中的元索,都統(tǒng)一歸一化到指定的值域標(biāo)準(zhǔn)內(nèi),這樣就可以保證在計(jì)算兩個(gè)向量之間的相似度。
根據(jù)以上計(jì)算,如果能夠融合高斯歸一化方法,可以獲得更好的結(jié)果。假設(shè)列向量vk是一個(gè)高斯數(shù)列,可以首先計(jì)算該數(shù)列的標(biāo)準(zhǔn)方差σk和平均值聲μk,然后式6 來實(shí)現(xiàn)高斯歸一化,公式定義如公式6所示:
通過結(jié)果分析,將公式6 的分母部分,都替換為經(jīng)過σk單獨(dú)歸一化后,數(shù)列中的某個(gè)值位于區(qū)間[-1,1]范圍中的概率大約為68%。如果用式6,則根據(jù)高斯歸化后,其數(shù)值在區(qū)間[-1,1]范圍中的概率已經(jīng)達(dá)到了99%。所以可以認(rèn)為數(shù)列,通過該方法所有值都己經(jīng)在[-1,1]范圍中了,高斯歸一化方法的優(yōu)點(diǎn)在于,即便是數(shù)列中存在一些異常的數(shù)值,比如過大或者過小,在計(jì)算向量間的相似度時(shí),也不會(huì)導(dǎo)致分量rijk重要性有所偏差,達(dá)到了預(yù)期的效果。
通過使用的圖像庫SIMPLIcity 系統(tǒng)提供的測(cè)試集。它是從Corel圖像庫中抽取的500 幅圖像,分為:人、醫(yī)療器械、建筑物、老虎、山峰、食物等,每類一百幅。分別是使用基于區(qū)域的方法對(duì)其進(jìn)行檢索,結(jié)果均達(dá)到了理想的要求。
[1]呂英華,唐昌華,孔俊,等.A Content-Based Image Retrieval System Using RBF Neural Network[C]//DCDIS 國際會(huì)議.2007,10.
[2]章毓晉.圖象工程——圖象理解與計(jì)算機(jī)視覺[M].北京:清華大學(xué)出版社,2000.
[3]WY Ma and B Manjunath.Netra:A Toolbox for Navigating Large Image Databases[C]//Proc.IEEE Int’l Conf.Image Processing.2012:568-571.