潘紅艷
(浙江工商職業(yè)技術(shù)學(xué)院,浙江 寧波 315012)
圖像是一種直觀表達(dá)信息的媒介。隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展和各種購(gòu)物平臺(tái)的興起,網(wǎng)絡(luò)數(shù)據(jù)庫(kù)中的圖像數(shù)據(jù)量呈指數(shù)級(jí)增長(zhǎng)。面對(duì)繁雜的海量圖像數(shù)據(jù),高效的圖像檢索系統(tǒng)應(yīng)運(yùn)而生。利用該系統(tǒng),人們可以快速地在海量圖像數(shù)據(jù)中找到與自己需求相匹配的圖像。
在圖像檢索中,最常用的是基于內(nèi)容的圖像檢索。基于內(nèi)容的圖像檢索是基于圖像底層特征進(jìn)行的檢索。圖像的底層特征有顏色特征、紋理特征和形狀特征。由于圖像本身的復(fù)雜性,很難用一種特征去描述千差萬(wàn)別的圖像[2]。基于單一圖像特征的檢索系統(tǒng),檢索準(zhǔn)確率普遍不高。越來(lái)越多的研究者嘗試將多種圖像特征采用一定的融合策略進(jìn)行圖像檢索,以提高檢索系統(tǒng)的查全率和查準(zhǔn)率。
角點(diǎn)指的是圖像中灰度值在水平和垂直方向變化都顯著的一類點(diǎn),是圖像的局部特征。將角點(diǎn)進(jìn)一步處理,可以形成圖像的興趣區(qū)域。常用的角點(diǎn)檢測(cè)算法有Harris算法、Susan算法等[1]。本文采用Harris算法獲取圖像的興趣區(qū)域。數(shù)學(xué)模型如下:
w(x,y)為窗口函數(shù),(u,v)是窗口偏移量,(x, y)為窗口內(nèi)所對(duì)應(yīng)的圖像像素的位置。
當(dāng)水平方向和垂直方向變化不明顯時(shí),R(u,v)≈0,此時(shí)該點(diǎn)不是角點(diǎn)(興趣點(diǎn)),否則為角點(diǎn)。角點(diǎn)獲取后,根據(jù)所有角點(diǎn)的位置,確定一個(gè)能包含所有角點(diǎn)的最小矩形,即興趣區(qū)域。角點(diǎn)檢測(cè)結(jié)果如圖1所示(白色點(diǎn)為檢測(cè)出的角點(diǎn))。
顏色特征是圖像檢索系統(tǒng)中最常用的一個(gè)特征,是一個(gè)全局特征,魯棒性較好。常用的顏色特征有顏色直方圖、顏色相關(guān)圖、顏色矩等。
圖1 角點(diǎn)檢測(cè)
(1)灰度化圖像。利用公式I(i,j)=(R+G+B)/3,求出像素點(diǎn)I(i,j)的灰度值,從而將彩色圖像灰度化。
(2)對(duì)像素值進(jìn)行聚類。圖像的顏色特征比較復(fù)雜,如果直接獲取圖像的直方圖,會(huì)導(dǎo)致形成的特征向量維度太大,影響計(jì)算速度。為了降低特征向量的維度,利用K-means算法對(duì)興趣區(qū)域內(nèi)的灰度像素值進(jìn)行聚類。
(3)提取灰度累積直方圖。顏色直方圖表示的是圖像灰度值的一種統(tǒng)計(jì)信息,具有旋轉(zhuǎn)不變、縮放不變等穩(wěn)定特征。為了避免顏色直方圖的零值問(wèn)題,本文采用灰度累積直方圖獲取圖像的顏色特征。
L為圖像的灰度級(jí)數(shù),ni為圖像中灰度級(jí)為i的像素個(gè)數(shù)。
紋理特征反映的是圖像內(nèi)容或顏色的某種變化,是一種統(tǒng)計(jì)特征,所以抗噪能力比較強(qiáng)。常用的紋理特征提取方法有灰度共生矩陣、傅里葉變換等?;叶裙采仃囉捎趯?shí)現(xiàn)簡(jiǎn)單、特征提取速度快等優(yōu)點(diǎn),成為紋理特征提取中經(jīng)常被采用的方法。
本文采用灰度共生矩陣的方法提取圖像的紋理特征,計(jì)算時(shí)灰度級(jí)取16級(jí),在4個(gè)方向上(0°,45°,90°,135°)分別計(jì)算能量、熵、慣性矩、相關(guān)度4個(gè)紋理特征,然后分別計(jì)算4個(gè)方向上的均值μ和標(biāo)準(zhǔn)差σ,將其重新組合,得到8維紋理特征向量T=[μ1,μ2,μ3,μ4,σ1,σ2,σ3,σ4]。
為了減少不同特征分量對(duì)檢索結(jié)果的影響,在進(jìn)行相似度計(jì)算之前對(duì)特征分量進(jìn)行歸一化處理。假設(shè)圖像數(shù)據(jù)庫(kù)中有M幅圖像,提取的特征向量有N維,形成M×N的特征矩陣VM×N。對(duì)特征矩陣中的每一個(gè)元素vi,j(表示第i個(gè)圖像的第j個(gè)特征),利用0均值標(biāo)準(zhǔn)化方法進(jìn)行歸一化處理,如式3所示。
在提取興趣區(qū)域中的顏色特征和紋理特征,并進(jìn)行歸一化處理后,形成顏色特征矩陣CM×N和紋理特征矩陣TM×N。
(1)將待檢索圖像的顏色特征向量與CM×N中的向量進(jìn)行相似度計(jì)算(利用Euclidean距離),得到相似度為Ci(i=1……M)[3]。
(2)將待檢索圖像的紋理特征向量與TM×N中的向量進(jìn)行相似度計(jì)算(利用Euclidean距離),得到相似度為Ti(i=1……M)。
(3)將Ci和Ti利用公式Sim(Q,Pi)=WcCi+WTTiα+β=1進(jìn)行融合。
α和β的取值大小對(duì)結(jié)果有著至關(guān)重要的影響。圖像是千差萬(wàn)別的,如果把α和β值固定,也就是對(duì)所有圖像都應(yīng)用相同的權(quán)值,是不符合實(shí)際情況的。本文在確定α和β值時(shí),基于這樣的假設(shè):如果待檢索圖像與圖像數(shù)據(jù)庫(kù)中的每一幅圖像之間的距離都相似,說(shuō)明圖像對(duì)這類特征不敏感,應(yīng)賦予較低的權(quán)值。
為了驗(yàn)證本文提出的基于角點(diǎn)的動(dòng)態(tài)加權(quán)融合檢索技術(shù)[4]的有效性,自建小型圖像數(shù)據(jù)庫(kù),數(shù)據(jù)庫(kù)中包括自然風(fēng)光、昆蟲、魚、建筑、鮮花、汽車6類圖像,每類圖像200幅,共有圖像1 200幅。實(shí)驗(yàn)環(huán)境為Matlab2016b,Win7操作系統(tǒng)。
本文提出的圖像檢索方法查準(zhǔn)率和查全率如圖2—3所示。
圖2 圖像檢索查準(zhǔn)率
圖3 圖像檢索查全率
多特征融合的圖像檢索方法得到越來(lái)越多研究者的重視。利用哪些圖像特征進(jìn)行融合,以及采用什么樣的融合策略是提高檢索系統(tǒng)效率的關(guān)鍵。本文提出的基于角點(diǎn)的動(dòng)態(tài)加權(quán)融合方法,一定程度上解決了融合時(shí)固定權(quán)重帶來(lái)的問(wèn)題。在進(jìn)行特征提取之前,先利用Harris算法檢測(cè)角點(diǎn),確定圖像的主體興趣區(qū)域,減少了圖像中背景信息對(duì)檢索結(jié)果的干擾,提高了檢索系統(tǒng)的查全率和查準(zhǔn)率。