胡明娣, 劉 標(biāo)
(西安郵電大學(xué) 通信與信息工程學(xué)院, 陜西 西安 710121)
紋身圖像檢索技術(shù)是偵破刑事案件的手段之一[1],其方法最初主要是基于顏色、紋理和形狀等底層圖像特征[2-6]。為了適應(yīng)紋身圖像底層特征不夠穩(wěn)定的情形,人們引入了尺度不變特征變換(scale invariant feature transform, SIFT)特征[7-9],但在利用歐氏距離進(jìn)行特征點(diǎn)匹配時(shí),此法極易出錯(cuò),致使檢索精度不高。
在SIFT特征之外,加入紋身位置信息[10],可縮小檢索范圍,或?qū)IFT特征和全局形狀特征相結(jié)合,可完善檢索依據(jù)[11],此外,采用SIFT特征與詞袋(bag-of-words, BOW)模型相結(jié)合的方法[12],還可避免由詞袋量化引起的精確度損失。但是,這些基于SIFT特征的算法都未能顧及彩色紋身圖像的顏色信息。對(duì)于彩色紋身圖像,可結(jié)合SIFT特征和局部自相似性(local self similarity,LSS),實(shí)現(xiàn)圖像特征描述[13],此法因顏色信息的引入,能使檢索精度得以提高,但特征維度較大,提取效率不高,檢索時(shí)間較長(zhǎng)。
為了提高檢索精度,同時(shí)縮短檢索時(shí)間,本文擬給出一種基于三支決策[14-15]的分步約簡(jiǎn)紋身圖像檢索算法。計(jì)算經(jīng)灰度化處理后待檢索圖像與圖像庫(kù)所有圖像對(duì)應(yīng)像素點(diǎn)灰度值的差異,統(tǒng)計(jì)差值小于某閾值的像素點(diǎn)在各圖像中所占比例,據(jù)此以三支決策從圖像庫(kù)中篩選出相似圖像并剔除不相似圖像;提取剩余圖像的SIFT特征,使用歐氏距離進(jìn)行特征點(diǎn)匹配,再次以三支決策選取正確匹配點(diǎn)并剔除錯(cuò)誤匹配點(diǎn),提取其余特征點(diǎn)鄰域色調(diào)-飽和度-亮度(hue saturation value, HSV)空間的顏色特征[16],并結(jié)合SIFT特征進(jìn)行特征點(diǎn)匹配,進(jìn)而確定出不同程度的相似圖像。
將彩色待檢索紋身圖像I和圖像庫(kù)中所有紋身圖像,轉(zhuǎn)化為灰度圖像[13]。調(diào)整所有圖像大小[17],使其與待檢索圖像保持一致。
將待檢索圖像I與圖像庫(kù)圖像對(duì)應(yīng)像素點(diǎn)灰度值相減得到值d,經(jīng)實(shí)驗(yàn)設(shè)置閾值μ。若d≤μ,則把圖像庫(kù)圖像相應(yīng)像素點(diǎn)賦值為1,否則,賦值為0。統(tǒng)計(jì)圖像庫(kù)各圖像賦值為1的像素點(diǎn)在該圖像所有像素點(diǎn)中所占比例α。某圖像與待檢索圖像I越相似,則其α值越大。
經(jīng)實(shí)驗(yàn)尋找合適的閾值a和b。根據(jù)三支決策,若α≥b,則對(duì)應(yīng)圖像為相似圖像,將其歸入圖像集P;若α≤a,則對(duì)應(yīng)圖像為不相似圖像,將丟棄,若a<α1.2 特征點(diǎn)約簡(jiǎn)
對(duì)于待檢索圖像I以及圖像集Q中的圖像q,提取其SIFT特征,表征為若干128維向量。計(jì)算圖像q∈Q與圖像I中各特征點(diǎn)的特征差異,即歐氏距離
(1)
其中qk和Ik分別為圖像q和圖像I中各特征向量的第k個(gè)分量(k=1,2,…,128)。
對(duì)于圖像q的Mq個(gè)特征點(diǎn),依次計(jì)算他們與圖像I各特征點(diǎn)的距離,并求出其最小距離與次小距離的比值r1。
為了使用三支決策,需要確定出閾值a1和b1。若某特征點(diǎn)對(duì)應(yīng)的比值r1
對(duì)于圖像q中滿足a1≤r1≤b1的mq個(gè)SIFT特征點(diǎn),取以其為中心,以41×41為大小的鄰域窗口,根據(jù)原始彩色紋身圖像,提取其HSV顏色特征[16]。所得36維特征向量與原SIFT特征,組成164維新特征向量。
利用類似于式(1)的計(jì)算方式,對(duì)于圖像q剩余的mq個(gè)特征點(diǎn),根據(jù)新特征向量,依次計(jì)算他們與圖像I相應(yīng)各特征點(diǎn)的距離,并求出其最小距離與次小距離的比值r2。另外確定閾值a2,若r2 優(yōu)先選擇P中的相似圖像作為檢索結(jié)果,且圖像對(duì)應(yīng)的α值越大,其優(yōu)先級(jí)越高。若要求輸出的圖像在數(shù)量上超出了圖像集P,則繼續(xù)從圖像集Q中選擇相似圖像作為檢索結(jié)果,且圖像對(duì)應(yīng)β+γ值越大,其優(yōu)先級(jí)越高。 通過(guò)實(shí)驗(yàn)確定約簡(jiǎn)步驟中涉及的參數(shù)。 選擇70幅原始紋身圖像,每幅圖像經(jīng)光照、模糊、和添加噪聲等處理,得出8幅相似圖像,另為每幅圖像選擇9幅干擾圖像作為不相似圖像,共同組成圖像庫(kù)。 隨機(jī)選擇一幅原始圖像,計(jì)算其與圖像庫(kù)中其余圖像灰度值的差值d,并針對(duì)不同的μ值,統(tǒng)計(jì)各圖像對(duì)應(yīng)的α值。分別求出所有相似圖像和干擾圖像各自α值的平均值α1和α2,它們分別代表正確或錯(cuò)誤實(shí)現(xiàn)檢索的概率。參數(shù)μ與α1和α2的關(guān)系如圖1所示。 圖1 參數(shù)μ的確定 由圖1可見(jiàn),在μ=5時(shí),既能保證相似圖像被正確檢索的概率較高,又能確保干擾圖像被錯(cuò)誤檢索的概率較低。因此,選擇閾值參數(shù) μ=5。 選定閾值參數(shù)μ=5后,以70幅原始圖像為待檢索圖像,統(tǒng)計(jì)圖像庫(kù)中其他圖像對(duì)應(yīng)的α值,其中,相似圖像α值最小者為0.06,不相似圖像α值最大者為0.94。據(jù)此設(shè)定 a=0.05,b=0.95。 即當(dāng)α≥0.95時(shí),對(duì)應(yīng)圖像為相似圖像;當(dāng)α≤0.05時(shí),對(duì)應(yīng)圖像為干擾圖像;而當(dāng)0.05<α<0.95時(shí),對(duì)應(yīng)圖像與待檢索圖像的相似性待定。 另外,根據(jù)文獻(xiàn)[8],可設(shè)定參數(shù) a1=a2=0.4,b1=0.85。 在為確定參數(shù)值所用的圖像庫(kù)中,再添加2 319幅干擾圖像,構(gòu)成包含3 579幅圖像的紋身圖像庫(kù),以供對(duì)比實(shí)驗(yàn)所用。 對(duì)于70幅原始圖像,分別使用SIFT算法、文獻(xiàn)[13]算法和所給改進(jìn)算法,在自建圖像庫(kù)中進(jìn)行檢索。輸出結(jié)果包含不同數(shù)量圖像時(shí),各自查準(zhǔn)率、查全率和平均精度均值的平均值如表1、表2和表3所示。其中,所用3種算法依次編號(hào)A、B和C。 表1 查準(zhǔn)率對(duì)比結(jié)果 表2 查全率對(duì)比結(jié)果 表3 平均精度均值對(duì)比結(jié)果 由對(duì)比實(shí)驗(yàn)結(jié)果可見(jiàn),改進(jìn)算法的3種性能皆優(yōu)于另外兩種算法。 由于每幅圖像所提取的特征點(diǎn)數(shù)不同,因此檢索時(shí)間也不同。使用3種算法分別對(duì)70幅原始圖像進(jìn)行檢索,計(jì)算每種算法的平均檢索時(shí)間。結(jié)果顯示,SIFT算法用時(shí)66秒,文獻(xiàn)[13]算法用時(shí)97秒,而在不計(jì)調(diào)整圖像大小所用時(shí)間外,所給改進(jìn)用時(shí)僅37秒,明顯快于前兩種方法。 給出一種基于三支決策的分步約簡(jiǎn)紋身圖像檢索方法,在對(duì)圖像庫(kù)先行約簡(jiǎn)后,又約簡(jiǎn)了特征點(diǎn)的選取,在兼顧SIFT算法及其與局部顏色特征相融合算法有效性的同時(shí),提高了圖像檢索的查準(zhǔn)率和查全率。1.3 完成檢索
2 實(shí)驗(yàn)分析
2.1 參數(shù)設(shè)置
2.2 算法評(píng)估
3 結(jié)語(yǔ)