宋志平,朱亞俐,吾爾尼沙·買(mǎi)買(mǎi)提,庫(kù)爾班·吾布力,2*
(1. 新疆大學(xué)信息科學(xué)與工程學(xué)院,新疆 烏魯木齊 830046;2. 新疆多語(yǔ)種信息技術(shù)重點(diǎn)實(shí)驗(yàn)室,新疆 烏魯木齊 830046)
伴隨科學(xué)技術(shù)的普及與發(fā)展,數(shù)字圖像已成為一種應(yīng)用廣泛的媒介,是一種獨(dú)立性較強(qiáng)的數(shù)據(jù)載體。怎樣有效組織、管理及檢索大規(guī)模的圖像信息,同時(shí)從海量數(shù)字圖像內(nèi)準(zhǔn)確無(wú)誤地檢索出相似圖像,逐漸成為現(xiàn)階段亟待解決的重要問(wèn)題[1]。語(yǔ)義與文本條件下的圖像檢索為常用的檢索模式,但針對(duì)復(fù)雜圖像而言,此類(lèi)檢索模式可靠性較低。由此衍生出圖像二次檢索方式[2],讓相似圖像檢索變得更為輕松且檢索精度也得到大幅提高。
面向圖像檢索問(wèn)題,彭騰飛等[3]提出一種端到端的深度哈希算法。在卷積神經(jīng)網(wǎng)絡(luò)中嵌入空間金字塔池化和冪均值變換明確圖像多種尺度范圍數(shù)據(jù),在全連接層之間引入哈希層,使用漢明距離計(jì)算圖像對(duì)相似性,建立損失函數(shù)來(lái)提升圖像檢索性能。但此方法計(jì)算過(guò)程中沒(méi)有采取圖像預(yù)處理,導(dǎo)致圖像相似性結(jié)果與實(shí)際結(jié)果出入較大。陳宏宇等[4]擇取深度卷積網(wǎng)絡(luò)全卷積層張量當(dāng)作深度特征,使用逆文檔頻率加權(quán)深度特征獲得顯著圖像,采用主成分分析獲取圖像全局特征,實(shí)現(xiàn)圖像距離度量檢索。該方法需要計(jì)算的變量較多,運(yùn)算耗時(shí)較長(zhǎng),沒(méi)有充分考慮真實(shí)場(chǎng)景下算法性能的合理性。
總結(jié)以上內(nèi)容,提出一種基于灰度直方圖的圖像關(guān)鍵特征二次檢索算法。首先預(yù)處理圖像,利用灰度直方圖計(jì)算圖像紋理相似度,完成圖像關(guān)鍵特征一次檢索,將相似度值作為二次檢索臨界值,并使用Canny算子得到準(zhǔn)確的相似圖像檢索結(jié)果。
根據(jù)圖像性質(zhì),融合灰度直方圖紋理特征檢索與形態(tài)匹配檢索兩種策略,設(shè)計(jì)基于灰度直方圖的圖像關(guān)鍵特征二次檢索算法。所提方法二次檢索步驟中,將圖像紋理關(guān)鍵特征當(dāng)作第一次檢索,推算圖像灰度直方圖來(lái)獲取并統(tǒng)計(jì)紋理特征,計(jì)算圖像相似度,完成圖像關(guān)鍵特征初期篩查,把第一次檢索結(jié)果輸入至第二次檢索中,利用投影相似度剔除第一次檢索中的干擾[5],在第一次檢索前提下,最大限度增強(qiáng)圖像關(guān)鍵特征二次檢索正確率。將算法具體步驟如圖1。
圖1 圖像關(guān)鍵特征二次檢索步驟
為消除圖像背景及系統(tǒng)噪聲干擾,提高后續(xù)圖像關(guān)鍵特征檢索準(zhǔn)確率,預(yù)先對(duì)圖像預(yù)處理。傳統(tǒng)高通濾波方法可以很好地控制面積較大的低頻背景信息,加強(qiáng)目標(biāo)邊緣特征清晰度,但不能過(guò)濾掉獨(dú)立的高頻噪聲點(diǎn),還會(huì)減少目標(biāo)中心點(diǎn)灰度值。中值濾波與高通濾波存在較大差異,高通濾波方法可以剔除高頻噪聲,保存完整的目標(biāo)特征,但對(duì)低頻背景信息的處理欠佳。在互補(bǔ)原則前提下,設(shè)計(jì)一種高通中值濾波方法。首先利用低通濾波模式對(duì)輸入圖像采取背景預(yù)測(cè),然后利用中值濾波,將某像素點(diǎn)灰度值替換成相鄰像素點(diǎn)灰度中值[6],圖像預(yù)處理過(guò)程如圖2所示,并將輸出圖像表示成式(1)。
Y(i,j)=X(i,j)+Med(i,j)-2Lp(i,j)
(1)
其中,Y(i,j)代表輸出圖像,X(i,j)為輸入圖像,Med(i,j)是中值濾波圖像,Lp(i,j)表示低通濾波預(yù)測(cè)背景圖像。
圖2 高通中值濾波算法流程
中值濾波與低通濾波圖像的推導(dǎo)過(guò)程分別為
Med(i,j)=mmedianS{X(i,j)}
(2)
(3)
其中,S表示濾波窗口,R是濾波半徑。
完成預(yù)處理后,為進(jìn)一步提高圖像關(guān)鍵特征二次檢索準(zhǔn)確率,就要獲取圖像關(guān)鍵特征灰度值分布狀態(tài),明確圖像特征紋理信息?;叶戎狈綀D表示灰度級(jí)函數(shù),是圖像位于此灰度級(jí)的像素?cái)?shù)目。直方圖曲線內(nèi)的橫軸表示圖像像素灰度級(jí),縱軸是產(chǎn)生灰度級(jí)的幾率。
圖像關(guān)鍵紋理特征中包含結(jié)構(gòu)紋理與統(tǒng)計(jì)紋理,由于結(jié)構(gòu)紋理對(duì)物體幾何框架的需求較為嚴(yán)格,約束了其大量應(yīng)用,當(dāng)前使用統(tǒng)計(jì)紋理方式較多,其中灰度共生矩陣就是使用次數(shù)最多的統(tǒng)計(jì)紋理計(jì)算方法。
灰度共生矩陣方法是根據(jù)圖像灰度值空間分布來(lái)描述其紋理狀態(tài),在評(píng)估圖像二階組合條件概率密度函數(shù)前提下得到的統(tǒng)計(jì)策略。此方法可描述具有某類(lèi)關(guān)聯(lián)的兩個(gè)像素之間的頻率關(guān)系。將歸一化灰度共生矩陣記作
(4)
其中,d表示步長(zhǎng),i、j均為灰度值,θ表示方向。
運(yùn)用灰度共生矩陣能獲得能量、熵、慣性矩與局部穩(wěn)定性四個(gè)量化的紋理元素[7],能量、熵、慣性矩與局部穩(wěn)定性依次記作
(5)
(6)
(7)
(8)
灰度變換表示按照某類(lèi)條件憑借相應(yīng)變換關(guān)聯(lián)逐點(diǎn)變換初始圖像各像素灰度值的方式。例如為凸顯圖像細(xì)節(jié)部分,把圖像灰度級(jí)全部區(qū)域或其中某段(a,b)拓展為(a*,b*)。若輸入圖像灰度級(jí)為z,通過(guò)灰度變換后輸出圖像相對(duì)的灰度級(jí)為z*,需要將z與z*均安置于圖像灰度范圍中,將處在灰度區(qū)間[a,b]中的像素點(diǎn)映射至[z1,zk]區(qū)間,則組建灰度變換函數(shù)表達(dá)式
(9)
在式(9)的灰度變換函數(shù)中,其曲線形態(tài)映射關(guān)聯(lián)就是把[a,b]區(qū)間拓展至[z1,zk]。假設(shè)圖像絕大部分像素灰度值分布于[a,b],較多部分灰度值范圍超過(guò)此區(qū)間。
利用圖像灰度變換計(jì)算,圖像關(guān)鍵特征的灰度形態(tài)更為明顯,為接下來(lái)使用灰度直方圖完成深入的特征提取工作,解決了圖像灰度特征不明顯這一重要問(wèn)題[8]。圖像完成灰度變換之后,統(tǒng)計(jì)圖像灰度值,按照統(tǒng)計(jì)結(jié)果獲得圖像直方圖,然后計(jì)算灰度特征矢量,并將輸入圖像采取向量化手段。
將灰度直方圖運(yùn)算過(guò)程記作
(10)
式中,C為灰度級(jí)類(lèi)別個(gè)數(shù),n代表圖像擁有灰度級(jí)i像素的數(shù)量,D為圖像全部像素?cái)?shù)量。
設(shè)置目標(biāo)圖像灰度直方圖中包含N維向量,按照樣本圖特征向量和數(shù)據(jù)庫(kù)圖像特征向量,在規(guī)定的相似度內(nèi)提取全部圖像關(guān)鍵特征。
將圖像灰度區(qū)間拉伸至全局灰度區(qū)間,完成灰度拉伸圖像的灰度增強(qiáng)[9]。將全部灰度空間劃分成30個(gè)灰度,灰度圖像像素點(diǎn)為E,E∈(0,255),劃分后的圖像灰度值為V,V∈(0,32)。由此,把灰度值劃分過(guò)程定義為
V=[E/8]
(11)
利用式(11)推導(dǎo)過(guò)程,整合出每個(gè)灰度出現(xiàn)的頻率。將其具體計(jì)算過(guò)程記作
(12)
其中,count(vk)表示劃分后灰度值vk的像素點(diǎn)個(gè)數(shù),N1為圖像全局長(zhǎng)度中的像素點(diǎn)個(gè)數(shù),N2為圖像全局寬度中的像素點(diǎn)個(gè)數(shù)。
在本文算法中,灰度直方圖是圖像關(guān)鍵特征提取中最簡(jiǎn)便的方法,計(jì)算過(guò)程簡(jiǎn)單,推導(dǎo)速率很快,符合圖像檢索過(guò)程中的旋轉(zhuǎn)、比例及位移不變性,特征提取精度較高。直方圖函數(shù)為
H(k)=Mk
(13)
式中,Mk為第k個(gè)灰度級(jí)出現(xiàn)的數(shù)量。
把圖像內(nèi)的像素灰度級(jí)作為任意變量,其分布狀況表現(xiàn)出圖像全局統(tǒng)計(jì)特征,圖像關(guān)鍵紋理特征呈現(xiàn)出圖像灰度局部性特點(diǎn),圖像窗口不能過(guò)大[10]。計(jì)算式(5)~式(8)的紋理特征量,得到紋理相似度公式:
(14)
紋理相似度越趨近于1,表明待檢測(cè)圖像和輸入圖像相似度越大,這樣就實(shí)現(xiàn)了基于灰度直方圖的圖像關(guān)鍵紋理特征的第一次檢索。
目標(biāo)外輪廓是其本身最關(guān)鍵的形態(tài)特征,也是推算目標(biāo)周長(zhǎng)與面積等變量的基礎(chǔ)。針對(duì)自然界的物體形態(tài)特征而言,人眼可以輕易地捕獲與識(shí)別,但使用計(jì)算機(jī)要完成此項(xiàng)任務(wù)則難度很高。現(xiàn)階段,獲取研究目標(biāo)形態(tài)特征的手段包括基于區(qū)域與基于邊界兩種方法?;趨^(qū)域方法利用圖像分割、挖空內(nèi)部點(diǎn)等策略得到物體外部輪廓,但此種方式過(guò)多依賴(lài)圖像分割結(jié)果,圖像分割是圖像處理中最難處理的問(wèn)題之一,因此該方法實(shí)用性較差?;谶吔绶椒幢隳苁褂眠吘壧崛∷阕拥玫轿矬w外部輪廓,但提取結(jié)果沒(méi)有持續(xù)性[11],且一般會(huì)具有物體內(nèi)部細(xì)節(jié)邊緣與背景噪聲干擾,物體輪廓分析中的噪聲數(shù)量較多,增添了圖像關(guān)鍵特征二次檢索工作量。
本文按照待檢測(cè)圖像內(nèi)的目標(biāo)物體處于圖像中間且物體周邊通常為低灰度背景的特征,設(shè)計(jì)一種基于Canny算子的圖像關(guān)鍵特征二次檢索算法。
算法的核心步驟為:
第一,利用Canny算子計(jì)算圖像邊緣信息,統(tǒng)計(jì)各段邊緣長(zhǎng)短,設(shè)置臨界值剔除微小邊緣數(shù)據(jù);
第二,針對(duì)各行圖像信息,依次實(shí)施掃描,把掃描獲得的灰度值邊緣橫坐標(biāo)描述為x1[i]、x2[i],lHeight-1表示圖像高度。把圖像處于垂直軸內(nèi)的投影Vproject[i]為
i=0,1,2,…,lHeight-1
(15)
第三,關(guān)于各列圖像信息,使用和上個(gè)步驟相似手段,按照掃描結(jié)果獲得邊緣點(diǎn)縱坐標(biāo)y1[i]、y2[i],lWidth-1表示圖像寬度,推算圖像處于水平軸內(nèi)的投影Hproject[i]
i=0,1,2,…,lWidth-1
(16)
對(duì)圖像數(shù)據(jù)庫(kù)內(nèi)每一幅圖像均使用式(15)與式(16)計(jì)算兩個(gè)投影值,同時(shí)保存在圖像特征庫(kù)內(nèi)。對(duì)輸入圖像使用相同模式推導(dǎo)[12],將圖像關(guān)鍵特征形態(tài)相似度表示成
(17)
(18)
SimShape(Q,G)=wv×SimShapeV(Q,G)+wh×SimShapeH(Q,G)
(19)
式中,SimShapeV(Q,G)與SimShapeH(Q,G)依次表示垂直、水平投影的相關(guān)指數(shù),VprojectQ、HprojectQ是輸入圖像與待檢測(cè)圖像外部輪廓垂直與水平投影,SimShape(Q,G)代表兩個(gè)位置上合成的形態(tài)相似度,wv、wh是垂直軸與水平軸的投影權(quán)重。
形態(tài)相似度SimShape越趨近1,證明輸入圖像與待檢測(cè)圖像的形態(tài)越相近。將基于灰度直方圖的圖像紋理特征檢索結(jié)果設(shè)置成形態(tài)相似度臨界值,通常臨界值的取值范圍是0.6~0.8。以此實(shí)現(xiàn)圖像關(guān)鍵特征的二次檢索目標(biāo),完成快速、準(zhǔn)確的圖像關(guān)鍵特征提取與篩選,讓用戶(hù)獲得更加精準(zhǔn)的相似圖像識(shí)別結(jié)果。
從Corel圖像數(shù)據(jù)庫(kù)內(nèi)挑選5種不同類(lèi)型的550幅圖像,每類(lèi)圖像的個(gè)數(shù)是110幅,包含風(fēng)景、事物、動(dòng)物等,對(duì)本文方法及文獻(xiàn)[3]方法、[4]方法進(jìn)行仿真。在圖像檢索性能評(píng)估中,評(píng)估指標(biāo)包含查準(zhǔn)率、查全率、輸出格式等,本文實(shí)驗(yàn)著重前兩個(gè)參數(shù)。查準(zhǔn)率表示檢索時(shí),檢索系統(tǒng)得到相似圖像和檢索圖像總數(shù)量的比值,記作
(20)
查全率表示檢索時(shí),檢索的相似圖像和數(shù)據(jù)庫(kù)內(nèi)全部相似圖像個(gè)數(shù)的比值,記作:
(21)
圖3為三種方法海景類(lèi)圖像二次檢索結(jié)果,比較返回的前5幅圖像檢索結(jié)果,每幅圖左上角圖像為示例圖。
圖3 三種方法對(duì)海景圖像的檢索結(jié)果對(duì)比
從圖3可知,文獻(xiàn)[3]中有4幅圖為海景圖像,一幅巖石圖像,查準(zhǔn)率為80%;文獻(xiàn)[4]中有三幅海景圖像,另外兩幅圖像分別是街道與花卉,查準(zhǔn)率為60%;本文方法5幅圖像均為海景圖像,查準(zhǔn)率為100%。實(shí)驗(yàn)結(jié)果證實(shí),本文方法查準(zhǔn)率顯著優(yōu)于兩種文獻(xiàn)方法,這是因?yàn)樗岱椒ㄊ褂没叶戎狈綀D得到圖像關(guān)鍵特征灰度值分布狀態(tài),掌握?qǐng)D像特征紋理數(shù)據(jù),在第一次檢索中最大限度提升待檢測(cè)圖像和輸入圖像相似度,為圖像二次檢索提供有效幫助。
在數(shù)據(jù)庫(kù)內(nèi)檢索更多不同類(lèi)型圖像,將圖像類(lèi)型增加到7種,對(duì)三種方法進(jìn)行大量的圖像二次檢索實(shí)驗(yàn),統(tǒng)計(jì)其檢索平均查全率,結(jié)果如圖4所示。
圖4 圖像二次檢索平均查全率對(duì)比
可以看到,在不同類(lèi)型的圖像關(guān)鍵特征二次檢索中,本文方法查全率均不同程度地高于文獻(xiàn)[3]與文獻(xiàn)[4],表明檢索查準(zhǔn)率和查全率為正比例關(guān)聯(lián),即查準(zhǔn)率越大,查全率也越大。由此也證明本文方法擁有優(yōu)秀的圖像關(guān)鍵特征二次檢索性能,為準(zhǔn)確查找相似圖像發(fā)揮應(yīng)有作用。
針對(duì)海量大數(shù)據(jù)中的相似圖像檢索問(wèn)題,提出基于灰度直方圖的圖像關(guān)鍵特征二次檢索算法。所提算法應(yīng)用過(guò)程簡(jiǎn)潔,與傳統(tǒng)方法相比,可以最大限度提升相似圖像檢索精準(zhǔn)度。伴隨圖像特征二次檢索研究的不斷深入,接下來(lái)的研究目標(biāo)將轉(zhuǎn)向二次檢索系統(tǒng)的構(gòu)建,為圖像檢索領(lǐng)域拓寬新的研究方向。