王心一 劉智
【摘要】 針對單色并且無紋理的二值商標(biāo)圖像檢索,本文采用基于勢函數(shù)的高斯描繪子和邊界方向直方圖算法描述形狀,通過采用加權(quán)融合兩種不同算法的形狀特征后,實(shí)現(xiàn)基于形狀商標(biāo)圖像檢索;最后本文選取查全率-查準(zhǔn)率對比圖作為本文檢索的性能評判指標(biāo),實(shí)驗(yàn)數(shù)據(jù)表明,文中采用的算法能夠精確有效實(shí)現(xiàn)商標(biāo)圖像檢索。
【關(guān)鍵詞】 高斯描繪子 商標(biāo)圖像 檢索 邊界直方圖
一、引言
隨著經(jīng)濟(jì)快速的發(fā)展,商標(biāo)注冊需求越來越大,檢索成為一個突出問題,為防止仿冒注冊商標(biāo)事件,建立數(shù)據(jù)庫管理系統(tǒng)十分必要。本文研究方向著重于小尺度范圍內(nèi)觀測到的局部特性,采用高斯描繪子及邊界方向直方圖的算法提取出圖像形狀特征,通過加權(quán)融合的方法把兩種算法提取出的形狀特征作為商標(biāo)圖像底層特征,使用歐式距離公式計算出特征向量間的相似距離進(jìn)行相似度的匹配,從而建立基于兩種形狀特征融合的商標(biāo)圖像檢索方法。
二、商標(biāo)形狀特征提取
2.1 基于高斯描繪子的形狀特征提取
高斯描繪子的特點(diǎn)有:適用的范圍很廣;對于圖像旋轉(zhuǎn)、平移、反射具有不變性;計算難度低,識別的精度很高;可以承受一定噪聲干擾及邊緣的變動等[2]。假設(shè)曲線 為檢測物 的輪廓曲線。曲線 可以表示為:
■ (1)
曲線C的質(zhì)心坐標(biāo)為
■ (2)
方差σ2表示曲線上所有點(diǎn)的分散度
■
(3)
參數(shù)r表示曲線L上面所有點(diǎn)與質(zhì)心間距離:
■ (4)
對于任意的λ∈(0,∞),落在圓心為(x,y)半徑為rλ的圓內(nèi)部分的物體輪廓曲線如下式所示:
■■ (5)
對于任意的θ∈[0,2π], λ∈(0,∞),設(shè)P=(x+ λrcosθ,y+λrsinθ)定義如下函數(shù):
■
(6)
(xk,yk)∈L(λ),Δsk表示曲線相鄰像素之間的距離。f(θ,λ)表示高斯勢函數(shù)[4]。
θ∈[0,2π]分成N等分,高斯描繪子pe(λ)可表示為:
■ (7)
2.2 基于邊界方向直方圖的形狀特征提取
對邊界圖像中各點(diǎn)計算出切線的方向,得到物體的邊界輪廓上每個點(diǎn)的邊界方向角,建立起直方圖,統(tǒng)計出邊界直方圖每級個數(shù)最終表征物體的形狀。
對邊界切線方向進(jìn)行劃分,以5度為范圍劃分形成一個72級方向直方圖H[i]。i表示劃分后的每級數(shù),范圍是0~71;相對應(yīng)H[i]的值代表在這一級數(shù)下點(diǎn)的個數(shù)。為保證尺度不變性,將邊界直方圖歸一化:
H[i]=H[i]/S (8)
其中H[i]為邊界方向直方圖,S為圖像的面積。
為避免圖像旋轉(zhuǎn)影響到邊界直方圖,對直方圖進(jìn)行平滑處理,使其具有一定旋轉(zhuǎn)特性。
■ (9)
Dr是A[i,j]與B[i,j]的距離
■ (10)
三、圖像特征的融合
商標(biāo)圖像的相似性度量表示的是圖像特征之間的相似性,一般使用特征向量間的距離函數(shù)來度量[5]。對提取到的特征向量進(jìn)行歸一化計算,特征內(nèi)部的歸一化:
V的均值和方差分別為mV和σV, V為歸一化處理結(jié)果:
V=■ (11)
計算示例圖像與圖像庫中圖像的相似度步驟如下:
(1)將輸入商標(biāo)圖像庫的圖像進(jìn)行預(yù)先處理,距離dGauss,dHistogram。
d(x,y)=■X■-Y■■■ (12)
Euclidean距離表示兩個點(diǎn)之間真實(shí)的距離,與參考系旋轉(zhuǎn)不變量相關(guān),是一個常用的度量距離的方法。
(2)計算(1)中距離相對應(yīng)的均值μGauss,μHistogram及標(biāo)準(zhǔn)差σGauss,σHistogram。
(3)按照上文高斯描繪子及邊界直方圖算法提取被檢商標(biāo)的特征向量,將每一組特征向量利用(13)式進(jìn)行歸一化處理。
(4)將(3)中計算得出的歸一化特征向量與數(shù)據(jù)庫中相應(yīng)商標(biāo)的特征向量分別計算出歐式距離dGauss(x,y),dHistogram(x,y)。
(5)將(4)中每組特征向量的相似距離進(jìn)行距離歸一化,公式如下
d'=■1+■ (13)
(6)將歸一化后的距離進(jìn)行加權(quán)融合,得到商標(biāo)間最終相似度的距離
d=w1d'Gauss+w2d'Histogram (14)
其中w1+w2=1,d'Gauss,d'Histogram分別為采用二種特征提取得到的相似距離進(jìn)行歸一化后的結(jié)果。
根據(jù)多次實(shí)驗(yàn)情況下比較設(shè)定兩個權(quán)值分別為w1= 0.65,w2=0.35。實(shí)驗(yàn)證明,在該權(quán)值下可得到較精確的結(jié)果。
四、實(shí)驗(yàn)結(jié)果
在二值商標(biāo)圖像庫中進(jìn)行實(shí)驗(yàn),采用查全率-查準(zhǔn)率為性能評判指標(biāo)。查全率Pk指的是檢索的結(jié)果中達(dá)標(biāo)圖像數(shù)目和圖像數(shù)據(jù)庫中全部符合要求的圖像數(shù)目之比。查準(zhǔn)率Rk表示檢索的結(jié)果里達(dá)標(biāo)圖像數(shù)目和檢索返回圖像總數(shù)的比值。公式如下:
Pk=Nk/M (15)
Rk=Nk/Tk (16)
Nk表示達(dá)標(biāo)圖像數(shù)目, Tk表示檢索返回圖像總數(shù),M 表示符合要求圖像總數(shù)。
實(shí)驗(yàn)1比較了本文算法與單獨(dú)采用不變距、傅里葉描繪子算法的檢索性能,其結(jié)果如圖1所示。
由仿真結(jié)果可見,本文的特征提取方法能夠在圖像庫高效檢索到與待檢測圖像相似圖像。相同的檢索查全率下,多特征融合算法比單一特征提取算法精度要高。由此可得研究更為精確的形狀描述特征,采用多種特征融合的方式就能夠提高檢索的精度,或者加入紋理、顏色、關(guān)鍵字詞分類檢索等特征也可以達(dá)到提高精確度的目的。
五、結(jié)論
本文研究內(nèi)容為基于形狀的二值商標(biāo)圖像的檢索,采用的圖像特征檢索方法使用了高斯描繪子及邊界直方圖算法,分別提取出商標(biāo)的形狀特征,再把兩種特征進(jìn)行加權(quán)融合,從而得到商標(biāo)圖像最終的檢索特征。實(shí)驗(yàn)的結(jié)果表明該方法能夠達(dá)到較高的查全率-查準(zhǔn)率。