余松森,陳曉升,蘇 海+,鐘 莉,張智輝
(1.華南師范大學(xué) 軟件學(xué)院,廣東 佛山 528000;2.華南師范大學(xué) 計(jì)算機(jī)學(xué)院,廣東 廣州 510000)
商標(biāo)Logo是區(qū)分商品和服務(wù)來源的一種標(biāo)記。目前存在的有效商標(biāo)注冊(cè)量超過2274萬。平均每5.2個(gè)市場(chǎng)主體就擁有一件有效商標(biāo)。商標(biāo)的注冊(cè)需要規(guī)避已注冊(cè)的相同相似商標(biāo);商標(biāo)量的增加導(dǎo)致商標(biāo)審查員目不暇接,容易錯(cuò)判誤判。商標(biāo)申請(qǐng)人在進(jìn)行商標(biāo)注冊(cè)前會(huì)通過專業(yè)的商標(biāo)代理機(jī)構(gòu)進(jìn)行商標(biāo)檢索,國(guó)家商標(biāo)局同意商標(biāo)注冊(cè)之前會(huì)排查該商標(biāo)是否與已注冊(cè)商標(biāo)存在過高的相似度,若相似則無法注冊(cè)[1]。
商標(biāo)圖像與普通圖像存在較大的差異,其中最常用的商標(biāo)由文字和圖案組成,換句話說,該類型的商標(biāo)在市場(chǎng)上的申請(qǐng)量是最普遍的,也是商標(biāo)代理企業(yè)處理最多的一種類型的商標(biāo)圖像。在商標(biāo)圖像數(shù)據(jù)庫(kù)中檢索到一組相似度最高的商標(biāo)圖像,該過程雖然可以用傳統(tǒng)意義的圖像檢索算法來實(shí)現(xiàn),但是檢索的效果卻不盡人意,究其原因是商標(biāo)圖像存在以下特點(diǎn):①圖案單一,像素點(diǎn)之間沒有太大的聯(lián)系;②包含相同文字的商標(biāo)圖像,其字體形狀在不同商標(biāo)圖像中呈現(xiàn)較大差異,但屬于相似商標(biāo);③不同商標(biāo)圖像中包含的不同文字可能為同音字,但屬于相似商標(biāo)。
綜上所述,商標(biāo)圖像檢索與傳統(tǒng)圖像檢索的最大差異在于,與查詢目標(biāo)圖像相似的一組商標(biāo)圖像在視覺上并不一定特別相似。因此,本文主要研究基于內(nèi)容的圖像檢索技術(shù)(CBIR)[2]在提高商標(biāo)檢索系統(tǒng)效率中的應(yīng)用,提出一種特征融合的商標(biāo)檢索方法。CBIR的關(guān)鍵技術(shù)在于特征提取和特征匹配,提取圖像的關(guān)鍵信息作為特征描述符,并以此作為檢索的匹配依據(jù)。
早期的商標(biāo)檢索系統(tǒng),大多方法利用基于形狀特征的方法來實(shí)現(xiàn),因?yàn)楫?dāng)時(shí)的商標(biāo)圖像通常是二進(jìn)制圖像,由簡(jiǎn)單的圖形單元組成,采用形狀描述符就能很好地表示商標(biāo)圖像。Wu等[3]提出了一種基于形狀區(qū)域特征和邊界特征融合的商標(biāo)圖像檢索方法。Rusinol等[4]通過計(jì)算圖像的顏色直方圖結(jié)合形狀特征作為檢索的綜合特征。雷蕾等[5]提出使用Zernike矩作為全局特征,并使用邊緣梯度共現(xiàn)矩陣作為局部特征,將特征進(jìn)行融合檢索從而提高檢索精度與魯棒性。胡明娣等[6]提出了一種新的顏色特征量化算法與HU不變矩的形狀特征進(jìn)行融合進(jìn)一步提高檢索效率。Yan Y等[7]提出了顏色和空間描述符的自適應(yīng)融合,用于彩色商標(biāo)圖像檢索。將顏色量化和k均值相結(jié)合以進(jìn)行有效的主色提取,通過分析圖像直方圖,實(shí)現(xiàn)這兩個(gè)功能的自適應(yīng)融合,從而實(shí)現(xiàn)更有效準(zhǔn)確的商標(biāo)圖像檢索。Qing等[8]提取圖像的LBP特征來作為圖像檢索的描述符。還有一些其它流行的基于SIFT的方法,比如將SIFT與MSER相結(jié)合進(jìn)行圖像匹配和PCA-sift等。Chen[9]提出了一種基于SIFT的商標(biāo)圖像搜索算法。通過計(jì)算鄰近區(qū)域的梯度直方圖來檢測(cè)和描述特征點(diǎn)。再通過歐幾里得距離得到從兩個(gè)對(duì)應(yīng)圖像中提取的SIFT特征之間的相似性。汪慧蘭等[10]提出一種將小波變換與SIFT特征相結(jié)合的方法,用小波變換提取到的圖像輪廓與SIFT特征進(jìn)行融合。商標(biāo)圖像規(guī)模的增多使得哈希技術(shù)也應(yīng)用到商標(biāo)圖像檢索技術(shù)中,哈希檢索可以將圖片的高維內(nèi)容特征轉(zhuǎn)為低維的哈希序列,降低了圖像檢索對(duì)計(jì)算機(jī)內(nèi)存的要求,加快了檢索速度。Yannis等[11]將CNN最后一個(gè)卷積層提取出的特征進(jìn)行加權(quán),改變特征平面權(quán)重的同時(shí)也對(duì)每個(gè)通道進(jìn)行加權(quán),取得了不錯(cuò)的效果。Noh H等[12]提出了一種大規(guī)模商標(biāo)圖像檢索技術(shù),利用采用全卷積神經(jīng)網(wǎng)絡(luò)模型ResNet50提取局部密集特征,提取的特征具有語義局部特征,還引入了一個(gè)對(duì)關(guān)鍵點(diǎn)進(jìn)行選取的注意力機(jī)制,使特征匹配更加精確。Perez等[13]提出使用兩個(gè)經(jīng)過預(yù)訓(xùn)練的VGG卷積神經(jīng)網(wǎng)絡(luò)在商標(biāo)圖像的數(shù)據(jù)庫(kù)中分別對(duì)商標(biāo)圖像的視覺相似性和概念相似性進(jìn)行了微調(diào)訓(xùn)練,結(jié)果表明這兩種方法融合在METU數(shù)據(jù)庫(kù)上取得了不錯(cuò)的效果。以上的方法能提取到商標(biāo)圖像很好的視覺特征,而絕大部分常用的商標(biāo)包含文字,由于字體千變?nèi)f化,相同文字在視覺感知上卻不盡相同。然而,這部分文字信息對(duì)檢索算法確是非常關(guān)鍵的,對(duì)于商標(biāo)而言,包含相同或形近字就是近似商標(biāo)的充分非必要條件。但也由于這部分關(guān)鍵信息在視覺感知上差異較大,導(dǎo)致該文字信息不僅沒有提取到,反而使得特征的差異更大了。
基于以上的研究,本文提出一種融合卷積特征和文字特征的方法來作為商標(biāo)圖像的描述,主要有以下兩點(diǎn)貢獻(xiàn):①針對(duì)文字特征匹配改進(jìn)編輯距離算法,提高形近字的匹配度。②提出一種基于結(jié)果融合的重排序方法,將卷積特征檢索結(jié)果與文字特征匹配結(jié)果進(jìn)行融合重排序,得到最終的結(jié)果。
本節(jié)介紹詳細(xì)的商標(biāo)檢索方法,如圖1所示,本文檢索的方法在基于深度學(xué)習(xí)的基礎(chǔ)上融合文字檢索的結(jié)果,特征提取過程需要對(duì)商標(biāo)圖像進(jìn)行文字識(shí)別和卷積特征提取,檢索過程分為基于深度學(xué)習(xí)商標(biāo)檢索和基于文字商標(biāo)檢索。最后將兩者檢索的結(jié)果進(jìn)行融合重排序得到最終的檢索結(jié)果。
本節(jié)介紹卷積神經(jīng)網(wǎng)絡(luò)的檢索方法,本文收集200組不同的商標(biāo),每組共20張相似商標(biāo)(如圖2所示)。利用商標(biāo)庫(kù)的200類商標(biāo)對(duì)深度網(wǎng)絡(luò)模型NetVLAD進(jìn)行分類訓(xùn)練。將訓(xùn)練好的模型保存之后,用來提取商標(biāo)數(shù)據(jù)庫(kù)圖像的卷積特征,經(jīng)過加權(quán)和局部聚合成一維向量之后,以此作為檢索的索引向量。
2.1.1 特征處理
本節(jié)介紹詳細(xì)的特征處理方法,本文利用商標(biāo)數(shù)據(jù)集訓(xùn)練NetVLAD進(jìn)行特征提取。對(duì)于輸入的圖像首先做一個(gè)預(yù)處理,使得圖像輸入卷積神經(jīng)網(wǎng)絡(luò)的尺寸為224*224*3,X∈RN×W×H為卷積層提取到的三維矩陣,其中N為通道(Channel)數(shù),W和H分別為每一層特征平面(Feature Map)的長(zhǎng)和寬。即利用提取到的卷積層特征進(jìn)一步對(duì)每一個(gè)特征平面的元素進(jìn)行一個(gè)權(quán)重的賦予,并且每個(gè)通道也賦予不同的權(quán)重。按照這樣的方式。假設(shè)xkij∈X,s為三維的權(quán)重矩陣,x′kij表示加權(quán)后的特征,那么
(1)
圖1 本文方法框架
圖2 商標(biāo)分類數(shù)據(jù)集
bk表示每個(gè)通道的權(quán)重大小,aij表示特征平面上每個(gè)元素賦予的權(quán)重,因此skij=bkaij。 由于圖像感興趣區(qū)域經(jīng)過卷積濾波之后會(huì)有較強(qiáng)的響應(yīng),本文利用卷積特征平面的特征值作為加權(quán)的依據(jù)
(2)
(3)
其中,對(duì)平面 (i,j) 點(diǎn)處的權(quán)重參數(shù)為該點(diǎn)的通道權(quán)重與平面權(quán)重的乘積。
2.1.2 特征聚合
局部聚合的思想來源于局部特征擁有更好的匹配效果,全局的CNN特征缺少幾何不變性,限制了對(duì)可變場(chǎng)景的分類和匹配,因?yàn)槿值腃NN特征包含了太多的空間信息。以往對(duì)局部特征的描述也有很多方法,比如SIFT(尺度不變特征變換)描述子,它的思想是在圖像感興趣區(qū)域提取到穩(wěn)定的特征點(diǎn),比如邊緣或目標(biāo)物體的區(qū)域,該特征點(diǎn)不隨圖像的縮放或者旋轉(zhuǎn)等操作而改變。對(duì)于商標(biāo)圖像而言,感興趣區(qū)域比較集中。通過對(duì)CNN特征加權(quán),實(shí)際上也是為了突出感興趣區(qū)域。這樣在進(jìn)行局部特征聚合的時(shí)候,可以使得商標(biāo)有Logo的區(qū)域得到更大的權(quán)重。
通過對(duì)卷積層加權(quán)后輸出的特征為X′∈RN×W×H, 我們將該三維的向量視為共 (W×H) 個(gè)長(zhǎng)度為D一維的向量。聚合的思想與Bag of Features[14]和文獻(xiàn)[15]類似,也是將已提取到的描述子進(jìn)行聚類最終得到一維的向量特征。本文采用NetVLAD池化方法,將長(zhǎng)度為D的一維向量看作一個(gè)個(gè)的描述子,NetVLAD可以理解成一種Pooling的方式,即將多個(gè)維度不同的特征聚合,生成一個(gè)能夠描述這些特征集的向量。
2.1.3 特征匹配
利用余弦距離來度量向量之間的相似度,通過計(jì)算兩個(gè)相同長(zhǎng)度的向量之間的夾角余弦值來衡量它們之間的相似度。向量夾角余弦值的范圍在[-1,1]之間,向量之間夾角越小則余弦值越大,代表兩個(gè)向量越相似,反之亦然。余弦距離對(duì)向量的絕對(duì)值數(shù)值大小不敏感,因?yàn)樗从车氖莾蓚€(gè)向量在方向上的相似度。上一步將圖像聚合成一維向量特征后,本節(jié)將采用L2歸一化和PCA-Whitening對(duì)特征進(jìn)一步處理,由于本文采用的是余弦距離,所以向量絕對(duì)值的大小不影響最后的距離計(jì)算。計(jì)算特征向量X與Y的余弦距離公式如下
(4)
本文采用CRNN算法進(jìn)行商標(biāo)文字識(shí)別,CRNN網(wǎng)絡(luò)是端到端可訓(xùn)練的網(wǎng)絡(luò)模型,只需要圖像和文字標(biāo)注即可進(jìn)行訓(xùn)練。百度中文識(shí)別大賽的數(shù)據(jù)集都采集自中國(guó)街景,并由街景圖片中的文字行區(qū)域(例如店鋪商標(biāo)、地標(biāo)等)截取出來而形成,所有圖像的文字區(qū)域利用仿射變換,等比映射為一張大小為100*32像素的圖片。該數(shù)據(jù)集部分圖像如圖3和圖4所示。
圖3 七星豹電動(dòng)車
圖4 魅派集成吊頂
通過CRNN文字識(shí)別將商標(biāo)庫(kù)中的文字商標(biāo)圖像的識(shí)別結(jié)果作為數(shù)據(jù)庫(kù)中商標(biāo)圖像的文字特征關(guān)鍵字。
2.2.1 文字匹配
基于文字特征關(guān)鍵字來進(jìn)行檢索相當(dāng)于給定一個(gè)字符串集合和待查詢字符串,從字符串集合中找出相似的字符串,通過該方法找到對(duì)應(yīng)的相似商標(biāo)圖像。返回相似結(jié)果采用基于top-k的字符串匹配,給定數(shù)據(jù)庫(kù)中商標(biāo)文字的字符串集合P,從圖片識(shí)別的文字結(jié)果作為待查詢的字符串q,從字符串集合中P中查找與待查詢字符串q比較相似的前k個(gè)字符串。比如從字符串集合P={“阿里巴巴”, “阿里”, “阿里爸爸”, “啊里巴”}, 對(duì)于待匹配字符串q=“阿里巴巴”,使用top-1查詢得到的結(jié)果為 {“阿里巴巴”}。 字符串近似匹配一般有海明距離,J-W距離、編輯距離[16,17]等。商標(biāo)圖像中文字的音、形相似也可以判斷為相似圖像的特點(diǎn),本文提出一種基于融合音形的編輯距離算法,利用漢子的拼音編碼和筆形編碼,通過比較漢字的編碼得到單個(gè)漢字的相似度,結(jié)合單個(gè)漢字的相似度的和以及編輯距離的值得出兩個(gè)字符串的相似度。
編輯距離算法是根據(jù)計(jì)算一個(gè)字符串轉(zhuǎn)換到另一個(gè)字符串所需要最少操作(對(duì)字符串進(jìn)行插入、刪除或替換)來度量?jī)蓚€(gè)字符串的相似度[17]。如果編輯距離越小,兩個(gè)字符串就越相似,比如計(jì)算a,b兩個(gè)字符串的相似度,編輯距離為ED(a,b), 標(biāo)準(zhǔn)化編輯距離為NED(a,b), 公式如式(5)所示
(5)
標(biāo)準(zhǔn)化編輯距離NED的取值范圍是[0,1],標(biāo)準(zhǔn)化編輯距離越大說明兩個(gè)字符串越相似。兩個(gè)字符串a(chǎn),b的編輯距離可以通過動(dòng)態(tài)規(guī)劃的算法進(jìn)行計(jì)算,首先構(gòu)造一個(gè)以 |a|+1為行, |b|+1為列的矩陣D[|a|+1,|b|+1], 先給矩陣D[|a|+1,|b|+1] 的第一行和第一列賦值從0開始遞增,D[i][0]=i, 0≤i≤|a|,D[0][j]=j, 0≤j≤|b|。 編輯距離計(jì)算公式如式(6)所示
D[a][b]=min(D[i-1][j]+1,D[i][j-1]+1,D[i-1][j-1]+cost)
(6)
其中,D[i-1][j]+1為刪除一個(gè)字符的操作,D[i][j-1]+1為增加一個(gè)字符串的操作,D[i-1][j-1]+cost為替換字符操作,如果a[i]=b[j],cost的值為1,否則cost的值為0。以此迭代計(jì)算出最后D[a][b] 的值為編輯距離ED(a,b) 的值。
2.2.2 改進(jìn)編輯距離算法
由于傳統(tǒng)的編輯距離算法并沒有考慮到中文字符的音和形,在替換、刪除和增加操作的權(quán)重都是1,而商標(biāo)圖像中文字的音和形相似對(duì)于判斷近似商標(biāo)圖像都比較重要,為了增加商標(biāo)圖像中漢字的音和形的影響,本文提出一種改進(jìn)的編輯距離算法,融合漢字的音和形,也就是拼音和五筆,表1為一些漢字的五筆編碼和拼音。將基本字符集中使用五筆編碼方式的常用的6757個(gè)漢字,按照編碼規(guī)則,表示成代表其字形信息的五筆編碼,并組建常用漢字的字形數(shù)據(jù)庫(kù)。每個(gè)漢字都可以使用至多4個(gè)字母表示其五筆編碼,部分漢字的拼音和五筆編碼見表1。
表1 漢字編碼
提出一種融合音和形的編輯距離算法如式(7)~式(9)所示
(7)
(8)
(9)
其中,式(7)中的DWB為兩個(gè)字符的五筆差異,式(8)中的DPY為兩個(gè)字符的拼音差異,EDWB(a[i],b[j]) 為兩個(gè)字符的五筆編輯距離,EDPY(a[i],b[j]) 為兩個(gè)字符拼音的編輯距離,MAX(|a[i]WB|,|b[j]WB|) 為兩個(gè)字符五筆長(zhǎng)度取較長(zhǎng)的值,MAX(|a[i]PY|,|b[j]PY|) 為兩個(gè)字符拼音長(zhǎng)度取較長(zhǎng)的值。一般來說漢字的五筆編碼不超過4個(gè)字母,所以兩個(gè)字符五筆編碼的編輯距離不會(huì)超過4,漢字的拼音編碼最長(zhǎng)為6個(gè)字母,兩個(gè)字符拼音的編輯距離最大為6。在漢字中存在著多音字的情況,在3500個(gè)常用漢字中,就有250多個(gè)多音字,一個(gè)漢字的讀音有可能有5個(gè)之多。如“重”字就有“chong”和“zhong”兩種讀音,在計(jì)算兩個(gè)字符的拼音的編輯距離時(shí),如果一個(gè)漢字存在多音字,選取兩個(gè)字符的拼音編輯距離較小的讀音。該算法的偽代碼如算法1所示。
算法1:改進(jìn)的編輯距離算法
開始
輸入:a:待匹配的字符串
b:目標(biāo)匹配的字符串
輸出:a,b兩個(gè)字符串的編輯距離d[i,j]
字符串a(chǎn)的長(zhǎng)度為n,字符串b的長(zhǎng)度為m
構(gòu)造一個(gè)矩陣d[m+1,n+1], 初始化矩陣第一行為0到n,初始化第一列為0到m
for(i ← 1 tom) do
for(j ← 1 to n) do
ifa[i]==b[j] then
cost=0
else
cost=d[i-1,j-1] +1/2(DWB +DPY) //DWB和DPY為拼音和五筆的編輯距離的均值
d[i,j]=min{d[i-1,j]+1,d[i,j-1]+1,d[i-1,j-1]+cost}
returnd[m,n]
結(jié)束
檢索結(jié)果融合與重排序,本節(jié)詳細(xì)介紹如何將2.1與2.2的檢索結(jié)果進(jìn)行融合重排序進(jìn)而得到最終的檢索結(jié)果,單純利用2.1或2.2得到的檢索結(jié)果并不算特別好,都有各自的局限性。本文針對(duì)大量商標(biāo)圖像中含有文字和圖形組成的混合圖像,提出一種基于排序列表相似度分?jǐn)?shù)融合的圖像相似度方法,在計(jì)算圖像相似度時(shí),將基于深度學(xué)習(xí)和文字識(shí)別的檢索結(jié)果的排序表融合在一起得到最后的檢索排序結(jié)果。現(xiàn)有的根據(jù)多個(gè)排序列表進(jìn)行相似度融合的方法主要有:IRP(inverse rank positon)算法、BC(borda count)算法等。
本文提出的相似度排名列表融合算法首先在基于深度學(xué)習(xí)的相似度排名表中依次判斷是否出現(xiàn)在文字檢索相似度排名列表中,如果該圖像在兩種排名列表中均出現(xiàn),則將該圖片排在最終相似度排名列表的前面,然后將兩種排名列表剩下的圖片依次循環(huán)插入到最終相似度排名列表中。該算法的如算法2所示。
算法2:排名融合
開始
輸入:Q:基于深度學(xué)習(xí)的檢索結(jié)果排名圖像,{Q[q]:1≤q≤N}
T:基于文字的檢索結(jié)果排名圖像, {T[t]:1≤t≤N}
輸出:S:Q、T兩者排名結(jié)果進(jìn)行融合的相似度排名圖像, {S[s]:1≤s≤N}
for(q←1 toN) do
for(t←1 toN) do
ifQ[q]==T[t] then
S[s]←Q[q]
Break;
for(循環(huán)次數(shù)←1 toN-s) do
S←將T[t]?S圖像插入最終相似度排序列表中
S←將Q[q]?S圖像插入最終相似度排序列表中
returnS
結(jié)束
圖5是利用排名融合算法對(duì)基于深度學(xué)習(xí)檢索和文字檢索的相似度排名列表進(jìn)行融合的前5個(gè)檢索圖像的排序,基于深度學(xué)習(xí)檢索的前5個(gè)檢索圖像的排序結(jié)果為 {a,b,c,d,e}, 文字檢索的前5個(gè)檢索圖像的排序結(jié)果為 {f,a,g,c,b}, 根據(jù)算法2,首先依次遍歷基于深度學(xué)習(xí)檢索的前5個(gè)檢索圖像的排序a,圖片a也出現(xiàn)在文字檢索結(jié)果排名列表中,將圖片a排在最終檢索列表的第一位,后面依照此規(guī)則得到檢索結(jié)果排名為{a,b,c}, 再依次將兩種排名剩下的圖片插入到最終檢索結(jié)果排名列表中,得到最終的檢索結(jié)果排名為 {a,b,c,f,d}。
圖5 融合排序算法
本文收集1000組商標(biāo)進(jìn)行檢索實(shí)驗(yàn),每一組包含15張相似商標(biāo)圖像,一共15 000張商標(biāo)圖像作為測(cè)試集(以下稱為L(zhǎng)ogos)。每一組商標(biāo)圖像從Logo1-Logo15進(jìn)行編號(hào),每一組的Logo1作為檢索的查詢圖像,按照與Logo1的相似度從大到小排序的原則從Logo2到Logo15對(duì)該組的商標(biāo)進(jìn)行編號(hào)。圖6為兩組相似商標(biāo)。
圖6 相似商標(biāo)圖像
本文首先在包含形近字或同音字的商標(biāo)上面進(jìn)行實(shí)驗(yàn),利用本文提出的改進(jìn)編輯距離算法1計(jì)算包含形近字或同音字的部分詞語的距離,并與改進(jìn)前的算法作比較,表2為改進(jìn)后和改進(jìn)前的編輯距離一些字符串相似度的比較結(jié)果。
表2 比較結(jié)果/%
上面的字符串列表中,列舉了一些易混淆的商標(biāo)名稱,這些商標(biāo)名稱中包含了形近字和同音字的情況。從改進(jìn)后算法的相似度結(jié)果來看,針對(duì)易混淆的商標(biāo)名稱,改進(jìn)后的結(jié)果比傳統(tǒng)的編輯距離計(jì)算相似度效果更好。因此,利用改進(jìn)的編輯距離算法就可以更好找出含有相似度比較高的文字的商標(biāo)圖像。
本文的檢索方法在Logos上進(jìn)行評(píng)估,對(duì)Logos分別進(jìn)行文字檢索和卷積特征檢索,最終將結(jié)果進(jìn)行融合重排序。檢索精度相比于深度學(xué)習(xí)檢索方法得到的結(jié)果要高出將近3個(gè)百分點(diǎn)。評(píng)估結(jié)果如圖7所示。
圖7 評(píng)估結(jié)果
本文對(duì)文中提到的部分方法進(jìn)行實(shí)驗(yàn)評(píng)估,本文選取3個(gè)比較有代表性的算法在商標(biāo)數(shù)據(jù)集上評(píng)估,包括深度學(xué)習(xí)算法經(jīng)典模型VGG16、HU矩特征和SIFT這3種圖像檢索算法。由于Logos數(shù)據(jù)集的商標(biāo)圖像都包含文字部分,為了使得結(jié)果更加公平,所有算法都在Logos上進(jìn)行實(shí)驗(yàn)評(píng)估,圖8展示了不同算法在返回圖像數(shù)量10張到50張的查全率的變化。
圖8 實(shí)驗(yàn)評(píng)估結(jié)果
本文分別對(duì)不同算法之間的查準(zhǔn)率和查全率進(jìn)行實(shí)驗(yàn)比對(duì)。在實(shí)驗(yàn)過程中,設(shè)置返回的前top-k=50。表3是實(shí)驗(yàn)對(duì)比結(jié)果。
表3 不同方法實(shí)驗(yàn)對(duì)比結(jié)果/%
本文提出一種商標(biāo)Logo的檢索方法,利用商標(biāo)圖像的包含文字的特性,將文字匹配的結(jié)果與卷積特征檢索的結(jié)果進(jìn)行融合。另外,本文提出一種改進(jìn)的編輯距離算法,能大大提高形近字的匹配率。隨著我國(guó)的商標(biāo)注冊(cè)量直線飆升,在數(shù)據(jù)庫(kù)中更加精準(zhǔn)找到相似商標(biāo)可以降低企業(yè)申請(qǐng)商標(biāo)的成本。為了提高卷積特征的匹配率,針對(duì)商標(biāo)圖像的特性重新訓(xùn)練了網(wǎng)絡(luò)模型,利用訓(xùn)練后的網(wǎng)絡(luò)模型來提取特征,并對(duì)特征進(jìn)一步加權(quán)和局部聚合,使得最后得到的特征描述符能更好地表示商標(biāo)Logo圖像。在融合文字特征搜索結(jié)果之后結(jié)果提高了3個(gè)百分點(diǎn)。實(shí)驗(yàn)結(jié)果表明,本文方法對(duì)商標(biāo)檢索方面具有良好的表現(xiàn),更加適用于商標(biāo)Logo圖像的檢索。