亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        局部特征的局部敏感哈希專利二值化圖像檢索

        2022-06-13 16:46:28董小靈
        電視技術(shù) 2022年5期
        關(guān)鍵詞:描述符哈希檢索

        董小靈

        (國家知識(shí)產(chǎn)權(quán)局專利局 專利文獻(xiàn)部,北京 100083)

        0 引 言

        用文字與圖像相結(jié)合的方式來記載技術(shù)創(chuàng)新成果信息,文字部分用以客觀、準(zhǔn)確地描述整體技術(shù)專利說明書,是以方案為特征,圖像部分是對(duì)文字部分描述的直觀形象化補(bǔ)充。傳統(tǒng)的專利檢索技術(shù)是以文本內(nèi)容為基礎(chǔ)提供檢索功能,而圖像內(nèi)容幾乎不參與檢索。換言之,傳統(tǒng)的專利檢索過程幾乎忽略了圖像內(nèi)容信息。事實(shí)上,“一圖勝萬言”,圖像等非文本數(shù)據(jù)能夠在專利檢索中發(fā)揮舉足輕重的作用。

        專利圖像不包括外觀設(shè)計(jì)圖像,幾乎全部是二值化圖像(黑與白)[1],無色且大多數(shù)無紋理,僅有少數(shù)是低紋理。一方面,專利二值化圖像源于矢量圖像光柵化或者手工繪圖的掃描數(shù)字化,經(jīng)過這樣的過程,原始圖像的顯著幾何信息如紋理等幾近消失;另一方面,專利二值化圖像是由多種畫法創(chuàng)建的繪圖,如線的粗細(xì)、點(diǎn)虛線等,均取決于制圖者的偏好或者技術(shù)領(lǐng)域的特性。因此,形狀特征成為表述專利二值化圖像內(nèi)容信息的唯一圖像特征。

        形狀特征是實(shí)現(xiàn)專利二值化圖像檢索的最為重要的低層視覺特征[2]。鑒于專利二值化圖像的特殊性質(zhì)并結(jié)合專利審查員的檢索需求,本文運(yùn)用局部特征技術(shù)提取專利二值化圖像的特征描述矢量并對(duì)特征描述矢量進(jìn)行必要簡化,在此基礎(chǔ)上,對(duì)專利二值化圖像的特征描述矢量進(jìn)行二值化處理,并結(jié)合局部敏感哈希方法設(shè)計(jì)檢索索引結(jié)構(gòu),從而實(shí)現(xiàn)基于內(nèi)容的專利二值化圖像檢索。

        1 基于SIFT 的專利二值化圖像特征提取與簡化

        尺度不變特征轉(zhuǎn)換(Scale Invariant Feature Transform,SIFT)算法[3-4]是以特征點(diǎn)為基礎(chǔ)的局部特征圖像算法。運(yùn)用此算法可以提取專利二值化圖像的特征點(diǎn),在此基礎(chǔ)上,通過幾何變換的方法縮減圖像中對(duì)幾何變換敏感的特征點(diǎn)數(shù)量,剔除專利二值化圖像的冗余與無效特征點(diǎn),壓縮專利二值化圖像特征點(diǎn)的數(shù)量規(guī)模,從而降低專利二值化圖像的檢索匹配復(fù)雜度。

        1.1 基于SIFT 的專利二值化圖像特征提取

        運(yùn)用SIFT 特征算法生成專利二值化圖像特征向量的過程大體上可以劃分為4 個(gè)主要步驟[5-6]。

        第一步是尺度空間極值點(diǎn)檢測,主要是檢測圖像在不同尺度中所有可能的特征點(diǎn)位置,運(yùn)用高斯函數(shù)處理,對(duì)模糊化的圖像做尺度變化,使圖像在不同尺度獲取代表性特征點(diǎn)。

        第二步是過濾特征點(diǎn)與方向定位。為了取得穩(wěn)定的特征點(diǎn),除了將低對(duì)比度的候選特征點(diǎn)濾除之外,還需要將邊緣處低對(duì)比度的特征點(diǎn)濾除。

        第三步是為特征點(diǎn)分配適當(dāng)?shù)姆较颍饕谴_定特征點(diǎn)的主要方向,將圖像特征點(diǎn)的主要方向轉(zhuǎn)換一致,達(dá)成旋轉(zhuǎn)不變性。

        第四步是建立特征點(diǎn)的特征向量,在找出特征點(diǎn)的位置、尺度與主要方向的基礎(chǔ)上,形成特征點(diǎn)的特征向量。

        1.1.1 尺度空間極值點(diǎn)檢測

        一幅專利二值化圖像的尺度空間定位計(jì)算如下:

        式中:(x,y)是空間坐標(biāo),L(x,y)是尺度坐標(biāo),I(x,y)表示原始圖像,*為卷積運(yùn)算,G(x,y)為高斯函數(shù)。

        完成專利二值化圖像的尺度空間定位后,采用高斯差分函數(shù)(Differential of Gaussian,DoG)[7-8],利用高斯差分函數(shù)中的不同參數(shù)對(duì)圖像進(jìn)行濾波并相減,得到高斯差分函數(shù)的DoG 關(guān)系公式(3),其中D(x,y)的關(guān)系由公式(4)推導(dǎo)而來。

        式中:k為常數(shù)。

        利用差分近似值替代微積分值,式(4)可寫為式(5)的形式:

        則有式(6):

        建立高斯差分(DOG)化后的金字塔,即在DoG 尺度空間中檢測極值點(diǎn)。極值點(diǎn)的檢測是在DoG 尺度空間中,取某一像素點(diǎn)與相鄰的8 個(gè)像素以及金字塔上下兩層相鄰的9 個(gè)像素等26 個(gè)像素進(jìn)行比較,觀察該像素為最大值或最小值時(shí),則為極值點(diǎn)。

        1.1.2 特征點(diǎn)位置的確定

        為找出專利二值化圖像的準(zhǔn)確的特征點(diǎn),利用擬合三維二次函數(shù)(3D Quadratic Function)刪除若干不穩(wěn)定的特征點(diǎn),其中包括低對(duì)比度特征點(diǎn)和位于邊緣的點(diǎn),實(shí)現(xiàn)對(duì)特征點(diǎn)位置與尺度的精準(zhǔn)定位,提升特征點(diǎn)的穩(wěn)定性與抗噪能力。

        對(duì)于低對(duì)比度特征點(diǎn),基本上是以一個(gè)三維二次函數(shù)計(jì)算亞像素極大值。具體做法是將尺度空間函數(shù)D(x)依據(jù)泰勒級(jí)數(shù)展開(最高到二次項(xiàng)),如式(7)所示:

        式中:D為DoG 的結(jié)果,x為特征點(diǎn)。根據(jù)D可以得到一個(gè)偏移量如式(8)所示:

        如果x^ 值任何一個(gè)方向上都大于0.5,則意味著極值與附加采樣點(diǎn)的偏移量非常接近,就會(huì)改變此采樣點(diǎn)。這時(shí)候就需要通過差值來取代該采樣點(diǎn),x^ 值就會(huì)被添加到其他采樣點(diǎn)上,這樣就可以獲取極值點(diǎn)的差值估算值。如式(9)所示:

        為濾除邊緣處的低對(duì)比特征點(diǎn),將使用這些主曲率來判斷特征點(diǎn)是否在邊緣上。主曲率透過一個(gè)2×2 的Hessian 矩陣H求出,如式(10)所示:

        導(dǎo)數(shù)可以由取樣點(diǎn)相鄰差估計(jì)求得D的主曲率和H的特征值(Eigen value)成正比。假設(shè)H的兩個(gè)特征值分別為α、β,可以推導(dǎo)出矩陣Tr(H)對(duì)角線元素之和為兩特征值的和,矩陣H行列值Det(H)為兩特征值的積,如式(11)、式(12)所示:

        令α=γβ,如式(13)所示,則有:

        (γ+1)2/γ的結(jié)果在兩個(gè)特征值相等時(shí)最小,隨著γ增加,(γ+1)2/γ的值也會(huì)隨著增加。當(dāng)γ比較大的時(shí)候,就表示特征值的差異較大,則表示特征點(diǎn)位于圖像的邊緣部分。要判斷特征點(diǎn)是否在圖像的邊緣上,需計(jì)算特征點(diǎn)在尺度空間中是否有較大的主曲率。因此,為了確定主曲率間比值的門檻值γ,采用式(14)進(jìn)行計(jì)算:

        在本研究中,計(jì)算出主曲率間的比值大于10[9],則該點(diǎn)被視為落入邊緣點(diǎn)位,即將該點(diǎn)予以濾除。

        1.1.3 特征點(diǎn)方向確定

        為了在后續(xù)描述專利二值化圖像特征點(diǎn)時(shí)準(zhǔn)確描述圖像特征點(diǎn)的方向,并且在圖像特征點(diǎn)匹配時(shí)可以將圖像特征點(diǎn)轉(zhuǎn)變?yōu)橹魈荻确较颍赃_(dá)到圖像特征點(diǎn)具有旋轉(zhuǎn)不變性的特性,必須對(duì)各個(gè)圖像特征點(diǎn)計(jì)算向量方向和大小,賦予一個(gè)主梯度方向。

        以圖像的特征點(diǎn)為中心,取一區(qū)域?yàn)?6×16像素大小的鄰域,再將其均勻分為16 個(gè)4×4 像素的子區(qū)域。對(duì)每個(gè)子區(qū)域進(jìn)行區(qū)域內(nèi)所有梯度強(qiáng)度與方向計(jì)算,梯度計(jì)算由式(15)、式(16)說明:式中:m(x,y)代表坐標(biāo)位置上的梯度強(qiáng)度,(x,y)代表坐標(biāo)位置上的梯度方向,L表示該區(qū)域內(nèi)所有的像 素 位 置,L(x,y+1),L(x,y-1),L(x-1,y),L(x+1,y)分別代表特征點(diǎn)(x,y)上、下、左、右4 個(gè)相鄰域像素點(diǎn)的灰度值。

        依據(jù)上述式(15)、式(16)對(duì)每一個(gè)所提取的特征點(diǎn)作計(jì)算,可以得到特征點(diǎn)的梯度強(qiáng)度值與方向值。接下來計(jì)算每個(gè)特征點(diǎn)的主要方向。方向可以化作方向直方圖的統(tǒng)計(jì)方式進(jìn)行計(jì)算,其范圍是[0,2π],則每個(gè)柱表示為10°共有36 個(gè)柱。統(tǒng)計(jì)出來的直方圖結(jié)果峰值為這個(gè)特征點(diǎn)的像素梯度的方向。

        方向直方圖中峰值代表特征點(diǎn)的方向。確認(rèn)方向直方圖的最大值后,如果方向直方圖的統(tǒng)計(jì)中,峰值在最大值80%以上,則可以歸類為主梯度方向,即將所有高峰值最大值的80%的描述方向都列為主梯度方向。若梯度方向直方圖超過80%的峰值不是只有一個(gè),則屬于多重方向的情形。大約僅有15%的特征點(diǎn)會(huì)被賦予多個(gè)方向,這些點(diǎn)可以加強(qiáng)特征點(diǎn)匹配的穩(wěn)定性。

        1.1.4 特征點(diǎn)描述向量

        經(jīng)過前述三個(gè)步驟,檢測到所需要的圖像穩(wěn)定特征點(diǎn),并且獲得圖像每一個(gè)穩(wěn)定特征點(diǎn)的相關(guān)特性,即坐標(biāo)位置、尺度空間及方向強(qiáng)度。在此基礎(chǔ)上,對(duì)圖像的穩(wěn)定特征點(diǎn)進(jìn)行特征描述,構(gòu)成特征向量。以特征點(diǎn)為中心提取4×4 大小的區(qū)域,每個(gè)特征點(diǎn)所在的區(qū)域可以劃分為16 個(gè)子區(qū)域。分別統(tǒng)計(jì)每個(gè)子區(qū)域內(nèi)的方向直方圖。每個(gè)子區(qū)域共計(jì)有8個(gè)方向,因此,每一個(gè)特征點(diǎn)的向量維度全部共有4×4×8=128 維。

        1.2 基于SIFT 的專利二值化圖像特征簡化

        用SIFT 算法提取專利二值化圖像得到的特征點(diǎn)數(shù)量較多[10],對(duì)于專利二值化圖像的描述相當(dāng)充分,能夠全面表述專利二值化圖像的內(nèi)容。但是過多的圖像特征點(diǎn)也會(huì)產(chǎn)生冗余信息,直接影響專利二值化圖像的檢索匹配速度與效果。為了刪除專利二值圖像不必要與扭曲的SIFT 關(guān)鍵特征點(diǎn),運(yùn)用特征點(diǎn)簡化算法去除關(guān)鍵點(diǎn)數(shù)量,僅保留具有高幾何可變性的健壯關(guān)鍵特征點(diǎn),以保持后續(xù)專利二值化圖像檢索的速度與準(zhǔn)確度,其算法過程代碼如下:

        輸入:

        Tij:第i幅訓(xùn)練專利二值化圖像的第j個(gè)關(guān)鍵特征點(diǎn)

        變量:

        R90ik:第i幅訓(xùn)練專利二值化圖像90°旋轉(zhuǎn)后第k個(gè)關(guān)鍵特征點(diǎn)

        R180ik:第i幅訓(xùn)練專利二值化圖像180°旋轉(zhuǎn)后第k個(gè)關(guān)鍵特征點(diǎn)

        S2ik:第i幅訓(xùn)練專利二值化圖像尺寸擴(kuò)大2 倍后第k個(gè)關(guān)鍵特征點(diǎn)

        S0.5ik:第i幅訓(xùn)練專利二值化圖像尺寸縮小一半后第k個(gè)關(guān)鍵特征點(diǎn)

        Fi:簡化后所保留的專利二值化圖像關(guān)鍵特征點(diǎn)

        程序:

        //Pi訓(xùn)練專利二值化圖像的關(guān)鍵特征點(diǎn)數(shù)量

        //Gis是訓(xùn)練專利二值化圖像不同幾何變換的關(guān)鍵特征點(diǎn)數(shù)量

        如果Tij能夠同時(shí)實(shí)現(xiàn)R90ik、R180ik、S2ik和S0.5ik四種幾何變換的匹配,則保存Tij在Fi中。

        首先,對(duì)訓(xùn)練專利二值化圖像集合中每1 件圖像進(jìn)行幾何旋轉(zhuǎn)與縮放。使用4 種幾何變換:旋轉(zhuǎn)90°,旋轉(zhuǎn)180°,尺寸擴(kuò)大2 倍,尺寸縮小1/2。從變換圖像中提取特征點(diǎn)并且與原始圖像進(jìn)行比較。如果變換圖像與原始圖像相同特征點(diǎn)匹配(歐幾里德距離小于3 000),則該特征點(diǎn)被視為對(duì)幾何可變性具有魯棒性。通過保留魯棒特征點(diǎn),可以高效減少專利二值化圖像特征點(diǎn)數(shù)據(jù)庫規(guī)模。然而,有可能一些圖像提取很少魯棒特征點(diǎn),這使得圖像匹配相當(dāng)困難。因此設(shè)定每張專利二值化圖像最少特征點(diǎn)閾值F相當(dāng)重要。具體閾值F決定可參見式(19)。其中x-是訓(xùn)練專利二值化圖像數(shù)據(jù)集合關(guān)鍵特征點(diǎn)的平均數(shù)量,σ是訓(xùn)練專利二值化圖像數(shù)據(jù)集合關(guān)鍵特征點(diǎn)的標(biāo)準(zhǔn)方差,具體計(jì)算參見式(17)和式(18)。

        式中:n是訓(xùn)練專利二值化圖像數(shù)據(jù)集合數(shù)量(本集合中數(shù)量為1 000 000 件)是所有訓(xùn)練專利二值化圖像的關(guān)鍵特征數(shù)量平均值。對(duì)于本訓(xùn)練集合而言是141 個(gè),σ是90 個(gè)。注意在關(guān)鍵點(diǎn)簡化過程后決定這些值。每個(gè)訓(xùn)練圖像閾值的確定如下:

        式中:R是在F的關(guān)鍵點(diǎn)數(shù)量。offset是從原始圖像中隨機(jī)選取的關(guān)鍵點(diǎn)數(shù)量直至通過這樣的調(diào)整機(jī)制,可以確保每個(gè)訓(xùn)練圖像的關(guān)鍵點(diǎn)數(shù)目在平均值與方差值之和范圍內(nèi)。如果R是在范圍內(nèi),則R是F。如果R大于,減少R中關(guān)鍵特征點(diǎn)數(shù)量直至F等于

        本研究中訓(xùn)練專利二值化圖像數(shù)量是1 000 000件,原始特征點(diǎn)共有216,734,674 個(gè)。在應(yīng)用特征點(diǎn)去除程序后,關(guān)鍵特征點(diǎn)數(shù)量減少到43,324,865。關(guān)鍵特征點(diǎn)數(shù)量減少近80%。

        2 基于LSH 的專利二值化圖像索引機(jī)制

        SIFT 算法能夠很好地表達(dá)描述專利二值化圖像的內(nèi)容特征。但是專利二值化圖像SIFT 特征的匹配時(shí)間過長,導(dǎo)致整個(gè)專利二值圖像檢索耗時(shí)冗長。為了減少專利二值化圖像檢索時(shí)間并且不影響檢索準(zhǔn)確度,對(duì)專利二值化圖像的SIFT 特征進(jìn)行二值化并結(jié)合局部敏感哈希(LSH)建立索引結(jié)構(gòu)[11-12],以提升整個(gè)專利二值化圖像檢索系統(tǒng)的檢索速度與效率。

        2.1 產(chǎn)生二值化描述符

        針對(duì)專利二值化圖像的SIFT 特征點(diǎn)描述符計(jì)算8 個(gè)方向的平均值[13],接著依據(jù)每個(gè)方向的平均值分別對(duì)描述符內(nèi)所對(duì)應(yīng)的數(shù)值進(jìn)行二值化。假設(shè)SIFT 特征點(diǎn)描述為F={fi|i=0,…,127},然后分類成8個(gè)序列Fd={f8j+d|i=0,…,15},d=0,…,7,其中d表示8個(gè)方向。算出8 個(gè)方向類別的平均值為Dd,計(jì)算公式為式(20)。最后比較其方向大小,判斷是否為0或1,計(jì)算公式為式(21),共產(chǎn)生128 維度的二值化描述符B={bi|i=0,…,127}。

        2.2 哈希函數(shù)的計(jì)算

        根據(jù)專利二值化圖像的SIFT 特征描述符特性產(chǎn)生哈希函數(shù)算法[14]H(M1,M2),如式(22)所示,其中M1和M2都是利用專利二值化圖像SIFT 特征描述符的8 個(gè)方向所產(chǎn)生的平均值。

        M1的產(chǎn)生是利用專利二值化圖像SIFT 特征描述符9 個(gè)方向的平均值,兩兩比較其大小去判斷是否為0 或1,如式(23)所示,接著把8 個(gè)0 或1 的比較結(jié)果合并成M1,如式(24)所示。

        M2的產(chǎn)生也是利用專利二值化圖像SIFT 特征描述符8 個(gè)方向的平均值,依照每個(gè)方向的平均值與其他兩個(gè)鄰近的平均值做累加并產(chǎn)生8 個(gè)累加值,如式(25)所示,然后在8 個(gè)里面找出其最大值的累加值編號(hào),如式(26)所示。

        2.3 哈希表的建立

        依據(jù)哈希函數(shù)將專利二值化圖像的SIFT 特征描述符存入哈希表中。但是若僅存儲(chǔ)SIFT 特征描述B,則不能分辨出該特征描述符是屬于哪一幅專利二值化圖像,所以應(yīng)當(dāng)將每幅專利二值化圖像的SIFT 特征描述符二值化后,經(jīng)過哈希函數(shù)計(jì)算,將二值化描述符B與圖像的ID,(B,In),共同存入哈希表中,其中I={In|n=1,…,N},N為專利二值化圖像數(shù)量,下述為具體方法代碼。

        Input:F={fm|m=1,…,M}:專利二值化圖像的SIFT 特征描述符集合

        Output:T={TX|x=0,…,2 047}:哈希表的2 048個(gè)桶集合

        For 每張專利二值化圖像SIFT 特征描述符fm

        ComputerD0,…,D7by(20)

        將專利二值化圖像SIFT 特征描述符轉(zhuǎn)化為二值描述符

        2.4 圖像檢索匹配

        對(duì)專利二值化圖像SIFT 特征描述符經(jīng)過上述3 個(gè)步驟處理后,依據(jù)每個(gè)特征描述符經(jīng)過哈希計(jì)算的結(jié)果,檢索對(duì)應(yīng)哈希表桶內(nèi)的全部二值化描述,接著對(duì)測試的專利二值化圖像與哈希表桶內(nèi)的二值化描述符做海明距離比較[15-16],設(shè)定海明距離的閾值為T。若比較結(jié)果小于或等于閾值T,就判定該哈希表桶內(nèi)的二值化描述符為相似描述符,并且記錄對(duì)應(yīng)的專利二值化圖像ID。當(dāng)計(jì)算完測試圖像的所有特征描述符后,統(tǒng)計(jì)相似特征描述符數(shù)量最多的專利二值化圖像為相似圖像,下述為具體方法代碼。

        Input:F={fy|y=1,…,Y}:測試圖像的特征描述符集合

        C={Cn|n=1,…,N}:目標(biāo)數(shù)據(jù)庫圖像集合,初始值為0

        T:海明距離的閾值

        Output:C={Cn|n=1,…,N}:目標(biāo)數(shù)據(jù)庫圖像更新結(jié)合

        For 測試圖像的特征描述符fy

        將專利二值化圖像SIFT 特征描述符fm轉(zhuǎn)化為二值描述符B′

        從哈希表T 的桶內(nèi)檢索數(shù)據(jù)

        從桶中產(chǎn)生一系列(B,In)

        計(jì)算B′與B的海明距離

        3 專利二值化圖像檢索算法的實(shí)驗(yàn)

        為了驗(yàn)證上文所述的專利二值化圖像檢索算法的性能,選擇專利二值化圖像進(jìn)行實(shí)驗(yàn)測試。開展本實(shí)驗(yàn)測試所搭建的基本硬件配置為Intel CPU Q9550 2.83 GHz,4 GB DDR2 800 內(nèi)存。選擇2010年至2020 年期間中國發(fā)明專利申請說明書與實(shí)用新型專利說明書的相關(guān)附圖作為實(shí)驗(yàn)的圖像數(shù)據(jù)集。作為實(shí)驗(yàn)的圖像數(shù)據(jù)集主要包括測試圖像集、查詢圖像集及目標(biāo)圖像集3 個(gè)部分。

        測試圖像集是指進(jìn)行查詢的專利二值化圖像數(shù)據(jù)集合,在本實(shí)驗(yàn)測試中選擇1 000 000 幅專利附圖圖像作為測試數(shù)據(jù)集,圖像大小的范圍為256×384 ~1 024×768。查詢圖像集是指作為查詢輸入的專利二值化圖像數(shù)據(jù)集合,在本實(shí)驗(yàn)測試中從測試圖像集中人工選取200 幅專利二值化圖像數(shù)據(jù)。目標(biāo)圖像集是根據(jù)查詢圖像集200 幅專利二值化圖像數(shù)據(jù)在測試圖像集中人工確定的相似專利二值化圖像數(shù)據(jù),這部分?jǐn)?shù)據(jù)是中國專利文獻(xiàn)深加工項(xiàng)目的產(chǎn)物。

        通過對(duì)測試圖像集的專利二值化圖像進(jìn)行SIFT 特征提取與簡化,形成優(yōu)化的專利二值化圖像關(guān)鍵特征點(diǎn)。在此基礎(chǔ)上,對(duì)專利二值化圖像關(guān)鍵特征點(diǎn)進(jìn)行二值化后利于哈希算法形成不同規(guī)模大小的局部敏感哈希索引表,具體如表1 所示。從表1可知,隨著專利二值化圖像訓(xùn)練數(shù)據(jù)集合規(guī)模數(shù)量的變動(dòng),局部敏感哈希索引表大小也線性變動(dòng)。

        表1 不同規(guī)模專利二值化圖像集合的哈希索引表大小

        在對(duì)所述的專利二值化圖像進(jìn)行測試實(shí)驗(yàn)過程中,以查詢圖像集所包含的200 幅專利二值化圖像作為作為查詢圖像用例在測試圖像集中進(jìn)行專利二值化圖像檢索的測試。首先,運(yùn)用SIFT 算法提取專利二值化查詢圖像的特征點(diǎn),再利用幾何變換算法對(duì)專利二值化查詢圖像所提取的SIFT 特征點(diǎn)進(jìn)行簡化。其次,對(duì)簡化后的專利二值化查詢圖像SIFT特征點(diǎn)進(jìn)行二值化處理形成新的專利二值化圖像的二值特征向量。隨后,根據(jù)哈希函數(shù)對(duì)專利二值化圖像的二值特征向量構(gòu)建局部敏感哈希索引,最后,基于投票方式統(tǒng)計(jì)相似特征描述符數(shù)量最多的專利二值化圖像為相似圖像并返回圖像標(biāo)識(shí)號(hào)碼。

        根據(jù)專利二值化圖像測試集合不同規(guī)模進(jìn)行檢索,本實(shí)驗(yàn)選用的專利二值化圖像測試集合有6 種規(guī)模,分別是50 000,100 000,200 000,500 000,800 000 及1 000 000。不同規(guī)模的專利二值化圖像測試集合的關(guān)鍵特征點(diǎn)數(shù)量簡化前后數(shù)值如表2 所示。表3 表示200 幅專利二值化查詢圖像在不同規(guī)模的專利二值化圖像測試集合中特征簡化前后檢索匹配具體時(shí)間值。從表3 可知,專利二值化圖像特征簡化前的檢索匹配時(shí)間要長于特征簡化后的檢索匹配時(shí)間。換言之,專利二值化圖像特征簡化提升了整個(gè)專利二值化圖像的檢索匹配速度。

        表2 不同規(guī)模專利二值化圖像簡化前后的SIFT 特征點(diǎn)數(shù)量

        表3 專利二值化圖像特征簡化前后檢索匹配時(shí)間值

        表4表示200 幅專利二值化查詢圖像在不同規(guī)模的專利二值化圖像測試集合中特征簡化前后檢索匹配查全率。從表4 可以發(fā)現(xiàn),專利二值化查詢圖像檢索匹配查全率在圖像特征簡化前要高于圖像特征簡化后,并且兩者都隨著專利二值化測試圖像集合規(guī)模的增加而逐步降低。盡管專利二值化測試圖像集合規(guī)模達(dá)到百萬級(jí),但是專利二值化圖像檢索特征簡化前后匹配查全率并沒有大幅度變化,并且最低匹配查全率仍然保持在85%以上。這樣的測試結(jié)果表明,本研究所提出的專利二值化圖像檢索算法具有較高的查全率與較快的檢索速度,可以運(yùn)用在現(xiàn)實(shí)的專利二值化圖像檢索中。

        表4 專利二值化圖像特征簡化前后檢索匹配查全率比值

        4 結(jié) 語

        專利二值化圖像自身內(nèi)在的復(fù)雜性與特殊性使得基于形狀特征的專利二值化圖像檢索更具挑戰(zhàn)性。通過對(duì)現(xiàn)有基于內(nèi)容的圖像檢索技術(shù)系統(tǒng)研究,認(rèn)識(shí)到局部特征提取技術(shù)對(duì)于構(gòu)建專利二值化圖像檢索算法具有重要意義。針對(duì)SIFT 算法在專利二值化圖像檢索算法實(shí)際應(yīng)用過程中所產(chǎn)生的特征矢量數(shù)量過多與特征矢量維度過高等兩大問題,本文提出了專利二值化圖像SIFT 特征向量的簡化算法和索引構(gòu)建機(jī)制。下一步將在改進(jìn)專利二值化圖像的局部特征提取算法和圖像相似度量比較算法基礎(chǔ)上,優(yōu)化索引結(jié)構(gòu),來提升專利二值化圖像檢索算法的運(yùn)行效率。

        猜你喜歡
        描述符哈希檢索
        基于結(jié)構(gòu)信息的異源遙感圖像局部特征描述符研究
        2019年第4-6期便捷檢索目錄
        Linux單線程并發(fā)服務(wù)器探索
        利用CNN的無人機(jī)遙感影像特征描述符學(xué)習(xí)
        專利檢索中“語義”的表現(xiàn)
        專利代理(2016年1期)2016-05-17 06:14:36
        基于OpenCV與均值哈希算法的人臉相似識(shí)別系統(tǒng)
        基于維度分解的哈希多維快速流分類算法
        基于同態(tài)哈希函數(shù)的云數(shù)據(jù)完整性驗(yàn)證算法
        一種基于Bigram二級(jí)哈希的中文索引結(jié)構(gòu)
        基于PDIUSBD12的USB接口設(shè)計(jì)應(yīng)用研究
        日本女u久久精品视频| 国产国拍亚洲精品mv在线观看| 国产精品无码久久久一区蜜臀| 国产精品成人久久一区二区| 亚洲av色图一区二区三区| 国产偷久久久精品专区| 国产人碰人摸人爱视频| 久久久精品人妻一区二区三区| 天天狠天天透天干天天| 美女视频永久黄网站免费观看国产 | 丁香婷婷六月综合缴清| 友田真希中文字幕亚洲| 亚洲熟妇丰满多毛xxxx| 亚洲中文字幕无码久久2020| 最新在线观看精品国产福利片| 精品麻豆一区二区三区乱码| 在线亚洲高清揄拍自拍一品区| 精品香蕉久久久爽爽| 日韩在线视频不卡一区二区三区| 亚洲av专区一区二区| 亚洲av无码国产精品色| 亚洲а∨天堂久久精品2021| 亚洲另类激情专区小说婷婷久 | 丝袜欧美视频首页在线| 伊人婷婷综合缴情亚洲五月| 操风骚人妻沉沦中文字幕| 亚洲国产成人久久综合下载| 久久成人麻豆午夜电影| 国产喷白浆精品一区二区| 日本大片一区二区三区| 全黄性性激高免费视频| 久久国产热这里只有精品| 99久久久国产精品免费蜜臀| WWW拍拍拍| 国产视频一区二区三区观看| 狠狠色噜噜狠狠狠777米奇小说| 久久99欧美| 国产av精品久久一区二区| 成人无码av免费网站| 国产亚洲av手机在线观看| 老肥熟女老女人野外免费区|