亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        一種基于主成分的多表圖像哈希檢索方法

        2018-02-07 01:47:48鄧清文林志賢郭太良
        計算機(jī)工程與應(yīng)用 2018年3期
        關(guān)鍵詞:哈希投影檢索

        鄧清文,林志賢,郭太良

        福州大學(xué) 物理與信息工程學(xué)院,福州 350002

        1 引言

        2010年,著名網(wǎng)站Flickr統(tǒng)計的圖片總量超過50億[1],2014年平均每天在Facebook、Snapchat、Whats App等平臺上上傳分享的圖片數(shù)量超過18億張。面對如此龐大的數(shù)據(jù),傳統(tǒng)的線性枚舉查找方法也會變得十分耗時[2]。因此,如何快速準(zhǔn)確地進(jìn)行內(nèi)容查找對大規(guī)模數(shù)據(jù)管理意義重大。

        例如,給定一幅待查的圖片,如何在大規(guī)模的數(shù)據(jù)庫中快速、準(zhǔn)確地檢索到與給其具有語義相似的圖像,基本的思想是對數(shù)據(jù)集中所有圖像提取特征,然后定義特征相似性度量,對數(shù)據(jù)庫進(jìn)行線性掃描并根據(jù)相似度排序,從而獲取檢索的結(jié)果。然而,這樣必能存在兩個重要的問題:(1)圖像特征往往是一種高維化的數(shù)據(jù),高維數(shù)據(jù)的存儲要求高,計算效率和類與類之間的區(qū)分性較低;(2)對大規(guī)模數(shù)據(jù)進(jìn)行線性搜索很難滿足效率要求。因此,如何對圖像高維特征進(jìn)行有效索引成為一個亟需解決的問題。研究人員在這方面最早提出了以樹形結(jié)構(gòu)索引算法,主要以樹形結(jié)構(gòu)索引算法。基于樹的查找方法如:kd-tree[3]、M-tree[4]、cover-tree[5]、metric-tree[6]等方法,然而,樹形索引結(jié)構(gòu)提高了檢索速度,但所需的存儲空間大,難以適應(yīng)大規(guī)模數(shù)據(jù)檢索的要求。

        與此同時,基于哈希的相似度查詢方法倍受關(guān)注?;诠5南嗨贫炔檎曳椒ㄊ菍?shù)據(jù)映射到低維度的漢明空間,也就是二進(jìn)制編碼。通過查找哈希表的方式,在計算查詢樣本點和數(shù)據(jù)庫中的樣本點的相似度時只需要簡單的位操作運算,并且擁有良好的存儲效率。

        Chum等人[7]將局部敏感的哈希算法(Locality-Sensitive Hashing,LSH)引入到圖像哈希索引技術(shù)當(dāng)中,其利用隨機(jī)投影的方式對樣本點特征進(jìn)行哈希,通過構(gòu)建一組哈希函數(shù),將n維的原始特征索引成d維(d?n),其形式定義:對于集合S,集合內(nèi)元素間相似度計算公式為sim( )a,b。如果存在一個哈希函數(shù)h(*)滿足以下條件:存在一個相似度S到概率P的單調(diào)遞增映射關(guān)系,使得S中的任意兩個元素滿足,如果sim(a ,b)≤R,則 有P{h (a)=h(b)}≥P1;如果 sim(a ,b)≥(1 +ξ) R,則 有 P{h (a)≠h(b)} ≤P2,其 中 ξ>0,P1>P2。2006年,Andoni等人[8]又提出了Min哈希,其對LSH哈希函數(shù)族進(jìn)行了擴(kuò)展,構(gòu)造了ls范數(shù)距離下的LSH哈希函數(shù),將空間隨機(jī)分割為固定寬度的單元,每個單元代表一個桶,通過ls和Jaccard系數(shù)作為近似最近鄰檢索的度量標(biāo)準(zhǔn)。對于高維核數(shù)據(jù),當(dāng)核函數(shù)未知情況下,LSH類方法的檢索效果并不好。為了解決這個問題,Kulis等人[9]將LSH擴(kuò)展為核位置敏感哈希(Kernelized Locality-Sensitive Hashing,KLSH)。然而這類LSH算法采用與特征無關(guān)隨機(jī)投影的方式構(gòu)建哈希函數(shù),因此為了增加哈希碼的碰撞概率,需要較多的超平面對數(shù)據(jù)進(jìn)行分割投影才能達(dá)到令人滿意的準(zhǔn)確率。近年來,研究者為了克服LSH方法的缺點,提出了一系列的基于機(jī)器學(xué)習(xí)的哈希函數(shù)算法,利用數(shù)據(jù)局部性的特性,通過哈希函數(shù)將高維特征映射為緊湊的二進(jìn)制編碼,降低了檢索時間的復(fù)雜度。這些算法中最具有代表性的是利用主成分分析(Principle Component Analysis Hashing,PCAH)[10]進(jìn)行降維,從而對特征實現(xiàn)索引,相對于隨機(jī)的投影方式產(chǎn)生哈希函數(shù)的算法而言,該算法構(gòu)建哈希函數(shù)依賴數(shù)據(jù)本身,提高了檢索的準(zhǔn)確率。這類算法還包括Weiss等人[11]提出的譜哈希算法(Spectral Hashing,SpH)。通過譜分析,利用服從分布的n個離散數(shù)據(jù)點求拉普拉斯的特征方程求解。為了使算法的性能隨著哈希編碼長度的增加而得到提升,Jin等人[12]采用了和局部敏感的哈希算法類似的框架,利用了數(shù)據(jù)的幾何結(jié)構(gòu)特征產(chǎn)生投影向量,提出了一種密度敏感的哈希算法(Density Sensitive Hashing,DSH),即使在較短的哈希編碼時,密度敏感的算法在檢索性能上也得到了相應(yīng)的提升。此外,Gong等人[13]提出了迭代量化哈希算法(Iterative Quantization Hashing,ITQ)通過對相互正交的投影進(jìn)行旋轉(zhuǎn),最小化哈希函數(shù)的實數(shù)值輸出和當(dāng)前哈希編碼之間的差值的平方和來構(gòu)建哈希函數(shù),使得二值哈希編碼的均衡性大大增加,性能也隨之得到顯著的改善。然而,現(xiàn)有的方法存在一個問題,通過學(xué)習(xí)哈希函數(shù)獲得的二進(jìn)制編碼,這些投影矩陣不僅需要很強(qiáng)的判別性,而且能夠同時區(qū)分多類特征,否則難以保證檢索的準(zhǔn)確性。而實際的圖像數(shù)據(jù)往往很難學(xué)習(xí)到這樣的投影,如果增加編碼的長度,那么需要更多的存儲空間,因此,如何在編碼位數(shù)相同的情況下,使學(xué)習(xí)到的哈希函數(shù)得到更高的檢索性能,是一個有待解決的問題。

        本文針對上述問題,提出了一種基于主成分的多表圖像哈希檢索方法,即在編碼位數(shù)相同的情況下,通過增加查詢哈希表的索引個數(shù)提高檢索的性能。

        2 主成分的多表索引哈希函數(shù)構(gòu)建

        如果哈希函數(shù)判別能力不夠,即使使用了緊湊的編碼方式,仍然需要增加編碼位數(shù)來達(dá)到令人滿意的檢索性能。換言之,在構(gòu)造哈希之前提高樣本特征的區(qū)分性就更容易學(xué)習(xí)到區(qū)分度高的哈希編碼。因此,為了獲取圖像區(qū)分性強(qiáng)的特征,本文首先利用主元分析在原有的特征維度中,抽取具有區(qū)分性的特征作為原始數(shù)據(jù)的主成分,這樣可以減少高維空間中所包含的冗余信息或噪聲,得到數(shù)據(jù)內(nèi)部的本質(zhì)結(jié)構(gòu)特征,同時解決了數(shù)據(jù)稀疏性問題,加快了后續(xù)的計算速度。此外,為了保證不同語義樣本哈希編碼具有很強(qiáng)的判別性,運用了不同語義樣本的聚類中心進(jìn)行特征聚類。在編碼位數(shù)相同的情況下,通過每類聚類中心獲取多個相似類,構(gòu)建多組哈希函數(shù)并生成多個哈希索引表,提高相似樣本的召回率。最后,為了進(jìn)一步提高算法檢索的準(zhǔn)確度,避免投影在某個方向方差大,引起對應(yīng)編碼位的權(quán)重較大而其他位的權(quán)重小,導(dǎo)致檢索性能下降,采用正交矩陣對投影向量進(jìn)行旋轉(zhuǎn),均衡每位哈希編碼的權(quán)值,確保相似的樣本通過哈希映射后得到相似編碼。

        2.1 區(qū)分性特征提取

        圖像哈希檢索的目的是把原始高維度的數(shù)據(jù)映射到低維的漢明空間,且在這個低維空間編碼后的數(shù)據(jù)能夠保持原來高維空間的語義關(guān)系,即在原始空間是近鄰的特征,在編碼空間還是近鄰。因此,在降低圖像特征維度的同時盡量減少高維空間中所包含的冗余信息或噪聲。本文首先通過主元分析提取原始高維特征中具有區(qū)分性強(qiáng)的特征維度,得到訓(xùn)練集內(nèi)部的本質(zhì)結(jié)構(gòu)特征,也就是原始特征經(jīng)過投影后保留那些方差較大的特征維度。

        如圖1所示,假設(shè)不同顏色的點代表不同樣本的特征,如果將這些區(qū)分性不大的特征按照X、Y軸投影,那么投影后的數(shù)據(jù)在X、Y軸上的方差相差不大,即這些投影后的特征區(qū)分性較小。為了增強(qiáng)不同樣本之間特征的區(qū)分性,如何尋找一個最佳投影u降低數(shù)據(jù)集樣本特征的維度,且保留具有區(qū)分性特征維度。下面給出推導(dǎo)過程。

        圖1 數(shù)據(jù)集樣本特征示意圖

        如圖2所示,綠色和淺藍(lán)色表示樣本點X′(x),X″(x)分別在U(x)和?(x)上的投影,其中U(x)和?(x)都為單位向量。顯然紅色和棕紅色的樣本點在U(x)方向上的投影之間的方差最大,而在?(x)方向上投影之間的方差幾乎為零,不適合樣本點特征之間的區(qū)分。對于給定的數(shù)據(jù)圖像特征庫,如何找到這個投影矩陣u(x)={u1,u2,…,un},使得投影后樣本點特征方差最大。

        圖2 樣本點特征投影

        定義u(x)={u1,u2,…,ud}為投影矩陣,X(x)={x1(x),x2(x),…,xn(x)}為由n個樣本xi(x)組成的數(shù)據(jù)集,其中xi(x)∈Rk。假設(shè)這些樣本點的每一維特征均值都為0,因此x(i)在u上的投影均值也為0。根據(jù)最大化方差理論,數(shù)據(jù)集在u(x)上投影后的方差為:上述表達(dá)式為即可知,λ是的特征值,u(x)是其對應(yīng)的特征向量,最佳的投影向量為特征值λ最大時對應(yīng)的特征向量u1(x),以此類推,第i個特征值對應(yīng)的特征向量為ui(x),本文選取前k個最大特征值對應(yīng)的特征向量作為最佳投影矩陣u(x)={u1(x),u2(x),…,uk(x)},其中k值與樣本點哈希編碼的位數(shù)有關(guān),則X(x)在u(x)投影后的數(shù)據(jù)X(x)?u(x)為該數(shù)據(jù)集樣本特征方差最大的主成分,在降低維度的同時過濾了那些方差小的特征。

        2.2 特征聚類量化預(yù)處理

        哈希函數(shù)往往需要很強(qiáng)的判別性,即能夠同時區(qū)分多類樣本點特征,否則很難確保檢索的準(zhǔn)確率。Jegou等人[14]研究表明數(shù)據(jù)量化的預(yù)處理將顯著提高最近鄰檢索的性能,基于這個研究成果,在學(xué)習(xí)哈希投影之前,對數(shù)據(jù)集的主成分進(jìn)行量化處理,即利用不同語義樣本的聚類中心進(jìn)行特征聚類,將不同特征的多類樣本n分到k個不同的組里面,并作為哈希投影的訓(xùn)練集,以此得到具有更強(qiáng)判別性的哈希函數(shù)。

        假設(shè)區(qū)分性特征樣本集為:X′(x)={x1(x),x2(x),…,xk(x)},其中xi(x)∈Rk,特征聚類將樣本聚類成k個簇,算法描述如下:

        1.隨機(jī)選取k個樣本點作為聚類質(zhì)心,μ1,μ2,…,μk∈Rk。

        2.對于每一個樣本點i,計算其歸屬的類。

        3.對于每個類j,重新計算該類的質(zhì)心。

        4.重復(fù)步驟2、3直到收斂。

        然而,大規(guī)模圖像特征聚類的收斂過程非常耗時,在實際的應(yīng)用中,一般不知道算法迭代的次數(shù)p和最佳的聚類組數(shù)k,經(jīng)過大量實驗發(fā)現(xiàn),特征降維后的迭代次數(shù)p通常比較小,其性能就能夠達(dá)到理想值。此外,算法性能往往還取決于聚類的組數(shù)k,一般來說k值越大,算法的性能會有所提升,但是,這將必導(dǎo)致量化的計算量增大,系統(tǒng)檢索的時間會更慢。在該算法中,聚類的組數(shù)k與哈希編碼的位數(shù)L有關(guān),下一節(jié)會詳細(xì)介紹。

        2.3 多表哈希函數(shù)構(gòu)建

        基于上述兩節(jié),得到低維度且區(qū)分性強(qiáng)的圖像特征,并通過不同語義樣本的聚類中心進(jìn)行特征聚類,將不同特征的多類樣本n分到k個不同的聚類組,從而增強(qiáng)了多樣本間的區(qū)分度。本節(jié)選取每類樣本的聚類中心作為哈希函數(shù)的訓(xùn)練集,獲取多組哈希投影矩陣,每組哈希矩陣包含L個投影向量,其中L為哈希編碼的位數(shù)。定義一個哈希函數(shù)的形式如下:

        其中,x?Rn×d是從原始特征提取的具有區(qū)分性的特征向量,?Ti(x)?Rd×L是投影矩陣,sign(?)是符號函數(shù),t是偏移參數(shù),在學(xué)習(xí)哈希函數(shù)之前,對數(shù)據(jù)進(jìn)行了零均值處理,函數(shù)可簡化為h(x)≈sign(x?Ti(x))。通過哈希函數(shù)每個樣本的圖像特征將被映射為長度為L的哈希值。

        訓(xùn)練哈希函數(shù)時,充分利用了數(shù)據(jù)內(nèi)部本質(zhì)特征,并將這些區(qū)分性特征進(jìn)行了聚類,作為哈希函數(shù)的指引,因此得到區(qū)分度高的投影矩陣?Ti(x)。下面是推導(dǎo)過程,假設(shè)低維空間中樣本特征x?Rn×d經(jīng)過特征聚類后得到圖3。

        圖3 低維空間中樣本點的特征聚類

        令s={s1,s2,…,sk}為區(qū)分性特征聚類后的結(jié)果,引用誤差平方和(Sum of Square Error,SSE)評判聚類后的性能:

        其中μn為第n組sn的代表點,則:

        然而特征聚類后相似類之間的離散度相差較大,或者是相似樣本點屬性分布區(qū)間較大,即原本是相似的樣本類,而被分到兩個不同的聚類組。這樣勢必導(dǎo)致相似的樣本點,在哈希檢索時被遺漏。因此,采用學(xué)習(xí)多組哈希投影矩陣的方式,生成多張哈希索引表,這樣在編碼位數(shù)相同的情況下,便可以提高相似樣本的召回率。

        定義1相似簇ζ

        如圖4所示,黃色梅花型是查詢圖像,其他不同顏色不同形狀的點是與查詢圖像相似的圖像。如果僅在黃色梅花聚類哈希表里查詢,勢必導(dǎo)致其他相似圖像被遺漏。如果利用圖4所示四個相似類分別構(gòu)建一組哈希函數(shù),各自生成一張哈希表,那么查詢時結(jié)合這些表可檢索到更多的相似樣本,以此提高檢索召回率。下面為其中一組哈希函數(shù)的構(gòu)建過程,在特征聚類后再次進(jìn)行二次聚類,并將相似類歸為到一組相似簇里面,再利用相似簇中心與其中相似類聚類中心之間的中垂面作為超幾何平面分離相似簇中相鄰類的樣本點集。并將這些中垂面構(gòu)建一組投影矩陣?Ti(x)。

        定義2超幾何中垂面

        圖4 相似簇中相似類

        其中μi,μj表示相似簇和其中一個子集聚類中心,推導(dǎo)相應(yīng)的哈希函數(shù)如下:

        由上式可知,假設(shè)哈希編碼的長度為L,特征聚類最終得到L個相似簇,并且每個相似簇ζ包含λ個相似類,每一位哈希碼對應(yīng)一個相似簇ζ,從而可以得到λ組哈希函數(shù),每組哈希函數(shù)對應(yīng)一個投影矩陣其中包含L個投影向量。

        2.4 哈希編碼優(yōu)化

        本文為了進(jìn)一步提高算法檢索的準(zhǔn)確度,避免投影后數(shù)據(jù)x?Ti(x)在某個方向方差大,引起對應(yīng)編碼位的權(quán)重較大而其他位的權(quán)重小,導(dǎo)致檢索性能下降。本節(jié)借鑒文獻(xiàn)[12],引入正交矩陣R對投影向量?Ti(x)進(jìn)行旋轉(zhuǎn),均衡每位哈希編碼的權(quán)值,以減小量化誤差。定義損失函數(shù)為投影后數(shù)據(jù)x?Ti(x)與對應(yīng)的哈希編碼之間的誤差。利用矩陣運算性質(zhì)和弗羅貝尼烏斯范數(shù)的定義,損失函數(shù)可簡化為:

        由式(7)可知,最小化損失函數(shù)等價于最大化J(B)=tr(BTx?Ti(x)R)。當(dāng)固定參數(shù)R時,最小化損失函數(shù)對應(yīng)的參數(shù)B的最優(yōu)解為對于固定參數(shù)B時,最小化目標(biāo)函數(shù)等價于最大化J(R)=tr(BTx?Ti(x)R)。將矩陣BTx?Ti(x)進(jìn)行奇異值分解(SVD)得:J(R)=tr(SΩTR)=tr(TRSΩ)由奇異值分解SVD定義:T=I,STS=I可知,當(dāng) R=ST時,損失函數(shù)達(dá)到最小值。

        3 實驗結(jié)果分析

        本文實驗所選的測試集為Caltech-256和CIFAR-10,并選取了具有代表性的方法如:LSH[7]、PCAH[10]、SPH[11]、DSH[12]、ITQ[13]、SH[15]與本文提出的方法進(jìn)行比較。對本文提出的方法進(jìn)行驗證和分析,為了比較方便,本文提出了一種基于主成分的多表圖像哈希檢索方法(A Multi Table Image Hash Retrieval Method Based on Principal Component),簡稱為PMTH。對于每個圖像庫,隨機(jī)選擇1 000個樣本點作為查詢圖像,剩下的樣本作為訓(xùn)練集,用于學(xué)習(xí)哈希函數(shù)。對于每個查詢樣本點,計算其哈希編碼與召回來的圖像哈希編碼的漢明距離,并按照距離大小來排序,距離越小的排得越前。

        3.1 檢索性能評判標(biāo)準(zhǔn)

        實驗選取了召回率,準(zhǔn)確率作為算法性能的評價標(biāo)準(zhǔn)。具體來說,假設(shè)特征A在原始空間有相同語義的特征集合為Sem(A),其元素個數(shù)為T,在經(jīng)過哈希函數(shù)索引后,以漢明距離dist為閾值進(jìn)行檢索,將漢明距離小于dist的特征集合Sem(H(A))作為檢索結(jié)果,其元素個數(shù)為G,S=Sem(A)∩Sem(H(A))表示檢索結(jié)果中與特征A語義相同的元素集合,其元素個數(shù)為H。召回率可表示為Recall=H/T,準(zhǔn)確率可表示為Precision=H/G。

        3.2 PMTH算法參數(shù)設(shè)置

        2.1節(jié)通過主元分析提取圖像的區(qū)分性特征維度d與當(dāng)前哈希編碼的位數(shù)L相等;在2.2節(jié)特征聚類量化預(yù)處理部分有兩個設(shè)置參數(shù),特征聚類迭代次數(shù)P和最佳的聚類組數(shù)k,經(jīng)過大量的重復(fù)性實驗,當(dāng)P∈(20,50)時,算法性能達(dá)到最佳,聚類組數(shù)k和相似簇ζ的值有關(guān),即:k=λζ,其中,λ為相似簇中相似類的個數(shù),也就是構(gòu)建哈希函數(shù)的組數(shù),對圖像進(jìn)行了10次以上的量化檢索實驗,在兼顧準(zhǔn)確率的同時,當(dāng)λ=3時,圖像召回率達(dá)到最佳。最后在2.4節(jié)哈希編碼的優(yōu)化階段,采用和ITQ算法一樣的迭代次數(shù)N=50。

        3.3 測試結(jié)果

        數(shù)據(jù)集Caltech-256、CIFAR-10的圖像特征分別為1 024維的CNN特征和512維的GIST特征。哈希編碼的位數(shù)一般不超過特征維數(shù),分別采用32 bit、64 bit、128 bit對圖像特征進(jìn)行漢明編碼。隨著漢明距離依次增加,得到圖5 P-R曲線,圖6 P-S曲線,圖7 R-S曲線和圖8 M-CL曲線。

        如圖5(a),(b)所示,在相同的召回率下,PMTH算法取得的準(zhǔn)確率更高。因為在訓(xùn)練哈希編碼前,首先獲取了圖像的區(qū)分性特征,并利用這些特征進(jìn)行聚類作為哈希投影矩陣的訓(xùn)練集,得到了判別性強(qiáng)的哈希函數(shù),提高了檢索的準(zhǔn)確率。另外,可以看出在CIFAR-10數(shù)據(jù)集下所有的方法實驗結(jié)果有明顯的下降,這是因為CIFAR-10數(shù)據(jù)集下的圖像本身比較復(fù)雜,但在相同的測試環(huán)境下,該方法均優(yōu)于其他的方法。

        如圖6(a),(b)所示,在Recall-Sample曲線這種評價標(biāo)準(zhǔn)下,PMTH算法優(yōu)于其他六種算法,隨著檢索樣本數(shù)量的增加PMTH算法召回的相似樣本數(shù)有了明顯的提升。這是因為在編碼位數(shù)相同的情況下,構(gòu)造了多組哈希碼索引表,在查詢過程中通過查詢多表的方式降低了相似樣本遺漏率。另外,在Caltech-256數(shù)據(jù)集下,當(dāng)檢索樣本數(shù)量相同時,召回率較ITQ算法提升不太明顯,這是因為當(dāng)前哈希編碼位數(shù)比較低,不能充分獲取原始高維圖像的區(qū)分性特征信息。

        如圖7(a),(b)所示,PMTH算法在Precision-Sample曲線上,其32 bit、64 bit和128 bit編碼性能都比其他六種算法要高。尤其在CIFAR-10數(shù)據(jù)集下,當(dāng)檢索樣本數(shù)一定時,其準(zhǔn)確率有了顯著提高,這是因為其原始圖像特征維度是Caltech-256數(shù)據(jù)集下,圖像特征維度的,即在相同位數(shù)編碼的情況下,能獲取到 CIFAR-10數(shù)據(jù)集圖像特征信息要比Caltech-256的要多。

        圖5(a) Caltech數(shù)據(jù)集下Precision-Recall測試

        圖5(b) CIFAR數(shù)據(jù)集下Precision-Recall測試

        圖6(a) Caltech數(shù)據(jù)集下Recall-Sample測試

        圖6(b) CIFAR數(shù)據(jù)集下Recall-Sample測試

        圖7(a) Caltech數(shù)據(jù)集下Precision-Sample測試

        圖7(b) CIFAR數(shù)據(jù)集下Precision-Sample測試

        圖8 Caltech和CIFAR數(shù)據(jù)集下平均準(zhǔn)確率測試

        如圖8所示,PMTH算法分別在32 bit、64 bit、128 bit和256 bit哈希編碼檢索的平均準(zhǔn)確率要高于比較的六種算法。這是因為充分利用了數(shù)據(jù)內(nèi)部的本質(zhì)結(jié)構(gòu)特征,抽取具有區(qū)分性的特征,并通過特征聚類后的數(shù)據(jù)訓(xùn)練哈希函數(shù),提高了樣本間的判別性。表1、表2分別為不同算法在Caltech-256和CIFAR-10數(shù)據(jù)集下的訓(xùn)練時間,每個算法分別在32 bit、64 bit和128 bit上進(jìn)行量化訓(xùn)練測試。最終,取10次量化結(jié)果的平均訓(xùn)練時間作為當(dāng)前編碼位的訓(xùn)練時間。測試平臺配置為Intel 2核2.53 GHz的CPU,4 GB的內(nèi)存,Matlab 2014。

        為了更為直觀地比較PMTH算法的性能,圖9為CIFAR-10下的64 bit哈希編碼可視化檢索結(jié)果比算法性能更好,驗證了算法的有效性。

        表1 Caltech-256數(shù)據(jù)集下,不同哈希編碼的訓(xùn)練時間

        表2 CIFAR10數(shù)據(jù)集下,不同哈希編碼的訓(xùn)練時間

        圖9 CIFAR數(shù)據(jù)集下可視化檢索測試

        4 結(jié)束語

        本文提出了一種基于主成分的多表圖像哈希檢索方法。利用主元分析提取了具有區(qū)分性強(qiáng)的主成分特征,并通過特征聚類訓(xùn)練學(xué)習(xí)多個哈希索引表,以此提高相似樣本的召回率,最后采用正交旋轉(zhuǎn)矩陣對哈希函數(shù)進(jìn)行優(yōu)化,提高了相同語義的樣本檢索的準(zhǔn)確率,實驗表明該方法是有效的。

        [1]Kullin H.Two Swedish eyes on media and public relations[EB/OL].(2010-09)[2010-11-16].http://www.kullin.net/2010/09/flickr-5-billion-photos/.Media Culpa.

        [2]Friedman J H,Bentley J L,F(xiàn)inkel R A.An algorithm for finding best matches in logarithmic expected time[J].ACM Transactions on Mathematical Software,1977,3(3):209-226.

        [3]Silpa-Anan C,Hartley R.Optimised KD-trees for fast image descriptor matching[C]//IEEE Conference on Computer Vision and Pattern Recognition,2008:1-8.

        [4]Ciaccia P,Patella M,Zezula P.M-tree:An efficient access method for similarity search in metric spaces[C]//International Conference on Very Large Data Bases,1997:426-435.

        [5]Beygelzimer A,Kakade S,Langford J.Cover trees for nearestneighbor[C]//Proceedings of the 23rd International Conference on Machine Learning,2006:97-104.

        [6]Uhlmann J K.Satisfying general proximity/similarity queries with metric trees[J].Information Processing Letters,1991,40(4):175-179.

        [7]Chum O,Philbin J,Isard M,et al.Scalable near identical image and shot detection[C]//Proceedings of the 6th ACM International Conference on Image and Video Retrieval,2007:549-556.

        [8]Andoni A,Indyk P.Efficient algorithms for substring near neighbor problem[C]//Proceedings of the Seventeenth AnnualACM-SIAM Symposium onDiscreteAlgorithm,Society for Industrial and Applied Mathematics,2006:1203-1212.

        [9]Kulis B,Grauman K.Kernelized locality-sensitive hashing for scalable image search[C]//IEEE 12th International Conference on Computer Vision,2010,30(2):2130-2137.

        [10]Price A L,Patterson N J,Plenge R M,et al.Principal components analysis corrects for stratification in genomewide association studies[J].Nature Genetics,2006,38(8):904-909.

        [11]Weiss Y,Torralba A,F(xiàn)ergus R.Spectral hashing[C]//Advances in Neural Information Processing Systems,2009:1753-1760.

        [12]Jin Z,Li C,Lin Y,et al.Density sensitive hashing[J].IEEE Transactions on Cybernetics,2014,44(8):1362-1371.

        [13]Gong Y,Lazebnik S,Gordo A,et al.Iterative quantization:A procrustean approach to learning binary codes for large-scale image retrieval[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2013,35(12):2916-2929.

        [14]Jégou H,Amsaleg L,Schmid C,et al.Query adaptative locality sensitive hashing[C]//IEEE International Conference on Acoustics,Speech and Signal Processing,2008:825-828.

        [15]Heo J P,Lee Y,He J,et al.Spherical hashing[C]//IEEE Conference on Computer Vision and Pattern Recognition,2012:2957-2964.

        猜你喜歡
        哈希投影檢索
        解變分不等式的一種二次投影算法
        基于最大相關(guān)熵的簇稀疏仿射投影算法
        2019年第4-6期便捷檢索目錄
        找投影
        找投影
        專利檢索中“語義”的表現(xiàn)
        專利代理(2016年1期)2016-05-17 06:14:36
        基于OpenCV與均值哈希算法的人臉相似識別系統(tǒng)
        基于維度分解的哈希多維快速流分類算法
        基于同態(tài)哈希函數(shù)的云數(shù)據(jù)完整性驗證算法
        一種基于Bigram二級哈希的中文索引結(jié)構(gòu)
        国产乱妇无乱码大黄aa片| 国产精品短视频| 岛国熟女一区二区三区| 蜜桃精品国产一区二区三区| 丝袜美腿视频一区二区 | 亚洲精品成人网久久久久久| 亚洲国产字幕| 久久精品国产亚洲av天美| 国产精品无码dvd在线观看| 国产剧情麻豆女教师在线观看| 野外三级国产在线观看| 亚洲国产成人无码电影| 亚洲一区免费视频看看| 不卡一本av天堂专区| 中文字幕网伦射乱中文| 天天影视色香欲综合久久| 亚洲天堂无码AV一二三四区| 国产成人av三级在线观看韩国| 亚洲女同一区二区| 护士奶头又白又大又好摸视频| 无码流畅无码福利午夜| 国产性虐视频在线观看| 中文字幕无码毛片免费看 | 亚洲第一页综合图片自拍| 妓院一钑片免看黄大片| 久久久久久久尹人综合网亚洲 | 国产精品一区二区av片| 国产精品自拍网站在线| 国产一区二区精品久久岳| 99久久精品国产成人综合| 国产亚洲精品日韩香蕉网| 国产黄久色一区2区三区| 人妻少妇偷人精品无码| 香蕉成人啪国产精品视频综合网| 热门精品一区二区三区| 欧美日韩在线视频| 午夜亚洲av永久无码精品| 自慰高潮网站在线观看| 亚洲黄色av一区二区三区| 97精品国产97久久久久久免费| 黄色网址国产|