亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于雙倍比特量化分類索引技術的圖像檢索研究

        2021-05-17 03:51:02魯明宋馥莉劉平勝蘭勇
        河南科技 2021年3期

        魯明 宋馥莉 劉平勝 蘭勇

        摘 要:本文對圖像數(shù)據(jù)進行雙倍比特量化分類,增強了每個維度數(shù)據(jù)的差異程度。為了最大限度地提升量化后的查詢精度,其間采用量化后比對結果和量化前的查詢數(shù)據(jù)進行非等距計算,提高索引的查詢精度。試驗證明,最近鄰查詢的準確率較傳統(tǒng)二進制映射中的雙倍比特量化大大提高了性能。

        關鍵詞:二進制量化;雙倍比特量化;加權距離度量

        中圖分類號:TP301.6文獻標識碼:A文章編號:1003-5168(2021)03-0015-04

        Research on Image Retrieval Based on Double Bit

        Quantitative Classification Index Technology

        LU Ming1 SONG Fuli1 LIU Pingsheng2 LAN Yong3

        (1. The Open University of Henan,Zhengzhou Henan 450008;2. Zhongshan Torch Polytechnic,Zhongshan Guangdong 528436;3. Tianjin University of Finance and Economics Pearl River College , Tianjin 301800)

        Abstract: In this paper, the double-bit quantization classification of image data had enhanced the degree of difference in data in each dimension. In the meantime, in order to maximize the query accuracy after quantification, the comparison result after quantization and the query data before quantification were used to perform non-equal distance calculations to improve the query accuracy of the index. Experiments showed that the accuracy of nearest neighbor query greatly improved the performance compared to the double-bit quantization in traditional binary mapping.

        Keywords: binary quantization;double bit quantization;weighted distance metric

        視覺圖像檢測[1]和圖像檢索[2-3]的核心工作存在相似性,二者都需要在高維數(shù)據(jù)庫中檢索和匹配相似的特征數(shù)據(jù)。它的目的是在大型高維數(shù)據(jù)庫中搜索相似的數(shù)據(jù)來查詢數(shù)據(jù)。最近鄰算法作為大型多維度數(shù)據(jù)庫的常用算法,其性能和效率問題愈發(fā)顯現(xiàn)[4]。

        1 概述

        針對最近鄰算法圖像檢索效率低的問題,本文在高維圖像檢索過程中引入了二進制編碼形式。二進制代碼是執(zhí)行效率最高的一種編碼形式,可以應用于圖像數(shù)據(jù)的二進制量化和索引技術[5]中。二進制量化是將圖像數(shù)據(jù)存儲格式中原始浮點相似的特征數(shù)據(jù)轉化映射為近似的二進制碼,然后針對生成的二進制代碼設計出高效快捷的圖像檢索算法,以適應大規(guī)模數(shù)據(jù)環(huán)境[6]下的圖像檢索需求。如圖1所示,本文提出了一種雙倍比特量化的索引查詢技術,具體創(chuàng)新主要有兩點。

        1.1 雙倍比特量化的方法

        將浮點高維特征空間投影到高維向量二元映射,屬性間的區(qū)別在于添加了中間高維向量空間,每一維的數(shù)據(jù)有兩位的二進制代碼。雙倍比特量化可以應用于不同的二進制量化技術、不同的類型和不同的尺寸特征。

        1.2 非對稱距離查詢算法

        對于每次查詢,可以在漢明最近鄰的空間選擇雙倍比特量化舉措,繼而在漢明最近鄰候選集空間通過浮點計算非對稱距離,對查詢函數(shù)(中間數(shù)據(jù))和二進制碼特征庫進行重新排序,從而提高查詢精度指標。

        本文使用的要領具有三個顯著優(yōu)勢。一是雙倍比特量化方法能夠高效降低量化耗損,提高查詢精度;二是雙倍比特量化和非對稱距離算法可以應用于現(xiàn)有的二進制量化和索引方法;三是雙倍比特量化易于實現(xiàn)?;鶞蕯?shù)據(jù)集試驗表明,雙倍比特量化方法可以使最近鄰查詢精度提升15%~25%。

        2 研究現(xiàn)狀

        2.1 二進制量化

        目前,研究者提出了很多著名的二進制映射方法,其主要分為兩類,即基于隨機的映射和基于學習的映射?;陔S機的映射主要有局部敏感哈希(LSH)和位置敏感聚類(Locality Sensitive Clustering, LSC)。LSH使用內積來比較兩個向量的相似程度,通過多元正態(tài)分布取得多個哈希函數(shù),并將其稀疏之特質映射到超平面。隨機映射與處理數(shù)據(jù)無關,處理速度快,但只有在維度足夠高時才有好的檢索效果?;趯W習的二進制映射技術在維度低的情況下能滿足查詢精度的要求,但試驗效率較低,而且中間向量的每一維數(shù)據(jù)在傳統(tǒng)的量化方法下只能被簡要地映射為兩類(為0或者1),這樣的量化方法不能很好地保持原始特征之間的相似關系。位置敏感聚類方法主要包括三部分:第一,生成位置敏感哈希函數(shù);第二,桶標記的產生,即利用位置敏感哈希函數(shù)對每個點進行映射得出桶標記;第三,桶標記的合并。由于桶標記的個數(shù)多于實際的類數(shù)目,需要選擇合適的合并區(qū)間對桶標記進行合并,合并后的桶標記對可用來對數(shù)據(jù)點進行分組,得出最終的類標簽。

        4.1 試驗設置

        試驗在BIGANN SIFT 1M和Caltech101兩個數(shù)據(jù)集上開展,如表2所示。試驗的硬件環(huán)境是Intel Xeon E5-2620*2(7.2 GT/s,2.00 GHz,15M cache,6cores),內存為64 GB。

        4.2 雙倍比特量化分類索引

        下面使用多種二進制映射方法來驗證本文所提二進制映射的優(yōu)化方法,包括局部敏感哈希(LSH)、主成分分析(PCA)和迭代量化(PCA-ITQ)。

        每個試驗包括1 000個查詢,以查詢的平均準確率和平均召回率當作性能指標來明確雙位量化。試驗在兩個數(shù)據(jù)集(BIGANN SIFT 1M和Caltech101)比照使用差異二進制映射方式。為了獲得雙倍二進制碼,訓練集中的高維特征被映射為中間數(shù)據(jù),并根據(jù)每個維度的正負符號獲得中值。繼而,以與訓練集相同的方式將特征庫中的特征和查詢特征變換為中間數(shù)據(jù),通過雙倍比特量化將數(shù)據(jù)轉化為二進制碼。最后,計算并查詢二進制碼與每個二進制碼的加權海明距離。在兩個數(shù)據(jù)集上,使用原始二進制映射算法和雙倍比特量化方法比較結果如表3和表4顯示。

        試驗結果表明,傳統(tǒng)二進制映射的性能有了很大的提高。在使用原始二進制映射算法時,數(shù)據(jù)集BIGANN 1M SIFT的結果(百分比)如表3所示。二進制代碼分別是32位、64位、128位和256位。二值投影算法分別為ITQ、RR、SH、LSH和PCA。T@1表示top-1的準確率,B@10表示top-10的召回率。SB代表單位量化,DB代表雙倍比特量化。

        在使用雙倍比特量化方法時,數(shù)據(jù)集Caltech GIST datasets的結果(百分比)如表4所示。二進制代碼分別為64位、128位、256位和320位。二進制投影算法分別是ITQ、RR、SH、LSH和PCA。T@1表示top-1的準確率,B@10表示top-10的召回率。SB代表單位量化,DB代表雙位量化。

        每個試驗有1 000個查詢。本研究只對結果進行了重新排序,召回率仍舊保持固定不變,所以本試驗以準確率作為檢測指標。在兩個有差別的數(shù)據(jù)集(BIGANN SIFT 1M和Caltech101)中,本文使用不同的二值映射方式,結果發(fā)現(xiàn),使用不對稱距離進行重新排序的結果優(yōu)于直接獲取的成果。

        5 結論

        在大規(guī)模數(shù)據(jù)環(huán)境下進行快速最近鄰查詢時,需要量化普通二進制數(shù)據(jù),但是查詢信息的原始特征信息弱化會導致查詢精度降低。研究者充分利用二進制運算規(guī)則簡單、適于邏輯運算的特點,提出了一種雙倍比特量化分類索引方法,解決了該問題。本文對量化分類后的二進制數(shù)據(jù)和查詢信息未量化前的數(shù)據(jù)進行距離計算,大大提高了查詢的精度和準確性。大數(shù)據(jù)集試驗證明,該方法可以提升15%~25%的最近鄰查詢精度。

        參考文獻:

        [1]賈佳,唐勝,謝洪濤,等.移動視覺搜索綜述[J].計算機輔助設計與圖形學學報,2017(6):1007-1021.

        [2]RUBLEE E,RABAUD V,KONOLIGE K,et al.ORB:an efficient alternative to SIFT or SURF[C]//International Conference on Computer Vision.2012.

        [3]ZITNICK C L.Binary Coherent Edge Descriptors[C]//European Conference on Computer Vision,2010.

        [4]馬艷萍,姬光榮,鄒海林,等.數(shù)據(jù)依賴的多索引哈希算法[J].西安電子科技大學學報,2015(4):159-164.

        [5]李雯,鄧涵,許玉珍.基于雙倍比特量化與分段哈希索引的軍事圖像過濾[J].航天控制,2019(4):59-65.

        [6]宋馥莉,閆培玲.雙倍比特量化近似查詢索引算法研究[J].河南科技,2019(25):28-31.

        亚洲福利一区二区不卡| 日本一区二区不卡视频| 日本一区二区三区激情视频| 中文字幕一区二区人妻在线不卡| 无遮挡很爽视频在线观看| 丝袜美腿在线观看视频| 亚洲精品国偷拍自产在线| 蜜臀av 国内精品久久久| 久久久久久亚洲AV成人无码国产 | 免费a级作爱片免费观看美国 | 亚洲一区精品无码| 国产精品_国产精品_k频道| 91天堂素人精品系列全集亚洲| 色综合999| 国产夫妻自偷自拍第一页| 欧美日韩午夜群交多人轮换 | 亚洲熟女乱色一区二区三区| 四虎成人精品国产一区a| 国产美女冒白浆视频免费| 一本到在线观看视频| 黄色视频免费在线观看| 国内精品久久久久国产盗摄| 亚洲a级视频在线播放| 国产精品办公室沙发| 夜夜揉揉日日人人| 亚洲av综合日韩精品久久久| 日本最新视频一区二区| 免费a级毛片无码免费视频120软件| 亚洲欧洲无码一区二区三区| 精品久久杨幂国产杨幂| 亚洲24小时免费视频| 亚洲av精品一区二区三区| 精品久久久久久久久久久aⅴ| 国产成人亚洲合集青青草原精品| 女同性恋一区二区三区四区| 亚洲中文字幕精品乱码2021| 少妇久久久久久被弄到高潮| 成人午夜视频一区二区无码| 熟女少妇精品一区二区三区| 免费超爽大片黄| 在线播放a欧美专区一区|