哈希
- 自適應(yīng)高效深度跨模態(tài)增量哈希檢索算法
有學(xué)者提出了基于哈希編碼的跨模態(tài)檢索算法,該算法存儲(chǔ)開銷小、檢索速度快以及適合大規(guī)模數(shù)據(jù)的跨模態(tài)檢索任務(wù)?;?span id="0om0kai" class="hl">哈希編碼的跨模態(tài)檢索算法將高維數(shù)據(jù)映射為低維的二進(jìn)制表示,然后采用異或操作來(lái)進(jìn)行相似性距離度量,實(shí)現(xiàn)高效的大規(guī)模數(shù)據(jù)檢索。盡管現(xiàn)階段提出了大量的深度哈希算法,但幾乎所有的哈希算法無(wú)法較好地檢索訓(xùn)練數(shù)據(jù)類別以外的數(shù)據(jù),當(dāng)加入新類別的數(shù)據(jù)(即,訓(xùn)練數(shù)據(jù)類別并未完全包含查詢數(shù)據(jù)類別加入)時(shí),需要重新訓(xùn)練哈希函數(shù),并為數(shù)據(jù)庫(kù)中的數(shù)據(jù)生成新的哈希碼,這對(duì)于大
計(jì)算機(jī)工程與應(yīng)用 2023年2期2023-01-29
- 基于有序哈希鏈的文件數(shù)據(jù)同步方法
時(shí)仍存在使用大量哈希算法的問(wèn)題。IRMAK 等[9]提出一種基于冗余碼的新方法,通過(guò)對(duì)單輪協(xié)議的文件進(jìn)行同步,以顯著地改進(jìn)Rsync 算法。盡管這些方法都在實(shí)踐中對(duì)Rsync 進(jìn)行改進(jìn)以提升同步效率,但是都未從根本上減少同步過(guò)程中時(shí)間和資源的消耗。現(xiàn)有的大多數(shù)同步算法需要逐個(gè)對(duì)文件瀏覽對(duì)比并進(jìn)行差異計(jì)算,增加了性能消耗,以及缺少一致性承諾,無(wú)法快速判斷文件庫(kù)是否產(chǎn)生新變動(dòng)和同步完全。在對(duì)文件進(jìn)行查找比對(duì)和同步后,現(xiàn)有算法未對(duì)操作狀態(tài)和更新結(jié)果進(jìn)行備份[10
計(jì)算機(jī)工程 2023年1期2023-01-27
- 基于圖論的視覺顯著模型的圖像哈希算法
36037)圖像哈希又被稱為圖像摘要或圖像指紋,可以用一段序列表示圖像信息,它通常被用來(lái)檢測(cè)網(wǎng)絡(luò)空間中有許多熱門事件的圖像副本,還被廣泛應(yīng)用于圖像索引、圖像質(zhì)量評(píng)價(jià)、圖像檢索、圖像取證等方面。圖像哈希算法可以將任意一幅圖像映射成一串短小的字符序列或者數(shù)字。通常,圖像哈希算法需要具備兩個(gè)基本性質(zhì):魯棒性和唯一性。魯棒性是指哈希算法需要具備抵抗圖像壓縮、圖像增強(qiáng)、噪聲干擾等正常數(shù)字操作的能力。這是因?yàn)榻?jīng)歷這些操作后的圖像,其視覺內(nèi)容與原圖像基本一致,圖像哈希應(yīng)
- 基于多級(jí)索引的高維數(shù)據(jù)近似最近鄰搜索
性能仍不夠理想。哈希搜索的精確、高效性,使其逐步發(fā)展為近似最近鄰查詢問(wèn)題的有效方法之一,對(duì)于高維數(shù)據(jù)近似最近鄰搜索,距離敏感哈希算法運(yùn)用廣泛,為優(yōu)化該算法存在的搜索穩(wěn)定性較差問(wèn)題,引入能將若干索引方法組合使用的多級(jí)索引方法,提出基于多級(jí)索引的高維數(shù)據(jù)近似最近鄰搜索算法,通過(guò)二級(jí)距離敏感哈希,實(shí)現(xiàn)高維數(shù)據(jù)近似最近鄰搜索。2 基于多級(jí)索引的高維數(shù)據(jù)近似最近鄰搜索算法2.1 近似最近鄰查詢近似最近鄰查詢?cè)诟呔S數(shù)據(jù)處理中運(yùn)用廣泛,數(shù)據(jù)集和查詢點(diǎn)定義同上,近似比率用
計(jì)算機(jī)仿真 2022年11期2022-12-24
- 一種基于移位取反和加法的字符串哈希算法*
數(shù)據(jù)處理技術(shù)中,哈希算法將任意長(zhǎng)度數(shù)據(jù)塊映射為較短的固定長(zhǎng)度的二進(jìn)制值,即哈希值。只要是更改數(shù)據(jù)塊的任何字節(jié),都會(huì)產(chǎn)生不同的哈希值,反向找到同一哈希值的不同輸入,在計(jì)算上代價(jià)巨大。因此,哈希算法廣泛應(yīng)用在數(shù)據(jù)的完整性檢驗(yàn)、數(shù)據(jù)快速查找、構(gòu)造安全的數(shù)據(jù)結(jié)構(gòu)等。哈希算法的實(shí)現(xiàn)方式有加減法、位運(yùn)算、乘法除法、查表、混合實(shí)現(xiàn)等,不同實(shí)現(xiàn)方式在運(yùn)行速度和哈希效果上有所差異。比較常見的算法有MD5、SHA-1、BKDRHash、APHash 等。不同的哈希算法有不同的
計(jì)算機(jī)時(shí)代 2022年11期2022-11-10
- 標(biāo)簽松弛回歸的跨模態(tài)哈希檢索
執(zhí)行精確搜索.而哈希技術(shù)的出現(xiàn)大大降低了檢索時(shí)間與存儲(chǔ)成本,由于其在跨模態(tài)檢索中的高效率和高準(zhǔn)確率,因此在近年來(lái)也引起了廣泛的關(guān)注與應(yīng)用.哈希學(xué)習(xí)是將實(shí)例的數(shù)據(jù)點(diǎn)編碼成二進(jìn)制碼,即哈希碼,以此原始特征之間的距離可以用漢明距離來(lái)計(jì)算.而待檢索的樣本則通過(guò)哈希函數(shù)將原始特征向量映射到漢明空間中,并通過(guò)漢明距離進(jìn)行相似性檢索.這樣,哈希碼能減少存儲(chǔ)量并通過(guò)位操作來(lái)提高檢索速度,因此哈希檢索技術(shù)還具有高效性和靈活性的特點(diǎn).最早出現(xiàn)的哈希方法是單模態(tài)哈希方法[4-6
小型微型計(jì)算機(jī)系統(tǒng) 2022年10期2022-10-15
- 支持分頁(yè)顯存的高性能哈希表索引系統(tǒng)①
049)1 引言哈希表(hash table), 也稱散列表, 是一種根據(jù)關(guān)鍵碼值技術(shù)(key value)來(lái)為大規(guī)模數(shù)據(jù)提供直接訪問(wèn)操作的數(shù)據(jù)結(jié)構(gòu), 其通過(guò)將關(guān)鍵碼值映射到表中的一個(gè)位置來(lái)訪問(wèn)記錄數(shù)據(jù), 以O(shè)(1)時(shí)間復(fù)雜度來(lái)加快數(shù)據(jù)查找速度. 哈希表作為一種廣泛采用的基礎(chǔ)數(shù)據(jù)結(jié)構(gòu)和核心算法, 為程序提供對(duì)各類數(shù)據(jù)(文本、流媒體、結(jié)構(gòu)型數(shù)據(jù)等)高吞吐、低時(shí)延的增刪查改操作. 隨著數(shù)據(jù)規(guī)模的不斷擴(kuò)大和各類應(yīng)用對(duì)高性能的需求, 哈希表技術(shù)在當(dāng)前數(shù)據(jù)庫(kù)軟件、系
計(jì)算機(jī)系統(tǒng)應(yīng)用 2022年9期2022-09-20
- 標(biāo)簽局部結(jié)構(gòu)保持的離散哈希方法
們的需求,跨模態(tài)哈希檢索技術(shù)因其檢索效率高、存儲(chǔ)成本低而使其廣受關(guān)注[1-3].源模態(tài)數(shù)據(jù)轉(zhuǎn)換為二進(jìn)制哈希碼后能大幅度降低存儲(chǔ)開銷,并且哈希碼之間的硬件級(jí)異或操作也提高了漢明空間[4,5]中的搜索效率.早期的許多工作都只關(guān)注單一模態(tài)[6,7],即查詢和搜索結(jié)果處于同一模態(tài).近年來(lái),跨模態(tài)哈希研究成為熱點(diǎn).跨模態(tài)哈希檢索又可分為無(wú)監(jiān)督和有監(jiān)督方法兩個(gè)大類.無(wú)監(jiān)督跨模態(tài)哈希的重點(diǎn)是利用不同模態(tài)數(shù)據(jù)的特征信息來(lái)尋找模態(tài)之間的相關(guān)性.其中跨模態(tài)哈希(IMH)[8]
小型微型計(jì)算機(jī)系統(tǒng) 2022年5期2022-05-10
- 基于D維映射的布谷鳥哈希表
可或缺的一部分。哈希表是根據(jù)鍵(key)而直接訪問(wèn)內(nèi)存存儲(chǔ)位置的數(shù)據(jù)結(jié)構(gòu),能夠支持快速查詢,被廣泛應(yīng)用于數(shù)據(jù)挖掘、數(shù)據(jù)庫(kù)、存儲(chǔ)、網(wǎng)絡(luò)等各個(gè)領(lǐng)域[3-6]。但當(dāng)負(fù)載較高時(shí),哈希沖突會(huì)頻繁發(fā)生,為了更好地解決沖突,誕生了許多解決方案和哈希表存儲(chǔ)結(jié)構(gòu)。線性探查法(Linear Hash)和雙重哈希函數(shù)法(Double Hash)是傳統(tǒng)解決哈希沖突方法中的開放尋址法,但其需要額外的時(shí)間和資源來(lái)解決沖突,會(huì)影響插入和查找的性能。經(jīng)典哈希表數(shù)據(jù)結(jié)構(gòu)還包括鏈?zhǔn)?span id="emyucgk" class="hl">哈希表(L
- 基于非對(duì)稱監(jiān)督深度離散哈希的圖像檢索
的ANN技術(shù)中,哈希以其快速的查詢速度和較低的內(nèi)存成本成為最受歡迎和有效的技術(shù)之一。哈希方法[2,3]的目標(biāo)是將多媒體數(shù)據(jù)從原來(lái)的高維空間轉(zhuǎn)換為緊湊的漢明空間,同時(shí)保持?jǐn)?shù)據(jù)的相似性。這些二進(jìn)制哈希碼不僅可以顯著降低存儲(chǔ)成本,在信息搜索中實(shí)現(xiàn)恒定或次線性的時(shí)間復(fù)雜度,而且可以保持原有空間中存在的語(yǔ)義結(jié)構(gòu)?,F(xiàn)有的哈希方法大致可分為兩類:獨(dú)立于數(shù)據(jù)的哈希方法和依賴于數(shù)據(jù)的哈希方法。局部敏感哈希(Locality Sensitive Hashing, LSH)[4
電子與信息學(xué)報(bào) 2021年12期2022-01-04
- 基于特征選擇的局部敏感哈希位選擇算法
能快速下降。基于哈希的搜索算法在數(shù)據(jù)規(guī)模與數(shù)據(jù)維度很大時(shí)仍具有高效的檢索性能,且其時(shí)間、空間復(fù)雜度較低,因此該算法成為主流的檢索算法之一[5-6]。在基于哈希的檢索方法中,局部敏感哈希(locality-sensitive hashing,LSH)算法[6-8]是有代表性的算法之一。LSH會(huì)隨機(jī)生成一組哈希函數(shù),每一個(gè)哈希函數(shù)生成一個(gè)對(duì)應(yīng)二值哈希位,將由多個(gè)哈希位組成的編碼稱為哈希碼。LSH將原空間中的數(shù)據(jù)點(diǎn)映射成哈希碼,使得相似度越高的數(shù)據(jù)具有相同哈希碼
大數(shù)據(jù) 2021年6期2021-11-22
- 基于抗幾何變換的離散深度哈希算法
泛的應(yīng)用[1]。哈希技術(shù)由于其低存儲(chǔ)量和快速檢索速度而成為近似最近鄰搜索方法中最重要的技術(shù)之一。哈希方法的目標(biāo)是找到一個(gè)映射函數(shù)可以將每個(gè)樣本編碼成哈希碼,同時(shí)保持原始樣本的相似性[2]?,F(xiàn)有的哈希方法主要分為兩類:數(shù)據(jù)獨(dú)立的哈希方法和數(shù)據(jù)依賴的哈希方法。數(shù)據(jù)獨(dú)立的哈希方法是在不使用訓(xùn)練數(shù)據(jù)的情況下,利用隨機(jī)投影實(shí)現(xiàn)有效哈希函數(shù)學(xué)習(xí),其典型代表是位置敏感哈希(LSH)[1],此類方法在針對(duì)較長(zhǎng)哈希碼時(shí)效果良好,但需要大量存儲(chǔ)[3]。鑒于此問(wèn)題,學(xué)者們又開發(fā)
西安理工大學(xué)學(xué)報(bào) 2021年2期2021-09-03
- 深度優(yōu)先局部聚合哈希
NN 搜索技術(shù),哈希方法(Hashing)[3]將數(shù)據(jù)轉(zhuǎn)換為緊湊的二進(jìn)制編碼(哈希編碼)表示,同時(shí)保證相似的數(shù)據(jù)對(duì)生成相似的二進(jìn)制編碼.利用哈希編碼來(lái)表示原始數(shù)據(jù),顯著減少了數(shù)據(jù)的存儲(chǔ)和查詢開銷,從而可以應(yīng)對(duì)大規(guī)模數(shù)據(jù)中的檢索問(wèn)題.因此,哈希方法吸引了越來(lái)越多學(xué)者的關(guān)注.當(dāng)前哈希方法主要分為兩類:數(shù)據(jù)獨(dú)立的哈希方法和數(shù)據(jù)依賴的哈希方法,這兩類哈希方法的區(qū)別在于哈希函數(shù)是否需要訓(xùn)練數(shù)據(jù)來(lái)定義.局部敏感哈希(Locality Sensitive Hashing
- 基于點(diǎn)對(duì)相似度的深度非松弛哈希算法
到低維二值空間的哈希學(xué)習(xí)方法.哈希學(xué)習(xí)方法是一種在保持圖像或視頻等高維數(shù)據(jù)間相似性的條件下,通過(guò)哈希函數(shù)或函數(shù)簇將高維空間的數(shù)據(jù)投影到低維漢明空間的二值編碼的機(jī)器學(xué)習(xí)方法.通過(guò)哈希學(xué)習(xí)方法對(duì)數(shù)據(jù)建立索引,提高圖像等高維數(shù)據(jù)的檢索效率,并節(jié)省存儲(chǔ)空間.現(xiàn)有的哈希方法大致可以分為兩類:數(shù)據(jù)獨(dú)立的方法和數(shù)據(jù)依賴的方法[1].數(shù)據(jù)獨(dú)立的方法使用隨機(jī)投影來(lái)構(gòu)造哈希函數(shù).局部敏感哈希(Locality sensitive hashing,LSH)算法[2-4]于199
自動(dòng)化學(xué)報(bào) 2021年5期2021-06-20
- 捕獲局部語(yǔ)義結(jié)構(gòu)和實(shí)例辨別的無(wú)監(jiān)督哈希?
檢索的手段之一,哈希技術(shù)近年來(lái)得到了突飛猛進(jìn)的發(fā)展.從原理上來(lái)講,哈希方法通常將高維連續(xù)空間的數(shù)據(jù)(例如圖像、視頻、文本等)映射到一個(gè)低維的二進(jìn)制空間中(也就是,哈希空間),如圖1 所示.在映射的過(guò)程中,期望在哈希空間中能夠保持原始空間的信息.由于使用二進(jìn)制編碼對(duì)數(shù)據(jù)進(jìn)行特征表示,哈希方法可以極大地減少存儲(chǔ)代價(jià)以及計(jì)算復(fù)雜度,并因此可以快速地對(duì)大規(guī)模數(shù)據(jù)集進(jìn)行檢索查詢.因此,哈希方法可以被視為一種支持大規(guī)模數(shù)據(jù)檢索的高效特征學(xué)習(xí)的新技術(shù).由于其具有廣泛的潛
軟件學(xué)報(bào) 2021年3期2021-05-23
- 哈希值處理 功能全面更易用
年第19期《文件哈希值處理一條龍》一文介紹過(guò)另一個(gè)哈希值處理軟件Hasher,但該軟件不具備右鍵調(diào)用的功能。此外,2020年第12期“傻博士”欄目中介紹過(guò)一個(gè)哈希值查看的文件“屬性”擴(kuò)展OpenHashTab,但需要先進(jìn)入“屬性”窗口才能查看,不太方便。我們先到“https:∥www.binarvfortress.com/HashTools/Download/”下載HashTooIs。該頁(yè)面中提供安裝版和綠色便攜版的下載,我們以使用綠色便攜版為例。1.哈希
電腦愛好者 2021年8期2021-04-21
- 在線哈希算法研究綜述
7]檢索。學(xué)習(xí)型哈希[8-9]通過(guò)將數(shù)據(jù)表示為緊湊的二進(jìn)制碼形式,很方便地使用異或運(yùn)算快速計(jì)算數(shù)據(jù)間相似度,將原樣本空間相似的兩個(gè)數(shù)據(jù)點(diǎn)映射到海明空間里接近的兩個(gè)點(diǎn)。學(xué)習(xí)型哈希不僅能大大減少數(shù)據(jù)的存儲(chǔ)空間和運(yùn)算開銷,還能降低數(shù)據(jù)維度,從而顯著提高大數(shù)據(jù)學(xué)習(xí)系統(tǒng)的效率。在線學(xué)習(xí)型哈希算法的關(guān)系如圖1 所示。本文首先介紹了學(xué)習(xí)型哈希算法的原理;然后介紹了在線哈希的難點(diǎn)以及在線哈希學(xué)習(xí)所采取的不同方式,隨后討論在線哈希的各種算法的發(fā)展?fàn)顩r并總結(jié),對(duì)在線哈希未來(lái)發(fā)
計(jì)算機(jī)應(yīng)用 2021年4期2021-04-20
- “雙料”工具 讓哈希值處理更便捷
的一種特殊代碼,哈希值的具體內(nèi)容在此前的文章中有過(guò)介紹,這里不再贅述。下面我們重點(diǎn)講述Hash It軟件(下載地址:https://www.trishtech.com/downloads/hash_it_101.zip)在哈希值的生成、校驗(yàn)、右鍵集成、取消集成等方面的用法。1.哈希值的生成與校驗(yàn)Hash It必須要以管理員身份運(yùn)行,右鍵單擊下載的HashIt.exe程序,然后選擇“以管理員身份運(yùn)行”(圖1)。在打開的程序窗口中,點(diǎn)擊“File”右邊的三點(diǎn)式
電腦愛好者 2021年5期2021-03-10
- Windows哈希值處理不犯難
文件Hash”的哈希值處理方法。2018年第23期《實(shí)用簡(jiǎn)單的PowerShell命令》一文介紹過(guò)用PowerShell命令來(lái)生成文件哈希值的方法。此外,2020年第17期的文章《“真?zhèn)巍绷⒈姹容^文件的哈希值》介紹了另一個(gè)哈希值比較軟件HashMyFiles??勺鲄⒖?。小提示上述選項(xiàng)卡中可顯示的哈希值不僅僅是默認(rèn)的三種,點(diǎn)擊“選項(xiàng)”,進(jìn)入選項(xiàng)窗口,可添加更多類型的哈希值項(xiàng)目(圖2)。我們可以利用名為“HashTab Shell Extension”的系統(tǒng)插
電腦愛好者 2021年1期2021-01-13
- 哈希算法在電子數(shù)據(jù)取證中的應(yīng)用研究
冠網(wǎng)絡(luò)犯罪與取證哈希算法在電子數(shù)據(jù)取證中的應(yīng)用研究◆王冠(遼寧警察學(xué)院公安信息系 遼寧 116036)哈希在電子數(shù)據(jù)取證中具有重要的作用,可以保證電子數(shù)據(jù)的完整性和真實(shí)性。通過(guò)分析哈希算法的特點(diǎn),實(shí)驗(yàn)驗(yàn)證Word文件的修改時(shí)間對(duì)完整性校驗(yàn)的影響。提出把哈希庫(kù)看作一種廣義上的關(guān)鍵字搜索,以及哈希算法在電子數(shù)據(jù)提取與司法鑒定階段中的作用。哈希;電子數(shù)據(jù)取證1 哈希算法介紹Hash(通常翻譯為散列,或音譯為哈希),是把任意長(zhǎng)度的輸入數(shù)據(jù)通過(guò)散列算法,經(jīng)過(guò)壓縮映射
網(wǎng)絡(luò)安全技術(shù)與應(yīng)用 2020年11期2020-11-14
- 文件哈希值處理一條龍
面。要計(jì)算文件的哈希值,首先拖動(dòng)文件或文件夾到軟件窗口,軟件會(huì)自動(dòng)計(jì)算哈希值,窗口中便會(huì)顯示文件的大小、日期的屬性,同時(shí)在下方列出CRC32、MD5、SHA256等10種不同類型的哈希值(圖1)。在每種哈希值的右側(cè),均有兩個(gè)按鈕,第一個(gè)按鈕可將本條哈希值復(fù)制到剪切板上,而第二個(gè)按鈕能啟動(dòng)哈希值比較窗口,比較窗口中下方的哈希值是軟件自動(dòng)提取的值。在“您的哈希”中輸入文件說(shuō)明資料中給出的哈希值(如下載軟件時(shí)給出的哈希值),如果右側(cè)的按鈕變成綠色對(duì)鉤狀,則說(shuō)明哈
電腦愛好者 2020年20期2020-10-22
- 基于剛性內(nèi)存的區(qū)塊鏈協(xié)議改進(jìn)
協(xié)議要求有效塊的哈希值小于預(yù)定的閾值[7]。每個(gè)礦工通過(guò)調(diào)整哈希函數(shù)的輸入值(在區(qū)塊中稱為nonce)進(jìn)行有效區(qū)塊的計(jì)算[8]。獲取有效區(qū)塊后,礦工將廣播該區(qū)塊到整個(gè)網(wǎng)絡(luò),其他礦工在驗(yàn)證該區(qū)塊的有效性后停止當(dāng)前高度的區(qū)塊挖掘[9]。在傳統(tǒng)區(qū)塊鏈中,除了創(chuàng)世區(qū)塊外,每個(gè)區(qū)塊的區(qū)塊頭均包含其父區(qū)塊的哈希值。每個(gè)新區(qū)塊的生成方式都是通過(guò)更改隨機(jī)數(shù),并不斷計(jì)算其區(qū)塊頭的哈希值,直到其小于當(dāng)前難度。因此,挖掘只是一個(gè)純粹的計(jì)算過(guò)程。計(jì)算速度越快,挖掘出新區(qū)塊的可能性
網(wǎng)絡(luò)與信息安全學(xué)報(bào) 2020年5期2020-10-21
- “真?zhèn)巍绷⒈姹容^文件的哈希值
動(dòng)地顯示該文件的哈希值。有些下載網(wǎng)站提供的是SHA1的哈希值,為了方便比對(duì),避免由于字母大小寫(如0和o、l和1)造成識(shí)別錯(cuò)誤,我們?cè)诠ぞ邫谏弦来吸c(diǎn)擊“選項(xiàng)→以大寫字母顯示哈希值”,接著在程序窗口中用鼠標(biāo)右鍵點(diǎn)擊需要核驗(yàn)的文件,在彈出的菜單中選擇“復(fù)制SHA1校驗(yàn)碼”(圖2)。然后將網(wǎng)站提供的哈希值和上述復(fù)制的哈希值都粘貼到記事本中進(jìn)行比對(duì)即可。如果想要快速地校驗(yàn)多個(gè)文件,還可以使用命令行的方式。比如需要將A電腦的“C:\Users\cfan\Downlo
電腦愛好者 2020年17期2020-09-14
- 基于高階統(tǒng)計(jì)信息的深度哈希學(xué)習(xí)模型
之一[1-2],哈希方法由于其特有的高查詢速度和低存儲(chǔ)代價(jià)而被廣泛應(yīng)用于ANN檢索領(lǐng)域?,F(xiàn)有的哈希學(xué)習(xí)方法大致可以分為兩類,即數(shù)據(jù)獨(dú)立哈希和數(shù)據(jù)相關(guān)哈希[3-4]。其中,數(shù)據(jù)獨(dú)立哈希在訓(xùn)練過(guò)程中通常不依賴任何數(shù)據(jù)集,其采用隨機(jī)映射的方式進(jìn)行哈希映射函數(shù)的學(xué)習(xí),而數(shù)據(jù)相關(guān)哈希通過(guò)訓(xùn)練數(shù)據(jù)集以學(xué)習(xí)哈希函數(shù),因此其又被稱為學(xué)習(xí)哈希(Learning to Hash,L2H)[5]。根據(jù)是否利用訓(xùn)練樣本的監(jiān)督信息,學(xué)習(xí)哈希又可以進(jìn)一步分為監(jiān)督哈希、半監(jiān)督哈希和無(wú)監(jiān)
計(jì)算機(jī)工程 2020年7期2020-07-17
- Lorenz混沌系統(tǒng)的BLAKE哈希算法
22)0 引 言哈希函數(shù)是現(xiàn)代密碼學(xué)中一類重要的基礎(chǔ)密碼算法,它將任意長(zhǎng)度的數(shù)據(jù)輸入經(jīng)過(guò)變化得到固定長(zhǎng)度的哈希值,在密碼協(xié)議、數(shù)字簽名、完整性認(rèn)證等領(lǐng)域具有廣泛應(yīng)用。作為消息摘要函數(shù)標(biāo)準(zhǔn)SHA-3的第二輪候選算法,BLAKE哈希算法[1]運(yùn)算速度快且安全性高。近年來(lái),其相關(guān)密碼攻擊正被逐漸重視。Aumasson等[2]給出BLAKE-256壓縮函數(shù)中間4輪的幾乎碰撞攻擊。Biryukov等[3]對(duì)BLAKE的7輪壓縮函數(shù)和8輪置換函數(shù)進(jìn)行了攻擊,Dunke
黑龍江科技大學(xué)學(xué)報(bào) 2020年3期2020-07-13
- 基于深度卷積神經(jīng)網(wǎng)絡(luò)與哈希的圖像檢索
逐步提升。而基于哈希的圖像檢索方法可以降低搜索的空間復(fù)雜度與時(shí)間復(fù)雜度,其將圖像的高維的特征表示映射為緊致的二維碼,實(shí)現(xiàn)了數(shù)據(jù)降維并能在低維空間內(nèi)進(jìn)行度量運(yùn)算[3]。本文提出了一種基于深度卷積神經(jīng)網(wǎng)絡(luò)來(lái)學(xué)習(xí)二進(jìn)制哈希編碼的模型,它結(jié)合了深度卷積神經(jīng)網(wǎng)絡(luò)和哈希算法的優(yōu)勢(shì)。首先在深度卷積神經(jīng)網(wǎng)絡(luò)中添加了用于生成哈希碼的哈希層,并將兩個(gè)完全連接層直接連接到哈希層;其次將輸入哈希層的特征表示先分割再映射成對(duì)應(yīng)哈希碼;最后在損失函數(shù)中加入分類誤差與量化誤差。在CIF
計(jì)算機(jī)工程與設(shè)計(jì) 2020年3期2020-04-24
- 無(wú)鑰簽名基礎(chǔ)設(shè)施及檔案領(lǐng)域應(yīng)用介紹
所謂的單向無(wú)沖突哈希函數(shù),是公開、標(biāo)準(zhǔn)化且不涉及任何密鑰的數(shù)據(jù)轉(zhuǎn)換模式。無(wú)鑰簽名可以實(shí)現(xiàn)同一時(shí)間簽名多份文件。簽名過(guò)程包括以下幾個(gè)步驟:(1)哈希:對(duì)要簽名的文檔進(jìn)行哈希運(yùn)算,哈希值代表該文檔用于之后的流程;(2)聚合:每次簽名創(chuàng)建一個(gè)全球的臨時(shí)哈希樹,代表本次簽名的所有文檔。每次持續(xù)時(shí)間可能不同,在實(shí)際中,它被固定為一秒鐘;(3)發(fā)布:每次聚合樹的前3 個(gè)哈希值被收集到永久哈希樹(所謂的日歷哈希鏈)中,并且該樹的頂部哈希值作為信任錨發(fā)布。要在實(shí)際中使用此
電子技術(shù)與軟件工程 2020年8期2020-04-23
- 基于深度學(xué)習(xí)哈希算法的快速圖像檢索研究?
方法[1]、基于哈希的圖像檢索方法[2],其中,經(jīng)典的哈希方法是局部敏感哈希方法(Locality Sensitive Hashing,LSH)[3]和基于向量量化的圖像檢索方法[4]。相比基于樹結(jié)構(gòu)的圖像檢索方法和基于向量量化的圖像檢索方法,哈希技術(shù)將圖像的高維特征保持相似性的映射為緊致的二進(jìn)制哈希碼。由于二進(jìn)制哈希碼在漢明距離計(jì)算上的高效性和存儲(chǔ)空間上的優(yōu)勢(shì)[5],哈希碼在大規(guī)模相似圖像檢索中非常高效。近幾年研究者們對(duì)基于CNN的深度哈希算法提出了多種
計(jì)算機(jī)與數(shù)字工程 2019年12期2019-12-27
- 基于卷積神經(jīng)網(wǎng)絡(luò)的圖像搜索技術(shù)研究
處理.為此,基于哈希編碼的圖像搜索方法被提出來(lái)了.哈希編碼可以將表示圖像的高維向量表示成二進(jìn)制碼的形式,每一個(gè)圖像都有自己獨(dú)一無(wú)二的哈希碼,我們通過(guò)這個(gè)編碼就可以快速找到相關(guān)圖像并比較出圖像間的相似程度.哈希編碼能夠降低數(shù)據(jù)維度,減少數(shù)據(jù)的存儲(chǔ)和搜索代價(jià),從而顯著提高檢索系統(tǒng)的效率.因此,成為了圖像搜索領(lǐng)域的一個(gè)研究熱點(diǎn).現(xiàn)在主流的哈希算法是將圖像檢索系統(tǒng)中的表征圖像特征的高維向量,通過(guò)哈希函數(shù)映射成簡(jiǎn)潔的二進(jìn)制的哈希碼并構(gòu)建哈希表,而圖像間的相似度可以直
- Sliding mode control design for oblique wing aircraft in wing skewing process
.本文中我們采用哈希算法,主要的過(guò)程為:發(fā)送方采用單向哈希函數(shù)對(duì)消息進(jìn)行計(jì)算,得到摘要并發(fā)送消息和摘要。接收方將接收到的消息,按同樣方式進(jìn)行哈希函數(shù)計(jì)算,并將新得出的結(jié)果與發(fā)送方的原摘要結(jié)果進(jìn)行比對(duì)。如結(jié)果一致,說(shuō)明消息完整。在本系統(tǒng)中,摘要信息的不可變,保證了需要存證信息的完整性和真實(shí)性。將需要存證的電子數(shù)據(jù)放在區(qū)塊鏈中,避免數(shù)據(jù)被惡意篡改。(2)The outer-loop control model generates the input comma
CHINESE JOURNAL OF AERONAUTICS 2019年2期2019-02-27
- 在線密度敏感哈希算法研究
注,越來(lái)越多基于哈希的ANNs算法[8,9]被提了出來(lái).ANNs的特點(diǎn)是在損失少量精度的條件下實(shí)現(xiàn)快速的近鄰搜索,提高效率的同時(shí)也可以得到精度相對(duì)較高的搜索結(jié)果.基于哈希的方法是ANN搜索的代表之一.按照其產(chǎn)生哈希函數(shù)的原理,哈希算法大致可以分為基于隨機(jī)映射的哈希算法和基于學(xué)習(xí)的哈希算法.前者不考慮數(shù)據(jù)分布[8],而后者根據(jù)數(shù)據(jù)分布形成哈希函數(shù)[9].上述的精確最近鄰搜索算法和基于哈希的搜索算法都是基于靜態(tài)數(shù)據(jù)的搜索算法,其處理數(shù)據(jù)的量總體上是不變的.但在
小型微型計(jì)算機(jī)系統(tǒng) 2018年5期2018-07-04
- 一種高性能計(jì)算網(wǎng)絡(luò)下的TCP查找哈希算法
TCP查找算法中哈希表的數(shù)據(jù)結(jié)構(gòu)已經(jīng)不能滿足查找高性能計(jì)算網(wǎng)絡(luò)中大量TCP會(huì)話的要求,且會(huì)對(duì)計(jì)算機(jī)的處理器緩存造成極大負(fù)擔(dān)。為了解決這些問(wèn)題,必須提出一種適合現(xiàn)代計(jì)算機(jī)處理器的TCP會(huì)話的哈希查找算法。1 技術(shù)背景哈希表是在當(dāng)前TCP過(guò)程中計(jì)算機(jī)查找TCB最廣泛使用的方法。當(dāng)TCP會(huì)話到達(dá)時(shí),計(jì)算機(jī)按照哈希函數(shù)將TCP會(huì)話標(biāo)識(shí)符映射為哈希值,然后使用哈希值定位哈希桶,最后在發(fā)生哈希沖突時(shí)對(duì)沖突鏈表進(jìn)行搜索。只有當(dāng)裝填因子較低時(shí),哈希表才有較好的性能。在數(shù)百
計(jì)算機(jī)技術(shù)與發(fā)展 2018年5期2018-05-25
- 基于感知哈希算法的目標(biāo)跟蹤研究
張 宇1.感知哈希算法1.1 原理隨著數(shù)據(jù)增長(zhǎng),尤其是圖像數(shù)據(jù)的快速增長(zhǎng),人們對(duì)于圖像集的快速查重校對(duì)的需求越來(lái)越大,感知哈希算法應(yīng)運(yùn)而生。它屬于哈希算法的一種,可以將圖片提取成一個(gè)哈希指紋。每一個(gè)指紋都是一個(gè)哈希矩陣。通過(guò)比較兩張不同的圖片的指紋相似度,我們得出它們的內(nèi)容相似度。常見的感知哈希算法分為兩種,均值哈希算法和增強(qiáng)哈希算法。前者更快速,而后者更加精確。它們兩者都依賴于一個(gè)前提,即圖像的信息大多隱藏在低頻信息中,通過(guò)濾除掉圖像的邊緣,角點(diǎn)等高頻
電子世界 2018年4期2018-03-20
- 一種改進(jìn)的應(yīng)用于多模式串匹配的KR算法
相同長(zhǎng)度的子串按哈希函數(shù)[2]求值,如果哈希值相同,則逐一比較模式串和子串。一個(gè)良好的哈希函數(shù),不同子串的哈希值相同的概率很小,且匹配速度快。KR算法理論上最壞情況下的時(shí)間復(fù)雜度是O(m×n),但實(shí)際應(yīng)用中平均時(shí)間復(fù)雜度是O(m+n)[3]。KR算法屬于暴力算法[4]的改進(jìn)型。KR算法設(shè)計(jì)的最初思想是考慮到每一次模式串在與目標(biāo)串進(jìn)行匹配時(shí)需要比較每一個(gè)字符,效率很低。而KR算法在每次比較時(shí),使用哈希函數(shù),分別計(jì)算出模式串以及目標(biāo)文本段的hash映射,通過(guò)比
智能計(jì)算機(jī)與應(yīng)用 2018年1期2018-03-02
- SHA—1真的不能用了嗎?
A-1(簡(jiǎn)稱安全哈希算法)來(lái)做電子文本簽名已不再可靠,因?yàn)槊鎸?duì)一個(gè)電子文本和它的SHA-1簽名,科學(xué)家們可以生成一個(gè)完全不同的文本并確保它有完全相同的SHA-1簽名。安全哈希算法是對(duì)信息做一種不可逆的轉(zhuǎn)換,它有下列屬性:不論輸入信息量的大小,特定的哈希算法的輸出總是固定的長(zhǎng)度;輸入信息的微小變化會(huì)帶來(lái)哈希值的很大變化;哈希值的計(jì)算必須包括輸入信息的每一個(gè)比特,否則上面一條將無(wú)法滿足。安全哈希算法的強(qiáng)度在于從哈希值反推原來(lái)的輸入信息有多大的難度。如果黑客能在
軟件和集成電路 2017年5期2017-06-05
- 位置敏感哈希函數(shù)數(shù)據(jù)結(jié)構(gòu)的概率分析
找問(wèn)題,位置敏感哈希 (LSH)在查詢代價(jià)和磁盤空間利用上有著出色表現(xiàn)。在傳統(tǒng)分析模型下,LSH被視作隨機(jī)算法,唯一不確定因素就是哈希函數(shù)的選擇。研究中將這種模型下得到的碰撞概率稱為基于哈希函數(shù)的碰撞概率。在本文中,我們用不同的分析模型對(duì)LSH作了理論分析。此工作的出發(fā)點(diǎn)有2個(gè):(1)在現(xiàn)有的分析模型下,用戶為了達(dá)到理論的效果,必須對(duì)每個(gè)查詢點(diǎn)產(chǎn)生隨機(jī)的數(shù)據(jù)結(jié)構(gòu),這在實(shí)際應(yīng)用中是不現(xiàn)實(shí)的。(2)用戶所關(guān)心的性能指標(biāo)是隨機(jī)查詢點(diǎn)在一個(gè)數(shù)據(jù)結(jié)構(gòu)上的期望碰撞概率
智能計(jì)算機(jī)與應(yīng)用 2016年5期2016-11-19
- 基于改進(jìn)譜哈希的大規(guī)模圖像檢索
9)?基于改進(jìn)譜哈希的大規(guī)模圖像檢索夏立超,蔣建國(guó),齊美彬(合肥工業(yè)大學(xué) 計(jì)算機(jī)與信息學(xué)院,安徽 合肥230009)為了提高圖像檢索精度,文章在譜哈希的基礎(chǔ)上引入最小量化誤差的思想,提出了一種基于改進(jìn)譜哈希的大規(guī)模圖像檢索算法,該算法避免了譜哈希中要求的數(shù)據(jù)服從均勻分布的假設(shè),并且能夠保持?jǐn)?shù)據(jù)在原始空間的相似性;引入Boosting算法來(lái)確定閾值,使得該算法具有更強(qiáng)的適應(yīng)性和更廣泛的應(yīng)用;在公開的圖像數(shù)據(jù)集上做了實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果表明該方法優(yōu)于譜哈希、局部敏感
- 一種相似性保持的線性嵌入哈希方法
性保持的線性嵌入哈希方法王秀美,丁利杰,高新波(西安電子科技大學(xué)電子工程學(xué)院,陜西西安 710071)在圖像檢索技術(shù)中,針對(duì)高維特性海量的圖像數(shù)據(jù)檢索速度慢、數(shù)據(jù)存儲(chǔ)容量大及圖像和其哈希編碼之間相關(guān)性差的缺點(diǎn),將相關(guān)性預(yù)測(cè)函數(shù)引入到哈希算法中,提出了一種相似性保持的線性嵌入哈希方法.該方法利用相關(guān)性預(yù)測(cè)函數(shù)保持高維數(shù)據(jù)與其編碼之間的鄰近關(guān)系,使邊界損失代價(jià)最小化,構(gòu)建線性哈希映射矩陣,獲得緊致的哈希編碼,提高了圖像與編碼間的相關(guān)性,實(shí)現(xiàn)了高精度的圖像檢索.
西安電子科技大學(xué)學(xué)報(bào) 2016年1期2016-09-12
- 基于深度卷積神經(jīng)網(wǎng)絡(luò)和二進(jìn)制哈希學(xué)習(xí)的圖像檢索方法
神經(jīng)網(wǎng)絡(luò)和二進(jìn)制哈希學(xué)習(xí)的圖像檢索方法彭天強(qiáng)*①栗芳②① ①(河南工程學(xué)院計(jì)算機(jī)學(xué)院鄭州451191) ②(河南圖像識(shí)別工程技術(shù)中心鄭州450001)隨著圖像數(shù)據(jù)的迅猛增長(zhǎng),當(dāng)前主流的圖像檢索方法采用的視覺特征編碼步驟固定,缺少學(xué)習(xí)能力,導(dǎo)致其圖像表達(dá)能力不強(qiáng),而且視覺特征維數(shù)較高,嚴(yán)重制約了其圖像檢索性能。針對(duì)這些問(wèn)題,該文提出一種基于深度卷積神徑網(wǎng)絡(luò)學(xué)習(xí)二進(jìn)制哈希編碼的方法,用于大規(guī)模的圖像檢索。該文的基本思想是在深度學(xué)習(xí)框架中增加一個(gè)哈希層,同時(shí)學(xué)習(xí)
電子與信息學(xué)報(bào) 2016年8期2016-08-30
- 基于低沖突幫助機(jī)制的快速無(wú)等待哈希表算法
機(jī)制的快速無(wú)等待哈希表算法李鵬飛,張坤龍,康超凡(天津大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,天津300072)針對(duì)現(xiàn)有無(wú)等待哈希表算法未充分利用哈希表的固有并行性,造成線程之間存在高沖突和高冗余的問(wèn)題,提出一種快速無(wú)等待哈希表算法。利用可凍結(jié)集合思想簡(jiǎn)化哈希表操作,采用CAS原子指令保證插入、刪除與查找操作均為無(wú)等待。根據(jù)哈希表結(jié)構(gòu)改進(jìn)幫助機(jī)制,使得哈希桶的實(shí)現(xiàn)為無(wú)等待,只有在擴(kuò)展哈希表時(shí)哈希桶之間才提供幫助。實(shí)驗(yàn)結(jié)果表明,該算法能降低線程操作間的沖突,提高幫助操作的
計(jì)算機(jī)工程 2015年11期2015-12-06
- 基于哈希函數(shù)的查找算法設(shè)計(jì)及性能分析
.本文提出了基于哈希函數(shù)的查找算法,不需要進(jìn)行比較,直接定位到要查找的記錄,從而提高查找效率.1 傳統(tǒng)的查找算法1.1 數(shù)據(jù)結(jié)構(gòu)的定義以圖書館中圖書信息的查詢?yōu)槔?,圖書數(shù)據(jù)的存儲(chǔ)結(jié)構(gòu)定義如下:Typedef struct{char isbn[20];//圖書的 ISBN 號(hào)char name[40];//圖書名字char author[20];//作者姓名char press[20];//出版社名字float price;//價(jià)格}book[];1.2 順
鞍山師范學(xué)院學(xué)報(bào) 2015年2期2015-11-22
- 巧用哈希數(shù)值傳遞文件
重劍計(jì)算文件的哈希數(shù)值現(xiàn)在網(wǎng)絡(luò)中比較常見的哈希數(shù)值計(jì)算方式有兩種,一種是MD5方式,另一種是SHA1方式。目前只有通過(guò)MD5這種方式計(jì)算出的結(jié)果,才可以成功轉(zhuǎn)換為磁性鏈接信息。所以我們首先下載運(yùn)行“MD5-Hash哈希值計(jì)算工具”這款軟件,接著點(diǎn)擊窗口下方“校驗(yàn)類型”中的“MD5”選項(xiàng)。然后點(diǎn)擊“計(jì)算文件哈希值”按鈕,在彈出的對(duì)話框中選擇需要傳遞的文件,很快就可以在軟件的“哈希值”里面看到計(jì)算出來(lái)的哈希數(shù)值了(圖1)。默認(rèn)情況下計(jì)算出的哈希數(shù)值是32位的,
電腦愛好者 2015年13期2015-09-10
- 一種改進(jìn)的分段哈希算法
·一種改進(jìn)的分段哈希算法胥 攀,劉勝利,蘭景宏,肖 達(dá)(數(shù)學(xué)工程與先進(jìn)計(jì)算國(guó)家重點(diǎn)實(shí)驗(yàn)室,鄭州450002)為更有效地降低分段哈希算法的碰撞率,提出一種改進(jìn)的分段哈希算法。在各哈希子表中采用開放地址法,降低各哈希子表中元素的碰撞率,進(jìn)而降低整個(gè)分段哈希算法的碰撞率。對(duì)碰撞率、時(shí)間效率、空間效率進(jìn)行分析。使用11 119 905個(gè)不同IP數(shù)據(jù)包的五元組信息,對(duì)該算法的碰撞率和時(shí)間效率進(jìn)行測(cè)試。實(shí)驗(yàn)結(jié)果表明,改進(jìn)的分段哈希算法在不增加內(nèi)存使用的情況下,可有效降
計(jì)算機(jī)工程 2015年1期2015-06-27
- 基于投影殘差量化哈希的近似最近鄰搜索
時(shí)的。目前,基于哈希的方法因其能在常量時(shí)間能完成搜索已被廣泛應(yīng)用于相似度檢索[5-7]。 已 有 的 哈 希 方 法 一 般 分 為 兩 大 類[8-9]:數(shù)據(jù)無(wú)關(guān)的方法和數(shù)據(jù)相關(guān)的方法。數(shù)據(jù)無(wú)關(guān)方法的一個(gè)代表是隨機(jī)投影殘差量化哈希,如漢明嵌入[10]和局部敏感哈希(Local Sensitive Hashing,LSH)[11-12]。在這類方法中,哈希函數(shù)為獨(dú)立于數(shù)據(jù)集的隨機(jī)投影。理論上,隨機(jī)投影保證了隨著編碼長(zhǎng)度的增加,原始距離或相似性在海明空間漸近
計(jì)算機(jī)工程 2015年12期2015-01-01
- 哈希表沖突處理方法淺析
00)0 引言在哈希表中,哈希函數(shù)的設(shè)置是非常靈活的,只要能使任一關(guān)鍵字由此所得的哈希地址都分布在哈希表允許的范圍內(nèi)就可以了。因此常常會(huì)出現(xiàn)不同的關(guān)鍵字值對(duì)應(yīng)到同一個(gè)存儲(chǔ)地址的現(xiàn)象,這就叫沖突。即關(guān)鍵字key1≠key2,但H(key1)=H(key2)。適當(dāng)?shù)倪x擇分布均勻的哈希函數(shù)能有效地減少?zèng)_突的發(fā)生,但是不能不免沖突。發(fā)生沖突后,必須解決,也即必須尋找下一個(gè)可用的地址。因此哈希表的建立通常為如下步驟:第一步,取出一個(gè)數(shù)據(jù)元素的關(guān)鍵字key,根據(jù)哈希函
科技視界 2014年6期2014-08-15
- 基于HEVC屏幕圖像編碼的哈希表的優(yōu)化算法
C屏幕圖像編碼的哈希表的優(yōu)化算法金小娟,張培君,林濤同濟(jì)大學(xué)超大規(guī)模集成電路研究所,上海 200092仿2維匹配算法對(duì)屏幕圖像中的非連續(xù)色調(diào)區(qū)域有很好的壓縮性能,但該算法中哈希表的空間開銷較大,不利于硬件實(shí)現(xiàn)。為了減小哈希表的空間,通過(guò)對(duì)原算法優(yōu)化提出了一種3字節(jié)計(jì)算哈希值方法,將源數(shù)據(jù)看作是一個(gè)由以YUV三元組為元素組成的數(shù)據(jù)集合,然后以YUV三元組為單位計(jì)算哈希值,這樣不但減少了哈希值的計(jì)算量,而且使哈希表的存儲(chǔ)空間得到很大的節(jié)省。實(shí)驗(yàn)結(jié)果表明,3字節(jié)
計(jì)算機(jī)工程與應(yīng)用 2014年17期2014-07-08
- 哈希公司獲“2013年中國(guó)水質(zhì)分析儀器評(píng)選”卓越品牌獎(jiǎng)
儀器發(fā)展論壇上,哈希公司憑借雄厚的技術(shù)實(shí)力和的完善的服務(wù)體系,再次獲得中國(guó)水質(zhì)分析儀器領(lǐng)域最高的獎(jiǎng)項(xiàng)“卓越品牌獎(jiǎng)”,這也是哈希公司連續(xù)五年獲此殊榮。哈希公司作為水質(zhì)分析儀器的專家,致力于幫助中國(guó)廣大用戶解決在水質(zhì)監(jiān)測(cè)領(lǐng)域所遇到的問(wèn)題,為用戶提供高精度的儀器和專家級(jí)的服務(wù)。從上?!八镭i事件”,到四川雅安地震災(zāi)區(qū)震后水源水監(jiān)測(cè)中,都能看到哈希的身影。2012—2013年度,哈希公司新品頻出。2012年度推出DR6000紫外可見光分光光度計(jì)和全新一代哈希LDO?
中國(guó)環(huán)保產(chǎn)業(yè) 2013年5期2013-08-15
- 局部敏感哈希在高維向量K近鄰搜索中的應(yīng)用
1)前言局部敏感哈希是一種對(duì)高維度數(shù)據(jù)通過(guò)概率方法降維的一種方法,基本的想法是將輸入的數(shù)據(jù)進(jìn)行哈希,使得相似的數(shù)據(jù)的哈希值映射到同一個(gè)哈希桶的概率非常高。由于在局部敏感哈希中,哈希桶的數(shù)量遠(yuǎn)遠(yuǎn)小于輸入數(shù)據(jù)的窮舉數(shù)量,它的實(shí)現(xiàn)方法和傳統(tǒng)的哈希函數(shù)較不一樣,通常用于數(shù)據(jù)的聚簇和最近鄰搜索[1-3]。在圖片的相似性搜索的應(yīng)用中[4],給定一張參考圖片,來(lái)從圖片數(shù)據(jù)庫(kù)中進(jìn)行搜索,以得到和參考圖片最相似的若干圖片。搜索的過(guò)程通常經(jīng)過(guò)2個(gè)步驟,首先通過(guò)特征點(diǎn)提取算法將
上饒師范學(xué)院學(xué)報(bào) 2013年6期2013-05-08
- 基于雙字哈希的PAT樹詞典機(jī)制的研究
他學(xué)者提出的雙字哈希詞典機(jī)制、基于改進(jìn)的PAT樹詞典機(jī)制及四字哈希詞典機(jī)制。這些詞典機(jī)制圍繞著分詞的準(zhǔn)確率及分詞速度作了逐步改進(jìn),但隨著網(wǎng)絡(luò)的發(fā)展及信息量成級(jí)數(shù)增長(zhǎng)的趨勢(shì),分詞的詞典機(jī)制還有待加強(qiáng)和提高,以滿足分詞工作的需要。本文首先介紹了基于雙字哈希的詞典機(jī)制及基于改進(jìn)的PAT樹詞典機(jī)制,結(jié)合兩種方法的優(yōu)點(diǎn),提出了基于雙字哈希的PAT樹詞典機(jī)制,最后通過(guò)實(shí)驗(yàn)對(duì)新的詞典機(jī)制和已有的詞典機(jī)制在分詞準(zhǔn)確率及分詞的時(shí)間、空間效率上做了比較。1 兩種相關(guān)詞典機(jī)制的
- 基于圖像正則化的抗幾何變換的感知哈希算法
抗幾何變換的感知哈希算法孫 銳1, 閆曉星2, 丁志中1(1. 合肥工業(yè)大學(xué)計(jì)算機(jī)與信息學(xué)院,安徽 合肥230009;2. 合肥工業(yè)大學(xué)光電技術(shù)研究院,安徽 合肥 230009)圖像哈希在內(nèi)容認(rèn)證、數(shù)據(jù)庫(kù)搜索和水印等領(lǐng)域有廣泛的應(yīng)用。該文提出的新的抗幾何變換的感知哈希方法包括三個(gè)主要階段:第一階段通過(guò)圖像正則化過(guò)程獲得一個(gè)對(duì)任意仿射變換具有不變性的正則圖像;第二階段對(duì)隨機(jī)選擇的多個(gè)子圖像進(jìn)行小波變換產(chǎn)生一個(gè)包括圖像主要特征的副圖像;第三階段采用奇異值分解捕
圖學(xué)學(xué)報(bào) 2010年2期2010-04-26