亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于同態(tài)加密的密文檢索方案研究

        2016-11-17 10:13:13呂文斌拱長(zhǎng)青
        關(guān)鍵詞:同態(tài)密文云端

        呂文斌,拱長(zhǎng)青

        (沈陽(yáng)航空航天大學(xué) 計(jì)算機(jī)學(xué)院,沈陽(yáng) 110136)

        ?

        基于同態(tài)加密的密文檢索方案研究

        呂文斌,拱長(zhǎng)青

        (沈陽(yáng)航空航天大學(xué) 計(jì)算機(jī)學(xué)院,沈陽(yáng) 110136)

        現(xiàn)有的密文檢索技術(shù)主要是采用的是布爾模型,它無(wú)法精確的計(jì)算出檢索項(xiàng)與待檢索文件的相關(guān)度,不能按相似度進(jìn)行精確的排序;針對(duì)以上情況,結(jié)合同態(tài)加密技術(shù)和基于TF-IDF的向量空間模型技術(shù),提出了一個(gè)基于向量空間模型全同態(tài)環(huán)境下的密文檢索方案BVH(based vector space model and homomorphism ciphertext retrieval scheme),BVH主要分為3個(gè)步驟:第一是預(yù)處理階段,主要對(duì)上傳的文件建立倒排索引,生成文件向量集,計(jì)算各個(gè)文件向量的模,對(duì)文件向量集和要上傳的文件加密以密文的形式上傳到云端;第二個(gè)階段是檢索階段,主要是將搜索詞的向量密文和各個(gè)文件向量的密文相乘將結(jié)果以密文的形式返回給客戶(hù)端;第3個(gè)階段結(jié)果處理階段,主要是對(duì)解密后的結(jié)果進(jìn)行相應(yīng)的計(jì)算處理,對(duì)最后的處理結(jié)果按相似度大小排序;經(jīng)分析,該方案在準(zhǔn)確率和檢索效率方面都得到了較大提升。

        同態(tài)加密;向量空間模型;倒排索引;密文檢索;相似度

        0 引言

        云計(jì)算是一種通過(guò)網(wǎng)絡(luò)以按需、易擴(kuò)展的方式獲取所需服務(wù)的在線(xiàn)網(wǎng)絡(luò)服務(wù)交付和使用模式,它是分布式計(jì)算的一種形式,它是網(wǎng)絡(luò)上的服務(wù)以及提供這種服務(wù)的數(shù)據(jù)中心的軟硬件集合[1]。云計(jì)算是并行計(jì)算、分布式計(jì)算和網(wǎng)格計(jì)算的演進(jìn)。云計(jì)算的實(shí)現(xiàn)形式包括軟件即服務(wù)、效用計(jì)算、平臺(tái)即服務(wù)、基礎(chǔ)設(shè)施即服務(wù)[1]。

        云計(jì)算的提出對(duì)那些數(shù)據(jù)量極大而且復(fù)雜的數(shù)據(jù)提供一個(gè)高效穩(wěn)定的計(jì)算方法。首先要提供一個(gè)安全可靠的數(shù)據(jù)存儲(chǔ)中心,一個(gè)可靠的方法就對(duì)用戶(hù)要上傳的數(shù)據(jù)加密,把數(shù)據(jù)以密文的形式存儲(chǔ)到云端。但是隨著云端數(shù)據(jù)量的增大,快速準(zhǔn)確的從云端大量的密文數(shù)據(jù)中檢索出用戶(hù)需要的數(shù)據(jù)將是一個(gè)急需解決的問(wèn)題。

        密文檢索技術(shù)已經(jīng)發(fā)展多年,有很多已經(jīng)比較成熟的算法,如線(xiàn)性搜索算法,基于關(guān)鍵詞的公鑰搜索算法,安全索引。這幾種算法使用的是是布爾模型,布爾模型有一個(gè)局限性就是無(wú)法計(jì)算出關(guān)鍵詞和待檢索文檔之間的相關(guān)度,既無(wú)法對(duì)檢索出的多個(gè)文檔進(jìn)行排序。引入相關(guān)排序的搜索算法雖然引入了相關(guān)度這個(gè)概念,但是此算法只允許一次只查詢(xún)一個(gè)詞,還有就是此算法只使用了詞頻并沒(méi)有使用文檔頻率,而在實(shí)際應(yīng)用中,只有詞頻和逆文檔頻率共同使用才能得到合理的排序。在云端,待檢索的文檔數(shù)是巨大的,那么計(jì)算關(guān)鍵詞和待檢索文檔之間的相關(guān)度就變得非常重要。而向量空間模型則可以很好的解決這個(gè)問(wèn)題,它在目前的明文檢索系統(tǒng)中應(yīng)用已經(jīng)非常廣泛,它可以對(duì)搜索到的多個(gè)文檔根據(jù)相似度進(jìn)行排序。全同態(tài)加密技術(shù)是一種可以直接對(duì)密文進(jìn)行操作的技術(shù), 并且對(duì)密文操作的結(jié)果進(jìn)行解密和直接對(duì)明文操作的其結(jié)果是一樣的。因此采用全同態(tài)加密方式不僅可以保證用戶(hù)數(shù)據(jù)的安全,而且可以直接對(duì)密文進(jìn)行加法和乘法操作,這會(huì)大大提高在云端的檢索效率。

        1 全同態(tài)加密

        1978 年,R.Rivest、L.Adleman 和 M.Dertouzos 提出了“全同態(tài)加密”的概念,全同態(tài)加密即可以對(duì)密文進(jìn)行任意深度的計(jì)算,然后對(duì)計(jì)算結(jié)果解密和對(duì)明文進(jìn)行相應(yīng)的計(jì)算其結(jié)果是一樣的。幾十年來(lái),國(guó)內(nèi)外的專(zhuān)家們對(duì)其進(jìn)行不停的探索與研究,直到2009年, Gentry提出了首個(gè)全同態(tài)加密方案, 這一問(wèn)題才有了突破性的進(jìn)展, 該方案使用的數(shù)學(xué)工具是理想格。 Gentry的全同態(tài)加密思想框架如下: 構(gòu)造一個(gè)部分同態(tài)方案,該方案不能處理任意次數(shù)的多項(xiàng)式或任意深度的電路,即它只能滿(mǎn)足有限次的加法同態(tài)和乘法同態(tài), 然后壓縮解密電路,使得壓縮后的解密算法的次數(shù)降低,能夠正確用于密文的解密。最后利用自舉轉(zhuǎn)換技術(shù),在對(duì)密文做完一次加法或乘法運(yùn)算后,對(duì)運(yùn)算后的密文進(jìn)行重加密操作,此舉的目地是降低密文運(yùn)算過(guò)程中產(chǎn)生的噪聲,使得此方案能滿(mǎn)足任意次數(shù)的加法同態(tài)和乘法同態(tài),最終得到一個(gè)全同態(tài)加密方案[2]。

        基于理想格的全同態(tài)加密算法如下所示:

        在此方案中,密文ψ表示為V+X,其中,V代表理想格,X代表加密明文時(shí)產(chǎn)生的噪聲,它的含義就是將密文空間用多項(xiàng)式環(huán)Ζ[x]/f(x) 的元素的系數(shù)向量形式來(lái)表示,對(duì)密文的加法和乘法運(yùn)算就變成了對(duì)多項(xiàng)式環(huán)上的向量空間的運(yùn)算:如式(1)(2)所示[2]:

        (1)

        (2)

        這種方案的缺陷在于加密過(guò)程產(chǎn)生的噪聲會(huì)隨著運(yùn)算深度的增加而變大,尤其對(duì)乘法運(yùn)算更是如此,噪聲過(guò)大會(huì)影響解密的正確性,因此此方案只適合于運(yùn)算次數(shù)較低的電路。為此Gentry提出了他的全同態(tài)思想框架來(lái)解決這一問(wèn)題。除此之外,因?yàn)樵摲桨敢M(jìn)行向量的加法和乘法運(yùn)算,每次 Evaluate運(yùn)算中加法和乘法的計(jì)算的時(shí)間復(fù)雜度為O(n6),可以看出此方案的效率不高。因此國(guó)內(nèi)外的專(zhuān)家們對(duì)其進(jìn)行了不同方向上的改進(jìn),如2010年由Dijk,Gentry等人提出了整數(shù)上的全同態(tài)加密方案(簡(jiǎn)記為DGHV方案),該方案不僅概念簡(jiǎn)單,而且在效率上有了一定的提高。

        1.1 整數(shù)上的全同態(tài)加密方案

        Dijk 和 Gentry 等人利用最基本的模運(yùn)算構(gòu)造了一個(gè)Somewhat同態(tài)加密方案,在該方案中舍棄掉了多項(xiàng)式環(huán)中的理想格,僅利用整數(shù)上的加法和乘法運(yùn)算,從上可以看出,此方案相對(duì)于Gentry的基于理想格的全同態(tài)加密算法效率要高,并且它的計(jì)算復(fù)雜度低。

        此方案先是構(gòu)造一個(gè)對(duì)稱(chēng)加密方案,然后在將其改造成非對(duì)稱(chēng)的加密方案。

        其對(duì)稱(chēng)加密方案如下[6-7]:

        Kengen():選取比特長(zhǎng)度的素?cái)?shù)作為私鑰

        Encryption(p,m):密文c=m+2r+pq,q 和r是隨機(jī)選取的,并且滿(mǎn)足|2r|<|p/2|

        Decryption(p,c):明文m=(c mod p)mod 2

        如果m+2r

        現(xiàn)在將其對(duì)稱(chēng)加密方案轉(zhuǎn)換成非對(duì)稱(chēng)加密方案

        Kengen():選取比特長(zhǎng)度的素?cái)?shù)作為私鑰,公鑰pk為集合,加密時(shí)隨機(jī)選擇該集合的一個(gè)子集S

        Encryption(pk, m):密文

        Decryption(p,m):明文m=(c mod p)mod2

        由上可以得出,此方案加密過(guò)程會(huì)產(chǎn)生噪音,隨著密文噪聲的增大,解密時(shí)有可能得不到正確的明文,即只有對(duì)密文進(jìn)行較低次的加法和乘法運(yùn)算時(shí),此方案才滿(mǎn)足同態(tài)特性。如果想得到一個(gè)全同態(tài)加密方案,可以采用Gentry的全同態(tài)加密思想框架對(duì)上述方案改進(jìn)。

        1.2 本文的同態(tài)加密方案

        本文所使用的同態(tài)加密算法也是基于整數(shù)的模運(yùn)算,其具體過(guò)程如下:

        Kengen:隨機(jī)選取一P位的大素?cái)?shù)作為密鑰p

        Encryption:隨機(jī)選取一個(gè)Q位的大素?cái)?shù)q,且P>Q>明文分組長(zhǎng)度,隨機(jī)選取兩個(gè)隨機(jī)數(shù)r1,r2,N=pq,密文c=(m+pr1+pqr2)mod N

        Decryption:明文m=c mod p

        同態(tài)性分析:設(shè)有兩個(gè)明文 m1,m2,其對(duì)應(yīng)的密文分別為c1,c2,則

        c1=(m1+pr11+pqr12)mod N

        c2=(m2+pr21+pqr22)mod N

        加法同態(tài)性分析:c1+c2=(m1+m2+p(r11+r21)+pq(r12+r22))modN=c(m1+m2),因此該算法,滿(mǎn)足加法同態(tài)。

        乘法同態(tài)性分析:c1*c2=(m1*m2+pm1r21+pqm1r22+pm2r11+p2r11r21+p2qr11r22)mod N,c1*c2modp=m1*m2,因此該算法滿(mǎn)足乘法同態(tài)性。

        綜上所述,該方案既滿(mǎn)足加法同態(tài)性,又滿(mǎn)足乘法同態(tài)性。此方案也是基于整數(shù)的,其加密過(guò)程會(huì)產(chǎn)生噪音,隨著運(yùn)算電路深度的增加,該算法有可能不再滿(mǎn)足同態(tài)性,即該方案為Somewhat同態(tài)加密方案,要想得到一個(gè)全同態(tài)加密方案,那么就要根據(jù)Gentry的全同態(tài)思想框架,采用解密電路壓縮技術(shù)和重加密技術(shù)對(duì)上述方案改進(jìn)得到一個(gè)全同態(tài)加密方案,但是其實(shí)現(xiàn)起來(lái)是非常復(fù)雜和困難的。

        2 現(xiàn)有的密文檢索技術(shù)

        密文檢索技術(shù)已經(jīng)發(fā)展多年,有很多已經(jīng)比較成熟的算法,如下面介紹的幾種密文檢索算法。這幾種算法有一個(gè)共同的缺點(diǎn),因?yàn)樗鼈兯玫哪P褪遣紶柲P?,布爾模型有一個(gè)局限性就是它無(wú)法計(jì)算出關(guān)鍵詞和待檢索文檔之間的相似度,既無(wú)法將檢索出的多個(gè)文檔根據(jù)相似度進(jìn)行排序。在云端,待檢索的文檔數(shù)是巨大的,計(jì)算檢索項(xiàng)和待檢索的各個(gè)文件集之間的相關(guān)度并按相關(guān)度進(jìn)行排序非常重要。

        2.1 線(xiàn)性搜索算法

        線(xiàn)性搜索算法是一種具有線(xiàn)性搜索特征的密文檢索算法,它的核心就是以密碼流為基礎(chǔ),把明文與密碼流的逐個(gè)單詞進(jìn)行異或,這樣就得到了相應(yīng)的密文,在搜索時(shí),把待搜索的關(guān)鍵字與密文進(jìn)行異或,若異或結(jié)果滿(mǎn)足密碼流單詞的結(jié)構(gòu)特征,則搜索成功[9-10]。

        線(xiàn)性搜索算法的優(yōu)點(diǎn)是它只進(jìn)行異或操作,因此加解密時(shí)速度會(huì)非??欤娜秉c(diǎn)就是檢索時(shí)必須依次對(duì)照密文,當(dāng)檢索的文件量大時(shí),其檢索速度會(huì)非常慢。

        2.2 安全索引

        安全索引是一種采用Bloom Filter的密文檢索技術(shù),它的核心思想是保證索引的安全性,它為每一個(gè)文檔建立一個(gè)索引,其索引就是關(guān)鍵字和文檔的一個(gè)映射,在搜索時(shí),可以通過(guò)這個(gè)索引找到要檢索的文檔,采用Bloom Filter的優(yōu)勢(shì)在于幾乎不可能通過(guò)統(tǒng)計(jì)的方式從索引推出關(guān)鍵字,也就不可能得到明文的相關(guān)信息,但是安全索引的一個(gè)缺點(diǎn)就是它需要維護(hù)大量的密鑰序列,因此它的計(jì)算效率是非常低的。

        2.3 安全索引

        它的核心思想如下:首先對(duì)文檔中的關(guān)鍵詞統(tǒng)計(jì)其詞頻信息,然后構(gòu)建安全索引,其構(gòu)建的索引中包含詞頻統(tǒng)計(jì)信息,然后采用順序加密算法加密其詞頻統(tǒng)計(jì)信息,將索引和密文發(fā)到服務(wù)器端,檢索時(shí),輸入要搜索的關(guān)鍵字,將得到擁有該詞的所有密文文檔,然后對(duì)這些密文文檔根據(jù)詞頻進(jìn)行排序,然后將排序的結(jié)果返回給客戶(hù)端[9-10]。

        排序搜索算法的缺點(diǎn)是只允許一次只查詢(xún)一個(gè)詞,還有就是此算法只使用了詞頻并沒(méi)有使用逆文檔頻率,而在實(shí)際應(yīng)用中,只有詞頻和逆文檔頻率共同使用才能得到精確的排序。

        3 基于同態(tài)加密的密文檢索方案

        3.1 現(xiàn)有的同態(tài)環(huán)境下的密文檢索方案

        同態(tài)加密技術(shù)可以直接對(duì)密文進(jìn)行操作,因此可以將同態(tài)加密技術(shù)應(yīng)用到云端的密文檢索中,這樣既可以保證用戶(hù)數(shù)據(jù)的安全,也可以在一定程度上提高密文檢索的效率。文獻(xiàn)[12]提出的基于同態(tài)加密的密文檢索技術(shù)主要分為以下幾步[12]:

        (1)用戶(hù)上傳文檔之前先將文檔M分成若干長(zhǎng)度為L(zhǎng)的分組,設(shè)M=m1,m2,m3…..mt,假設(shè)這里采用的加密算法為本文提出的同態(tài)加密方案,則ci=mi+pr11+pqr12,然后將各個(gè)分組密文合并得到文檔密文,最后將文檔密文上傳到云端。

        (2)客戶(hù)端檢索時(shí),設(shè)要檢索的關(guān)鍵詞為mindex,首先將其加密得到其密文cindex=mindex+pr21+pqr22,然后將關(guān)鍵詞密文上傳到云端。

        (3)計(jì)算設(shè)匹配結(jié)果為result,則result的值如公式(3) 所示:

        result = (ci-cindex)qribmodN=

        (3)

        在云端檢索時(shí),要先向云端上傳qri和N,其中N=pq,由上述公式可得,若result=0,則匹配成功,即檢索到所需文件。

        可以看出,文獻(xiàn)[12]提出的同態(tài)環(huán)境下的密文檢索方案,其在云端的密文檢索操作主要還是線(xiàn)性匹配,它并沒(méi)有計(jì)算檢索項(xiàng)和各個(gè)文件的相似度,并按相似度對(duì)檢索出的各個(gè)文件進(jìn)行排序。

        3.2 BVH

        BVH是在上述的密文檢索方案的基礎(chǔ)上結(jié)合文獻(xiàn)[9-10]對(duì)密文檢索方案進(jìn)行改進(jìn),得到一個(gè)基于向量空間模型全同態(tài)環(huán)境下的密文檢索方案,其總體架構(gòu)如圖1所示。

        圖1 BVH的總體架構(gòu)圖

        從以上可以看出BVH共分為客戶(hù)端和服務(wù)器端(即云端)兩部分,客戶(hù)端主要進(jìn)行文檔集和檢索項(xiàng)的預(yù)處理和對(duì)云端返回的結(jié)果的處理,服務(wù)器端主要進(jìn)行的是存儲(chǔ)和檢索。下面詳細(xì)分析這3個(gè)階段。

        3.2.1 文件和檢索項(xiàng)的預(yù)處理

        文件和檢索項(xiàng)預(yù)處理階段的主要工作如圖2所示。

        圖2 預(yù)處理階段架構(gòu)圖

        建立倒排索引的第一步是文檔分詞,首先要過(guò)濾掉那些停用詞,即那些沒(méi)啥實(shí)際含義但出現(xiàn)頻率很高的詞,這些詞對(duì)文檔區(qū)分意義不大,所以要先把它過(guò)濾掉。

        在很多檢索系統(tǒng)中,倒排索引的建立一般是在服務(wù)器端進(jìn)行,這樣做雖然減少了客戶(hù)端的壓力,但是它有一個(gè)致命的缺點(diǎn),就是它暴露了關(guān)鍵詞的詞頻信息,考慮到安全等因素,在BVH中,倒排索引的建立放在客戶(hù)端進(jìn)行[9-10]。

        假設(shè)文件集為test1,test2,…test5,最后形成的倒排索引表如下所示。

        guide(test4,1)(test5,1)(test2,2)(test3,1)

        perilous(test4,1)(test5,1)(test2,2)(test3,1)

        others(test4,1)(test5,1)(test2,2)(test3,1)

        hold(test4,1)(test5,1)(test2,2)(test3,1)

        倒排索引表建立好以后,緊接著就是根據(jù)倒排索引表生成文件向量集,BVH所使用的權(quán)重框架是TF-IDF權(quán)重框架,其中TF代表的是關(guān)鍵詞的項(xiàng)頻,IDF代表的是關(guān)鍵詞的反文檔頻率,設(shè)wij代表關(guān)鍵詞ki對(duì)文檔dj的TF-IDF權(quán)重。在BVH中,各個(gè)文檔項(xiàng)和查詢(xún)項(xiàng)所用的TF-IDF框架都如式(4)所示:

        (4)

        其中fij代表關(guān)鍵詞ki在文檔dj中的詞頻,N/ni代表關(guān)鍵詞ki的反文檔頻率,從上述公式可以看出,關(guān)鍵詞的詞頻越高,文檔頻率越低,其權(quán)重越高。設(shè)共有t個(gè)關(guān)鍵詞項(xiàng),且它們之間相互獨(dú)立,定義文檔dj為t維空間上的向量 ,則dj的值如公式(5)所示:

        (5)

        在方案BVH中,最終上傳到服務(wù)器端的不是倒排索引表,而是文件向量集的密文,因?yàn)榉桨窧VH采用的同態(tài)加密算法是基于整數(shù)的,所以在這里采用wij*10a(a取決于你要求的精度)將關(guān)鍵詞的權(quán)重值轉(zhuǎn)換為整數(shù)值。

        文件向量集建好以后,按公式(6)計(jì)算文件向量的模:

        (6)

        然后將各文件名和對(duì)應(yīng)的文件向量的模保存在客戶(hù)端為之后的密文檢索服務(wù)。最后把文件向量集和文件集加密以密文的形式存儲(chǔ)到云端

        文件向量集的密文形式如圖3所示。

        圖3 文件向量集密文結(jié)構(gòu)圖

        3.2.2 文件的檢索

        文件檢索階段的主要工作如圖4所示。

        圖4 文件檢索階段架構(gòu)圖

        在BVH中,用戶(hù)只有登錄驗(yàn)證成功以后,才能去云端檢索文件。登錄成功后,在客戶(hù)端首先要對(duì)檢索項(xiàng)做和文件集一樣的預(yù)處理工作生成檢索項(xiàng)權(quán)重向量,其中檢索項(xiàng)中各關(guān)鍵詞的權(quán)重按如下公式計(jì)算,設(shè)檢索項(xiàng)中關(guān)鍵詞的權(quán)重為wiq, fiq為關(guān)鍵詞 ki在檢索項(xiàng)q中的詞頻,ni為包含關(guān)鍵詞ki的文檔數(shù),N為文檔集總文檔數(shù),則wiq的值如公式(7)所示:

        (7)

        最后把檢索項(xiàng)的權(quán)重向量密文上傳到云端準(zhǔn)備進(jìn)行密文檢索。

        因?yàn)锽VH所采用的檢索模型為基于TF-IDF的向量空間模型,因此檢索的過(guò)程就是計(jì)算文件集中各文件的向量與檢索項(xiàng)向量的相似度,在服務(wù)器端的是文件集向量和檢索項(xiàng)向量的密文,因?yàn)锽VH所采用的加密算法滿(mǎn)足加法同態(tài)和乘法同態(tài),因此可以直接對(duì)文件向量集的密文和檢索項(xiàng)向量的密文進(jìn)行相似度計(jì)算,它并不會(huì)影響最終的計(jì)算結(jié)果。

        (8)

        首先,因?yàn)楸痉桨杆捎玫耐瑧B(tài)加密算法基于整數(shù),其加密過(guò)程會(huì)產(chǎn)生噪聲,因此BVH所使用的同態(tài)加密方案能夠處理的電路深度是有限的。其次,方案BVH采用的同態(tài)加密方案是基于整數(shù)的,其計(jì)算除法和開(kāi)根號(hào)的效率很低,因?yàn)槲募蛄康哪J遣蛔兊?,所以可以在預(yù)處理階段把文件向量的模還有檢索項(xiàng)的模提前計(jì)算好保存在客戶(hù)端供計(jì)算結(jié)果處理階段使用,所以在此階段無(wú)需計(jì)算文件向量集和檢索項(xiàng)向量的模,也無(wú)需計(jì)算除法和開(kāi)根號(hào),只需計(jì)算兩個(gè)向量的相乘,兩個(gè)向量的相乘其加法和乘法的運(yùn)算深度為一,可知其必定是滿(mǎn)足同態(tài)特性。

        (9)

        檢索階段最后計(jì)算結(jié)果的格式如圖5所示。

        圖5 檢索階段計(jì)算結(jié)果示意圖

        3.2.3 計(jì)算結(jié)果的處理

        計(jì)算結(jié)果處理階段的工作主要如圖6所示。

        圖6 計(jì)算結(jié)果處理階段架構(gòu)圖

        (10)

        在計(jì)算出檢索項(xiàng)和各個(gè)文件的相似度后,按相似度對(duì)各個(gè)文件從大到小排序,接下來(lái)就是到云端下載相應(yīng)的文件返回給用戶(hù)。

        下載文件時(shí),首先在客戶(hù)端對(duì)文件名用本方案的同態(tài)加密方案進(jìn)行加密得到其密文,然后將其密文上傳到云端,再接著根據(jù)公式(11)(12)在云端找到要下載的文件進(jìn)行下載,設(shè)待檢索文件的文件名密文為cindex,云端文件的文件名密文為ci

        (11)

        (12)

        在云端按公式(13)進(jìn)行文件匹配,設(shè)匹配結(jié)果為result,則

        result = (ci-cindex)qribmodN=

        (13)

        其中:N=pq,使用上述公式時(shí),向云端上傳N和 qri,因?yàn)閞i是檢索時(shí)隨機(jī)產(chǎn)生的,所以從N和qri是無(wú)法得出密鑰p的,所以上述公式是安全的。從上述公式得出,若result=0,則mi-mindex=0,即在云端匹配到要下載的文件,然后從云端下載文件即可。

        4 實(shí)驗(yàn)論證

        4.1 與文獻(xiàn)[12]的方案檢索準(zhǔn)確率對(duì)比

        在此部分采用的待檢索的文檔為test2,test3,test4,test5,test6,檢索時(shí),輸入關(guān)鍵詞others,兩個(gè)方案的實(shí)驗(yàn)結(jié)果如圖7~8所示。

        圖7 文獻(xiàn)[12]的方案

        圖8 BVH

        由于這里采用的同態(tài)加密是基于整數(shù)的,為了保證同態(tài)性,在這里對(duì)相似度計(jì)算結(jié)果的精度作了限制,由實(shí)驗(yàn)結(jié)果得知,文獻(xiàn)[12]提出的方案僅僅列出了包含關(guān)鍵詞others的文檔,它并沒(méi)有對(duì)檢索到的文檔按相似度大小排序,因此相比文獻(xiàn)[12]提出的方案,BVH在檢索的準(zhǔn)確率上有了一定的提升。

        4.2 與文獻(xiàn)[12]的方案檢索效率對(duì)比

        此部分選取了7組數(shù)據(jù),其如表1所示。

        表1 實(shí)驗(yàn)數(shù)據(jù)

        其實(shí)驗(yàn)結(jié)果如圖9所示。

        圖9 BVH和文獻(xiàn)[12]檢索效率對(duì)比圖

        5 方案分析

        由上述實(shí)驗(yàn)結(jié)果可得,BVH和文獻(xiàn)[12]提出的同態(tài)環(huán)境下的密文檢索方案其性能對(duì)比如表2所示。

        表2 性能對(duì)比表BVH文獻(xiàn)[12]提出的密文檢索方案安全性高高準(zhǔn)確率高低檢索效率高低在BVH中,上傳到云端的是文件集的密文和文件向量集的密文,其檢索操作都是直接針對(duì)密文進(jìn)行的,從以上可以看出,本方案很好的解決了云端數(shù)據(jù)的安全問(wèn)題。

        BVH所采用的模型為基于TF-IDF的向量空間模型,很好的解決了現(xiàn)有的密文檢索技術(shù)不能按相似度對(duì)檢索到的文件進(jìn)行排序的問(wèn)題,因此方案其BVH檢索的準(zhǔn)確率相比文獻(xiàn)[12]提出的密文檢索方案要高。

        因?yàn)橥瑧B(tài)加密方案加密過(guò)程可能會(huì)產(chǎn)生噪音,即隨著電路深度的增加有可能不滿(mǎn)足同態(tài)特性,若要使它成為一個(gè)全同態(tài)加密方案,就需要采用解密電路壓縮技術(shù)和重加密技術(shù),這在實(shí)現(xiàn)起來(lái)是非常困難的,為了解決這個(gè)問(wèn)題,BVH在計(jì)算相似度時(shí),將計(jì)算過(guò)程分為多步進(jìn)行,一部分在云端進(jìn)行,一部分在客戶(hù)端進(jìn)行,以此保證在云端密文的計(jì)算滿(mǎn)足同態(tài)性,由于在云端針密文計(jì)算的復(fù)雜度大大降低,而且在客戶(hù)端文件向量的模預(yù)處理階段已經(jīng)計(jì)算好了,因此相比文獻(xiàn)[12]提出的密文檢索方案,BVH的密文檢索效率會(huì)有所提高。

        6 結(jié)論

        本文首先分析了現(xiàn)有的全同態(tài)加密算法,然后再此基礎(chǔ)上,提出了一個(gè)基于整數(shù)的同態(tài)加密算法。其次介紹了現(xiàn)有的一些密文檢索技術(shù)并指出了它們存在的缺點(diǎn)。最后結(jié)合同態(tài)加密技術(shù)和基于TF-IDF的向量空間模型,提出了一個(gè)同態(tài)環(huán)境下的密文檢索方案BVH,此方案有以下優(yōu)點(diǎn):首先,該方案采用同態(tài)加密技術(shù)對(duì)云端的數(shù)據(jù)加密,在云端都是直接針對(duì)密文進(jìn)行操作的,這在一定程度上保證了云端數(shù)據(jù)的安全性。其次,該方案中采用了基于TF-IDF的向量空間模型,它會(huì)對(duì)檢索到的文件按相似度從大到小進(jìn)行排序,最后把結(jié)果返回給用戶(hù)。綜上所述,方案BVH既能保證云端數(shù)據(jù)的安全,又能保證檢索數(shù)據(jù)的準(zhǔn)確性,所以它更加符合云端數(shù)據(jù)檢索的實(shí)際需求。

        [1]馮登國(guó),張 敏,張 妍,等. 云計(jì)算安全研究[J]. 軟件學(xué)報(bào),2011,22(1):71-83.

        [2]張雪嬌. 基于整數(shù)上同態(tài)加密的云存儲(chǔ)密文檢索系統(tǒng)[D]. 青島:中國(guó)海洋大學(xué),2013.

        [3]Aderemi A. Atayero, Oluwaseyi Feyisetan. Security Issues in Cloud Computing: The Potentials of Homomorphic Encryption [J].Journal of Emerging Trends in Computing and Information Sciences, 2011,2(10):546-552.

        [4]Craig Gentry, Palo Alto. Fully homomorphic encryption using ideal lattices[A]. STOC '09 Proceedings of the 41st annual ACM symposium on Theory of computing[C]. 2009,3(10): 169-178 .

        [5]Yin L F. The Analysis of Critical Technology on Cloud Storage Security[A]. 2013 International Conference on Computer Sciences and Applications[C].2013,2(7):26-28.

        [6]岳秋玲.有限素域上的全同態(tài)加密方案及其應(yīng)用研究[D].哈爾濱:黑龍江大學(xué),2014.

        [7]湯殿華,祝世雄,曹云飛. 一個(gè)較快速的整數(shù)上的全同態(tài)加密方案[J]. 計(jì)算機(jī)工程與應(yīng)用,2012,3(2):117-122.

        [8]譚凱麗.飛行記錄數(shù)據(jù)云存儲(chǔ)安全通信研究 [D].沈陽(yáng):沈陽(yáng)航空航天大學(xué),2014.

        [9]趙英明.基于同態(tài)加密的密文檢索技術(shù)研究 [D].包頭:內(nèi)蒙古科技大學(xué),2014.

        [10]黃永峰,張久嶺,李 覓. 云存儲(chǔ)應(yīng)用中的加密存儲(chǔ)及其檢索技術(shù)[J]. 中興通訊技術(shù),2010,3(4):33-35.

        [11]Schmidt P. Fully Homomorphic Encryption: Overview and Cryptanalysis[D]. Diploma Thesis, Technische Universitat Dortmund, 2011.

        [12]郭璐璐. 云存儲(chǔ)密文檢索方法的研究[J]. 技術(shù)研究,2013,4(9):6-8.

        Cipher text Retrieval Technology Based on Homomorphic Encryption

        Lü Wenbin,Gong Changqing

        (College of Computer Science, Shenyang Aerospace University, Shenyang 110136, China)

        The existing cipher text retrieval techniques mainly adopt the Boolean model and can not calculate accurately the related degree of the search terms and the retrieved documents, then it can not sort precisely. In view of the above situation, combined with homomorphic encryption technology and vector space model technique based on TF-IDF, the paper proposed a cipher text retrieval scheme BVH , BVH is divided into three steps: the first is preprocessing stage, it's main work is the establishment of inverted index file and vector set, and the calculation of each document vector module, then uploads the encrypted document vectors and files to the cloud. The second stage is the retrieval stage, it mainly multiplys key words vector cipher text and each file vector cipher text and returns the result cipher text to the client. The third stage is the result process stage, it mainly decrypts the returned results, processes the decrypted results, and then sorts the processing results according to the similarity. The results of analysis show that the scheme has greatly improved in the safety, precision and retrieval efficiency.

        homomorphic encryption ; vector space modal ; inverted index; cipher text retrieval ;similarity

        2015-08-26;

        2015-10-26。

        遼寧省教育廳科學(xué)基金(L2013064);中航工業(yè)技術(shù)創(chuàng)新基金(基礎(chǔ)研究類(lèi))(2013S60109R)。

        呂文斌(1988-),男,山西省運(yùn)城市人,碩士研究生,主要從事同態(tài)加密方向的研究。

        拱長(zhǎng)青(1965-),男,內(nèi)蒙古省赤峰市人,教授,碩士研究生導(dǎo)師,主要從事云安全,下一代網(wǎng)絡(luò)方向的研究。

        1671-4598(2016)03-0154-05

        10.16526/j.cnki.11-4762/tp.2016.03.042

        TP309.7

        B

        猜你喜歡
        同態(tài)密文云端
        一種針對(duì)格基后量子密碼的能量側(cè)信道分析框架
        一種支持動(dòng)態(tài)更新的可排名密文搜索方案
        基于模糊數(shù)學(xué)的通信網(wǎng)絡(luò)密文信息差錯(cuò)恢復(fù)
        關(guān)于半模同態(tài)的分解*
        拉回和推出的若干注記
        云端之城
        美人如畫(huà)隔云端
        行走在云端
        初中生(2017年3期)2017-02-21 09:17:43
        云端創(chuàng)意
        一種基于LWE的同態(tài)加密方案
        久久久成人av毛片免费观看| 精品人妻系列无码人妻免费视频 | 免费的一级毛片| 精品亚洲视频免费观看网站| 在线国产视频精品视频| 亚洲一区二区三区av无| 日本美女在线一区二区| 午夜福利理论片在线观看播放| 一本丁香综合久久久久不卡网站| 久久人人妻人人做人人爽| 欧洲午夜视频| 日韩精品成人一区二区三区久久久 | 婷婷色香五月综合激激情| 日本三级欧美三级人妇视频黑白配| 亚洲色在线视频| 亚洲综合免费在线视频| 麻豆精品一区二区综合av| 激情影院内射美女| 91亚洲国产成人aⅴ毛片大全| 日本一区二区日韩在线| 久久精品久99精品免费| 摸进她的内裤里疯狂揉她动图视频| 无遮挡亲胸捏胸免费视频| 亚洲毛片av一区二区三区| 中文字幕一区二区三区| 国产精品亚洲色婷婷99久久精品| 小sao货水好多真紧h视频| 国产经典免费视频在线观看| 国产成人一区二区三区| 在线精品首页中文字幕亚洲| 久久国产亚洲高清观看| 亚洲精品欧美二区三区中文字幕| 成人午夜免费福利| 草逼视频污的网站免费| 色综合久久蜜芽国产精品| 亚洲 自拍 另类 欧美 综合| 99RE6在线观看国产精品| 亚洲日本一区二区三区四区| 免费看黄a级毛片| 中文字幕无码免费久久| 性感人妻一区二区三区|