蔣 岑,吳 迪
(湖北工業(yè)大學(xué)工程技術(shù)學(xué)院,湖北武漢 430000)
由于無線通信自身存在較強(qiáng)廣播性,在傳輸信息時(shí)容易被第三方竊取。近年來,隱蔽無線通信的提出對(duì)這一問題取得突破性成果。此種通信方式更加強(qiáng)調(diào)對(duì)傳輸過程的保護(hù),減小竊聽者檢測(cè)概率。因其具有服務(wù)費(fèi)用低、使用方便等特點(diǎn),逐漸發(fā)展為用戶普遍使用的服務(wù)。隨之而來的安全問題日漸突出,由于第三方不能完全可信,通信信息需要以密文形式儲(chǔ)存。如果文檔信息量較大,則用戶對(duì)所需信息進(jìn)行檢索成為迫切需求。
針對(duì)上述問題,文獻(xiàn)[1]提出一種基于安全密文區(qū)間的檢索方案。對(duì)密鑰矩陣結(jié)構(gòu)進(jìn)行攻擊,同時(shí)引入隨機(jī)數(shù),使方案可以隱藏關(guān)鍵字大小的排列關(guān)系,確保關(guān)鍵字索引機(jī)密性,實(shí)現(xiàn)排列安全和歸并特征安全的目的。實(shí)驗(yàn)結(jié)果證明此方法可有效擴(kuò)展云儲(chǔ)存空間,減少檢索時(shí)間。文獻(xiàn)[2]結(jié)合模糊檢索特征與要求,構(gòu)建云儲(chǔ)存環(huán)境下安全密文模糊檢索模型。利用基于通配符與編輯距離的模糊集構(gòu)成方式,將關(guān)鍵詞詞頻信息當(dāng)作權(quán)值建立Huffman樹形索引結(jié)構(gòu),采用布隆過濾器儲(chǔ)存并匹配關(guān)鍵詞模糊集;最后,使用改進(jìn)的TF-IDF規(guī)則對(duì)檢索文檔做評(píng)價(jià)排序,得出用戶最滿意的結(jié)果。實(shí)驗(yàn)表明,該方法滿足儲(chǔ)存規(guī)模要求,檢索準(zhǔn)確度較高。
上述兩種方法雖然檢索結(jié)果能夠滿足用戶期望,但無法實(shí)現(xiàn)檢索安全與效率平衡。為此本文將改進(jìn)層次質(zhì)量聚類(IQHC Improved Quality Hierarchical Clustering)與多關(guān)鍵排序方法相結(jié)合,對(duì)隱蔽無線通信網(wǎng)絡(luò)傳輸信息云儲(chǔ)存密文進(jìn)行檢索。該方法不僅建立文件向量,還考慮關(guān)鍵字出現(xiàn)頻率與重要性,在進(jìn)行檢索時(shí)通過用戶對(duì)某關(guān)鍵字賦予的權(quán)重?cái)?shù)值,優(yōu)先返回用戶感興趣的檢索信息,提高檢索效率與準(zhǔn)確性。此外還可以保護(hù)用戶隱私,避免攻擊者獲取通信數(shù)據(jù)。傳輸與檢索效率不受網(wǎng)絡(luò)限制,實(shí)現(xiàn)安全與效率平衡。
與信息加密技術(shù)相比,隱蔽通信可提供更強(qiáng)的數(shù)據(jù)安全保障。在無線通信過程中,它能夠利用一定策略降低通信雙方傳輸過程被竊聽方檢測(cè)出來的概率[3],因此又被稱為低檢測(cè)率通信。在其通信信道模型中包括一個(gè)發(fā)射方Alice、接收方Bob和一個(gè)竊聽者Willie。隱蔽通信流程如圖1所示。
圖1 隱蔽通信流程
發(fā)射方若要和接收方之間進(jìn)行無線通信信息傳輸,且要保證此過程不被竊聽,但由于無線環(huán)境具有較強(qiáng)開放性,傳輸行為存在被檢測(cè)到的風(fēng)險(xiǎn)。隱蔽通信技術(shù)利用信號(hào)檢測(cè)相關(guān)原理分析遭到竊聽的可能性,構(gòu)建一個(gè)隱蔽的通信網(wǎng)絡(luò)。接收方獲取的接收符號(hào)序列[4]描述為yb=[yb(1),yb(2),…,yb(n)],其中
yb(i)=x(i)+nb(i),i=1,2,…,n
(1)
同理可得竊聽信道上獲取的符號(hào)序列表示為yw=[yw(1),yw(2)…,yw(n)],其中
yw(i)=x(i)+nw(i),i=1,2,…,n
(2)
發(fā)射方在無線通信環(huán)境中將信息按規(guī)定發(fā)送到接收方,此時(shí)竊聽者對(duì)觀測(cè)到的信號(hào)判斷是否發(fā)生秘密通信。為準(zhǔn)確判斷發(fā)射方與接收方是否進(jìn)行通信,竊聽者的檢測(cè)行為可以利用一個(gè)二元假設(shè)方程[5]描述
(3)
式中,H0是零假設(shè),表示沒有檢測(cè)到有效信號(hào),竊聽者只能獲取高斯白噪聲;H1屬于有效假設(shè),竊聽者檢測(cè)到了有效信號(hào)與高斯白的混合信號(hào)。竊聽者檢測(cè)性一般利用檢測(cè)概率PD表示,其表達(dá)式如下
PD=1-ξ
(4)
式中,ξ=α+β表示總檢測(cè)錯(cuò)誤率,α=PFA(D1|H0)為虛警概率,表示發(fā)射者沒有傳輸信息,是由于竊聽者的錯(cuò)誤判斷發(fā)生了通信行為;β=PMd=P(D0|H1)為漏檢概率,表示發(fā)射方進(jìn)行通信傳輸,但竊聽者并未檢測(cè)到。D1與D0表示二元檢測(cè)結(jié)果,分別描述發(fā)射方傳輸與未傳輸?shù)挠行盘?hào)。
AWGN信道屬于一種簡單信道模型經(jīng)常被用作無線通信分析,本文在此基礎(chǔ)上構(gòu)建的通信信道模型如圖2所示。
圖2 隱蔽通信信道模型圖
在圖2信道模型中,T表示傳輸策略,若T=1,發(fā)射方將消息M以速度R編碼為復(fù)值發(fā)送符號(hào)x=[x(1),x(2),…,x(n)],其中n表示碼塊長度;若T=0,發(fā)射方不會(huì)有消息傳出,此時(shí)傳輸符號(hào)表示為x=[0,0,…,0]。
1)云儲(chǔ)存平臺(tái)架構(gòu)
用戶通過無線網(wǎng)絡(luò)將數(shù)據(jù)傳輸?shù)皆苾?chǔ)存平臺(tái),此時(shí)不需要自行建立數(shù)據(jù)中心,避免儲(chǔ)存平臺(tái)重復(fù)構(gòu)建,增加儲(chǔ)存成本。云平臺(tái)結(jié)構(gòu)如圖3所示。
圖3 云儲(chǔ)存平臺(tái)架構(gòu)圖
由圖3可知,云儲(chǔ)存架構(gòu)主要分為儲(chǔ)存層、管理層、接口層以及訪問層。其中儲(chǔ)存層為該架構(gòu)最底層,主要包括硬件儲(chǔ)存設(shè)備與管理系統(tǒng)。該層次利用相同管理系統(tǒng)將不同類型儲(chǔ)存設(shè)備連接,實(shí)現(xiàn)海量通信數(shù)據(jù)的統(tǒng)一管控[6]。
2)密文檢索系統(tǒng)模型
檢索系統(tǒng)主要模塊如圖4所示。
圖4 檢索系統(tǒng)主要模塊
在檢索系統(tǒng)主要模塊環(huán)境下,構(gòu)建密文檢索系統(tǒng)模型,此模型中包含云儲(chǔ)存平臺(tái)、數(shù)據(jù)擁有者以及授權(quán)用戶群三個(gè)實(shí)體,如圖5所示。
圖5 云儲(chǔ)存環(huán)境下檢索系統(tǒng)模型
該系統(tǒng)運(yùn)行流程為:數(shù)據(jù)擁有者將密文集合發(fā)送到云儲(chǔ)存平臺(tái),然后數(shù)據(jù)擁有者認(rèn)證并授權(quán)能夠訪問的用戶,并將生成的密鑰發(fā)放給每一位成員。當(dāng)用戶需要檢索儲(chǔ)存信息時(shí),利用密鑰生成檢索陷門[7],并將陷門傳輸?shù)皆贫?,云平臺(tái)接收后,開始進(jìn)行查詢,最終將檢索結(jié)果反饋給用戶。
在儲(chǔ)存環(huán)境下對(duì)密文進(jìn)行檢索,信息向量維度高、冗余維度較多,其信息分布稀疏,造成計(jì)算開銷大,檢索效率低。為改善這一現(xiàn)象,本文對(duì)質(zhì)量層次聚類方法進(jìn)行改進(jìn),改進(jìn)后的聚類過程如下所示。
步驟一:生成樣本數(shù)量為N的文件向量B1,B2,…,BN,其中BN=(b1,b2,…,bq)屬于q維向量,若N>q時(shí),構(gòu)建樣本矩陣,對(duì)該矩陣中的元素進(jìn)行下述變換生成標(biāo)準(zhǔn)樣本矩陣Zij
(5)
步驟二:利用下述公式計(jì)算Zij的協(xié)方差矩陣C
C=(ZtZij)/(N-1)
(6)
式中,Zt為Zij的轉(zhuǎn)置矩陣。
步驟三:利用奇異值分解方法獲取矩陣C的特性方程|C-λIe|=0,獲得e個(gè)特征根,將這些特征根從大到小進(jìn)行排序[8],并根據(jù)公式(7)中貢獻(xiàn)率η計(jì)算主成分?jǐn)?shù)量
(7)
計(jì)算η的值,對(duì)于任意一個(gè)特征根λj(j=1,2,…,f),對(duì)方程組Rb=λjb進(jìn)行求解,獲得f個(gè)特征向量bj(j=1,2,…,f)。
步驟四:將經(jīng)過標(biāo)準(zhǔn)化處理的數(shù)據(jù)變量變換為主成分
(8)
式中,U1表示第一主成分,U2表示第二主成分,依次排列。對(duì)文件向量通過新的主成分描述出來,獲得經(jīng)過降維后的文件向量。
步驟五:假設(shè)E表示文件中最大聚類數(shù)量,相關(guān)性最小的閾值計(jì)作min(S),通過歐式距離判斷文件之間相關(guān)性與文件和聚類中心的相關(guān)程度[9]。
步驟六:對(duì)降維后的文件向量聚類。如果聚類數(shù)量k不穩(wěn)定,則增加一個(gè)新聚類中心。分別選取聚類中相關(guān)程度最小的分?jǐn)?shù)min(St)和相關(guān)程度最小閾值min(S)進(jìn)行對(duì)比,如果min(St) 步驟七:令上一步驟形成的聚類中心集合當(dāng)作第一級(jí)聚類中心C0,逐個(gè)判斷每個(gè)聚類中心包含的文件個(gè)數(shù),如果數(shù)量超出此前設(shè)定的閾值E,將此聚類分割為多個(gè)子聚類;反之不進(jìn)行子聚類劃分。將劃分出的子聚類當(dāng)作下一級(jí)聚類,反復(fù)執(zhí)行步驟七,直到所有聚類數(shù)量均符合閾值設(shè)定要求。 步驟八:重復(fù)以上步驟,直到全部聚類都滿足相關(guān)性與數(shù)量要求,完成聚類處理。 綜合考慮安全性需要,在檢索過程中需要隱藏一些索引詞和文件之間的聯(lián)系,但是這會(huì)導(dǎo)致檢索結(jié)果失去有序性。為解決這一問題,本文建立一個(gè)用戶興趣模型,該模型包括用戶基本信息與密文興趣向量兩部分,如圖6所示。 圖6 用戶興趣模型 在構(gòu)建用戶檢索興趣模型后,通過用戶定義關(guān)鍵字權(quán)值對(duì)密文進(jìn)行檢索。在云儲(chǔ)存下,多關(guān)鍵字檢索實(shí)現(xiàn)過程如下: 步驟一:對(duì)聚類過程中獲得文件向量利用關(guān)鍵字權(quán)重值對(duì)其表示,生成字典Fw與文件向量集合F。 步驟四:用戶選取一種較為安全的方式對(duì)文件加密,將加密后的文件集合與之前形成的文件及聚類索引共同發(fā)送到云服務(wù)器。 步驟六:用戶將陷門OW傳輸?shù)皆品?wù)器,云端利用內(nèi)積方程計(jì)算相關(guān)分?jǐn)?shù)Score,計(jì)算公式如下 Score=Ic×Ow (9) 云端利用上述公式先獲取陷門與聚類索引向量中一級(jí)聚類中心的內(nèi)積,找出評(píng)分最高聚類中心;其次計(jì)算陷門和子聚類中心的內(nèi)積[10],獲取第二級(jí)聚類中心。以此類推;最后得到陷門和密文索引向量的內(nèi)積,從而將得分最高的密文反饋給用戶,完成密文檢索。 本次仿真對(duì)所提算法、文獻(xiàn)[1]方法、文獻(xiàn)[2]方法進(jìn)行性能對(duì)比。為確保實(shí)驗(yàn)精準(zhǔn)性,不考慮次要因素對(duì)實(shí)驗(yàn)的影響,例如網(wǎng)絡(luò)帶寬、穩(wěn)定性等因素。實(shí)驗(yàn)設(shè)備包括服務(wù)器兩臺(tái)、客戶端一臺(tái),將通信傳輸信息儲(chǔ)存在云端。其索引過程流程如圖7所示。 圖7 仿真檢索過程圖 依據(jù)圖7過程,分別生成1000、2000、3000、4000、5000kB的不同規(guī)模文件,利用三種方法對(duì)其檢索,所用檢索時(shí)間如表1所示。 表1 不同方法密文檢索時(shí)間對(duì)比表 由表1測(cè)試結(jié)果可知,在文件大小相同情況下,本文方法密文檢索時(shí)間最短,且隨著文件規(guī)模擴(kuò)大,所需檢索時(shí)間增長幅度較小,檢索效率高于其它兩種方法。主要因?yàn)槔酶倪M(jìn)的質(zhì)量層次聚類方法降低了云儲(chǔ)存中信息維度,減少冗余數(shù)據(jù),因此提高檢索效率。 密文檢索的安全性主要表現(xiàn)在索引中關(guān)鍵詞數(shù)量、陷門的不可區(qū)分性、檢索模式以及相關(guān)程度分?jǐn)?shù)方面。表2為三種方法在安全方面的對(duì)比結(jié)果。 表2 不同方法安全性對(duì)比表 由表2可知,本文方法滿足所有安全性要求,而其它兩種方法在個(gè)別性能中無法保證檢索安全。主要由于所提方法在檢索過程中,利用可逆矩陣對(duì)索引向量進(jìn)行加密處理,不會(huì)泄露關(guān)鍵詞與文件之間的相關(guān)性, 陷門與檢索結(jié)果的映射關(guān)系被很好保護(hù),確保檢索安全。 5G時(shí)代到來,促使智能終端構(gòu)建出復(fù)雜多維的無線通信網(wǎng)絡(luò)。隨著云存儲(chǔ)應(yīng)用與發(fā)展,通常將通信網(wǎng)絡(luò)傳輸信息儲(chǔ)存在云端。為實(shí)現(xiàn)隱蔽無線通信傳輸信息云儲(chǔ)存的安全高效檢索,本文將改進(jìn)的質(zhì)量層次聚類與關(guān)鍵詞排序方法相結(jié)合,減少云儲(chǔ)存中冗余通信信息,對(duì)檢索行為進(jìn)行加密處理,實(shí)現(xiàn)了檢索效率與安全性相平衡。但為滿足用戶更多需求,在今后研究中需要擴(kuò)展其它功能,例如模糊搜索、支持動(dòng)態(tài)更新等。此外還可以與密碼學(xué)相結(jié)合,進(jìn)一步提高檢索安全性。3.3 多關(guān)鍵字檢索實(shí)現(xiàn)過程
4 仿真分析
5 結(jié)論