于文奇
(山東省青島市中國石油大學(華東)理學院 山東 青島 266580)
隨著大數(shù)據(jù)環(huán)境的到來,使人們的生活更加信息化、數(shù)據(jù)化,但是在帶來一定優(yōu)勢的同時也存在一些弊端,比如帶來的信息安全隱患。為了保護信息的私密性,最直接的方式便是設置密碼。如今密碼安全技術也得以發(fā)展進步,為了進一步滿足大數(shù)據(jù)環(huán)境下的信息安全需求,還應對密碼技術加大研究力度。
安全多方計算(SMC)是常用的一種云存儲中數(shù)據(jù)保護的方法,其為了對敏感數(shù)據(jù)加強保護,采用多個參與方的交互進行計算,因此使用SMC技術時需要各方進行信息交換、協(xié)作完成,而大數(shù)據(jù)的來源較為廣泛,具有較強的時效性,如運用SMC技術需要付出較大的通信代價,且無法滿足大數(shù)據(jù)處理對時效性和擴散的需求[1]。這種計算方式只適用于兩方計算,而不適合在多方來源大數(shù)據(jù)計算中應用。
密文檢索技術是促使隱私數(shù)據(jù)實現(xiàn)安全共享的重要途徑,這種設計的原理為:現(xiàn)將數(shù)據(jù)中的關鍵詞提取出來,然后對關鍵詞采取加密措施,將加密的關鍵詞與數(shù)據(jù)制作成一個密文整體,進而傳輸?shù)皆品掌髦衃2]。當前,密文檢索的方式主要有兩種,即對稱檢索加密與非對稱檢索加密。
對稱檢索加密思想在最初始提出的目的是為了對數(shù)據(jù)檢索的內(nèi)容進行加密,也可將其用到關鍵詞可檢索的對稱加密中。為了進一步優(yōu)化檢索性能和安全性能,接連很多研究成果都顯示,對稱檢索加密具有較高的安全性和極高的運算效率,但是也有一定缺點,即功能不多。有研究人員提出了雖然安全索引方案能夠?qū)崿F(xiàn)高效率的索引更新,而其服務器搜索的效率卻不高。截至目前,已經(jīng)有研究人士提出可檢索對稱加密算法具有良好的綜合性,但是這種方式的缺陷在于數(shù)據(jù)索引的更新過于繁瑣。
非對稱檢索具有較強的加密算法功能,但是其運算方式通常為橢圓曲線算法,與哈希函數(shù)及分組密碼運算相比其運算效率較低。隨著時間的推移,很多研究人員都對非對稱加密方案進行了研究改進,最終,關鍵詞能夠?qū)崿F(xiàn)公鑰加密,進一步實現(xiàn)了對關鍵詞的加密,使得對關鍵詞檢索人員在不知道關鍵詞真實內(nèi)容的基礎上判斷密文中是否含有此關鍵詞。公鑰加密的安全性較強,但是其檢索效率關系到云儲存空間,因此在檢索效率方面還不能滿足實際需求,這也是公鑰加密的最大缺陷[3],非對稱檢索加密算法能夠?qū)㈥P鍵詞檢索和區(qū)間詢問緊密聯(lián)系在一起。但是,截至目前,檢索還處于模糊狀態(tài),只能對返回結(jié)果排序給予支持,而對于關鍵詞檢索的數(shù)據(jù)加密還有待加強。
全同動態(tài)加密技術(FHE)可以在不解密的情況下便能隨意處理加密數(shù)據(jù),其有望成為對大數(shù)據(jù)進行安全分析的重點發(fā)展對象[4]。全同態(tài)加密相較于同態(tài)加密而言,區(qū)別重點在于一個“全”字,其表示沒有全面限制加密數(shù)據(jù),也就是說有利于實現(xiàn)多個任意同態(tài)加或乘。要想達到這一效果并不容易,直到2009年全同態(tài)加密方案才出現(xiàn)。
與數(shù)據(jù)匿名化技術相比,全同態(tài)加密能夠?qū)崿F(xiàn)對密文的直接處理,更有利于大數(shù)據(jù)安全;而相比多方安全計算來說,由于全同態(tài)加密具有非交互特點,因此更適合在多來源的大數(shù)據(jù)中應用。當然,運存儲中處理加密數(shù)據(jù)還包括可搜索加密以及保序加密的方式。比如,保序加密能將數(shù)據(jù)的順序泄露出去;而可搜索加密緊密關聯(lián)于其他信息,從而導致書庫分布被揭露。而全動態(tài)加密能夠?qū)崿F(xiàn)任意處理,其中包含排序和查詢的內(nèi)容,并且無需其他信息獨立完成保密。
然而,利用當前的全同態(tài)加密技術對大數(shù)據(jù)進行處理,隨著數(shù)據(jù)規(guī)模的范圍逐漸擴增以及處理難度逐漸上升,其性能便存在下降狀況,比如密文尺寸、公鑰尺寸、處理效率等都呈現(xiàn)上漲趨勢,導致擴展性和效率受到不良影響。
Hall等人在2011年對密文數(shù)據(jù)集采取了低維線性回歸的研究;Graepel等人在2012年學習了加密數(shù)據(jù)的機器,用于Fisher線性的分類器的訓練。上述研究只能體現(xiàn)出對一些特殊機器的學習算法,還無法滿足當前大數(shù)據(jù)加密的實際需求,因此還應對加密大數(shù)據(jù)相關機器的學習與分類方法加大研究力度。
大數(shù)據(jù)檢索是一種有效分析大數(shù)據(jù)安全的方式,大數(shù)據(jù)安全分析所檢索的加密大數(shù)據(jù)更為復雜。當前,檢索加密大數(shù)據(jù)工作,可能不能絕對安全,可能只能進行簡答的檢索,也可能缺乏對大數(shù)據(jù)集的支持。因此,有必要對加密大數(shù)據(jù)檢索加強研究,主要內(nèi)容為:檢索支持的數(shù)據(jù)類型不一致,比如非結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù);檢索支持的查詢類型不一致,比如Skyline查詢、余弦相似度的查詢等,進一步促進更為復雜的加密大數(shù)據(jù)檢索提供支持。
大數(shù)據(jù)分析能夠為大數(shù)據(jù)安全提供保障,大數(shù)據(jù)安全分析需要分析較為復雜的加密大數(shù)據(jù)。當前所分析統(tǒng)計的加密數(shù)據(jù)在數(shù)量和規(guī)模方面還比較小,數(shù)據(jù)集記錄只能達到上千,維度也都在4維之內(nèi),對海量加密數(shù)據(jù)來說并不適用。因此,有必要對加密大數(shù)據(jù)分析統(tǒng)計進行研究。研究內(nèi)容主要為:分析加密大數(shù)據(jù)的多變量;分析加密大數(shù)據(jù)的主分量;分析加密大數(shù)據(jù)的線性回歸。促進加密大數(shù)據(jù)的發(fā)展。
綜上所述,我國已經(jīng)邁入大數(shù)據(jù)時代,社會還處于飛速發(fā)展建設階段,大數(shù)據(jù)在給人們生活帶來便利的同時也會帶來一定信息安全隱患。為了將此類不良影響降到最低,就需要密碼安全技術作為保障,因此對安全密碼技術進行研究具有重要意義。