(北京信息職業(yè)技術(shù)學(xué)院,北京 100081)
21世紀(jì)是大數(shù)據(jù)的時代,它為人們帶來的巨大的機遇與財富,各行各業(yè)通過對大數(shù)據(jù)進行分析及深挖,從中找到有用信息進而提高企業(yè)效益。但是在另一方面來看,用戶個人數(shù)據(jù)的網(wǎng)絡(luò)化、透明化成為不可阻擋的大趨勢,如何對其隱私保護成為業(yè)內(nèi)人士注重的問題。如果不能加以有效保護,用戶在網(wǎng)絡(luò)中留下的數(shù)據(jù)信息很可能被惡意利用,造成意外甚至是難以挽回的經(jīng)濟損失。
現(xiàn)階段,傳感器可以自動采集用戶位置信息,其采集用戶位置信息的能力(速度、規(guī)模等)發(fā)展迅速,遠超當(dāng)前系統(tǒng)的處理速度。在將來,隨著移動傳感設(shè)備的發(fā)展與通信技術(shù)的進步,位置信息產(chǎn)生的速度會更快,頻率則更高,其均會為人們的日常生活及科學(xué)研究帶來極大的便利,這類包含位置信息且具有規(guī)模大、產(chǎn)生速度快、蘊含價值高等特點且被普遍認(rèn)可的數(shù)據(jù)被稱為位置大數(shù)據(jù)。
隱私是指與本人相關(guān)的且在不經(jīng)過本人的同意不可能在某些時間、某些地點以某種方式被公開,與一般的隱私定義有共同之處,大數(shù)據(jù)隱私是指用戶對自己位置信息的掌握。在當(dāng)今社會,企業(yè)與商家可以用各種各樣的方式獲取用戶的位置信息,并且企業(yè)與商家可以利用位置信息得到用戶的活動軌跡,利用活動軌跡可以對用戶的家庭住址、生活習(xí)慣、健康狀況及社會地位等進行初步推斷。比如,可以依據(jù)用戶出現(xiàn)在醫(yī)院的時間段及次數(shù)可以推斷用戶是醫(yī)院工作者還是身體出現(xiàn)了健康問題,進而對用戶進行下一步的推銷。
大數(shù)據(jù)隱私攻擊模型有統(tǒng)一的標(biāo)準(zhǔn)描述對用戶位置隱私信息的攻擊效果,不同的攻擊方法提供給攻擊者的用戶位置的數(shù)據(jù)量不同,攻擊者得到用戶的位置數(shù)據(jù)是需要用r(攻擊者取得的用戶的一條位置信息)、p(用戶的位置數(shù)據(jù))、t(收集到的用戶位置信息所對應(yīng)的時刻),因此攻擊者可以根據(jù)采集到的位置數(shù)據(jù)推斷用戶在t時刻處于某個敏感位置的概率。
在對大數(shù)據(jù)加密的方法進行設(shè)計時,我們需要引入模糊加密理論。這個模糊理論包括兩方面,一方面是對位置數(shù)據(jù)的空間模糊,另一個是對位置數(shù)據(jù)的時間模糊。位置數(shù)據(jù)的空間模糊是通過降低位置數(shù)據(jù)的精確度來對位置的空間數(shù)據(jù)進行模糊進而達到對用戶數(shù)據(jù)進行隱私保護的目的,這種方法可以將用戶的位置信息從一個點擴大到一片區(qū)域,使攻擊者無法直接得到用戶的具體位置信息。
圖1 位置數(shù)據(jù)空間模糊示意圖
圖2 位置數(shù)據(jù)時間模糊示意圖
a圖表示某一時刻內(nèi)A、B、C、D、E五個用戶的空間位置信息,b圖表示用戶之間的空間關(guān)系。
用戶如果想將黑色區(qū)域作為自身的模糊位置范圍,需要在符合各項要求的前提下對用戶的周圍區(qū)域進行保護,進而對系統(tǒng)內(nèi)的所有數(shù)據(jù)進行加密。針對本次設(shè)計的具體情況,進一步提高針對隱私保護的修正速度是重中之重。針對位置數(shù)據(jù)的模糊加密理論,他是通過對位置數(shù)據(jù)時域進行模糊,降低位置數(shù)據(jù)的精確度,進而加密位置數(shù)據(jù)。
在對用戶位置數(shù)據(jù)定位與表示準(zhǔn)確的情況下,利用位置數(shù)據(jù)的時間模糊加密理論與空間模糊加密理論選定位置數(shù)據(jù)信息的加密保護強度,假定用ε表示位置數(shù)據(jù)的隱私預(yù)算,對于用戶的隱私保護,需要對用戶的關(guān)聯(lián)位置的數(shù)據(jù)集合進行集權(quán)化處理:
U代表大數(shù)據(jù)集,他的特點為具有位置特征,Qi表示最初位置信息的查看結(jié)果,S是范數(shù)距離,但是暫時不使用。
為避免位置數(shù)據(jù)時時刻刻在變化對加密的效果產(chǎn)生影響,在計算中加入一個位置數(shù)據(jù)的敏感系數(shù)Δβ和閾值N,若計算目錄到達或超過敏感度閾值則停止計算,針對數(shù)據(jù)集進行調(diào)整。
綜合以上所述,設(shè)計數(shù)據(jù)加密算法模型,可以得出最后加密系數(shù)為:
數(shù)據(jù)越近似加密系數(shù)越大,這表明對用戶位置數(shù)據(jù)的隱私保護越好。
在對本加密方法進行仿真時需要提供合適的仿真環(huán)境。在進行仿真時為保證實驗的準(zhǔn)確,需要進行對比實驗。對用戶的位置數(shù)據(jù)采用兩種加密方法:傳統(tǒng)加密方法與上文的隱私保護加密方法,在閾值確定時,分析兩種方法對用戶隱私信息的保護程度。本文方法的惡意數(shù)據(jù)攔截量為97.68%,而傳統(tǒng)方法對惡意攻擊數(shù)據(jù)的有效攔截量僅為85.91%。綜上所述,本文的加密方法對用戶的隱私保護效果更加理想。
互聯(lián)網(wǎng)在滲透進入人們生活的方方面面,因此對于用戶的隱私保護問題更應(yīng)該受到人們的重視,本文特針對這一問題設(shè)計了用戶位置隱私保護加密方法,但是該方法仍然存在一些不足,希望在后續(xù)研究中可以針對這些不足加以改進。