童 威, 黃啟萍, 王堂志
(1.安徽文達(dá)信息工程學(xué)院, 安徽 合肥 231201; 2.安徽電氣工程職業(yè)技術(shù)學(xué)院,安徽 合肥 230051)
位置大數(shù)據(jù)就是包含用戶位置信息的規(guī)模較大、產(chǎn)生速度較快、蘊(yùn)含價(jià)值較高且滿足用戶認(rèn)可的數(shù)據(jù),也正憑借其諸多優(yōu)勢(shì)被廣泛應(yīng)用,但位置大數(shù)據(jù)在給人們帶來便利的同時(shí),也存在泄露個(gè)人信息的風(fēng)險(xiǎn)。這是因?yàn)槲恢么髷?shù)據(jù)不僅包含了用戶的隱私信息,甚至連用戶的習(xí)慣、喜好、健康狀況等其他敏感信息都包括在內(nèi)[1],一旦大數(shù)據(jù)信息遭到破壞,那么用戶的隱私會(huì)受到極大的威脅,甚至影響人們的財(cái)產(chǎn)及生命安全。因此,對(duì)用戶位置大數(shù)據(jù)的隱私保護(hù)與加密的研究是極其必要的。傳統(tǒng)的用戶位置加密方法產(chǎn)生時(shí)間較為久遠(yuǎn),能夠?qū)蝹€(gè)用戶的位置數(shù)據(jù)進(jìn)行隱私保護(hù),但隨著數(shù)據(jù)量的增加,傳統(tǒng)加密方法便不再受用,常常出現(xiàn)用戶位置數(shù)據(jù)獲取誤差大、隱私數(shù)據(jù)保護(hù)程度不高等現(xiàn)象[2],嚴(yán)重限制了用戶位置加密的進(jìn)一步發(fā)展,為此本文提出并設(shè)計(jì)了一種基于隱私保護(hù)的位置大數(shù)據(jù)加密方法。為驗(yàn)證該方法的可行性,在仿真平臺(tái)內(nèi)進(jìn)行用戶位置大數(shù)據(jù)的加密保護(hù)實(shí)驗(yàn),結(jié)果表明,基于隱私保護(hù)的加密方法能夠?qū)τ脩舻奈恢脭?shù)據(jù)進(jìn)行長(zhǎng)期有效的保護(hù),為人們的日常生活提供了更多的便利。
用戶在允許位置的訪問權(quán)限時(shí),移動(dòng)設(shè)備會(huì)立即獲取這一時(shí)刻用戶的經(jīng)緯度信息,并用(x,y,t)的形式表示,其中,x代表位置的經(jīng)度;y代表位置的緯度;t代表獲取這一位置信息的時(shí)刻?,F(xiàn)階段,我國(guó)用戶位置數(shù)據(jù)的定位主要通過GPS實(shí)現(xiàn),根據(jù)多個(gè)衛(wèi)星與同一移動(dòng)設(shè)備之間的通信,實(shí)時(shí)獲取移動(dòng)設(shè)備的定位信息,并利用三角測(cè)量方法[3],精準(zhǔn)獲取移動(dòng)設(shè)備的經(jīng)緯度;再通過移動(dòng)設(shè)備的互聯(lián)網(wǎng)功能,在保證互聯(lián)網(wǎng)連接的前提下,找準(zhǔn)互聯(lián)網(wǎng)與移動(dòng)設(shè)備的對(duì)應(yīng)關(guān)系,便可在數(shù)據(jù)庫中找到目標(biāo)定位對(duì)象,當(dāng)移動(dòng)設(shè)備連接到某個(gè)局域網(wǎng)時(shí),GPS也可以將用戶的位置數(shù)據(jù)進(jìn)行準(zhǔn)確獲取。
結(jié)合GPS系統(tǒng)的定位優(yōu)勢(shì),將其引入數(shù)據(jù)的加密過程中,當(dāng)有用戶的隱私數(shù)據(jù)被泄露時(shí),數(shù)據(jù)的隱私保護(hù)機(jī)構(gòu)會(huì)立即獲取移動(dòng)設(shè)備的信號(hào)基站,并尋求其他設(shè)備的支援保護(hù)。在有移動(dòng)設(shè)備接入互聯(lián)網(wǎng)的前提下,對(duì)用戶的位置數(shù)據(jù)進(jìn)行隱私保護(hù),并隨機(jī)分配一個(gè)IP地址[4],這個(gè)IP地址便是位置大數(shù)據(jù)的映射形式,用戶利用這一映射關(guān)系,將位置數(shù)據(jù)進(jìn)行識(shí)別,以尋找最優(yōu)的保護(hù)策略。
針對(duì)用戶的位置數(shù)據(jù)進(jìn)行隱私保護(hù)與加密,對(duì)位置數(shù)據(jù)的區(qū)分與提取顯得尤為重要。當(dāng)用戶在獲得自己的位置信息以后,移動(dòng)設(shè)備的簽到應(yīng)用和導(dǎo)航功能便會(huì)立即啟動(dòng),那么在眾多數(shù)據(jù)中,只要帶有(x,y,t)表示形式的數(shù)據(jù)便被歸為位置數(shù)據(jù)集,再根據(jù)IP地址的映射關(guān)系[5],尋找恰當(dāng)?shù)姆绞綄?duì)這些數(shù)據(jù)集進(jìn)行加密保護(hù)。
若位置數(shù)據(jù)集中混入其他非位置數(shù)據(jù)或具有攻擊性的數(shù)據(jù)時(shí),根據(jù)數(shù)據(jù)的其他屬性,將不屬于位置屬性的其他數(shù)據(jù)進(jìn)行剔除或銷毀。當(dāng)用戶收到位置請(qǐng)求服務(wù)時(shí),帶有(x,y,t)形式的數(shù)據(jù)還具有非線性特征,那么具有線性特征的數(shù)據(jù)便會(huì)立即被剔除;攻擊數(shù)據(jù)屬性更具識(shí)別性,本次分析不對(duì)惡意數(shù)據(jù)進(jìn)行仔細(xì)分析,一旦系統(tǒng)檢測(cè)到惡意數(shù)據(jù)后,會(huì)立即將其銷毀,那么此時(shí)數(shù)據(jù)集內(nèi)有且僅有用戶的位置數(shù)據(jù)。
模糊加密理論主要包含兩個(gè)層面,一個(gè)是位置數(shù)據(jù)的空間模糊;另一個(gè)是位置數(shù)據(jù)的時(shí)間模糊,只要保證這兩個(gè)層面的模糊加密,才能對(duì)動(dòng)態(tài)性的位置數(shù)據(jù)進(jìn)行準(zhǔn)確的重組計(jì)算[6],以為數(shù)據(jù)的隱私加密過程提供精準(zhǔn)的數(shù)據(jù)基礎(chǔ)。用戶位置數(shù)據(jù)的空間和模糊加密過程如下:
用戶位置數(shù)據(jù)的空間模糊能夠在一定程度上通過降低位置數(shù)據(jù)精度的方式,保護(hù)用戶的位置信息,以滿足用戶的隱私需求。同時(shí),設(shè)有位置數(shù)據(jù)的妨礙區(qū),能夠?qū)⒂脩舻碾[私數(shù)據(jù)從一個(gè)模糊點(diǎn)轉(zhuǎn)化為一個(gè)模糊區(qū)域,使得用戶提交的位置數(shù)據(jù)具有隱蔽性,無法通過肉眼獲得用戶的清晰位置。用戶位置數(shù)據(jù)的空間模糊如圖1所示。
圖1中,(a)圖代表時(shí)刻內(nèi),從A到E這5個(gè)用戶的空間位置數(shù)據(jù);(b)圖代表這5個(gè)用戶的空間關(guān)系。
當(dāng)用戶A想要將黑色區(qū)域作為自己的模糊位置時(shí),在符合各項(xiàng)參數(shù)的前提下,只要對(duì)與A臨近的區(qū)域進(jìn)行隱私保護(hù),便可對(duì)全系統(tǒng)內(nèi)的位置數(shù)據(jù)實(shí)現(xiàn)統(tǒng)一的加密保護(hù),這樣一來,將用戶的位置數(shù)據(jù)限定在更小的區(qū)域內(nèi),便于對(duì)隱私數(shù)據(jù)的查詢[8]。
考慮到用戶位置的隱私需求能夠在兩個(gè)連續(xù)的區(qū)域內(nèi)實(shí)現(xiàn)加密保護(hù),因此本次設(shè)計(jì)結(jié)合用戶的實(shí)際需求,對(duì)隱私保護(hù)的修正速度進(jìn)行優(yōu)化,使得用戶的位置信息在這種隱私需求下得到擴(kuò)展,允許每個(gè)用戶具有小規(guī)模的模糊要求[7]。這種將隱私保護(hù)作為技術(shù)支持的加密保護(hù)方式,不但大大降低了位置數(shù)據(jù)的加密難度,還能縮短用戶的請(qǐng)求響應(yīng)時(shí)間,提高數(shù)據(jù)加密過程中的保護(hù)速度,提高方法的加密保護(hù)效率。
位置大數(shù)據(jù)的時(shí)間模糊加密理論,是通過增加位置數(shù)據(jù)時(shí)域不確定性的方式,減少位置數(shù)據(jù)的精度,進(jìn)而實(shí)現(xiàn)位置數(shù)據(jù)的加密過程,如圖2所示。
圖1 位置數(shù)據(jù)空間模糊示意圖
圖2代表一個(gè)用戶位置數(shù)據(jù)點(diǎn)C在移動(dòng)設(shè)備網(wǎng)絡(luò)中的移動(dòng)過程,在經(jīng)過時(shí)間模糊后,位置數(shù)據(jù)點(diǎn)的移動(dòng)狀態(tài)如表1所示。
表1 時(shí)間模糊后位置數(shù)據(jù)的移動(dòng)狀態(tài)
分析表1可知,數(shù)據(jù)點(diǎn)C在任一時(shí)間模糊函數(shù)內(nèi)均能正常移動(dòng),因此說明該狀態(tài)函數(shù)具備有效性。
由于時(shí)間模糊函數(shù)對(duì)位置數(shù)據(jù)的模糊程度要求較高,因此實(shí)際應(yīng)用過程中,要考慮用戶位置數(shù)據(jù)在時(shí)間維度上的變化特征,并利用這一特征的時(shí)域進(jìn)行動(dòng)態(tài)模糊,實(shí)現(xiàn)用戶位置大數(shù)據(jù)的隱私保護(hù)需求。
在確定用戶位置大數(shù)據(jù)的定位與表示準(zhǔn)確的前提下,結(jié)合數(shù)據(jù)的空間和時(shí)間模糊加密理論,對(duì)數(shù)據(jù)的保護(hù)強(qiáng)度進(jìn)行選定[9]。假設(shè)位置數(shù)據(jù)的隱私預(yù)算記作ε,對(duì)用戶查詢的相關(guān)位置數(shù)據(jù)集進(jìn)行集權(quán)化處理,使之滿足差分隱私保護(hù)計(jì)算的要求,集權(quán)化處理過程如下:
(1)
式中,U代表滿足隱私保護(hù)計(jì)算的用戶位置數(shù)據(jù),即具有位置特征的大數(shù)據(jù)集;Qi代表原始位置數(shù)據(jù)的查詢結(jié)果,Qi∈(x,y,t);S代表范數(shù)距離,本次引用計(jì)算不做定向分析。
考慮到互聯(lián)網(wǎng)系統(tǒng)中,用戶的位置數(shù)據(jù)體量大、更新速度快、數(shù)據(jù)組合形式復(fù)雜等特征,直接對(duì)用戶位置大數(shù)據(jù)進(jìn)行加密計(jì)算,可能會(huì)激活數(shù)據(jù)的敏感屬性[10],最終導(dǎo)致位置數(shù)據(jù)隨著時(shí)間的變化而變化,影響最終的加密效果。為避免這一現(xiàn)象的發(fā)生,本次計(jì)算加入一個(gè)位置數(shù)據(jù)的敏感系數(shù)Δβ和閾值N。一旦位置數(shù)據(jù)集中的計(jì)算目錄超過數(shù)據(jù)敏感度閾值,則必須停止計(jì)算,對(duì)數(shù)據(jù)集進(jìn)行重新調(diào)節(jié),實(shí)時(shí)監(jiān)管并獲取用戶的位置數(shù)據(jù),滿足數(shù)據(jù)加密保護(hù)的最新要求。位置數(shù)據(jù)的敏感度計(jì)算過程如下:
(2)
式中,P代表符合加密規(guī)則的位置數(shù)據(jù);γ代表數(shù)據(jù)的離散屬性集合,其中,U·Δβ≤N。
在此基礎(chǔ)上,結(jié)合差分算法的要求,設(shè)計(jì)基于隱私保護(hù)的數(shù)據(jù)加密算法模型,在滿足用戶位置數(shù)據(jù)加密的前提下,對(duì)用戶的服務(wù)質(zhì)量進(jìn)行預(yù)期評(píng)價(jià),得到最終的加密系數(shù):
(3)
式中,E代表隱私保護(hù)加密計(jì)算系數(shù);e2代表對(duì)同一位置數(shù)據(jù)加密時(shí)的查詢函數(shù);Rk代表數(shù)據(jù)敏感度的近似程度。分析可知,數(shù)據(jù)的近似程度Rk越高,則得到的加密系數(shù)越大,那么表明用戶位置大數(shù)據(jù)的服務(wù)質(zhì)量越高,誤差越小,對(duì)位置數(shù)據(jù)的隱私保護(hù)強(qiáng)度越高。
通過上述定義,將基于隱私保護(hù)的加密方法在互聯(lián)網(wǎng)系統(tǒng)內(nèi)進(jìn)行一次位置大數(shù)據(jù)的加密推演。當(dāng)用戶匿名發(fā)布的位置數(shù)據(jù)符合查詢要求時(shí),通過表述用戶位置數(shù)據(jù)的方式,區(qū)分?jǐn)?shù)據(jù)庫中的非位置數(shù)據(jù);再結(jié)合模糊加密理論,得到位置數(shù)據(jù)的時(shí)間及空間特征,最后簡(jiǎn)化計(jì)算步驟,保證加密計(jì)算的可用性能,從而獲得快速、準(zhǔn)確的用戶位置大數(shù)據(jù)加密效果。
在仿真平臺(tái)內(nèi)對(duì)本文基于隱私保護(hù)的加密方法是否可行進(jìn)行驗(yàn)證,設(shè)置仿真實(shí)驗(yàn)環(huán)境如表2所示。
表2 實(shí)驗(yàn)環(huán)境設(shè)置
由于經(jīng)匿名計(jì)算后的位置數(shù)據(jù)具有不穩(wěn)定性,因此其中的位置數(shù)據(jù)都是動(dòng)態(tài)的、分散的,不具有任何關(guān)聯(lián)特征,那么選擇對(duì)數(shù)據(jù)加密前后的惡意數(shù)據(jù)攔截量與加密誤差作為衡量標(biāo)準(zhǔn)是可行的。同時(shí),為保證實(shí)驗(yàn)的嚴(yán)謹(jǐn)性,采用傳統(tǒng)加密方法與本文隱私保護(hù)加密方法進(jìn)行對(duì)比,在固定閾值內(nèi),分析兩方法對(duì)惡意攻擊信息的攔截量與位置大數(shù)據(jù)加密誤差,實(shí)驗(yàn)結(jié)果如圖3所示。
圖3 仿真實(shí)驗(yàn)結(jié)果對(duì)比
圖3中,(a)圖代表兩方法對(duì)惡意攻擊數(shù)據(jù)的攔截量對(duì)比;(b)圖代表兩方法對(duì)位置大數(shù)據(jù)的加密誤差對(duì)比。從圖3可以看出,兩方法對(duì)惡意攻擊數(shù)據(jù)的攔截量及位置大數(shù)據(jù)的加密誤差均相差較多,本文方法的優(yōu)勢(shì)明顯。(a)圖中,隨著變換尺度的增加,傳統(tǒng)方法對(duì)惡意攻擊數(shù)據(jù)的攔截量有所提高,但仍低于本文方法的惡意數(shù)據(jù)攔截量,計(jì)算可知,本文方法的惡意數(shù)據(jù)攔截量高達(dá)97.68%,而傳統(tǒng)方法對(duì)惡意攻擊數(shù)據(jù)的有效攔截量?jī)H為85.91%。(b)圖中,當(dāng)數(shù)據(jù)集為3時(shí),兩方法的數(shù)據(jù)加密誤差最為接近,但對(duì)于其他數(shù)據(jù)集的加密保護(hù),傳統(tǒng)方法存在的加密誤差在5.0左右,誤差嚴(yán)重影響了用戶的隱私安全。結(jié)合圖(a)和圖(b)可以看出,本文基于隱私保護(hù)的位置大數(shù)據(jù)加密方法的數(shù)據(jù)隱私保護(hù)效果較為理想,說明該隱私保護(hù)加密方法具有較好的穩(wěn)定性和有效性,較傳統(tǒng)方法具備極高的加密保護(hù)優(yōu)勢(shì)。
隨著人們對(duì)互聯(lián)網(wǎng)的依賴程度不斷提升,利用互聯(lián)網(wǎng)技術(shù)進(jìn)行數(shù)據(jù)交互與存儲(chǔ)時(shí),人們的安全問題也受到了不同程度的威脅,因此本文利用隱私保護(hù)手段,設(shè)計(jì)了一種對(duì)用戶位置大數(shù)據(jù)進(jìn)行加密保護(hù)的方法。但在本次研究中,還存在一些不足之處,例如引入模糊理論時(shí),沒有重視對(duì)用戶位置大數(shù)據(jù)的預(yù)處理過程,導(dǎo)致最終模糊加密的數(shù)據(jù)存在一定的噪聲,影響最后的加密誤差,雖然沒有對(duì)加密結(jié)果造成嚴(yán)重的影響,但希望在下一次的研究中,能夠針對(duì)位置大數(shù)據(jù)的預(yù)處理過程進(jìn)行有針對(duì)性的研究,以不斷將數(shù)據(jù)加密保護(hù)誤差縮小并無限趨于零,為用戶的隱私信息提供強(qiáng)有力的加密保護(hù),促進(jìn)我國(guó)互聯(lián)網(wǎng)技術(shù)的進(jìn)一步發(fā)展。