亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于BIGRU的軌跡數(shù)據(jù)發(fā)布隱私保護(hù)方案

        2023-12-29 12:35:10申艷梅張玉陽申自浩劉沛騫
        關(guān)鍵詞:可用性差分分區(qū)

        申艷梅,張玉陽,申自浩,王 輝,劉沛騫

        (1.河南理工大學(xué) 軟件學(xué)院, 河南 焦作 454000;2.河南理工大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院, 河南 焦作 454000)

        0 引 言

        近年來,隨著通信技術(shù)和定位技術(shù)的發(fā)展,越來越多的設(shè)備具有位置數(shù)據(jù)搜集的能力?;谖恢梅?wù)(location-based services, LBS)[1]已經(jīng)廣泛應(yīng)用于各個(gè)領(lǐng)域,服務(wù)人民的生活。LBS技術(shù)可以分為兩類:單點(diǎn)LBS與連續(xù)LBS。其中,單點(diǎn)LBS是指用戶可以間斷地獲取位置信息,而連續(xù)LBS則需要用戶周期地獲取位置信息。盡管人們從LBS中獲益良多,但使用LBS時(shí)被搜集的數(shù)據(jù)可能包含個(gè)人隱私,若不經(jīng)處理直接進(jìn)行發(fā)布,很可能引起隱私的泄露[2]。

        目前位置隱私保護(hù)技術(shù)中,K-匿名是常用的方法之一?;贙-匿名及其延伸技術(shù)實(shí)現(xiàn)了對(duì)數(shù)據(jù)的泛化處理,使得每個(gè)用戶的記錄與多條錯(cuò)誤信息相匹配,攻擊者很難分辨出真正的用戶,從而保證個(gè)人的隱私。Gupta等[3]在考慮最小等待時(shí)間的情況下,將用戶的信息進(jìn)行保護(hù),提出了最佳移動(dòng)感知緩存數(shù)據(jù)預(yù)取和替換策略,引入匿名器,通過使用K-匿名預(yù)取設(shè)施,使得移動(dòng)用戶輸入形成一個(gè)掩蔽區(qū)域,提高了隱私保護(hù)程度。朱素霞等[4]認(rèn)為位置會(huì)影響隱私預(yù)算與軌跡形狀,進(jìn)而影響數(shù)據(jù)的可用性,因此,利用相關(guān)熵和K-means技術(shù),既保證了軌跡數(shù)據(jù)的隱私性,又增強(qiáng)了軌跡數(shù)據(jù)可用性。

        差分隱私技術(shù)[5]因其具有精確的數(shù)學(xué)表達(dá)方式和個(gè)性化的隱私保護(hù)而備受關(guān)注。Guo等[6]為解決LBS中位置隱私的暴露問題,設(shè)計(jì)了一種構(gòu)造匿名集的最佳輔助用戶選擇,并將差分隱私應(yīng)用于匿名集的構(gòu)建過程,添加自適應(yīng)拉普拉斯噪聲以滿足用戶的隱私要求,從而有效地保護(hù)了用戶的隱私。田豐等[7]為滿足不同用戶的隱私保護(hù)需求,給出了一種基于個(gè)性化差分隱私的軌跡發(fā)布機(jī)制,提高數(shù)據(jù)可用性,更好地兼顧隱私和數(shù)據(jù)的可用性。

        隨著機(jī)器學(xué)習(xí)相關(guān)技術(shù)的發(fā)展,現(xiàn)如今越來越多的學(xué)者嘗試將深度學(xué)習(xí)技術(shù)與差分隱私結(jié)合。晏燕等[8]提出基于深度學(xué)習(xí)的位置大數(shù)據(jù)劃分結(jié)構(gòu)預(yù)測方法和差分隱私發(fā)布方法。該方法構(gòu)建基于時(shí)空序列的深度學(xué)習(xí)預(yù)測模型,通過提取歷史位置大數(shù)據(jù)統(tǒng)計(jì)劃分結(jié)構(gòu)矩陣的時(shí)間和空間相關(guān)特性,實(shí)現(xiàn)對(duì)劃分結(jié)構(gòu)矩陣的有效預(yù)測,從而解決傳統(tǒng)位置大數(shù)據(jù)統(tǒng)計(jì)劃分發(fā)布結(jié)構(gòu)不合理、劃分發(fā)布方法效率低下的問題。Chen等[9]提出新的軌跡發(fā)布算法RNN-DP,將循環(huán)神經(jīng)網(wǎng)絡(luò)與差分隱私技術(shù)相結(jié)合應(yīng)用于軌跡發(fā)布,提高了數(shù)據(jù)可用性。

        針對(duì)循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN)無法處理長距離數(shù)據(jù)以及大多數(shù)隱私保護(hù)方案無法抵御背景知識(shí)攻擊的問題,本文利用差分隱私(differential privacy,DP)與循環(huán)神經(jīng)網(wǎng)絡(luò)技術(shù),提出一種面向軌跡數(shù)據(jù)發(fā)布的雙向門控循環(huán)神經(jīng)網(wǎng)絡(luò)差分隱私(bidirectional gated recurrent unit-differential privacy,BIGRU-DP)保護(hù)方案,以達(dá)到在抵御背景知識(shí)攻擊的同時(shí)提高數(shù)據(jù)的可用性的目的。該方案能夠更好地對(duì)長距離軌跡數(shù)據(jù)進(jìn)行處理,降低梯度爆炸與梯度消失造成的影響,更好地適應(yīng)不同類型的軌跡數(shù)據(jù)。

        1 相關(guān)定義

        定義1ε-DP[10]。給定隨機(jī)算法M:D→Rn以及任意相鄰數(shù)據(jù)集D和D′,其輸入為一個(gè)數(shù)據(jù)集,輸出為n維實(shí)數(shù)向量。若隨機(jī)算法M對(duì)D和D′進(jìn)行操作,得到的任意輸出均使得結(jié)果S?Range(M),且滿足

        Pr[M(D)∈S]≤eε×Pr[M(D′)∈S]

        (1)

        則稱算法M滿足ε-DP。其中,ε為隱私預(yù)算,ε越接近于0,則算法M作用于D和D′輸出的概率分布越相似,隱私保護(hù)效果越好。

        定義2全局敏感度。設(shè)有查詢函數(shù)f:D→R,以及任意的鄰近數(shù)據(jù)集D和D′,函數(shù)f的敏感度定義為

        Δf=maxD,D′‖f(D)-f(D′)‖1

        (2)

        差分隱私通過對(duì)數(shù)據(jù)加上噪聲的方式來保證對(duì)數(shù)據(jù)隱私的保護(hù)。其中,全局敏感度Δf是一個(gè)十分重要的參數(shù)。通過控制全局敏感度,從而控制添加噪聲的大小,實(shí)現(xiàn)滿足差分隱私的隱私保護(hù)。

        定義3軌跡數(shù)據(jù)集。軌跡是若干位置點(diǎn)依據(jù)其時(shí)間戳組成的位置序列。其中,位置Pi=(xi,yi,ti)為地圖上離散點(diǎn),xi和yi分別為位置點(diǎn)Pi的經(jīng)度和維度,ti為記錄該位置點(diǎn)的時(shí)間戳。軌跡可以表示為T=P1→P2→P3→…→Pn,其中,n為該軌跡的長度。由若干的軌跡組成的集合,稱為軌跡數(shù)據(jù)集,表示為D=(T1,T2,T3,…,Tq),q為該軌跡數(shù)據(jù)集中軌跡數(shù)量。

        定義4Laplace機(jī)制[11]。給定數(shù)據(jù)集D和隱私預(yù)算ε,查詢函數(shù)q的全局敏感度為Δf,當(dāng)查詢函數(shù)q的輸出滿足

        M(O)=q(O)+Lap(Δf/ε)

        (3)

        則稱算法M滿足ε-DP,且服從尺度參數(shù)為Δf/ε的Laplace分布。

        拉普拉斯機(jī)制通過向查詢函數(shù)加入符合拉普拉斯分布的噪聲,使加噪后滿足差分隱私,從而保護(hù)用戶隱私。記位置參數(shù)μ為0,尺度參數(shù)為b。則所添加噪聲的概率密度函數(shù)為

        (4)

        定義5指數(shù)機(jī)制。給定輸入為數(shù)據(jù)集D以及輸出為實(shí)體對(duì)象r∈Range,有可用性函數(shù)u:(D,r)→R,若算法M滿足

        (5)

        則算法M滿足ε-DP。其中,Δu為效用函數(shù)u:(D,r)全局敏感度,可通過(6)式計(jì)算得到。效用函數(shù)值越高,r被選擇輸出的概率越大。

        Δu=maxr∈,D~D′|u(D,r)-u(D′,r)|

        (6)

        性質(zhì)2并行組合原理。設(shè)有算法F1,F2,…,Fn,Fi(1<=i<=n)均滿足εi-DP,那么對(duì)于不相交的輸入數(shù)據(jù)集D1,D2,…,Dn,由這些算法構(gòu)成的組合算法F(F1(D1),F2(D2),…,Fn(Dn))滿足max(εi)-DP。

        2 BIGRU-DP方案

        2.1 系統(tǒng)架構(gòu)

        BIGRU-DP方案系統(tǒng)架構(gòu)如圖1所示,包含軌跡預(yù)測,軌跡泛化,軌跡合并,軌跡發(fā)布4個(gè)部分。

        圖1 系統(tǒng)架構(gòu)Fig.1 System architecture

        該方案實(shí)現(xiàn)隱私保護(hù)進(jìn)行軌跡數(shù)據(jù)發(fā)布步驟如下。

        步驟1軌跡預(yù)測模塊應(yīng)用BIGRU對(duì)軌跡進(jìn)行預(yù)測。與一般的神經(jīng)網(wǎng)絡(luò)不同,BIGRU不僅適用于處理時(shí)序數(shù)據(jù),相對(duì)于單向循環(huán)網(wǎng)絡(luò)能夠達(dá)到更精確的預(yù)測結(jié)果。

        步驟2軌跡泛化模塊使用K-means對(duì)時(shí)間屬性進(jìn)行泛化處理,降低時(shí)空相關(guān)性對(duì)于數(shù)據(jù)泄露的影響。

        步驟3軌跡合并模塊使用聚類技術(shù)與指數(shù)機(jī)制生成抽象軌跡數(shù)據(jù)集,并與原始軌跡進(jìn)行比較合并。

        步驟4軌跡發(fā)布模塊采用異常處理機(jī)制刪除異常軌跡,并對(duì)需要發(fā)布的軌跡數(shù)據(jù)集進(jìn)行加噪處理,抵御背景知識(shí)攻擊。

        2.2 軌跡預(yù)測

        鑒于RNN的梯度爆炸和梯度消失的缺陷,循環(huán)神經(jīng)網(wǎng)絡(luò)的發(fā)展催生出了門控循環(huán)網(wǎng)絡(luò)(gated recurrent unit,GRU),它能有效地處理上述問題,并能捕獲長距離依賴。BIGRU改進(jìn)了GRU,其結(jié)構(gòu)包含正反2個(gè)GRU層。時(shí)間步t處的輸入提供正反雙向隱藏狀態(tài)信息來進(jìn)行參考。在訓(xùn)練模型的過程中提供正向逆向2個(gè)隱藏信息,其中,參數(shù)根據(jù)公式(7)—(9)進(jìn)行更新。

        H′t=f(W1xt+W3H′t+b′t)

        (7)

        Ht=f(W2xt+W4Ht-1+bt)

        (8)

        Ht=H′t⊕Ht

        (9)

        使用BIGRU來進(jìn)行軌跡的預(yù)測,生成新的軌跡,從而達(dá)到隱藏原始軌跡的效果。在模型訓(xùn)練的過程中,BIGRU同時(shí)參考預(yù)測點(diǎn)兩側(cè)的數(shù)據(jù),因此,能夠獲得更加準(zhǔn)確的軌跡數(shù)據(jù)。算法1給出了軌跡預(yù)測生成的過程。

        算法1BIGRU-DP_prediction

        輸入:原始軌跡數(shù)據(jù)集D;

        輸出:預(yù)測后的軌跡數(shù)據(jù)集DBIGRU。

        1.forTinD;

        2.for eachPinT;

        3.xBIGRU=BIGRU(D,x);

        4.yBIGRU=BIGRU(D,y);

        5.end for;

        6.end for;

        7.TBIGRU=(XBIGRU_1,YBIGRU_1,t1)→(XBIGRU_2,YBIGRU_2,t2)→…→(XBIGRU_n,YBIGRU_n,tn);

        8.DBIGRU=(TBIGRU_1,TBIGRU_2,TBIGRU_3,…,TBIGRU_n);

        9.returnDBIGRU。

        2.3 軌跡泛化

        在得到DBIGRU軌跡數(shù)據(jù)集后,對(duì)其時(shí)間屬性進(jìn)行泛化處理,避免因軌跡的時(shí)空相關(guān)性帶來的隱私泄露。使用K-means聚類方法來實(shí)現(xiàn)所需的時(shí)間泛化。算法2描述了具體的泛化過程。

        算法2BIGRU-DP_Generalization

        輸入:預(yù)測后的軌跡數(shù)據(jù)集DBIGRU,位置點(diǎn)集X={X1,X2,X3,…,Xm};

        輸出:泛化后的分區(qū)集Pset=(P1,P2,…,Pn)。

        1.ifDBIGRU=? ;

        2.return null;

        3.end if;

        4.初始化k個(gè)簇心μ1,…,μk;

        5.repeat;

        6.forjfrom 1 tom;

        7.計(jì)算各位置點(diǎn)Xj與各聚類中心μi的距離;

        8.將該位置點(diǎn)Xj劃進(jìn)與其最近的樣本中心μi所在的簇中;

        9.end for;

        10.forifrom 1 tok;

        12.end for;

        13.until所有的聚類中心不再變化;

        14.記錄泛化后的分區(qū)集Pset=(P1,P2,…,Pn);

        15.returnPset。

        軌跡泛化如圖2所示。

        圖2 軌跡泛化Fig.2 Trajectory generalization

        2.4 軌跡合并

        考慮到軌跡數(shù)據(jù)存在維數(shù)高,位置范圍較大的問題,本方案通過對(duì)每個(gè)時(shí)間戳內(nèi)的位置進(jìn)行空間劃分來解決。即通過使用K-means聚類將同一個(gè)時(shí)間戳內(nèi)的位置劃分為k組,k值越大,則每個(gè)位置將與其他軌跡上的較少位置進(jìn)行合并,從而軌跡精度損失越小。劃分后如圖3所示。

        通過合并每個(gè)時(shí)間戳的位置點(diǎn),軌跡也會(huì)被合并,因此軌跡的計(jì)數(shù)就會(huì)增加。通過這種方式,使得即使添加小噪聲也不會(huì)對(duì)數(shù)據(jù)可用性造成過大影響。

        使用指數(shù)機(jī)制對(duì)在同一時(shí)間戳中的分區(qū)進(jìn)行選擇,并用候選分區(qū)的簇心代替該簇中的其他位置點(diǎn)。指數(shù)機(jī)制使用效用函數(shù)來對(duì)每一個(gè)候選分區(qū)進(jìn)行打分賦值,分?jǐn)?shù)較高的分區(qū)將會(huì)有更高的概率被輸出。根據(jù)文獻(xiàn)[14]中基于豪斯多夫距離設(shè)計(jì)的平均距離算法(mean distance,MeanDist),可以得到效用函數(shù)[13]為

        (10)

        (10)式中,

        (11)

        指數(shù)機(jī)制基于該效用函數(shù),則每一個(gè)分區(qū)Pi的輸出概率為

        (12)

        通過指數(shù)機(jī)制,能夠建立一個(gè)劃分區(qū)域內(nèi)部位置點(diǎn)與簇心的映射關(guān)系,從而達(dá)到泛化的效果。

        圖3 空間劃分Fig.3 Space division

        2.5 軌跡發(fā)布

        s個(gè)時(shí)間段與m個(gè)候選分區(qū)會(huì)有ms種劃分策略。將所有的真實(shí)軌跡替換為泛化軌跡,從而保護(hù)用戶的隱私。

        然而,使用新生成的泛化軌跡代替原始軌跡的同時(shí),會(huì)產(chǎn)生一些不存在的異常軌跡。針對(duì)這些異常軌跡,設(shè)計(jì)異常處理機(jī)制,將原始軌跡與泛化后的軌跡作對(duì)比并計(jì)數(shù)相對(duì)應(yīng)的真實(shí)軌跡數(shù)(true count,TC),將tc=0的數(shù)據(jù)進(jìn)行刪除,不但減少了處理空軌跡的資源,同時(shí)增加了發(fā)布軌跡的有效性。

        若直接將tc=1的軌跡進(jìn)行發(fā)布,很容易遭到背景知識(shí)攻擊。因此需要對(duì)其添加Laplace噪聲。選擇n條泛化軌跡,首先將具有原始軌跡的泛化軌跡納入選擇,將其數(shù)量記為n1,然后在剩余泛化軌跡中選擇n-n1條軌跡。

        然而,為了保證隱私性而添加噪聲,將會(huì)導(dǎo)致犧牲部分的數(shù)據(jù)可用性。因此,根據(jù)文獻(xiàn)[14]本文設(shè)計(jì)了一種后處理機(jī)制以保證數(shù)據(jù)的可用性。具體處理工作為將添加噪聲前的軌跡集映射為圖G,將泛化后的軌跡作為圖G的邊,其交叉點(diǎn)作為節(jié)點(diǎn),這種映射更加符合現(xiàn)實(shí)的軌跡網(wǎng)絡(luò)。為了降低添加噪聲對(duì)數(shù)據(jù)可用性的影響,規(guī)定對(duì)于任意的兩條邊x,y,若x的軌跡比y更多,則其tc(x)>tc(y)。令Cmean[i,j]表示S的一條子軌跡Sij的平均數(shù)。

        (13)

        則經(jīng)過約束性處理后的噪聲Lm可以表示為

        Lm=minj∈[m,n]maxi∈[1,j]Cmean[i,j]

        (14)

        排序處理后的序列S為

        S=

        (15)

        經(jīng)過處理后能提高數(shù)據(jù)的可用性。其處理過程如算法3所示。

        算法3BIGRU-DP_release

        輸入:合并優(yōu)化后的軌跡數(shù)據(jù)集Do,每條軌跡的真實(shí)計(jì)數(shù){tc1,tc2,…,tcN};

        輸出:經(jīng)過合并與異常機(jī)制處理后的軌跡數(shù)據(jù)集Dr。

        1.ifDo=?;

        2.return null;

        3.end if;

        5.for allp,q∈[1,n1];

        6.Δf=maxp,q{∣tcp-tcq∣};

        7.μ=ComputeAverage(ε);

        8.b=Δf/μ;

        9.end for;

        10.for alli∈[1,n1];

        12.nci=tc′+noise(x);

        13.end for;

        14.NC={nc1,nc2,…,ncN};

        16.S′=;

        17.forifrom 1 ton1;

        19.end for;

        21.returnDr。

        3 隱私安全證明

        結(jié)合差分隱私應(yīng)用到方案的不同模塊以滿足隱私安全需求。在軌跡合并模塊,首先在每個(gè)時(shí)間戳的位置區(qū)域上執(zhí)行聚類,得到該時(shí)間戳的候選分區(qū)集,然后使用指數(shù)機(jī)制在候選分區(qū)集中選擇一個(gè)區(qū)域。在軌跡發(fā)布模塊中,為了提高隱私保護(hù)程度,對(duì)tc添加Laplace噪聲。為了便于描述,分別將其稱為軌跡合并(trajectory merging,TM)和軌跡發(fā)布(trajectory release,TR)。

        定理1TM滿足ε-DP。

        因此,只需將隨機(jī)算法M的輸出進(jìn)行歸一化處理,即可得到輸出候選分區(qū)ri的概率密度。歸一化處理為

        (16)

        根據(jù)差分隱私定義,在相鄰數(shù)據(jù)集中通過隨機(jī)化算法M得到相同的輸出值ri的比值為

        (17)

        將(16)式代入(17)式,進(jìn)行展開運(yùn)算,則有

        (18)

        綜上,TM滿足ε-DP。

        定理2TR滿足ε-DP。

        證明對(duì)tc的集合TC={tc1,tc2,…,tcN},Δf為敏感度。

        M(D)=f(D)+Y

        (19)

        (19)式中:f為查詢函數(shù);Y為Laplace噪聲;M(D)為加入噪聲后的混淆返回結(jié)果。

        px(z)和py(z)分別為ML(x,f,ε)與ML(y,f,ε)的概率密度函數(shù)。因此,對(duì)于某個(gè)輸出z,有

        (20)

        對(duì)其進(jìn)行運(yùn)算推導(dǎo)可以得出

        (21)

        綜上,TR滿足ε-DP。

        定理3BIGRU-DP滿足ε-DP。

        證明:由于TM與TR均為BIGRU-DP的子算法,且TM與TR都滿足ε-DP,假設(shè)TM滿足ε1-DP,TR滿足ε2-DP,因此,BIGRU-DP滿足ε-DP,其中,ε=ε1+ε2。

        4 實(shí)驗(yàn)評(píng)估

        實(shí)驗(yàn)仿真采用Pycharm開發(fā)平臺(tái),以Python語言實(shí)現(xiàn)。實(shí)驗(yàn)所使用的軌跡數(shù)據(jù)集為微軟的T-Drive軌跡數(shù)據(jù)集。將BIGRU-DP與RNN-DP[9],NGTMA[14]進(jìn)行比較以證明該方案在可用性和性能上的優(yōu)勢。

        4.1 可用性評(píng)估

        本文使用Hausdorff[15]距離作為軌跡數(shù)據(jù)可用性的度量指標(biāo)。Hausdorff距離能夠很好地計(jì)算兩組集合之間的相似度。假設(shè)有2組集合A={a1,a2,…,ap},B={b1,b2,…,bq}則這2個(gè)點(diǎn)集合之間的Hausdorff距離定義為

        H(A,B)=max(h(A,B),h(B,A))

        (22)

        (22)式中,

        h(A,B)=max(a∈A)min(b∈B)‖a-b‖

        (23)

        h(B,A)=max(b∈B)min(a∈A)‖b-a‖

        (24)

        (23)—(24)式中,‖·‖是點(diǎn)集A和B點(diǎn)集間的距離范式。Hausdorff距離越小,代表數(shù)據(jù)的可用性越高。

        本文使用Hausdorff距離計(jì)算原始軌跡數(shù)據(jù)集與進(jìn)行軌跡發(fā)布算法處理后的軌跡數(shù)據(jù)集的相似性度量,并且記錄在分配不同的隱私預(yù)算ε的情況下使用Hausdorff距離軌跡相似度的變化情況。

        圖4展示了隱私預(yù)算分別為0.1、0.2和0.5的情況下,隨著每組測試數(shù)據(jù)的增加,BIGRU-DP,RNN-DP和NGTMA三種方案中Hausdorff距離的變化和對(duì)比情況。

        從圖4可以看出,根據(jù)分配不同的隱私預(yù)算ε實(shí)驗(yàn)結(jié)果可以得知,當(dāng)實(shí)驗(yàn)數(shù)據(jù)量大小固定時(shí),隨著隱私預(yù)算ε的增大,不同算法的Hausdorff距離值均為下降趨勢,數(shù)據(jù)可用性增加。這是因?yàn)?根據(jù)差分隱私的性質(zhì),增加隱私預(yù)算ε會(huì)導(dǎo)致隱私保護(hù)度的下降,從而導(dǎo)致數(shù)據(jù)可用性的提高。

        圖4 可用性分析對(duì)比Fig.4 Availability analysis and comparison

        在分配相同的隱私預(yù)算的情況下,可以觀察到BIGRU-DP具有更好的數(shù)據(jù)可用性,這是因?yàn)樵陬A(yù)測算法中,BIGRU在預(yù)測過程中引入了更多的信息,因此具有更高的數(shù)據(jù)可用性。

        4.2 效率評(píng)估

        觀察不同的隱私預(yù)算與每組測試數(shù)據(jù)的大小對(duì)于消耗時(shí)間的影響。圖5展示了隱私預(yù)算分別為0.1,0.2,0.5的情況下,隨著每組測試數(shù)據(jù)的增加,BIGRU-DP,RNN-DP和NGTMA三種方案中所需時(shí)間的變化情況。

        圖5 性能效率對(duì)比Fig.5 Performance efficiency comparison

        該實(shí)驗(yàn)結(jié)果表明,在對(duì)時(shí)間資源使用的過程中,隱私預(yù)算對(duì)于時(shí)間的影響不大。隨著每一組實(shí)驗(yàn)數(shù)據(jù)的增加,所用時(shí)間也會(huì)隨之增長。BIGRU-DP相較于其他2種方案具有時(shí)間優(yōu)勢。這是因?yàn)锽IGRU-DP減少軌跡數(shù)據(jù)集的離群點(diǎn),從而減少聚類時(shí)的迭代次數(shù),進(jìn)而減少了時(shí)間的消耗。

        4.3 評(píng)估總結(jié)

        本文主要貢獻(xiàn)如下。

        1)考慮到軌跡數(shù)據(jù)的多樣性,利用GRU中門的特性,捕捉到軌跡數(shù)據(jù)中時(shí)間步距離較長的依賴關(guān)系,使該方案對(duì)于軌跡數(shù)據(jù)的處理更加具有普遍性。

        2)為了提高軌跡發(fā)布數(shù)據(jù)的可用性,使用雙向循環(huán)網(wǎng)絡(luò),同時(shí)參考預(yù)測點(diǎn)兩側(cè)的數(shù)據(jù),使得到的軌跡更加準(zhǔn)確。

        3)使用BIGRU對(duì)軌跡數(shù)據(jù)集進(jìn)行預(yù)處理,為k-means聚類減少了離群值,提升了效率。

        4)采用微軟公司發(fā)布的T-Drive軌跡數(shù)據(jù)集進(jìn)行仿真實(shí)驗(yàn)。仿真實(shí)驗(yàn)結(jié)果表明,與同類方案相比,BIGRU-DP方案提高了軌跡數(shù)據(jù)可用性。同時(shí)與RNN-DP,NGTMA對(duì)比,實(shí)驗(yàn)結(jié)果表明BIGRU-DP具有時(shí)間效率優(yōu)勢。

        5 結(jié)束語

        本文提出了一種面向軌跡數(shù)據(jù)發(fā)布的BIGRU保護(hù)方案,使用BIGRU進(jìn)行預(yù)測處理軌跡數(shù)據(jù)。由于BIGRU的雙向性,BIGRU-DP對(duì)于軌跡數(shù)據(jù)具有更好的處理效果,從而增加了軌跡數(shù)據(jù)的可用性。同時(shí)在預(yù)測過程中能夠處理離群值,使得BIGRU-DP在執(zhí)行效率上優(yōu)于RNN-DP與NGTMA,并且能夠在不同樣本數(shù)量下保持穩(wěn)定。BIGRU能夠利用過去和未來的數(shù)據(jù)來估計(jì)當(dāng)前值,因此,其更加適合對(duì)一些靜態(tài)軌跡數(shù)據(jù)進(jìn)行處理。對(duì)于動(dòng)態(tài)軌跡數(shù)據(jù),該方案只能根據(jù)過去的數(shù)據(jù)進(jìn)行處理,因此精度將會(huì)下降。如何在保證數(shù)據(jù)可用性的同時(shí),提高數(shù)據(jù)的處理效率,選擇與更好的聚類技術(shù)結(jié)合將會(huì)是下一步工作的重點(diǎn)。

        猜你喜歡
        可用性差分分區(qū)
        基于文獻(xiàn)計(jì)量學(xué)的界面設(shè)計(jì)可用性中外對(duì)比研究
        包裝工程(2023年24期)2023-12-27 09:18:26
        上海實(shí)施“分區(qū)封控”
        數(shù)列與差分
        基于輻射傳輸模型的GOCI晨昏時(shí)段數(shù)據(jù)的可用性分析
        浪莎 分區(qū)而治
        基于SAGA聚類分析的無功電壓控制分區(qū)
        電測與儀表(2015年8期)2015-04-09 11:50:16
        基于多種群遺傳改進(jìn)FCM的無功/電壓控制分區(qū)
        電測與儀表(2015年7期)2015-04-09 11:40:16
        空客A320模擬機(jī)FD1+2可用性的討論
        河南科技(2015年7期)2015-03-11 16:23:13
        基于差分隱私的大數(shù)據(jù)隱私保護(hù)
        相對(duì)差分單項(xiàng)測距△DOR
        太空探索(2014年1期)2014-07-10 13:41:50
        丁香五月缴情综合网| 少妇被黑人整得嗷嗷叫视频| 亚洲香蕉成人av网站在线观看| 好大好深好猛好爽视频免费| 大陆国产乱人伦| 国产av区亚洲av毛片| 中文字幕日韩有码在线| 九色九九九老阿姨| 亚洲中文字幕无线无码毛片| 亚洲色图在线视频观看| 中文字幕精品一区久久| 亚洲人成无码网站在线观看| 午夜短视频日韩免费| 一区二区三区视频偷拍| 亚洲av无码成人精品国产| 成年无码av片完整版| 91青草久久久久久清纯| 久久九九精品国产不卡一区| 成年免费a级毛片免费看| 国产露脸精品产三级国产av | 精品久久久噜噜噜久久久| 中文字幕第一页亚洲观看| 日韩精品一区二区三区影音视频| 色一情一乱一伦一视频免费看| 丰满人妻熟妇乱又伦精品视| 国产人妖xxxx做受视频| 国产综合开心激情五月| 天下第二社区在线视频| 国产成人精品免费久久久久| 日本高清一区在线你懂得| 婷婷成人丁香五月综合激情| 久久久久亚洲av无码a片软件| 国产午夜av一区二区三区| 精品女同一区二区三区免费战| 亚洲精品熟女国产| 久久精品国产一区二区蜜芽| 中文字幕人妻av四季| 中文字幕日韩三级片| 91av小视频| 日本高清色一区二区三区| 国产一精品一av一免费爽爽|