亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        邊緣計(jì)算支持下的移動群智感知本地差分隱私保護(hù)機(jī)制

        2021-09-18 06:22:24宋子暉
        計(jì)算機(jī)應(yīng)用 2021年9期
        關(guān)鍵詞:可用性差分邊緣

        李 卓,宋子暉,沈 鑫,陳 昕

        (1.網(wǎng)絡(luò)文化與數(shù)字傳播北京市重點(diǎn)實(shí)驗(yàn)室(北京信息科技大學(xué)),北京 100101;2.北京信息科技大學(xué)計(jì)算機(jī)學(xué)院,北京 100101)

        (*通信作者電子郵箱lizhuo@bistu.edu.cn)

        0 引言

        在移動群智感知(Mobile Crowd Sensing,MCS)系統(tǒng)[1]中,用戶完成數(shù)據(jù)感知任務(wù)后向MCS 平臺提交感知數(shù)據(jù),用戶的提交數(shù)據(jù)包括位置信息和感知數(shù)據(jù)。由于提交中的位置信息與用戶的實(shí)際位置統(tǒng)一,任務(wù)感知結(jié)果反映出用戶實(shí)際所處的真實(shí)環(huán)境信息[2],導(dǎo)致用戶提交數(shù)據(jù)存在泄漏用戶隱私的風(fēng)險(xiǎn)。一方面,不同屬性之間存在不同的用戶隱私風(fēng)險(xiǎn);另一方面,屬性之間的關(guān)聯(lián)也會暴露用戶隱私。如地圖信息感知任務(wù),用戶去指定地點(diǎn)查看該地點(diǎn)的建筑名稱等信息并提交到MCS 服務(wù)器,感知數(shù)據(jù)為地名、建筑名等公共數(shù)據(jù),但只對用戶提交數(shù)據(jù)中的位置信息隱私保護(hù),通過感知結(jié)果依舊可以泄露用戶的位置隱私。

        設(shè)計(jì)MCS 中的隱私保護(hù)機(jī)制比較復(fù)雜。不同于其他MCS 存在用戶主動上傳數(shù)據(jù)這一步驟,這一步驟增加了用戶隱私泄露的風(fēng)險(xiǎn);MCS 中的用戶執(zhí)行的感知任務(wù)多為公共數(shù)據(jù),導(dǎo)致提交數(shù)據(jù)中的信息會與眾多公開信息關(guān)聯(lián),進(jìn)一步增加了用戶隱私泄露的風(fēng)險(xiǎn);同時無法保證MCS 服務(wù)平臺的可信程度,隱私保護(hù)機(jī)制不僅要面向攻擊者,同時也要面向MCS系統(tǒng)本身。

        本地差分隱私(Local Differential Privacy,LDP)[3]保護(hù)是一種不依賴可信第三方、不受限于類型的數(shù)據(jù)隱私量化方法。LDP隱私保護(hù)的原理是對整體數(shù)據(jù)添加隨機(jī)噪聲達(dá)到保護(hù)個體數(shù)據(jù)的目的,因此在數(shù)據(jù)量相同的情況下,發(fā)布數(shù)據(jù)的有效數(shù)據(jù)比例減小。

        綜合考慮MCS 中用戶提交數(shù)據(jù)的特點(diǎn),本文針對邊緣計(jì)算(Edge Computing,EC)支持下MCS 場景,基于本地差分隱私(LDP)保護(hù)原理設(shè)計(jì)出用戶提交數(shù)據(jù)屬性聯(lián)合隱私保護(hù)的CS-MVP(Crowd Sensing with Multi-Value data privacy Protection)算法和用戶提交數(shù)據(jù)屬性獨(dú)立隱私保護(hù)的CS-MAP(Crowd Sensing with Multi-Attribute data privacy Protection)算法。針對用戶提交數(shù)據(jù)的多個屬性,將屬性關(guān)聯(lián)為兩部分:一是位置數(shù)據(jù)和感知結(jié)果數(shù)據(jù)的關(guān)聯(lián)關(guān)系,該部分體現(xiàn)數(shù)據(jù)的可用性;另一部分為用戶信息數(shù)據(jù)分別與位置數(shù)據(jù)和感知結(jié)果數(shù)據(jù)的關(guān)聯(lián)關(guān)系,該部分體現(xiàn)了用戶的隱私。CS-MVP 和CS-MAP 算法使得用戶提交數(shù)據(jù)滿足上述兩部分所構(gòu)建的LDP隱私約束模型。本文算法的主要優(yōu)點(diǎn)如下:

        1)用戶僅需依據(jù)算法在本地對提交數(shù)據(jù)依概率替換,無需增加額外的交互和計(jì)算過程,且無需依賴可信第三方。

        2)依據(jù)MCS 屬性關(guān)聯(lián)的LDP 隱私約束相較于LDP 數(shù)據(jù)隱私約束,避免了對單個屬性數(shù)據(jù)進(jìn)行大規(guī)模統(tǒng)計(jì)計(jì)算恢復(fù)原始感知數(shù)據(jù)的分布,用戶提交數(shù)據(jù)中直接保留了可用性部分,增加了數(shù)據(jù)的可用性。

        3)針對不同規(guī)模的MCS 任務(wù)類型設(shè)計(jì)了CS-MVP 和CS-MAP 兩種隱私保護(hù)算法。CS-MVP 算法以屬性聯(lián)合的方法來增加隱私性,解決了隨機(jī)擾動范圍較小時,LDP模型的隨機(jī)性降低造成的隱私性降低問題;CS-MAP算法以屬性獨(dú)立的方式增加數(shù)據(jù)可用性,解決了任務(wù)數(shù)量和感知數(shù)據(jù)范圍較大的場景下,LDP模型的隨機(jī)性增加導(dǎo)致數(shù)據(jù)可用性降低問題。

        1 研究現(xiàn)狀

        針對MCS 中用戶提交數(shù)據(jù)的隱私保護(hù),當(dāng)前研究主要集中在保護(hù)用戶的位置信息和感知數(shù)據(jù)。

        對于提交數(shù)據(jù)中的位置信息,由于用戶在執(zhí)行感知任務(wù)時,自身的位置與提交數(shù)據(jù)中的位置信息一致,因此,提交數(shù)據(jù)中的位置信息存在暴露用戶位置隱私的風(fēng)險(xiǎn),用戶多次提交數(shù)據(jù),可能泄露其軌跡。文獻(xiàn)[4]研究虛擬位置技術(shù),將用戶的真實(shí)位置映射到一個虛擬的位置上來進(jìn)行數(shù)據(jù)提交,但虛擬位置存在一些不合理的情況導(dǎo)致隱私性降低,且攻擊者根據(jù)虛擬的位置和用戶背景知識可推斷出用戶實(shí)際位置。文獻(xiàn)[5]基于空間泛化技術(shù)提出了基于粒度的位置隱私保護(hù)算法,自適應(yīng)地將用戶位置泛化到不同粒度空間;在此基礎(chǔ)上,文獻(xiàn)[6]提出利用沃羅諾伊的概念來生成匿名區(qū)域;文獻(xiàn)[7]提出一種位置K-匿名的算法,用一個包含K個用戶的空間區(qū)域替代用戶的真實(shí)位置,在這K個用戶中,任何一個用戶的位置都與其他K-1個用戶的位置不可分辨。然而用戶節(jié)點(diǎn)移動性會導(dǎo)致匿名區(qū)域的改變,從而使匿名區(qū)域面積過小不滿足隱私保護(hù)要求,或過大降低位置準(zhǔn)確性。

        文獻(xiàn)[8]提出基于區(qū)域覆蓋數(shù)量的中心化差分隱私保護(hù)技術(shù),以單位區(qū)域中的用戶數(shù)量來構(gòu)建差分隱私保護(hù)模型,對城市人口流量數(shù)據(jù)中的個人位置進(jìn)行保護(hù);文獻(xiàn)[9]定義密度約束來計(jì)算出整體感知用戶位置信息的全局敏感度,構(gòu)建滿足差分隱私的拉普拉斯噪聲分量,對整體感知數(shù)據(jù)的中的位置信息進(jìn)行差分隱私保護(hù)。

        提交數(shù)據(jù)中的感知數(shù)據(jù),包含數(shù)據(jù)類型復(fù)雜,且與用戶所處環(huán)境密切相關(guān)。感知數(shù)據(jù)本身會泄露用戶隱私,屬性之間的關(guān)聯(lián)也存在隱私泄露的風(fēng)險(xiǎn),因?yàn)橥ㄟ^感知數(shù)據(jù)可間接獲得用戶當(dāng)前位置信息。為降低由用戶提交數(shù)據(jù)導(dǎo)致的用戶隱私泄露問題,文獻(xiàn)[10]利用多級代理機(jī)制,在不可信移動感知平臺之間構(gòu)建代理服務(wù)器,并提出了一種新的差分隱私保護(hù)機(jī)制使得用戶數(shù)據(jù)滿足差分隱私約束來保護(hù)用戶身份隱私;然而這種方式無法保證多級代理之間的可信程度,代理之間可能聯(lián)合從而使用戶隱私泄露。文獻(xiàn)[11]設(shè)計(jì)了一個對數(shù)據(jù)隱私保護(hù)下的移動群智感知系統(tǒng)架構(gòu),利用多個功能實(shí)體間的相互協(xié)作,實(shí)現(xiàn)了節(jié)點(diǎn)授權(quán)驗(yàn)證、節(jié)點(diǎn)匿名提交數(shù)據(jù)、數(shù)據(jù)隱私驗(yàn)證、用戶匿名激勵發(fā)放等功能。該方法雖然可實(shí)現(xiàn)完整的匿名數(shù)據(jù)提交和匿名數(shù)據(jù)評估,但將系統(tǒng)功能分散為多個實(shí)體增加了系統(tǒng)復(fù)雜程度,用戶認(rèn)證、令牌加密等算法也增加了計(jì)算復(fù)雜性。

        LDP 技術(shù)由于不受數(shù)據(jù)類型的限制,已有多項(xiàng)工作使用LDP 技術(shù)來保護(hù)社會感知數(shù)據(jù)[12-13]。文獻(xiàn)[14]基于Copula 函數(shù)構(gòu)造滿足LDP 的多維度群智感知數(shù)據(jù)。文獻(xiàn)[15]提出LoPub 算法,構(gòu)造多維本地差分隱私擾動機(jī)制來解決多屬性下的節(jié)點(diǎn)隱私保護(hù)機(jī)制,利用統(tǒng)計(jì)計(jì)算方法,從多維聯(lián)合分布中計(jì)算出單一屬性的邊緣分布情況。文獻(xiàn)[16]提出面向Key-Value 類型數(shù)據(jù)的隱私發(fā)布機(jī)制PrivKV 算法,對Key 屬性和Value 屬性的數(shù)據(jù)分別進(jìn)行LDP 擾動,并提供數(shù)據(jù)統(tǒng)計(jì)算法從被隱私化的數(shù)據(jù)中分別計(jì)算Key的頻數(shù)和Value的均值。然而,這些算法均只針對通用數(shù)據(jù)類型來設(shè)計(jì)隱私保護(hù)機(jī)制,沒有考慮MCS系統(tǒng)中用戶提交數(shù)據(jù)的特點(diǎn)。

        本文基于邊緣計(jì)算支持下的MCS,提出CS-MVP 和CSMAP 用戶提交數(shù)據(jù)隱私保護(hù)算法,基于MCS 中用戶提交數(shù)據(jù)的屬性關(guān)系,構(gòu)建兩種關(guān)系之間的LDP隱私約束,不但應(yīng)用了LDP 理論在隱私保護(hù)上的優(yōu)勢,同時避免了在數(shù)據(jù)恢復(fù)時復(fù)雜的統(tǒng)計(jì)計(jì)算。

        2 模型定義

        本章定義MCS 的系統(tǒng)模型,并給出用戶提交數(shù)據(jù)的隱私性模型和任務(wù)數(shù)據(jù)的可用性模型,提出隱私約束下的可用性最大化問題。

        2.1 移動群智感知用戶原始感知數(shù)據(jù)和提交數(shù)據(jù)模型

        首先將用戶采提交據(jù)構(gòu)建為數(shù)學(xué)模型。設(shè)MCS 中感知任務(wù)位置集合L={l1,l2,…,lN},感知任務(wù)結(jié)果的取值范圍X={x1,x2,…,xM},原始感知數(shù)據(jù)可表示為r=(l∈L,x∈X),則任意用戶ui的提交數(shù)據(jù)記作di=

        2.2 多屬性用戶提交數(shù)據(jù)的本地差分隱私模型

        用戶的原始感知數(shù)據(jù)可以為任意位置和任意感知數(shù)據(jù)的組合,即r∈R,其中R為L和X中所有元素對應(yīng)構(gòu)成組合的集合。

        任務(wù)執(zhí)行后,用戶獲得正確的原始感知數(shù)據(jù)ri∈RT。一組能保證任務(wù)完成的原始感知數(shù)據(jù)集合RT是R的一個子集,RT?R。RT表示所有位置li與用戶實(shí)際在該位置感知到的結(jié)果xi的組合的集合。

        構(gòu)建滿足LDP的用戶原始感知數(shù)據(jù)和發(fā)布數(shù)據(jù)模型。存在隱私保護(hù)算法Q,其定義域和值域分別為RT和R,滿足:

        存在隱私保護(hù)算法QX,其定義域和值域均為X;隱私保護(hù)算法QL,其定義域和值域均為L,滿足:

        則算法Q滿足隱私預(yù)算為ε的用戶數(shù)據(jù)屬性聯(lián)合的本地差分隱私保護(hù),QX、QL滿足隱私預(yù)算為ε的用戶數(shù)據(jù)屬性獨(dú)立的本地差分隱私保護(hù)。

        2.3 用戶隱私化提交數(shù)據(jù)的可用性模型

        用戶真實(shí)的提交數(shù)據(jù)集合D={d1,d2,…,di,…}。對D中所有數(shù)據(jù)采用相同的隱私保護(hù)算法,構(gòu)建隱私化提交數(shù)據(jù)集合D'={d'1,d'2,…,d'i,…}。

        設(shè)D對應(yīng)的原始感知數(shù)據(jù)RT中存在ra=,ra∈RT,D'=Q(D),則集合D'中任意r'∈R的概率為:

        對于隱私化的用戶提交數(shù)據(jù),相同位置中正確數(shù)據(jù)的概率大于錯誤數(shù)據(jù)的概率時,可保留正確感知數(shù)據(jù)信息。即D'中包含ra的數(shù)據(jù)的概率大于僅包含數(shù)據(jù)la的概率:

        定義隱私保護(hù)算法Q生成的數(shù)據(jù)滿足MCS 任務(wù)可用性指標(biāo)I:

        基于LDP 隱私模型,可用性指標(biāo)I反映了能從提交數(shù)據(jù)中恢復(fù)正確感知數(shù)據(jù)的概率。

        2.4 隱私約束下的可用性最大問題

        MCS 中用戶發(fā)布數(shù)據(jù)隱私約束下的可用性最大問題可記作:

        3 EC支持下的用戶提交數(shù)據(jù)隱私保護(hù)算法

        3.1 EC支持下的移動群智感知系統(tǒng)流程

        為分離用戶和MCS 云服務(wù)器的直接交互,消除MCS 云服務(wù)器泄露用戶隱私的風(fēng)險(xiǎn),在MCS 中引入邊緣計(jì)算架構(gòu)。同時,滿足LDP的隱私保護(hù)算法[17-20]對原始感知數(shù)據(jù)[21-22]隱私處理后會生成部分噪聲數(shù)據(jù),隱私預(yù)算越高,提交數(shù)據(jù)中的噪聲數(shù)據(jù)越多,引入邊緣服務(wù)器,在靠近用戶端計(jì)算恢復(fù)出任務(wù)需求數(shù)據(jù),過濾掉用戶提交數(shù)據(jù)中相同任務(wù)的噪聲數(shù)據(jù),降低MCS系統(tǒng)數(shù)據(jù)傳輸成本。

        基于邊緣計(jì)算架構(gòu)設(shè)計(jì)了MCS系統(tǒng)流程如圖1所示。任務(wù)分發(fā)階段,云服務(wù)器向邊緣服務(wù)器發(fā)布感知任務(wù),由邊緣服務(wù)器代替云服務(wù)器對用戶進(jìn)行任務(wù)分發(fā),用戶執(zhí)行的具體感知任務(wù)對云服務(wù)器保持隱私性;任務(wù)提交階段,用戶首先利用滿足LDP的隱私保護(hù)算法,本地處理原始感知數(shù)據(jù),然后提交隱私化的感知數(shù)據(jù)給邊緣服務(wù)器;邊緣服務(wù)器聚合所有用戶提交數(shù)據(jù),通過統(tǒng)計(jì)計(jì)算恢復(fù)任務(wù)結(jié)果提交云服務(wù)器。

        圖1 邊緣計(jì)算支持下MCS用戶數(shù)據(jù)隱私保護(hù)流程Fig.1 Flow of MCS user data privacy protection supported by EC

        整個過程中云服務(wù)器不直接接觸用戶數(shù)據(jù),而邊緣服務(wù)器接觸到的為用戶滿足LDP 隱私的提交數(shù)據(jù),因此保證了用戶隱私。

        3.2 CS-MVP算法

        本節(jié)介紹滿足LDP的用戶提交數(shù)據(jù)屬性聯(lián)合隱私保護(hù)算法的設(shè)計(jì)。屬性聯(lián)合即將用戶提交數(shù)據(jù)中的位置和感知結(jié)果屬性組合成的數(shù)據(jù)作為整體構(gòu)建隱私約束。隱私化的發(fā)布數(shù)據(jù)符合用戶提交數(shù)據(jù)取值范圍且滿足LDP隱私約束。

        設(shè)L中位置的數(shù)量為N,感知任務(wù)的取值范圍X的元素?cái)?shù)量為M,則集合R中的元素個數(shù)為M×N。屬性聯(lián)合的原始感知數(shù)據(jù)的取值范圍為RT,隱私化的用戶提交數(shù)據(jù)中感知數(shù)據(jù)的取值范圍為R。Q為RT到R的隨機(jī)轉(zhuǎn)移矩陣。

        考慮感知任務(wù)執(zhí)行前RT未確定。首先構(gòu)建由R向R的隨機(jī)轉(zhuǎn)移矩陣QR。QR的元素為條件概率qij=P(rj|ri)。

        QR應(yīng)滿足以下約束:

        式(9)表示任意元素ri變換為rj所有可能取值的概率和為1;式(10)表示該變換滿足隱私預(yù)算為ε的LDP隱私約束。

        用戶提交數(shù)據(jù)可用性為:

        在每個位置感知相同的數(shù)據(jù)量的情況下,問題(6)可轉(zhuǎn)換為:

        求解可得:

        任務(wù)執(zhí)行后,每個用戶依據(jù)其原始感知數(shù)據(jù),選擇QR對應(yīng)的行,所有被選擇的行組成由RT向R的實(shí)際使用的轉(zhuǎn)移概率矩陣Q。如圖2所示。

        圖2 基于隨機(jī)轉(zhuǎn)移矩陣的MCS用戶提交數(shù)據(jù)的隱私算法Fig.2 Privacy algorithm of MCS user submitted data based on random transition matrix

        實(shí)際的狀態(tài)轉(zhuǎn)移矩陣Q依據(jù)真實(shí)的感知結(jié)果來構(gòu)建,在任務(wù)執(zhí)行前,邊緣服務(wù)器根據(jù)隱私預(yù)算,首先構(gòu)建完全隨機(jī)轉(zhuǎn)移矩陣QR,用戶在感知結(jié)束后選擇需要的行對原始感知數(shù)據(jù)隨機(jī)變換。隱私化的用戶感知流程為:

        1)邊緣服務(wù)器計(jì)算感知任務(wù)位置數(shù)量N,感知數(shù)據(jù)取值范圍元素個數(shù)M。

        2)邊緣服務(wù)器生成用戶原始感知數(shù)據(jù)取值范圍和提交數(shù)據(jù)取值范圍R:

        3)邊緣服務(wù)器計(jì)算轉(zhuǎn)移概率參數(shù)a=M×N-1+eε。

        4)邊緣服務(wù)器生成完全隨機(jī)轉(zhuǎn)移矩陣QR,其元素值為:

        5)用戶執(zhí)行感知任務(wù),獲得原始感知數(shù)據(jù)ri,從QR中選擇第i行對ri隨機(jī)變換得到隱私算法的發(fā)布數(shù)據(jù)r',生成用戶提交數(shù)據(jù)=

        屬性聯(lián)合的MCS 用戶提交數(shù)據(jù)隱私保護(hù)算法將用戶的原始感知數(shù)據(jù)隨機(jī)變換到取值空間中任意值,該算法可直接保留位置和感知結(jié)果的對應(yīng)關(guān)系。對于同一個任務(wù)位置,雖然取值空間存在多個值,但MCS 的用戶原始感知數(shù)據(jù)中,相同位置只存在唯一值,CS-MVP 算法將個體數(shù)據(jù)隨機(jī)化,擾亂了數(shù)據(jù)整體分布,但原始數(shù)據(jù)保持了最高的后驗(yàn)概率,因此恢復(fù)算法僅需統(tǒng)計(jì)提交數(shù)據(jù)的頻數(shù)即可恢復(fù)真實(shí)結(jié)果。

        CS-MVP算法為用戶提交數(shù)據(jù)提供了嚴(yán)格的隱私性,但該算法中數(shù)據(jù)的取值空間大小為任務(wù)量和所有任務(wù)結(jié)果取值空間大小的乘積,當(dāng)任務(wù)量過多或任務(wù)取值范圍過大時,提交數(shù)據(jù)的取值范圍也將擴(kuò)大,這導(dǎo)致原始感知數(shù)據(jù)恢復(fù)算法需求的樣本量增加。為解決聯(lián)合隱私造成的取值空間相乘性擴(kuò)大問題,本文另外提出了屬性獨(dú)立的MCS 用戶提交數(shù)據(jù)的本地差分隱私保護(hù)算法。

        3.3 CS-MAP算法

        本節(jié)介紹屬性獨(dú)立的用戶提交數(shù)據(jù)的本地差分隱私保護(hù)算法。將用戶提交數(shù)據(jù)中位置屬性數(shù)據(jù)和感知結(jié)果數(shù)據(jù)獨(dú)立地進(jìn)行隱私保護(hù),可降低多個屬性取值空間相乘引起的提交數(shù)據(jù)取值空間的擴(kuò)大。MCS中任務(wù)需求為位置數(shù)據(jù)和感知結(jié)果數(shù)據(jù)之間的對應(yīng)關(guān)系,因此,設(shè)計(jì)屬性獨(dú)立的MCS 用戶提交數(shù)據(jù)隱私保護(hù)機(jī)制需要在保證不同屬性獨(dú)立隱私約束的情況下保留位置和感知結(jié)果數(shù)據(jù)的對應(yīng)關(guān)系,以保留提交數(shù)據(jù)的可用性。

        仍針對上述場景,所有任務(wù)的位置L的數(shù)量為N,感知任務(wù)的取值范圍X的元素?cái)?shù)量為M。屬性獨(dú)立的本地差分隱私算法即構(gòu)建由狀態(tài)空間L到L的轉(zhuǎn)移矩陣QL和由狀態(tài)空間到X的隨機(jī)變換矩陣QX。其中QL和QX的元素分別為

        對于任意原始感知數(shù)據(jù)ra=,為保持生成提交數(shù)據(jù)中l(wèi)a和xa的對應(yīng)關(guān)系,基于獨(dú)立狀態(tài)轉(zhuǎn)移,設(shè)計(jì)了兩階段的轉(zhuǎn)移過程:第一階段,對ra=做隨機(jī)擾動,若生成數(shù)據(jù)為ra=,則用戶用原始感知數(shù)據(jù)構(gòu)建提交數(shù)據(jù);若生成數(shù)據(jù)為虛假數(shù)據(jù),則執(zhí)行第二階段。第二階段,構(gòu)建虛假數(shù)據(jù),分別從集合L和集合X中去掉la和xa,然后以均勻分布分別從中選出的數(shù)據(jù)構(gòu)建用戶的提交數(shù)據(jù)。

        基于上述步驟,可保留原始感知數(shù)據(jù)中位置和感知結(jié)果的對應(yīng)關(guān)系,即保留了用戶提交數(shù)據(jù)的可用性,并且可得出如下約束條件:

        其中:式(17)為在兩個屬性獨(dú)立變換過程中保持正確數(shù)據(jù)的概率相同,且若在變換過程中位置保持不變,則此時感知數(shù)據(jù)也應(yīng)保持不變;式(18)為位置和感知數(shù)據(jù)獨(dú)立變換的約束,類比式(9);式(19)屬于獨(dú)立的LDP隱私約束。

        用戶提交數(shù)據(jù)可用性為:

        屬性獨(dú)立的本地差分隱私保護(hù)算法,對用戶原始感知數(shù)據(jù)中的不同屬性數(shù)據(jù)獨(dú)立擾動,提交數(shù)據(jù)的取值空間相較于屬性聯(lián)合算法降低了樣本需求量;但屬性獨(dú)立算法只對數(shù)據(jù)的屬性滿足差分隱私約束,對用戶提交數(shù)據(jù)不滿足嚴(yán)格的隱私約束,相較于聯(lián)合算法隱私性降低。

        3.4 基于差分隱私發(fā)布的感知數(shù)據(jù)恢復(fù)算法

        本文所提出的CS-MVP 算法和CS-MAP 算法均依據(jù)MCS用戶提交數(shù)據(jù)屬性間關(guān)系分析和處理,擾亂用戶信息與位置、感知結(jié)果的對應(yīng)關(guān)系,保留位置與感知結(jié)果的對應(yīng)關(guān)系。邊緣服務(wù)器匯總所有用戶的提交數(shù)據(jù),計(jì)算恢復(fù)任務(wù)感知數(shù)據(jù)的算法不需要經(jīng)過復(fù)雜的統(tǒng)計(jì)計(jì)算,根據(jù)用戶提交數(shù)據(jù)可用性最大化,只需要計(jì)算提交數(shù)據(jù)中相同位置數(shù)據(jù)中頻數(shù)最大值即可。具體流程如算法3所示。

        匯總所有用戶的提交數(shù)據(jù),提交數(shù)據(jù)中攜帶的隱私化任務(wù)感知數(shù)據(jù)屬于取值空間R,將提交數(shù)據(jù)按取值空間R計(jì)數(shù),記錄每個可能取值的頻數(shù);然后按相同位置將R劃分,對每個位置取頻數(shù)最大的元素,作為恢復(fù)的感知結(jié)果。

        4 理論分析

        4.1 算法的時間復(fù)雜性

        根據(jù)算法1和算法2可分析得算法的時間復(fù)雜度。

        定理1CS-MVP 算法的時間復(fù)雜度為O(MN),CS-MAP算法的時間復(fù)雜度為O(max(M,N))。

        算法1 中感知任務(wù)位置集合L,感知數(shù)據(jù)取值范圍X,采用嵌套循環(huán),外循環(huán)共循環(huán)N次,內(nèi)循環(huán)共循環(huán)M次,則雙重循環(huán)的時間復(fù)雜度就是O(M×N)。類比算法1,算法2 中第4)步構(gòu)建QX和QL的時間復(fù)雜度均為max(M,N),同時第6)步中用戶遍歷QX和QL,即MAP 的算法復(fù)雜度為O(max(M,N))。

        4.2 數(shù)據(jù)隱私性

        定理2算法CS-MVP 的一組發(fā)布數(shù)據(jù)對其原始感知數(shù)據(jù)滿足隱私預(yù)算為ε的LDP約束。

        證明 依據(jù)隨機(jī)轉(zhuǎn)移矩陣,可得發(fā)布數(shù)據(jù)中任意r'∈R來自于原始感知數(shù)據(jù)r∈R的轉(zhuǎn)移概率P(r'|r),

        定理3算法CS-MAP 的一組發(fā)布數(shù)據(jù)對其原始感知數(shù)據(jù)的位置數(shù)據(jù)和感知結(jié)果屬性分別滿足ε的LDP約束。

        證明 發(fā)布數(shù)據(jù)中任意r'=∈R,由原始感知數(shù)據(jù)變換來的轉(zhuǎn)移概率為:

        其為原始感知數(shù)據(jù)中任務(wù)位置屬性到la的轉(zhuǎn)移概率,可知對于任意原始數(shù)據(jù)中位置屬性數(shù)據(jù)li(lj∈L)滿足:

        對于任意原始感知數(shù)據(jù)中感知結(jié)果屬性數(shù)據(jù)xi,xj∈X滿足:

        定理4算法CS-MAP的任意發(fā)布數(shù)據(jù)r'∈R對其原始感知數(shù)據(jù)r∈RT滿足隱私預(yù)算為ε+ln(min(M,N) -1)的LDP隱私約束。

        存在如下等式:

        概率比的滿足如下:

        4.3 數(shù)據(jù)可用性

        對于最優(yōu)機(jī)制,不同任務(wù)之間的數(shù)據(jù)不受任務(wù)實(shí)際數(shù)據(jù)如何取值影響,即對任意任務(wù)所有可能取值,由其他任務(wù)變換而來的概率應(yīng)相同。公式如下:

        5 實(shí)驗(yàn)與結(jié)果分析

        基于Python 環(huán)境使用真實(shí)數(shù)據(jù)集GeoLife[23]對算法進(jìn)行性能評估。GeoLife 數(shù)據(jù)集是由微軟亞洲研究院于2016 年發(fā)布的北京地區(qū)的軌跡信息,其中主要包含182 個移動設(shè)備的17 621 個軌跡數(shù)據(jù)。將統(tǒng)計(jì)相同時間段和一定區(qū)域范圍內(nèi)的設(shè)備數(shù)量作為感知任務(wù),共提取出1 134個感知任務(wù)與感知數(shù)據(jù)對。同時實(shí)現(xiàn)了LoPub和PrivKV算法作為對比。

        感知數(shù)據(jù)的可用性表現(xiàn)為真實(shí)數(shù)據(jù)與噪聲數(shù)據(jù)生成概率的差值,隨著樣本量增大,概率接近于數(shù)據(jù)頻率。可用性越大,正確數(shù)據(jù)與錯誤數(shù)據(jù)的概率差值越大,即樣本頻率差值越大。即可用性越高,計(jì)算獲得真實(shí)感知數(shù)據(jù)所需的用戶提交數(shù)據(jù)數(shù)量越少。定義數(shù)據(jù)樣本比(Data Sample Ratio,DSR)為所有任務(wù)獲得的感知數(shù)據(jù)的平均個數(shù)。實(shí)驗(yàn)驗(yàn)證在不同隱私預(yù)算和DSR 下,計(jì)算感知數(shù)據(jù)的準(zhǔn)確率。使用0-1 損失函數(shù)來度量統(tǒng)計(jì)值和原始值的誤差。

        任務(wù)的平均數(shù)據(jù)準(zhǔn)確率記作:

        將隱私預(yù)算控制在[0,10],DSR 控制在[0,5 000]。對實(shí)驗(yàn)中的每個狀態(tài)均計(jì)算10次結(jié)果后取均值。

        首先分析在不同DSR 和不同隱私預(yù)算下,CS-MVP 和CSMAP算法的平均數(shù)據(jù)準(zhǔn)確性,驗(yàn)證算法的適用范圍。

        如圖3 所示,當(dāng)隱私預(yù)算大于3.5,每個任務(wù)平均采集數(shù)據(jù)量大于300 時,CS-MVP 算法恢復(fù)任務(wù)結(jié)果的準(zhǔn)確性大于95%;在隱私預(yù)算大于2,每個任務(wù)平均數(shù)據(jù)采集量大于200時,CS-MAP 算法恢復(fù)任務(wù)結(jié)果的準(zhǔn)確性大于95%。CS-MAP算法比CS-MVP 算法具有更大的隱私預(yù)算適用范圍,且在相同隱私約束下,需要采集的數(shù)據(jù)量更少。

        圖3 CS-MVP和CS-MAP算法生成數(shù)據(jù)的平均準(zhǔn)確率Fig.3 Average accuracies of data generated by CS-MVP and CS-MAP algorithms

        利用CS-MVP 和CS-MAP 算法順序隱私化處理多個數(shù)據(jù),對比運(yùn)行時間,每次實(shí)驗(yàn)統(tǒng)計(jì)10 次處理時間取平均值,實(shí)驗(yàn)結(jié)果如表1所示。從表1可看出,兩算法的運(yùn)行時間隨著數(shù)據(jù)量的增加差距逐漸增大。在數(shù)據(jù)量為1 000 以內(nèi)時,CS-MAP算法的運(yùn)行時間0.04 s以下,而CS-MVP算法的運(yùn)行時間最長已超過20 s。屬性獨(dú)立的隨機(jī)算法可顯著降低算法的運(yùn)行時間。

        表1 CS-MVP和CS-MAP算法的平均運(yùn)行時間Tab.1 Average running times of CS-MVP and CS-MAP algorithms

        實(shí)驗(yàn)過程中實(shí)現(xiàn)了LoPub 和PrivKV 算法來對比CS-MVP算法的性能。分別在隱私預(yù)算ε=2,4,6 三種情況下,對比CS-MVP、CS-MAP、LoPub 和PrivKV 四種算法隨著DSR 增加生成數(shù)據(jù)的準(zhǔn)確性。

        如圖4 所示,隨著數(shù)據(jù)量的增多各算法生成數(shù)據(jù)的準(zhǔn)確性逐漸增加;對滿足LDP 的隱私保護(hù)算法,隱私預(yù)算增加,隱私性降低,數(shù)據(jù)可用性增加,圖4 中體現(xiàn)在隨著隱私預(yù)算的增加,在數(shù)據(jù)達(dá)到相同隱私預(yù)算下,需要的DSR越小。

        從圖4 可明顯看出,在相同條件下,CS-MAP 算法的準(zhǔn)確性大于CS-MVP 算法和PrivKV 算法的準(zhǔn)確性。在隱私預(yù)算ε≥2 時,CS-MVP 算法的準(zhǔn)確性比PrivKV 平均高40%。原因在于:PrivKV是對數(shù)據(jù)進(jìn)行二值差分隱私擾動,其發(fā)布值的隱私空間小,在隱私性低的情況下能保持較高的可用性;而CSMVP 機(jī)制的發(fā)布空間為感知數(shù)據(jù)所有可取值空間,發(fā)布值取錯誤值的概率更大。整體來看,CS-MVP直接從提交數(shù)據(jù)中計(jì)算兩個屬性數(shù)據(jù)間的對應(yīng)關(guān)系,而PrivKV 需要統(tǒng)計(jì)頻次計(jì)算分布來得出真實(shí)值,因此需要更多的數(shù)據(jù)量來支撐。

        在隱私預(yù)算為2 和4 時,CS-MVP 算法的數(shù)據(jù)準(zhǔn)確性比LoPub 高30%;在隱私預(yù)算為6 時CS-MVP 算法略低于LoPub算法,其原因在于LoPub 算法發(fā)布值的取值空間也為感知數(shù)據(jù)的所有取值,在隱私預(yù)算小時,可用性較低,且需要計(jì)算數(shù)據(jù)的整體分布,然后從中再恢復(fù)對應(yīng)關(guān)系,因此需要的數(shù)據(jù)量較多,在相同數(shù)據(jù)量下,準(zhǔn)確性低于CS-MVP。兩種算法的準(zhǔn)確率在隱私預(yù)算增大時表現(xiàn)得逐漸相等,如圖4(c),但LoPub算法需要多次迭代操作來逼近結(jié)果,算法復(fù)雜度要遠(yuǎn)大于CSMVP。圖4(b)中在樣本量大于20 后,CS-MVP 的準(zhǔn)確性大于LoPub,其原因在于,LoPub是利用EM(Expectation Maximization)算法計(jì)算分布,EM 算法迭代過程中預(yù)設(shè)初始分布為均勻分布,群智感知結(jié)果分布與均勻分布相差較大,計(jì)算的任務(wù)數(shù)據(jù)準(zhǔn)確率較低。

        圖4 CS-MAP、CS-MVP、PrivKV、LoPub生成數(shù)據(jù)的準(zhǔn)確性對比Fig.4 Accuracy comparison of CS-MAP,CS-MVP,PrivKV,LoPub generated data

        最后,CS-MAP的算法的數(shù)據(jù)準(zhǔn)確率在三種情況下均大于其他三個算法,且在較低的隱私預(yù)算下也能保持較高的數(shù)據(jù)準(zhǔn)確性。原因在于該算法發(fā)布值的空間只在每個屬性的各自獨(dú)立空間中,且直接保留了位置和感知結(jié)果的對應(yīng)關(guān)系。從圖4 可知,CS-MAP 算法比LoPub 算法的數(shù)據(jù)準(zhǔn)確率平均提高了26.94%,比PrivKV 算法平均提高了84.34%;CS-MVP 算法比LoPub算法平均提高了66.24%,比PrivKV 算法平均提高了144.14%。

        接下來驗(yàn)證邊緣計(jì)算模式支持下隱私保護(hù)的MCS 系統(tǒng)感知開銷。保持用戶提交的感知數(shù)據(jù)量不變,分析網(wǎng)絡(luò)中的數(shù)據(jù)傳輸量。記Ce為邊緣計(jì)算支持下的傳輸數(shù)據(jù)量,Cc為不引入邊緣計(jì)算模式時的傳輸數(shù)據(jù)量。傳輸數(shù)據(jù)降低比記作:

        在保證感知數(shù)據(jù)恢復(fù)準(zhǔn)確性大于95%的情況下,實(shí)驗(yàn)結(jié)果如圖5所示。

        圖5 邊緣計(jì)算模式對MCS系統(tǒng)數(shù)據(jù)傳輸量的影響Fig.5 Influence of edge computing mode on data transmission amount in MCS system

        從圖5 可知,隨著提交數(shù)據(jù)總量的提升,邊緣計(jì)算可顯著減少數(shù)據(jù)傳輸量。邊緣計(jì)算服務(wù)器匯聚所有隱私算法生成的發(fā)布數(shù)據(jù),忽略隨機(jī)算法生成的錯誤數(shù)據(jù),只向云端傳輸實(shí)際任務(wù)數(shù)據(jù),當(dāng)平均任務(wù)數(shù)據(jù)DSR 大于10 時,對每個任務(wù)采集10 個以上的感知數(shù)據(jù),而只向云端傳輸一個數(shù)據(jù),可降低90%網(wǎng)絡(luò)中的數(shù)據(jù)量,這與實(shí)驗(yàn)結(jié)果相符合。

        6 結(jié)語

        本文針對MCS 用戶數(shù)據(jù)提交階段隱私保護(hù)困難和因隱私保護(hù)帶來的成本增加問題,建立了用戶提交數(shù)據(jù)的隱私性和任務(wù)數(shù)據(jù)可用性模型,設(shè)計(jì)了基于用戶提交數(shù)據(jù)屬性關(guān)系的CS-MVP 算法和CS-MAP 算法。在MCS 中引入邊緣計(jì)算架構(gòu),設(shè)計(jì)了邊緣計(jì)算支持下的隱私化MCS 系統(tǒng)感知模式。針對MCS 用戶提交數(shù)據(jù)可用性的下界進(jìn)行理論分析,證明CSMVP 算法在數(shù)據(jù)屬性聯(lián)合隱私約束下的最優(yōu)性,CS-MAP 算法在數(shù)據(jù)屬性獨(dú)立隱私約束下的最優(yōu)性,并定量給出CS-MVP和CS-MAP 算法生成數(shù)據(jù)的可用性。實(shí)驗(yàn)結(jié)果表明,與現(xiàn)有的LoPub 和PrivKV 算法相比,在相同隱私預(yù)算下,CS-MVP 和CS-MAP 算法擁有更高的數(shù)據(jù)準(zhǔn)確性和更低的數(shù)據(jù)量需求。CS-MAP 算法較之CS-MVP 算法擁有更高的數(shù)據(jù)可用性和更低的算法復(fù)雜度,但其隱私約束局限于一組任務(wù)數(shù)據(jù),對存在多組感知數(shù)據(jù)的用戶數(shù)據(jù)不滿足隱私約束。邊緣計(jì)算的引入可減低MCS 系統(tǒng)中90%的數(shù)據(jù)傳輸量。在當(dāng)前工作的基礎(chǔ)上,未來擬開展隱私保護(hù)下的MCS 任務(wù)分發(fā)和激勵機(jī)制的優(yōu)化研究。

        猜你喜歡
        可用性差分邊緣
        基于文獻(xiàn)計(jì)量學(xué)的界面設(shè)計(jì)可用性中外對比研究
        包裝工程(2023年24期)2023-12-27 09:18:26
        數(shù)列與差分
        基于輻射傳輸模型的GOCI晨昏時段數(shù)據(jù)的可用性分析
        一張圖看懂邊緣計(jì)算
        空客A320模擬機(jī)FD1+2可用性的討論
        河南科技(2015年7期)2015-03-11 16:23:13
        基于差分隱私的大數(shù)據(jù)隱私保護(hù)
        相對差分單項(xiàng)測距△DOR
        太空探索(2014年1期)2014-07-10 13:41:50
        黔西南州烤煙化學(xué)成分可用性評價
        作物研究(2014年6期)2014-03-01 03:39:04
        差分放大器在生理學(xué)中的應(yīng)用
        在邊緣尋找自我
        雕塑(1999年2期)1999-06-28 05:01:42
        青青草中文字幕在线播放| 亚洲欧洲久久久精品| 亚洲一区二区三在线播放| 午夜视频网址| 成人综合激情自拍视频在线观看| 国产精品久久久免费精品| 国产成人a人亚洲精品无码| 国产精品自在线免费| 伊人久久婷婷综合五月97色| 亚洲av迷人一区二区三区| 日本强伦姧人妻一区二区| 日日碰狠狠添天天爽无码| 国产精品偷伦视频免费手机播放| 亚洲人妻有码中文字幕| 美女视频在线观看亚洲色图| 波多野42部无码喷潮| 久久无码精品精品古装毛片| 国产一区二区av在线观看| 图片小说视频一区二区| 久久精品国产精品| 亚洲国产精品久久亚洲精品| 成人免费无码a毛片| 免费视频亚洲一区二区三区| 少妇性俱乐部纵欲狂欢少妇| 久久精品免视看国产成人| 亚洲欧洲久久久精品| 久久国产精品免费一区二区三区 | 国产亚洲精品品视频在线| 狠狠色噜噜狠狠狠777米奇| 藏春阁福利视频| 完整在线视频免费黄片| 白白色发布会在线观看免费| 亚洲国产精品综合久久网各| 亚洲国产精品嫩草影院久久| 女同欲望一区二区三区| 亚洲精品中文幕一区二区| 亚洲尺码电影av久久| 亚洲24小时在线免费视频网站| 国产成年人毛片在线99| 熟妇的荡欲色综合亚洲| 无码伊人66久久大杳蕉网站谷歌|