亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        一種基于矩陣計(jì)算的數(shù)據(jù)開放隱私泄露評估方法

        2020-01-14 06:03:46周旭晨王智慧李思勤
        關(guān)鍵詞:擁有者單字字段

        周旭晨 王智慧 王 宇 朱 云 李思勤 汪 衛(wèi)

        (復(fù)旦大學(xué)計(jì)算機(jī)科學(xué)技術(shù)學(xué)院 上海 201203)

        (上海市數(shù)據(jù)科學(xué)重點(diǎn)實(shí)驗(yàn)室(復(fù)旦大學(xué)) 上海 201203)

        0 引 言

        隨著大數(shù)據(jù)時(shí)代的來臨,數(shù)據(jù)的開放需求和使用價(jià)值日益提高,數(shù)據(jù)資源的開放和共享也成為熱門的研究方向。然而在現(xiàn)實(shí)中,數(shù)據(jù)開放和共享雖然是數(shù)據(jù)資源研究者共同的需求,但對數(shù)據(jù)擁有者而言,其帶來的隱私泄露風(fēng)險(xiǎn)是必須考慮的因素。

        以醫(yī)療數(shù)據(jù)為例,醫(yī)院作為醫(yī)療數(shù)據(jù)擁有者,希望能夠開放醫(yī)療數(shù)據(jù)以支持醫(yī)療領(lǐng)域科學(xué)研究,也希望能夠共享到其他醫(yī)院或其他機(jī)構(gòu)的醫(yī)療數(shù)據(jù)進(jìn)行研究。但是,醫(yī)療數(shù)據(jù)通常包含較多的隱私信息,包括患者的個(gè)人信息、病情病史、就診情況和醫(yī)生的診斷情況等等。出于對隱私的考慮,醫(yī)院作為數(shù)據(jù)擁有者,不可避免地對數(shù)據(jù)開放持保留態(tài)度。

        現(xiàn)有的隱私保護(hù)研究會對數(shù)據(jù)進(jìn)行匿名化或其他擾動處理,使得數(shù)據(jù)開放后無法獲得原始數(shù)據(jù),從而對數(shù)據(jù)隱私進(jìn)行保護(hù)。但在當(dāng)今對數(shù)據(jù)資源要求越來越高的情況下,擾動后的數(shù)據(jù)通常會影響數(shù)據(jù)使用者對數(shù)據(jù)的使用,進(jìn)而影響相關(guān)研究成果。

        數(shù)據(jù)擁有者有時(shí)在了解隱私泄露風(fēng)險(xiǎn)的情況下,愿意以一定的代價(jià)將數(shù)據(jù)開放。因此就需要研究者提供一套隱私泄露評估的手段,供數(shù)據(jù)擁有者了解數(shù)據(jù)開放可能帶來的隱私泄露風(fēng)險(xiǎn),以此決定是否開放數(shù)據(jù)或以何種形式開放數(shù)據(jù)。本文將對現(xiàn)有的隱私保護(hù)研究進(jìn)行概括總結(jié),并提出一種基于矩陣計(jì)算的隱私泄露評估方法,以適應(yīng)新的數(shù)據(jù)開放系統(tǒng)的需要。

        1 相關(guān)工作

        現(xiàn)有的隱私保護(hù)研究中有兩類比較重要的研究方向,其一是對數(shù)據(jù)進(jìn)行匿名化處理,尤其是對其中的標(biāo)識符等敏感信息。匿名化研究中,比較具有代表性的有文獻(xiàn)[1]提出的匿名化原則——k-匿名,文獻(xiàn)[2]提出的l-多樣性原則和文獻(xiàn)[3]提出的t-臨近原則等。從k-匿名到t-臨近,這些匿名化原則大多是將敏感屬性作為問題處理的關(guān)鍵,對其出現(xiàn)頻率、取值分布和取值多樣性,提出不同的限制,從而提出對應(yīng)的原則來達(dá)到使個(gè)人隱私不被泄露的目的[4-5]。

        基于匿名化的隱私保護(hù)模型,均會有不同的漏洞易被攻擊者利用。其原因在于模型的安全性都與攻擊者擁有的背景知識有關(guān),而攻擊者擁有的背景知識很難被形式化地定義。因此,一個(gè)匿名化的隱私保護(hù)模型只能針對擁有特定假設(shè)下的背景知識的攻擊者。此外,以上的匿名化隱私保護(hù)模型沒有嚴(yán)格的數(shù)學(xué)理論作為依據(jù),以有效地證明并表示隱私保護(hù)的強(qiáng)度,從而使得隱私保護(hù)的可靠性不夠強(qiáng)。

        針對以上問題,Dwork等[6]在2006年首次提出了差分隱私保護(hù)模型。該模型具有嚴(yán)格的理論依據(jù),并能夠嚴(yán)格地以參數(shù)表示隱私保護(hù)的強(qiáng)度。差分隱私描述的是一個(gè)對個(gè)體的承諾,即盡管攻擊者擁有較強(qiáng)的背景知識(主要來自于研究結(jié)果、發(fā)布數(shù)據(jù)集和其他信息來源),個(gè)體的信息也不會因?yàn)槠鋽?shù)據(jù)被用于研究而泄露。換言之,差分隱私保證了在從數(shù)據(jù)總體中獲得有效信息的同時(shí),個(gè)體數(shù)據(jù)(即個(gè)人隱私)不會被泄露[7]。差分隱私的基本機(jī)制有拉普拉斯機(jī)制和指數(shù)機(jī)制兩大類,同時(shí)具有序列組合性和并行組合性兩大特性[8]。但差分隱私存在對背景知識的假設(shè)過強(qiáng)以及隱私預(yù)算分配比較困難,對專業(yè)知識要求較高等問題[9-11]。

        2 數(shù)據(jù)開放中的隱私泄露評估

        現(xiàn)有的隱私保護(hù)研究多致力于對數(shù)據(jù)中的敏感信息進(jìn)行保護(hù),但或多或少都會影響到數(shù)據(jù)的可用性,這在某些應(yīng)用場景,尤其是要求使用原始數(shù)據(jù)的情形下,是不能被接受的。針對這種情況,本文對數(shù)據(jù)開放過程中的隱私泄露評估進(jìn)行了研究。

        2.1 問題分析與動機(jī)

        本文提出的隱私泄露評估方法是基于數(shù)據(jù)開放背景的。所謂數(shù)據(jù)開放是指,數(shù)據(jù)擁有者上傳數(shù)據(jù),數(shù)據(jù)使用者通過一定代價(jià)獲取自己需要的數(shù)據(jù)集進(jìn)行使用。

        數(shù)據(jù)開放能夠提供便利的數(shù)據(jù)共享服務(wù),但這也引發(fā)了數(shù)據(jù)開放者對隱私問題的擔(dān)憂。數(shù)據(jù)開放者在上傳原始數(shù)據(jù)時(shí),一定會考慮數(shù)據(jù)集里的敏感屬性是否會泄露,由此帶來的隱私風(fēng)險(xiǎn)如何。如果存在較大的風(fēng)險(xiǎn),數(shù)據(jù)開放者會考慮是否開放這部分?jǐn)?shù)據(jù),或者需要數(shù)據(jù)使用者付出怎樣的代價(jià)來換取數(shù)據(jù)的使用權(quán)。

        在這一過程中,數(shù)據(jù)開放帶來的隱私泄露風(fēng)險(xiǎn)能否被評估、能否被定量分析,就是數(shù)據(jù)開放者和數(shù)據(jù)擁有者共同關(guān)心的問題。因?yàn)橹挥心軌蜻M(jìn)行定量評估,才能供數(shù)據(jù)開放者參考,從而根據(jù)不同情況制定相應(yīng)的開放策略。因此,數(shù)據(jù)開放過程中的隱私泄露評估是一個(gè)很值得研究的問題。

        2.2 問題描述

        圖1是隱私泄露評估系統(tǒng)的結(jié)構(gòu)圖。數(shù)據(jù)開放者提供原始數(shù)據(jù)并根據(jù)自身隱私保護(hù)需求進(jìn)行隱私等級標(biāo)記。原始數(shù)據(jù)是指數(shù)據(jù)開放者希望進(jìn)行開放共享的未經(jīng)處理過的數(shù)據(jù)集,包含數(shù)據(jù)科學(xué)研究者感興趣的多方面內(nèi)容。隱私等級標(biāo)記f1,f2,…,fn是根據(jù)數(shù)據(jù)開放者自身的隱私保護(hù)需求,對開放數(shù)據(jù)集內(nèi)包含的字段的隱私保護(hù)需求等級進(jìn)行的標(biāo)記,也包括了對字段間關(guān)聯(lián)關(guān)系的隱私等級標(biāo)記。隱私等級標(biāo)記可用來評估數(shù)據(jù)開放帶來的隱私泄露風(fēng)險(xiǎn),等級越高,表示隱私泄露的風(fēng)險(xiǎn)越大。

        圖1 隱私泄露風(fēng)險(xiǎn)評估系統(tǒng)

        數(shù)據(jù)開放者通過接口上傳原始數(shù)據(jù)和隱私等級標(biāo)記,系統(tǒng)進(jìn)行隱私泄露風(fēng)險(xiǎn)等級評估后也將通過接口層將評估結(jié)果反饋給數(shù)據(jù)開放者,為其確定數(shù)據(jù)開放策略提供參考。數(shù)據(jù)使用者通過接口聲明自己的使用需求,包含需要使用的字段和對該字段進(jìn)行的操作。

        隱私泄露評估系統(tǒng)負(fù)責(zé)進(jìn)行隱私泄露評估,在獲取數(shù)據(jù)開放者設(shè)定的隱私等級標(biāo)記和數(shù)據(jù)使用者提出的使用需求后,利用評估算法進(jìn)行隱私泄露的風(fēng)險(xiǎn)評估。

        2.3 問題定義

        數(shù)據(jù)開放過程中的隱私泄露評估問題,需要從數(shù)據(jù)開放者和數(shù)據(jù)擁有者兩個(gè)角度來綜合考慮,因此本文基于下述兩個(gè)前提假設(shè)。

        首先,假設(shè)數(shù)據(jù)開放者對自己上傳的數(shù)據(jù)集有較為明確的隱私保護(hù)需求,即知道數(shù)據(jù)集中哪些字段是隱私保護(hù)等級較高或是哪些字段關(guān)聯(lián)后隱私保護(hù)等級較高。

        這就是數(shù)據(jù)開放者的隱私等級標(biāo)記,隱私等級標(biāo)記可用來評估數(shù)據(jù)開放帶來的隱私風(fēng)險(xiǎn),等級越高,表示數(shù)據(jù)開放的隱私風(fēng)險(xiǎn)越大。字段間關(guān)聯(lián)關(guān)系的標(biāo)記被稱為關(guān)聯(lián)字段規(guī)則,用來表示當(dāng)兩個(gè)或多個(gè)字段被同時(shí)使用時(shí)帶來的隱私風(fēng)險(xiǎn),通常比單字段隱私等級更高。本文參考BNF范式的格式,定義數(shù)據(jù)開放者的標(biāo)記語言如下:

        定義1數(shù)據(jù)開放者的標(biāo)記語言,是指數(shù)據(jù)開放者用來標(biāo)記開放數(shù)據(jù)集內(nèi)各字段以及操作隱私等級的語言,描述如下:

        <數(shù)據(jù)開放者標(biāo)記>::=(<對象>,<隱私等級>)

        <對象>::=<字段>|<操作>

        <字段>::=<單字段>|<多字段集合>

        <隱私等級>::=1|2|…|N

        這里,數(shù)據(jù)開放者的標(biāo)記包含兩大類,其一是字段隱私等級標(biāo)記,又包括兩類,一是單字段隱私等級,即單個(gè)字段的隱私等級;二是關(guān)聯(lián)字段規(guī)則。關(guān)聯(lián)字段規(guī)則的形式化定義如下:

        定義2關(guān)聯(lián)字段隱私等級,表示兩個(gè)或多個(gè)字段關(guān)聯(lián)情況下的字段隱私等級,一般格式為:

        r={f1,f2,…,fs,level},其中s≥2

        上式表示當(dāng)兩個(gè)或多個(gè)字段f1,f2,…,fs同時(shí)出現(xiàn)在同一使用需求中時(shí),這些字段的隱私等級將變?yōu)閘evel,因?yàn)楫?dāng)兩個(gè)或多個(gè)字段關(guān)聯(lián)時(shí),會暴露除單字段本身外更多的信息,因此level的值都大于或等于(通常是大于)單字段隱私等級。

        數(shù)據(jù)開放者標(biāo)記的第二類是操作隱私等級標(biāo)記,用來標(biāo)記不同操作的隱私等級,這一類標(biāo)記有時(shí)也可以使用事先設(shè)定好的缺省值。

        下面說明第一類字段隱私等級標(biāo)記。假設(shè)某醫(yī)院數(shù)據(jù)集有姓名、年齡、性別、診斷結(jié)果四個(gè)字段,醫(yī)院對這一數(shù)據(jù)集進(jìn)行了字段隱私等級標(biāo)記,如表1所示(這里N=5),其中最后一條為關(guān)聯(lián)字段規(guī)則。使用本文的數(shù)據(jù)開放標(biāo)記語言可以形式化描述如下:

        字段標(biāo)記1:(姓名,4);

        字段標(biāo)記2:(年齡,3);

        字段標(biāo)記3:(性別,1);

        字段標(biāo)記4:(診斷結(jié)果,4);

        字段標(biāo)記5:({姓名,診斷結(jié)果},5)。

        表1 某醫(yī)院數(shù)據(jù)集字段隱私等級標(biāo)記

        下面說明第二類操作隱私等級標(biāo)記。假設(shè)某醫(yī)院數(shù)據(jù)集支持的操作有取值、求和、計(jì)數(shù)、求最值,醫(yī)院對這些操作進(jìn)行了隱私等級標(biāo)記,如表2所示(這里N=3)。使用本文的數(shù)據(jù)開放者標(biāo)記語言可以形式化描述如下:

        操作標(biāo)記1:(取值,3);

        操作標(biāo)記2:(求和,2);

        操作標(biāo)記3:(計(jì)數(shù),1);

        操作標(biāo)記4:(求最值,2)。

        表2 某醫(yī)院數(shù)據(jù)集操作隱私等級標(biāo)記

        以上,是對數(shù)據(jù)開放者標(biāo)記的定義。

        其次,假設(shè)數(shù)據(jù)使用者有明確的使用需求,即能夠描述對需要的數(shù)據(jù)集內(nèi)每個(gè)字段進(jìn)行什么操作。

        數(shù)據(jù)使用者的使用需求語言定義如下:

        定義3數(shù)據(jù)使用者的使用需求語言,是指數(shù)據(jù)使用者用來描述具體使用需求的語言,描述如下:

        <使用需求>::=<需求元組>|<需求元組列表>

        <需求元組>::=(字段,操作集合)

        下面結(jié)合表1和表2,說明這一使用需求描述語言。假設(shè)醫(yī)院在開放如表1、表2所示的一個(gè)數(shù)據(jù)集后,一位數(shù)據(jù)使用者提出了這樣的使用需求:需要對年齡進(jìn)行求和、計(jì)數(shù)和求最值的操作,需要對性別和診斷結(jié)果進(jìn)行取值操作??梢孕问交孛枋鲞@個(gè)使用需求如下:

        需求元組1:(年齡,{求和,計(jì)數(shù),求最值});

        需求元組2:(性別,{取值});

        需求元組3:(診斷結(jié)果,{取值})。

        以上是對數(shù)據(jù)使用需求描述的定義。在此基礎(chǔ)上,可以形式化地描述數(shù)據(jù)開放過程中的隱私泄露評估:

        所謂隱私泄露評估,就是給定數(shù)據(jù)開放者標(biāo)記集合R和數(shù)據(jù)使用者需求集合U,求隱私泄露評估等級l=f(R,U),其中映射f就是隱私泄露評估的過程。

        隱私泄露評估就是綜合考慮數(shù)據(jù)開放者進(jìn)行的隱私等級標(biāo)記和數(shù)據(jù)使用者提出的使用需求,對此次數(shù)據(jù)開放進(jìn)行評估后得出隱私泄露風(fēng)險(xiǎn)等級,并反饋給數(shù)據(jù)開放者的過程。

        例如,某醫(yī)院作為數(shù)據(jù)擁有者,考慮開放一個(gè)數(shù)據(jù)集,其中包含患者ID、性別、年齡、病癥和治療方案等若干字段。作為數(shù)據(jù)擁有者,醫(yī)院認(rèn)為患者ID、治療方案都是隱私保護(hù)等級較高的字段,而患者ID和病癥關(guān)聯(lián)后,二者的隱私保護(hù)等級還會更高。某科研機(jī)構(gòu)作為數(shù)據(jù)使用者,希望研究某種疾病與性別和年齡的相關(guān)性,那么就需要對性別、年齡和病癥三個(gè)字段進(jìn)行取值、計(jì)數(shù)等操作。將這些信息作為輸入?yún)?shù)進(jìn)行隱私泄露評估后得到一個(gè)隱私泄露風(fēng)險(xiǎn)等級,并將這個(gè)等級反饋給醫(yī)院,為其制定相應(yīng)的數(shù)據(jù)開放策略提供參考。

        3 基于矩陣計(jì)算的隱私泄露評估方法

        3.1 評估方法

        在數(shù)據(jù)開放的時(shí)代背景下,大量數(shù)據(jù)擁有者希望開放共享自己擁有的數(shù)據(jù),供數(shù)據(jù)科學(xué)研究者進(jìn)行研究。但數(shù)據(jù)開放帶來的隱私泄露風(fēng)險(xiǎn),是困擾數(shù)據(jù)擁有者的重要問題。因此本文基于前述提到的數(shù)據(jù)開放中的隱私泄露評估思想,提出一種數(shù)據(jù)開放模式下的隱私泄露評估方法,以評估數(shù)據(jù)開放過程中可能帶來的隱私泄露風(fēng)險(xiǎn)等級,供數(shù)據(jù)開放者參考,進(jìn)而制定相應(yīng)的數(shù)據(jù)開放策略。

        下面對評估方法進(jìn)行具體說明:

        (1) 評估方法的輸入包含四個(gè)部分,首先對數(shù)據(jù)開放過程中所支持的m種操作的隱私等級進(jìn)行預(yù)標(biāo)記(例如,1-3級,隱私等級依次提高),記為o1,o2,…,om;其次數(shù)據(jù)開放者對擬開放的n個(gè)數(shù)據(jù)字段進(jìn)行隱私等級標(biāo)記(例如,1-5級,隱私保護(hù)需求依次升高),記為f1,f2,…,fn,如不進(jìn)行標(biāo)記則可以使用設(shè)定的缺省值,數(shù)據(jù)開放者同時(shí)會提出關(guān)聯(lián)字段規(guī)則集合R;數(shù)據(jù)使用者針對開放數(shù)據(jù)提出使用需求集合U。

        (2) 建立一個(gè)m×n的矩陣A,并均以最低的隱私等級(例如,1)填充。

        (3) 遍歷使用需求集合U中的每一個(gè)使用請求u,以操作為行,字段為列,若使用需求中涉及第i種操作和第j個(gè)字段,則在矩陣第i行第j列的位置存放oi×fj的值(即aij=oi×fj),其中若某些字段觸發(fā)了關(guān)聯(lián)字段規(guī)則集合R中的某一條r,則將會以關(guān)聯(lián)字段規(guī)則下的隱私等級替換原始的單字段隱私等級。例如,姓名和診斷結(jié)果單字段隱私等級均為4級,而二者關(guān)聯(lián)后隱私等級為5級,若在使用需求中同時(shí)用到這兩個(gè)字段時(shí),則將這兩個(gè)字段的隱私等級均設(shè)為5級。

        3.2 正確性證明

        評估方法的正確性主要由以下三個(gè)定理證明:

        定理1在字段隱私等級、操作隱私等級相同,針對字段進(jìn)行的操作數(shù)目相同的情況下,使用者兩次使用請求要求使用的字段數(shù)目分別為t1和t2,若t2>t1,則p2>p1。

        證明:由數(shù)據(jù)使用需求定義,使用者要求使用的字段越多,矩陣中就有更多元素由1替換為較大值,由隱私泄露風(fēng)險(xiǎn)等級系數(shù)的計(jì)算公式p=(asum-amin)/(amax-amin)可知,asum2>asum1,而amin和amax不變,因此p2>p1。

        證畢。

        定理2在字段隱私等級、操作隱私等級相同,要求使用字段數(shù)目相同的情況下,使用者兩次使用請求要求對字段進(jìn)行的操作數(shù)目分別為st1和st2,若st2>st1,則p2>p1。

        證明:證明過程類似定理1。

        以上兩個(gè)定理描述的是只考慮單字段的情況下評估算法的正確性,下述定理考慮關(guān)聯(lián)字段規(guī)則下評估算法的正確性。

        定理3在其他條件相同的情況下,加入關(guān)聯(lián)字段規(guī)則集合R,且使用請求觸發(fā)關(guān)聯(lián)字段規(guī)則時(shí),新的隱私泄露風(fēng)險(xiǎn)等級系數(shù)大于或等于原隱私泄露風(fēng)險(xiǎn)等級系數(shù)。

        證明:因?yàn)榍拔奶岬降年P(guān)聯(lián)字段規(guī)則中提出,關(guān)聯(lián)字段規(guī)則涉及到的字段隱私等級會提高,加入越多的關(guān)聯(lián)字段規(guī)則會使得隱私泄露風(fēng)險(xiǎn)等級系數(shù)越高,因此不失一般性,考慮加入兩個(gè)字段的關(guān)聯(lián)字段規(guī)則時(shí),隱私泄露風(fēng)險(xiǎn)等級的變化情況。

        證畢。

        以上證明了該評估方法的正確性,能夠根據(jù)隱私等級標(biāo)記和使用者的使用需求,對數(shù)據(jù)開放的隱私泄露風(fēng)險(xiǎn)進(jìn)行有效評估。

        4 實(shí)驗(yàn)分析

        為了驗(yàn)證方法的運(yùn)行效率和正確性,本文進(jìn)行了一系列實(shí)驗(yàn)。實(shí)驗(yàn)中我們給定操作隱私等級(見表2)、字段隱私等級和關(guān)聯(lián)字段規(guī)則集合,通過改變使用需求集合,根據(jù)上文提出的算法構(gòu)造不同的矩陣,計(jì)算相應(yīng)的隱私泄露風(fēng)險(xiǎn)等級系數(shù)來驗(yàn)證評估方法的正確性。

        實(shí)驗(yàn)采用UCI數(shù)據(jù)集Adult作為實(shí)驗(yàn)數(shù)據(jù)集[12],選取了其中“年齡(1)”“受教育時(shí)間(3)”“資本收益(4)”“資本損失(4)”“每周工作小時(shí)數(shù)(2)”“fnlwgt(5)”總計(jì)6個(gè)數(shù)值型字段進(jìn)行實(shí)驗(yàn),括號中為設(shè)定的字段隱私等級。

        實(shí)驗(yàn)環(huán)境如下:CPU配置為Intel(R) Core(TM) i5- 4590 @ 3.30 GHz,內(nèi)存8 GB,該計(jì)算機(jī)運(yùn)行Windows 10操作系統(tǒng),所有算法和實(shí)驗(yàn)程序由Python語言開發(fā)實(shí)現(xiàn)。

        4.1 運(yùn)行效率

        由于在實(shí)際運(yùn)用中,相比數(shù)據(jù)集的字段數(shù)目,通??紤]支持的操作數(shù)目數(shù)量級較小,因此在測試算法運(yùn)行效率時(shí),不考慮使用需求中涉及到的操作數(shù)目,而將其作為常數(shù),考慮涉及到的字段數(shù)目對算法運(yùn)行效率的影響。

        在實(shí)驗(yàn)過程中發(fā)現(xiàn)算法運(yùn)行時(shí)間與字段數(shù)基本呈線性正相關(guān),算法在Adult數(shù)據(jù)集上運(yùn)行時(shí)間很短,而在我們?nèi)斯ず铣傻陌?00個(gè)字段的數(shù)據(jù)集上,算法運(yùn)行時(shí)間也不到1毫秒,實(shí)際運(yùn)用中,數(shù)據(jù)集的字段數(shù)通常達(dá)不到100個(gè),因此該算法具有較高的運(yùn)行效率。

        4.2 正確性

        首先對定理1進(jìn)行驗(yàn)證,考慮在字段隱私等級、操作隱私等級相同,針對字段進(jìn)行的操作數(shù)目相同的情況下,使用請求要求使用的字段數(shù)目越多,則隱私泄露風(fēng)險(xiǎn)等級系數(shù)應(yīng)該越高。實(shí)驗(yàn)采用的Adult數(shù)據(jù)集總字段數(shù)為6,只改變每次請求要求使用的字段數(shù)目,要求對使用字段進(jìn)行的操作均為“取值”和“計(jì)數(shù)”(支持操作還包含“求和”、“求最值”,詳見表2),計(jì)算隱私泄露風(fēng)險(xiǎn)等級系數(shù)。實(shí)驗(yàn)結(jié)果如圖2所示。

        圖2 請求字段數(shù)

        圖2表明,在字段隱私等級、操作隱私等級相同,使用請求要求對字段進(jìn)行的操作數(shù)目相同的情況下,隨著要求使用字段數(shù)目的增多,隱私泄露風(fēng)險(xiǎn)等級系數(shù)也在不斷提高。

        下面對定理2進(jìn)行驗(yàn)證。考慮在字段隱私等級、操作隱私等級相同,要求使用字段數(shù)目相同的情況下,使用請求要求對字段進(jìn)行的操作數(shù)目越多,隱私泄露風(fēng)險(xiǎn)等級系數(shù)應(yīng)該越高。實(shí)驗(yàn)依然采用總字段數(shù)為6個(gè)的Adult數(shù)據(jù)集,且固定請求使用其中的4個(gè)字段(“受教育時(shí)間”,“資本收益”,“資本損失”,“每周工作小時(shí)數(shù)”),從支持操作集合{“取值”,“求和”,“計(jì)數(shù)”,“求最值”}中依次選取包含不同個(gè)數(shù)的操作子集作為操作使用請求,計(jì)算隱私泄露風(fēng)險(xiǎn)等級系數(shù),實(shí)驗(yàn)結(jié)果如圖3所示。

        圖3 請求操作數(shù)

        圖3表明,在字段隱私等級、操作隱私等級相同,要求使用字段數(shù)目相同的情況下,隨著使用請求要求對字段進(jìn)行的操作數(shù)目增多,隱私泄露風(fēng)險(xiǎn)等級系數(shù)在不斷提高。

        下面對定理3進(jìn)行驗(yàn)證??紤]在其他條件相同的情況下,加入關(guān)聯(lián)字段規(guī)則集合R,且使用請求觸發(fā)關(guān)聯(lián)字段規(guī)則時(shí),應(yīng)當(dāng)會使隱私泄露風(fēng)險(xiǎn)等級系數(shù)提高。實(shí)驗(yàn)采用若干字段數(shù)不同的數(shù)據(jù)集,且假設(shè)數(shù)據(jù)使用者請求使用所有字段,對每個(gè)字段進(jìn)行的操作固定且一致。然后隨機(jī)生成一系列的關(guān)聯(lián)字段規(guī)則,構(gòu)成不同的關(guān)聯(lián)字段規(guī)則集合,因?yàn)槭褂谜哒埱笫褂萌孔侄?,因此所有?guī)則會被觸發(fā)。此外,由于原始數(shù)據(jù)集中單字段隱私等級為隨機(jī)生成的,為了保證關(guān)聯(lián)字段規(guī)則中隱私等級比單字段隱私等級高,將關(guān)聯(lián)字段規(guī)則中的隱私等級全部設(shè)為最高級,實(shí)際應(yīng)用場景中通常會要求數(shù)據(jù)開放者在進(jìn)行標(biāo)記時(shí)保證關(guān)聯(lián)字段規(guī)則中隱私等級不低于單字段隱私等級。最后,計(jì)算關(guān)聯(lián)字段規(guī)則觸發(fā)下的隱私泄露風(fēng)險(xiǎn)等級系數(shù),結(jié)果如圖4所示。

        圖4 關(guān)聯(lián)字段規(guī)則

        圖4表明,在其他條件相同的情況下,加入關(guān)聯(lián)字段規(guī)則集合R,且使用請求觸發(fā)關(guān)聯(lián)字段規(guī)則時(shí),隱私泄露風(fēng)險(xiǎn)等級系數(shù)均有不同程度的提高。

        綜合而言,本文提出的隱私泄露評估方法的效率和正確性驗(yàn)證結(jié)果均符合預(yù)期。

        5 結(jié) 語

        本文結(jié)合當(dāng)前數(shù)據(jù)開放的需要,提出了一種基于矩陣計(jì)算的數(shù)據(jù)開放隱私泄露評估方法。該方法綜合考慮開放數(shù)據(jù)集中單字段和關(guān)聯(lián)字段的隱私等級所涉及操作的隱私等級以及數(shù)據(jù)使用者的使用需求,采用矩陣計(jì)算的方法,對數(shù)據(jù)開放的隱私泄露風(fēng)險(xiǎn)進(jìn)行評估,為數(shù)據(jù)擁有者決定是否開放數(shù)據(jù)以及開放形式提供參考,為數(shù)據(jù)開放提供了有力保障。

        在今后的研究中,我們將會對數(shù)據(jù)使用需求描述語言繼續(xù)進(jìn)行擴(kuò)展,以支持更為復(fù)雜的數(shù)據(jù)使用需求描述,進(jìn)一步提高評估結(jié)果的精細(xì)化程度。

        猜你喜歡
        擁有者單字字段
        基于Stackelberg博弈的異步聯(lián)邦學(xué)習(xí)激勵機(jī)制設(shè)計(jì)
        圖書館中文圖書編目外包數(shù)據(jù)質(zhì)量控制分析
        美德倫理品質(zhì)有利于其擁有者
        河北大名話單元音韻母、單字調(diào)及雙音節(jié)非輕聲詞連調(diào)的實(shí)驗(yàn)語音學(xué)初探
        “對仗不宜分解到單字”毋庸置疑——答顧紳先生“四點(diǎn)質(zhì)疑”
        中華詩詞(2016年11期)2016-07-21 14:56:16
        鹽城方言單字調(diào)聲學(xué)實(shí)驗(yàn)研究
        CNMARC304字段和314字段責(zé)任附注方式解析
        無正題名文獻(xiàn)著錄方法評述
        關(guān)于CNMARC的3--字段改革的必要性與可行性研究
        《通鑒釋文》所反映的宋代單字音特殊變化
        在线观看免费日韩精品| 青草蜜桃视频在线观看| 99久久国产一区二区三区| av成人一区二区三区| 亚洲精品tv久久久久久久久久| 一群黑人大战亚裔女在线播放| 亚洲日日噜噜噜夜夜爽爽| 国产高潮迭起久久av| 四虎成人精品国产永久免费无码| 国产99久久亚洲综合精品| 无码高清视频在线播放十区| 日本少妇又色又紧又爽又刺激| 国产亚洲精品久久久久久国模美| 欧美亚洲日本国产综合在线| 99久久国内精品成人免费| 国产av一区二区制服丝袜美腿| 中文字幕免费在线观看动作大片| 性欧美暴力猛交69hd| 福利网在线| 国产午夜精品视频观看| 国产专区一线二线三线码| 艳妇乳肉豪妇荡乳av无码福利 | 国产免费网站在线观看不卡| 久久久噜噜噜久久中文福利| 亚洲 欧美 激情 小说 另类| 久久亚洲精彩无码天堂| 熟女人妻在线中文字幕| 午夜毛片不卡免费观看视频| 国产成人精品三级麻豆 | 日本中文字幕一区二区高清在线 | 国产一区二区a毛片色欲| 久久麻传媒亚洲av国产| 国产日产综合| 中文字幕少妇AV| 亚洲一区二区三区在线激情| 高h小月被几个老头调教| 国产精品久久久久久人妻精品| 欧美亚洲日韩国产人成在线播放| 国产免费观看久久黄av麻豆 | 亚洲青青草视频在线播放| 国内自拍色第一页第二页|