陳春玲,熊 晶,陳 琳,余 瀚
(南京郵電大學(xué) 計(jì)算機(jī)學(xué)院 軟件學(xué)院,江蘇 南京 210003)
加權(quán)社會(huì)網(wǎng)絡(luò)中的個(gè)性化隱私保護(hù)算法
陳春玲,熊 晶,陳 琳,余 瀚
(南京郵電大學(xué) 計(jì)算機(jī)學(xué)院 軟件學(xué)院,江蘇 南京 210003)
針對(duì)加權(quán)社會(huì)網(wǎng)絡(luò)中存在一部分用戶不需要隱私保護(hù)或者需要某種特殊隱私保護(hù)的現(xiàn)象,提出了一種基于加權(quán)社會(huì)網(wǎng)絡(luò)數(shù)據(jù)發(fā)布的個(gè)性化隱私保護(hù)方法。將社會(huì)網(wǎng)絡(luò)中的隱私保護(hù)分為3個(gè)等級(jí):不需保護(hù)L=0、防止權(quán)重包攻擊L=1和防止敏感屬性泄漏L=2。對(duì)于L≠0的節(jié)點(diǎn)集,通過k-度分組和修改權(quán)重包信息對(duì)節(jié)點(diǎn)進(jìn)行匿名,使得每個(gè)分組滿足權(quán)重包k-匿名;在分組過程中,對(duì)于存在L=2的分組要求其敏感屬性滿足l-diversity。理論分析和實(shí)驗(yàn)表明:攻擊者不能以大于1/k的概率識(shí)別出某節(jié)點(diǎn),且不能以大于1/l的概率推斷出節(jié)點(diǎn)的敏感信息。該方法能夠滿足社會(huì)網(wǎng)絡(luò)中各用戶對(duì)隱私保護(hù)的要求,同時(shí)降低了社會(huì)網(wǎng)絡(luò)圖的信息損失。
加權(quán)社會(huì)網(wǎng)絡(luò);隱私保護(hù);個(gè)性化;權(quán)重包;敏感屬性
前Sun Microsystems的CEO,Scott McNealy曾說過“反正你的隱私為零,那就克服它吧”。當(dāng)時(shí)這句話震驚了很多人。然而,十幾年過去了,事實(shí)證明他的說法是正確的。社會(huì)網(wǎng)絡(luò)中的用戶不斷增多,使得社會(huì)網(wǎng)絡(luò)在現(xiàn)實(shí)生活中已非常普遍,并深刻地影響著人們的日常生活。國外的LinkedIn、Facebook、Twitter,國內(nèi)的新浪微博、QQ、微信等社交平臺(tái)都擁有了龐大的客戶群。用戶通過社會(huì)網(wǎng)絡(luò)與他人分享個(gè)人信息,并接觸到了更多的人,而用戶之間的這種互動(dòng)與交流必然會(huì)產(chǎn)生大量社會(huì)網(wǎng)絡(luò)數(shù)據(jù)。分析數(shù)據(jù)有助于認(rèn)識(shí)網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)和演化過程、用戶的類別劃分和行為傾向等,但是也會(huì)造成用戶敏感信息泄漏,可能導(dǎo)致個(gè)人隱私受到威脅。近些年,對(duì)于社會(huì)網(wǎng)絡(luò)的隱私保護(hù)研究已經(jīng)引起了廣泛的關(guān)注。
Samarati等[1]提出k-匿名隱私保護(hù)模型,但僅針對(duì)關(guān)系數(shù)據(jù),并不適用于現(xiàn)在的社會(huì)網(wǎng)絡(luò);Terzi等[2]將節(jié)點(diǎn)的度作為攻擊者的背景知識(shí),提出了k-度匿名方法來防止節(jié)點(diǎn)再識(shí)別攻擊;Zhou等[3]提出的匿名化方法使得對(duì)任意節(jié)點(diǎn)的鄰域子圖,至少有k-1個(gè)節(jié)點(diǎn)的鄰域子圖與其同構(gòu);Jiao等[4]提出了個(gè)性化的社會(huì)網(wǎng)絡(luò)數(shù)據(jù)保護(hù)方法,允許用戶根據(jù)自身要求設(shè)置隱私保護(hù)程度,同時(shí)為了保護(hù)節(jié)點(diǎn)的敏感屬性(例如疾病、收入)不被泄漏,引入了l-diversity思想[5-7],避免同質(zhì)性攻擊。上述研究成果都是基于不帶權(quán)值的社會(huì)網(wǎng)絡(luò),在現(xiàn)實(shí)生活中,對(duì)邊的權(quán)值分析也是具有重要意義的,它可以表示社會(huì)網(wǎng)絡(luò)中各節(jié)點(diǎn)之間的連接關(guān)系,如朋友網(wǎng)絡(luò)(朋友圈)中的邊權(quán)值表示聯(lián)系次數(shù),商業(yè)交易網(wǎng)絡(luò)中的邊權(quán)值表示交易次數(shù)等。Maria等[8]提出了基于加權(quán)社會(huì)網(wǎng)絡(luò)的k-匿名保護(hù)方法,使得攻擊者不能以大于1/k的概率識(shí)別出目標(biāo)節(jié)點(diǎn);Tsai等[9-10]通過修改權(quán)值方法,使得任意兩節(jié)點(diǎn)之間的最短路徑條數(shù)滿足k1≤k≤k2,避免任意兩節(jié)點(diǎn)之間的最短路徑泄漏問題;Chen等[11]提出了k-histogram-inverse-l-diversity匿名方法,通過修改節(jié)點(diǎn)的權(quán)重包信息,使得同一等價(jià)類中節(jié)點(diǎn)的權(quán)重包信息相同;陳可等[12]提出了k-可能路徑匿名模型來保護(hù)加權(quán)社會(huì)網(wǎng)絡(luò)中的最短路徑信息泄漏問題;蘭麗輝等[13-14]采用向量來描述加權(quán)社會(huì)網(wǎng)絡(luò),通過隨機(jī)分割和聚類分割兩種方式將加權(quán)社會(huì)網(wǎng)絡(luò)表示為若干個(gè)子圖,用向量表示每個(gè)子圖,將所有子圖的向量構(gòu)成的集合作為加權(quán)社會(huì)網(wǎng)絡(luò)的發(fā)布模型,但目前還不能很好地應(yīng)用于社會(huì)網(wǎng)絡(luò)中。
現(xiàn)實(shí)生活中存在一種現(xiàn)象:只有很少一部分人需要較高級(jí)別的隱私保護(hù);對(duì)于度相對(duì)較大的節(jié)點(diǎn)集,只有其中很少一部分節(jié)點(diǎn)需要進(jìn)行較高級(jí)別的隱私保護(hù)[4]。例如,將生活中的公眾人物抽象為一個(gè)節(jié)點(diǎn),該節(jié)點(diǎn)的鄰居節(jié)點(diǎn)會(huì)比普通節(jié)點(diǎn)多,聚類系數(shù)更大,但是相對(duì)來說,他們的隱私保護(hù)要求更低。在加權(quán)社會(huì)網(wǎng)絡(luò)的隱私保護(hù)研究中,每個(gè)人對(duì)隱私保護(hù)的要求不盡相同,而目前的研究并沒有考慮到用戶的這一需求,而是將所有用戶節(jié)點(diǎn)都進(jìn)行同一隱私保護(hù),導(dǎo)致對(duì)某些節(jié)點(diǎn)的隱私保護(hù)過度,同時(shí)增加了隱私保護(hù)的代價(jià),降低了社會(huì)網(wǎng)絡(luò)信息的有效性。因此,文中提出一種基于加權(quán)社會(huì)網(wǎng)絡(luò)數(shù)據(jù)發(fā)布的個(gè)性化隱私保護(hù)算法。
2.1 加權(quán)社會(huì)網(wǎng)絡(luò)
為了形象地描述社會(huì)網(wǎng)絡(luò)結(jié)構(gòu),文中將其抽象成加權(quán)圖模型G=(V,E,W,S,L)。其中,V為節(jié)點(diǎn)集,表示社會(huì)網(wǎng)絡(luò)中的用戶;E為邊集,表示社會(huì)網(wǎng)絡(luò)中的節(jié)點(diǎn)關(guān)系;W為邊權(quán)值集,表示節(jié)點(diǎn)關(guān)系的緊密程度;S為敏感標(biāo)簽集,表示社會(huì)網(wǎng)絡(luò)中的用戶敏感屬性;L為隱私級(jí)別集,表示社會(huì)網(wǎng)絡(luò)中的用戶隱私要求。
圖1為某公司員工交流中心的模型,邊權(quán)值表示兩節(jié)點(diǎn)一周內(nèi)聯(lián)系的次數(shù),如果兩節(jié)點(diǎn)沒有連接,則表示他們本周沒有聯(lián)系過。節(jié)點(diǎn)的上半部分標(biāo)識(shí)表示員工的薪資,屬于敏感屬性,下半部分標(biāo)識(shí)表示隱私級(jí)別,可由節(jié)點(diǎn)自身進(jìn)行設(shè)置。例如節(jié)點(diǎn)a和b本周聯(lián)系了2次,a和d在本周沒有聯(lián)系過,且a的薪資為7.5k,隱私級(jí)別為1。
圖1 某公司員工交流中心網(wǎng)絡(luò)圖
2.2 權(quán)重包匿名
權(quán)重包:節(jié)點(diǎn)的權(quán)重包表示與該節(jié)點(diǎn)關(guān)聯(lián)的邊的權(quán)值序列,文中將此序列按照逆序排列。圖1中a的權(quán)重包為<5,2>,b的權(quán)重包為<7,6,5,4,2>。
權(quán)重包k-匿名:假設(shè)攻擊者已經(jīng)掌握了某個(gè)節(jié)點(diǎn)的權(quán)重包信息,很容易識(shí)別出目標(biāo)節(jié)點(diǎn)。為了避免節(jié)點(diǎn)受到此類攻擊,文中采用了權(quán)重包k-匿名的思想。通過修改權(quán)重包信息,使得每個(gè)分組中節(jié)點(diǎn)的權(quán)重包均一致,這樣攻擊者就不能以大于1/k的概率識(shí)別出目標(biāo)節(jié)點(diǎn)[11]。
2.3 敏感屬性匿名
在對(duì)節(jié)點(diǎn)進(jìn)行分組時(shí),可能會(huì)出現(xiàn)某個(gè)分組中的敏感屬性值都一樣的情形。而對(duì)于L=2的節(jié)點(diǎn)要求進(jìn)行敏感屬性匿名,使得攻擊者不能獲取敏感屬性。為了滿足用戶的隱私保護(hù)要求,文中采用l-diversity思想[11],使得每個(gè)分組中的敏感屬性值不同的節(jié)點(diǎn)數(shù)不小于l,因此攻擊者獲取目標(biāo)節(jié)點(diǎn)的敏感屬性值的概率不會(huì)大于1/l。
2.4 隱私級(jí)別
用戶根據(jù)自身需求設(shè)置相應(yīng)的隱私保護(hù)級(jí)別,文中將用戶隱私級(jí)別L分三個(gè)等級(jí):
(1)L=0,表示用戶對(duì)隱私保護(hù)沒有要求;
(2)L=1,表示用戶希望攻擊者不能通過其權(quán)重包識(shí)別出自己;
(3)L=2,表示用戶希望攻擊者不能通過其權(quán)重包識(shí)別出自己,且不能識(shí)別出自己的敏感屬性。
2.5 信息損失度loss
社會(huì)網(wǎng)絡(luò)的信息損失由三部分組成:邊的添加與刪除、節(jié)點(diǎn)的添加與刪除以及權(quán)值的修改。式(1)表示信息損失度loss的計(jì)算方法。
(1)
其中,α+β+γ=1;|Δedge|為添加與刪除的邊總數(shù);|Δnode|為添加與刪除的節(jié)點(diǎn)總數(shù);|Δweight|為權(quán)值修改的邊總數(shù)。
3.1 分組算法
圖1表示一個(gè)原始的社會(huì)網(wǎng)絡(luò)圖G,現(xiàn)在需要對(duì)G進(jìn)行隱私保護(hù),假設(shè)k=3,l=2。匿名算法如下:
(1)將節(jié)點(diǎn)(隱私級(jí)別L>0)的度按逆序排列,節(jié)點(diǎn)v記錄為(v,v.degree,S,L),得到度序列:
P={(b,5,10k,1),(j,5,10k,2),(f,4,6k,1),(h,4,3k,1),(l,3,9k,2),(a,2,7.5k,1),(e,2,3k,1),(c,1,7.5k,1),(d,1,6k,1),(n,1,6k,1)}
(2)將節(jié)點(diǎn)分組,選取前k個(gè)節(jié)點(diǎn)為當(dāng)前組,如果在該組中有L=2的節(jié)點(diǎn),且不滿足l-diversity,則將下一節(jié)點(diǎn)加入到當(dāng)前組中,直到滿足l-diversity,得到分組C1=(b,j,f)。
(4)重復(fù)步驟3,直到待分組的節(jié)點(diǎn)數(shù)小于等于k,得到分組C3=(e,c,d),C4=(n)。
(5)分組結(jié)束后,判斷最后一個(gè)分組是否滿足分組要求。如果不滿足,則與前一分組進(jìn)行合并,將C3與C4合并,得到C3=(e,c,d,n)。
故圖1的分組為C1C2C3。
3.2 圖匿名算法
對(duì)節(jié)點(diǎn)進(jìn)行分組后,需要對(duì)圖進(jìn)行匿名,使得攻擊者不能識(shí)別出目標(biāo)節(jié)點(diǎn)。為了防止攻擊者通過權(quán)重包識(shí)別出目標(biāo)節(jié)點(diǎn),要求每個(gè)分組滿足權(quán)重包k-匿名特性。
(1)分組后,每個(gè)分組首先要求節(jié)點(diǎn)度相同,這樣才可以達(dá)到權(quán)重包相同。故對(duì)于Δd≠0的節(jié)點(diǎn)需要進(jìn)行k-度匿名,使得每一組的節(jié)點(diǎn)度都相同。對(duì)分組中的各節(jié)點(diǎn)進(jìn)行k-度匿名會(huì)出現(xiàn)兩種情況:
①對(duì)于Δd>0的節(jié)點(diǎn)集N1,優(yōu)先選擇在N1中的兩個(gè)節(jié)點(diǎn)之間添加噪聲邊(不存在邊關(guān)聯(lián)),權(quán)值為0。如果|N1|=1或者N1節(jié)點(diǎn)集中的任意兩節(jié)點(diǎn)都存在邊,則添加噪聲節(jié)點(diǎn),此時(shí)噪聲節(jié)點(diǎn)的敏感屬性值與該節(jié)點(diǎn)相同,隱私級(jí)別L=0,噪聲邊權(quán)重為0。
②對(duì)于Δd<0的節(jié)點(diǎn)集N2,優(yōu)先選擇刪除N2中的兩個(gè)節(jié)點(diǎn)之間的關(guān)聯(lián)邊。如果依然存在Δd<0的節(jié)點(diǎn),則刪除其與隱私級(jí)別L=0的節(jié)點(diǎn)之間的關(guān)聯(lián)邊。如果不存在這樣的邊,則刪除其中一條邊,并將該邊關(guān)聯(lián)的另一節(jié)點(diǎn)連接到噪聲節(jié)點(diǎn)上,權(quán)值不變。
(2)權(quán)重包的匿名:對(duì)于每個(gè)分組,根據(jù)各邊權(quán)重出現(xiàn)的頻率,選取前n個(gè)值作為該分組的權(quán)重包標(biāo)準(zhǔn),n=avg(Ci)。修改每個(gè)節(jié)點(diǎn)的權(quán)重包,使得分組中的各節(jié)點(diǎn)權(quán)重包一致,盡量不改變?cè)瓉淼臋?quán)值。C1的權(quán)重包為<6,5,4,3,2>,C2的權(quán)重包為<5,4,3,2>,C3的權(quán)重包為<5>。由于每條邊關(guān)聯(lián)了兩個(gè)節(jié)點(diǎn),導(dǎo)致修改某個(gè)邊的權(quán)值后,在匿名其關(guān)聯(lián)的另外一個(gè)節(jié)點(diǎn)權(quán)重包時(shí),需要再次修改邊的權(quán)值。為了解決這個(gè)問題,采取泛化的方法,保存多次修改后的邊權(quán)值。例如,匿名節(jié)點(diǎn)b的權(quán)重時(shí),將邊eab的權(quán)值改為2,而在匿名節(jié)點(diǎn)a的權(quán)值時(shí),需要將eab的權(quán)值改為3,故將eab的權(quán)值修改為<2,3>,即eab的權(quán)值可能為2,也可能為3。
圖2為G的發(fā)布圖G*。粗實(shí)線表示修改了權(quán)值的邊或添加的噪聲邊,虛線為匿名過程中已刪除的邊,細(xì)實(shí)線表示原始邊,節(jié)點(diǎn)o為添加的噪聲節(jié)點(diǎn)。
3.3 算法分析
假設(shè)攻擊者掌握了目標(biāo)節(jié)點(diǎn)的權(quán)重包信息,在發(fā)布的社會(huì)網(wǎng)絡(luò)圖中,存在兩種情況:第一,在權(quán)重包匿名過程中,權(quán)重包的信息被修改過,使得在發(fā)布的社會(huì)網(wǎng)絡(luò)圖中不存在這樣的權(quán)重包,這樣攻擊者就識(shí)別不出目標(biāo)節(jié)點(diǎn),例如圖2中的節(jié)點(diǎn)b;第二,在權(quán)重包匿名過程中,要求同一個(gè)分組中每個(gè)節(jié)點(diǎn)的權(quán)重包一致,這樣攻擊者不能以大于1/k的概率識(shí)別出目標(biāo)節(jié)點(diǎn)。在分組過程中,如果存在某個(gè)節(jié)點(diǎn)的隱私級(jí)別L=2,則要求該組中敏感屬性值不同的節(jié)點(diǎn)個(gè)數(shù)大于等于l,因此,攻擊者也不能以大于1/l的概率推測(cè)出目標(biāo)節(jié)點(diǎn)的敏感屬性值。綜上所述,該算法是有效的。
由于在生成節(jié)點(diǎn)分組的過程中需要遍歷每個(gè)節(jié)點(diǎn),故時(shí)間復(fù)雜度為O(n)。分組結(jié)束后,對(duì)于L≠0的節(jié)點(diǎn),需要進(jìn)行k-度匿名。在對(duì)Δd≠0的節(jié)點(diǎn)集匿名過程中,需要?jiǎng)h除和增加邊,而找到最優(yōu)解的策略則需要遍歷該節(jié)點(diǎn)集,因此進(jìn)行節(jié)點(diǎn)k-度匿名的時(shí)間復(fù)雜度為O(n2)。例如現(xiàn)在需要使Δd>0的節(jié)點(diǎn)集滿足k-度匿名,則需要遍歷Δd>0節(jié)點(diǎn)集,判斷是否存在這樣的兩個(gè)節(jié)點(diǎn),不存在邊的連接。在對(duì)權(quán)重包的匿名過程中,需要將節(jié)點(diǎn)的權(quán)重包修改為所在分組的標(biāo)準(zhǔn)權(quán)重包,而選擇權(quán)重包的標(biāo)準(zhǔn)需要的時(shí)間復(fù)雜度為O(n)。因此,總的時(shí)間復(fù)雜度為O(n2)。
4.1 實(shí)驗(yàn)環(huán)境
實(shí)驗(yàn)在Windows 7操作系統(tǒng)上進(jìn)行,CPU2.0 GHz,內(nèi)存2 GB,編程工具使用Visual C++ 6.0。實(shí)驗(yàn)數(shù)據(jù)集來自微信(http://weixin.qq.com/),包含500個(gè)節(jié)點(diǎn)的網(wǎng)絡(luò)圖,1 482條邊,節(jié)點(diǎn)平均度為5.928,各節(jié)點(diǎn)的隱私保護(hù)級(jí)別(0~2)由程序隨機(jī)產(chǎn)生,各節(jié)點(diǎn)的敏感屬性值由程序隨機(jī)產(chǎn)生。
4.2 實(shí)驗(yàn)結(jié)果分析
算法考慮了現(xiàn)實(shí)情況,避免對(duì)不需要進(jìn)行隱私保護(hù)的節(jié)點(diǎn)進(jìn)行匿名,在滿足用戶的隱私要求下,減小了開銷,降低了數(shù)據(jù)的損失。分組是關(guān)鍵,在進(jìn)行分組時(shí)考慮節(jié)點(diǎn)滿足k-匿名的同時(shí),判斷當(dāng)前分組是否存在要求敏感屬性值滿足l-多樣性的節(jié)點(diǎn)。k值越大,用戶的隱私保護(hù)程度就越高,造成的信息損失也會(huì)越大,執(zhí)行時(shí)間越長;l值越大,攻擊者獲取目標(biāo)節(jié)點(diǎn)的敏感屬性值概率越??;社會(huì)網(wǎng)絡(luò)中節(jié)點(diǎn)的隱私級(jí)別分布比例,也會(huì)對(duì)社會(huì)網(wǎng)絡(luò)的信息損失和執(zhí)行時(shí)間產(chǎn)生重要影響。通過修改參數(shù)k和l,以及社會(huì)網(wǎng)絡(luò)的隱私級(jí)別分布,從時(shí)間和信息損失兩個(gè)方面對(duì)實(shí)驗(yàn)結(jié)果進(jìn)行分析。
圖3和圖4分別表示了隱私級(jí)別分布比例,以及k值對(duì)算法的執(zhí)行時(shí)間和信息損失度產(chǎn)生的影響,l=3,X∶Y∶Z表示隱私級(jí)別為L=0、L=1和L=2的節(jié)點(diǎn)分布比例。
圖3 執(zhí)行時(shí)間比較
圖4 信息損失度比較
當(dāng)分布比例為1∶0∶0時(shí),所有的節(jié)點(diǎn)均不要求進(jìn)行隱私保護(hù),因此k值的改變對(duì)執(zhí)行時(shí)間和信息損失沒有影響,且信息損失度為0。隨著k值的增大,當(dāng)分布比例為4∶3∶3,0∶1∶0以及0∶0∶1時(shí),執(zhí)行時(shí)間和信息損失不斷增大。當(dāng)k遠(yuǎn)大于l時(shí),分布比例為0∶1∶0和0∶0∶1的執(zhí)行時(shí)間和信息損失趨于相等。一般k值越大,分布比例為4∶4∶3的優(yōu)勢(shì)越能得到體現(xiàn)。
圖5表示的是算法執(zhí)行時(shí)間隨l值的變化規(guī)律,其中k=6,隱私級(jí)別分布比例為4∶3∶3。隨著l值的增大,執(zhí)行時(shí)間不斷增長,且增長比率也隨之增大。當(dāng)l遠(yuǎn)小于k時(shí),l值對(duì)執(zhí)行時(shí)間的影響不明顯;當(dāng)l接近k時(shí),l對(duì)執(zhí)行時(shí)間的影響則比較明顯。
圖5 執(zhí)行時(shí)間
對(duì)于加權(quán)社會(huì)網(wǎng)絡(luò)的隱私保護(hù)方法還處在不斷研究中。文中提出了一種基于加權(quán)社會(huì)網(wǎng)絡(luò)的個(gè)性化隱私保護(hù)方法,先除去不需要進(jìn)行保護(hù)的節(jié)點(diǎn),再將社會(huì)網(wǎng)絡(luò)按照節(jié)點(diǎn)度分組,要求每個(gè)分組中的節(jié)點(diǎn)滿足k-度匿名;對(duì)于存在L=2的節(jié)點(diǎn)所在分組,要求此分組滿足l-多樣性;分組結(jié)束后,對(duì)每個(gè)分組根據(jù)各邊權(quán)重出現(xiàn)的頻率,確定該分組的權(quán)重包標(biāo)準(zhǔn);通過修改邊的權(quán)值實(shí)現(xiàn)節(jié)點(diǎn)的權(quán)重包k-匿名,而對(duì)于需要重復(fù)修改權(quán)值的邊,通過泛化方法保留每次修改后的權(quán)值。實(shí)驗(yàn)結(jié)果表明,算法在滿足用戶的隱私保護(hù)要求的前提下,降低了對(duì)社會(huì)網(wǎng)絡(luò)結(jié)構(gòu)信息的破壞。但在處理敏感屬性滿足l-多樣性的過程中只考慮單一敏感屬性,并且對(duì)引入的噪聲節(jié)點(diǎn)未進(jìn)行匿名處理,以后還需針對(duì)上述問題不斷完善。
[1]SamaratiP,SweeneyL.Generalizingdatatoprovideanonymitywhendisclosinginformation[C]//ProceedingsoftheseventeenthACMSIGACT-SIGMOD-SIGARTsymposiumonprinciplesofdatabasesystems.[s.l.]:ACM,1998.
[2]LiuK,TerziE.Towardsidentityanonymizationongraphs[C]//ProceedingsofACMSIGMODinternationalconferenceonmanagementofdata.Vancouver:ACM,2008:93-106.
[3]ZhouB,PeiJ.Preservingprivacyinsocialnetworksagainstneighborhoodattacks[C]//ProcofIEEEinternationalconferenceondataengineering.[s.l.]:IEEEComputerSociety,2008:506-515.
[4]JiaoJ,LiuP,LiX.Apersonalizedprivacypreservingmethodforpublishingsocialnetworkdata[M]//Theoryandapplicationsofmodelsofcomputation.[s.l.]:SpringerInternationalPublishing,2014:141-157.
[5]ZhouB,PeiJ.Thek-anonymityandl-diversityapproachesforprivacypreservationinsocialnetworksagainstneighborhoodattacks[J].Knowledge&InformationSystems,2011,28(1):47-77.
[6]TripathyBK,SishodiaMS,JainS,etal.Privacyandanonymizationinsocialnetworks[M]//Socialnetworking.[s.l.]:SpringerInternationalPublishing,2014.
[7]SongY,KarrasP,XiaoQ,etal.Sensitivelabelprivacyprotectiononsocialnetworkdata[M]//Scientificandstatisticaldatabasemanagement.Berlin:Springer,2012:562-571.
[8]SkarkalaME,MaragoudakisM,GritzalisS,etal.Privacypreservationbyk-anonymizationofweightedsocialnetworks[C]//Proceedingsofthe2012internationalconferenceonadvancesinsocialnetworksanalysisandmining.[s.l.]:IEEEComputerSociety,2012:423-428.
[9]TsaiYC,WangSL,HongTP,etal.[K1,K2]-anonymizationofshortestpaths[C]//Procofinternationalconferenceonadvancesinmobilecomputing&multimedia.[s.l.]:ACM,2014:317-321.
[10]TsaiYC,WangSL,HongTP,etal.Extending[K1,K2]anonymizationofshortestpathsforsocialnetworks[M]//Multidisciplinarysocialnetworksresearch.Berlin:Springer,2015:187-199.
[11]ChenKe,ZhangHongyi,WangBin,etal.Protectingsensitivelabelsinweightedsocialnetworks[C]//Procofwebinformationsystemandapplicationconference.[s.l.]:IEEE,2013:221-226.
[12] 陳 可,劉向宇,王 斌,等.防止路徑攻擊的加權(quán)社會(huì)網(wǎng)絡(luò)匿名化技術(shù)[J].計(jì)算機(jī)科學(xué)與探索,2013,7(11):961-972.
[13] 蘭麗輝,鞠時(shí)光.基于向量相似的權(quán)重社會(huì)網(wǎng)絡(luò)隱私保護(hù)[J].電子學(xué)報(bào),2015,43(8):1568-1574.
[14] 蘭麗輝,鞠時(shí)光.基于差分隱私的權(quán)重社會(huì)網(wǎng)絡(luò)隱私保護(hù)[J].通信學(xué)報(bào),2015,36(9):145-159.
Personalized Privacy Preservation Algorithm in Weighted Social Networks
CHEN Chun-ling,XIONG Jing,CHEN Lin,YU Han
(School of Computer Science & Technology,School of Software,Nanjing University of Posts and Telecommunications,Nanjing 210003,China)
There is a phenomenon that some users do not need privacy protections or they need special privacy protections in social networks,so a personalized privacy protection method to meet these requirements is proposed based on weighted social network.The privacy protection is divided into three levels:without protection (L=0),preventingtheweightbagsattack(L=1),andpreventingthesensitiveattributesdisclosure(L=2).FornodeswithL≠0,k-degreegroupingandweightbagmodifyingisusedtotheanonymousnodes,whichmakeseachgroupmeetsthekanonymityofweightbag.Intheprocessofgrouping,thegroupwithL=2hastoensurel-diversityforsensitiveattributes.Theoreticalanalysisandexperimentsshowthatattackerscan’tidentifyanodewiththeprobabilityover1/kandinfernode’ssensitiveattributewiththeprobabilityover1/l.Themethodsatisfiestheuser’srequirementsinweightedsocialnetwork,andtheinformationlossisreduced.
weighted social network;privacy preservation;personalization;weight bag;sensitive attributes
2015-11-18
2016-03-03
時(shí)間:2016-08-01
國家自然科學(xué)基金資助項(xiàng)目(11501302)
陳春玲(1961-),男,教授,碩士,CCF會(huì)員,從事軟件技術(shù)及其在通信中的應(yīng)用、網(wǎng)絡(luò)信息安全等方面的教學(xué)和科研工作;熊 晶(1991-),女,碩士研究生,研究方向?yàn)樾畔踩c隱私保護(hù)。
http://www.cnki.net/kcms/detail/61.1450.TP.20160801.0842.018.html
TP
A
1673-629X(2016)08-0088-05
10.3969/j.issn.1673-629X.2016.08.019