付東煒
摘 要:社交網(wǎng)絡(luò)結(jié)構(gòu)信息和非敏感屬性信息均可通過(guò)公開(kāi)的用戶(hù)信息進(jìn)行推測(cè),從而推測(cè)出隱私用戶(hù)的信息,甚至造成敏感屬性的推測(cè),該文提出一種基于社區(qū)關(guān)鍵節(jié)點(diǎn)隱私用戶(hù)推測(cè)方法,對(duì)社區(qū)劃分中關(guān)鍵節(jié)點(diǎn)用戶(hù)隱私推測(cè)策略,最后以實(shí)例來(lái)說(shuō)明其推測(cè)過(guò)程。
關(guān)鍵詞:社交網(wǎng)絡(luò) 敏感屬性 推測(cè) 社區(qū)劃分
中圖分類(lèi)號(hào):TP293 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1672-3791(2017)03(c)-0010-02
社交網(wǎng)絡(luò)的高速發(fā)展,不同社交團(tuán)體之間關(guān)系緊密,有的社交團(tuán)體關(guān)系稀疏,這些不同的群體社交關(guān)系網(wǎng)絡(luò)中的社區(qū)[1]。研究表明,很多在線(xiàn)社交網(wǎng)絡(luò)用戶(hù)對(duì)安全風(fēng)險(xiǎn)認(rèn)識(shí)不足[2,3].通過(guò)對(duì)Facebook上調(diào)查80%用戶(hù)使用個(gè)人使用清晰可識(shí)別或者半可識(shí)別的個(gè)人照片信息[2],而一些用戶(hù)在交流過(guò)程中被泄露[3]。
1 基于社區(qū)劃分用戶(hù)隱私泄露
在社交網(wǎng)絡(luò)中大量用戶(hù)的個(gè)人信息是公開(kāi)的,對(duì)于社交網(wǎng)絡(luò)中用戶(hù)u,由其好友組成的好友關(guān)系網(wǎng)絡(luò)Gu=(Vu,Eu),Vu=Eu即與用戶(hù)u鄰接節(jié)點(diǎn)的集合,Eu ={i, j|i, j∈Vu }即用戶(hù)u的好友之間關(guān)系的集合。利用社區(qū)發(fā)現(xiàn)算法可以將Gu分為社區(qū)Ci,i=1,2,…,N,N 為總的社區(qū)數(shù)。對(duì)社區(qū)Ci內(nèi)公開(kāi)信息的用戶(hù)Pubi計(jì)算,Ki為社區(qū)Ci內(nèi)的公開(kāi)信息核心結(jié)節(jié)數(shù),Pi為社區(qū)Ci核心集,令Ti=| Pubi|/|Ci|=θ,Tik=| Ki|/| Pi |=θ,|Ci|為社區(qū)中總用戶(hù)數(shù),|Pubi|為社區(qū)信息公開(kāi)的用戶(hù)數(shù),| Pi |為社區(qū)的核心結(jié)節(jié)數(shù),|Ki|為社區(qū)核心公開(kāi)數(shù),為了保證實(shí)驗(yàn)的有效性,Ti,Tik滿(mǎn)足θ,θ,是實(shí)驗(yàn)中的閾值,該文中θ是關(guān)鍵值,下面按照兩種情況進(jìn)行討論:如果 Tik非常小,通過(guò)對(duì)Ti公開(kāi)信息的內(nèi)容進(jìn)行推測(cè),如果關(guān)鍵節(jié)點(diǎn)信息被隱藏,而關(guān)鍵節(jié)點(diǎn)的連接節(jié)點(diǎn)信息都公開(kāi)的,那關(guān)鍵節(jié)點(diǎn)的信息可以推測(cè)出來(lái);如果關(guān)鍵節(jié)點(diǎn)信息被隱藏,但在關(guān)鍵節(jié)點(diǎn)中有隱藏節(jié)點(diǎn),此時(shí),分兩種情況:(1)如果隱藏節(jié)點(diǎn)數(shù)目有限,則可以直接推測(cè)出關(guān)鍵信息;(2)如果隱藏節(jié)點(diǎn)數(shù)目多,無(wú)法直接推測(cè)關(guān)鍵節(jié)點(diǎn),通過(guò)其周?chē)?jié)點(diǎn)信息的公開(kāi)情況來(lái)推測(cè)其信息,再推測(cè)關(guān)鍵節(jié)點(diǎn)信息。
如果Ti值很大時(shí),可以大大提高關(guān)鍵節(jié)點(diǎn)推測(cè)正確率。當(dāng)Ti值很大時(shí),Tik很大時(shí),則系統(tǒng)推測(cè)正確率高;當(dāng)Ti值很大時(shí),Tik很小時(shí),通過(guò)關(guān)鍵節(jié)點(diǎn)的連接節(jié)點(diǎn)推測(cè)出關(guān)鍵節(jié)點(diǎn)信息,提高Ti k的值,從而提高系統(tǒng)推測(cè)正確率;當(dāng)Ti值很小時(shí),Ti k很大時(shí),通過(guò)關(guān)鍵節(jié)點(diǎn)推測(cè)其連接節(jié)點(diǎn),提高Ti的值,從而提高系統(tǒng)推測(cè)正確率;當(dāng)Ti值很小時(shí),Ti k很小時(shí),此時(shí)系統(tǒng)無(wú)法保證很高的推測(cè)正確率。算法如下:
(1)利用modularity 為度量的社區(qū)發(fā)現(xiàn),實(shí)現(xiàn)劃分社區(qū)和利用PageRank算法確定每個(gè)社區(qū)的關(guān)鍵節(jié)點(diǎn);
(2)計(jì)算 Ti,Tik,θ取0.4,θ取0.5 ,如果Ti值大,θ可以取小點(diǎn);
(3)If Ti≥0.4andTik≥0.5通過(guò)關(guān)鍵節(jié)點(diǎn),推測(cè)連接隱私節(jié)點(diǎn)信息,再推測(cè)其它關(guān)鍵節(jié)點(diǎn)或先推測(cè)所有關(guān)鍵節(jié)點(diǎn),再推測(cè)其它節(jié)點(diǎn);
(4)If Ti≥0.4andTik<0.5通過(guò)連接節(jié)點(diǎn),推測(cè)關(guān)鍵隱私節(jié)點(diǎn)信息,再推測(cè)其它連接節(jié)點(diǎn);
(5)If Ti<0.4andTik≥0.5通過(guò)關(guān)鍵節(jié)點(diǎn),推測(cè)連接隱私節(jié)點(diǎn)信息,再推測(cè)其它關(guān)鍵節(jié)點(diǎn)。
2 實(shí)例說(shuō)明
以圖1為例對(duì)信息推測(cè)過(guò)程進(jìn)行仿真,該實(shí)例可以分為4個(gè)社區(qū),通過(guò)PageRank算法計(jì)算得到關(guān)鍵節(jié)點(diǎn),則社區(qū)A,B,C,D關(guān)鍵節(jié)點(diǎn):A={A2,A3},B={B1,B3},C={C1,C3},D={D5,D3}。
首先計(jì)算A社區(qū)中隱藏節(jié)點(diǎn)A1的信息,令A(yù)i={InFi1A,InFi2A, InFi3A ,…, InFinA},表示A社區(qū)中i節(jié)點(diǎn)的信息。A社區(qū)能夠成為一個(gè)獨(dú)立的社區(qū),成員之間存在大量地相同信息,A1=A2∩A3∩A4,A2∩A3,關(guān)鍵節(jié)點(diǎn),信息中包括著與A1與A4的信息,已經(jīng)A4的信息是公開(kāi),此時(shí),隱藏節(jié)點(diǎn)A1= A2∩A3∩A4∪(A2∩A3-A4)通過(guò)關(guān)鍵節(jié)點(diǎn)來(lái)推測(cè)連接節(jié)點(diǎn)。
在社區(qū)C中,通過(guò)關(guān)鍵隱藏節(jié)點(diǎn)C3,通過(guò)C2,C1,C4進(jìn)行推測(cè)C3= C2∩C1∩C4,已經(jīng)C1也是關(guān)鍵節(jié)點(diǎn),也存在部分信息C1-C2∩C4-C3中信息為C3的信息,則C3= C2∩C1∩C4∪(C1-C2∩C4-C3)。
以此類(lèi)推,圖1中所有的隱藏節(jié)點(diǎn)都可以推測(cè)出來(lái),由于時(shí)間關(guān)系,實(shí)驗(yàn)仿真部分可選現(xiàn)有微博等用戶(hù)進(jìn)行實(shí)例推測(cè),后期的工作中對(duì)相關(guān)信息推測(cè)進(jìn)行推進(jìn)。
4 結(jié)語(yǔ)
該文提出一種基于關(guān)鍵節(jié)點(diǎn)的隱私用戶(hù)信息推測(cè)方法,通過(guò)社區(qū)的關(guān)鍵節(jié)點(diǎn)推測(cè)其它隱私節(jié)點(diǎn)信息。后期的工作通過(guò)對(duì)完整的社交信息進(jìn)行學(xué)習(xí),找出信息中關(guān)鍵節(jié)點(diǎn)在信息傳播過(guò)程中的作用。
參考文獻(xiàn)
[1] NEWMAN M. Modularity and community structure in network[J].The National Academy of Sciences,2012, 103(23):8857-8582.
[2] Gross R,Acquisti A.Information revelation and privacy in online social networks[C]//Proc of ACM Workshop on Privacy in the Electronic Society.2013:71-80.
[3] Huberman B A,Adar E,F(xiàn)ine L R.Valuating privacy[J].IEEE Security and Privacy,2014,10(5):22-25.