亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于大數(shù)據(jù)分析的移動(dòng)社交網(wǎng)絡(luò)用戶隱私信息關(guān)聯(lián)關(guān)系研究

        2018-09-23 08:05:14王平水朱新峰
        關(guān)鍵詞:屬性數(shù)據(jù)關(guān)聯(lián)社交

        王平水,朱新峰

        0 引言

        移動(dòng)社交網(wǎng)絡(luò)作為大數(shù)據(jù)時(shí)代下的主要網(wǎng)絡(luò)社交平臺(tái),其安全性及隱私問(wèn)題直接影響移動(dòng)社交網(wǎng)絡(luò)用戶參與網(wǎng)絡(luò)活動(dòng)的積極性,網(wǎng)絡(luò)用戶的隱私保護(hù)問(wèn)題值得社會(huì)各界高度關(guān)注.

        當(dāng)前,隨著Web 2.0技術(shù)的廣泛應(yīng)用,移動(dòng)社交網(wǎng)絡(luò)作為一種新型互聯(lián)網(wǎng)交互模式,正受到越來(lái)越多的關(guān)注,已經(jīng)成為用戶數(shù)最多、傳播影響最大的新媒體平臺(tái),如Facebook、Twitter、人人網(wǎng)、開心網(wǎng)、微博、微信等,為人們聊天交友和及時(shí)分享信息提供了便捷的服務(wù),吸引了大量用戶參與進(jìn)來(lái).大數(shù)據(jù)時(shí)代的到來(lái)加劇了社交網(wǎng)絡(luò)隱私泄露的風(fēng)險(xiǎn),由于移動(dòng)社交網(wǎng)絡(luò)具有開放性、共享性和連通性等特點(diǎn),借助強(qiáng)大的搜索引擎,用戶的隱私信息更容易被窺探、收集和非法利用,而且用戶看是平常的信息,借助大數(shù)據(jù)分析工具,從中挖掘出用戶的關(guān)聯(lián)信息,也可能造成用戶隱私的泄露,給相關(guān)個(gè)體和組織帶來(lái)一定的安全威脅.因此,如何使社交網(wǎng)絡(luò)在滿足用戶溝通交流、模式知識(shí)發(fā)現(xiàn)的同時(shí),更好地保護(hù)數(shù)據(jù)所有者的隱私,已成為近年來(lái)相關(guān)領(lǐng)域?qū)<覍W(xué)者研究的熱點(diǎn)問(wèn)題.

        目前針對(duì)社交網(wǎng)絡(luò)用戶隱私保護(hù)研究主要集中于社交網(wǎng)絡(luò)數(shù)據(jù)發(fā)布的隱私保護(hù)[1-3]和社交網(wǎng)絡(luò)訪問(wèn)控制等方面[4].社交網(wǎng)絡(luò)數(shù)據(jù)發(fā)布的隱私保護(hù)技術(shù)研究的較多,主要采用匿名處理技術(shù)[5-10],使得發(fā)布的社交網(wǎng)絡(luò)數(shù)據(jù)能夠滿足數(shù)據(jù)分析的需要,又能很好地保護(hù)用戶隱私不被泄露;社交網(wǎng)絡(luò)訪問(wèn)控制技術(shù)的研究主要集中于社交網(wǎng)絡(luò)訪問(wèn)控制模型設(shè)計(jì)[11-13],以解決社交網(wǎng)絡(luò)數(shù)據(jù)授權(quán)訪問(wèn)問(wèn)題.然而,現(xiàn)有文獻(xiàn)對(duì)用戶隱私信息間的關(guān)聯(lián)關(guān)系研究的很少,不便于進(jìn)行個(gè)性化隱私保護(hù)策略設(shè)計(jì),增加了用戶隱私保護(hù)設(shè)置的復(fù)雜性.為此,該文以數(shù)據(jù)挖掘和大數(shù)據(jù)分析工具為技術(shù)手段,對(duì)移動(dòng)社交網(wǎng)絡(luò)用戶個(gè)體及群體屬性數(shù)據(jù)進(jìn)行分析,提取用戶隱私信息關(guān)聯(lián)關(guān)系,以便為進(jìn)行個(gè)性化隱私保護(hù)策略設(shè)計(jì)提供數(shù)據(jù)支撐.

        1 相關(guān)概念

        1.1 移動(dòng)社交網(wǎng)絡(luò)(Mobile Social Network)

        移動(dòng)社交網(wǎng)絡(luò)是人們利用移動(dòng)終端設(shè)備通過(guò)Facebook、Twitter、人人網(wǎng)、開心網(wǎng)、博客、微博、微信、QQ 等 Internet應(yīng)用而形成的一類特殊社交群體,其本質(zhì)是提供一個(gè)分享興趣、愛(ài)好、狀態(tài)和活動(dòng)等信息的移動(dòng)交流平臺(tái).隨著移動(dòng)設(shè)備以及互聯(lián)網(wǎng)、云計(jì)算、大數(shù)據(jù)、人工智能等新一代信息技術(shù)的發(fā)展,移動(dòng)社交網(wǎng)絡(luò)已經(jīng)滲透到人們?nèi)粘9ぷ?、學(xué)習(xí)、生活的方方面面,具有實(shí)時(shí)性、開放性、移動(dòng)性、個(gè)性化等特點(diǎn),成為人們思想溝通、情感交流、數(shù)據(jù)通信、信息分享的主要平臺(tái),給人們帶來(lái)零距離的社交體驗(yàn).

        1.2 大數(shù)據(jù)(Big Data)

        大數(shù)據(jù)是指無(wú)法在一定時(shí)間內(nèi)用常規(guī)軟件工具對(duì)其內(nèi)容進(jìn)行抓取、管理和處理的數(shù)據(jù)集合.移動(dòng)社交網(wǎng)絡(luò)幾乎每時(shí)每刻都在產(chǎn)生新的數(shù)據(jù),數(shù)據(jù)種類和規(guī)模正以前所未有的速度呈指數(shù)級(jí)增長(zhǎng),整體上呈現(xiàn)出大數(shù)據(jù)的4V特征,即數(shù)據(jù)規(guī)模大(Volume)、處理速度快(Velocity)、數(shù)據(jù)類型多(Variety)、價(jià)值密度低(Value),這給社交網(wǎng)絡(luò)數(shù)據(jù)分析和研究者提供了研究的基礎(chǔ),便于展開相關(guān)數(shù)據(jù)分析、模式識(shí)別與知識(shí)發(fā)現(xiàn).

        1.3 關(guān)聯(lián)規(guī)則(Association Rule)

        關(guān)聯(lián)規(guī)則是指隱藏在于大型數(shù)據(jù)集中的有趣的、屬性間的關(guān)聯(lián)和規(guī)律,是數(shù)據(jù)挖掘中的重要研究?jī)?nèi)容,被廣泛應(yīng)用于金融領(lǐng)域[14].然而,在移動(dòng)社交網(wǎng)絡(luò)用戶屬性數(shù)據(jù)集中,通過(guò)關(guān)聯(lián)規(guī)則挖掘技術(shù)和大數(shù)據(jù)分析技術(shù)同樣可以找出社交網(wǎng)絡(luò)用戶屬性間的關(guān)聯(lián)關(guān)系(其中部分屬性可能為用戶的隱私信息),從而為社交網(wǎng)絡(luò)用戶的隱私保護(hù)策略設(shè)置提供數(shù)據(jù)支撐.

        2 大數(shù)據(jù)分析技術(shù)

        眾所周知,大數(shù)據(jù)的特征之一是價(jià)值密度低(Value),即在大量的數(shù)據(jù)中可能只有微乎其微的數(shù)據(jù)是有價(jià)值的,如何將其中的價(jià)值提取出來(lái),需要大數(shù)據(jù)分析技術(shù)的支撐.大數(shù)據(jù)分析技術(shù)有很多,如數(shù)據(jù)挖掘、統(tǒng)計(jì)分析、模型預(yù)測(cè)、可視化分析等,以下簡(jiǎn)要介紹與社交網(wǎng)絡(luò)用戶屬性數(shù)據(jù)處理有關(guān)的主要技術(shù).

        2.1 MapReduce技術(shù)

        MapReduce是面向大數(shù)據(jù)并行處理的計(jì)算模型、框架和平臺(tái),最早是由Google公司研究提出的一種面向大規(guī)模數(shù)據(jù)處理的并行計(jì)算模型和方法,后來(lái)在Hadoop中得到了開源實(shí)現(xiàn),功能上顯著增強(qiáng)[15].

        Hadoop MapReduce將復(fù)雜的、運(yùn)行于大規(guī)模集群上的并行計(jì)算過(guò)程高度地抽象到了兩個(gè)函數(shù):Map和Reduce,MapReduce采用“分而治之”策略,一個(gè)存儲(chǔ)在分布式文件系統(tǒng)中的大規(guī)模數(shù)據(jù)集,會(huì)被切分成許多獨(dú)立的分片(split),這些分片可以被多個(gè)Map任務(wù)并行處理,處理后的中間結(jié)果作為Reduce任務(wù)的輸入,產(chǎn)生出需要的結(jié)果:<鍵,值>對(duì).

        表1 Map和Reduce函數(shù)

        2.2 關(guān)聯(lián)規(guī)則挖掘技術(shù)

        關(guān)聯(lián)規(guī)則是形如X→Y的蘊(yùn)涵式,其中,X和Y分別稱為關(guān)聯(lián)規(guī)則的前導(dǎo)和后繼.其中,關(guān)聯(lián)規(guī)則X→Y,存在支持度和置信度.

        令I(lǐng)={i1,i2,…,im}為數(shù)據(jù)庫(kù)中所有項(xiàng)的集合,D={t1,t2,…,tn}為數(shù)據(jù)庫(kù),其中每條記錄ti為一個(gè)項(xiàng)集且ti?I,記錄ti包含項(xiàng)集X當(dāng)且僅當(dāng)X?ti.關(guān)聯(lián)規(guī)則X→Y被稱為是有趣的當(dāng)且僅當(dāng)其支持度和置信度分別不低于用戶給定的最小支持度和最小置信度閾值,其中規(guī)則X→Y的支持度和置信度分別定義為:

        其中|X|為數(shù)據(jù)庫(kù)D中包含項(xiàng)集X的記錄數(shù).

        關(guān)聯(lián)規(guī)則挖掘算法一般分為兩步:首先找出所有的頻繁項(xiàng)集;然后根據(jù)用戶給定的最小支持度和最小置信度閾值產(chǎn)生有趣的關(guān)聯(lián)規(guī)則.

        3 移動(dòng)社交網(wǎng)絡(luò)用戶隱私信息關(guān)聯(lián)分析

        人們?cè)谏缃痪W(wǎng)絡(luò)上提供了許多真實(shí)的個(gè)人信息,包括個(gè)人資料、教育和工作經(jīng)歷、聯(lián)系方式、照片、言論和在線活動(dòng)等,而且,移動(dòng)社交網(wǎng)絡(luò)中聊天信息、視頻信息、圖片信息猛增,呈現(xiàn)出結(jié)構(gòu)化、半結(jié)構(gòu)化以及非結(jié)構(gòu)化等多種數(shù)據(jù)形式,其龐大的信息量符合大數(shù)據(jù)典型的4V(Volume、Variety、Velocity、Veracity)特性,傳統(tǒng)的數(shù)據(jù)分析工具面對(duì)如此復(fù)雜、規(guī)模巨大的社交網(wǎng)絡(luò)數(shù)據(jù)顯得力不從心,需借助大數(shù)據(jù)處理工具方可有效處理.

        為利用大數(shù)據(jù)分析技術(shù)對(duì)社交網(wǎng)絡(luò)進(jìn)行用戶隱私信息關(guān)聯(lián)分析,我們隨機(jī)選取了部分某社交網(wǎng)絡(luò)用戶屬性數(shù)據(jù)作為樣本數(shù)據(jù),該樣本數(shù)據(jù)中共有50000個(gè)用戶,每個(gè)用戶包含姓名、性別、生日、血型、職業(yè)、興趣愛(ài)好、手機(jī)、郵箱等屬性,且每個(gè)屬性均包含是否公開選項(xiàng),我們主要針對(duì)每個(gè)屬性的是否公開數(shù)據(jù)進(jìn)行關(guān)聯(lián)分析,以便簡(jiǎn)化用戶賬號(hào)注冊(cè)時(shí)的相關(guān)屬性隱私設(shè)置.

        3.1 單屬性數(shù)據(jù)隱私分析

        假定支持度為60%,通過(guò)對(duì)樣本數(shù)據(jù)的單屬性數(shù)據(jù)統(tǒng)計(jì)分析(如表2),得到如下結(jié)果:

        表2 單屬性數(shù)據(jù)隱私情況統(tǒng)計(jì)

        統(tǒng)計(jì)結(jié)果表明:60%以上的用戶將姓名、生日、手機(jī)和郵箱視為個(gè)人隱私,于是,在社交網(wǎng)絡(luò)用戶賬號(hào)注冊(cè)時(shí)系統(tǒng)自動(dòng)將這些屬性可設(shè)置為默認(rèn)不公開,其他屬性默認(rèn)公開.我們將姓名、生日、手機(jī)和郵箱定義為大眾屬性,其余為小眾屬性.

        在將性別屬性數(shù)據(jù)視為隱私的8418用戶中,性別為男和女的用戶分別占16%和84%,如表3.該結(jié)果表明,在社交網(wǎng)絡(luò)用戶中女性用戶對(duì)性別數(shù)據(jù)的隱私保護(hù)意識(shí)比男性更強(qiáng).

        表3 性別屬性數(shù)據(jù)隱私情況統(tǒng)計(jì)

        3.2 雙屬性數(shù)據(jù)隱私關(guān)聯(lián)分析

        在將性別屬性數(shù)據(jù)視為隱私的8418用戶中,將其他某一小眾屬性數(shù)據(jù)也視為隱私的用戶統(tǒng)計(jì)情況如表4.于是,在社交網(wǎng)絡(luò)用戶賬號(hào)注冊(cè)時(shí)系統(tǒng)通過(guò)實(shí)時(shí)檢測(cè)性別屬性的隱私設(shè)置,自動(dòng)完成相關(guān)屬性的默認(rèn)設(shè)置,從而簡(jiǎn)化用戶操作,同時(shí)也保護(hù)了用戶的相關(guān)屬性數(shù)據(jù).

        表4 雙屬性數(shù)據(jù)(含性別)隱私情況統(tǒng)計(jì)

        3.3 多屬性數(shù)據(jù)隱私關(guān)聯(lián)分析

        在將性別、血型屬性數(shù)據(jù)視為隱私的8418用戶中,將其他某一小眾屬性數(shù)據(jù)也視為隱私的用戶統(tǒng)計(jì)情況如表5.同理在社交網(wǎng)絡(luò)用戶賬號(hào)注冊(cè)時(shí)系統(tǒng)可自動(dòng)完成相關(guān)屬性的默認(rèn)設(shè)置.

        表5 三屬性數(shù)據(jù)(含性別、血型)隱私情況統(tǒng)計(jì)

        此外,我們也可以將大眾屬性與小眾屬性結(jié)合進(jìn)行多屬性的隱私關(guān)聯(lián)分析,找出大眾屬性間、小眾屬性間以及大小眾人屬性間的隱私信息關(guān)聯(lián)關(guān)系,為用戶個(gè)性化隱私保護(hù)策略設(shè)計(jì)提供參考依據(jù).

        4 結(jié)束語(yǔ)

        移動(dòng)社交網(wǎng)絡(luò)作為Web2.0的技術(shù)產(chǎn)物之一,已經(jīng)成為人們?cè)诨ヂ?lián)網(wǎng)上傳播信息、溝通交流的主要平臺(tái).大數(shù)據(jù)工具的出現(xiàn)加劇了移動(dòng)社交網(wǎng)絡(luò)用戶隱私泄露的風(fēng)險(xiǎn).移動(dòng)社交網(wǎng)絡(luò)用戶信息安全與隱私保護(hù)問(wèn)題成為學(xué)術(shù)界和工業(yè)界近年來(lái)關(guān)注的熱點(diǎn).然而,現(xiàn)有研究很少關(guān)注用戶隱私信息間的關(guān)聯(lián)關(guān)系,給用戶個(gè)性化隱私保護(hù)策略設(shè)計(jì)帶來(lái)不便,也增加了用戶隱私保護(hù)設(shè)置的復(fù)雜性.本文以大數(shù)據(jù)分析工具為技術(shù)手段,對(duì)移動(dòng)社交網(wǎng)絡(luò)用戶隱私信息關(guān)聯(lián)關(guān)系進(jìn)行了分析,以便為進(jìn)行個(gè)性化隱私保護(hù)策略設(shè)計(jì)提供數(shù)據(jù)支撐.下一步我們將在此基礎(chǔ)上,通過(guò)建立支持移動(dòng)社交網(wǎng)絡(luò)用戶個(gè)性化隱私偏好的授權(quán)模型來(lái)實(shí)現(xiàn)更為靈活的、實(shí)用的隱私策略定義,并進(jìn)行仿真實(shí)驗(yàn)和對(duì)比分析,以全面解決移動(dòng)社交網(wǎng)絡(luò)應(yīng)用中存在的用戶隱私泄露問(wèn)題.

        猜你喜歡
        屬性數(shù)據(jù)關(guān)聯(lián)社交
        社交之城
        社交牛人癥該怎么治
        意林彩版(2022年2期)2022-05-03 10:25:08
        社交距離
        基于GIS的房產(chǎn)測(cè)繪管理信息系統(tǒng)架構(gòu)研究
        科技資訊(2019年18期)2019-09-17 11:03:28
        “一帶一路”遞進(jìn),關(guān)聯(lián)民生更緊
        無(wú)源多傳感器綜合數(shù)據(jù)關(guān)聯(lián)算法研究
        屬性數(shù)據(jù)分析教學(xué)改革初探
        你回避社交,真不是因?yàn)閮?nèi)向
        文苑(2018年17期)2018-11-09 01:29:28
        奇趣搭配
        智趣
        讀者(2017年5期)2017-02-15 18:04:18
        亚洲av日韩专区在线观看| 日韩av一区二区蜜桃| 麻豆精品国产专区在线观看| 丁字裤少妇露黑毛| 亚洲欲色欲香天天综合网| 最新永久免费AV网站| 免费人成网站在线视频| 国产成人精品999视频| √天堂中文官网8在线| 欧美日本视频一区| 中文字幕av素人专区| 白丝爆浆18禁一区二区三区| 亚洲av永久无码一区| 超清无码AV丝袜片在线观看| 日韩中文字幕久久久老色批| 四川丰满妇女毛片四川话| 开心久久综合婷婷九月| 国产亚洲精品久久久闺蜜 | 亚洲乱码国产乱码精华| 被群cao的合不拢腿h纯肉视频| 亚色中文字幕| 日本一区二区不卡超清在线播放| 久久精品熟女亚洲av香蕉| 欧美日韩亚洲中文字幕二区| 国产成人免费a在线视频| 色中文字幕视频在线观看| 男人的天堂一区二av| 中文字幕一区二区三区日韩精品| 国产最新一区二区三区天堂| 国产精品自拍视频免费观看| 99无码精品二区在线视频| 免费av片在线观看网站| 久久综合激激的五月天| 青青手机在线观看视频| 无码人妻人妻经典| 欧洲在线一区| 在线亚洲精品免费视频| 国产成人无码专区| 国产山东熟女48嗷嗷叫| 日本女优一区二区在线免费观看 | 亚洲av无码潮喷在线观看|