亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        社會(huì)網(wǎng)絡(luò)中信息傳播與安全研究的現(xiàn)狀和發(fā)展趨勢(shì)

        2015-01-07 07:40:42鮑媛媛薛一波
        集成技術(shù) 2015年3期
        關(guān)鍵詞:用戶信息模型

        鮑媛媛薛一波

        1(清華大學(xué)信息技術(shù)研究院 北京 100084)

        2(清華大學(xué)信息科學(xué)技術(shù)國(guó)家實(shí)驗(yàn)室(籌) 北京 100084)

        社會(huì)網(wǎng)絡(luò)中信息傳播與安全研究的現(xiàn)狀和發(fā)展趨勢(shì)

        鮑媛媛1,2薛一波1,2

        1(清華大學(xué)信息技術(shù)研究院 北京 100084)

        2(清華大學(xué)信息科學(xué)技術(shù)國(guó)家實(shí)驗(yàn)室(籌) 北京 100084)

        社會(huì)網(wǎng)絡(luò)新媒體在日常溝通、商業(yè)運(yùn)作、政治斗爭(zhēng)以及外交等方面發(fā)揮越來(lái)越重要的作用,對(duì)社會(huì)網(wǎng)絡(luò)的研究也引發(fā)了廣泛關(guān)注。文章通過(guò)對(duì)最近幾年國(guó)際重要期刊和會(huì)議上社會(huì)網(wǎng)絡(luò)方面發(fā)表的文章進(jìn)行統(tǒng)計(jì)分析,發(fā)現(xiàn)了社會(huì)網(wǎng)絡(luò)近三年的研究熱點(diǎn),即主要集中在社會(huì)網(wǎng)絡(luò)的信息傳播以及安全問(wèn)題的研究。信息傳播方面包括對(duì)信息傳播模型、影響因素、影響力最大化和預(yù)測(cè)感知的研究;安全問(wèn)題方面包括對(duì)用戶安全和信息安全的研究,用戶安全研究中包括僵尸用戶識(shí)別和級(jí)聯(lián)失效研究,信息安全研究包括源頭追溯和網(wǎng)絡(luò)控制問(wèn)題研究。文章對(duì)上述各方面的最新成果進(jìn)行了分析、概括和討論,分析了面臨的問(wèn)題、挑戰(zhàn)和機(jī)遇,探索了新的研究點(diǎn)和未來(lái)的發(fā)展方向,為廣大研究者提供一些參考和借鑒。

        社會(huì)網(wǎng)絡(luò);消息傳播;源頭發(fā)現(xiàn);社會(huì)網(wǎng)絡(luò)控制

        1 引 言

        隨著 Web2.0 技術(shù)的不斷成熟,以論壇、博客、微信和微博為代表的新媒體不斷涌現(xiàn),特別是以社會(huì)網(wǎng)絡(luò)為平臺(tái)的新媒體,主要包括Facebook[1]、Twitter[2]、新浪微博[3]和微信[4]等的出現(xiàn),更是改變了人們交流溝通、分享信息的方式,日益成為社會(huì)輿論的集散地和放大器。政府部門對(duì)以社會(huì)網(wǎng)絡(luò)為根基的新媒體的繁榮發(fā)展高度重視。2014 年 8 月 18 日,中央全面深化改革領(lǐng)導(dǎo)小組第四次會(huì)議審議通過(guò)了《關(guān)于推動(dòng)傳統(tǒng)媒體和新興媒體融合發(fā)展的指導(dǎo)意見(jiàn)》。習(xí)近平總書(shū)記在會(huì)上強(qiáng)調(diào),要遵循新聞傳播規(guī)律和新興媒體發(fā)展規(guī)律,推動(dòng)傳統(tǒng)媒體和新興媒體融合發(fā)展,強(qiáng)化互聯(lián)網(wǎng)思維,堅(jiān)持傳統(tǒng)媒體和新興媒體優(yōu)勢(shì)互補(bǔ)、一體發(fā)展,堅(jiān)持先進(jìn)技術(shù)為支撐、內(nèi)容建設(shè)為根本,推動(dòng)傳統(tǒng)媒體和新興媒體在內(nèi)容、渠道、平臺(tái)、經(jīng)營(yíng)、管理等方面的深度融合,著力打造一批形態(tài)多樣、手段先進(jìn)、具有競(jìng)爭(zhēng)力的新型主流媒體,建成幾家擁有強(qiáng)大實(shí)力和傳播力、公信力、影響力的新型媒體集團(tuán),形成立體多樣、融合發(fā)展的現(xiàn)代傳播體系。中央明確表示推進(jìn)媒體融合順應(yīng)市場(chǎng)潮流,對(duì)于傳統(tǒng)媒體與社交等網(wǎng)絡(luò)媒體進(jìn)行融合發(fā)展有著重要激勵(lì)作用。在時(shí)代發(fā)展潮流和政策扶持雙重因素的影響下,必然激發(fā)更多高質(zhì)量新媒體的出現(xiàn)、發(fā)展。

        社會(huì)網(wǎng)絡(luò)即社會(huì)網(wǎng)絡(luò)服務(wù)(Social Networking Service,SNS),又稱社會(huì)性網(wǎng)絡(luò)服務(wù),是指以一定社會(huì)關(guān)系或共同興趣為紐帶,以各種形式為用戶提供溝通、交互服務(wù)的互聯(lián)網(wǎng)應(yīng)用,是Web2.0 體系下的一個(gè)技術(shù)應(yīng)用架構(gòu)[5]。在社會(huì)網(wǎng)絡(luò)中,海量用戶以相互關(guān)注的方式建立好友關(guān)系,并通過(guò)信息轉(zhuǎn)發(fā)、信息評(píng)論、話題參與等途徑逐步擴(kuò)大社交圈。信息通過(guò)發(fā)布、轉(zhuǎn)發(fā)、評(píng)論、推薦等方式,在社會(huì)網(wǎng)絡(luò)這種媒介中沿著用戶關(guān)系進(jìn)行裂變式的傳播[6]。

        社會(huì)網(wǎng)絡(luò)新媒體呈現(xiàn)以下主要的特征:(1)用戶數(shù)逐年暴增,社會(huì)網(wǎng)絡(luò)已經(jīng)成為覆蓋用戶最廣、傳播影響最大、商業(yè)價(jià)值最高的 Web2.0業(yè)務(wù)。在世界范圍內(nèi),最著名的社會(huì)網(wǎng)絡(luò)代表是 Facebook、Twitter。截至 2014 年 6 月 30 日,F(xiàn)acebook 和 Twitter 的月活躍用戶數(shù)分別達(dá)到13.2 億[7]、2.71 億[8]。國(guó)內(nèi)使用人數(shù)最多的社會(huì)網(wǎng)絡(luò)工具是微信和新浪微博,微信的月活躍用戶數(shù)超過(guò) 4.38 億[9],新浪微博的月活躍用戶數(shù)達(dá)到 1.565 億[10]。(2)巨大的用戶基數(shù)產(chǎn)生了海量數(shù)據(jù),不僅包含用戶屬性數(shù)據(jù)、關(guān)系數(shù)據(jù),而且包含大量用戶行為數(shù)據(jù)。Facebook 日均消息量為47.5 億條,Twitter 日均消息量為 5 億條,新浪微博的日均消息量為 1 億條,海量數(shù)據(jù)為用戶行為分析和文本分析提供了巨大的數(shù)據(jù)資源。(3)社會(huì)網(wǎng)絡(luò)新媒體從本質(zhì)上改變了信息傳播的方式,社會(huì)網(wǎng)絡(luò)傳播具備“點(diǎn)對(duì)點(diǎn)”的人際傳播和“點(diǎn)對(duì)面”的大眾傳播雙重功能,極大地提高了消息傳播速度、廣度以及深度。例如,2014 年奧斯卡頒獎(jiǎng)禮主持人 Ellen Lee DeGeneres 在 Twitter 上發(fā)布的一條包含眾多影視界明星的自拍照的推文,在發(fā)布后 35 分鐘內(nèi)轉(zhuǎn)發(fā)量就達(dá)到 81 萬(wàn),48 分鐘后突破 88 萬(wàn)次轉(zhuǎn)發(fā),2 個(gè)小時(shí)后其轉(zhuǎn)發(fā)量已經(jīng)超過(guò)167 萬(wàn)次[11]。可見(jiàn),社會(huì)網(wǎng)絡(luò)媒體的傳播速度、響應(yīng)速度以及覆蓋面都是傳統(tǒng)媒體所無(wú)法企及的。

        社會(huì)網(wǎng)絡(luò)的用戶數(shù)量大、海量數(shù)據(jù)多、響應(yīng)速度快以及傳播速度迅速等特征促使社會(huì)網(wǎng)絡(luò)新媒體在信息傳播、日常交流、商業(yè)營(yíng)銷、信息推薦等方面發(fā)揮越來(lái)越重要的作用,而其重要的影響力以及問(wèn)題的復(fù)雜性也引起諸多學(xué)者的關(guān)注,許多領(lǐng)域的專家學(xué)者都對(duì)社會(huì)網(wǎng)絡(luò)進(jìn)行了深入的研究。在社會(huì)網(wǎng)絡(luò)研究初期,主要研究點(diǎn)集中于網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)及特性分析、社團(tuán)發(fā)現(xiàn)算法、鏈路預(yù)測(cè)以及用戶影響力分析等。

        (1)關(guān)于網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)及特性分析的研究,影響最大的是社會(huì)網(wǎng)絡(luò)的小世界特征[12]、無(wú)標(biāo)度特征[13]、介數(shù)中心性[14]、同配性[15-17]、自相似性[18]等特性的發(fā)現(xiàn)以及對(duì) Twitter、Facebook、新浪微博和人人網(wǎng)社會(huì)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)及特性的實(shí)證分析:HaewoonKwak[19]分析并得到 Twitter 用戶的粉絲數(shù)分布的非冪律特征、關(guān)系網(wǎng)絡(luò)的小直徑特征;Wu[20]對(duì) Twitter 中用戶進(jìn)行了歸類:媒體、組織、名人、博主等類別,并設(shè)計(jì)了精英用戶和普通用戶的識(shí)別方法,另外發(fā)現(xiàn)了推文轉(zhuǎn)發(fā)量的長(zhǎng)尾特征;Suh 等[21]中得出結(jié)論:內(nèi)容特征中,是否包含 URL、標(biāo)簽是影響轉(zhuǎn)發(fā)的重要特征,用戶特征中,用戶粉絲數(shù)、關(guān)注數(shù)及用戶創(chuàng)建時(shí)間是影響轉(zhuǎn)發(fā)行為的重要特征;Jose 等[22]分析了 Twitter 用戶的地理位置分布;Golder 等[23]研究了 Facebook 用戶行為的周期性;Yan 等[24]得出新浪微博用戶粉絲數(shù)、關(guān)注數(shù)以及發(fā)布微博的數(shù)量的分布服從冪律特征;Fu 等[25]分析并得到人人網(wǎng)絡(luò)具有的小世界、層次性及異配性特征;

        (2)社團(tuán)發(fā)現(xiàn)算法主要包括分裂算法(GN算法[26]、基于邊聚合系數(shù)的算法[27])、聚合算法(Newman 提出的快速劃分方法[30]、CNM 算法[29])、基于圖論的算法(譜平分算法[30])、基于標(biāo)簽傳播的算法(LPA 算法[31]、COPRA 算法[32]以及 SLPA 算法[33])等;

        (3)鏈接預(yù)測(cè)主要方法包括基于馬爾科夫鏈的方法[34,35]、基于節(jié)點(diǎn)屬性相似性的方法[36,37]、基于概率模型的方法(有向無(wú)環(huán)概率實(shí)體關(guān)系模型[38]和概率關(guān)系模型[39])以及基于最大似然估計(jì)得方法(隨機(jī)分塊模型[40]和層次結(jié)構(gòu)模型[41]);

        (4)用戶影響力度量方面主要包括 Kleinberg提出的 HITS 算法[42]、Google 創(chuàng)始人 Larry Page 提出的 PageRank 算法[43]、Romero 等提出的類 HITS 算法的 IP 算法[44]、Cha 等提出的Twitter 用戶影響力計(jì)算方法[45]、Tunkelang 提出的類 PageRank 算法[46]、Haveliwala 等提出的Personalized PageRank 算法[47]等;影響力擴(kuò)散方面的模型主要包括獨(dú)立級(jí)聯(lián)模型(Independent Cascade Model)[48]、線性閾值模型(Linear Threshold Model)[48]、KSN-TIAN 算法[49]、基于最短路徑的影響力級(jí)聯(lián)模型[50]、CELF 方案[51]等。

        社會(huì)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)與特性研究屬于宏觀研究,用戶影響力研究屬于微觀層面,社團(tuán)發(fā)現(xiàn)以及鏈路預(yù)測(cè)研究屬于中觀層面。目前這幾個(gè)方面的研究相對(duì)比較完善,學(xué)者們的關(guān)注點(diǎn)也逐漸發(fā)生了轉(zhuǎn)移,希望開(kāi)拓全新的研究領(lǐng)域,完善社會(huì)網(wǎng)絡(luò)的研究體系。

        社會(huì)網(wǎng)絡(luò)新媒體在實(shí)際生活中帶來(lái)了諸多的問(wèn)題和挑戰(zhàn),主要體現(xiàn)在以下幾點(diǎn):

        (1)社會(huì)網(wǎng)絡(luò)的用戶數(shù)很大,且還在不斷增長(zhǎng),用戶每天產(chǎn)生的內(nèi)容數(shù)據(jù)、行為數(shù)據(jù)的增量都是 TB 級(jí)的,具有大數(shù)據(jù)的典型特點(diǎn),海量級(jí)的數(shù)據(jù)為社會(huì)網(wǎng)絡(luò)分析帶來(lái)了極大的挑戰(zhàn),目前越來(lái)越多的學(xué)者致力于社會(huì)網(wǎng)絡(luò)大數(shù)據(jù)問(wèn)題的解決方案;

        (2)社會(huì)網(wǎng)絡(luò)結(jié)構(gòu)方面的研究是基礎(chǔ)工作,真正有挑戰(zhàn)的則是對(duì)社會(huì)網(wǎng)絡(luò)上的信息傳播過(guò)程進(jìn)行分析,這一過(guò)程受到諸多因素的影響,加大了問(wèn)題的復(fù)雜性,目前為止沒(méi)有一個(gè)公認(rèn)的、有效的描述信息傳播過(guò)程的模型,也就無(wú)法進(jìn)行信息傳播的準(zhǔn)確預(yù)測(cè)和感知,信息傳播的影響因素也沒(méi)有定量的研究,同時(shí)也缺少對(duì)信息傳播影響力的評(píng)價(jià)指標(biāo)體系,上述問(wèn)題都亟待解決;

        (3)社會(huì)網(wǎng)絡(luò)中也暴露出眾多的安全問(wèn)題,比如由于社會(huì)網(wǎng)絡(luò)中信息發(fā)布的便捷性以及對(duì)內(nèi)容缺乏監(jiān)管,無(wú)法保證信息的真實(shí)性,使得大量不實(shí)信息、非法信息、謠言等在社會(huì)網(wǎng)絡(luò)上肆意傳播,尤其是近一年來(lái),社會(huì)網(wǎng)絡(luò)新媒體在一系列大型和突發(fā)政治事件中被用作快速傳媒,成為示威者傳遞信息、發(fā)泄不滿和積聚外界同情的重要渠道,污染了社交網(wǎng)絡(luò)環(huán)境,同時(shí)也極易被外部勢(shì)力用作干預(yù)和顛覆的工具,傳播惡意信息,對(duì)社會(huì)的穩(wěn)定和國(guó)家的安全造成了非常重大的影響。因此,對(duì)信息的精細(xì)化分析、識(shí)別和控制具有重要意義,且勢(shì)在必行。此外,社會(huì)網(wǎng)絡(luò)中存在的攻擊行為、僵尸用戶、垃圾信息等問(wèn)題也嚴(yán)重威脅了社會(huì)網(wǎng)絡(luò)的健康發(fā)展,對(duì)于上述安全問(wèn)題的研究也有重要意義。

        近期社會(huì)網(wǎng)絡(luò)研究的熱點(diǎn)集中于哪些方面?學(xué)者們是從哪些角度作為切入點(diǎn)進(jìn)行問(wèn)題研究?未來(lái)社會(huì)網(wǎng)絡(luò)研究重點(diǎn)是什么?對(duì)這些問(wèn)題的探究有助于對(duì)社會(huì)網(wǎng)絡(luò)研究整體現(xiàn)狀的認(rèn)識(shí)以及未來(lái)研究方向的把握,具有重要的學(xué)術(shù)和理論意義。為了嘗試回答這些問(wèn)題,本文對(duì)近幾年來(lái)在國(guó)際影響力較大的期刊和會(huì)議上發(fā)表的社會(huì)網(wǎng)絡(luò)方面的論文進(jìn)行了整理和統(tǒng)計(jì),總結(jié)出社會(huì)網(wǎng)絡(luò)的研究熱點(diǎn);通過(guò)整理社會(huì)網(wǎng)絡(luò)上的消息傳播過(guò)程以及安全問(wèn)題的文獻(xiàn),對(duì)這兩個(gè)方向研究的演進(jìn)過(guò)程有了更為清晰的認(rèn)識(shí),并對(duì)今后的研究方向進(jìn)行相關(guān)推演。

        2 社會(huì)網(wǎng)絡(luò)研究熱點(diǎn)

        我們對(duì) 2012 年至 2014 年在國(guó)際影響力較大的期刊以及會(huì)議上發(fā)表的社會(huì)網(wǎng)絡(luò)方向的論文進(jìn)行了整理和統(tǒng)計(jì),發(fā)現(xiàn)近幾年社會(huì)網(wǎng)絡(luò)方面的文章集中在消息傳播、傳播干預(yù)、源頭發(fā)現(xiàn)等方面,具體統(tǒng)計(jì)情況如表 1 所示。

        表 1 2012-2014 年國(guó)際主流期刊及會(huì)議社會(huì)網(wǎng)絡(luò)論文統(tǒng)計(jì)Table 1 Statistics of social networks papers on 2012-2014 mainstream international journals and conferences

        社會(huì)網(wǎng)絡(luò)消息傳播方面的研究主要集中在消息傳播模型、消息傳播影響因素、影響力最大化以及預(yù)測(cè)感知。社會(huì)網(wǎng)絡(luò)安全方面的研究主要集中在用戶安全和信息安全等。其中,用戶安全中包含僵尸用戶識(shí)別和級(jí)聯(lián)失效;信息安全包括謠言發(fā)現(xiàn)、不良信息追蹤、源頭追溯和網(wǎng)絡(luò)控制。下面將分別對(duì)這兩個(gè)方面的研究進(jìn)行文獻(xiàn)的整理和論述。

        3 社會(huì)網(wǎng)絡(luò)信息傳播

        社會(huì)網(wǎng)絡(luò)是用戶在線交流、消息傳播的重要場(chǎng)所,也是某些網(wǎng)絡(luò)突發(fā)事件發(fā)酵、爆發(fā)、傳播、演化、并影響社會(huì)的重要媒介,因此深入理解和認(rèn)識(shí)社會(huì)網(wǎng)絡(luò)中的信息傳播過(guò)程具有重要的意義。消息傳播本身是一個(gè)復(fù)雜的過(guò)程,受到諸多因素的影響,很多學(xué)者對(duì)這一問(wèn)題進(jìn)行了研究,主要集中在消息傳播模型以及消息傳播影響因素研究上。

        3.1 信息傳播模型

        在社會(huì)網(wǎng)絡(luò)消息傳播領(lǐng)域的研究,已經(jīng)提出了一系列重要的模型和理論,其中最具有代表性的是傳染病模型(SIS 模型、SIR 模型等)[52-55]、獨(dú)立級(jí)聯(lián)模型(Independent Cascade Model)[48,56]和線性閾值模型(Linear Threshold Model)[57,58]。

        由于在社會(huì)網(wǎng)絡(luò)中消息傳播過(guò)程的復(fù)雜性,上述模型存在一定的缺陷,目前也有大量的學(xué)者投入到經(jīng)典消息傳播模型的改進(jìn)研究中:Gruhl等[59]對(duì)博客中的傳播網(wǎng)絡(luò)進(jìn)行推斷,給定帖子的時(shí)間標(biāo)記,用獨(dú)立級(jí)聯(lián)模型來(lái)模擬傳播過(guò)程,并利用傳染病模型分析信息傳播中的用戶之間的行為;Leskovec 等[60]提出了另一個(gè)類似于SIS 的信息傳播的模型模擬博客中的傳播過(guò)程;Galuba 等[61]研究 Twitter 中 URL 的傳播,利用線性閾值模型預(yù)測(cè)哪個(gè)用戶會(huì)傳播哪個(gè) URL;Kimura 等[50]利用最短路徑模型(Shortest-Path Model,SPM)近似求解信息的傳播范圍,最短路徑模型是獨(dú)立級(jí)聯(lián)模型的一個(gè)特例,主要思想是信息從已受影響節(jié)點(diǎn)集合到將要受影響節(jié)點(diǎn)的最短路徑進(jìn)行傳播,實(shí)驗(yàn)結(jié)果表明與獨(dú)立級(jí)聯(lián)模型相比,最短路徑模型的運(yùn)行結(jié)果相同,但運(yùn)行效率更高。

        此外,博弈論、隨機(jī)過(guò)程等理論也被用來(lái)進(jìn)行消息傳播模型構(gòu)建,取得一些有價(jià)值的結(jié)論。Zinoviev 等[62]認(rèn)為信息的發(fā)布、傳播與個(gè)體的知識(shí)、信任度、受關(guān)注度有著密切的關(guān)系,這些因素都將影響個(gè)體的信息發(fā)布、轉(zhuǎn)發(fā)以及評(píng)論策略。為了研究個(gè)體的信息傳播模式,利用博弈論理論,該文構(gòu)建了在星形社交網(wǎng)絡(luò)中轉(zhuǎn)發(fā)以及評(píng)論行為的信息傳播模型。其中,星形社會(huì)網(wǎng)絡(luò)是指包含一個(gè)中心節(jié)點(diǎn) S(消息發(fā)布者)、N 個(gè)相互獨(dú)立的接收節(jié)點(diǎn) Ri(消息收聽(tīng)者)的網(wǎng)絡(luò),在此網(wǎng)絡(luò)中關(guān)系是雙向的,消息會(huì)由消息發(fā)布者 S 傳遞給 N 個(gè)收聽(tīng)者,對(duì)此消息的轉(zhuǎn)發(fā)、評(píng)論則會(huì)回傳給發(fā)布者?;诖诵切紊鐣?huì)網(wǎng)絡(luò),考慮個(gè)體對(duì)信息的了解程度、信任以及個(gè)體的受歡迎程度等影響因素,構(gòu)建了以這三個(gè)因素為收益函數(shù)的非零和合作博弈模型,描述了星形社會(huì)網(wǎng)絡(luò)上的消息轉(zhuǎn)發(fā)以及評(píng)論行為,通過(guò)對(duì)收益函數(shù)中參數(shù)的調(diào)節(jié)能夠較好地達(dá)到納什均衡。

        Wang 等[63]嘗試從時(shí)間和空間兩個(gè)維度對(duì)消息傳播進(jìn)行研究,基于偏微分方程理論,建立了消息傳播過(guò)程的傳播回歸方程,以刻畫時(shí)間和空間維度上的信息傳播過(guò)程。首先通過(guò)對(duì)消息傳播過(guò)程的分析,將消息傳播過(guò)程劃分為兩個(gè)子過(guò)程:增長(zhǎng)過(guò)程和社會(huì)過(guò)程。在與消息發(fā)布者相同距離的用戶群中經(jīng)歷增長(zhǎng)過(guò)程,而在不同層次的接收者群體中經(jīng)歷社會(huì)過(guò)程,作者結(jié)合社會(huì)過(guò)程和增長(zhǎng)過(guò)程建立傳播回歸方程,從時(shí)間和空間維度上完成對(duì)信息傳播過(guò)程的描述。

        Zhang 等[64]基于交互式馬爾科夫鏈理論和平均場(chǎng)理論建立了社會(huì)網(wǎng)絡(luò)上的消息傳播模型,該模型證明在網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)和信息傳播之間存在密切關(guān)系,信息傳播的能力與網(wǎng)絡(luò)的異質(zhì)性正相關(guān),與相關(guān)系數(shù)負(fù)相關(guān)。模型假設(shè)在消息傳播過(guò)程中個(gè)體存在四個(gè)狀態(tài):無(wú)知狀態(tài)、活躍狀態(tài)、冷漠狀態(tài)以及靜默狀態(tài)。根據(jù)四個(gè)狀態(tài)之間的轉(zhuǎn)化關(guān)系,得到常微分方程,如式(1)

        其中ik(t)、ak(t)、rk(t)、qk(t)分別表示在t時(shí)刻度為k的節(jié)點(diǎn)處于無(wú)知狀態(tài)、活躍狀態(tài)、冷漠狀態(tài)以及靜默狀態(tài)的比重情況?;诖四P湍軌?qū)ο鞑サ膹V度和深度進(jìn)行預(yù)測(cè),而人人網(wǎng)的實(shí)驗(yàn)數(shù)據(jù)也驗(yàn)證了該模型的正確性。此外,Jin等[65]也是基于傳染病模型對(duì)消息傳播過(guò)程進(jìn)行了分析,主要是利用改進(jìn)的 SEIZ 傳染病模型對(duì)Twitter 上的新聞和謠言傳播過(guò)程進(jìn)行了研究。

        最近幾年,社會(huì)網(wǎng)絡(luò)上消息傳播方面的研究越來(lái)越多,成果大都發(fā)表于 Science、Nature、INFOCOM、SIGMETRICS、WWW 以及 KDD 等頂級(jí)期刊或者國(guó)際會(huì)議上。由此可見(jiàn),目前社會(huì)網(wǎng)絡(luò)消息傳播研究是熱點(diǎn)中的熱點(diǎn)。除了對(duì)主流社交網(wǎng)站實(shí)證數(shù)據(jù)的分析外,抓住關(guān)鍵的傳播機(jī)制,構(gòu)建合理的傳播模型,描述新聞、謠言以及各種輿論等在社會(huì)網(wǎng)絡(luò)中的傳播過(guò)程,并能夠?qū)鞑ミM(jìn)行準(zhǔn)確預(yù)測(cè),是當(dāng)前亟需解決的問(wèn)題。目前還處于完全開(kāi)放狀態(tài),需要更多的學(xué)者投入到社會(huì)網(wǎng)絡(luò)消息傳播這一復(fù)雜過(guò)程的研究中。

        3.2 影響因素

        社會(huì)網(wǎng)絡(luò)上的消息傳播過(guò)程受到諸多因素的影響,例如網(wǎng)絡(luò)結(jié)構(gòu)、消息內(nèi)容、關(guān)系類型以及空間距離等因素,都會(huì)對(duì)傳播過(guò)程產(chǎn)生影響。在網(wǎng)絡(luò)結(jié)構(gòu)對(duì)消息傳播過(guò)程影響的研究方面,最具代表性的是小世界網(wǎng)絡(luò)上的傳播行為研究以及無(wú)標(biāo)度網(wǎng)絡(luò)上的傳播行為研究。近幾年,其他特性對(duì)傳播過(guò)程的影響研究也不斷開(kāi)展。

        節(jié)點(diǎn)度的關(guān)聯(lián)性是社會(huì)網(wǎng)絡(luò)的一個(gè)重要特征。Boguna 等[66]研究了關(guān)聯(lián)網(wǎng)絡(luò)上 SIS 模型傳播的臨界值,用條件概率表示度為k的節(jié)點(diǎn)與度為的節(jié)點(diǎn)相連接的概率,定義連接矩陣,研究結(jié)果表明關(guān)聯(lián)網(wǎng)絡(luò)的傳播臨界值與連接矩陣 的最大特征值呈反比;Moreno 等[67]分析了關(guān)聯(lián)網(wǎng)絡(luò)上 SIR 模型的傳播臨界值,也得到了與 SIS 模型類似的結(jié)論;隨后,Boguna 等[68]分析了度分布二階矩發(fā)散的無(wú)標(biāo)度網(wǎng)絡(luò)中傳播行為,當(dāng)二階矩發(fā)散時(shí),由于鄰接矩陣的最大特征值趨于無(wú)窮大,所以無(wú)論網(wǎng)絡(luò)是否是關(guān)聯(lián)網(wǎng)絡(luò),都不存在正的傳播臨界值;Eguiluz 等[69]研究了一個(gè)具有很大的結(jié)構(gòu)化無(wú)標(biāo)度網(wǎng)絡(luò)上 SIS 模型傳播的閾值情況,研究發(fā)現(xiàn)在具有上述特征的無(wú)標(biāo)度網(wǎng)絡(luò)上,即使度分布的二階矩發(fā)散,疾病傳播也存在非零的傳染閾值,進(jìn)而指出高度的聚集性和度關(guān)聯(lián)性可以保護(hù)無(wú)標(biāo)度網(wǎng)絡(luò),阻止病毒在此類網(wǎng)絡(luò)上的傳播。

        社會(huì)網(wǎng)絡(luò)具有很強(qiáng)的社團(tuán)結(jié)構(gòu),即網(wǎng)絡(luò)由若干個(gè)明顯的社團(tuán)組成,社團(tuán)內(nèi)部的個(gè)體聯(lián)系緊密,而不同社團(tuán)的個(gè)體之間聯(lián)系稀疏。社團(tuán)結(jié)構(gòu)對(duì)傳播行為會(huì)有怎樣的影響呢?Liu 等[70]研究了帶有社團(tuán)結(jié)構(gòu)的小世界網(wǎng)絡(luò)上 SIS 傳播模型的傳播臨界值和傳播最終態(tài)情況,發(fā)現(xiàn)帶有社團(tuán)結(jié)構(gòu)的小世界網(wǎng)絡(luò)的傳播臨界值較隨機(jī)網(wǎng)絡(luò)的要低,也即傳播更易爆發(fā),但最終感染人數(shù)較少,也即傳播爆發(fā)的最終危害降低。Huang 等[71]研究了帶有社團(tuán)結(jié)構(gòu)的無(wú)標(biāo)度網(wǎng)絡(luò)上 SI 傳播模型的傳播臨界值,研究發(fā)現(xiàn),帶有社團(tuán)結(jié)構(gòu)的無(wú)標(biāo)度網(wǎng)絡(luò)上傳播的波及范圍也會(huì)大大降低。社會(huì)網(wǎng)絡(luò)中的社團(tuán)不僅具有平面的拓?fù)涮匦?,其社團(tuán)之間還存在層次化特征,社團(tuán)層次結(jié)構(gòu)就是對(duì)社會(huì)網(wǎng)絡(luò)中不同層次、不同粒度的社區(qū)整合,這種層次結(jié)構(gòu)會(huì)對(duì)傳播行為有什么樣的影響呢? Zheng 等[72]研究了具有層次社團(tuán)結(jié)構(gòu)的網(wǎng)絡(luò)上 SIR 模型的傳播問(wèn)題,分析了層次結(jié)構(gòu)的維數(shù)對(duì)傳播行為的影響,如果層次結(jié)構(gòu)的維數(shù)為 1,那么隨著人群劃分為日益相似的社團(tuán),則會(huì)存在從全局到局部傳播的相變;而如果層次結(jié)構(gòu)的維數(shù)大于 1,不管個(gè)體所在組的相似程度如何,都會(huì)達(dá)到全局傳播。

        社會(huì)網(wǎng)絡(luò)中個(gè)體之間的關(guān)系類型具有差異性,因此導(dǎo)致個(gè)體之間的緊密程度、作用強(qiáng)度也存在較大差異,考慮用戶之間關(guān)系權(quán)重的網(wǎng)絡(luò)更為符合實(shí)際網(wǎng)絡(luò)的情況,而權(quán)重的非均勻分布會(huì)對(duì)消息傳播造成什么樣的影響呢?Yan 等[73]首先研究 BBV 帶有權(quán)重?zé)o標(biāo)度網(wǎng)絡(luò)[77]上 SI 傳播模型的動(dòng)態(tài)特性,研究發(fā)現(xiàn)傳播速度會(huì)迅速達(dá)到一個(gè)峰值,然后以冪律形式衰減,同時(shí)得出結(jié)論:具有較大權(quán)重的節(jié)點(diǎn)會(huì)更易被感染,非均勻分布的權(quán)重還會(huì)導(dǎo)致傳播速度的放慢。

        由于目前社會(huì)網(wǎng)絡(luò)上的傳播行為都是基于傳染病模型等進(jìn)行建立的,然而社會(huì)網(wǎng)絡(luò)上新聞、謠言以及廣告等信息的傳播行為與傳染病的傳播具有本質(zhì)不同,基于這一出發(fā)點(diǎn),學(xué)者們開(kāi)始分析信息傳播的獨(dú)特性對(duì)傳播行為的影響。Lu 等[75]綜和考慮了記憶效應(yīng)、社會(huì)加強(qiáng)效應(yīng)以及多次接觸等對(duì)傳播行為的影響,研究結(jié)果表明考慮了上述因素后,傳播的速度和范圍都會(huì)有所提高;另外,作者通過(guò)模擬實(shí)驗(yàn)還得到當(dāng)規(guī)則網(wǎng)絡(luò)中引入少量隨機(jī)因素后,會(huì)大幅度提高信息傳播的有效性,即小世界特征會(huì)導(dǎo)致最有效的信息傳播。Kan 等[76]研究了加權(quán)網(wǎng)絡(luò)中社會(huì)增強(qiáng)效應(yīng)、連邊權(quán)重和網(wǎng)絡(luò)結(jié)構(gòu)的非局域性效應(yīng)對(duì)信息傳播的影響,研究發(fā)現(xiàn),當(dāng)個(gè)體越傾向于接受親密朋友的信息時(shí),信息的傳播范圍越窄;同時(shí),還發(fā)現(xiàn)社會(huì)強(qiáng)化效應(yīng)較小時(shí),隨機(jī)網(wǎng)絡(luò)比規(guī)則網(wǎng)絡(luò)傳播范圍廣,反之規(guī)則網(wǎng)絡(luò)傳播范圍廣。Gross 等[77]提出一個(gè)自適應(yīng)網(wǎng)絡(luò)演化模型,分析健康個(gè)體在面臨傳染病爆發(fā)時(shí)主動(dòng)避讓機(jī)制對(duì)傳播的影響,從連接邊演化的角度建立 SIS 傳播動(dòng)力學(xué)方程,分析避讓率的變化對(duì)傳播的影響,結(jié)果發(fā)現(xiàn)隨著避讓率的變化,傳播過(guò)程存在 Hopf 分叉、跨臨界分叉以及鞍結(jié)分叉等動(dòng)力學(xué)行為,染病個(gè)體密度呈現(xiàn)不連續(xù)躍遷、雙穩(wěn)態(tài)、震蕩和滯環(huán)等現(xiàn)象。Xu 等[78]基于 SIS 傳播模型研究了偏好連接和地理空間結(jié)構(gòu)共同對(duì)疾病傳播的影響。

        網(wǎng)絡(luò)結(jié)構(gòu)、信息內(nèi)容、關(guān)系類型以及空間距離等因素,都會(huì)對(duì)傳播過(guò)程產(chǎn)生影響。基于度、介數(shù)等典型網(wǎng)絡(luò)結(jié)構(gòu)特性的影響分析以及靜態(tài)網(wǎng)絡(luò)的影響分析較多,但由于網(wǎng)絡(luò)的層次結(jié)構(gòu)、網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)是實(shí)時(shí)變化的,而基于層次結(jié)構(gòu)、網(wǎng)絡(luò)特性的動(dòng)態(tài)變化等對(duì)傳播動(dòng)力學(xué)的影響研究較少。將網(wǎng)絡(luò)的加權(quán)特性、社區(qū)行為、網(wǎng)絡(luò)結(jié)構(gòu)的動(dòng)態(tài)變化等結(jié)合起來(lái)研究它們對(duì)傳播行為的影響更能反映網(wǎng)絡(luò)上真實(shí)傳播行為,這值得深入研究;由于信息內(nèi)容的精確衡量難度很大,因此不同信息內(nèi)容對(duì)傳播過(guò)程的影響研究也較少;另外,傳播的主體是人,人的心理因素、情緒以及其他人為因素必然會(huì)對(duì)傳播過(guò)程產(chǎn)生重大影響,這方面的研究也由于問(wèn)題的復(fù)雜性較少出現(xiàn),但此領(lǐng)域的研究必將從本質(zhì)上影響傳播過(guò)程的結(jié)論。

        3.3 影響力最大化

        影響力最大化問(wèn)題是指如何有效選擇k個(gè)節(jié)點(diǎn)作為初始傳播對(duì)象,通過(guò)社會(huì)網(wǎng)絡(luò)中的信息傳播,最終達(dá)到傳播范圍的最大化。核心問(wèn)題是鑒別并發(fā)現(xiàn)網(wǎng)絡(luò)中傳播影響力最大的節(jié)點(diǎn),即為了達(dá)到傳播的最大化,應(yīng)該最初激活哪些節(jié)點(diǎn)。在社會(huì)網(wǎng)絡(luò)中,不同的節(jié)點(diǎn)對(duì)信息傳播的影響程度不同,對(duì)信息傳播起重要作用的個(gè)體稱為“意見(jiàn)領(lǐng)袖”,影響力最大化問(wèn)題就是尋找社會(huì)網(wǎng)絡(luò)中影響力最大的節(jié)點(diǎn),對(duì)影響力節(jié)點(diǎn)的鑒別和發(fā)現(xiàn)可以歸結(jié)為網(wǎng)絡(luò)節(jié)點(diǎn)重要性評(píng)判問(wèn)題,學(xué)者們從不同的角度分析如何發(fā)現(xiàn)影響力個(gè)體。

        社會(huì)網(wǎng)絡(luò)影響最大化問(wèn)題由 Domingos 等[79]和 Richardson 等[80]首次提出,并給出了影響最大化問(wèn)題的詳細(xì)定義以及影響力最大化的評(píng)價(jià)指標(biāo)。Kempe 等[48]首次證明了社會(huì)網(wǎng)絡(luò)上影響力最大化求解問(wèn)題是一個(gè) NP-Hard 問(wèn)題,設(shè)計(jì)了一個(gè)自然貪婪算法對(duì)這一問(wèn)題進(jìn)行求解,利用基于子模函數(shù)的分析框架進(jìn)行分析,得到結(jié)論:以多種公認(rèn)的影響力最大化算法的結(jié)果的交集作為標(biāo)準(zhǔn),則所提出的貪婪算法能夠保證至少獲得此交集的 63%,并且給出了穩(wěn)定性的證明。

        貪心算法提出以后,Leskovec 等[81]基于獨(dú)立級(jí)聯(lián)模型的次子模特性,提出 Cost-Effective Lazy Forward (CELF)算法。此算法是對(duì)貪心算法的優(yōu)化,實(shí)驗(yàn)表明 CKLF 算法大大降低了貪心算法的時(shí)間復(fù)雜度,但是算法在影響力范圍上沒(méi)有得到很好的結(jié)果。此外,Chen 等[82]的研究工作也是在獨(dú)立級(jí)聯(lián)模型下利用次模特性來(lái)提高貪心算法的運(yùn)行效率。在貪心算法的基礎(chǔ)之上,Chen等[82]也提出自己的改進(jìn)算法:NewGreedy 算法和 Mixgreedy 算法。其中,NewGreedy 算法是從原始網(wǎng)絡(luò)中去掉對(duì)傳播沒(méi)有影響的邊的基礎(chǔ)上做影響力傳播;MixGreedy 算法結(jié)合 NewGreedy 和CELF 算法獲得影響力最大的節(jié)點(diǎn)集,這兩種方法可以以較高的運(yùn)算效率在大規(guī)模數(shù)據(jù)集上進(jìn)行計(jì)算。

        除了貪心算法之外,還有一些常見(jiàn)的啟發(fā)式重要節(jié)點(diǎn)集合選擇算法,對(duì)網(wǎng)絡(luò)節(jié)點(diǎn)重要性的度量方法主要包括節(jié)點(diǎn)的度(Degree)、緊密度(Coseness)、中介性(Betweenness)、特征向量(Eigenvector)和累計(jì)提名(Cumulated Nomination)等,學(xué)者們提出了多種基于各種度中心性指標(biāo)的啟發(fā)式算法來(lái)計(jì)算節(jié)點(diǎn)集合的影響力。

        Chen 等[82]提出了一種改進(jìn)的度數(shù)最大算法的 DegreeDiscount 算法,該算法選取下一個(gè)度數(shù)最大節(jié)點(diǎn)時(shí),選取對(duì)節(jié)點(diǎn)度數(shù)打折的若干節(jié)點(diǎn),實(shí)驗(yàn)結(jié)果表明該算法的效果相比直接選取度最大的節(jié)點(diǎn)集的啟發(fā)式算法有改進(jìn)。Estévez 等[83]提出了另外一種改進(jìn)算法,即 SCG 算法,此算法有效保證選取的初始度最大的節(jié)點(diǎn)不會(huì)出現(xiàn)鄰居重疊情況,有效地提高了節(jié)點(diǎn)的傳播,實(shí)驗(yàn)結(jié)果表明它的時(shí)間復(fù)雜度比貪心算法低,且效果比簡(jiǎn)單的度最大算法好。Kimura 等[49]提出一種通過(guò)分解極大強(qiáng)連通子圖尋找影響力最大節(jié)點(diǎn)集合的算法,實(shí)驗(yàn)表明算法的時(shí)間復(fù)雜度比貪心算法降低了很多,且效果相差不大,此方法是目前處理影響力最大化比較好的一種方法,在處理大型網(wǎng)絡(luò)時(shí)的時(shí)間復(fù)雜度依然很高。

        此外,許多學(xué)者基于社會(huì)網(wǎng)絡(luò)中存在的社區(qū)結(jié)構(gòu),提出了考慮社區(qū)結(jié)構(gòu)的影響力最大化算法。Galstyan 等[84]第一次提出了利用網(wǎng)絡(luò)的社區(qū)性質(zhì)來(lái)求解影響力最大化問(wèn)題。Cao 等[85]利用網(wǎng)絡(luò)的社區(qū)性質(zhì)把影響力最大化,堪稱一種最佳的資源動(dòng)態(tài)分配問(wèn)題,并提出了 OASNET 算法。首先利用社團(tuán)發(fā)現(xiàn)算法把網(wǎng)絡(luò)劃分為獨(dú)立的社團(tuán),然后利用動(dòng)態(tài)規(guī)劃方法把初始幾點(diǎn)最佳地分配到各個(gè)社區(qū)中做影響力最大化實(shí)驗(yàn),最終將各個(gè)社區(qū)中被影響的節(jié)點(diǎn)累加得到最終被影響的節(jié)點(diǎn)數(shù)目。Wang 等[86]也提出一種基于社團(tuán)發(fā)現(xiàn)的求解影響力最大化問(wèn)題的 CGA 算法,實(shí)驗(yàn)結(jié)果表明新算法的性能相對(duì)貪心算法有很大數(shù)量級(jí)的提高,但是時(shí)間復(fù)雜度依然很高,而且由于社團(tuán)的劃分會(huì)造成一些邊的丟失,從而導(dǎo)致效果的降低。

        影響力最大化問(wèn)題的兩個(gè)重要方面包括如何盡可能大地提升影響范圍和如何降低時(shí)間復(fù)雜度。而在這兩個(gè)方面,貪心算法和啟發(fā)式算法都有各自的優(yōu)缺點(diǎn)。貪心算法在每一步都選擇當(dāng)前最有影響力的節(jié)點(diǎn)作為初始傳播對(duì)象進(jìn)行傳播,然而,選擇最具影響力的節(jié)點(diǎn)是一個(gè)非常耗時(shí)的過(guò)程,并且這種局部最優(yōu)并不能保證最終的傳播結(jié)果最優(yōu)。對(duì)于大型社會(huì)網(wǎng)絡(luò),由于高耗時(shí),貪心算法更加不適用。另一方面,雖然啟發(fā)式算法所需的計(jì)算時(shí)間較少,但就傳播范圍而言,啟發(fā)式算法沒(méi)有考慮到社會(huì)網(wǎng)絡(luò)的傳播特性,只是靜態(tài)地選擇種子節(jié)點(diǎn),因此得到的效果并不理想[87]。此外,當(dāng)前所有社會(huì)網(wǎng)絡(luò)中影響最大化問(wèn)題的研究都是基于獨(dú)立級(jí)聯(lián)模型或者線性閾值模型以及其擴(kuò)展模型,但是究竟影響力傳播是否符合這些模型,這方面的結(jié)論還沒(méi)有。隨著大型社會(huì)網(wǎng)絡(luò)出現(xiàn),提出一種影響范圍和時(shí)間復(fù)雜度都優(yōu)化的算法很有必要,并且這種算法最好能夠同時(shí)適用傳統(tǒng)的社會(huì)網(wǎng)絡(luò)和帶符號(hào)的社會(huì)網(wǎng)絡(luò)。

        3.4 預(yù)測(cè)和感知

        信息傳播過(guò)程的預(yù)測(cè)和感知在熱點(diǎn)信息發(fā)現(xiàn)、個(gè)性化推薦、敏感信息預(yù)警等方面發(fā)揮著重要作用,此問(wèn)題的研究具有重要的實(shí)際意義。信息傳播過(guò)程的預(yù)測(cè)研究可以分為微觀研究和宏觀研究。其中,微觀研究是指從個(gè)體角度出發(fā),預(yù)測(cè)單一個(gè)體是否會(huì)傳播某條信息;宏觀研究是指從整體出發(fā),對(duì)信息傳播的廣度、深度以及速度進(jìn)行預(yù)測(cè)。信息傳播過(guò)程可由傳染病模型、線性閾值模型和獨(dú)立級(jí)聯(lián)模型描述及模擬,然而依據(jù)這些模型得到的信息傳播過(guò)程是按照一定規(guī)則得到的模擬結(jié)果,如果利用這種方法進(jìn)行信息傳播預(yù)測(cè),將會(huì)造成很大的預(yù)測(cè)誤差。因此,信息傳播預(yù)測(cè)和感知方面的研究主要是依據(jù)已經(jīng)完成的傳播數(shù)據(jù)、信息本身性質(zhì)、網(wǎng)絡(luò)特征等因素,實(shí)現(xiàn)依據(jù)已有實(shí)際數(shù)據(jù)基礎(chǔ)上的信息傳播預(yù)測(cè)和感知。

        (1)宏觀研究

        Zaman 等[88]利用貝葉斯方法構(gòu)建概率模型來(lái)研究 Twitter 中推文的轉(zhuǎn)發(fā)行為,對(duì)于推文的轉(zhuǎn)發(fā)時(shí)間以及轉(zhuǎn)發(fā)者網(wǎng)絡(luò)結(jié)構(gòu)能夠進(jìn)行準(zhǔn)確預(yù)測(cè)。利用這種方法,能夠在僅知道極少轉(zhuǎn)發(fā)路徑的情況下,預(yù)測(cè)出推文的最終轉(zhuǎn)發(fā)次數(shù),對(duì)于分析社會(huì)網(wǎng)絡(luò)中觀點(diǎn)、謠言以及輿論演化有重要意義。文章首先通過(guò)對(duì) Twitter 中部分推文的轉(zhuǎn)發(fā)情況進(jìn)行分析,確定了轉(zhuǎn)發(fā)的時(shí)間序列服從對(duì)數(shù)正態(tài)分析,轉(zhuǎn)發(fā)關(guān)系結(jié)構(gòu)的演化服從二項(xiàng)分析,基于這兩點(diǎn)假設(shè)構(gòu)建了描述轉(zhuǎn)發(fā)過(guò)程的對(duì)數(shù)正態(tài)-二項(xiàng)貝葉斯模型?;诖四P瓦M(jìn)行轉(zhuǎn)發(fā)過(guò)程的模擬仿真,驗(yàn)證了模型在轉(zhuǎn)發(fā)時(shí)間以及轉(zhuǎn)發(fā)總量預(yù)測(cè)方面的準(zhǔn)確性。

        Guille 等[89]在假設(shè)宏觀層面的信息傳播動(dòng)力學(xué)是基于微觀層面?zhèn)€體間的互動(dòng)以及網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)的基礎(chǔ)上,考慮消息傳播過(guò)程中個(gè)體的社會(huì)因素、消息的語(yǔ)義因素以及網(wǎng)絡(luò)的時(shí)間因素,利用機(jī)器學(xué)習(xí)方法建立消息傳播模型。個(gè)體的社會(huì)因素主要包括活躍度、同質(zhì)性、原創(chuàng)度、受關(guān)注度;消息的語(yǔ)義因素主要由消息本身的語(yǔ)義與用戶原有微博中語(yǔ)義的重合度表示;時(shí)間因素主要由網(wǎng)絡(luò)在不同時(shí)間段的活躍用戶情況表示。文章構(gòu)建了包含 13 個(gè)因素的貝葉斯 logistic 回歸模型,對(duì)消息的傳播與否進(jìn)行預(yù)測(cè),傳播概率如式(2)和(3)表示:

        此外,Yang 等[90]構(gòu)建了 Linear Influence Model(LIM),用于對(duì)傳播過(guò)程中節(jié)點(diǎn)的全局影響力進(jìn)行建模。此模型能夠準(zhǔn)確獲得節(jié)點(diǎn)的影響力,并對(duì)信息傳播做出準(zhǔn)確的時(shí)間維度的預(yù)測(cè)。Yang 等[91]從宏觀的角度出發(fā)進(jìn)行信息傳播預(yù)測(cè),采用特征選擇和因子圖模型對(duì)信息傳播的深度進(jìn)行預(yù)測(cè)。此模型考慮了網(wǎng)絡(luò)結(jié)構(gòu)、用戶關(guān)系等因素,但是由于其未考慮時(shí)間因素,因此只能對(duì)信息傳播深度進(jìn)行預(yù)測(cè),而無(wú)法預(yù)測(cè)信息傳播速度。Yang 等[92]基于特征選擇和衰減模型對(duì)信息傳播的廣度、深度以及速度進(jìn)行預(yù)測(cè),考慮的特征主要包括用戶發(fā)布信息數(shù)量、被提及次數(shù)等社會(huì)屬性和是否包含超鏈接、轉(zhuǎn)發(fā)時(shí)間等信息屬性。實(shí)驗(yàn)表明,用戶被提及次數(shù)、是否包含超鏈接以及轉(zhuǎn)發(fā)時(shí)間這三個(gè)屬性對(duì)于信息傳播過(guò)程具有重要影響。

        (2)微觀研究

        Suh 等[93]從推文內(nèi)容屬性(URL、hashtag 和mention)和推文發(fā)布者屬性(follower、followee、favorite、day 和 status)出發(fā)提出傳播預(yù)測(cè)模型。首先利用主成分分析方法(PCA)對(duì)影響推文轉(zhuǎn)發(fā)的主要因素進(jìn)行分析,得到影響因素之間的關(guān)系;隨后,基于廣義線性模型(Generalized Linear Model)構(gòu)建了一個(gè)推文轉(zhuǎn)發(fā)預(yù)測(cè)模型;最后利用大量數(shù)據(jù)分析得出:在推文內(nèi)容屬性中 URL和 Tag 對(duì)轉(zhuǎn)發(fā)有很大的影響;在推文發(fā)布者屬性中,用戶的好友數(shù)、粉絲數(shù)以及用戶使用時(shí)長(zhǎng)在轉(zhuǎn)發(fā)中起到很大的作用,而用戶發(fā)表的歷史微博數(shù)則作用不大。

        Hong 等[94]分析了信息內(nèi)容屬性(TF-IDF、LDA 主題分布)、時(shí)間屬性(當(dāng)前消息和源消息的時(shí)間差、當(dāng)前消息和前一消息的時(shí)間差、同一事件中消息被轉(zhuǎn)發(fā)的平均時(shí)間差以及用戶消息被轉(zhuǎn)發(fā)的平均時(shí)間)、信息和用戶的元數(shù)據(jù)屬性(信息是否被轉(zhuǎn)發(fā)、用戶發(fā)布信息的被轉(zhuǎn)發(fā)總量以及用戶發(fā)布的消息總量)以及用戶的結(jié)構(gòu)屬性(PageRank 值、度分布、局部聚集系數(shù)以及互關(guān)系)等因素對(duì)于推文轉(zhuǎn)發(fā)量的影響,并基于上述因素將預(yù)測(cè)推文的轉(zhuǎn)發(fā)量問(wèn)題轉(zhuǎn)化為兩個(gè)分類問(wèn)題,包括預(yù)測(cè)推文是否被轉(zhuǎn)發(fā)的二項(xiàng)分類問(wèn)題和轉(zhuǎn)發(fā)具體量的多項(xiàng)分類問(wèn)題,實(shí)現(xiàn)對(duì)轉(zhuǎn)發(fā)量進(jìn)行預(yù)測(cè)。

        Yang 等[91]從用戶屬性和微博內(nèi)容屬性等角度出發(fā),通過(guò)分析影響微博被轉(zhuǎn)發(fā)的重要因素,提出了基于因子圖模型的預(yù)測(cè)用戶消息傳播行為模型。模型中分析了能夠促使用戶轉(zhuǎn)發(fā)消息或者制約轉(zhuǎn)發(fā)消息的若干特征,包括用戶活躍性、延遲規(guī)律性、權(quán)威性、內(nèi)容重要性、用戶對(duì)內(nèi)容的興趣、用戶之間的共同興趣以及擬社會(huì)交互等因素。

        Gupta 等[95]基于發(fā)布者屬性、社會(huì)屬性以及時(shí)間屬性利用回歸、分類以及混合方法對(duì)微博平臺(tái)上的事件發(fā)展趨勢(shì)進(jìn)行預(yù)測(cè),通過(guò)對(duì) 18382 個(gè)事件的實(shí)驗(yàn)證明,所用屬性以及方法在事件趨勢(shì)預(yù)測(cè)上的有效性。

        Peng 等[96]提出一種基于條件隨機(jī)場(chǎng)的轉(zhuǎn)發(fā)行為預(yù)測(cè)方法。該方法考慮內(nèi)容影響、網(wǎng)絡(luò)影響以及時(shí)間延遲影響,將用戶是否轉(zhuǎn)發(fā)一條推文問(wèn)題轉(zhuǎn)化為求最大后驗(yàn)概率問(wèn)題,并根據(jù)對(duì)用戶轉(zhuǎn)發(fā)行為的分析,將最大后驗(yàn)概率用條件隨機(jī)場(chǎng)表示,進(jìn)行轉(zhuǎn)發(fā)行為的預(yù)測(cè),實(shí)驗(yàn)結(jié)果也驗(yàn)證了結(jié)合了網(wǎng)絡(luò)關(guān)系后,此方法提高了轉(zhuǎn)發(fā)行為預(yù)測(cè)的有效性。

        信息傳播預(yù)測(cè)的宏觀研究,能夠?qū)崿F(xiàn)對(duì)信息傳播的廣度、深度以及速度的預(yù)測(cè),在熱點(diǎn)信息、熱點(diǎn)話題發(fā)現(xiàn)以及不良信息的預(yù)警等方面都有重要價(jià)值。信息傳播預(yù)測(cè)的微觀研究,實(shí)現(xiàn)對(duì)社會(huì)網(wǎng)絡(luò)中個(gè)體轉(zhuǎn)發(fā)行為的預(yù)測(cè),在個(gè)性化推薦、病毒式營(yíng)銷等方面有巨大應(yīng)用價(jià)值。

        在信息傳播預(yù)測(cè)方面,存在如下問(wèn)題:

        (1)宏觀研究方面,目前基于時(shí)間因素的預(yù)測(cè)模型大多集中于利用線性預(yù)測(cè)模型進(jìn)行,而尚無(wú)學(xué)者對(duì)信息傳播是否服從線性規(guī)律這一問(wèn)題進(jìn)行研究和得到結(jié)論,因此基于線性預(yù)測(cè)模型的方法的適用性仍需進(jìn)一步確認(rèn);

        (2)同樣在宏觀研究方面,目前并沒(méi)有統(tǒng)一的信息傳播過(guò)程評(píng)價(jià)指標(biāo)體系,只有包含傳播廣度、深度以及速度的經(jīng)驗(yàn)指標(biāo),而對(duì)信息傳播過(guò)程的預(yù)測(cè)也多集中于這三個(gè)方面,因此對(duì)信息傳播評(píng)價(jià)指標(biāo)體系的研究亟待加強(qiáng);

        (3)微觀研究方面,學(xué)者們不斷加入不同的諸如社會(huì)屬性、信息屬性及用戶屬性等特征構(gòu)建預(yù)測(cè)模型,而對(duì)信息傳播行為有影響力的特征究竟有哪些,目前還沒(méi)有定論,因此在對(duì)個(gè)體傳播行為建模加入不同的屬性特征時(shí),需要對(duì)特征進(jìn)行相關(guān)性和關(guān)聯(lián)性等方面的深入分析,以便構(gòu)建更有實(shí)際意義的預(yù)測(cè)模型。

        4 社會(huì)網(wǎng)絡(luò)安全問(wèn)題

        社會(huì)網(wǎng)絡(luò)的產(chǎn)生以及迅速爆發(fā)背后,也存在很多安全相關(guān)的問(wèn)題,例如數(shù)以萬(wàn)計(jì)的虛假帳號(hào)、鋪天蓋地的垃圾信息、大肆傳播的網(wǎng)絡(luò)謠言等。根據(jù)安全隱患主體的不同,可以分為用戶安全問(wèn)題和信息安全問(wèn)題。

        4.1 用戶安全

        由于社會(huì)網(wǎng)絡(luò)在信息傳播等方面的巨大作用,一些希望非法獲取傳播利益的機(jī)構(gòu),創(chuàng)造大量的虛假帳號(hào),作為其商業(yè)或者惡意信息的傳播工具,導(dǎo)致社會(huì)網(wǎng)絡(luò)中存在大量的垃圾信息和惡意信息,因此對(duì)虛假帳號(hào)進(jìn)行識(shí)別并控制具有重要意義;另外,社會(huì)網(wǎng)絡(luò)用戶可能受到病毒侵害,在受到病毒侵害后,病毒如何傳播和感染其他用戶?其他用戶又會(huì)如何級(jí)聯(lián)失效?作為新型網(wǎng)絡(luò),社會(huì)網(wǎng)絡(luò)在帶給用戶新的體驗(yàn)的同時(shí),也將傳統(tǒng)網(wǎng)站中潛伏的各種危害帶了過(guò)來(lái)。2005 年,Samy 蠕蟲(chóng)在 MySpace 爆發(fā),短短20 小時(shí),感染用戶就超過(guò)百萬(wàn),兩天之后,致使 MySpace 不得不關(guān)閉站點(diǎn)進(jìn)行維護(hù)。2009 年4 月,Mikeyy 蠕蟲(chóng)攻擊 Twitter 社交網(wǎng)站,用大量垃圾信息大肆修改用戶頁(yè)面。2009 年 5 月,KoobFace蠕蟲(chóng)爆發(fā),先沖擊Facebook 網(wǎng)站,隨后其變種開(kāi)始攻擊其他社交網(wǎng)站。這些都表明網(wǎng)絡(luò)攻擊者開(kāi)始將社交網(wǎng)絡(luò)作為新的攻擊目標(biāo)[97]。如何確保社會(huì)網(wǎng)絡(luò)用戶不受病毒侵害,或者盡可能低地控制病毒危害,是非常重要的研究課題。

        4.1.1 僵尸用戶識(shí)別

        所謂的僵尸用戶,是指在線社會(huì)網(wǎng)絡(luò)上的虛假用戶,通常是由系統(tǒng)自動(dòng)產(chǎn)生的惡意注冊(cè)用戶,一般只求數(shù)量而不重質(zhì)量,是有名無(wú)實(shí)的在線社會(huì)網(wǎng)絡(luò)用戶。由于目前在線社會(huì)網(wǎng)絡(luò)并未完全實(shí)現(xiàn)實(shí)名制,對(duì)用戶行為的約束力仍遠(yuǎn)遠(yuǎn)不夠,數(shù)據(jù)的真實(shí)性和準(zhǔn)確性很大程度上依賴于發(fā)布者的道德素養(yǎng)。而出于商業(yè)競(jìng)爭(zhēng)、私人泄憤等目的,一些希望非法獲取傳播利益的機(jī)構(gòu),創(chuàng)造大量的僵尸用戶,即通過(guò)計(jì)算機(jī)編程語(yǔ)言編寫的在社交網(wǎng)絡(luò)中能模擬真實(shí)用戶操作實(shí)現(xiàn)各種功能的用戶,讓真實(shí)用戶難以辨別在其網(wǎng)絡(luò)社交圈里的用戶是否亦是真實(shí)用戶。

        隨著社會(huì)網(wǎng)絡(luò)等新型媒體的走紅,僵尸用戶也遍地開(kāi)花,而這種通過(guò)向惡意注冊(cè)的用戶花少量的錢直接購(gòu)買而來(lái)的僵尸用戶,不僅會(huì)造成對(duì)特定用戶的傷害(如誹謗他人、批露他人隱私),而且對(duì)社會(huì)網(wǎng)絡(luò)公信力和誠(chéng)信環(huán)境也會(huì)造成嚴(yán)重?fù)p害,目前已經(jīng)為其他社會(huì)網(wǎng)絡(luò)用戶帶來(lái)極大的困擾,影響社會(huì)網(wǎng)絡(luò)中信息的真實(shí)性,成為社會(huì)網(wǎng)絡(luò)環(huán)境中一個(gè)很大的毒瘤。僵尸用戶作為其商業(yè)或者惡意信息的傳播工具,是導(dǎo)致社會(huì)網(wǎng)絡(luò)中大量垃圾信息和惡意信息存在的主要原因,因此對(duì)僵尸用戶進(jìn)行識(shí)別并控制,具有重要意義。

        對(duì)于社會(huì)網(wǎng)絡(luò)中僵尸用戶的甄別問(wèn)題,學(xué)術(shù)界的研究還很少。一般來(lái)說(shuō),對(duì)僵尸用戶的甄別的起點(diǎn)是分析其特征,傳統(tǒng)上主要利用手工查找、分析樣本數(shù)據(jù)特征的方法,這種方法效率低下、成本高昂。最近出現(xiàn)一種僵尸用戶統(tǒng)計(jì)器,用一些簡(jiǎn)單的經(jīng)驗(yàn)特征,包括是否是已注銷用戶、粉絲數(shù)低于 5、微博數(shù)低于 5 等分別對(duì)新浪微博和騰訊微博的名人的粉絲進(jìn)行統(tǒng)計(jì)分析。最終統(tǒng)計(jì)結(jié)果顯示,新浪名人粉絲中的僵尸用戶數(shù)占16.96%,騰訊微博名人粉絲中的僵尸用戶數(shù)占 56.73%。這種統(tǒng)計(jì)方法相對(duì)于傳統(tǒng)方法簡(jiǎn)單高效、成本低廉,但分類的精確率有待考證。

        Chu 等[98]利用信息熵、機(jī)器學(xué)習(xí)等方法研究了僵尸用戶的識(shí)別問(wèn)題,基于發(fā)布信息的行為特征、推文內(nèi)容特征以及用戶特征等因素判斷用戶是人、機(jī)器還是半機(jī)器人,但這種方法對(duì)于數(shù)據(jù)要求較高,實(shí)現(xiàn)復(fù)雜。Irani 等[99]分析了 190 萬(wàn)Myspace 用戶檔案,利用機(jī)器學(xué)習(xí)技術(shù)設(shè)計(jì)并實(shí)現(xiàn)了一套惡意用戶檢測(cè)系統(tǒng)。

        Yardi 等[100]對(duì) Twitter 中的垃圾信息發(fā)布者進(jìn)行分析,發(fā)現(xiàn)垃圾信息發(fā)布者會(huì)比正常用戶發(fā)布更多的信息,跟隨更多的用戶,因此高的跟隨比率是衡量垃圾信息發(fā)布用戶的一個(gè)主要特征。Grier 等[101]從點(diǎn)擊率角度出發(fā)分析了 Twitter 中的垃圾信息傳播行為特征,發(fā)現(xiàn)垃圾信息的點(diǎn)擊率在 0.13 左右,由于社會(huì)網(wǎng)絡(luò)中用戶之間的信任機(jī)制,點(diǎn)擊率相對(duì)于 0.003~0.006 的傳統(tǒng)垃圾郵件的點(diǎn)擊率稍高,但仍是較低的范圍,利用此點(diǎn)擊率制定黑名單,可有效抑制垃圾信息的傳播。Thomas 等[102]根據(jù)用戶的可疑程度確定其發(fā)布信息的有效程度,發(fā)現(xiàn)目前 Twitter 中垃圾信息擴(kuò)散技術(shù),包括制造僵尸用戶、生成垃圾信息 URL以及廣泛分布垃圾信息。

        Webb 等[103]利用蜜罐手段在 MySpace 上成功捕獲 1570 個(gè)惡意用戶。Stringhini 等[104]同樣使用蜜罐手段研究了三個(gè)主要社會(huì)網(wǎng)絡(luò)平臺(tái)的數(shù)據(jù)。首先利用網(wǎng)絡(luò)爬蟲(chóng)抓取一定量的種子用戶,再通過(guò)與這些種子用戶聯(lián)系的方法獲得其他用戶,通過(guò)對(duì)用戶行為分析,確定惡意用戶。關(guān)于 Twitter 和 Facebook 的研究成果表明,這兩個(gè)社會(huì)網(wǎng)絡(luò)平臺(tái)中的惡意用戶會(huì)主動(dòng)關(guān)注其他用戶來(lái)建立關(guān)系,發(fā)現(xiàn) 15857 個(gè)惡意用戶。Lee 等[105]在 Facebook 上采用類似的手段,取得了不錯(cuò)的效果。Wang 等[106]提出一種更為通用的跨平臺(tái)的惡意用戶檢測(cè)機(jī)制。

        雖然對(duì)社會(huì)網(wǎng)絡(luò)中僵尸用戶或者惡意用戶的識(shí)別研究已有一些,但是目前的研究過(guò)于粗放,且存在較多不足之處。首先,目前主要方法是在對(duì)僵尸用戶的特征進(jìn)行提取的基礎(chǔ)上,利用機(jī)器學(xué)習(xí)等算法對(duì)僵尸用戶進(jìn)行識(shí)別,但對(duì)僵尸用戶的行為特征提取過(guò)于簡(jiǎn)單,且這種簡(jiǎn)單統(tǒng)計(jì)方法把所有特征平等看待,沒(méi)有考慮不同特征的重要性;其次,目前主要的研究成果是對(duì)于 Twitter、Facebook 以及 MySpace 等以英文為主要語(yǔ)言的社會(huì)網(wǎng)絡(luò)平臺(tái),抽取特征也是基于英語(yǔ)進(jìn)行的文本等特征抽取,但由于語(yǔ)言和文化差異,這些方法無(wú)法直接適用于國(guó)內(nèi)社會(huì)網(wǎng)絡(luò)平臺(tái)的僵尸用戶識(shí)別,還需根據(jù)平臺(tái)用戶自身特征進(jìn)行特征抽??;最后,隨著僵尸用戶級(jí)別的不斷提高,目前為了防止被識(shí)別和清除,僵尸用戶已經(jīng)在進(jìn)化,有針對(duì)性地根據(jù)已被發(fā)現(xiàn)的特征進(jìn)行優(yōu)化,因此目前有效的特征未必一直有效,如何根據(jù)僵尸用戶行為特征的進(jìn)化,更新識(shí)別方法具有重要研究?jī)r(jià)值。

        4.1.2 級(jí)聯(lián)失效

        級(jí)聯(lián)失效是指在網(wǎng)絡(luò)中一個(gè)或者少數(shù)節(jié)點(diǎn)或邊的失效會(huì)通過(guò)節(jié)點(diǎn)之間的耦合關(guān)系引發(fā)其他節(jié)點(diǎn)也發(fā)生失效,進(jìn)而產(chǎn)生級(jí)聯(lián)效應(yīng),最終導(dǎo)致相當(dāng)一部分節(jié)點(diǎn)甚至整個(gè)網(wǎng)絡(luò)的崩潰,這種現(xiàn)象被稱為級(jí)聯(lián)失效,也可形象地稱為“雪崩”。由于社會(huì)網(wǎng)絡(luò)中存在惡意的用戶,進(jìn)行病毒的傳播以及惡意信息的傳播,隨后通過(guò)某些用戶感染病毒,最終導(dǎo)致整個(gè)網(wǎng)絡(luò)都被攻擊,影響社會(huì)網(wǎng)絡(luò)用戶的體驗(yàn),造成惡劣影響,而這一過(guò)程可以由級(jí)聯(lián)失效過(guò)程進(jìn)行描述。因此,為了對(duì)病毒傳播以及惡意信息傳播的危害進(jìn)行研究,確定其危害,并尋找合理的限制策略,分析不同類型網(wǎng)絡(luò)下用戶在不同攻擊策略下的性能表現(xiàn)十分重要。雖然復(fù)雜網(wǎng)絡(luò)中的級(jí)聯(lián)失效過(guò)程與社會(huì)網(wǎng)絡(luò)中用戶失效的級(jí)聯(lián)反應(yīng)具有一致性,但將復(fù)雜網(wǎng)絡(luò)中級(jí)聯(lián)失效的結(jié)論運(yùn)用到社會(huì)網(wǎng)絡(luò)中的研究還很少,本文就復(fù)雜網(wǎng)絡(luò)中級(jí)聯(lián)失效主要模型進(jìn)行介紹,希望對(duì)于級(jí)聯(lián)失效在社會(huì)網(wǎng)絡(luò)中的應(yīng)用有一定的借鑒價(jià)值。

        負(fù)荷-容量模型是一類主要的級(jí)聯(lián)失效模型,該類模型通常賦予網(wǎng)絡(luò)中每個(gè)節(jié)點(diǎn)一定的初始負(fù)荷和容量,當(dāng)由于某種原因某個(gè)節(jié)點(diǎn)的負(fù)荷超過(guò)其容量從而產(chǎn)生故障時(shí),就把該節(jié)點(diǎn)的負(fù)荷按照一定的策略分配給網(wǎng)絡(luò)中的其他節(jié)點(diǎn),這些節(jié)點(diǎn)接受了額外的負(fù)荷,其總負(fù)荷也有可能超過(guò)其容量,從而導(dǎo)致新一輪的負(fù)荷重新分配,這個(gè)過(guò)程反復(fù)進(jìn)行,影響的節(jié)點(diǎn)有可能逐漸擴(kuò)散,從而產(chǎn)生級(jí)聯(lián)失效。Moreno 等[107]提出一種研究無(wú)標(biāo)度網(wǎng)絡(luò)中級(jí)聯(lián)失效的模型,每個(gè)節(jié)點(diǎn)的負(fù)荷相同,且節(jié)點(diǎn)失效后負(fù)荷將平均分配給其他與之相連的無(wú)故障節(jié)點(diǎn);Motter 等[108]提出并研究了另一種模型,其中假設(shè)信息和能量總在節(jié)點(diǎn)對(duì)之間沿著最短路徑交換,節(jié)點(diǎn)的負(fù)荷定義為節(jié)點(diǎn)的結(jié)束,反應(yīng)了網(wǎng)絡(luò)中通過(guò)該節(jié)點(diǎn)的最短路徑數(shù)目;Holme 等[109]研究了網(wǎng)絡(luò)增長(zhǎng)過(guò)程中級(jí)聯(lián)失效的產(chǎn)生條件。上述研究只考慮了節(jié)點(diǎn)的動(dòng)態(tài)行為,沒(méi)有考慮邊的動(dòng)態(tài)行為,實(shí)際網(wǎng)絡(luò)中在節(jié)點(diǎn)之間起連接和傳輸作用的邊的影響不可忽視。Moreno等[110]研究了無(wú)標(biāo)度網(wǎng)絡(luò)中由于邊的擁塞所引發(fā)的級(jí)聯(lián)失效;Crucitti 等[111]研究了一種同時(shí)考慮節(jié)點(diǎn)和邊的作用的動(dòng)態(tài)級(jí)聯(lián)失效模型。

        二值影響模型是一般影響模型的一個(gè)特例,構(gòu)造包含N個(gè)節(jié)點(diǎn)的隨機(jī)網(wǎng)絡(luò),其中網(wǎng)絡(luò)度分布為pk,網(wǎng)絡(luò)平均度為 <k>=z,網(wǎng)絡(luò)中的每個(gè)節(jié)點(diǎn)只有兩個(gè)狀態(tài):1(表示故障)、0(表示正常),任意一個(gè)節(jié)點(diǎn)某時(shí)刻的狀態(tài)選擇,必須根據(jù)其k個(gè)直接相連的鄰居節(jié)點(diǎn)的狀態(tài)作決定。若鄰居節(jié)點(diǎn)數(shù)等于或超過(guò)賦予這個(gè)節(jié)點(diǎn)的狀態(tài)切換閾值,則該節(jié)點(diǎn)狀態(tài)為 1,否則為 0;一旦節(jié)點(diǎn)的狀態(tài)設(shè)置為 1,則其狀態(tài)在動(dòng)態(tài)演化的過(guò)程中保持不變?;谶@個(gè)演化規(guī)則,如果網(wǎng)絡(luò)中節(jié)點(diǎn)的度分布和閾值分布具有一定的關(guān)系,則單個(gè)或若干節(jié)點(diǎn)發(fā)生故障可以產(chǎn)生雪崩效應(yīng)。Watts[112]將這一模型應(yīng)用于隨機(jī)網(wǎng)絡(luò)級(jí)聯(lián)失效分析中。

        沙堆模型中假設(shè)在一個(gè)平面上不停地堆沙子,隨著沙堆逐漸變大,坡面變陡,新添加的沙子引發(fā)沙崩的可能性愈來(lái)愈大。將沙崩前的臨界狀態(tài)稱為自組織臨界狀態(tài),Bak 等[113]提出一個(gè)用計(jì)算機(jī)模擬的沙堆模型,用以描述級(jí)聯(lián)失效現(xiàn)象。

        目前復(fù)雜網(wǎng)絡(luò)在考慮級(jí)聯(lián)失效下的抗毀性有一些研究成果。人們根據(jù)真實(shí)網(wǎng)絡(luò)的特點(diǎn)提出了多種級(jí)聯(lián)失效模型, 并研究了特定模型下不同的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)應(yīng)對(duì)攻擊的性能表現(xiàn)。Albert等[114]最先研究了不同拓?fù)浣Y(jié)構(gòu)的網(wǎng)絡(luò)應(yīng)對(duì)節(jié)點(diǎn)移除攻擊的魯棒性。Cohen 等[115,116]基于滲流理論研究了互聯(lián)網(wǎng)在隨機(jī)和故意攻擊下的性能表現(xiàn)。Holme 等[117]研究發(fā)現(xiàn)基于重計(jì)算的度和介數(shù)進(jìn)行攻擊對(duì)網(wǎng)絡(luò)的破壞程度比基于初始度或介數(shù)更嚴(yán)重。然而上述工作都僅是基于網(wǎng)絡(luò)的靜態(tài)連通性能,而忽視了網(wǎng)絡(luò)的動(dòng)態(tài)特征。而實(shí)際網(wǎng)絡(luò)具有顯著的動(dòng)態(tài)性,拓?fù)浣Y(jié)構(gòu)的改變會(huì)影響網(wǎng)絡(luò)中的交通流、信息流或數(shù)據(jù)流,這易引發(fā)級(jí)聯(lián)失效現(xiàn)象[118,119]。

        Wang 等[120]提出了一個(gè)基于局部負(fù)荷分配策略的級(jí)聯(lián)失效模型,在該模型上研究發(fā)現(xiàn)在某些條件下攻擊低度節(jié)點(diǎn)對(duì)網(wǎng)絡(luò)的破壞程度反而大于高度的節(jié)點(diǎn)。Bao 等[121]發(fā)現(xiàn)在小世界網(wǎng)絡(luò)中,攻擊負(fù)載最高的邊對(duì)網(wǎng)絡(luò)的破壞性大于攻擊最高負(fù)載節(jié)點(diǎn),而在無(wú)標(biāo)度網(wǎng)絡(luò)中剛好相反。Motter[122]提出通過(guò)移除部分邊緣節(jié)點(diǎn)或是核心區(qū)域的邊來(lái)降低級(jí)聯(lián)失效的規(guī)模。Li 等[123]表明給高度節(jié)點(diǎn)分配更多的容量能有效提高網(wǎng)絡(luò)抵抗級(jí)聯(lián)失效的能力。

        前人從對(duì)一般復(fù)雜網(wǎng)絡(luò)上的級(jí)聯(lián)失效模型的研究中,已經(jīng)得出了很多有價(jià)值的結(jié)論。與普通復(fù)雜網(wǎng)絡(luò)相似,社會(huì)網(wǎng)絡(luò)中由于部分節(jié)點(diǎn)的失效(如感染病毒、受到其他攻擊等)也可能造成更多的節(jié)點(diǎn)失效。但由于社會(huì)網(wǎng)絡(luò)中節(jié)點(diǎn)與邊具有社會(huì)屬性,如社會(huì)網(wǎng)絡(luò)中節(jié)點(diǎn)或者邊的負(fù)荷、容量等的意義與普通網(wǎng)絡(luò)不同,普通的級(jí)聯(lián)模型不能直接運(yùn)用到社會(huì)網(wǎng)絡(luò)中,而必須根據(jù)社會(huì)網(wǎng)絡(luò)中的特有性質(zhì)進(jìn)行相應(yīng)調(diào)整。在設(shè)計(jì)社會(huì)網(wǎng)絡(luò)級(jí)聯(lián)失效模型時(shí),需要根據(jù)社會(huì)網(wǎng)絡(luò)性質(zhì)對(duì)其進(jìn)行重新定義,這必將影響級(jí)聯(lián)失效模型的機(jī)制。這方面的研究尚處于初級(jí)階段,還需要更多學(xué)者的投入。

        4.2 信息安全

        由于社會(huì)網(wǎng)絡(luò)龐大的用戶數(shù)量和快捷的數(shù)據(jù)訪問(wèn)方式,數(shù)據(jù)的傳播呈現(xiàn)廣泛、快速的特點(diǎn),大量惡意用戶產(chǎn)生的虛假消息也充斥于社會(huì)網(wǎng)絡(luò)中,比如虛假?gòu)V告、詐騙信息、垃圾標(biāo)簽等。這些虛假信息主要分為三大類:(1)涉及經(jīng)濟(jì)利益的虛假信息,例如謊稱花費(fèi)幾萬(wàn)元可以購(gòu)買北京機(jī)動(dòng)車購(gòu)車指標(biāo),而這一指標(biāo)按規(guī)定不準(zhǔn)買賣;(2)涉及名譽(yù)利益的虛假信息,例如謊稱某銀行經(jīng)理辱罵客戶,而事實(shí)是該客戶在該銀行貸款被拒后出于泄憤而編造了這一虛假信息;(3)涉及國(guó)家安全的虛假信息,例如,美國(guó) Sandy 颶風(fēng)發(fā)生后,Twitter 上出現(xiàn)了大量關(guān)于政府營(yíng)救不利、死尸遍野的網(wǎng)絡(luò)謠言,造成了群眾的恐慌,對(duì)社會(huì)穩(wěn)定造成了不利影響;此外,中國(guó)最為流行的社交網(wǎng)站中也充斥著為數(shù)眾多的網(wǎng)絡(luò)謠言,如“軍車進(jìn)京”產(chǎn)生惡劣社會(huì)影響、“滴血食物傳播病毒”引發(fā)恐慌、地震謠言令山西數(shù)百萬(wàn)人街頭避難、“蛆橘”謠言讓全國(guó)柑橘嚴(yán)重滯銷等等,對(duì)社會(huì)穩(wěn)定和國(guó)家安全造成了嚴(yán)重影響。上述虛假信息因其具有誘惑性或有悖常理的特點(diǎn)而受到更多人關(guān)注,傳播速度更快,傳播范圍更廣,造成的惡劣影響也更大。根據(jù)中國(guó)社會(huì)科學(xué)院 2013 年 6 月 25 日發(fā)布的 2013 年《中國(guó)新媒體發(fā)展報(bào)告》顯示,從 2012 年 1 月至 2013 年 1月的 100 件微博熱點(diǎn)輿情案件中,虛假信息的比例超過(guò) 1/3。因此,在社會(huì)網(wǎng)絡(luò)中如何對(duì)虛假信息的傳播源頭進(jìn)行追溯,及時(shí)引導(dǎo)網(wǎng)絡(luò)輿情,并對(duì)謠言進(jìn)行有效控制,都面臨著巨大的困難和挑戰(zhàn)。這些問(wèn)題的解決,有助于凈化網(wǎng)絡(luò)環(huán)境、維護(hù)社會(huì)穩(wěn)定、保障國(guó)家安全,具有重大的理論和現(xiàn)實(shí)意義。因此,采取有效的方法對(duì)虛假信息進(jìn)行控制成為另一個(gè)非常重要的研究問(wèn)題。

        4.2.1 源頭追溯

        信息源頭追溯主要是指根據(jù)已有的少量的信息獲得者情況以及網(wǎng)絡(luò)信息,推測(cè)出發(fā)布信息的源頭,對(duì)信息的分析和控制具有重要意義。最新的一篇物理評(píng)論快報(bào)進(jìn)行了關(guān)于擴(kuò)散源點(diǎn)的定位研究[124]。文章提出一種適用于二叉樹(shù)的信息源頭發(fā)現(xiàn)策略,通過(guò)計(jì)算每一個(gè)節(jié)點(diǎn)為源頭的概率,確定獲得最大概率的節(jié)點(diǎn)為源頭,實(shí)驗(yàn)發(fā)現(xiàn)預(yù)測(cè)精度與網(wǎng)絡(luò)結(jié)構(gòu)、獲得信息的用戶密度以及獲得信息數(shù)量相關(guān)。

        Shah 等[125,126]研究了計(jì)算機(jī)病毒的源頭發(fā)現(xiàn)問(wèn)題,定義了謠言中心性,并基于 SIR 傳染病模型計(jì)算了節(jié)點(diǎn)為謠言源頭的最大可能性,利用最大似然估計(jì)方法確定謠言的源頭,通過(guò)在小世界網(wǎng)絡(luò)和無(wú)標(biāo)度網(wǎng)絡(luò)等模擬網(wǎng)絡(luò)以及計(jì)算機(jī)網(wǎng)絡(luò)、電力網(wǎng)絡(luò)等實(shí)際網(wǎng)絡(luò)上的仿真實(shí)驗(yàn),說(shuō)明利用此方法能夠確定定位謠言源頭位置或者謠言真實(shí)源頭與實(shí)驗(yàn)獲得的源頭之間距離很小,說(shuō)明了方法的有效性。

        Zhu 等[127]借鑒節(jié)點(diǎn)離心率和喬丹中心節(jié)點(diǎn)(Jordan Center)的概念,定義了相對(duì)于信息傳播的感染離心率和喬丹感染中心節(jié)點(diǎn)(Jordan Infection Centers),將信息源頭追溯問(wèn)題轉(zhuǎn)化為求喬丹感染中心節(jié)點(diǎn)(Jordan Infection Centers)問(wèn)題。而由于喬丹感染中心節(jié)點(diǎn)(Jordan Infection Centers)的求解為一個(gè)優(yōu)化問(wèn)題,需要很大的計(jì)算量和很多的網(wǎng)絡(luò)結(jié)構(gòu)信息,作者設(shè)計(jì)了一個(gè)方法,首先讓每個(gè)感染者傳播一條帶標(biāo)簽的消息,如果鄰居的存儲(chǔ)庫(kù)中沒(méi)有這個(gè)消息,那么這個(gè)鄰居就記錄下這個(gè)消息,并記錄下收到這個(gè)消息的時(shí)間,再向它的鄰居傳播。如果找到一個(gè)節(jié)點(diǎn)收到了所有的標(biāo)簽,則終止程序,并認(rèn)為此節(jié)點(diǎn)很可能是信息源。這個(gè)算法所需的計(jì)算量和信息少于已有的其他方法。

        Wang 等[128]對(duì)網(wǎng)絡(luò)謠言源識(shí)別問(wèn)題開(kāi)展了深入研究,首次發(fā)現(xiàn)利用多樣本觀察知識(shí)能夠?yàn)闄z測(cè)方法帶來(lái)顯著的分集增益。作者從原理上證明,利用多樣本觀察知識(shí),對(duì)于規(guī)則樹(shù)狀網(wǎng)絡(luò)拓?fù)淠P?,能夠?qū)⒄_檢測(cè)率由文獻(xiàn)中單樣本觀察時(shí)的 30.7% 提升到趨近 100%,進(jìn)一步通過(guò)對(duì)多種實(shí)際網(wǎng)絡(luò)模型的數(shù)值實(shí)驗(yàn)研究,證實(shí)了所提出的多樣本檢測(cè)算法有潛力大幅度提高謠言源識(shí)別的精度。

        毫無(wú)疑問(wèn),傳播路徑的還原研究有助于傳播過(guò)程的控制,其應(yīng)用也非常廣泛,例如輿情和疫情的防控、網(wǎng)絡(luò)取證等。然而,這一研究在很大程度上受限于傳播機(jī)理研究的進(jìn)展,單單憑借數(shù)學(xué)統(tǒng)計(jì)方法和計(jì)算機(jī)技術(shù)很難發(fā)展出一套行之有效的還原方法。因而還需要各個(gè)研究領(lǐng)域的學(xué)者運(yùn)用不同的技術(shù)投入到源頭追溯的研究中。

        4.2.2 網(wǎng)絡(luò)控制

        對(duì)網(wǎng)絡(luò)自身結(jié)構(gòu)和網(wǎng)絡(luò)動(dòng)力學(xué)過(guò)程的分析、建模以及預(yù)測(cè)等都不是網(wǎng)絡(luò)研究的終極目標(biāo),上述工作都是為了能夠?qū)W(wǎng)絡(luò)進(jìn)行定性控制以及進(jìn)一步的精確控制。作為網(wǎng)絡(luò)研究的終極目標(biāo),這一研究課題自然是非常重要的。Valente 等[129]指出,網(wǎng)絡(luò)控制是運(yùn)用社會(huì)網(wǎng)絡(luò)數(shù)據(jù)來(lái)加快行為的變化,提高組織的性能。文章描述了對(duì)網(wǎng)絡(luò)進(jìn)行控制的四種策略,包括個(gè)人(Individual)、社團(tuán)(Segmentation)、激勵(lì)(Induction)以及改變(Alternation)。分別對(duì)這四種策略進(jìn)行了分析,認(rèn)為每種控制策略都包含多種具體實(shí)施方式:個(gè)人層面的控制是指首先需要確定網(wǎng)絡(luò)中的意見(jiàn)領(lǐng)袖以及群體之間的橋梁節(jié)點(diǎn);社團(tuán)層面的控制是指需要將網(wǎng)絡(luò)進(jìn)行社團(tuán)劃分后,通過(guò)團(tuán)體中個(gè)體的互相影響實(shí)現(xiàn)控制;激勵(lì)層面的控制是指通過(guò)個(gè)體與個(gè)體之間的相互作用或者誘導(dǎo),完成對(duì)個(gè)體的控制;改變層面主要是指通過(guò)增加、刪除節(jié)點(diǎn)或者邊以及邊的重連(rewiring)來(lái)實(shí)現(xiàn)控制。作者同時(shí)指出,選擇合適的網(wǎng)絡(luò)控制策略取決于網(wǎng)絡(luò)數(shù)據(jù)特征、行為特征、已形成的傳播態(tài)勢(shì)以及需要控制的事件的社會(huì)背景。

        在網(wǎng)絡(luò)控制方面,牽制控制(Pinning Control)是應(yīng)用較多的一種控制策略,其目標(biāo)是通過(guò)對(duì)網(wǎng)絡(luò)中一部分節(jié)點(diǎn)直接施加常數(shù)輸入的控制,達(dá)到對(duì)整個(gè)網(wǎng)絡(luò)的時(shí)空混沌行為進(jìn)行有效控制的目的。Wang 等[130]和 Li 等[131]研究了在具有無(wú)標(biāo)度拓?fù)浣Y(jié)構(gòu)的復(fù)雜動(dòng)力網(wǎng)絡(luò)上的牽制控制問(wèn)題,發(fā)現(xiàn)牽制控制利用無(wú)標(biāo)度網(wǎng)絡(luò)結(jié)構(gòu)的非均勻性,有針對(duì)性地對(duì)網(wǎng)絡(luò)中的少數(shù)關(guān)鍵節(jié)點(diǎn)施加反饋控制,從而能夠?qū)⒁?guī)模龐大的復(fù)雜動(dòng)態(tài)網(wǎng)絡(luò)穩(wěn)定到平衡點(diǎn),獲得很高的控制效率。Liu 等[132]研究了復(fù)雜網(wǎng)絡(luò)的完全能控性,即在有限時(shí)間內(nèi)將網(wǎng)絡(luò)節(jié)點(diǎn)的狀態(tài)從任意初態(tài)控制到任意終態(tài)。文章定義最小驅(qū)動(dòng)節(jié)點(diǎn)集為足以完全控制網(wǎng)絡(luò)中全部節(jié)點(diǎn)狀態(tài)所需要的驅(qū)動(dòng)節(jié)點(diǎn)的最小集合,將最小驅(qū)動(dòng)節(jié)點(diǎn)集的求解問(wèn)題轉(zhuǎn)化為有向圖的最大匹配問(wèn)題,得到了使一個(gè)具有泊松或冪律度分布的隨機(jī)網(wǎng)絡(luò)完全能控所需的最少的驅(qū)動(dòng)節(jié)點(diǎn)的數(shù)目。在此基礎(chǔ)上,Wang 等[133]提出了對(duì)網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行微擾以減少所需的驅(qū)動(dòng)節(jié)點(diǎn)的數(shù)目的方法;Nepusz等[134]則運(yùn)用點(diǎn)邊互換的思想研究了對(duì)網(wǎng)絡(luò)的邊的狀態(tài)進(jìn)行控制的問(wèn)題。此外,Yang 等[135]研究了控制復(fù)雜網(wǎng)絡(luò)所需要付出的能量代價(jià)的上界和下界,發(fā)現(xiàn)了控制的難易程度與網(wǎng)絡(luò)結(jié)構(gòu)的對(duì)等性之間的關(guān)系。

        社會(huì)網(wǎng)絡(luò)控制方面的研究還很少,許多開(kāi)放性的問(wèn)題還沒(méi)有得到完全的解決,比如在網(wǎng)絡(luò)結(jié)構(gòu)與控制之間的關(guān)系方面,完全控制一個(gè)網(wǎng)絡(luò)最少需要直接控制哪些節(jié)點(diǎn),哪些網(wǎng)絡(luò)需要的驅(qū)動(dòng)節(jié)點(diǎn)較少、付出的能量代價(jià)較低,如何對(duì)網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行微擾從而降低驅(qū)動(dòng)節(jié)點(diǎn)的數(shù)目等等。

        5 未結(jié)束的結(jié)束語(yǔ)

        本文對(duì)近幾年社會(huì)網(wǎng)絡(luò)研究中的熱點(diǎn)問(wèn)題進(jìn)行了整理,主要是信息傳播以及安全方面,并分別對(duì)這兩方面的研究成果進(jìn)行了概括、分析和歸納,并對(duì)未來(lái)的研究方向進(jìn)行了討論和思索。信息傳播方面,主要從信息傳播模型、影響因素、影響力最大化以及預(yù)測(cè)感知四個(gè)角度出發(fā),安全方面主要從用戶安全和信息安全兩個(gè)角度出發(fā),整理了相關(guān)文獻(xiàn),對(duì)每一部分的研究現(xiàn)狀以及存在的問(wèn)題進(jìn)行分析后,對(duì)未來(lái)的研究重點(diǎn)進(jìn)行了討論。

        最后,結(jié)合文中對(duì)社會(huì)網(wǎng)絡(luò)熱點(diǎn)各個(gè)方面文獻(xiàn)的綜述,對(duì)社會(huì)網(wǎng)絡(luò)未來(lái)的研究方向進(jìn)行簡(jiǎn)單的總結(jié),我們認(rèn)為以下幾個(gè)方面還存在巨大的研究空間:

        (1)對(duì)于信息傳播影響力評(píng)價(jià)問(wèn)題,目前尚無(wú)統(tǒng)一的信息傳播過(guò)程評(píng)價(jià)指標(biāo)體系,只有包含傳播廣度、深度以及速度的經(jīng)驗(yàn)指標(biāo)。因此為了更準(zhǔn)確地衡量信息的影響力,需要構(gòu)建更有說(shuō)服力的、全面的信息傳播影響力評(píng)價(jià)指標(biāo)體系。

        (2)社會(huì)網(wǎng)絡(luò)中的級(jí)聯(lián)失效與網(wǎng)絡(luò)控制相結(jié)合,已有的級(jí)聯(lián)失效模型不能完全適應(yīng)于社會(huì)網(wǎng)絡(luò),因此要根據(jù)社會(huì)網(wǎng)絡(luò)中節(jié)點(diǎn)失效的具體情況,構(gòu)建適應(yīng)于社會(huì)網(wǎng)絡(luò)的級(jí)聯(lián)失效模型;在選擇控制策略時(shí),綜合社會(huì)網(wǎng)絡(luò)級(jí)聯(lián)失效模型評(píng)價(jià)控制策略的效率,完善網(wǎng)絡(luò)控制策略制定。

        (3)對(duì)于被提出不到兩年時(shí)間的信息傳播源頭追溯問(wèn)題,大多數(shù)學(xué)者基于最大似然估計(jì)方法對(duì)源頭進(jìn)行預(yù)測(cè),方法單一,且沒(méi)有結(jié)合其他研究領(lǐng)域的現(xiàn)有成果,對(duì)問(wèn)題的解決還沒(méi)有很大的突破。未來(lái)工作可以根據(jù)信息傳播規(guī)律,嘗試借鑒其他領(lǐng)域的優(yōu)秀理論解決此類問(wèn)題。

        社會(huì)網(wǎng)絡(luò)目前是學(xué)術(shù)界和工業(yè)界的研究熱點(diǎn),我們梳理了社會(huì)網(wǎng)絡(luò)信息傳播和安全方面的最新研究成果,分析了問(wèn)題、挑戰(zhàn)和機(jī)遇,探索了新的研究點(diǎn)。僅是淺之拙見(jiàn),意在拋磚引玉,激發(fā)大家的研究熱情,以集思廣益、齊心協(xié)力來(lái)共同解決社會(huì)網(wǎng)絡(luò)面臨的諸多問(wèn)題和挑戰(zhàn)。

        [1] 臉譜 [OL]. [2014-12-05]. http://www.facebook. com/.

        [2] 推特 [OL]. [2014-12-05]. http://www.twitter. com/.

        [3] 微博 [OL]. [2014-12-05]. http://www.weibo.cn/.

        [4] 微信 [OL]. [2014-12-05]. http://weixin.qq.com/.

        [5] Boyd DM, Ellison NB. Social network sites: definition, history, and scholarship [J]. Journal of Computer-Mediated Communication, 2007, 13(1): 210-230.

        [6] Agrawal D, Budak C, Abbadi AE. Information diffusion in social networks: observing and influencing societal interests [C] // The 37th International Conference on Very Large Data Bases, 2011.

        [7] 臉譜投資者關(guān)系 [OL]. [2014-12-05]. http:// investor.fb.com/.

        [8] 推特投資者關(guān)系 [OL]. [2014-12-05]. http:// investor.twitterinc.com/.

        [9] 騰訊投資者關(guān)系 [OL]. [2014-12-05]. http:// www.tencent.com/zh-cn/ir.

        [10] 微博投資者關(guān)系 [OL]. [2014-12-05]. http:// ir.weibo.com.

        [11] 史上轉(zhuǎn)發(fā)量最多的推文[O L]. [2 0 1 4-12-05]. http://abcnews.go.com/blogs/ entertainment/2014/03/ellens-oscar-selfie-mostretweeted-tweet-ever/.

        [12] Watts DJ, Strogatz SH. Collective dynamics of‘small-world’ networks [J]. Nature, 1998, 393: 440-442.

        [13] Barabási AL, Albert R. Emergence of scaling in random networks [J]. Science, 1999, 286: 509-512.

        [14] Arrowsmith DK, Mondrag RJ, Woolf M. Data traffic, topology and congestion [C] // Complex Dynamics in Communication Networks Understanding Complex Systems, 2005: 127-157.

        [15] Newman MEJ. Assortative mixing in networks [J]. Physical Review Letters, 2002, 89(20): 28701.

        [16] Newman MEJ. Mixing patterns in networks [J]. Physical Review Letters, 2003, 67(2): 026126.

        [17] Ahn YY, Han S, Kwak H, et al. Analysis of topological characteristics of huge online social networking services [C] // Proceedings of the 16th International Conference on World Wide Web, 2007: 835-844.

        [18] Song C, Havlin S, Makse HA. Self-similarity of complex networks[J].Nature,2005,433:392-395.

        [19] Kwak H, Lee C, Park H, et al. What is twitter, a social network or a new media? [C] // Proceedings of the 19 the International Conference on World Wide Web, 2010: 591-600.

        [20] Wu SM, Hofman JM, Mason WA, et al. Who says what to whom on Twitter? [C] // Proceedings of the 20th International Conference on World Wide Web, 2011: 705-714.

        [21] Suh B, Hong L, Pirolli P, et al. Want to be retweeted? Large scale analytics on factors impacting retweet in twitter network [C] // 2010 IEEE International Conference on Social Computing / IEEE International Conference on Privacy, Security, Risk and Trust, 2010: 177-184.

        [22] Jose S. Why we twitter: understanding microblogging usage and communities [C] // Conference on Knowledge Discovery in Data, Proceedings of the 9th WebKDD and 1st SNAKDD 2007 Workshop on Web Mining and Social Network Analysis, 2007: 56-65.

        [23] Golder S, Wilkinson D, Huberman BA. Rhythms of social interaction: messaging within a massive online network [C] // Proceedings of the 3rd International Conference on Communities and Technologies, 2007: 41-66.

        [24] Yan Q, Wu LR, Zheng L. Social network based microblog user behavior analysis [J]. Physica A: Statistical Mechanics and Its Applications, 2013, 392(7): 1712-1723.

        [25] Fu F, Chen X, Liu L, et al. Social dilemmas in an online social network: The structure and evolution of cooperation [J]. Physics Letters A, 2007, 371: 58-64.

        [26] Girvan M, Newman MEJ. Community structure in social and biological networks [C] // Proceedings of the National Academy of Sciences, 2002, 99(12): 7821-7826.

        [27] Newman MEJ. Fast algorithm for detecting community structure in networks [J]. Physical Review E, 2004, 69(6): 066133.

        [28] Newman MEJ, Girvan M. Finding and evaluating community structure in networks [J]. Physical Review E,2004,69(2):026113.

        [29] Clauset A, Newman MEJ, Moore C. Finding community structure in very large networks [J]. Physical Review E, 2004, 70(6): 066111.

        [30] Barnes ER. An algorithm for partitioning the nodes of a graph [J]. SIAM Journal on Algebraic Discrete Methods, 1982, 3(4): 541-550.

        [31] Raghavan UN, Albert R, Kumara S. Near linear time algorithm to detect community structuresin large-scale networks [J]. Physical Review E, 2007, 76(3): 036106.

        [32] Gregory S. Finding overlapping communities in networks by label propagation [J]. New Journal of Physics, 2010, 12(10): 103018.

        [33] Xie J, Szymanski BK, Liu X. SLPA: Uncovering overlapping communities in social networksvia a speaker-listener interaction dynamic process [C] // 2011 IEEE 11th International Conference on Data Mining Workshops (ICDMW), 2011: 344-349.

        [34] Sarukkai RR. Link prediction and path analysis using markov chains [J]. Computer Networks, 2000, 33(1-6): 377-386.

        [35] Zhu J,Hong J, Hughes JG. Using markov chains for link prediction in adaptive web sites [C] // Soft-Ware 2002: Computing in an Imperfect World, Lecture Notes in Computer Science, 2002, 2311: 60-73.

        [36] Popescul A, Ungar L. Statistical relational learning for link prediction [C] // Proceedings of the Workshop on Learning Statistical Models from Relational Data, 2003: 81-87.

        [37] Zhou T, Lü L, Zhang YC. Predicting missing links via local information [J]. European Physical Journal B, 2009, 71(4): 623-630.

        [38] Heckerman D, Meek C, Koller D. Probabilistic entity-relationship models, PRMs, and plate models [C] // Proceedings of the 21st International Conference on Machine Learning, 2004: 55-60.

        [39] Friedman N, Getoor L, Koller D, et al. Learning probabilistic relational models [C] // Proceedings of the 16th International Joint Conferences on Artificial Intelligence, 1999: 1300-1307.

        [40] Guimera R, Sales-Pardo M. Missing and spurious interactions and the reconstruction of complex networks [J]. Proceedings of the National Academy of Sciences of the United States of America, 2009, 106(52): 22073-22078.

        [41] Clauset A, Moore C, Newman MEJ. Hierarchical structure and the prediction of missing links in networks [J]. Nature, 2008, 453: 98-101.

        [42] Kleinberg JM. Authoritative sources in a hyperlinked environment [J]. Journal of the ACM, 1999, 46(5): 604-632.

        [43] Lawrence P, Sergey B, Rajeev M, et al. The PageRank citation ranking: Bringing order to the web [J]. World Wide Web Internet and Web Information Systems, 1998, 54(2): 1-17.

        [44] Romero DM, Galuba W, Asur S, et al. Influence and passivity in social media [C] // The 20th International Conference Companion on World Wide Web, 2011: 113-114.

        [45] Cha M, Haddadi H, Benevenuto F, et al. Measuring user influence in Twitter: The million follower fallacy [C] // The 4th International AAAI Conference on Weblogs and Social Media, 2010: 10-17.

        [46] Tunkelang D. A Twitter analog to PageRank [OL]. http://thenoisychannel.com/2009/01/13/a_twitter_ analog_to_pagerank/.

        [47] Haveliwala T, Sepandar K, Glen J. An analytical comparion of approaches to personalizing PageRank [OL]. http://ilpubs.stanford.edu:8089/596/.

        [48] Kempe D, Kleinberg J, Tardos é. Maximizing the spread of influence through a social netwok [C] // Proceedings of the 9th ACM SIGKDD Conference of Knowledge Discovery and Data Mining, 2003: 137-146.

        [49] Kimura M, Saito K,Nakano R. Extracting influential nodes for information diffusion on a social network [C] // Proceedings of the 22nd National Conference on Artificial Intelligence, 2007, 2: 1371-1376.

        [50] Kimura M, Saito K. Tractable models for information diffusion in social networks [C] // The 10th European Conference on Principle and Practice of Knowledge Discovery in Databases, 2006,4213:259-271.

        [51] Leskovee J, Krause A, Guestrin C, et al. Cost-effective outbreak detection in networks [C] // Proceedings of the 13th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, 2007: 420-429.

        [52] Anderson RM, May RM. Infectious Diseases of Humans [M]. Oxford: Oxford University Press, 1992.

        [53] Hethcot HW. The mathematics of infectious diseases [J]. SIAM Review, 2000, 42(4): 599-653.

        [54] Pastor-Satorras R, Vespignani A. Epidemic spreading in scale-free networks [J]. Physical Review Letters, 2001, 86(14): 3200-3203.

        [55] Pastor-Satorras R, Vespignani A. Epidemic dynamics in finite size scale-free networks [J]. Physical Review E, 2002, 65(3): 035108.

        [56] Goldenberg J, Libai B, Muller E. Talk of the network: A complex systems look at the underlying process of word-of-mouth [J]. Marketing Letters, 2001, 12(3): 211-223.

        [57] Granovetter M. Threshold models of collective behavior [J]. The American Journal of Sociology, 1978, 83(6): 1420-1443.

        [58] Schelling T. Micromotives and Macrobehavior [M]. New York: Norton, 1978.

        [59] Gruhl D, Guha R, Liben-Nowell D, et al. Information diffusion through blogspace [C] // Proceedings of the 13th International Conference on World Wide Web, 2004: 491-501.

        [60] Leskovec J, McGlohon M, Faloutsos C, et al. Cascading behavior in large blog graphs: Patterns and a model [C] // SDM, 2007, 7: 551-556.

        [61] Galuba W, Aberer K, Chakraborty D, et al. Outtweeting the twitterers-predicting information cascades in microblogs [C] // Proceedings of the 3rd Conference on Online Social Networks, 2010: 3-3.

        [62] Zinoviev D, Duong V. A game theoretical approach to broadcast information diffusion in social networks [J]. Computer Science, 2011: arXiv:1106.5174.

        [63] Wang F, Wang HY, Xu K. Diffusive logistic model towards predicting information diffusion in online social networks[J].Computer Science,2011: arXiv:1108.0442.

        [64] Zhang S, Xu K, Chen X, et al. Dynamics of Information Spreading in Online Social Networks [J]. Computer Science, 2014: arXiv1404.5562.

        [65] Jin F, Dougherty E, Saraf P, et al. Epidemiological modeling of news and rumors on Twitter [C] // Proceedings of the 7th Workshop on social network mining and Analysis, 2013: 10.1145/2501025.2501027.

        [66] Boguna M, Pastor-satorras R. Epidemic spreading in correlated complex networks [J]. Physical Review E, 2002, 66: 047104.

        [67] Moreno Y, Gómez JB, Pacheco AF. Epidemic incidence in correlated complexnetworks [J]. Physical Review E, 2003, 68: 035103.

        [68] Boguna M, Pastor-satorras R, Vespignan IA. Absence of epidemic threshold in scale-free networks withdegree correlations [J]. Physical Review Letters,2003, 90: 028701.

        [69] Eguiluz VM, Klemm K. Epidemic threshold in structure dscale-free networks [J]. Physical Review Letters, 2002, 89: 108701.

        [70] Liu ZH, Hu B. Epidemic spreading in community networks [J]. Euro-Physics Letters, 2005, 72(2): 315-321.

        [71] Huang W, Lic G. Epidemic spreading in scale-free networks with community structure [J]. Journal of Statistical Mechanics: Theory and Experiment, 2008(1): P01014.

        [72] Zheng DF, Hu PM, Trimper S. Epidemics and dimensionality in hierarchical networks [J]. Physica A, 2005, 352: 659-668.

        [73] Yan G, Zhou T, Wang J, et al. Epidemic spread inweighted scale-free networks [J]. Chinese Physics Letters, 2005, 22(2): 510-513.

        [74] Barrat A, Barthélemy M, Vespignan V. Weight edevolving networks: coupling topology and weighted dynamics [J]. Physical Review Letters, 2004, 92: 228701.

        [75] Lu LY, Chen DB, Zhou T. The small world yields the most effective information spreading [J]. New Journal of Physics, 2011, 13: 123005.

        [76]Kan JQ,Xie JR,Zhang HF.Impacts of socialreinforcement and edge weight on the spreading of information in networks [J]. Journal of University of Electronic Science and Technology of China, 2014, 43: 21-25.

        [77] Gross TD, Lima CJD, Blasius B. Epidemic dynamics on an adaptive networks [J]. Physical Review Letters, 2006, 96: 208701.

        [78] Xu XJ, Zhang X, Mendes JFF. Impacts of preference and geography on epidemic spreading [J]. Physical Review E, 2007, 76: 056109.

        [79] Domingos P, Richardson M. Mining the network value of customers [C]// Proceedings of the 7th ACM SIGKDD Conference on Knowledge Discovery and Data Mining, 2001: 57-66.

        [80] Richardson M, Domingos P. Mining knowledgesharing sites for viral marketing [C] // Proceedings of the 8th ACM SIGKDD Conference on Knowledge Discovery and Data Mining, 2002: 61-70.

        [81] Leskovec J, Krause A, Guestrin C, et al. Costeffective outbreak detection in networks [C] // Proceedings of the 13th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, 2007: 420-429.

        [82] Chen W, Wang YJ, Yang SY. Efficient influence maximization in social networks [C] // Proceedings of the 15th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, 2009: 199-208.

        [83] Estévez PA, Vera P, Saito K. Selecting the most influential nodes in social networks [C] // International Joint Conference on Neural Networks, 2007: 2397-2402.

        [84] Galstyan A, Musoyan V, Cohen P. Maximizing influence Propagation in networks with community structure [J]. Physical Review E, 2009, 79(5): 056102.

        [85] Cao TY, Wu XD, Wang S, et al. OASNET: an optimal allocation approach to influence maximization in modular social network [C] // Proceedings of the 2010 ACM Symposium on Applied Computing, 2010: 1088-1094.

        [86] Wang Y, Cong G, Song GJ, et al. Community-based greedy algorithm for mining top-k influential nodes in mobile social networks [C] // Proceedings of the 16th ACMSIGKDD Conference on Knowledge Discovery and Data Mining, 2010: 1039-1048.

        [87] Tian JT, Wang YT, Feng XJ. A new hybrid algorithm for influence maximization in social networks [J]. Chinese Journal of Computers, 2011, 34(10): 1956-1965.

        [88] Zaman T, Fox EB, Bradlow ET. A bayesian approach for predicting the popularity of tweets [J]. Annals of Applied Statistics, 2014, 8(3): 1583-1611.

        [89] Guille A, Hacid H. A predictive model for the temporal dynamics of information diffusion in online social networks [C] // Proceedings of the 21st International Conference Companion on World Wide Web, 2012: 1145-1152.

        [90] Yang J, Leskovec J. Modeling information diffusion in implicit networks [C] // IEEE 10th International Conference on Data Mining (ICDM), 2010: 599-608.

        [91] Yang Z, Guo JY, Cai YY, et al. Understanding retweeting behaviors in social networks [C] // Proceedings of the 19th ACM Conference on Information and Knowledge Management (CIKM 2010), 2010: 1633-1636.

        [92] Yang J, Counts S. Predicting the speed, scale and range of information diffusion in Twitter [C] // Proceedings of the 4th International AAAI Conference on Weblogs and Social Media (ICWSM 2010), 2010: 355-358.

        [93] Suh B, Hong LC, Pirolli P, et al. Want to be retweeted? Large scale analytics on factors impacting tetweet in Twitter network [C] // IEEE Second International Conference on Social Computing, 2010: 177-184.

        [94] Hong LJ, Dan O, Davison BD. Predicting popular messages in Twitter [C] // Proceedings of the 20th International Conference Companion on World Wide Web,2011: 57-58.

        [95] Gupta M, Gao J, Zhai CX, et al. Predicting future popularity trend of events in microblogging platforms [C] // Proceedings of the American Society for Information Science and Technology,2012, 49(1): 1-10.

        [96] Peng HK, Zhu J, Piao DZ, et al. Retweet modeling using conditional random fields [C] // IEEE 11th International Conference on Data Mining Workshops, 2011: 336-343.

        [97] Luo WM, Liu JB, Liu J, et al. Propagation analysis of XSS worms in social network [J]. Computer Engineering, 2011, 37(10): 128-130.

        [98] Chu Z, Gianvecchio S, Wang HN, et al. Detecting automation of Twitter accounts: Are you a human, bot, or cyborg? [J]. IEEE Transactions on Dependable and Secure Computing, 2012, 9(6): 811-824.

        [99] Irani D, Webb S, Pu C. Study of static classification of social spam profiles in myspace [C] // ICWSM, 2010.

        [100] Yardi S, Romero D, Schoenebeck G, et al. Detecting spam in a Twitter network [OL]. http://firstmonday. org/ojs/index.php/fm/article/view/2793/2431.

        [101] Grier C, Thomas K, Paxson V, et al. @spam: the underground on 140 characters or less [C] // Proceedings of the 17th ACM conference on Computer and Communications Security, 2010: 27-37.

        [102] Thomas K, Grier C, Song D, et al. Suspended accounts in retrospect: An analysis of Twitter spam [C] // Proceedings of the 2011 ACM SIGCOMM Conference on Internet Measurement Conference, 2011: 243-258.

        [103] Webb S, Caverlee J, Pu C. Social honeypots: Making friends with a spammer near you [C] // CEAS, 2008.

        [104] Stringhini G, Kruegel C, Vigna G. Detecting spammers on social networks [C] // Proceedings of the 26th Annual Computer Security Applications Conference, 2010: 1-9.

        [105] Lee K, Caverlee J, Webb S. Uncovering social spammers: social honeypots+machine learning [C] // Proceedings of the 33rd International ACM SIGIR Conference on Research and Development in Information Retrieval, 2010: 435-442.

        [106] Wang D, Irani D, Pu C. A social-spam detection framework [C] // Proceedings of the 8th Annual Collaboration,Electronic Message,Anti-Abuse and Spam Conference, 2011: 46-54.

        [107] Moreno Y. Gómez JB, Pacheco AF. Instability of scale-free networks under node-breaking avalanches [J]. Europhysics Letters, 2002, 58(4): 630-636.

        [108] Motter AE, Nishikawa T, Lai YC. Cascade-based attacks on complex networks [J]. Physical Review E, 2002, 66 (6): 065102(R).

        [109] Holme P, Kim BJ. Attack vulnerability of complex networks [J]. Physical Review E, 2002, 65: 056109.

        [110] Moreno Y, Pastor-Satorras R, Vázquez A, et al. Critical load and congestion instabilities in scalefree networks [J]. Europhysics Letters, 2003, 62: 292-298.

        [111] Crucitti P, Latora V, Marchiori M. Model for cascading failures in complex networks [J]. Physical Review E, 2004, 69: 045104(R).

        [112] Watts DJ. A simple model of global cascades on random networks [J]. Proceedings of the National Academy of Sciences of the United States of America, 2002, 99(9): 5766-5771.

        [113] Bak P, Tang C, Wiesenfeld K. Self-organized criticality: An explanation of the 1/f noise [J]. Physical Review E, 1987, 59: 381-384.

        [114] Albert R, Jeong H , Barabási AL. Error and attack tolerance of complex networks [J]. Nature, 2000, 406(6794): 378-382.

        [115] Cohen R, Erez K, Ben-Avraham D, et al. Resilience of the Internet to random breakdowns [J]. Physical Review Letters, 2000, 85(21): 4626-4628.

        [116] Cohen R, ErezK , Ben-Avraham D. Breakdown of the Internet under intentional attack [J]. Physical Review Letters, 2001, 86(16): 3682-3685.

        [117] Holme P, Kim BJ, Yoon CN, et al. Attack vulnerability of complex networks [J]. Physical Review E, 2002, 65(5): 056109.

        [118] Zhao L, Park K, Lai YC. Attack vulnerability of scale-free networks due to cascading breakdown [J]. Physical Review E, 2004, 70(3): 035101.

        [119] Lai YC, Motter A, Nishikawa T, et al. Complex networks: Dynamics and security [J]. Pramana, 2005, 64(4): 483-502.

        [120]Wang JW,Rong LL.Cascade-based attackvulnerability on the US power grid [J]. Safety Science, 2009, 47(10): 1332-1336.

        [121] Bao ZJ, Cao YJ, Ding LJ, et al. Comparison of cascading failures in small world and scale-free networks subject to vertex and edge attacks [J]. Physica A, 2009, 388(20): 4491-4498.

        [122] Motter AE. Cascade control and defense in complex networks [J]. Physical Review Letters, 2004, 93(9): 098701.

        [123] Li P, Wang BH, Sun H, et al. A limited resource model of fault tolerant capability against cascading failure of complex network [J]. The European Physical Journal B, 2008, 62(1): 101-104.

        [124] Pinto PC, Thiran P, Vetterli M. Locating thesource of diffusion in large-scale networks [J]. Physical Review Letters, 2012, 109(6): 068702.

        [125] Shah D, Zaman T. Detecting sources of computer viruses in networks: Theory and experiment [C] // Proceedings of the ACM SIGMETRICS International Conference on Measurement and Modeling of Computer Systems, 2010: 203-214.

        [126] Shah D, Zaman T. Rumors in a network: Who’s the culprit? [J]. IEEE Transactions on Information Theory, 2011, 57(8): 5163-5181.

        [127] Zhu K, Ying L. Information source detection in the sir model: a sample path based approach [C] // Information Theory and Applications Workshop (ITA), 2013: 1-9.

        [128] Wang ZX, Dong WX, Zhang WY, et al. Rumor source detection with multiple observations: fundamental limits and algorithms [C] // The 2014 ACM International Conference on Measurement and Modeling of Computer Systems, 2014: 1-13.

        [129] Valente TW. Network interventions [J]. Science, 2012, 337(6090): 49-53.

        [130] Wang XF, Chen G. Pinning control of scale-free dynamical networks [J]. Physica A, 2002, 310: 521-531.

        [131] Li X, Wang XF, Chen G. Pinning a complex dynamical network to its equilibrium [J]. IEEE Transactions on Circuits and Systems-I: Regular Papers, 2004, 51(10): 2074-2087.

        [132] Liu YY, Slotine JJ, Barabási AL. Controllability of complex networks [J]. Nature, 2011, 473(7346): 167-173.

        [133] Wang WX, Ni X, Lai YC, et al. Optimizing controllability of complex networks by minimum structural perturbations [J]. Physical Review E, 2012, 85(2): 026115.

        [134] Nepusz T, Vicsek T. Controlling edge dynamics incomplex networks [J]. Nature Physics, 2012, 8(7): 568-573.

        [135] Yan G, Ren J, Lai YC, et al. Controlling complex networks: how much energy is needed? [J]. Physical Review Letters, 2012, 108(21): 218703.

        Review on Information Diffusion and Security of Social Networks

        BAO Yuanyuan1,2XUE Yibo1,2

        1(Research Institute of Information Technology,Tsinghua University,Beijing100084,China)
        2(Tsinghua National Laboratory for Information Science and Technology,Tsinghua University,Beijing100084,China)

        The explosive growth of social networks as convenient communication tools has played an increasingly important role in personal communications, marketing, political struggles, diplomacy and some other aspects. The popularity and huge influences attract much attention of the scholars into the social network research. Through statistics of the papers concerning social networks from the most famous international conferences and journals, we conclude the focuses of the social network research are information diffusion and securities. About the researches on information diffusion, there are four main questions including information diffusion model, factors, influence maximization and prediction. About the researches on security of social networks, there are two main questions including security of users and information. In security of users, spammer identification and cascading failures were discussed. The source identification and control strategy were included in security of information. The related papers of the conferences and journals were introduced and the main research results in the above aspects were stated. Then, the problems, challenges and trends of the information diffusion and securities, which will provide a meaningful guidance to the social network research, were obtained.

        social networks; information diffusion; source identification; social network control

        TP 393.4

        A

        2014-09-03

        :2015-01-07

        國(guó)家科技支撐計(jì)劃(2012BAH46B04)

        鮑媛媛,助理研究員,研究方向?yàn)樯缃痪W(wǎng)絡(luò);薛一波(通訊作者),研究員,研究方向?yàn)橛?jì)算機(jī)網(wǎng)絡(luò)、信息安全,E-mail:yiboxue@ tsinghua.edu.cn。

        猜你喜歡
        用戶信息模型
        一半模型
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
        訂閱信息
        中華手工(2017年2期)2017-06-06 23:00:31
        關(guān)注用戶
        商用汽車(2016年11期)2016-12-19 01:20:16
        3D打印中的模型分割與打包
        關(guān)注用戶
        商用汽車(2016年6期)2016-06-29 09:18:54
        關(guān)注用戶
        商用汽車(2016年4期)2016-05-09 01:23:12
        如何獲取一億海外用戶
        展會(huì)信息
        国产精品亚洲А∨天堂免下载| 久久精品人人做人人爱爱| 久久国产精品偷任你爽任你| 国产女女精品视频久热视频| 亚洲另在线日韩综合色| av免费观看在线网站| 日韩女优av一区二区| 欧美a级毛欧美1级a大片免费播放| 亚洲一区爱区精品无码| 国产精品爽爽VA吃奶在线观看| 亚洲综合视频一区二区| 香蕉免费一区二区三区| 久久天天躁夜夜躁狠狠躁2022| 无码人妻精品中文字幕免费| 久久91精品国产一区二区| 久久综合狠狠综合久久综合88| 最近中文字幕完整版| 亚洲一区精品中文字幕 | 日本中文字幕精品久久| 男人的天堂免费a级毛片无码| 日本55丰满熟妇厨房伦| 久久成人黄色免费网站| 在线精品首页中文字幕亚洲| 国产成人精品久久综合| 澳门精品无码一区二区三区 | 2019nv天堂香蕉在线观看| 色哟哟网站在线观看| 亚洲av日韩av一卡二卡| 国产丝袜一区丝袜高跟美腿| 国产精品视频一区二区三区不卡 | 少妇性l交大片免费快色| 久久精品网站免费观看| 国产99久久久久久免费看| 国产精品久久婷婷婷婷| 日本一区二区高清精品| 天天碰免费上传视频| 午夜无码大尺度福利视频| 丝袜美腿一区二区在线观看| 中文字幕国产精品一二三四五区| 亚洲精品午睡沙发系列| 免费一级欧美大片久久网|