陸 峰
(中國科學(xué)院軟件研究所 北京 100190) (中國電子信息產(chǎn)業(yè)發(fā)展研究院 北京 100846)
近年來,以微博、微信等代表的在線社交網(wǎng)絡(luò)快速發(fā)展,與經(jīng)濟社會活動日益融合,為人民生活提供了極大的便利,為企業(yè)生產(chǎn)注入了新的發(fā)展活力,對經(jīng)濟社會產(chǎn)生了巨大促進作用。技術(shù)是把雙刃劍,在線社交網(wǎng)絡(luò)普及應(yīng)用造福大眾生活、促進生產(chǎn)力發(fā)展、推動社會進步的同時,也成為了謠言等不法信息傳播的溫床,對人民生活、企業(yè)生產(chǎn)和社會穩(wěn)定都帶來了極大負(fù)面影響。微博、微信等在線社交網(wǎng)絡(luò)由于用戶規(guī)模龐大、消息即時傳播、社會動員能力強,已經(jīng)成為了國家治理的重要內(nèi)容,加強治理刻不容緩,為此許多學(xué)者都展開了研究[1]。如何高效地加強在線社交網(wǎng)絡(luò)治理,已經(jīng)成為促進國家治理體系和治理能力現(xiàn)代化的重要內(nèi)容之一。摸清在線社交網(wǎng)絡(luò)信息內(nèi)在傳播規(guī)律,把握其信息傳播特征,是有針對性高效地加強在線社交網(wǎng)絡(luò)治理的重要前提,本文對此展開了深入研究。
近年來,國內(nèi)外許多學(xué)者都對在線社交網(wǎng)絡(luò)展開了研究,提出了眾多消息傳播模型。目前大多數(shù)消息傳播模型都是源于經(jīng)典的SIS和SIR傳染病模型,比如早前的DK和MK謠言傳播模型[2-3]。王晨旭等研究了意見領(lǐng)袖對微博消息傳播的影響[4]。王輝等提出了基于記憶機制的CSR謠言傳播模型[5]。顧亦然等研究在線社交網(wǎng)絡(luò)中謠言消息的傳播和抑制問題[6]。Wang等多次研究了復(fù)雜網(wǎng)絡(luò)、同質(zhì)網(wǎng)絡(luò)、新媒體時代等多種情況下謠言傳播模型[7-10]。Ma等提出了積極和消極兩極社會狀態(tài)下的謠言傳播模型[11]。文獻[12]研究了謠言的傳播控制機制。王金龍等提出一種考慮用戶相對權(quán)重的謠言傳播模型[13]。文獻[14]提出了一種考慮網(wǎng)絡(luò)媒體的謠言傳播模型。曹玖新等提出了一種基于K-核的社會網(wǎng)絡(luò)影響最大化算法[15]。李國良等構(gòu)建了多個社交網(wǎng)絡(luò)情況下消息傳播模型[16]。王禎駿等考慮了社交內(nèi)容對消息傳播的影響[17]。Zhou等考慮了位置對社交網(wǎng)絡(luò)消息傳播最大的影響[18]。
然而上述大部分模型都基于均質(zhì)網(wǎng)絡(luò)假設(shè),且僅考慮網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)、網(wǎng)絡(luò)在線特性、節(jié)點拓?fù)洳町?、消息特性等其中單個因素對節(jié)點消息傳播的影響,沒有綜合考慮多種因素疊加影響。另外,有些模型簡單將節(jié)點固化為傳播者、潛伏者和免疫者等類型,存在一定的不科學(xué)性。社交網(wǎng)絡(luò)是綜合復(fù)雜網(wǎng)絡(luò),準(zhǔn)確分析社交網(wǎng)絡(luò)消息傳播特性,需要綜合考慮多種因素疊加效應(yīng)。
現(xiàn)實中,在線社交網(wǎng)絡(luò)是一張不規(guī)則、非均勻、無標(biāo)度動態(tài)網(wǎng)絡(luò),不同節(jié)點的連接度相差巨大,網(wǎng)絡(luò)中節(jié)點的度分布呈現(xiàn)冪分布現(xiàn)象,富者愈富。另外,不是所有節(jié)點都是實時在線的,非在線節(jié)點接收到的消息,由于消息時效性等因素,會影響節(jié)點上線后被轉(zhuǎn)發(fā)的概率?;谏鲜鲈?,用均質(zhì)、穩(wěn)態(tài)的在線網(wǎng)絡(luò)模擬謠言擴散存在一定局限性。
此外,經(jīng)典傳播模型簡單地將節(jié)點固化為傳播者、潛伏者、免疫者等存在一定不科學(xué)性。任何節(jié)點不會對所有消息都傳播,也不會對所有消息不傳播。特定節(jié)點針對所有消息不可能始終是傳播者、潛伏者或免疫者。一個節(jié)點是否會繼續(xù)傳播某個消息,是節(jié)點充分考慮節(jié)點自身特性、消息發(fā)送節(jié)點特定和消息本身特性等因素后作出的綜合判斷結(jié)果。
節(jié)點自身特性是指節(jié)點自身轉(zhuǎn)發(fā)消息的積極性,根據(jù)日常經(jīng)驗判斷,摒棄節(jié)點自身興趣愛好會影響消息傳播概率因素之外,僅從節(jié)點度數(shù)角度考慮,相對而言,度數(shù)越高的節(jié)點或越低的節(jié)點都不太愿意轉(zhuǎn)發(fā)別人的消息。
消息本身特性包括消息來源權(quán)威性、消息來源密集度,消息時效性等三個方面。相比而言,來自度數(shù)越高節(jié)點的消息,消息可信度越高,該消息則越容易被鄰居轉(zhuǎn)發(fā)。頻繁接收到來自不同鄰居節(jié)點相同的消息,該消息則越容易被接收節(jié)點相信,節(jié)點轉(zhuǎn)發(fā)率也就越高。消息時效性越強,則該消息越容易被轉(zhuǎn)發(fā);不在線節(jié)點接收到的緩存消息,等節(jié)點上線后該消息被轉(zhuǎn)發(fā)概率會大大降低。
基于上述原因,本文摒棄了之前已有研究將節(jié)點分為傳播者、潛伏者和免疫者等簡單固化分類,提出了在非均質(zhì)網(wǎng)絡(luò)中基于節(jié)點連接特性和消息特性的網(wǎng)絡(luò)謠言傳播模型,該模型構(gòu)建方法如下:
(1) 根據(jù)網(wǎng)絡(luò)節(jié)點連接度呈現(xiàn)冪分布特性[21],本文構(gòu)建網(wǎng)絡(luò)中節(jié)點連接度分布函數(shù)如下:
(2) 根據(jù)實際經(jīng)驗判斷,粉絲量越多和越少的節(jié)點都不容易轉(zhuǎn)發(fā)別人消息[1]?;诠?jié)點轉(zhuǎn)發(fā)消息積極性與自身度數(shù)呈現(xiàn)正態(tài)相關(guān)特性,本文構(gòu)建了節(jié)點自身轉(zhuǎn)發(fā)消息的積極性函數(shù)如下:
式中:y1表示節(jié)點從自己積極性單個因素考慮愿意轉(zhuǎn)發(fā)他人消息的概率,μ表示最愿意轉(zhuǎn)發(fā)其他節(jié)點消息的節(jié)點平均度數(shù),σ表示絕大部分愿意轉(zhuǎn)發(fā)消息的節(jié)點,其度數(shù)分布區(qū)間長度。根據(jù)正態(tài)分布規(guī)律,大部分節(jié)點度數(shù)x都落在該區(qū)間:μ-3σ (3) 消息可信度一定程度和轉(zhuǎn)發(fā)節(jié)點度有很大相關(guān)性。根據(jù)實際經(jīng)驗判斷,度數(shù)高的節(jié)點轉(zhuǎn)發(fā)的消息相對而言可信度越高,也越容易被鄰居節(jié)點轉(zhuǎn)發(fā)?;谏鲜?,本文構(gòu)建了基于消息可信度的消息轉(zhuǎn)發(fā)增強函數(shù)如下: y2=cplg(10+x) 式中:y2表示消息因消息來源可信度而被轉(zhuǎn)發(fā)增強的倍數(shù)。x表示消息發(fā)送方節(jié)點的連接度數(shù),cp表示因消息來源節(jié)點度數(shù)差異外界對消息認(rèn)可度的影響參數(shù),簡稱節(jié)點度數(shù)差異影響參數(shù)。 (4) 頻繁接收到來自不同鄰居節(jié)點相同消息,則接收節(jié)點越容易信任該消息,該消息被節(jié)點轉(zhuǎn)發(fā)的概率也就越高。基于上述,文本構(gòu)建了基于消息重復(fù)接收量的消息轉(zhuǎn)發(fā)增強函數(shù)如下: y3=rpln(e+z) 式中:y3表示因為消息重復(fù)接收而被轉(zhuǎn)發(fā)增強的倍數(shù),z表示相同消息被重復(fù)接收的次數(shù),rp表示因消息重復(fù)接收次數(shù)對消息轉(zhuǎn)發(fā)概率的影響參數(shù),簡稱消息重復(fù)接收差異影響參數(shù)。 (5) 借鑒文獻[19]傳播時間對消息的傳播影響,本文構(gòu)建了基于消息遲延的消息轉(zhuǎn)發(fā)概率函數(shù)如下: 式中:y4表示因為消息時效性對消息轉(zhuǎn)發(fā)概率降低比例,tp表示消息接收時延對消息轉(zhuǎn)發(fā)概率的影響參數(shù),簡稱消息時延差異影響參數(shù)。λ表示消息時延,實際仿真模式中,為了平滑消息時延對消息轉(zhuǎn)發(fā)概率影響,采用對數(shù)函數(shù)對物理消息時延參數(shù)T進行平滑處理,具體處理方式如下: λ=lg(1+T) (6) 綜合節(jié)點轉(zhuǎn)發(fā)消息的積極性、消息來源權(quán)威性、消息來源密集度,消息時效性等四個因素。最后,本文構(gòu)建了節(jié)點接收到謠言消息后,根據(jù)綜合決策,傳播轉(zhuǎn)發(fā)概率函數(shù)如下: Y=y1×y2×y3×y4 模擬環(huán)境搭建。本文在借鑒斯坦福大學(xué)網(wǎng)絡(luò)模擬器的基礎(chǔ)上[20],結(jié)合本文構(gòu)建的傳播模型,采用C#語言編程,構(gòu)建了一個規(guī)模8 000個節(jié)點、消息有向傳播的在線社交網(wǎng)絡(luò),其節(jié)點的度服從冪分布。該網(wǎng)絡(luò)模型節(jié)點度服從冪分布,主要是考慮了傳統(tǒng)模型節(jié)點度分布采用均勻分布,不能實際反映真實在線傳播網(wǎng)絡(luò)網(wǎng)絡(luò)特征。節(jié)點度采用冪分布,使得模擬環(huán)境更加契合真實在線傳播網(wǎng)絡(luò)特征。 網(wǎng)絡(luò)主要特征指標(biāo)如表1所示。 表1 仿真網(wǎng)絡(luò)主要特征指標(biāo) 從圖1可以看出仿真網(wǎng)絡(luò)中節(jié)點度分布近似滿足冪率關(guān)系,從表1可以看到仿真網(wǎng)絡(luò)擁有較短的平均路徑長度5.76,說明了仿真社交網(wǎng)絡(luò)較好地滿足了真實社交網(wǎng)絡(luò)無尺度和小世界特性[21]。 圖1 仿真網(wǎng)絡(luò)中節(jié)點連接度分布 用op表示網(wǎng)絡(luò)中節(jié)點平均在線概率,簡稱在線概率差異影響參數(shù)。np表示謠言消息包覆蓋網(wǎng)絡(luò)節(jié)點的比例。 定義:A1事件表示謠言從網(wǎng)絡(luò)中度數(shù)最大的節(jié)點首次向外傳播。A2表示表示謠言從網(wǎng)絡(luò)中度數(shù)最小的節(jié)點首次向外傳播。 本文模擬了A1和A2兩種事件情況下,在線概率差異影響參數(shù)op、節(jié)點度數(shù)差異影響參數(shù)cp、消息重復(fù)接收差異影響參數(shù)rp、消息時延差異影響參數(shù)tp等四個參數(shù)變化對謠言消息傳播擴散的影響,即謠言消息包不同傳播周期內(nèi)覆蓋網(wǎng)絡(luò)節(jié)點的比例np變化。 考慮到隨機事件對仿真結(jié)果存在一定隨機影響,為了讓仿真結(jié)果盡可能逼近真實情況,本文所有仿真試驗都模擬仿真10次,結(jié)果取10次仿真算術(shù)平均值。 (1) 仿真實驗一:比較A1和A2兩種事件情況下,在線概率差異影響參數(shù)op對謠言消息擴散的影響。op分別取20%、30%、40%,結(jié)果如圖2所示。其他參數(shù)設(shè)置如下:cp=1、rp=1、tp=1。 圖2 在線概率差異影響參數(shù)變化對謠言消息擴散影響 仿真結(jié)果顯示:相同事件情況下,網(wǎng)絡(luò)節(jié)點平均在線概率越高,謠言消息擴散越為迅速;在相同網(wǎng)絡(luò)節(jié)點在線概率情況下,謠言消息從度數(shù)大的節(jié)點開始傳播,要比度數(shù)小的節(jié)點開始傳播,擴散快得多。此仿真實驗說明,節(jié)點在線概率對謠言消息傳播擴散速度具有顯著影響。 對真實在線傳播網(wǎng)絡(luò)而言,仿真模擬情況反映了:針對相同謠言,在用戶在線概率越高(例如,對于微信朋友圈而言,根據(jù)官方統(tǒng)計,晚上9點是在線瀏覽的用戶數(shù)最高時候,凌晨3點是在線瀏覽的用戶數(shù)最低時候),謠言傳播快速越快;在線概率相同情況下,粉絲數(shù)量越多的用戶(例如:微博大V)傳播的謠言要比粉絲數(shù)量少的用戶(例如:普通網(wǎng)民)傳播的謠言擴散得快。 (2) 仿真實驗二:比較A1和A2兩種事件情況下,節(jié)點度數(shù)差異影響參數(shù)cp變化對謠言消息擴散的影響。cp分別取0.5、1、2,其他參數(shù)設(shè)置如下:op=30%、rp=1、tp=1。結(jié)果如圖3所示。 圖3 節(jié)點度數(shù)差異影響參數(shù)變化對謠言消息擴散影響 仿真結(jié)果顯示:相同事件情況下,網(wǎng)絡(luò)對節(jié)點對度數(shù)大的節(jié)點認(rèn)可度越高,謠言消息擴散越為迅速。在相同的節(jié)點度數(shù)影響外部節(jié)點信任情況下,謠言消息從度數(shù)大的節(jié)點開始傳播,要比度數(shù)小的節(jié)點開始傳播,擴散得快得多。此仿真實驗說明,大眾對網(wǎng)絡(luò)節(jié)點信任度高低,對謠言消息傳播擴散速度具有顯著影響。 對真實在線傳播網(wǎng)絡(luò)而言,仿真模擬情況反映了:社會知名度及公信力高的用戶傳播的謠言(例如:新聞媒體傳播未經(jīng)核實的新聞信息),要比社會知名度及公信力低的用戶傳播的謠言(例如:個人傳播未經(jīng)核實的信息),擴散得快得多;社會知名度及公信力相同的兩用戶,粉絲數(shù)量越多的用戶,其謠言傳播擴散能力越強。 (3) 仿真實驗三:比較A1和A2兩種事件情況下,消息重復(fù)接收差異影響參數(shù)rp對謠言消息擴散的影響。rp分別取0.5、1、2,其他參數(shù)設(shè)置如下:op=30%、cp=1、tp=1。結(jié)果如圖4所示。 圖4 消息重復(fù)接收差異影響參數(shù)變化對謠言消息擴散影響 仿真結(jié)果顯示:相同事件情況下,節(jié)點謠言消息重復(fù)接收度越高,謠言消息擴散越為迅速。在相同的消息重復(fù)接收影響節(jié)點信任情況下,謠言消息從度數(shù)大的節(jié)點開始傳播,要比度數(shù)小的節(jié)點開始傳播快得多。此仿真實驗說明,相同謠言消息渠道來源數(shù)量,對謠言消息傳播擴散速度具有顯著影響。 對真實在線傳播網(wǎng)絡(luò)而言,仿真模擬情況反映了:用戶接收到相同的謠言信息次數(shù)越多,越容易促成該用戶轉(zhuǎn)發(fā)該謠言,謠言傳播也就越快;謠言消息重復(fù)接收次數(shù)相同的兩個用戶,粉絲數(shù)量越多的用戶,其謠言傳播擴散能力越強。 (4) 仿真實驗四:比較A1和A2兩種事件情況下,消息時延差異影響參數(shù)tp對謠言擴散的影響。tp分別取0、1、2,其他參數(shù)設(shè)置如下:op=30%、cp=1、rp=1。結(jié)果如圖5所示。 圖5 消息時延差異影響參數(shù)對謠言消息擴散影響 仿真結(jié)果顯示:相同事件情況下,消息時延差異影響參數(shù)越高,謠言消息擴散越為迅速。在相同的消息時延差異影響參數(shù)情況下,謠言消息從度數(shù)大的節(jié)點開始傳播,要比度數(shù)小的節(jié)點開始傳播快得多。此仿真實驗說明,謠言消息時間敏感度,對謠言消息傳播擴散速度具有顯著影響。 對真實在線傳播網(wǎng)絡(luò)而言,仿真模擬情況反映了消息時延對謠言的傳播能力有很大影響,時延越長的謠言,其傳播能力越弱。接收到時延相同謠言的兩個用戶,粉絲數(shù)量越多的用戶,該謠言越可能被傳播。 另外從上述四個仿真實驗中可以看到,A1和A2兩種事件情況下,度數(shù)越高的節(jié)點造謠,謠言消息傳播擴散速度越快。仿真實驗說明,造謠者自身社會關(guān)注度,對謠言消息傳播擴散速度具有顯著影響。 從上面四組對比實驗中,可以清晰看到,造謠者的社會關(guān)注度、網(wǎng)絡(luò)節(jié)點在線概率、大眾對網(wǎng)絡(luò)節(jié)點信任度的高低、相同謠言消息渠道來源數(shù)量、謠言消息時間敏感度五個因素,對謠言消息傳播擴散速度具有顯著影響。因此,加強網(wǎng)絡(luò)空間謠言治理,需要綜合根據(jù)上述五個影響因素分類施策,才能起到更好的網(wǎng)絡(luò)謠言治理效果。3 實驗仿真
4 結(jié) 語