吳日銘,韓益亮,郭凱陽,李永斌
(1.武警工程大學(xué) 密碼工程學(xué)院,陜西 西安 710086;2.中央軍委政法委員會,北京 100010)
近年來,隨著云計算、大數(shù)據(jù)、物聯(lián)網(wǎng)等技術(shù)的發(fā)展,互聯(lián)網(wǎng)中的數(shù)據(jù)迎來了爆炸式增長[1]。為幫助用戶從眾多信息中篩選感興趣的信息,提升用戶體驗,目前,電子商務(wù)、信息檢索、社交網(wǎng)絡(luò)、位置服務(wù)、新聞推送等領(lǐng)域均應(yīng)用了推薦機制[2]。信息的傳播方式已經(jīng)發(fā)生了變化?;谕扑]機制的網(wǎng)絡(luò)謠言擴散方式與經(jīng)典流行病模型的信息擴散方式有很大不同,信息傳播的速度不僅僅依賴于信息發(fā)布者傳統(tǒng)的社會網(wǎng)絡(luò)指標(biāo),更依賴于所發(fā)布信息的吸引力和所能推薦的人群區(qū)域人流密度。在這種新的信息傳播模式之下,一些涉及敏感議題、政治類不實謠言以及對我國大政方針政策的偏激言論在各個推薦平臺中迅速傳播和擴散,極大地危害了網(wǎng)絡(luò)空間中的良好生態(tài),甚至對社會穩(wěn)定造成不好的影響[3]。因此,對當(dāng)下這種新的謠言傳播方式進行研究具有一定的現(xiàn)實意義。
謠言傳播模型的研究始于20世紀60年代,由于謠言在人際關(guān)系網(wǎng)絡(luò)中的散布與病毒傳播、擴散很相似,因此謠言傳播模型很多都是在傳染病模型的基礎(chǔ)上建立起來的。Daley和Kendall全面分析了謠言與流行病的相似性,在20世紀60年代提出了DK模型[4];Maki等[5]后來修改了DK模型并提出了MK模型,其中謠言通過傳播者與其他人直接傳播。隨著復(fù)雜網(wǎng)絡(luò)模型的發(fā)展,有學(xué)者認為DK和MK模型不適合研究大范圍的社會網(wǎng)絡(luò)中的謠言傳播過程,網(wǎng)絡(luò)也并不都是封閉的均勻網(wǎng)絡(luò)[6]。Zanette等[7]首先將復(fù)雜網(wǎng)絡(luò)理論應(yīng)用于謠言傳播的研究,在小世界網(wǎng)絡(luò)上建立謠言傳播模型,得出一些包括謠言傳播臨界值在內(nèi)的結(jié)論;Nekovee等[8]通過將MK模型與SIR模型結(jié)合,進一步研究了一般復(fù)雜網(wǎng)絡(luò)的謠言傳播。在之后的研究中,許多學(xué)者從不同的角度豐富和發(fā)展了基于SIR模型的謠言傳播模型。Zan等[9]在經(jīng)典的SIR模型中加入新的反攻群C,建立了SICR謠言傳播模型;顧亦然等[10]根據(jù)有疾病潛伏期的傳染病模型,提出了謠言傳播SEIR模型;Zheng等[11]考慮社會加強效應(yīng),提出了CSR模型;薛一波[12]引入謠言正向感染和負向感染兩個感染狀態(tài),提出了謠言傳播的SPNR模型;張亞明等[13]構(gòu)建了具有興趣衰減效應(yīng)的ISCR謠言傳播模型;朱張祥等[14]將謠言受眾對象擴展為無知者、知曉者、信任者、傳播者、暫時免疫者、永久免疫者,同時考慮正向社會加強效應(yīng)建立模型;丁學(xué)君等[15]基于傳染病動力學(xué)及“反沉默螺旋”理論,構(gòu)建了考慮辟謠行為及網(wǎng)絡(luò)結(jié)構(gòu)的社交媒體謠言傳播模型;張金鑫等[16]考慮多個賬號發(fā)布謠言情況,提出SInQR網(wǎng)絡(luò)謠言傳播模型;Zhu等[17]考慮到監(jiān)管資源有限的情況,建立了考慮對謠言擴散的一些綜合影響因素的SIS謠言傳播模型;王佳佳等[18]考慮到謠言對恐慌情緒誘發(fā)的即時性,建立了謠言和恐慌情緒并行傳播的雙傳播模型并給出了平均場方程。到目前為止,對網(wǎng)絡(luò)信息的傳播建模大都是基于社會關(guān)系拓撲網(wǎng)絡(luò)。但是隨著自媒體的發(fā)展和信息量的快速增長,信息的傳播方式發(fā)生了變化。Goel等[19]人通過仿真比較了真實信息擴散的傳播模式和具有真實感染率的SIR模型。傳播模式的差異表明,廣泛使用的流行病模型不能再現(xiàn)真實的信息傳播。而基于信息推薦機制的謠言傳播建模依然是一個空白?;谇叭说难芯?,本文在參考SIR模型的基礎(chǔ)上,引入真實信息因素,提出一種基于推薦機制的謠言傳播仿真模型,并對謠言的傳播過程進行了仿真分析。
本文的工作主要有以下幾個方面:一是對推薦平臺下的網(wǎng)絡(luò)用戶對信息的接受影響因素進行了調(diào)查;二是考慮到推薦機制對人群的分割效應(yīng),將網(wǎng)絡(luò)用戶劃分在不同的信息傳播區(qū)域,定義了傳播區(qū)域中網(wǎng)絡(luò)用戶與信息的交互規(guī)則;三是對影響謠言傳播的各種因素進行了仿真分析。
隨著大眾媒體和移動終端的興起,網(wǎng)絡(luò)信息數(shù)量和傳播方式、速度發(fā)生了巨大的變化。目前,抖音、今日頭條等主流網(wǎng)絡(luò)平臺主要采用信息推薦的方式進行內(nèi)容推送。新聞推薦可以有效緩解新聞信息過載,幫助用戶在眾多信息中篩選出自己感興趣的信息。而當(dāng)平臺使用智能推薦算法時,容易產(chǎn)生“過濾氣泡”,形成“信息繭房”。在這樣的現(xiàn)實情形下,作為信息接收者與消費者的互聯(lián)網(wǎng)用戶會因瀏覽習(xí)慣、觀點喜好、自身興趣等因素之間的巨大差異而使得其在客戶端中被推送的話題、觀點具有明顯的標(biāo)簽和分類,因此,不考慮推薦機制對人群的分割效應(yīng),隨機選取個體進行動力學(xué)模型構(gòu)建是不符合實際情況的。
表1總結(jié)了幾種新聞推薦算法所依據(jù)的數(shù)據(jù)類型。
表1 推薦模式使用數(shù)據(jù)粒度情況表
如表1所示,目前的推薦算法有相當(dāng)一部分是依據(jù)新聞的標(biāo)題劃分的詞級進行推薦。因此,本文模型依據(jù)信息標(biāo)題將信息傳播劃分為不同的區(qū)域。每個信息傳播區(qū)域擁有不同的用戶密度。
本文模型作以下幾點基本假設(shè):
(1)根據(jù)推薦平臺的信息傳播模式,本文假設(shè)平臺對信息的識別度為0,即不知道信息的真假,對謠言信息和辟謠信息的推薦機制是一致的。
(2)根據(jù)推薦平臺用戶的行為,如忽視、點擊等,參考SIR模型對用戶狀態(tài)進行分類,本文將被推薦謠言信息但未點擊信息的用戶稱為不知情者U;將接觸到謠言信息但是沒有點擊的用戶稱為忽視者N;將接觸到謠言信息并且對信息點擊的用戶稱為謠言相信者B;對謠言信息忽略或者接觸到了官方辟謠信息的用戶稱為謠言免疫者或康復(fù)者R。
(3)在信息傳播過程中,信息熱度越高,得到平臺推薦的概率越高。本文使用謠言信息的點擊量Bt表示信息的熱度,hi表示各個傳播域的閾值,一旦Bt>hi時,信息即在該域中進行傳播。
(4)將域中的網(wǎng)絡(luò)用戶當(dāng)成獨立節(jié)點,域中的獨立節(jié)點只與域中環(huán)境發(fā)生交互,域中環(huán)境被用戶發(fā)布的信息所影響。一旦用戶發(fā)布的信息在域中出現(xiàn),即認為域中所有用戶都有被該信息影響的概率(即信息的接受率),該概率設(shè)為p。概率p受信息的固有價值p0的影響。
為了研究在信息推薦機制下網(wǎng)絡(luò)用戶對信息的接受程度,本文對嗶哩嗶哩平臺用戶對視頻的點擊影響因素進行了問卷調(diào)查。影響應(yīng)用界面信息點擊的因素主要有以下五個:信息的封面圖片、信息的標(biāo)題、信息的播放量、信息的評論量、信息的發(fā)布者。在收到的1 309份調(diào)查問卷中,對應(yīng)五個因素的投票情況如圖1所示。
圖1 點擊影響因素
如圖1所示,用戶對信息的點擊概率主要是由信息本身(封面圖片和標(biāo)題)所決定的,占到全部問卷的70%;而信息的熱度(播放量和評價量)只占到10%。因此,在本文模型中,假設(shè)針對某一信息,網(wǎng)絡(luò)用戶對信息的點擊概率只受信息本身影響。
考慮個體對信息接受程度的多樣性,在本模型中,設(shè)定網(wǎng)絡(luò)用戶對信息的接受率為:
其中,po為信息的固有價值;Ψ~N(0,σ),為表現(xiàn)用戶差異性而添加的噪聲。
在信息發(fā)布初期,信息在最主要的標(biāo)簽域中傳播,當(dāng)信息的熱度(點擊量)達到一定程度后,信息會進一步擴大傳播范圍,進入到其他的非主要詞條的標(biāo)簽域。信息達到更大熱度時,信息傳播達到高峰,此時,信息在全平臺進行傳播,平臺中的每一個用戶都有可能接收到該信息的推薦。傳播過程如圖2所示。
圖2 推薦機制下的信息傳播過程
根據(jù)上述的交互規(guī)則,本文設(shè)α為網(wǎng)絡(luò)域中用戶對謠言信息的接受概率,β為網(wǎng)絡(luò)域中用戶對謠言信息忽視概率,μ為辟謠信息的接受概率。謠言在傳播過程中,域中用戶U以概率α成為謠言相信者B,以概率β成為謠言信息的忽視者N,在加入辟謠信息后,謠言相信者又以概率μ成為康復(fù)者R,沒有接收到謠言信息的忽視者同樣以概率μ成為康復(fù)者R。傳播結(jié)構(gòu)如圖3所示。
圖3 謠言傳播結(jié)構(gòu)圖
由圖3可知,α+β=1,μ≤1。
設(shè)U(t)、B(t)、N(t)、R(t)為不知情者、謠言相信者、謠言忽視者和康復(fù)者在每個傳播域中的密度。在辟謠信息加入之前,它們之間滿足:U(t)+B(t)+N(t)=1。
模型的平均場方程為:
加入辟謠信息之后,它們之間滿足:U(t)+B(t)+N(t)+R(t)=1。
模型的平均場方程為:
本實驗總共設(shè)置六個傳播區(qū)域,各個區(qū)域內(nèi)網(wǎng)絡(luò)用戶數(shù)量為d(100,500,1 000,3 000,4 000,5 000),在整個平臺中設(shè)置網(wǎng)絡(luò)用戶為13 600個,區(qū)域中的網(wǎng)絡(luò)用戶按照每個時間單位1%的比例進入到傳播區(qū)域。隨著傳播的擴散,暴露在傳播區(qū)域中的人數(shù)越來越多。每個區(qū)域設(shè)定一個傳播閾值,當(dāng)信息熱度達到閾值時,域中用戶按前文說明的交互規(guī)則接受謠言信息或者辟謠信息。本次實驗主要目的是分析各種參數(shù)變化下謠言相信者和謠言免疫者在整個網(wǎng)絡(luò)中的變化情況。
本次實驗對各個域的傳播閾值設(shè)置為h(0,30,200,700,2 000,4 000),對信息接受率設(shè)定為p=0.4,對于網(wǎng)絡(luò)用戶的比例本文設(shè)定是用戶占全平臺中的比例,而不是在每一個域中的比例。
從圖4可以看出,信息傳播大約在t=250時達到峰值,且隨著時間的推移,在不加入官方辟謠信息的情況下,各類人員在平臺中的比例會保持不變。這是由推薦機制的特點決定的,信息的傳播不再是用戶與用戶之間的強社會關(guān)系,用戶只會與平臺推薦的信息發(fā)生交互。在這種信息傳播模式下,與文獻[20]中的傳染病模型不同,人員不會隨著時間的推移全部被感染,而是會在網(wǎng)絡(luò)中保持一定的比例。
圖4 p=0.4各類用戶隨時間變化情況
在本文模型中,信息的接受率代表信息對平臺用戶的吸引能力,接受率越大,代表著平臺中用戶對其進行點擊、閱讀的概率越大,即信息越能夠得到傳播。
本次實驗對各個域的傳播閾值與3.1節(jié)實驗保持不變,分別設(shè)置不同的信息接受率進行實驗。
如圖5所示,當(dāng)各個傳播域中的閾值保持不變時,信息的接受率越高,信息傳播的范圍越大。當(dāng)p=0.1或者p=0.3時,信息傳播在很短時間就已經(jīng)達到了最大,說明此類信息得到了很少的推薦,很快被平臺所淹沒。當(dāng)信息接受率p=0.1時,謠言相信者的比例在全平臺中的比例幾乎為0,說明信息只在最小的傳播域中傳播,而沒有再被推薦到其他傳播區(qū)域中,其傳播達到平穩(wěn)也是最快的。對比p=0.3和p=0.5可以發(fā)現(xiàn),即使信息的接受率已經(jīng)很接近了,但是傳播的范圍依然相差很大,說明信息接受率p=0.5的信息熱度已經(jīng)達到了比p=0.3的信息更廣的傳播區(qū)域,所以導(dǎo)致了信息傳播范圍的差別比較大。由此可以得出,信息能否得到推薦對信息的傳播范圍影響較大,為了阻止謠言的傳播,應(yīng)該在謠言信息被推薦到更廣的傳播區(qū)域時及時發(fā)布辟謠信息或者對謠言信息進行處理。
圖5 不同信息接受率下謠言相信者的比例
不同的信息發(fā)布者對于每個傳播域的閾值設(shè)置可能不一樣,在本實驗中,本文以基于用戶行為的推薦算法為例,信息發(fā)布者之前信息受到的點擊越多,該用戶發(fā)布的信息越容易受到推薦。說明其信息傳播域值會比冷門信息發(fā)布者的更低。本次實驗分別對傳播域閾值設(shè)置為3.1節(jié)中實驗傳播域閾值的0.5倍,并與3.1節(jié)實驗結(jié)果進行對比。
對比圖4和圖6可以看出,傳播區(qū)域閾值越小,越有利于信息的傳播。在同樣的傳播時間內(nèi),當(dāng)傳播域閾值保持為h(0,30,200,700,2 000,4 000)時,信息的傳播范圍僅僅為全平臺的12%左右,如圖4所示;當(dāng)把各個傳播域的閾值變成h(0,15,100,350,1 000,2 000)時,信息的傳播范圍在t=250時就已經(jīng)達到了70%,并且還在進一步擴大,如圖6所示。
圖6 傳播域閾值對比實驗
在本次實驗中,各個傳播區(qū)域網(wǎng)絡(luò)用戶和各個域的閾值設(shè)置保持不變,在謠言傳播時間t=100,t=200,t=300,t=400時加入官方辟謠信息,觀察在辟謠信息加入到信息域中謠言相信者數(shù)量的變化情況以及各個時間點加入辟謠信息對謠言傳播的影響。
如圖7所示,兩條曲線分別是在信息接受率p=0.5情況下,未加入辟謠信息和在t=100時加入辟謠信息情況下謠言相信者的數(shù)量變化情況。從圖中可以看出,在加入辟謠信息300個時間單位后,相信謠言的用戶開始減少。
圖7 辟謠信息加入對比
在時間大于1 000時,網(wǎng)絡(luò)平臺中相信謠言的用戶已經(jīng)保持比較低的狀態(tài)。而未加入辟謠信息的情況下,謠言相信者一直保持在較高的數(shù)量,如果不及時進行處置,極有可能發(fā)生二次傳播和謠言的進一步演化,導(dǎo)致輿情惡化。
接下來,本文對不同的信息接受率在t=100,t=200,t=300,t=400時加入辟謠信息進行仿真實驗,謠言相信者的數(shù)量變化情況如圖8所示。
從圖8可以看出,在t=100加入辟謠信息時,謠言相信者在平臺中的數(shù)量均保持在一個較低水平;而在t=200加入辟謠信息時,謠言接受率為p=0.7,p=0.6的謠言在整個平臺中相信謠言的數(shù)量已經(jīng)達到了一定的水平。在t=300,t=400加入辟謠信息時,平臺中謠言相信者的數(shù)量除了在p=0.1,p=0.2情況下之外,都達到了比較高的水平。通過實驗得知,對于不同的信息接受率的謠言信息,對辟謠信息要求的時間效應(yīng)是不一致的,謠言接受率越大的謠言,越需要更早加入辟謠信息,但總體說來都是越早加入辟謠信息越有利于阻止謠言的傳播。
圖8 不同的信息接受率在不同的時間加入辟謠信息傳播情況對比
通過對謠言的傳播進行仿真實驗發(fā)現(xiàn):(1)在網(wǎng)絡(luò)推薦平臺中,用戶接受信息的概率與以往傳統(tǒng)的基于強社會關(guān)系的模式有所不同,隨著個人移動終端的廣泛使用和針對性越來越強的推薦算法的出現(xiàn),人們能否接受網(wǎng)絡(luò)圖文中的信息主要依賴于信息推薦和信息本身的吸引力,而受其他用戶的影響則相對較少。(2)由于推薦機制對人的分割效應(yīng),在推薦平臺中,信息本身帶有的標(biāo)簽對信息的傳播極為重要。信息標(biāo)簽直接影響了信息傳播域中的用戶密度,進一步影響了信息的推薦和傳播。(3)針對不同接受率的謠言信息,對于辟謠信息的要求是不一樣的,接受率越高的謠言信息,則越需要更早地加入辟謠信息,才能更好地起到阻止謠言傳播的效果。
本文研究了在推薦平臺中,弱社會關(guān)系下網(wǎng)絡(luò)用戶對網(wǎng)絡(luò)信息接受概率的影響因素;根據(jù)信息推薦機制的特點,考慮到推薦機制對人群的分割效應(yīng),將網(wǎng)絡(luò)用戶劃分在不同的信息傳播區(qū)域,賦予了不同傳播區(qū)域的信息熱度閾值,并在此基礎(chǔ)上建立了考慮信息熱度和傳播閾值的謠言傳播模型。模型從新的角度研究了推薦平臺中謠言信息傳播的特點規(guī)律。最后對謠言的傳播過程進行了模擬,分析了模型的相關(guān)參數(shù)對謠言傳播的影響。本研究為網(wǎng)絡(luò)推薦平臺下的謠言傳播和網(wǎng)絡(luò)輿情治理提供了一定的參考。
但本文提出的基于推薦機制的謠言傳播模型仍存在一定的局限性,尚有以下工作需要進一步研究:(1)由于各個平臺具體使用的推薦算法還不明確,無法進一步確定推薦算法對人群的分割效應(yīng),以及獲得平臺推薦的信息的各項指標(biāo)和條件,在下一步的研究中可以針對具體的推薦算法和平臺進行更深一步的研究;(2)由于平臺數(shù)據(jù)的私密性及影響因素的復(fù)雜性,目前無法使用實際數(shù)據(jù)對模型進行驗證,但從模型的仿真結(jié)果來看,與人們的認知具有一致性,這也對網(wǎng)絡(luò)環(huán)境的治理提供了一個新的思路和方法;(3)針對網(wǎng)絡(luò)用戶對信息接受率的確定,本文使用的是相同的概率加上個人特點的噪聲,這與實際情況還存在一定的差距,在下一步的研究中,可以考慮用戶活躍程度等情況,對人群進行進一步細化。