肖云鵬李松陽 劉宴兵
(重慶郵電大學(xué),網(wǎng)絡(luò)與信息安全技術(shù)重慶市工程實(shí)驗(yàn)室,重慶 400065)(2016年6月7日收到;2016年10月18日收到修改稿)
一種基于社交影響力和平均場理論的信息傳播動(dòng)力學(xué)模型?
肖云鵬?李松陽 劉宴兵
(重慶郵電大學(xué),網(wǎng)絡(luò)與信息安全技術(shù)重慶市工程實(shí)驗(yàn)室,重慶 400065)(2016年6月7日收到;2016年10月18日收到修改稿)
在線社會(huì)網(wǎng)絡(luò)中,信息傳播蘊(yùn)含著復(fù)雜的動(dòng)力學(xué)成因.本文將傳染病模型與社交影響力要素相結(jié)合,并針對(duì)影響力度量中主要研究靜態(tài)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)、忽略個(gè)體行為特征的問題,提出一種基于動(dòng)態(tài)節(jié)點(diǎn)行為和用戶影響力的信息傳播動(dòng)力學(xué)模型,旨在量化影響力強(qiáng)度,為研究信息擴(kuò)散過程中不同用戶群體狀態(tài)轉(zhuǎn)變提供理論依據(jù).首先,在網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)和用戶行為兩方面,提取個(gè)人記憶和用戶交互兩個(gè)表征,分析影響力形成的內(nèi)因和外因兩個(gè)動(dòng)力學(xué)成因,并基于多元線性回歸模型,提出一種度量用戶社會(huì)影響力的方法.其次,在傳統(tǒng)傳染病SIR(susceptible-infected-recovered)模型基礎(chǔ)上,結(jié)合信息擴(kuò)散與傳染病蔓延相似的傳播機(jī)理,綜合考慮信息傳播的多源并發(fā)性和雙向性,引入影響力因子,利用平均場理論改進(jìn)得到一種基于用戶影響力的信息傳播模型.實(shí)驗(yàn)表明,該模型能有效地解釋在線社會(huì)網(wǎng)絡(luò)中信息傳播的動(dòng)力學(xué)原因,感知社會(huì)網(wǎng)絡(luò)中信息傳播演化態(tài)勢.
信息傳播,傳播動(dòng)力學(xué),社交影響力,平均場理論
面向社會(huì)性網(wǎng)絡(luò)服務(wù)的在線社交網(wǎng)絡(luò)是Web2.0體系下的典型應(yīng)用,當(dāng)前關(guān)于在線社會(huì)網(wǎng)絡(luò)的研究包括網(wǎng)絡(luò)結(jié)構(gòu)[1]、群體互動(dòng)[2]、信息傳播[3,4]三個(gè)核心要素.在線社會(huì)網(wǎng)絡(luò)的蓬勃發(fā)展和線上用戶的急劇增長,使其迅速成為人們信息傳播、商品營銷、購物推薦、觀點(diǎn)表達(dá)、產(chǎn)生社會(huì)影響力的理想平臺(tái),研究社會(huì)網(wǎng)絡(luò)中的信息傳播動(dòng)力學(xué)成為熱門課題之一[5,6].鑒于信息收發(fā)方式多樣化、傳播效率核裂化、交互方式便捷化的特點(diǎn),有效控制輿情信息的準(zhǔn)確性、真實(shí)性和及時(shí)性對(duì)規(guī)范線上網(wǎng)絡(luò)信息起著至關(guān)重要的作用,也為相關(guān)部門加強(qiáng)社會(huì)輿情監(jiān)控和制定信息管控策略提供重要參考.
在線社會(huì)網(wǎng)絡(luò)的信息傳播問題研究,主要涉及研究信息傳播機(jī)理的解釋模型和信息擴(kuò)散規(guī)律的預(yù)測模型.解釋模型中,學(xué)者們大多從網(wǎng)絡(luò)結(jié)構(gòu)或自定義的信息傳播機(jī)理著手研究.例如,Borge-Holthoefer和Moreno[7]選擇不同核數(shù)的節(jié)點(diǎn)作為模型的出發(fā)點(diǎn),探索核數(shù)在信息傳播的作用.王超等[8]結(jié)合遏制機(jī)制和遺忘機(jī)制提出新的信息傳播模型.Lu等[9]研究了競爭性和合作性實(shí)體對(duì)信息傳播的影響.預(yù)測模型歸結(jié)起來可分為基于圖的線性閾值模型[10]和獨(dú)立級(jí)聯(lián)模型[11],基于非圖的傳染病模型[12]和博弈論模型[13].
傳染病模型是信息傳播領(lǐng)域較為成熟的模型[14].傳染病模型[15]認(rèn)為,當(dāng)信息已知者對(duì)某個(gè)消息未知者的傳播率大于某一臨界值時(shí),信息已知者會(huì)將信息傳播給該消息未知個(gè)體,這個(gè)過程會(huì)持續(xù)到整個(gè)網(wǎng)絡(luò)信息已知者處于某一穩(wěn)定的狀態(tài).SIR(susceptible-infected-recovered)模型在發(fā)展過程中出現(xiàn)了很多變種,例如,類似于SI模型的級(jí)聯(lián)模型[16]、考慮到重復(fù)感染的SIS模型[17]以及異構(gòu)網(wǎng)絡(luò)中的SIRS模型[18,19].Xiong等[20]提出一種基于轉(zhuǎn)發(fā)機(jī)制的SCIR模型,把網(wǎng)絡(luò)中的人群劃分為4類,即易感人群S(susceptible)、讀了信息但沒有傳播的人群C(contacted)、接收信息并繼續(xù)傳播的人群I(infected)和失去傳播信息興趣的人群R(refractory),該模型認(rèn)為I和R是信息傳播最終穩(wěn)定的狀態(tài).Li等[21]提出改進(jìn)的SIQRS模型研究無標(biāo)度網(wǎng)絡(luò)中的傳播動(dòng)力學(xué)模型,在模型中加入隔離人群Q(quarantined individuals),并認(rèn)為這些人在信息傳播中起關(guān)鍵作用.Xiong等[22]引入潛伏者的角色,提出了SILR(susceptible-infectedlatent-refractory)模型.由此可見,學(xué)者們集中考慮SIR模型狀態(tài)的劃分問題,少有量化導(dǎo)致狀態(tài)改變的感染率和免疫率的研究.
另一方面,影響力最大化問題[23,24]也是信息傳播領(lǐng)域的關(guān)鍵問題之一,其目的是通過提取異質(zhì)網(wǎng)絡(luò)中的多個(gè)特征,與影響用戶轉(zhuǎn)發(fā)、評(píng)論行為的因素結(jié)合,發(fā)現(xiàn)最大程度上影響網(wǎng)絡(luò)功能與信息傳播的節(jié)點(diǎn)集合[25,26].已有研究中,學(xué)者們大都是基于網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)[23,27,28]探討信息的傳播方式,而在線社會(huì)網(wǎng)絡(luò)用戶數(shù)量巨大,用戶之間形成的關(guān)系非常復(fù)雜,在這樣的環(huán)境下對(duì)社交影響力的定性分析受到很多因素的干擾和影響[29].盡管有不少學(xué)者試圖客觀準(zhǔn)確地理清影響力和其他因素之間的關(guān)系,使用了包括隨機(jī)化方法[30,31]、馬爾可夫鏈[32]、塊模型[33]在內(nèi)的多種技術(shù)手段,但最終難以很好地解決該問題.這種局面不僅與社交影響力的復(fù)雜構(gòu)成和信息傳播的不確定性有關(guān),也與影響力自身的定義密切相關(guān).
綜上可知,現(xiàn)有研究中普遍忽視了信息傳播中用戶相互影響的問題,本文從個(gè)體記憶維度和用戶交互維度兩個(gè)角度量化群體間的影響力,并認(rèn)為影響力因素是傳染病模型中狀態(tài)轉(zhuǎn)化的動(dòng)力學(xué)成因,利用平均場理論[34]對(duì)在線社會(huì)網(wǎng)絡(luò)傳播模式進(jìn)行分析研究.
本文的創(chuàng)新點(diǎn)可以總結(jié)為如下兩點(diǎn).
1)在影響強(qiáng)度計(jì)算上,與當(dāng)前研究工作中主要考慮網(wǎng)絡(luò)結(jié)構(gòu)不同,本文綜合考慮內(nèi)部因素即個(gè)體記憶維度及外部因素即用戶交互維度,提出一種基于多元線性回歸模型的用戶影響力計(jì)算和衡量方法.結(jié)合用戶自身屬性和個(gè)體行為習(xí)慣兩個(gè)維度分析個(gè)體記憶原理,利用圖論中的最短路徑法來度量社會(huì)網(wǎng)絡(luò)中用戶間信息交互經(jīng)過某條邊的流的總數(shù)來研究用戶交互原理.
2)在信息擴(kuò)散建模上,借鑒SIR模型機(jī)理,本文引入用戶影響力因子作為傳染病模型中狀態(tài)改變的參數(shù),運(yùn)用平均場理論建立微分方程組,并在此基礎(chǔ)上給出新的信息傳播動(dòng)力學(xué)模型和驗(yàn)證方法,有效避免了在模型中人為設(shè)定參數(shù)帶來的隨機(jī)性,揭示信息傳播中多因素耦合的本質(zhì)規(guī)律.
本文的組織結(jié)構(gòu)如下:第一部分闡述模型建立的背景及其基礎(chǔ)性工作;第二部分依據(jù)在線社會(huì)網(wǎng)絡(luò)信息關(guān)系網(wǎng)、信息傳播屬性、影響力形成的內(nèi)因和外因給出屬性的定義及問題的科學(xué)性描述;第三部分對(duì)信息模型進(jìn)行詳細(xì)描述,并給出相應(yīng)的學(xué)習(xí)算法和平均場方程;第四部分以真實(shí)的信息數(shù)據(jù)為背景,運(yùn)用研究思路對(duì)模型進(jìn)行仿真實(shí)驗(yàn),并與真實(shí)的自然規(guī)律進(jìn)行對(duì)比驗(yàn)證;第五部分對(duì)本文所做的相關(guān)工作進(jìn)行總結(jié).
2.1 相關(guān)知識(shí)
首先,設(shè)G={V,E}為信息傳播網(wǎng)絡(luò),其中V={v1,v2,...,vn}是社會(huì)網(wǎng)絡(luò)中單個(gè)信息互動(dòng)用戶集合,|V|=N,即用戶總數(shù),E?V×V為用戶間的朋友關(guān)系,若存在邊ei,j= 〈vi,vj〉,則用戶vj是用戶vi的粉絲,表示信息可沿邊ei,j由用戶vi傳向用戶vj.
然后,設(shè)A={(a,vi,t)}為不同時(shí)間段的用戶互動(dòng)數(shù)據(jù),其中{(a,vi,t)}表示用戶vi在t時(shí)間的動(dòng)作a,A是用戶群體Tk時(shí)間段的互動(dòng)行為.
接著,設(shè)個(gè)人記憶原理Inner和用戶交互原理Outer兩種度量用戶影響力的特征量,形式化表示群體事件擴(kuò)散中用戶行為動(dòng)力學(xué)的內(nèi)因和外因.
最后,設(shè)D(vi,t)為用戶vi在時(shí)刻t的狀態(tài).網(wǎng)絡(luò)中的用戶劃分為3類,每類個(gè)體集合都處于同一種狀態(tài),即D(vi,t)={S,I,R}∈κ,其中κ表示單個(gè)信息事件的傳播行為.每個(gè)用戶有三種可能的狀態(tài),分別為易感狀態(tài)S(susceptible),即消息未知者,有可能被感染;感染狀態(tài)I(infected),即消息已知者,具有傳染性;免疫狀態(tài)R(recovered),即消息免疫者,對(duì)消息失去了興趣.
2.2 特征提取與定義
在社會(huì)網(wǎng)絡(luò)中,信息傳播是個(gè)體、團(tuán)體之間的信息傳遞和交流.一個(gè)人發(fā)布的消息會(huì)被其好友看到,并以一定的概率分享、傳播.若好友對(duì)該信息內(nèi)容不感興趣,則成為消息免疫者且不會(huì)傳播.本文針對(duì)熱點(diǎn)話題傳播,挖掘影響用戶參與話題討論和轉(zhuǎn)發(fā)等行為的內(nèi)部、外部動(dòng)力驅(qū)動(dòng)因素,具體從個(gè)體記憶和用戶互動(dòng)兩個(gè)維度出發(fā),提取影響信息傳播表征.
1)個(gè)體記憶維度
在個(gè)體方面,我們認(rèn)為一個(gè)喜歡參與社會(huì)事件討論的人可能在今后的生活中依然喜歡參與,這種社交活動(dòng)中的活躍分子對(duì)群體事件具有記憶效應(yīng),這是由用戶自身因素決定的.在社會(huì)網(wǎng)絡(luò)中,用戶對(duì)一個(gè)群體事件的關(guān)注程度反映了信息的受歡迎程度,關(guān)注的人越多,證明人們對(duì)該事件越感興趣,信息擴(kuò)散的機(jī)會(huì)就越大.也就是說,研究用戶個(gè)人興趣在信息傳播領(lǐng)域具有不可或缺的作用.為了度量影響力的內(nèi)部成因,結(jié)合信息傳播網(wǎng)絡(luò)的靜態(tài)拓?fù)浣Y(jié)構(gòu),本文提取用戶內(nèi)部屬性列于表1.以下對(duì)所提取的內(nèi)部屬性做具體闡述.
定義1用戶度數(shù)Deg(vi)
用戶度數(shù)(degree)定義為與用戶vi相關(guān)聯(lián)的邊的數(shù)目.社會(huì)網(wǎng)絡(luò)是有向圖,若存在邊vi→vj,則用戶vj是用戶vi的關(guān)注者,關(guān)注者總和記作d+(vi);若存在邊vi←vk,則用戶vk是用戶vi的粉絲,粉絲總和記作d?(vi).顯然
定義2用戶介數(shù)Cb(vi)
用戶介數(shù)(between)定義為網(wǎng)絡(luò)最短路徑中經(jīng)過該節(jié)點(diǎn)(或邊)的概率之和,描述了節(jié)點(diǎn)在網(wǎng)絡(luò)中的影響力與中心性程度.假設(shè)節(jié)點(diǎn)p和節(jié)點(diǎn)q之間的最短路徑數(shù)為δpq條,這兩個(gè)節(jié)點(diǎn)之間經(jīng)過節(jié)點(diǎn)vi的最短路徑數(shù)為δpq(vi).在此基礎(chǔ)上,用戶vi的介數(shù)可定義為
定義3用戶緊密度Cc(vi)
用戶緊密度(closeness)定義為用戶vi與網(wǎng)絡(luò)中其他用戶的平均距離的長短,考察用戶vi傳播信息時(shí)不依靠其他用戶的程度.若社會(huì)網(wǎng)絡(luò)中有N個(gè)用戶,求用戶vi到其他所有用戶的最短距離,記作d(vi,vj),則用戶緊密度可定義為
表1 內(nèi)部屬性符號(hào)及描述Tab le 1.Symbols and descriptions of internal attribu te.
為了便于描述,本文統(tǒng)一用ψij來表示用戶vi影響力內(nèi)在驅(qū)動(dòng)因素,其中j=1,2,3分別代表上述3個(gè)靜態(tài)屬性.
2)用戶交互維度
現(xiàn)實(shí)世界中人們通過共同地域、相同活動(dòng)、親屬關(guān)系等形式構(gòu)建網(wǎng)絡(luò),在線社會(huì)網(wǎng)絡(luò)與現(xiàn)實(shí)世界不同,主要通過信息發(fā)布、共享、擴(kuò)散等信息交流的形式產(chǎn)生聯(lián)系.因此,在線社會(huì)網(wǎng)絡(luò)中信息是人們產(chǎn)生聯(lián)系的載體,用戶線上的交互行為在信息傳播影響力中扮演了重要角色.為了對(duì)影響力形成的外部動(dòng)態(tài)驅(qū)動(dòng)因素進(jìn)行定量分析,結(jié)合促進(jìn)信息傳播的用戶行為記錄,本文提取用戶間交互的屬性列于表2.
表2 外部屬性符號(hào)及描述Tab le 2. Symbols and descriptions of ex ternal attribute.
定義4內(nèi)容相似性S(vi)
內(nèi)容相似性(similarity)定義為用戶vi的個(gè)人興趣與話題標(biāo)簽的相似程度.從用戶自定義的標(biāo)簽和熱點(diǎn)話題中分別提取關(guān)鍵字,用Jaccard系數(shù)進(jìn)行歸一化計(jì)算.Jaccard系數(shù)越大,表明信息內(nèi)容和用戶個(gè)人興趣有較大的相關(guān)性,反之,相關(guān)性較小.令A(yù)為熱點(diǎn)話題內(nèi)容,B為用戶歷史行為數(shù)據(jù)的高頻詞匯,則內(nèi)容相似性為
定義5意見領(lǐng)袖L(vi)
意見領(lǐng)袖(leader)定義為對(duì)他人施加影響的活躍分子,在信息傳播中起到重要的中介或過濾作用.用PageRank算法[35]計(jì)算得到的PR值作為判定用戶vi是否為意見領(lǐng)袖的閾值,用φ作為可調(diào)參數(shù),意見領(lǐng)袖定義為
定義6活躍用戶A(vi)
A(vi)代表目標(biāo)用戶vi是否為活躍用戶(active user),1代表該用戶是活躍用戶,0代表該用戶不是活躍用戶.相比非活躍用戶,我們認(rèn)為活躍用戶對(duì)信息傳播所起的作用較大,活躍用戶定義為
其中,Active(vi)代表用戶vi的活躍指數(shù),τ為可調(diào)參數(shù).
其中,ρ ∈ [0,1]為 弱 化 系 數(shù),N[orig(vi)]和N[retw(vi)]分別是用戶vi在話題發(fā)起前一個(gè)月每日發(fā)表微博和轉(zhuǎn)發(fā)微博的數(shù)量.
定義7信息傳播帶動(dòng)力I(vi)
I(vi)指的是用戶vi發(fā)布信息后,該信息由于該用戶粉絲的瀏覽、評(píng)論、轉(zhuǎn)發(fā)等歷史行為在社會(huì)網(wǎng)絡(luò)中不斷擴(kuò)散,設(shè)η是弱化系數(shù),分別為用戶vi在所研究話題發(fā)起前一個(gè)月每條微博的平均閱讀數(shù)、平均評(píng)論數(shù)、平均轉(zhuǎn)發(fā)數(shù).綜合不同的用戶行為,量化該用戶的信息傳播帶動(dòng)力為
為了便于描述,本文統(tǒng)一用符號(hào)χij來表示用戶vi影響力外部驅(qū)動(dòng)因素,其中j=1,2,3,4代表上述4個(gè)動(dòng)態(tài)屬性.
2.3 問題形式化
本文構(gòu)建的模型旨在分析信息傳播中的用戶行為動(dòng)力學(xué)成因,挖掘用戶個(gè)人和用戶間的因素在信息傳播中所起的作用,如圖1所示,通過量化影響力強(qiáng)度進(jìn)一步分析用戶影響力對(duì)信息接收程度的影響,并利用平均場理論挖掘信息傳播態(tài)勢.其中,對(duì)于影響力的度量,考慮到線性回歸模型能綜合信息的多個(gè)特性,本文設(shè)計(jì)了一種基于線性回歸模型的影響力強(qiáng)度計(jì)算方法.
圖1 (網(wǎng)刊彩色)問題概述Fig.1.(color on line)Prob lemoverview.
在t時(shí)間段內(nèi),給定某個(gè)特定話題全網(wǎng)用戶群體關(guān)系網(wǎng)G(V,E)以及全網(wǎng)用戶的歷史行為數(shù)據(jù)A={(a,vi,t)},解決如下問題.
1)如何度量用戶影響力?本文模擬用戶行為動(dòng)力學(xué),結(jié)合影響力形成的內(nèi)部靜態(tài)要素finternal(vi)和外部動(dòng)態(tài)要素fexternal(vi),用多元線性回歸方法定量闡述用戶影響力Inf(vi).
2)如何感知信息傳播態(tài)勢?本文把影響力要素Inf(vi)與傳染病模型結(jié)合,為模型中感染率λ和恢復(fù)率μ提供理論依據(jù).本文通過二項(xiàng)分布計(jì)算得到的感染率和免疫率分別為θ(t),1?θ(t).接著,依托平均場理論建立動(dòng)力學(xué)微分方程組,計(jì)算不同時(shí)間步的用戶集合{St},{It},{Rt},模擬不同階段信息擴(kuò)散的大致情況.
3.1 模型框架
為了解決上述問題,構(gòu)建模型系統(tǒng)框架如圖2所示.首先,根據(jù)社會(huì)網(wǎng)絡(luò)中用戶個(gè)人屬性、個(gè)人行為習(xí)慣和信息交互記錄量化用戶影響力的內(nèi)因和外因,即訓(xùn)練出個(gè)人記憶維度和用戶交互維度.接著,計(jì)算處于同一狀態(tài)下的用戶群體相對(duì)于另一狀態(tài)用戶群體的影響力均值作為感染率λ和恢復(fù)率μ.最后,基于平均場理論,把λ和μ運(yùn)用到傳染病模型中,作為微分方程狀態(tài)轉(zhuǎn)移的參數(shù)依據(jù),模擬信息傳播趨勢,感知群體狀態(tài)演化.
圖2 模型框架Fig.2. Model framework.
3.2 模型細(xì)化
根據(jù)信息傳播網(wǎng)絡(luò)拓?fù)潢P(guān)系和用戶信息互動(dòng)行為提取兩種用戶影響力要素,即靜態(tài)內(nèi)部要素和動(dòng)態(tài)外部要素.形象表示如圖3,左邊為個(gè)人所處網(wǎng)絡(luò)靜態(tài)環(huán)境,右邊為基于擴(kuò)散信息動(dòng)作的網(wǎng)絡(luò).
圖3 社交影響力內(nèi)部和外部要素Fig.3. Internal and external factors of social in fluence.
我們認(rèn)為信息的傳播力不僅與用戶的自身網(wǎng)絡(luò)結(jié)構(gòu)屬性有關(guān),如用戶度數(shù)、用戶介數(shù)、用戶緊密性等,還與其外部行為屬性有關(guān),如信息內(nèi)容相似性、意見領(lǐng)袖、用戶是否為活躍用戶、信息傳播帶動(dòng)力.綜合內(nèi)因和外因,用戶vi的影響力函數(shù)為
這里的參數(shù)β0,β1,β2是偏回歸系數(shù),由多元線性回歸模型訓(xùn)練擬合得出,其中,β1,β2是測試個(gè)體內(nèi)因和外因的權(quán)值系數(shù),反映網(wǎng)絡(luò)結(jié)構(gòu)和信息交互情況在影響力構(gòu)成中的比重;finternal(vi)為用戶的內(nèi)部影響力,
其中,ψij表示用戶vi的靜態(tài)結(jié)構(gòu)屬性,可取度數(shù)、緊密度、介數(shù)等網(wǎng)絡(luò)結(jié)構(gòu)靜態(tài)屬性,mv∈aVx(ψ(v))為歸一化因子;fexternal(vi)為用戶的外部影響力,
由于信息話題影響力具有隨著時(shí)間推移而逐漸降低的事實(shí),因此,本文引入半衰期函數(shù)表示信息從發(fā)布到慢慢消亡的生命周期,其中,ti表示當(dāng)前時(shí)間,表示用戶vi上次行為時(shí)間,ω為正則化因子,本文中ω=1000;χij表示用戶vi的動(dòng)態(tài)行為屬性,可取內(nèi)容相似性、意見領(lǐng)袖、活躍度、信息傳播帶動(dòng)力等用戶交互屬性.
為了驗(yàn)證影響力對(duì)信息擴(kuò)散的作用,本文采用改進(jìn)的SIR模型模擬信息傳播的過程.SIR模型中的用戶群體有三種狀態(tài):易感染狀態(tài)S(susceptible),感染狀態(tài)I(infected)、免疫狀態(tài)R(recovered).不同用戶間的狀態(tài)轉(zhuǎn)移不僅依賴于用戶自身的狀態(tài),還與其鄰居用戶的狀態(tài)相關(guān).
這里要特別說明的是,該模型的建立基于以下3個(gè)假設(shè).
1)由于信息傳播具有爆發(fā)性、時(shí)長短的特點(diǎn),我們認(rèn)為在研究時(shí)間段內(nèi)用戶群體粉絲的增長和減少互相持平,故不考慮出生率和死亡率等種群因素.參與信息傳播的用戶總數(shù)始終保持一個(gè)常數(shù)N,所以S+I+R=1.
2)信息傳播為接觸性傳播,一個(gè)新用戶與信息已知者接觸就必然具有一定的傳染率.
3)假定用戶被傳播信息后,經(jīng)過一段時(shí)間(8 h)就會(huì)對(duì)該消息失去興趣,從而變成免疫者.經(jīng)過對(duì)以上數(shù)據(jù)的統(tǒng)計(jì),本文設(shè)定消息已知者變?yōu)橄⒚庖哒叩臅r(shí)間為8 h.
當(dāng)個(gè)體處于感染狀態(tài)時(shí),以λ的概率感染處于易感染狀態(tài)的鄰居個(gè)體,以μ的概率恢復(fù)為免疫狀態(tài).通過不同狀態(tài)間的變化,研究信息傳播機(jī)制,動(dòng)力學(xué)方程如下:
個(gè)體感染具有單向性,用戶接受信息的順序?yàn)槲锤腥緺顟B(tài)、感染狀態(tài)、免疫狀態(tài).因此,假設(shè)一個(gè)處于某個(gè)狀態(tài)的用戶vi有m個(gè)鄰居,則其中k個(gè)鄰居狀態(tài)發(fā)生改變的概率滿足二項(xiàng)分布,
則任一用戶在時(shí)刻t改變狀態(tài)的概率為
結(jié)合平均場方程式(12)得
針對(duì)在線社會(huì)網(wǎng)絡(luò)中信息傳播模式的特點(diǎn),結(jié)合傳染病動(dòng)力學(xué)原理,提出在線社會(huì)網(wǎng)絡(luò)中新的信息傳播擴(kuò)散模型.模型考慮不同關(guān)鍵用戶對(duì)信息傳播機(jī)理的影響力度,挖掘在信息傳播擴(kuò)散過程中各因素的地位,建立不同用戶節(jié)點(diǎn)的演化方程組,模擬信息傳播擴(kuò)散的過程,分析不同類型的用戶在網(wǎng)絡(luò)中的結(jié)構(gòu)特征以及影響信息傳播的主要因素.
3.3 模型算法
傳統(tǒng)的SIR模型的狀態(tài)轉(zhuǎn)變參數(shù)缺少理論依據(jù),人為設(shè)定的參數(shù)具有較大的隨機(jī)性,從而產(chǎn)生一定的誤差,導(dǎo)致預(yù)測值與當(dāng)前實(shí)際值差距較大的現(xiàn)象.針對(duì)以上局限性,進(jìn)行了一些改進(jìn),并以此為基礎(chǔ)結(jié)合在線社會(huì)網(wǎng)絡(luò)行為屬性,利用平均場理論的基本思想和方法,建立基于用戶影響力的SIR傳播模型.通過模型學(xué)習(xí)算法,獲取殘差值,并分析網(wǎng)絡(luò)靜態(tài)因素和交互動(dòng)態(tài)因素對(duì)用戶影響力的權(quán)重地位.總體來說,模型學(xué)習(xí)算法分為兩步:1)調(diào)節(jié)學(xué)習(xí)參數(shù),并根據(jù)平均場理論獲取不同時(shí)間段的信息擴(kuò)散情況;2)通過多元線性回歸算法,挖掘影響力動(dòng)力學(xué)成因.表3列出了本文所提出模型的算法實(shí)施過程.
表3 模型算法Tab le 3.Model algorithm.
模型學(xué)習(xí)算法首先是初始化不同狀態(tài)的用戶群,利用模型進(jìn)行首次估計(jì),得到初始狀態(tài)用戶的影響因子;然后利用多元線性回歸模型不斷調(diào)節(jié)參數(shù),重復(fù)獲取不同狀態(tài)節(jié)點(diǎn)的影響權(quán)重,將其作為用戶影響力的量化值,每個(gè)節(jié)點(diǎn)狀態(tài)改變的概率作為模型的傳染率和免疫率.本文根據(jù)每個(gè)信息的初始用戶群體數(shù)量,結(jié)合信息的生命周期特征,預(yù)測信息的變化趨勢.由于每次建立模型求解用到的原始數(shù)據(jù)都為話題數(shù)據(jù),保留了真實(shí)性.不斷調(diào)節(jié)學(xué)習(xí)參數(shù),對(duì)模型進(jìn)行修正,找到與實(shí)際最相符的狀態(tài)轉(zhuǎn)移概率,減小誤差,提高精確度.其中,多元線性回歸算法對(duì)影響力的度量與信息傳播SIR模型密切相關(guān),時(shí)間復(fù)雜度為Tinfluence=O(N),影響因子選擇階段的時(shí)間復(fù)雜度Tfactor=O(N),信息傳播模型執(zhí)行的時(shí)間復(fù)雜度Tmodel=1.因此,算法的時(shí)間復(fù)雜度T=Tinfluence+Tfactor~O(N).
4.1 數(shù)據(jù)描述
在人們的社交活動(dòng)中,很多時(shí)候信息是以話題的形式產(chǎn)生和傳播的.研究工作發(fā)現(xiàn),不同話題具有不同的影響力,即便是相同的話題在不同的人群中也不盡相同.所以,使用不同話題作為信息傳播的基本研究對(duì)象,能夠從多角度對(duì)用戶影響力進(jìn)行細(xì)致刻畫.本文基于騰訊微博真實(shí)數(shù)據(jù)進(jìn)行了實(shí)證驗(yàn)證,選取的熱點(diǎn)話題包括“馮小剛電影《私人定制》”(話題 A)、“爸爸去哪兒”(話題 B)、“熊貓女孩兒急需救助”(話題 C),針對(duì)這3個(gè)不同主題的群體事件對(duì)模型進(jìn)行實(shí)驗(yàn)驗(yàn)證.表4列出3個(gè)話題的統(tǒng)計(jì)數(shù)據(jù).
表4 話題數(shù)據(jù)統(tǒng)計(jì)Tab le 4.Statistics of topics.
本文利用真實(shí)信息傳播趨勢和模型估計(jì)值對(duì)信息傳播模型進(jìn)行校驗(yàn),真實(shí)走勢與模型估計(jì)值越接近,模型越優(yōu);利用殘差檢驗(yàn)方法對(duì)影響力度量進(jìn)行校驗(yàn),殘差序列越平穩(wěn),置信區(qū)間落在stats∈[?1,1]越多,則模型擬合越佳;利用線性回歸模型驗(yàn)證社交影響力形成的內(nèi)因和外因?qū)π畔鞑サ尿?qū)動(dòng)力大小;在模型的計(jì)算感染率和免疫率基礎(chǔ)上,預(yù)估信息傳播的最大感染峰值,為輿情傳播提供可控可管思路.
4.2 實(shí)驗(yàn)結(jié)果與討論
通過觀察上述社會(huì)網(wǎng)絡(luò)中的3個(gè)話題在整個(gè)生命周期中的演化趨勢,發(fā)現(xiàn)或多或少存在信息傳播的爆發(fā)期,結(jié)合用戶影響力,選定最活躍的時(shí)間段進(jìn)行本文信息傳播模型的驗(yàn)證.
本文把每2 h參與話題的人作為一個(gè)時(shí)間段分片,設(shè)定用戶轉(zhuǎn)發(fā)或評(píng)論話題的有效時(shí)間為24 h,如果超過24 h沒有重新參與話題,則認(rèn)為該用戶對(duì)該話題失去興趣.通過觀察,從話題發(fā)布算起,話題A的活躍區(qū)間為94—472 h,話題B的活躍區(qū)間為16—2730 h,話題 C的活躍區(qū)間為18—3598 h.圖4是3個(gè)話題不同時(shí)間段的實(shí)際參與信息傳播情況與模型估計(jì)值對(duì)比.
在圖4中,左邊一列圖4(a),(c),(e)依次為模型估計(jì)的話題A、話題B、話題C的信息未知者、信息已知者、信息免疫者的比例.網(wǎng)絡(luò)總數(shù)為最終傳播信息的人群及其所有會(huì)接受到該信息的粉絲.初始免疫者為網(wǎng)絡(luò)中內(nèi)因和外因值均為0的用戶群,即先剔除網(wǎng)絡(luò)中尤其不活躍的用戶;初始信息已知者為兩個(gè)時(shí)間片內(nèi)知道該信息的用戶;網(wǎng)絡(luò)中剩下的用戶群為信息未知者.從實(shí)驗(yàn)圖中可看出,在信息傳播過程中,信息未知者密度不斷較少,信息免疫者密度持續(xù)增大,信息已知者先增大后減小,總有一個(gè)時(shí)間段信息已知者會(huì)達(dá)到峰值,稱為信息爆發(fā)期;隨著時(shí)間的推移,三種狀態(tài)會(huì)之間趨于穩(wěn)定,即信息處于消亡期,驗(yàn)證了信息已知者會(huì)逐漸演變?yōu)樾畔⒚庖哒?網(wǎng)絡(luò)中最終用戶群的狀態(tài)為信息未知者和消息免疫者兩種人群.右邊一列圖4(b),(d),(f)為活躍時(shí)期真實(shí)的消息已知者和模型估計(jì)值對(duì)比,從圖中大致觀察到本文所建模型的精確度與真實(shí)信息傳播趨勢較為接近.
圖4 (網(wǎng)刊彩色)真實(shí)情況和模型結(jié)果對(duì)比 (a)話題A的SIR估計(jì)比例;(b)話題A的真實(shí)感染人群和模型估計(jì)值,總?cè)藬?shù)N=216792;(c)話題B的SIR估計(jì)比例;(d)話題B的真實(shí)感染人群和模型估計(jì)值,總?cè)藬?shù)N=38188;(e)話題C的SIR估計(jì)比例;(f)話題C的真實(shí)感染人群和模型估計(jì)值,總?cè)藬?shù)N=39197Fig.4.(color on line)Contrast between real situation and model resu lts contrast:(a)SIR estimated proportion of topic A;(b)contrast between real in fected people and model estimation of topic A,N=216792;(c)SIR estimated proportion of topic B;(d)contrast between real in fected people and model estimation of topic B,N=38188;(e)SIR estimated proportion of topic C;(f)contrast between real in fected people and model estimation of topic C,N=39197.
本文選定初始信息已知者作為研究對(duì)象,運(yùn)用多元線性回歸模型驗(yàn)證影響力內(nèi)因和外因的擬合程度.通過殘差衡量標(biāo)準(zhǔn),獲得如圖5所示的信息殘差序列圖,橫坐標(biāo)為不同用戶的編號(hào),縱坐標(biāo)為殘差值.
圖5 (網(wǎng)刊彩色)殘差序列圖 (a)話題 A;(b)話題B;(c)話題 CFig.5.(color on line)Residual plot:(a)Topic A;(b)topic B;(c)topic C.
通過圖5可以觀察到,殘差序列整體上較平穩(wěn),基本上都落在[?1,1]的區(qū)間,說明觀察值和估計(jì)值之差較小,預(yù)估方程符合客觀事實(shí),即內(nèi)部靜態(tài)因素和外部動(dòng)態(tài)因素在群體影響力的度量上有一定的相關(guān)性.
為了衡量不同靜態(tài)內(nèi)部屬性對(duì)用戶內(nèi)部影響力的影響,本文分別選取度數(shù)、介數(shù)、緊密度兩兩組合進(jìn)行實(shí)驗(yàn),得出不同指標(biāo)與信息已知群體的關(guān)系如圖6所示.橫坐標(biāo)表示時(shí)間序列,縱坐標(biāo)表示消息已知者累積值.
圖6 (網(wǎng)刊彩色)用戶內(nèi)部因素影響變化趨勢 (a)話題A內(nèi)因影響量化圖;(b)話題B內(nèi)因影響量化圖;(c)話題C內(nèi)因影響量化圖Fig.6.(color on line)Trends of user internal in fl uence:(a)Internal factors quantization of topic A;(b)internal factors quantization of topic B;(c)internal factors quantization of topic C.
如圖6(a)所示,當(dāng)除去網(wǎng)絡(luò)中的度數(shù)影響時(shí),信息擴(kuò)散峰值普遍增加,尤其是對(duì)話題A的影響較為明顯.經(jīng)計(jì)算對(duì)比,在初始傳播節(jié)點(diǎn)中,話題A的平均度數(shù)為1069.14,話題B的平均度數(shù)為877.3,話題C的平均度數(shù)為956.31.由此可見,信息在初始傳播節(jié)點(diǎn)平均度數(shù)大的網(wǎng)絡(luò)中傳播較廣,這與現(xiàn)實(shí)是相符的,往往朋友多的人比朋友少的人更容易成為意見領(lǐng)袖,促進(jìn)信息的傳播.如圖6(b)所示,當(dāng)除去網(wǎng)絡(luò)中介數(shù)的影響時(shí),信息擴(kuò)散受到較大影響,甚至難以擴(kuò)散.這是因?yàn)榻閿?shù)是用來評(píng)價(jià)節(jié)點(diǎn)的流量承載能力的指標(biāo),常用來衡量網(wǎng)絡(luò)中某一用戶向所有用戶之間傳遞信息的重要程度.若除去重要的節(jié)點(diǎn),將影響其周圍眾多節(jié)點(diǎn)接收信息.如圖6(c)所示,當(dāng)除去網(wǎng)絡(luò)緊密度時(shí),信息受眾最大峰值將會(huì)下降.這是由于網(wǎng)絡(luò)緊密度反映給定節(jié)點(diǎn)到其他節(jié)點(diǎn)中可達(dá)程度,若網(wǎng)絡(luò)不緊密,信息傳播會(huì)受到限制.
為了進(jìn)一步分析內(nèi)因和外因?qū)π畔鞑サ挠绊?本文采用時(shí)間分片的方法,截取信息擴(kuò)散活躍階段進(jìn)行研究,嘗試將社交影響力的內(nèi)因和外因認(rèn)同度量化.如圖7所示,橫坐標(biāo)為活躍時(shí)間段(每2 h為一個(gè)時(shí)間片),縱坐標(biāo)為信息擴(kuò)散的驅(qū)動(dòng)因子認(rèn)同度.
通過以話題A、話題B、話題C為例的實(shí)驗(yàn)發(fā)現(xiàn),在線社會(huì)網(wǎng)絡(luò)信息傳播的驅(qū)動(dòng)因子在不同時(shí)間段會(huì)動(dòng)態(tài)變化,但整體波動(dòng)不大.即便靜態(tài)因素和動(dòng)態(tài)因素均存在一定的差異,但就總體而言,在整個(gè)信息傳播過程中,外因的作用力比內(nèi)因的作用力大.在信息傳播后期,內(nèi)因的量化值基本上為0,即內(nèi)因所起作用不大.這種情況與現(xiàn)實(shí)社會(huì)是相符的,人們?cè)谏缃痪W(wǎng)絡(luò)中不是獨(dú)立的個(gè)體,人與人之間的信息互動(dòng)交流是促進(jìn)其傳播最直接的成因,而不僅僅是依靠網(wǎng)絡(luò)的靜態(tài)結(jié)構(gòu).也就是說,針對(duì)信息傳播和話題演化,個(gè)體記憶并不占據(jù)優(yōu)勢地位,相反卻是用戶交互在信息傳播的生命周期起主導(dǎo)作用.
接下來,在前面構(gòu)建的信息傳播模型的基礎(chǔ)上,分別固定平均場方程中的感染率和免疫率,分析三類信息的傳播廣度.如圖8所示,從上述三類信息中計(jì)算得到的信息傳播影響力出發(fā),取δ=0.05的步長,在(0,1)范圍內(nèi)分析信息傳播過程中的最大覆蓋范圍.
圖7 (網(wǎng)刊彩色)信息傳播驅(qū)動(dòng)因子的變化趨勢 (a)話題A驅(qū)動(dòng)因子量化圖;(b)話題B驅(qū)動(dòng)因子量化圖;(c)話題C驅(qū)動(dòng)因子量化圖Fig.7.(color on line)Trends of information dissemination d riving factors:(a)D riving factors quantization of topic A;(b)d riving factors quantization of topic B;(c)d riving factors quantization of topic C.
從圖8的實(shí)驗(yàn)結(jié)果可以發(fā)現(xiàn),最大感染峰值MIP(max infected peak)在三類信息中明顯地表現(xiàn)為隨著感染率的增大而上升,隨著免疫率的減小而下降.最大感染峰值的變化表明用戶單位時(shí)間內(nèi)信息的傳播力度是有差異的.顯然,MIP值越大,表明單位時(shí)間內(nèi)信息擴(kuò)散的速度越快.MIP作為衡量用戶傳播信息速度和信息覆蓋程度的指標(biāo),很大程度上受感染率和免疫率的直接影響.如果感染率很大,信息很快就會(huì)擴(kuò)散,一旦控制不當(dāng),甚至能影響整個(gè)網(wǎng)絡(luò);如果免疫率很小,信息也會(huì)傳播得很快,并且覆蓋整個(gè)網(wǎng)絡(luò).特別地,如果感染率控制在較小的范圍,免疫率控制在較大的范圍,信息就能較好地維持在初始感染水平,知道信息的用戶不會(huì)爆發(fā)式增長.所以,相關(guān)部門可以從信息感染率和免疫率兩方面著手,對(duì)網(wǎng)絡(luò)輿情進(jìn)行有效管控.
圖8 (網(wǎng)刊彩色)感染人數(shù)峰值 (a)感染峰值隨θ(t)的變化情況:topic A,1?θ(t)=0.301;topic B,1?θ(t)=0.266;topic C,1?θ(t)=0.126;(b)感染峰值隨1?θ(t)變化情況:topic A,θ(t)=0.699;topic B,θ(t)=0.734;topic C,θ(t)=0.874Fig.8.(color on line)Peak of in fected people:(a)Peak change with θ(t),topic A,1? θ(t)=0.301;topic B,1? θ(t)=0.266;topic C,1? θ(t)=0.126;(b)peak change with 1? θ(t),topic A,θ(t)=0.699;topic B,θ(t)=0.734;topic C,θ(t)=0.874.
通過分析人們相互之間的影響模式和信息傳播方式,既能夠從社會(huì)學(xué)角度加深理解人們的社會(huì)行為,為公共決策和輿情導(dǎo)向等提供理論依據(jù),同時(shí)還能促進(jìn)政治、經(jīng)濟(jì)和文化活動(dòng)等多個(gè)領(lǐng)域的交流和傳播,具有重要的社會(huì)意義和應(yīng)用價(jià)值.考慮到在線社交影響力及其傳播過程受諸多因素制約,而且不同因素之間往往相互影響,本文對(duì)具有特定屬性的用戶深入探討并對(duì)用戶與信息之間的交互行為進(jìn)行分析和度量.在此基礎(chǔ)上,本文采用改進(jìn)的SIR模型作為信息傳播模型,將用戶群體劃分為信息未知者、信息已知者、信息免疫者三種狀態(tài),并把量化后的影響力作為狀態(tài)轉(zhuǎn)移參數(shù)的理論支撐.研究表明,本文優(yōu)化的模型可以從更為宏觀的層面上理解社交影響力的作用原理和信息傳播機(jī)制,解釋信息傳播的內(nèi)部和外部動(dòng)力學(xué)成因,探知挖掘人類的行為特征和行為規(guī)律,促進(jìn)該領(lǐng)域知識(shí)的進(jìn)步和發(fā)展,為社會(huì)感知信息傳播態(tài)勢和制定信息傳播管控策略提供理論依據(jù).
[1]CaiM,Du HF,Feldman MW 2014Acta Phys.Sin.63 060504(in Chinese)[蔡萌,杜海峰,Feldman MW 2014物理學(xué)報(bào)63 060504]
[2]Zhou B,He Z,Jiang L L,W ang N X,W ang BH2014Sci.Rep.4 7577
[3]Huang J,Li C,W ang W Q,Shen HW,Li G,Cheng X Q 2014Sci.Rep.4 5334
[4]Zheng M,LüL,ZhaoM2013Phys.Rev.E88 012818
[5]Chen D B,Huang S,Shang MS 2011Comput.Sci.38 118(in Chinese)[陳端兵,黃晟,尚明生 2011計(jì)算機(jī)科學(xué)38 118]
[6]Chen D B,GaoH2012Chin.Phys.Lett.29 048901
[7]Borge-Holthoefer J,MorenoY 2012Phys.Rev.E85 026116
[8]W ang C,Liu C Y,Hu Y P,Liu Z H,Ma J F 2014Acta Phys.Sin.63 180501(in Chinese)[王超,劉騁遠(yuǎn),胡遠(yuǎn)萍,劉志宏,馬建峰2014物理學(xué)報(bào)63 180501]
[9]Lu W,Chen W,Lakshmanan L V S 2015Proceedings of the VLDBEndowmentHawaii,USA,August 31–September 4,2015 p60
[10]Elias Boutros K,Dilkina B,Song L 2014Proceedings of the 20th ACMSIGKDD In ternationa l Conference on Knowledge D iscovery and Data MiningNewYork,USA,August 24–27,2014 p1226
[11]Singer Y 2012Proceedings of the Fifth ACMIn ternational Conference on Web Search and Data MiningW ashington,USA,Feb ruary 8–12,2012 p733
[12]Liu JG,Lin JH,GuoQ,Zhou T2016Sci.Rep.6 21380
[13]Montanari A,Saberi A2010Proc.Natl.Acad.Sci.107 20196
[14]Yuan X P,Xue Y K,Liu MX 2013Chin.Phys.B22 030207
[15]Pastor-Satorras R,CastellanoC,van Mieghe P,Vespignani A2015Rev.Mod.Phys.87 925
[16]Kempe D,Jon K,éva T2003Proceedings of the N in th ACMSIGKDD International Conference on Knowledge D iscovery and Data MiningW ashington,USA,August 24–27,2003 p137
[17]Liu Q M,Deng C S,Sun MC 2014Physica A410 79
[18]Li C H,Tsai C C,Yang S Y 2014Commun.Non linear Sci.19 1042
[19]Chen L,Sun J 2014Physica A410 196
[20]X iong F,Liu Y,Zhang Z J,Zhu J,Zhang Y 2012Phys.Lett.A376 2103
[21]Li T,W ang Y,Guan Z H2014Commun.Non linear Sci.19 686
[22]X iong F,W ang X M,Cheng J J 2016Chin.Phys.B25 108904
[23]Kitsak M,Gallos L K,Hav lin S,Liljeros F,Muchnik L,Stan ley HE,Makse HA2010Nat.Phys.6 888
[24]Hu Q C,Zhang Y,Xu X H,Xing C X,Chen C,Chen X H2015Acta Phys.Sin.64 190101(in Chinese)[胡慶成,張勇,許信輝,邢春曉,陳池,陳信歡2015物理學(xué)報(bào)64 190101]
[25]LüL Y,Chen D B,Ren X L,Zhang Q M,Zhang Y C,Zhou T2016Phys.Rep.650 1
[26]W u Y,Yang Y,Jiang F,Jin S,Xu J 2014Physica A416 467
[27]Liben-Nowell D,Kleinberg J 2008Proc.Natl.Acad.Sci.105 4633
[28]LüL Y,Zhou T,Zhang Q M,Stan ley HE 2016Nat.Commun.7 10168
[29]Myers S A,Zhu C,Leskovec J 2012Proceedings of the 18th ACMSIGKDD In ternational Conference on Knowledge Discovery and Data MiningBeijing,China,August 12–16,2012 p33
[30]Aral S,W alker D 2012Science337 337
[31]La Fond T,Neville J 2010Proceedings of the 19th In ternational Conference on World W ide WebRaleigh,USA,April 26–30,2010 p601
[32]Li P,Zhang J,Xu X K,Small M2012Chin.Phys.Lett.29 048903
[33]Newman,ME J 2012Nat.Phys.8 25
[34]Barabási AL,Albert R,Jeong H1999Physica A272 173
[35]Ped roche F,MorenoF,González A,Valencia A2013Math.Comput.Model57 1891
PACS:05.10.–a,89.75.FbDOI:10.7498/aps.66.030501
An in formation d iff usion dynamic model based on social in fl uence and mean-fi eld theory?
XiaoYun-Peng?Li Song-Yang Liu Yan-Bing
(Chongqing Engineering Laboratory of Internet and Information Security,Chongqing University of Posts and Telecommunications,Chongqing 400065,China)(Received 7 June 2016;revised manuscript received 18 October 2016)
W ith the development of on line socialnetworks,they rapid ly become an ideal platformfor in formation about social information diff usion,commodity marketing,shopping recommendation,opinion expression and social consensus.The social network in formation propagation has become a research hotspot correspondingly.Meanwhile,in formation diff usion contains complex dynamic genesis in on line social networks.In viewof the diversity of in formation transmission,the effi ciency of propagation and the convenience of interaction,it is very important toregu late the accuracy,strengthen the public opinion monitoring and formulating the information control strategy.
The purpose of this study is toquantify the intensity of the infl uence,especially provides a theoretical basis for studying the state transition of diff erent user groups in the evolution process.As existing epidemic model paid less attention toinfluence factors and previous research about in fluence calculation mainly focused on static network topology but ignored individual behavior characteristics,we propose an in formation diff usion dynamicsmodel based on dynamic user behaviors and infl uence.Firstly,according tothe multiple linear regression model,we put forward a method toanalyze internal and external factors for influence formation fromtwoaspects:personalmemory and user interaction.Second ly,for a similar propagationmechanismof information diff usion and epidemics spreading,in this paper we present an improved SIR model based on mean-field theory by introducing influence factor.
The contribution of this paper can be summarized as follows.1)For the infl uence quantification,diff erent fromthe current research work that mainly focuses on network structure,we integrate the internal factors and external factors,and propose a user influence evaluation method based on themu ltiple linear regression model.The individualmemory principle is analyzed by combining user attributes and individual behavior.User interaction is alsostudied by using the shortest path method in graph theory.2)On modeling the in formation diff usion,by referring SIR model,we introduce the user infl uence factor as the parameter of the state change intothe epidemic model.Themean-field theory is used toestablish the diff erential equations.Subsequently,the novel information diff usion dynamicsmodel and verification method are proposed.The method avoids the randomness of the artificial setting parameters within the model,and reveals the nature ofmulti-factors coupling in the information transmission.
Experimental resu lts showthat the optimized model can comprehend the principle and information diff usion mechanismof social infl uence froma more macroscopic level.The study can not on ly explain the internal and external dynamics genesis of information diff usion,but alsoexplore the behavioral characteristics and behavior laws of human.In addition,we try toprovide theoretical basis for situation awareness and control strategy of social information diff usion.
information dissemination,diffusion dynamics,individual influence,mean-field theory
10.7498/aps.66.030501
?國家重點(diǎn)基礎(chǔ)研究發(fā)展計(jì)劃(批準(zhǔn)號(hào):2013CB329606)、國家自然科學(xué)基金(批準(zhǔn)號(hào):61272400)、重慶市青年人才項(xiàng)目(批準(zhǔn)號(hào):cstc2013kjrc-qnrc40004)、教育部–中國移動(dòng)研究基金(批準(zhǔn)號(hào):MCM20130351)、重慶市研究生研究與創(chuàng)新項(xiàng)目(批準(zhǔn)號(hào):CYS14146)、重慶市教委科學(xué)計(jì)劃項(xiàng)目(批準(zhǔn)號(hào):KJ1500425)和重慶郵電大學(xué)文峰基金(批準(zhǔn)號(hào):W F201403)資助的課題.
?通信作者.E-mail:xiaoyp@cqupt.edu.cn
*Project supported by the National Basic Research Programof China(G rant No.2013CB329606),the National Natural Science Foundation of China(G rant No.61272400),the Chongqing Youth Innovative Talent Project,China(G rant No.cstc2013k jrc-qn rc40004),the Foundation of Ministry of Education of China and China Mobile(G rant No.MCM20130351),the Chongqing G raduate Research and Innovation Project,China(G rant No.CYS14146),the Science and Technology Research Programof the Chongqing Municipal Education Committee,China(G rant No.KJ1500425),theWenFeng Foundation of Chongqing University of Post and Telecommunications,China(G rant No.W F201403).
?Corresponding author.E-mail:xiaoyp@cqupt.edu.cn