顧亦然,趙 棟,孟繁榮
(南京郵電大學(xué)自動(dòng)化學(xué)院,江蘇 南京 210023)
社交網(wǎng)絡(luò)興起在一定程度上打破了固化的社會(huì)結(jié)構(gòu),使得社會(huì)各階層的領(lǐng)袖、精英和大眾都可以在社交媒體上擁有自己的“麥克風(fēng)”,扮演著信息制造者、傳播者和接收者的多重角色。信息經(jīng)由一層一層的信息傳播圈迅速向外傳遞的過(guò)程中,逐漸形成不同的群體化行為。
扎利亞·戈維特在一篇關(guān)于“群體極端化”的文章中寫(xiě)到,人們的頭腦總是受周圍群體的影響而出現(xiàn)意見(jiàn)趨同現(xiàn)象。網(wǎng)絡(luò)群體作為虛擬網(wǎng)絡(luò)社會(huì)中的網(wǎng)民,對(duì)某一事件或主題表現(xiàn)出的群體行為,已經(jīng)被多次的真實(shí)事件表明,這些群體性行為可以撼動(dòng)事件的結(jié)果。因此,社交網(wǎng)絡(luò)的輿情已經(jīng)從公眾輿論的折射場(chǎng)轉(zhuǎn)為了引發(fā)地、爆發(fā)場(chǎng),成為網(wǎng)絡(luò)輿情的重要陣地,對(duì)社會(huì)活動(dòng)影響深遠(yuǎn)。身處輿論中的普羅大眾們通過(guò)各自的影響力相互作用,組織演化,使得在線社交網(wǎng)絡(luò)的輿情呈現(xiàn)出多樣化和復(fù)雜性[1-3]。
群體行為作為大規(guī)模的非正式的行為,往往帶有一定破壞性。如,網(wǎng)絡(luò)輿情、社會(huì)突發(fā)事件、公共危機(jī)、網(wǎng)絡(luò)攻擊等。因此,有必要針對(duì)個(gè)體的行為特點(diǎn)和影響力的關(guān)聯(lián)性進(jìn)行研究,進(jìn)一步理解和揭示影響力的作用機(jī)制和潛在的機(jī)理[4]。
近年來(lái),隨著社會(huì)中突發(fā)輿論事件的不斷增多,關(guān)于網(wǎng)絡(luò)群體及群體行為的研究備受學(xué)界的關(guān)注。有很多學(xué)者從自然科學(xué)和交叉學(xué)科的角度建模研究網(wǎng)絡(luò)輿論中的個(gè)體和群體的社會(huì)化影響,試圖深入分析傳播的交互機(jī)制。從建模方式上來(lái)看,有的模型側(cè)重于群體特征的描述,直接建立群體行為的動(dòng)態(tài)演化過(guò)程模型;有的模型側(cè)重于刻畫(huà)個(gè)體的交互機(jī)制[4],通過(guò)建立個(gè)體觀點(diǎn)的更新規(guī)則模型,研究宏觀上產(chǎn)生的群體觀點(diǎn)演化現(xiàn)象。Li等[5]對(duì)在人類行為中普遍存在的極化現(xiàn)象的機(jī)理進(jìn)行深入研究,并運(yùn)用閾值理論解釋騷亂暴動(dòng)等激進(jìn)群體行為,以及 Web上群體觀點(diǎn)極化與社會(huì)認(rèn)同理論之間的聯(lián)系;朱麗萍等[6]認(rèn)為情緒效價(jià)作為社會(huì)信息的重要特征,影響著人們對(duì)信息的感知與加工,相對(duì)于中性刺激,人們對(duì)情緒性刺激(正性和負(fù)性)的加工更加迅速,表現(xiàn)為對(duì)情緒刺激的反應(yīng)時(shí)間縮短,說(shuō)明情緒刺激能更快地進(jìn)入認(rèn)知加工,信息的情緒特征能更快地調(diào)動(dòng)認(rèn)知資源;劉凱等[7]通過(guò)構(gòu)建結(jié)構(gòu)方程模型計(jì)算了互聯(lián)網(wǎng)輿情中網(wǎng)民參與心理對(duì)參與行為的路徑系數(shù),測(cè)定了網(wǎng)民不同輿情參與心理下輿情參與行為的強(qiáng)度,同時(shí)對(duì)各因素進(jìn)行了有效分析;Hegselmann R等[3]探討了不同在線論壇用戶參與行為,發(fā)現(xiàn)在線論壇用戶之間的關(guān)系存在隨機(jī)性且用戶之間信任性較弱,用戶對(duì)在線參與行為顯示出了強(qiáng)有力的規(guī)律。Li N等[6]以人類的信息傳播行為為例做了實(shí)證研究,發(fā)現(xiàn)在人類的行為中普遍存在冪律特性;Gunjan Verma等[8]認(rèn)為當(dāng)出現(xiàn)相斥證據(jù)時(shí),有些人的觀點(diǎn)容易受到他人影響而改變其原有觀點(diǎn);不斷有學(xué)者指出等[9-10]指出處于社會(huì)網(wǎng)絡(luò)結(jié)構(gòu)中的有些人會(huì)受到鄰居節(jié)點(diǎn)的影響[12],并證明影響值正比于累計(jì)的回報(bào)值。Bonzom V基于Ising模型,在無(wú)標(biāo)度網(wǎng)絡(luò)結(jié)構(gòu)中,考慮個(gè)體的空間位置和人際交往的雙層等級(jí)結(jié)構(gòu),構(gòu)建了人際交往的觀點(diǎn)形成模型。該模型認(rèn)為個(gè)體對(duì)其他個(gè)體的影響程度取決于他們的權(quán)威度;Gargiulo F等[13]證明了有些人在制定決策時(shí)會(huì)受歷史選擇與旁人的影響??梢?jiàn),群體一個(gè)很重要的特征就是群體化的影響力。而從影響力的角度來(lái)看,上述描述現(xiàn)階段多數(shù)都是從個(gè)體與個(gè)體的角度分析影響力。還鮮有從個(gè)體與群體角度來(lái)分析研究影響力,也沒(méi)有對(duì)影響值進(jìn)行定量分析。因此本文通過(guò)研究群體對(duì)個(gè)體行為的影響力作用,提出了群體對(duì)個(gè)體的影響力交互模型,并對(duì)該算法進(jìn)行定量分析。
Kitask等人認(rèn)為位于網(wǎng)絡(luò)核心位置的節(jié)點(diǎn)i即使其度值很小,其對(duì)網(wǎng)絡(luò)的影響力也很大,相反的,即使節(jié)點(diǎn) j具有很高的度值,但是位于網(wǎng)絡(luò)邊緣位置,則其對(duì)網(wǎng)絡(luò)的影響力并沒(méi)有節(jié)點(diǎn)i大,基于此提出了K-Shell (K-殼)分解算法,這是一種粗粒化的節(jié)點(diǎn)重要性分類方法。它體現(xiàn)了網(wǎng)絡(luò)中節(jié)點(diǎn)影響力的擴(kuò)散,類似能量向外一層一層在涌動(dòng)。
K-Shell分解算法分解步驟如下:假設(shè)網(wǎng)絡(luò)中不存在度為0的節(jié)點(diǎn),即每個(gè)節(jié)點(diǎn)度值 k ≥ 1,先將網(wǎng)絡(luò)中所有度值為 1的節(jié)點(diǎn)剝落,剝落所有度值為 1的節(jié)點(diǎn)后,生成的新網(wǎng)絡(luò)中會(huì)繼續(xù)有度值為1的節(jié)點(diǎn),重復(fù)之前的步驟,繼續(xù)進(jìn)行剝落度值為1的節(jié)點(diǎn),直到新網(wǎng)絡(luò)中所有的節(jié)點(diǎn)的度值 k ≥ 2 ,把所有剝落的節(jié)點(diǎn)稱為網(wǎng)絡(luò)的1-Shell(1-殼);新網(wǎng)絡(luò)中節(jié)點(diǎn)的度值有 k ≥ 2 ,同第一步相同,重復(fù)剝落度值為2的節(jié)點(diǎn),直到網(wǎng)絡(luò)中所有節(jié)點(diǎn)的度值 k ≥ 3 ,將這一步剝落的節(jié)點(diǎn)稱為網(wǎng)絡(luò)的2-Shell。以此類推,進(jìn)一步得到網(wǎng)絡(luò)的3-Shell、4-Shell等更高的Shell層,直到網(wǎng)絡(luò)中的所有的節(jié)點(diǎn)都被剝落,這樣網(wǎng)絡(luò)中的每個(gè)節(jié)點(diǎn)都有對(duì)應(yīng)的K-Shell值 ks,例如屬于2-Shell的節(jié)點(diǎn),其 ks= 2 ,對(duì)于屬于K-Shell層的節(jié)點(diǎn)都有度值 k ≥ks。
網(wǎng)絡(luò)可以抽象為節(jié)點(diǎn)集 V(Vertex)與連邊集E(Edge)組成的圖 G=(V,E)。通過(guò)節(jié)點(diǎn)間連邊關(guān)系反應(yīng)網(wǎng)絡(luò)情況,在現(xiàn)實(shí)網(wǎng)絡(luò)中節(jié)點(diǎn)對(duì)彼此間的影響力是不同的,比如Vi節(jié)點(diǎn)是一個(gè)影響力很大的節(jié)點(diǎn)而Vj節(jié)點(diǎn)則是一個(gè)影響力較小的節(jié)點(diǎn),Vi對(duì)Vj的影響力要高于Vj對(duì)Vi的影響力,為了表征這種差異,引入貢獻(xiàn)度[11]這一概念,節(jié)點(diǎn) i對(duì) j的貢獻(xiàn)度定義見(jiàn)公式(1),其中 i和j分別為節(jié)點(diǎn)Vi和Vj鄰居節(jié)點(diǎn)的集合。
表1 社交關(guān)系親密度的符號(hào)和含義Tab.1 The symbol and meaning of social relationship intimacy
上文中節(jié)點(diǎn)的 Ks值的大小表示網(wǎng)絡(luò)中該節(jié)點(diǎn)所在的核心位置,既影響力傳播深度。貢獻(xiàn)度表述節(jié)點(diǎn)某屬性對(duì)各鄰居節(jié)點(diǎn)的貢獻(xiàn)情況。綜合考慮節(jié)點(diǎn)對(duì)全網(wǎng)信息的傳播影響力,將相鄰個(gè)體間影響力定義如下。節(jié)點(diǎn)iv對(duì)節(jié)點(diǎn)jv的影響力,為節(jié)點(diǎn)iv的K-Shell值、節(jié)點(diǎn)iv對(duì)節(jié)點(diǎn)jv的貢獻(xiàn)度、節(jié)點(diǎn)iv對(duì)節(jié)點(diǎn)jv的親密度因子三者的乘積:
定義 1:群體由微博、微信最新數(shù)據(jù)分析,在線社交網(wǎng)絡(luò)兩節(jié)點(diǎn)間的平均距離為 3,因此本文在做群體對(duì)個(gè)體影響力分析時(shí),計(jì)算僅考慮路徑距離為3以內(nèi)的所有節(jié)點(diǎn)群體。
節(jié)點(diǎn)在群體中受到的平均影響力定義:首先本文使用廣度優(yōu)先搜索算法,可以尋找到網(wǎng)絡(luò)中,某節(jié)點(diǎn)iv三步之內(nèi)的所有節(jié)點(diǎn)集合iV(實(shí)驗(yàn)表明兩步范圍太小不夠全面,四步開(kāi)始對(duì)結(jié)果影響很小,故這里選擇了三步)。由公式(2)可以計(jì)算出iv對(duì)集合內(nèi)所有節(jié)點(diǎn)的影響力,再進(jìn)行求和記為節(jié)點(diǎn)iv對(duì)群體的影響力iGF 。其次,本文計(jì)算出網(wǎng)絡(luò)中 m個(gè)節(jié)點(diǎn)對(duì)群體的影響力之和,再求平均數(shù)記為 i節(jié)點(diǎn)在群體中受到的平均影響力大?。?/p>
群體對(duì)個(gè)體影響力算法:假設(shè)要求群體對(duì)目標(biāo)節(jié)點(diǎn) t的影響力大小,考慮到每個(gè)群體對(duì)個(gè)體造成最直接影響的因素,往往是群體內(nèi)具有群體觀點(diǎn),且與目標(biāo)個(gè)體有直接交際關(guān)系的節(jié)點(diǎn),對(duì)目標(biāo)節(jié)點(diǎn)帶來(lái)的影響。因此本文使用廣度優(yōu)先搜索算法找出群體內(nèi)與節(jié)點(diǎn)tv相連一步之內(nèi)的所有節(jié)點(diǎn)(m節(jié)點(diǎn),l節(jié)點(diǎn)…),然后用群體影響力與相鄰個(gè)體影響力的乘積,再求和記為整個(gè)群體對(duì)個(gè)體的影響力:
綜上所述,可以得出群體對(duì)個(gè)體影響力傳播的算法,如下所示:
輸入:G=(V,E)
輸出:群體對(duì)節(jié)點(diǎn) vt的影響力 FGt
1)開(kāi)始,通過(guò)廣度優(yōu)選搜索算法獲取節(jié)點(diǎn) vi到集合Vi中節(jié)點(diǎn)的路徑與距離表;
2)計(jì)算網(wǎng)絡(luò)中每個(gè)節(jié)點(diǎn)的k-shell值;
3)計(jì)算網(wǎng)絡(luò)中每個(gè)節(jié)點(diǎn)間的貢獻(xiàn)度 Cn(i, j);
4)計(jì)算i節(jié)點(diǎn)在群體中受到的平均影響力大小FG;
5)由公式(4)求得群體對(duì)目標(biāo)節(jié)點(diǎn) vt的影響力 FGt。
6)END
通過(guò)本文的算法可以確定群體轉(zhuǎn)移給每個(gè)節(jié)點(diǎn)的影響力值,考慮到從群體轉(zhuǎn)移到目標(biāo)節(jié)點(diǎn)的影響力越大,反過(guò)來(lái)從該節(jié)點(diǎn)向群體可以傳播的速度就越快,廣度也相應(yīng)越遠(yuǎn)。本節(jié)使用經(jīng)典的傳染病模型進(jìn)行仿真,能夠較為直觀地監(jiān)測(cè)到節(jié)點(diǎn)傳播情況。本文使用SI傳染模型,并在隨機(jī)網(wǎng)絡(luò)與Email網(wǎng)絡(luò)中實(shí)現(xiàn)仿真。在 Email網(wǎng)絡(luò)總進(jìn)行群體對(duì)個(gè)體的影響力排序分析,結(jié)果如表2所示。
表2 Email網(wǎng)絡(luò)本算法與經(jīng)典K-shell算法排名前三節(jié)點(diǎn)Tab.2 The algorithm of Email network and classic k-shell algorithm rank the top three points
根據(jù)上述排序結(jié)果,首先選定節(jié)點(diǎn)105號(hào)與299號(hào)進(jìn)行傳播仿真,結(jié)果如圖 1所示,105號(hào)傳播效果明顯優(yōu)于299號(hào);同時(shí)將排序第二位及第三位的節(jié)點(diǎn)對(duì)進(jìn)行傳播仿真,結(jié)果如圖 2、圖 3所示。綜上所述,本算法獲得的節(jié)點(diǎn)傳播效果均優(yōu)于其它算法。
下面將整個(gè)網(wǎng)絡(luò)中的節(jié)點(diǎn),按群體對(duì)節(jié)點(diǎn)傳播的影響力從小到大排序,其橫坐標(biāo)為節(jié)點(diǎn)序號(hào)的對(duì)數(shù),縱坐標(biāo)為群體對(duì)個(gè)體的影響力值。
如圖4所示,對(duì)曲線分析可知,曲線的切線的斜率隨著橫坐標(biāo)的增大而增大的更明顯,網(wǎng)絡(luò)整體對(duì)大部分節(jié)點(diǎn)傳播的影響力很少,而對(duì)小部分節(jié)點(diǎn)傳播了很大的影響力。通過(guò)這一研究分析,整個(gè)網(wǎng)絡(luò)群體更多的將影響力,傳播給了少數(shù)不足20%的節(jié)點(diǎn)。因此,只需要對(duì)GtF 算法中排序靠前的重要節(jié)點(diǎn)進(jìn)行監(jiān)控,便能了解一個(gè)群體影響力的作用程度。
在隨機(jī)網(wǎng)絡(luò)總進(jìn)行群體對(duì)個(gè)體的影響力排序分析,結(jié)果如表3所示。
圖1 Email網(wǎng)絡(luò)105, 299號(hào)節(jié)點(diǎn)傳播結(jié)果Fig.1 Email network 105, 299 node communication results
圖3 Email網(wǎng)絡(luò)196, 434號(hào)節(jié)點(diǎn)傳播結(jié)果Fig.3 Email network 196, 434 node communication results
表3 隨機(jī)網(wǎng)絡(luò)本算法與經(jīng)典K-shell算法排名前三節(jié)點(diǎn)Tab.3 Random network algorithm and classic k-shell algorithm rank the top three nodes
在隨機(jī)網(wǎng)絡(luò)中仿真結(jié)果如圖5(a)(b)表明,在GtF算法中排名前三的節(jié)點(diǎn)1、2、3號(hào)傳播效果均優(yōu)于,在K-shell算法中排名前三的1、3、5號(hào)節(jié)。
圖2 Email網(wǎng)絡(luò)16, 389號(hào)節(jié)點(diǎn)傳播結(jié)果Fig.2 Email network 16, 389 node communication results
圖4 影響力值排序后分布情況Fig.4 Distribution after ranking of influence values
現(xiàn)如今社交網(wǎng)絡(luò)的輿情已經(jīng)從公眾輿論的折射場(chǎng)轉(zhuǎn)為了引發(fā)地、爆發(fā)場(chǎng),成為網(wǎng)絡(luò)輿情的重要陣地,對(duì)社會(huì)活動(dòng)影響深遠(yuǎn)。社交網(wǎng)絡(luò)的輿情又呈現(xiàn)出多樣化和復(fù)雜性,能夠準(zhǔn)確地掌握和控制輿情在群體中的演化過(guò)程迫在眉睫,因此有必要針對(duì)群體對(duì)個(gè)體的行為特點(diǎn)和影響力的關(guān)聯(lián)性進(jìn)行研究,進(jìn)一步理解和揭示影響力的作用機(jī)制和潛在的機(jī)理。本文提出了群體對(duì)個(gè)體影響力的計(jì)算方法,并建立了算法模型。進(jìn)行了SI傳播仿真分析,群體對(duì)個(gè)體影響力分布分析,結(jié)果表明本文提出的算法在傳播仿真中表現(xiàn)優(yōu)異,能夠準(zhǔn)確地找出重要的節(jié)點(diǎn)。希望能夠在控制網(wǎng)絡(luò)輿情傳播、處理社會(huì)突發(fā)事件等方面,為決策者提供更全面、更準(zhǔn)確的幫助。
圖5 (a) 隨機(jī)網(wǎng)絡(luò)2, 3號(hào)節(jié)點(diǎn)傳播結(jié)果Fig.5(a) Random network node 2, 3 transmission results
下一階段的研究重點(diǎn)是在本文研究的基礎(chǔ)之上,進(jìn)一步分析研究群體對(duì)個(gè)體的影響是如何隨時(shí)間而演化的。
[1] 趙旭劍, 張立, 李波, 等. 網(wǎng)絡(luò)新聞話題演化模式挖掘[J].軟件, 2015, 36(6): 1-6
[2] 王非. 基于微博的情感新詞發(fā)現(xiàn)研究[J]. 軟件, 2015,36(11): 06-08
[3] Hegselmann R, Krause U. Opinion Dynamics and Bounded Confidence Models, Analysis and Simulation[J]. Journal of Artificial Societies & Social Simulation, 2002, 5(3): 2.
[4] Li N N, Zhang N, Zhou T. Empirical analysis on temporal statistics of human correspondence patterns[J]. Physica A Statistical Mechanics & Its Applications, 2008, 387(25):6391-6394.
[5] Li Z, Tang X. From Global Polarization to Local Social Mechanisms: A Study Based on ABM and Empirical Data Analysis[M]. Springer Japan, 2015: 29-40.
[6] ZHU Li-ping, YUAN Jia-jin, Li Hong. The Influence of Emotional Valence and Intensity on Vocabulary Processing[J].Psychological Science, 2011, (02): 284-288(In Chinese)朱麗萍, 袁加錦, 李紅. 情緒效價(jià)及強(qiáng)度對(duì)詞匯加工的影響[J].心理科學(xué), 2011, (02): 284-288.
圖5 (b) 隨機(jī)網(wǎng)絡(luò)3, 5號(hào)節(jié)點(diǎn)傳播結(jié)果Fig.5(b) Random network node 3, 5transmission results
[7] LIU Kai, ZHU Hengmin, LIU Jingxian, Lu Zifang. R esearch on Netizens Factors in Internet Public Opinion Spread.Journal of Intellige, 2014, (04): 102-104 ( In Chinese)劉凱,朱恒民, 劉靜嫻等. 互聯(lián)網(wǎng)輿情傳播中的網(wǎng)民作用因素研究[J]. 情報(bào)雜志, 2014, (04): 102-104.
[8] Verma G, Swami A, Chan K. The impact of competing zealots on opinion dynamics[J]. Physica A Statistical Mechanics& Its Applications, 2014, 395(4): 310-331.
[9] Portillo I G. Cooperative networks overcoming defectors by social influence[J]. Physica A Statistical Mechanics & Its Applications, 2014, 394(2): 198-210.
[10] 劉璇, 于雙元. 非結(jié)構(gòu)化P2P 網(wǎng)絡(luò)基于馬爾科夫鏈的搜索算法研究[J]. 軟件, 2015, 36(3): 116-121
[11] Li Lei, Liu Ji. Empirical Analysis of Micro-blogger Behavior Clustering on Public Opinion Topics. Journal of Intellige, 2014, (03): 118-121 ( In Chinese)李磊, 劉繼. 面向輿情主題的微博用戶行為聚類實(shí)證分析[J]. 情報(bào)雜志,2014, (03): 118-121.
[12] Bonzom V, Gurau R, Rivasseau V. The Ising Model on Random Lattices in Arbitrary Dimensions[J]. Physics Letters B, 2011, 711(1): 88-96.
[13] Floriana G, Ramasco J J. Influence of Opinion Dynamics on the Evolution of Games[J]. Plos One, 2012, 7(11): e48916.
[14] 顧亦然, 王兵, 孟繁榮. 一種基于K-Shell的復(fù)雜網(wǎng)絡(luò)重要節(jié)點(diǎn)發(fā)現(xiàn)算法[J]. 計(jì)算機(jī)技術(shù)與發(fā)展, 2015(9): 70-74.GU Yi-ran, Wang Bing, Meng Fan-rong. A algorithm to find important nodes based on K-shell[J] Computer Technology and Development, 2015 25(09) 70-7.