亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于參數(shù)反演的網(wǎng)絡(luò)輿情傳播趨勢(shì)預(yù)測(cè)
        ——以新浪微博為例

        2017-07-31 17:47:12劉巧玲肖人彬
        計(jì)算機(jī)應(yīng)用 2017年5期
        關(guān)鍵詞:輿情反演神經(jīng)網(wǎng)絡(luò)

        劉巧玲,李 勁,肖人彬

        (華中科技大學(xué) 自動(dòng)化學(xué)院,武漢 430074)

        基于參數(shù)反演的網(wǎng)絡(luò)輿情傳播趨勢(shì)預(yù)測(cè)
        ——以新浪微博為例

        劉巧玲,李 勁*,肖人彬

        (華中科技大學(xué) 自動(dòng)化學(xué)院,武漢 430074)

        (*通信作者電子郵箱ljhust@hust.edu.cn)

        針對(duì)現(xiàn)有的輿情傳播模型研究與實(shí)際輿情數(shù)據(jù)結(jié)合較少以及難以從輿情大數(shù)據(jù)中挖掘輿情傳播內(nèi)在規(guī)律的問題,提出一種基于實(shí)際網(wǎng)絡(luò)輿情大數(shù)據(jù)采用神經(jīng)網(wǎng)絡(luò)的輿情傳播模型參數(shù)反演算法。改進(jìn)經(jīng)典SIR傳染病傳播模型,構(gòu)建一種網(wǎng)絡(luò)輿情傳播模型,基于該模型對(duì)實(shí)際案例進(jìn)行參數(shù)反演,預(yù)測(cè)網(wǎng)絡(luò)輿情的后續(xù)傳播趨勢(shì),并與馬爾可夫預(yù)測(cè)模型對(duì)比,所提算法可以精確預(yù)測(cè)輿情的具體熱度值。實(shí)驗(yàn)結(jié)果表明,所提算法在預(yù)測(cè)性能上具有一定的優(yōu)越性,可以用于網(wǎng)絡(luò)突發(fā)事件傳播的數(shù)據(jù)擬合、過程模擬和趨勢(shì)預(yù)測(cè)。

        新浪微博;SIR模型;反向傳播神經(jīng)網(wǎng)絡(luò);參數(shù)反演;輿情傳播

        0 引言

        互聯(lián)網(wǎng)及社交網(wǎng)絡(luò)的發(fā)展如新浪微博等,在便利信息傳播的同時(shí)導(dǎo)致網(wǎng)絡(luò)輿情傳播研究越來越困難。輿情傳播模型能對(duì)輿情傳播的過程和趨勢(shì)進(jìn)行描述,因此,基于輿情傳播模型研究社交網(wǎng)絡(luò)的輿情傳播具有極其重要的意義。

        對(duì)社交網(wǎng)絡(luò)輿情的傳播國內(nèi)外都有較多研究。早期的輿情傳播研究主要沿用SIS(Susceptible-Infected-Susceptible)、SIR(Susceptible-Infective-Recovered)傳染病模型[1-2]。后來很多研究者為更好地揭示社交網(wǎng)絡(luò)的輿情傳播規(guī)律改進(jìn)這些傳統(tǒng)模型: 2012年,朱恒民等[3]以無標(biāo)度網(wǎng)絡(luò)為載體提出了輿情傳播的SIRS(Susceptible-Infective-Recovered-Susceptible)模型; 2013年,張彥超等[4]結(jié)合傳染病模型構(gòu)造了一個(gè)基于社交網(wǎng)絡(luò)的信息傳播模型; Borge-Holthoefer等[5]將社交網(wǎng)絡(luò)中用戶的活躍度和對(duì)信息的感知度加入到信息傳播模型中; 2014年,蒙在橋等[6]考慮信息的傳播延遲,提出了動(dòng)態(tài)消息傳播模型; 張曉偉[7]借鑒日常生活中人與人之間的信任原理,提出了一種基于信任度的消息傳播模型; 2015年,陳驍?shù)萚8]為探究微博轉(zhuǎn)發(fā)網(wǎng)絡(luò)的構(gòu)建機(jī)制提出了一種有向加權(quán)網(wǎng)絡(luò)模型; 2016年,黃宏程等[9]考慮了網(wǎng)絡(luò)中用戶的不同感染狀態(tài),引入感染用戶的衰減函數(shù),提出了適合社交網(wǎng)絡(luò)的信息傳播模型。

        現(xiàn)有的社交網(wǎng)絡(luò)輿情傳播研究多局限于輿情傳播模型本身,研究所提模型的有效性及參數(shù)對(duì)輿情傳播的影響,與實(shí)際輿情數(shù)據(jù)結(jié)合較少。結(jié)合實(shí)際的傳染病疫情數(shù)據(jù)對(duì)傳染病傳播的參數(shù)反演已有相關(guān)研究。韓衛(wèi)國等人以香港和北京非典SARS(Severe Acute Respiratory Syndrome)疫情數(shù)據(jù)為實(shí)例,采用SIR模型對(duì)SARS傳播的時(shí)間過程參數(shù)反演[10]。熊焱等[11]提出一種基于SIR模型參數(shù)反演的新方法,以北京SARS疫情數(shù)據(jù)為例進(jìn)行驗(yàn)證。王香閣等[12]基于SIR模型預(yù)測(cè)病毒傳播的速度。但對(duì)于輿情傳播的參數(shù)反演則不多見。

        針對(duì)上述問題,本文基于SIR模型構(gòu)建一種網(wǎng)絡(luò)輿情傳播模型,并提出了一種基于實(shí)際網(wǎng)絡(luò)輿情大數(shù)據(jù)采用神經(jīng)網(wǎng)絡(luò)的輿情傳播模型參數(shù)反演算法,可實(shí)現(xiàn)從日益增長(zhǎng)的輿情大數(shù)據(jù)中挖掘出輿情傳播的內(nèi)在規(guī)律,可用于網(wǎng)絡(luò)突發(fā)事件傳播的數(shù)據(jù)擬合、過程模擬和趨勢(shì)預(yù)測(cè),可為政府部門對(duì)網(wǎng)絡(luò)輿情事件的控制決策提供依據(jù)。

        1 基本原理

        1.1 SIR模型

        Kermack與McKendrick于1927年建立了經(jīng)典的傳染病SIR模型,將人群劃分為易感染者S(Susceptible)、感染者I(Infected)和移出者R(Recovered)三類。S以一定的概率β被I感染,I以一定的概率γ被治愈后變成R,傳播過程如圖1[13]。

        圖1 經(jīng)典SIR模型

        Fig. 1 Classical SIR model

        經(jīng)典SIR模型具體形式如下:

        (1)

        (2)

        (3)

        S(t)+I(t)+R(t)=N(t)

        (4)

        式中:S(t)、I(t)、R(t)和N(t)分別表示t時(shí)刻易感人數(shù)、感染人數(shù)、移出人數(shù)和總?cè)藬?shù),β和γ分別表示感染者的感染率和移出率。

        1.2 網(wǎng)絡(luò)輿情傳播模型

        近年來學(xué)者們紛紛將SIR模型應(yīng)用到復(fù)雜網(wǎng)絡(luò)中[14-16]。本文在經(jīng)典SIR模型的基礎(chǔ)上,綜合考慮部分未接收到輿情信息的網(wǎng)民在接收信息后不參與傳播和部分接收信息但不傳播的網(wǎng)民在輿情衍生話題的影響下變?yōu)閭鞑フ哌@兩種情況,建立突發(fā)事件網(wǎng)絡(luò)輿情演化傳播的SIR模型。

        網(wǎng)絡(luò)輿情發(fā)生時(shí),基于經(jīng)典SIR模型,S也可能以概率d直接變?yōu)镽;當(dāng)原始網(wǎng)絡(luò)輿情衍生新話題時(shí),R會(huì)因?yàn)檠苌掝}輿情信息選擇傳播話題或制造新話題變?yōu)镮的概率為c。易感染者S、感染者I和移出者R的轉(zhuǎn)換關(guān)系如圖2。

        圖2 改進(jìn)SIR模型Fig. 2 Improved SIR model

        改進(jìn)經(jīng)典SIR模型后,網(wǎng)絡(luò)輿情傳播模型具體形式如下:

        (5)

        (6)

        (7)

        S(t)+I(t)+R(t)=N(t)

        (8)

        其中:a為感染率,b為衰退率,c為衍生影響率,d為轉(zhuǎn)化率。本文輿情傳播模型的易感染者S為未接收到輿情信息的用戶,感染者I為接收到輿情信息并傳播的用戶,移出者R為接收到輿情但不傳播或未接收到輿情且不傳播的用戶。

        2 相關(guān)方法

        2.1 Runge-Kutta方法

        龍格-庫塔(Runge-Kutta)方法利用級(jí)數(shù)法的思想,間接使用泰勒展開式和斜率表達(dá)微分,應(yīng)用廣泛,精度高,可保證求解過程的穩(wěn)定性和解的收斂性。

        微分方程組(5)~(7)可歸結(jié)為一階常微分方程組(9):

        (9)

        我們采用經(jīng)典Runge-Kutta四階方法求解此微分方程模型的數(shù)值解,求解公式如下:

        (10)

        (11)

        其中i=1,2,3;h為步長(zhǎng)。

        2.2 輿情預(yù)測(cè)方法

        常見的預(yù)測(cè)模型有兩大類:基于傳統(tǒng)統(tǒng)計(jì)學(xué)的預(yù)測(cè)方法,如時(shí)間序列模型、參數(shù)回歸模型等,它們更適用于線性關(guān)系的預(yù)測(cè);另一類基于智能機(jī)器學(xué)習(xí)算法的預(yù)測(cè)方法,如支持向量機(jī)模型、馬爾可夫模型、神經(jīng)網(wǎng)絡(luò)模型等[17]。支持向量機(jī)模型對(duì)缺失數(shù)據(jù)敏感,核函數(shù)及參數(shù)的選擇沒有統(tǒng)一的模式。馬爾可夫模型通過劃分狀態(tài)空間構(gòu)造狀態(tài)轉(zhuǎn)移矩陣,預(yù)測(cè)精確性取決于未來一期的預(yù)測(cè)。而BP(Back-Propagation)神經(jīng)網(wǎng)絡(luò)模型構(gòu)造簡(jiǎn)單,無需建立解析數(shù)學(xué)模型,計(jì)算效率高,逼近效果好,非線性擬合能力強(qiáng)。因此,本文采用貝葉斯正則化BP神經(jīng)網(wǎng)絡(luò)進(jìn)行群體性突發(fā)事件輿情傳播的參數(shù)反演和趨勢(shì)預(yù)測(cè),網(wǎng)絡(luò)結(jié)構(gòu)如圖3所示。

        圖3 BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)Fig. 3 BP neural network structure

        本文BP網(wǎng)絡(luò)的輸入為改進(jìn)SIR模型I(t)的數(shù)值解,對(duì)應(yīng)的參數(shù)值(a,b,c,d,N)作為網(wǎng)絡(luò)的輸出。

        3 參數(shù)反演算法

        本文結(jié)合Runge-Kutta微分方程數(shù)值解法和BP神經(jīng)網(wǎng)絡(luò)技術(shù),構(gòu)造一種適合于網(wǎng)絡(luò)輿情傳播模型的參數(shù)反演算法,進(jìn)行群體性突發(fā)事件輿情傳播的參數(shù)反演和趨勢(shì)預(yù)測(cè)。

        參數(shù)反演算法的求解步驟如下:

        1)確定改進(jìn)SIR模型的a、b、c、d和N的取值范圍Ia、Ib、Ic、Id和IN,并分別在這些參數(shù)的取值區(qū)間內(nèi)選取n組參數(shù)值(ai,bi,ci,di,Ni),其中:ai∈Ia、bi∈Ib、ci∈Ic、di∈Id、Ni∈IN(i=1,2,…,n)。

        2)對(duì)于每組參數(shù)值(ai,bi,ci,di,Ni),利用Runge-Kutta方法求解微分方程組(5)~(8),求出一組I(t)的數(shù)值解Ii,1,Ii,2,…,Ii,M,將n組I(t)數(shù)值解作為網(wǎng)絡(luò)的輸入,對(duì)應(yīng)的參數(shù)值(ai,bi,ci,di,Ni)作為網(wǎng)絡(luò)的輸出,構(gòu)造n組訓(xùn)練樣本,同時(shí)用相同方法構(gòu)造m組測(cè)試樣本。

        3)根據(jù)得到的訓(xùn)練樣本使用貝葉斯正則化方法訓(xùn)練BP神經(jīng)網(wǎng)絡(luò),并用測(cè)試樣本測(cè)試訓(xùn)練效果。

        4)將實(shí)際突發(fā)事件輿情傳播的相關(guān)數(shù)據(jù)輸入訓(xùn)練好的神經(jīng)網(wǎng)絡(luò),由神經(jīng)網(wǎng)絡(luò)的輸出得到改進(jìn)SIR輿情傳播模型的反演參數(shù)值a、b、c、d和N。

        5)利用反演參數(shù)值a、b、c、d和N和改進(jìn)SIR輿情傳播模型預(yù)測(cè)后L天的輿情傳播人數(shù)I(M+1),I(M+2),…,I(M+L)。

        4 案例分析

        4.1 案例選擇和數(shù)據(jù)獲取

        “醫(yī)療安全”問題歷來是社會(huì)關(guān)注的熱點(diǎn)話題,2016年4月28日針對(duì)自媒體曝出“魏則西”之死事件存在的涉事醫(yī)院外包診所給民營機(jī)構(gòu)、百度競(jìng)價(jià)排名等問題,引起了網(wǎng)民的熱議。為驗(yàn)證上述算法的可行性,選取目前國內(nèi)最熱門的社交網(wǎng)絡(luò)—新浪微博平臺(tái)“魏則西事件”作為本次研究實(shí)例。

        采用爬蟲技術(shù)抓取新浪微博相關(guān)的數(shù)據(jù)。以“魏則西”為搜索關(guān)鍵詞,以每?jī)蓚€(gè)小時(shí)為搜索區(qū)間,抓取新浪微博上2016-04-28— 2016-05-28一個(gè)月的微博,針對(duì)每條微博爬取微博發(fā)布者的昵稱、發(fā)布時(shí)間、轉(zhuǎn)發(fā)數(shù)、評(píng)論數(shù)、贊數(shù)等。每個(gè)時(shí)段的微博數(shù)量可反映輿情傳播中傳播者的輿情傳播水平。

        4.2 數(shù)據(jù)整理和分析

        針對(duì)以上數(shù)據(jù),提取以每?jī)蓚€(gè)小時(shí)為區(qū)間的微博數(shù)量。因?yàn)樾吕宋⒉┑牟┪臄?shù)據(jù)和時(shí)間息息相關(guān),通常每天2:00~6:00博文發(fā)布量偏少,9:00~10:00及22:00~23:00是博文發(fā)布的高峰期,因此將每天的博文量以4:00~16:00(第一時(shí)間段)和16:00~4:00(次日)(第二時(shí)間段)時(shí)間段進(jìn)行分段統(tǒng)計(jì),得到該事件新浪微博平臺(tái)輿情傳播的真實(shí)數(shù)據(jù),時(shí)間長(zhǎng)度為31 d,數(shù)據(jù)個(gè)數(shù)為62。部分?jǐn)?shù)據(jù)如表1所示。

        表1 “魏則西”事件相關(guān)數(shù)據(jù)Tab. 1 Related data of “WEI Zexi” event

        4.3 網(wǎng)絡(luò)輿情的預(yù)測(cè)

        以往研究大多以日微博總量衡量輿情傳播者的傳播水平,但群體性突發(fā)事件一旦發(fā)生如同火山爆發(fā)般迅速傳播,到達(dá)高峰期時(shí)間極短,而利用事件增長(zhǎng)期數(shù)據(jù)預(yù)測(cè)高峰期、衰退期等更有現(xiàn)實(shí)意義。因此,本文采用以上分段處理的博文量作為模型仿真的數(shù)據(jù)集反演SIR模型的參數(shù),進(jìn)而預(yù)測(cè)網(wǎng)絡(luò)輿情的傳播。由于博文量與一天中的不同時(shí)間段息息相關(guān),因此本文將日博文量以4:00~16:00和16:00~4:00(次日)時(shí)間段進(jìn)行統(tǒng)計(jì),用04-29— 05-01前三天的6組數(shù)據(jù)作為輸入數(shù)據(jù)進(jìn)行參數(shù)反演獲取感染率、衰退率等參數(shù),利用傳播模型預(yù)測(cè)該事件后續(xù)輿情傳播的趨勢(shì)走向。該算法的步驟如下:

        1)輿情傳播模型參數(shù)的取值范圍,感染率a∈[1.6×10-5,2.6×10-5],衰退率b∈[0.004,0.014],衍生影響率c∈[1.0×10-7,2.0×10-6],轉(zhuǎn)化率d∈[1.0×10-7,2.0×10-6],N∈[2 000,3 500];

        2)在上述參數(shù)的取值區(qū)間內(nèi)隨機(jī)選取10 000組參數(shù)值,利用Runge-Kutta方法得到10 000組I(t)的數(shù)值解,將每個(gè)I(t)數(shù)值解的前6個(gè)數(shù)值作為網(wǎng)絡(luò)的輸入,對(duì)應(yīng)的參數(shù)值a、b、c、d、N作為網(wǎng)絡(luò)的輸出,構(gòu)造10 000組訓(xùn)練樣本;

        3)利用BP神經(jīng)網(wǎng)絡(luò)技術(shù)訓(xùn)練,輸入層節(jié)點(diǎn)數(shù)6,輸出層節(jié)點(diǎn)數(shù)5,隱含層節(jié)點(diǎn)數(shù)8,最大迭代次數(shù)1 000,目標(biāo)誤差0.01,學(xué)習(xí)速率0.05,訓(xùn)練算法trainbr,訓(xùn)練函數(shù)tansig;

        4)網(wǎng)絡(luò)訓(xùn)練好后,以前三天此事件的6組實(shí)際微博數(shù)作為網(wǎng)絡(luò)的輸入,反演求得SIR模型的參數(shù)a、b、c、d和N;

        5)以上過程重復(fù)100次,求得模型參數(shù)a、b、c、d和N的平均值,代入SIR模型,可獲得該事件后續(xù)輿情傳播的趨勢(shì)走向及高峰期、高峰期傳播人數(shù)等信息。

        4.4 預(yù)測(cè)結(jié)果分析

        4.4.1 “魏則西”事件預(yù)測(cè)結(jié)果分析

        利用該事件前三天的微博數(shù)據(jù)參數(shù)反演100次,求得SIR模型參數(shù)a、b、c、d和N的平均值,結(jié)果如下:a=2.110 341 45×10-5,b=0.009 987 93,c=1.000 341 25×10-7,d=1.010 321 45×10-7,N=2 989,代入改進(jìn)SIR模型,部分預(yù)測(cè)結(jié)果如表2所示。表2列出了利用該事件前三天的微博數(shù)據(jù)參數(shù)反演預(yù)測(cè)后16天(05-02— 05-17)的輿情傳播過程。

        對(duì)比參數(shù)反演的預(yù)測(cè)結(jié)果和實(shí)測(cè)數(shù)據(jù),如圖4所示。

        由上述仿真結(jié)果可以看出,結(jié)合實(shí)際社交網(wǎng)絡(luò)的實(shí)際網(wǎng)絡(luò)輿情大數(shù)據(jù),利用該事件前三天的微博數(shù)據(jù),基于輿情傳播模型的參數(shù)反演算法,可挖掘感染率、衰退率等輿情傳播模型參數(shù),預(yù)測(cè)該事件后續(xù)的輿情傳播過程。仿真預(yù)測(cè)結(jié)果與實(shí)際數(shù)據(jù)變化趨勢(shì)基本吻合,擬合效果較好,說明可以用基于網(wǎng)絡(luò)輿情傳播模型的參數(shù)反演算法來仿真模擬該類群體性突發(fā)事件的演化傳播,并進(jìn)行相應(yīng)的分析和預(yù)測(cè)。

        1)該事件爆發(fā)于4月底,04-29— 04-30為緩慢增長(zhǎng)期,從05-01開始,該事件如同火山爆發(fā)般迅速傳播,進(jìn)入爆發(fā)階段,05-03達(dá)到最高峰,預(yù)測(cè)結(jié)果和實(shí)際數(shù)據(jù)吻合;預(yù)測(cè)高峰期的微博量為1 631,與實(shí)際數(shù)據(jù)1 619相比,誤差為12。

        2)05-05— 05-12是該事件的衰退期。此階段傳播者比例呈現(xiàn)遞減的態(tài)勢(shì),是事件衍生話題的潛伏期和關(guān)鍵期。此階段實(shí)際數(shù)據(jù)存在很大的波動(dòng),因?yàn)樵撾A段存在一定的隨機(jī)因素的影響,如“魏則西事件”涉及百度、央視、莆田系,導(dǎo)致網(wǎng)民熱度上升,使網(wǎng)絡(luò)輿情進(jìn)入二度爆發(fā)階段。

        表2 “魏則西”事件預(yù)測(cè)結(jié)果Tab. 2 Prediction results of “WEI Zexi” event

        圖4 “魏則西”事件模型預(yù)測(cè)結(jié)果與實(shí)際數(shù)據(jù)比較Fig. 4 Comparison of the predicted results and the actual data of the "WEI Zexi" event

        3)05-13開始是該事件的平息期。經(jīng)過衰退期后,網(wǎng)民對(duì)此事件的關(guān)注熱度出現(xiàn)疲態(tài),逐漸平息直至淡出網(wǎng)民視野。

        4)整個(gè)輿情傳播過程,與實(shí)際數(shù)據(jù)相比,預(yù)測(cè)微博量的平均絕對(duì)誤差為11.8,平均相對(duì)誤差為14.2%。

        4.4.2 算法有效性分析

        為了更好地驗(yàn)證所提算法的有效性以及更好地比較預(yù)測(cè)

        結(jié)果,抓取另一個(gè)案例“人機(jī)大戰(zhàn)”2016-03-06— 2016-03-21的相關(guān)新浪微博量,類似方法進(jìn)行處理,分別建立基于馬爾可夫模型的網(wǎng)絡(luò)輿情預(yù)測(cè)模型和基于BP神經(jīng)網(wǎng)絡(luò)的參數(shù)反演網(wǎng)絡(luò)輿情預(yù)測(cè)模型,分別利用該事件發(fā)展期的前三天6個(gè)數(shù)據(jù)預(yù)測(cè)后續(xù)輿情傳播趨勢(shì)。

        基于BP神經(jīng)網(wǎng)絡(luò)的參數(shù)反演網(wǎng)絡(luò)輿情預(yù)測(cè)中,參數(shù)反演求得的SIR模型參數(shù)a=2.898 675 4×10-5,b=0.021 974 2,c=3.983 645 6×10-6,d=1.2753234×10-6,N=2 686。

        利用03-06— 03-08三天的6個(gè)數(shù)據(jù)預(yù)測(cè)后續(xù)輿情傳播趨勢(shì)(03-09— 03-21),兩者的預(yù)測(cè)結(jié)果對(duì)照如表3,圖5所示。

        圖5 BP神經(jīng)網(wǎng)絡(luò)參數(shù)反演預(yù)測(cè)結(jié)果Fig. 5 Prediction results of parameter inversion based on BP neural network表3 本文方法與馬爾可夫模型預(yù)測(cè)結(jié)果對(duì)比Tab. 3 Comparison of the predicted results of the proposed model and Markov model

        編號(hào)真實(shí)值馬爾可夫模型真實(shí)狀態(tài)預(yù)測(cè)狀態(tài)參數(shù)反演預(yù)測(cè)值編號(hào)真實(shí)值馬爾可夫模型真實(shí)狀態(tài)預(yù)測(cè)狀態(tài)參數(shù)反演預(yù)測(cè)值1 4Z2— 411Z2—129228Z3Z3178115Z2Z3143225Z2—3580Z2—10310155Z2Z3115257Z3Z3923189Z1—271482Z1—58411152Z3Z37460Z3Z3594864Z1Z19151066Z3Z110471255Z3Z34848Z3Z3395912Z3Z3981810Z4Z38351341Z3Z33139Z2Z3256488Z4Z3683212Z3Z35491443Z3Z32034Z3Z3167210Z2Z3438330Z3Z33501520Z3Z31319Z2Z3118189Z2Z3279356Z3Z32231637Z3Z3 929——7

        注:—表示沒有進(jìn)行預(yù)測(cè)。

        由上述對(duì)同一事件,采用兩種不同方法進(jìn)行預(yù)測(cè)的結(jié)果可見:1)馬爾可夫模型輿情預(yù)測(cè)通過已知狀態(tài)預(yù)測(cè)未來的狀態(tài),只能預(yù)測(cè)未來所處的狀態(tài)空間,不能得到輿情的具體熱度值,而本文算法可以精確預(yù)測(cè)輿情的具體熱度值,更有實(shí)際意義;2)馬爾可夫模型通過輿情熱度計(jì)算、狀態(tài)空間劃分、狀態(tài)轉(zhuǎn)移矩陣構(gòu)造進(jìn)行輿情熱度趨勢(shì)預(yù)測(cè),狀態(tài)轉(zhuǎn)移矩陣的構(gòu)造需要大量的數(shù)據(jù),而網(wǎng)絡(luò)輿情突發(fā)事件一旦發(fā)生往往進(jìn)展很快,到達(dá)高潮的時(shí)間極短,數(shù)據(jù)量不足,這限制了馬爾可夫模型的使用,而本文算法利用事件發(fā)展期的數(shù)據(jù)即可以進(jìn)行參數(shù)反演,進(jìn)而預(yù)測(cè)高潮期時(shí)間、高潮峰值等數(shù)據(jù),更有現(xiàn)實(shí)意義。從圖5可見實(shí)際數(shù)據(jù)的衰退期有局部點(diǎn)數(shù)據(jù)出現(xiàn)了跳躍現(xiàn)象,經(jīng)查發(fā)現(xiàn),其原因是3月13日,圍棋人機(jī)大戰(zhàn)第四局較量中李世石接連三局負(fù)于“阿爾法圍棋”后迎來了首次勝利,致使網(wǎng)民的熱度上升??梢姡瑢?shí)際輿情數(shù)據(jù)受各種隨機(jī)因素的影響可能在局部點(diǎn)發(fā)生一定偏離,但模型對(duì)事件發(fā)展的整體趨勢(shì)的預(yù)測(cè)是正確的,這表明通過模型參數(shù)反演獲取到了輿情傳播事件發(fā)展的內(nèi)在規(guī)律,能夠正確描述輿情傳播進(jìn)程在其內(nèi)在機(jī)制驅(qū)動(dòng)下的演化和發(fā)展規(guī)律。

        5 結(jié)語

        本文在傳統(tǒng)傳染病模型的基礎(chǔ)上構(gòu)建了一種網(wǎng)絡(luò)輿情傳播模型,并提出了一種基于實(shí)際網(wǎng)絡(luò)輿情大數(shù)據(jù)采用神經(jīng)網(wǎng)絡(luò)完成輿情傳播模型參數(shù)反演的算法,實(shí)現(xiàn)了基于實(shí)際輿情傳播數(shù)據(jù)從日益增長(zhǎng)的輿情大數(shù)據(jù)中挖掘出輿情傳播的內(nèi)在規(guī)律。利用該參數(shù)反演算法預(yù)測(cè)網(wǎng)絡(luò)輿情傳播的趨勢(shì),并以新浪微博突發(fā)事件實(shí)際抓取數(shù)據(jù)為例進(jìn)行了驗(yàn)證,并與馬爾可夫預(yù)測(cè)模型進(jìn)行了對(duì)比。結(jié)果表明,基于實(shí)際網(wǎng)絡(luò)輿情大數(shù)據(jù)采用神經(jīng)網(wǎng)絡(luò)完成輿情傳播模型參數(shù)反演的算法可以預(yù)測(cè)網(wǎng)絡(luò)輿情的傳播趨勢(shì)且性能更優(yōu),這對(duì)指導(dǎo)政府部門制定網(wǎng)絡(luò)輿情的控制策略有著重要的參考價(jià)值。

        在下一步的研究中,擬構(gòu)建一種考慮空間傳播過程的網(wǎng)絡(luò)結(jié)構(gòu)動(dòng)態(tài)演化的輿情傳播模型?;诒疚牡膮?shù)反演算法進(jìn)行實(shí)時(shí)參數(shù)反演,實(shí)現(xiàn)輿情傳播過程中模型的參數(shù)動(dòng)態(tài)演化,同時(shí)結(jié)合輿情大數(shù)據(jù)的地理位置信息對(duì)輿情的傳播過程開展更進(jìn)一步的研究。

        References)

        [1] 張發(fā),李璐,宣慧玉.傳染病傳播模型綜述[J].系統(tǒng)工程理論與實(shí)踐,2011,31(9):1736-1744.(ZHANG F,LI L,XUAN H Y. Survey of transmission models of infectious diseases[J].Systems Engineering-Theory & Practice,2011,31(9):1736-1744.)

        [2] 劉丹,殷亞文,宋明.基于SIR模型的微博信息擴(kuò)散規(guī)律仿真分析[J].北京郵電大學(xué)學(xué)報(bào),2014,16(3):28-33.(LIU D,YIN Y W,SONG M. Simulation analysis of micro-blog information diffusion based on SIR model[J].Journal of Beijing University of Posts and Telecommunications, 2014,16(3):28-33.)

        [3] 朱恒民,李青.面向話題衍生性的微博網(wǎng)絡(luò)輿情傳播模型研究[J].現(xiàn)代圖書情報(bào)技術(shù),2012,28(5): 60-64.(ZHU H M,LI Q. Public opinion propagation model with topic derivatives in the micro-blog network[J].New Technology of Library and Information Service, 2012,28(5): 60-64.)

        [4] 張彥超,劉云,張海峰,等.基于在線社交網(wǎng)絡(luò)的信息傳播模型[J].物理學(xué)報(bào),2011,60(5):50501.(ZHANG Y C,LIU Y,ZHANG H F, et al. The research of information dissemination model on online social network[J]. Acta Physica Sinica,2011,60(5):50501.)

        [5] BORGE-HOLTHOEFER J, MELONI S, GONCALVES B, et al. Emergence of influential spreaders in modified rumor models[J].Journal of Statistical Physics,2013,151(1/2):383-393.

        [6] 蒙在橋,傅秀芬.基于社交網(wǎng)絡(luò)的動(dòng)態(tài)消息傳播模型[J]. 計(jì)算機(jī)應(yīng)用,2014,34(7):1960-1963.(MENG Z Q, FU X F. Dynamic information spreading model based on online social network[J]. Journal of Computer Applications,2014,34(7): 1960-1963.)

        [7] 張曉偉.在線社交網(wǎng)絡(luò)下基于信任度的消息傳播模型[J].計(jì)算機(jī)應(yīng)用,2014,34(2):411-416.(ZHANG X W. Trust-based information propagation model in online social networks[J]. Journal of Computer Applications, 2014, 34(2):411-416.)

        [8] 陳驍,黃曙光,秦李.基于微博轉(zhuǎn)發(fā)的社交網(wǎng)絡(luò)模型[J].計(jì)算機(jī)應(yīng)用,2015,35(3):638-642.(CHEN X,HUANG S G,QIN L. Social network model based on micro-blog transmission[J].Journal of Computer Applications, 2015,35(3):638-642.)

        [9] 黃宏程,蔣艾玲,胡敏.基于社交網(wǎng)絡(luò)的信息傳播模型分析[J].計(jì)算機(jī)應(yīng)用研究,2016,33(7):2738-2742.(HUANG H C,JIANG A L,HU M. Analysis of information diffusion model on social network[J].Application Research of Computers,2016,33(7): 2738-2742.)

        [10] 韓衛(wèi)東,王勁峰,劉旭華.SARS傳播時(shí)間過程的參數(shù)反演和趨勢(shì)預(yù)測(cè)[J]. 地球科學(xué)進(jìn)展,2004,19(6):925-930.(HAN W D,WANG J F,LIU X H. Parameter inversion and trend prediction of SARS propagation process[J].Advances in Earth Science, 2004,19(6):925-930.)

        [11] 熊焱,王莉,李大衛(wèi),等.SIR傳染病模型的參數(shù)反演[J].生物數(shù)學(xué)學(xué)報(bào),2009,24(1):129-135.(XIONG Y,WANG L,LI D W, et al. Parameter inversion of SIR epidemic model[J].Journal of Biomathematics,2009,24(1):129-135.)

        [12] 王香閣,于紅斌,王飄飄,等.基于SIR模型對(duì)埃博拉病毒蔓延趨勢(shì)的預(yù)測(cè)[J].福建電腦,2015,14(2):97,115.(WANG X G,YU H B,WANG P P,et al. The prediction of the spread of Ebola virus based on SIR model[J].Fujian Computer,2015,14(2):97,115.)

        [13] KERMACK W O, MCKENDRICK W G. A contribution to the mathematical theory of epidemics[J].Proceedings of the Royal Society of London: Series A,1927,115(1):700-721.

        [14] YUAN X P, XUE Y K, LIU M X. Global stability of an SIR model with two susceptible groups on complex networks[J]. Chaos, Solitons & Fractals,2014,59(2):42-50.

        [15] BALL F, SIRL D, TRAPMAN P. Analysis of a stochastic SIR epidemic on a random network incorporating household structure[J]. Mathematical Biosciences,2010, 224(2):53-73.

        [16] 李可嘉,王義康.改進(jìn)SIR模型在社交網(wǎng)絡(luò)信息傳播中的應(yīng)用[J].電子科技,2013,26(8):168-171.(LI K J,WANG Y K. Application of improved SIR model in information transmission in social networks[J]. Electronic Science and Technology, 2013,26(8):168-171.)

        [17] 游丹丹,陳福集.基于改進(jìn)粒子群和BP神經(jīng)網(wǎng)絡(luò)輿情預(yù)測(cè)研究[J]. 情報(bào)雜志,2016,35(8):156-161.(YOU D D,CHEN F J. Research on the prediction of network public opinion based on improved PSO and BP neural network[J].Journal of Intelligence,2016,35(8):156-161.)

        This work is partially supported by the National Natural Science Foundation of China (61540032).

        LIU Qiaoling,born in 1993, M. S. candidate. Her research interests include public opinion propagation, big data.

        LI Jin,born in 1980,Ph. D. His research interests include public opinion big data, neural network.

        XIAO Renbin, born in 1965, Ph. D., professor. His research interests include complex system, complex social management.

        Trend prediction of public opinion propagation based on parameter inversion — an empirical study on Sina micro-blog

        LIU Qiaoling, LI Jin*, XIAO Renbin

        (SchoolofAutomation,HuazhongUniversityofScienceandTechnology,WuhanHubei430074,China)

        Concerning that the existing researches on public opinion propagation model are seldom combined with the practical opinion data and digging out the inherent law of public opinion propagation from the opinion big data is becoming an urgent problem, a parameter inversion algorithm of public opinion propagation model using neural network was proposed based on the practical opinion big data. A network opinion propagation model was constructed by improving the classical disease spreading Susceptible-Infective-Recovered (SIR) model. Based on this model, the parameter inversion algorithm was used to predict the network public opinion’s trend of actual cases. The proposed algorithm could accurately predict the specific heat value of public opinion compared with Markov prediction model.The experimental results show that the proposed algorithm has certain superiority in prediction and can be used for data fitting, process simulation and trend prediction of network emergency spreading.

        Sina micro-blog; Susceptible-Infective-Recovered (SIR) model; Back-Propagation (BP) neural network; parameter inversion; public opinion propagation

        2016-11-14;

        2016-12-14。 基金項(xiàng)目:國家自然科學(xué)基金資助項(xiàng)目(61540032)。

        劉巧玲(1993—),女,湖北當(dāng)陽人,碩士研究生,主要研究方向:輿情傳播、大數(shù)據(jù); 李勁(1980—),男,湖北武漢人,博士,主要研究方向:輿情大數(shù)據(jù)、神經(jīng)網(wǎng)絡(luò); 肖人彬(1965—),男,湖北武漢人,教授,博士,主要研究方向:復(fù)雜系統(tǒng)、復(fù)雜社會(huì)管理。

        1001-9081(2017)05-1419-05

        10.11772/j.issn.1001-9081.2017.05.1419

        TP393.09

        A

        猜你喜歡
        輿情反演神經(jīng)網(wǎng)絡(luò)
        反演對(duì)稱變換在解決平面幾何問題中的應(yīng)用
        神經(jīng)網(wǎng)絡(luò)抑制無線通信干擾探究
        電子制作(2019年19期)2019-11-23 08:42:00
        基于低頻軟約束的疊前AVA稀疏層反演
        基于自適應(yīng)遺傳算法的CSAMT一維反演
        輿情
        中國民政(2016年16期)2016-09-19 02:16:48
        輿情
        中國民政(2016年10期)2016-06-05 09:04:16
        基于神經(jīng)網(wǎng)絡(luò)的拉矯機(jī)控制模型建立
        輿情
        中國民政(2016年24期)2016-02-11 03:34:38
        復(fù)數(shù)神經(jīng)網(wǎng)絡(luò)在基于WiFi的室內(nèi)LBS應(yīng)用
        基于支持向量機(jī)回歸和RBF神經(jīng)網(wǎng)絡(luò)的PID整定
        亚洲va中文字幕| 中文字幕日韩精品永久在线| 手机在线观看免费av网站| 免费a级毛片无码av| 北条麻妃毛片在线视频| 日产精品一区二区免费| 李白姓白白又白类似的套路| 久久久亚洲精品一区二区三区| 欧美日韩久久久精品a片| 无码精品一区二区三区免费16| 不卡视频在线观看网站| 色综合久久久久综合99| 精品国产黑色丝袜高跟鞋| 亚洲AV无码久久久久调教| 日产一区日产2区日产| 国产成人a在线观看视频免费| 人妻无码中文人妻有码| 久久精品国产亚洲av蜜桃av| 亚洲av日韩一区二区| 亚洲成人色区| 国产亚洲精品福利在线| 人妻体体内射精一区中文字幕 | 亚洲麻豆av一区二区| 日本精品一区二区高清| 人妖在线一区二区三区| 亚洲午夜久久久久久久久久| 婷婷亚洲综合五月天小说| 东京热加勒比日韩精品| 免费av日韩一区二区| 国产成人亚洲综合色婷婷| 欧美日韩国产在线观看免费| 亚洲男人的天堂色偷偷| 亚洲av永久无码天堂网| 少妇高潮惨叫久久久久久| 亚洲精品一品二品av| 国产情侣自拍在线视频| 国语精品一区二区三区| 日本a在线免费观看| 日本一区二区三区高清视| 亚洲av无码一区二区三区乱子伦 | 一区二区三区亚洲免费|