摘 要:網(wǎng)絡(luò)輿情發(fā)展迅速,有效地實(shí)現(xiàn)話題的熱度預(yù)測對(duì)網(wǎng)絡(luò)輿情監(jiān)管和正確引導(dǎo)具有重要意義。為了實(shí)現(xiàn)對(duì)話題熱度的預(yù)測,并提高預(yù)測的精度,本文提出基于小波神經(jīng)網(wǎng)絡(luò)的話題熱度預(yù)測模型。首先經(jīng)過預(yù)處理分析發(fā)現(xiàn)熱點(diǎn)話題,然后選取具有熱度表征能力的指標(biāo)量化話題熱度,構(gòu)建出話題熱度指標(biāo)的時(shí)間序列模型,最后提出基于小波神經(jīng)網(wǎng)絡(luò)模型的話題熱度預(yù)測方法,預(yù)測出下一時(shí)間段的話題熱度值。實(shí)驗(yàn)結(jié)果顯示,與BP神經(jīng)網(wǎng)絡(luò)預(yù)測模型相比,本文提出的小波神經(jīng)網(wǎng)絡(luò)預(yù)測模型無論從預(yù)測曲線的擬合度還是絕對(duì)誤差標(biāo)準(zhǔn)差的數(shù)值上都具有更高的預(yù)測精度及穩(wěn)定性。
關(guān)鍵詞:網(wǎng)絡(luò)輿情;熱點(diǎn)話題;熱度預(yù)測;小波神經(jīng)網(wǎng)絡(luò)
中圖分類號(hào):TP391 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):2096-4706(2018)05-0074-05
Research on Topic Heat Prediction Model Based on Wavelet Neural Network
TAN Peng,LUO Shunlian,SUN Xiaosong,WANG Hui,LIANG Xiaohan
(Civil Aviation University of China,Tianjin 300300,Chima)
Abstract:With the rapid development of network public opinion,realizing the forecast of hot topic has great importance for supervision and correct guidance of network public opinion. In order to realize the prediction of the hot topic and improve the accuracy of prediction. This paper proposes a prediction model based on wavelet neural network. Firstly,analysis the text that has been pre-treated to find the hot topic,and then we select some typical characterizations of heat topic index to construct the time series of heat topic value. Finally,a topic heat prediction method based on wavelet neural network model is proposed to predict the topic heat value of the next period. The experimental results show that compared with BP neural network the prediction model proposed in this paper has higher prediction accuracy and stability whether in curve fitting or the numerical absolute error of standard deviation.
Keywords:internet public opinion;hot topic;heat prediction;wavelet neural network
0 引 言
隨著互聯(lián)網(wǎng)的快速發(fā)展,微博已經(jīng)成為人們生活中獲取與分享信息的重要網(wǎng)絡(luò)平臺(tái),網(wǎng)絡(luò)輿情在網(wǎng)絡(luò)平臺(tái)上形成迅速,具有巨大的社會(huì)影響力。對(duì)于國家政府機(jī)關(guān)來講,加大對(duì)網(wǎng)絡(luò)輿情的監(jiān)測力度,及時(shí)有效地預(yù)測輿情的發(fā)展趨勢并對(duì)其進(jìn)行正確的引導(dǎo),對(duì)于社會(huì)和諧穩(wěn)定、國家安全等都具有重要的現(xiàn)實(shí)意義[1,2]。因此,及時(shí)準(zhǔn)確地預(yù)測微博上話題的未來流行趨勢具有十分重要的意義。
近年隨著大眾對(duì)網(wǎng)絡(luò)輿情的參與度的提高,關(guān)于網(wǎng)絡(luò)輿情預(yù)測問題的研究日益增多[3-5]。目前依據(jù)預(yù)測的性能,可將網(wǎng)絡(luò)輿情預(yù)測的方法分為兩種。一種是線性網(wǎng)絡(luò)輿情預(yù)測方法,這類方法的優(yōu)點(diǎn)是比較簡單、容易實(shí)現(xiàn),但是現(xiàn)實(shí)中網(wǎng)絡(luò)輿情的發(fā)展變化并非呈現(xiàn)線性發(fā)展趨勢,這使得預(yù)測結(jié)果容易出現(xiàn)偏差,導(dǎo)致達(dá)不到理想的預(yù)測效果的情況發(fā)生。另一種是非線性預(yù)測方法,這類方法是基于非線性理論建模的,主要的預(yù)測模型有隱馬爾可夫模型、K近鄰方法、支持向量機(jī)以及神經(jīng)網(wǎng)絡(luò)等方法。與線性預(yù)測方法相比,網(wǎng)絡(luò)輿情的預(yù)測精度得到了一定程度上的提高[6-8]。為了提高預(yù)測的精準(zhǔn)度,部分研究人員提出一些將兩種或多種模型相結(jié)合的網(wǎng)絡(luò)輿情預(yù)測模型[9],這種預(yù)測模型可以更好地發(fā)揮各單一預(yù)測模型的優(yōu)勢,并彌補(bǔ)其不足,構(gòu)建出性能更加優(yōu)越的預(yù)測模型。如陳宇中等人將小波變換與差分自回歸移動(dòng)平均模型結(jié)合起來構(gòu)建了一種新的網(wǎng)絡(luò)輿情微博話題熱度預(yù)測模型[10],取得了不錯(cuò)的預(yù)測效果。
小波神經(jīng)網(wǎng)絡(luò)是結(jié)合小波變換與人工神經(jīng)網(wǎng)絡(luò)的思想而形成的,有效地融合了小波變換良好的頻域分辨率以及神經(jīng)網(wǎng)絡(luò)能充分逼近任一復(fù)雜的非線性關(guān)系、高速尋優(yōu)及自我學(xué)習(xí)能力的優(yōu)點(diǎn)。閆輝輝、朱智慧將小波神經(jīng)網(wǎng)絡(luò)應(yīng)用在醫(yī)學(xué)領(lǐng)域的血藥濃度預(yù)測上[11],取得了良好的預(yù)測效果。靳然、李生才為了準(zhǔn)確預(yù)測病蟲害,將小波神經(jīng)網(wǎng)絡(luò)應(yīng)用于農(nóng)業(yè)領(lǐng)域麥蚜發(fā)生期的預(yù)測[12],與BP神經(jīng)網(wǎng)絡(luò)的預(yù)測效果相比具有較高的預(yù)測精度。
1 基于小波神經(jīng)網(wǎng)絡(luò)的話題熱度預(yù)測模型
熱點(diǎn)話題的熱度隨著時(shí)間的發(fā)展呈現(xiàn)一定的變化規(guī)律,微博用戶之間通過評(píng)論、轉(zhuǎn)發(fā)、關(guān)注等行為組成一個(gè)互相連接的龐大的社交網(wǎng)絡(luò)。鑒于用戶與用戶之間這種弱聯(lián)系關(guān)系,本文選取話題的評(píng)論數(shù)、轉(zhuǎn)發(fā)數(shù)以及點(diǎn)贊數(shù)這些能直觀顯示熱度的表現(xiàn)形式構(gòu)建話題的熱度評(píng)價(jià)指標(biāo),并構(gòu)建小波神經(jīng)網(wǎng)絡(luò)預(yù)測模型實(shí)現(xiàn)對(duì)話題熱度的預(yù)測。本文構(gòu)建的基于小波神經(jīng)網(wǎng)絡(luò)的話題熱度預(yù)測模型框架如圖1所示。
1.1 數(shù)據(jù)預(yù)處理
微博平臺(tái)某一時(shí)段的博文聚焦多個(gè)話題,需要對(duì)微博博文數(shù)據(jù)進(jìn)行預(yù)處理,通過聚類的方法將微博話題分類,通過熱度篩選發(fā)現(xiàn)熱點(diǎn)話題。然后對(duì)熱點(diǎn)話題進(jìn)行進(jìn)一步剖析與研究。本文對(duì)微博博文進(jìn)行數(shù)據(jù)預(yù)處理的流程圖如圖2所示。
獲取的微博信息為文本信息,無法使用計(jì)算機(jī)直接進(jìn)行處理分析。為了將文本表示為計(jì)算機(jī)可以處理的數(shù)字化信息,本文采用VSM模型對(duì)待處理文本進(jìn)行特征抽取和加權(quán)處理,以實(shí)現(xiàn)文本向數(shù)字化表示的轉(zhuǎn)化。每條文本信息被表示成如公式1所示的形式。
其中,di表示文本的特征項(xiàng),wi表示特征項(xiàng)di的權(quán)重。
對(duì)于特征項(xiàng)選擇,使用文檔頻度DF的方法,對(duì)文本進(jìn)行分詞、去停用詞處理后得到一個(gè)單詞粒度的文本集合,以每個(gè)單詞作為一個(gè)特征項(xiàng),計(jì)算每個(gè)特征項(xiàng)相應(yīng)的頻度值,選取具有高表達(dá)文本能力的特征項(xiàng)。
通過篩選得到一組具有表征能力的特征項(xiàng)集合{d1,d2,…,dn}。使用定量統(tǒng)計(jì)法計(jì)算每條文本中特征項(xiàng)di的權(quán)重wi,權(quán)重越大,對(duì)文本來說越重要。通過特征選擇及權(quán)重計(jì)算將每條文本表示成如公式(1)形式的向量,實(shí)現(xiàn)對(duì)文本的建模。
實(shí)現(xiàn)對(duì)文本的建模后,根據(jù)話題間的語義距離對(duì)話題進(jìn)行分類。本文中微博話題的發(fā)現(xiàn)采用聚類的方法將文檔聚類成若干話題集合,同一集合之間文本相似度較高,不同集合之間相似度較低。由此,可以對(duì)互聯(lián)網(wǎng)上大量信息進(jìn)行整合,集中對(duì)某些話題進(jìn)行進(jìn)一步的處理。
基于k-means算法效率快、時(shí)間復(fù)雜度低等優(yōu)點(diǎn),本文采用劃分式的k-means聚類方法實(shí)現(xiàn)對(duì)建模后的微博文本信息的話題分類識(shí)別。首先從所有未分類數(shù)據(jù)中隨機(jī)選取K個(gè)對(duì)象作為初始話題類的中心,計(jì)算其余文本與K個(gè)初始話題中心的相似性即向量之間的距離,將每條文本歸類到距離最近的中心點(diǎn)所在的話題類。計(jì)算話題簇中所有點(diǎn)的算術(shù)平均值,更新話題中心向量,不斷重復(fù)這個(gè)過程直到算法收斂。
文本聚類不同于普通的數(shù)值數(shù)據(jù)的聚類,通過文本向量化,將文本之間的相似度的度量轉(zhuǎn)換成文本之間的距離的計(jì)算。兩個(gè)文本的距離值越小,它們的相似度越大,屬于同一類話題的概率就越大。本文采用歐氏距離(ED)來計(jì)算兩條文本之間的相似度。對(duì)于確定的兩條文本向量,采用公式(2)計(jì)算出文本之間的距離。其公式為:
其中,d1、d2均為n維向量,每個(gè)向量都表示一條文本信息,即通過VSM建模后表示的文本向量。
通過聚類算法對(duì)建模后的微博文本實(shí)現(xiàn)話題分類,使用通過特征篩選得到的特征向量集合{t1,t2,…,tn},發(fā)現(xiàn)k個(gè)話題{C1,C2,…,Ck},通過構(gòu)建的熱度度量指標(biāo)計(jì)算得到話題的熱度,對(duì)比不同話題之間的熱度值,選出熱度最高的話題作為熱點(diǎn)話題。
1.2 話題熱度預(yù)測模型小波神經(jīng)網(wǎng)絡(luò)的設(shè)計(jì)
經(jīng)過數(shù)據(jù)預(yù)處理階段后,發(fā)現(xiàn)熱點(diǎn)話題,需要對(duì)熱點(diǎn)話題的數(shù)據(jù)進(jìn)行分析,然后對(duì)分析后的數(shù)據(jù)建模,構(gòu)建合適的小波神經(jīng)網(wǎng)絡(luò),使用小波神經(jīng)網(wǎng)絡(luò)預(yù)測模型實(shí)現(xiàn)對(duì)話題熱度的預(yù)測。本文構(gòu)建的小波神經(jīng)網(wǎng)絡(luò)預(yù)測模型的框架圖如圖3所示。
1.2.1 話題熱度指標(biāo)及其時(shí)間序列的構(gòu)建
為了更好地抽取影響新浪微博話題熱度的特征向量,本文首先將微博博文定義為一個(gè)八元組W:
其中,
W.ID表示該微博的ID;
W.user表示該微博的發(fā)表用戶;
W.time表示該微博的發(fā)表時(shí)間;
W.text表示該微博的文本內(nèi)容;
W.comments表示該微博的評(píng)論文本;
W.comment_num表示該微博的當(dāng)前評(píng)論數(shù);
W.repost_num表示該微博的當(dāng)前轉(zhuǎn)發(fā)數(shù);
W.attitude_num表示該微博的當(dāng)前點(diǎn)贊數(shù);
微博的轉(zhuǎn)發(fā)和評(píng)論行為分別從傳播的廣度以及話題的討論深度兩個(gè)層面刻畫出微博的熱度。包含了用戶對(duì)這類微博話題的興趣以及用戶的情感表達(dá)等多種主觀情感。微博的評(píng)論數(shù)、轉(zhuǎn)發(fā)數(shù)、點(diǎn)贊數(shù)對(duì)于話題傳播的趨勢有重要影響,因此,本文選取話題h在時(shí)間t內(nèi)的相關(guān)微博的討論數(shù)量w_count、平均轉(zhuǎn)發(fā)量repost_avg、平均評(píng)論數(shù)comment_avg、平均點(diǎn)贊數(shù)attitude_avg作為衡量話題熱度的topic_hot指標(biāo)。各指標(biāo)的計(jì)算公式如下:
其中,表示在時(shí)間間隔t內(nèi)話題h的討論量。由各個(gè)熱度指標(biāo)綜合構(gòu)建話題熱度的計(jì)算公式,公式如下:
使用構(gòu)建的熱度公式(7)計(jì)算得出話題的topic_hot值,將此值以時(shí)間間隔為t,按時(shí)間序列存儲(chǔ)得到對(duì)應(yīng)的每一個(gè)時(shí)間點(diǎn)上的序列{S1,S2,S3,…,Sl},其中,Si表示第i個(gè)時(shí)間間隔內(nèi)話題的熱度topic_hot,對(duì)于時(shí)間序列{S1,S2,S3,…,Sl}的觀測值Sn,與之前d個(gè)觀測值間的是一種非線性映射關(guān)系,其關(guān)系為:
式中,d為維數(shù),f(sn-1,sn-2,…,sn-d)為非線性函數(shù)。
由公式(8)可知,f(sn-1,sn-2,…,sn-d)的構(gòu)建是實(shí)現(xiàn)話題熱度值序列預(yù)測的關(guān)鍵所在。因此,以{S1,S2,S3,…,Sl}為基礎(chǔ)構(gòu)建熱度值的訓(xùn)練樣本集,其中xi=[sn-1,sn-2,…,sn-d]T為熱度值的輸入樣本;ti=sn為熱度值的輸出樣本;N=l-d為訓(xùn)練樣本數(shù)目。利用該熱度值訓(xùn)練樣本訓(xùn)練小波神經(jīng)網(wǎng)絡(luò),可使訓(xùn)練后的小波神經(jīng)網(wǎng)絡(luò)逼近f(sn-1,sn-2,…,sn-d),進(jìn)而實(shí)現(xiàn)對(duì){S1,S2,S3,…,Sl}后續(xù)熱度值Sl+1的預(yù)測。
1.2.2 小波神經(jīng)網(wǎng)絡(luò)的構(gòu)建
小波神經(jīng)網(wǎng)絡(luò)是對(duì)BP神經(jīng)網(wǎng)絡(luò)進(jìn)行優(yōu)化的網(wǎng)絡(luò),將隱含層的傳遞參數(shù)替換為小波基函數(shù),綜合兩者的長處,使得網(wǎng)絡(luò)的學(xué)習(xí)能力得到提高,并且提高了預(yù)測的精度。小波神經(jīng)網(wǎng)絡(luò)預(yù)測模型的拓?fù)浣Y(jié)構(gòu)如圖4所示。
圖中,X1,X2,…,Xk是小波神經(jīng)網(wǎng)絡(luò)預(yù)測模型的輸入?yún)?shù),本文的輸入?yún)?shù)即為xi=[sn-1,sn-2,…,sn-d]T,Y1,Y2,…,Ym是小波神經(jīng)網(wǎng)絡(luò)預(yù)測模型的預(yù)測輸出,ti=Sl+1為本文的輸出結(jié)果,ωij和ωjk表示小波神經(jīng)網(wǎng)絡(luò)預(yù)測模型的權(quán)值。
由于不同維度的數(shù)據(jù)級(jí)別存在一定差異,數(shù)據(jù)級(jí)別差較大時(shí)會(huì)對(duì)網(wǎng)絡(luò)的預(yù)測性能造成較大的影響,為了解決這個(gè)問題,在預(yù)測之前首先對(duì)數(shù)據(jù)進(jìn)行歸一化處理。本文首先對(duì)所需預(yù)測的時(shí)間序列{S1,S2,S3,…,Sl}的數(shù)據(jù)進(jìn)行歸一化。采用MIN-MAX標(biāo)準(zhǔn)化方法對(duì)輸入的數(shù)據(jù)進(jìn)行歸一化處理:
構(gòu)建網(wǎng)絡(luò)時(shí),在網(wǎng)絡(luò)的隱含層采用的計(jì)算公式為:
其中,ωij表示輸入層到隱含層的權(quán)值;hj表示公式中所使用的小波基函數(shù),aj、bi分別表示為hj的伸縮及平移因子;本文hj函數(shù)采用Morlet函數(shù),其公式為:
輸出層采用的計(jì)算公式為:
其中,ωik表示隱含層到輸出層的權(quán)值;h(i)函數(shù)表示隱含層第i個(gè)節(jié)點(diǎn)的預(yù)測值;l、m分別表示為隱含層以及輸出層的節(jié)點(diǎn)數(shù)。
為使輸出結(jié)果最大限度地接近預(yù)期值,本文采用梯度修正法,修正網(wǎng)絡(luò)中的各個(gè)權(quán)值。
首先,計(jì)算當(dāng)前預(yù)測結(jié)果的誤差:
其中S為實(shí)際的結(jié)果值,S′為經(jīng)過小波神經(jīng)網(wǎng)絡(luò)計(jì)算得出的預(yù)測結(jié)果值;
其次,根據(jù)通過公式(13)計(jì)算得到的誤差e,修正ωij、aj、bi的值。
其中,、、是根據(jù)網(wǎng)絡(luò)的預(yù)測誤差計(jì)算得到的:
其中η為學(xué)習(xí)速率。
根據(jù)本文數(shù)據(jù)集的特點(diǎn)及實(shí)際的預(yù)測目標(biāo)將小波神經(jīng)網(wǎng)絡(luò)設(shè)置為4-n-1的結(jié)構(gòu),最大迭代次數(shù)選取較為適中值1000;學(xué)習(xí)速率η的值選取默認(rèn)最優(yōu)值0.9;系統(tǒng)精度選取適合本實(shí)驗(yàn)數(shù)據(jù)規(guī)模的值0.01。大多數(shù)隱藏層節(jié)點(diǎn)數(shù)n的選取,依靠實(shí)際研究問題通過人工試驗(yàn)選擇合適的值,隨著隱含層節(jié)點(diǎn)個(gè)數(shù)的增加,預(yù)測誤差呈現(xiàn)一定的規(guī)律,首先整體呈現(xiàn)減小趨勢,當(dāng)達(dá)到最優(yōu)值后,誤差整體會(huì)呈現(xiàn)增長趨勢。因此本文通過實(shí)驗(yàn)分析確定隱含層節(jié)點(diǎn)的個(gè)數(shù)。
為了確定隱含層n的值,本文通過仿真實(shí)驗(yàn)選取最優(yōu)值。隱藏層節(jié)點(diǎn)數(shù)n的候選值取1-15。對(duì)于每一個(gè)候選值,預(yù)測值選取15次獨(dú)立實(shí)驗(yàn)得到的平均相對(duì)誤差的均值作為結(jié)果,以降低實(shí)驗(yàn)偶然性,提高可信度。對(duì)于不同隱含層節(jié)點(diǎn)個(gè)數(shù)n所對(duì)應(yīng)的平均相對(duì)誤差的變化如圖5所示。
觀察圖5,當(dāng)小波神經(jīng)網(wǎng)絡(luò)隱含層節(jié)點(diǎn)數(shù)為9時(shí),平均相對(duì)誤差達(dá)到最優(yōu)值。針對(duì)本文使用的數(shù)據(jù)集的特點(diǎn),本文構(gòu)建出結(jié)構(gòu)為4-9-1的三層小波神經(jīng)網(wǎng)絡(luò)預(yù)測模型。本文使用如圖6所示的流程圖對(duì)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,以達(dá)到良好的預(yù)測結(jié)果。
2 實(shí)驗(yàn)結(jié)果分析
實(shí)驗(yàn)時(shí)選取新浪微博作為數(shù)據(jù)源,通過對(duì)已有數(shù)據(jù)包中2012年4月3日至4月8日的微博數(shù)據(jù)進(jìn)行熱點(diǎn)話題分析,發(fā)現(xiàn)熱點(diǎn)話題“攜程旅游網(wǎng)”事件。以此作為輿情分析的源事件進(jìn)行預(yù)測分析。使用1.2.1節(jié)中構(gòu)建的熱度指標(biāo)的計(jì)算公式(7),計(jì)算出時(shí)間間隔為三十分鐘的話題熱度序列,構(gòu)建出預(yù)測數(shù)據(jù)模型。預(yù)測模型部分?jǐn)?shù)據(jù)如表1所示。
實(shí)驗(yàn)使用MATLAB工具編程構(gòu)建出小波神經(jīng)網(wǎng)絡(luò)模型以及BP神經(jīng)網(wǎng)絡(luò)模型。按照80%、20%的比例將數(shù)據(jù)劃分為訓(xùn)練集和測試集。使用訓(xùn)練集數(shù)據(jù)對(duì)小波神經(jīng)網(wǎng)絡(luò)的性能進(jìn)行訓(xùn)練,以使其達(dá)到較高的預(yù)測精度,將測試集數(shù)據(jù)輸入訓(xùn)練好的小波神經(jīng)網(wǎng)絡(luò)中,得到預(yù)測輸出結(jié)果。為驗(yàn)證本文基于小波神經(jīng)網(wǎng)絡(luò)的建模預(yù)測方法的性能,選取BP神經(jīng)網(wǎng)絡(luò)作為對(duì)比實(shí)驗(yàn)。采用平均絕對(duì)百分比誤差(MAPE)以及絕對(duì)誤差標(biāo)準(zhǔn)差(AESD)兩個(gè)指標(biāo)來對(duì)預(yù)測模型的預(yù)測性能進(jìn)行評(píng)價(jià)。
假定任一話題為D,它某一時(shí)間段t內(nèi)的實(shí)際熱度值為e,預(yù)測出的熱度值為e′,則該話題在時(shí)間段t內(nèi)的熱度預(yù)測的絕對(duì)誤差A(yù)E為:
(20)
平均絕對(duì)誤差MAE的公式如下:
(21)
n個(gè)時(shí)間段內(nèi)的平均絕對(duì)百分比誤差MAPE為:
(22)
絕對(duì)誤差標(biāo)準(zhǔn)差A(yù)ESD為:
(23)
顯然,MAPE越小,說明預(yù)測的精度越高;AESD越小,說明預(yù)測的穩(wěn)定性越好。
小波神經(jīng)網(wǎng)絡(luò)以及BP神經(jīng)網(wǎng)絡(luò)的熱度預(yù)測值與真實(shí)熱度的對(duì)比圖及預(yù)測誤差對(duì)比圖如圖7和圖8所示。
通過對(duì)預(yù)測結(jié)果進(jìn)行分析,根據(jù)公式(22)、公式(23)計(jì)算得到的小波神經(jīng)網(wǎng)絡(luò)以及BP神經(jīng)網(wǎng)絡(luò)的MAPE及AESD如表2所示:
通過圖7、圖8和表2對(duì)比分析可以看出,與BP神經(jīng)網(wǎng)絡(luò)預(yù)測模型相比較,小波神經(jīng)網(wǎng)絡(luò)預(yù)測模型的預(yù)測結(jié)果曲線的擬合度高于BP神經(jīng)網(wǎng)絡(luò)模型的預(yù)測結(jié)果曲線的擬合度,且誤差曲線較之略低;而且小波神經(jīng)網(wǎng)絡(luò)的MAPE為6.582%,小于BP神經(jīng)網(wǎng)絡(luò)的MAPE為9.221%。無論從預(yù)測曲線的擬合度上來說,還是平均絕對(duì)百分比誤差及絕對(duì)誤差標(biāo)準(zhǔn)差的大小上來說,小波神經(jīng)網(wǎng)絡(luò)都具有更高的預(yù)測精度及穩(wěn)定性。
3 結(jié) 論
本文提出使用小波神經(jīng)網(wǎng)絡(luò)對(duì)話題的熱度進(jìn)行預(yù)測,通過實(shí)驗(yàn)分析表明本文提出的模型對(duì)話題熱度的預(yù)測具有有效性,并通過對(duì)比實(shí)驗(yàn)說明了本文提出的方法提高了預(yù)測的精度。但由于自然語言本身極其復(fù)雜,對(duì)自然語言的處理分析有待進(jìn)一步改善。下一步將從語義分析的角度進(jìn)行進(jìn)一步的研究。
參考文獻(xiàn):
[1] 劉洋.新媒體背景下涉警網(wǎng)絡(luò)輿情的應(yīng)對(duì)與引導(dǎo) [J].法制與社會(huì),2017(5):201-202.
[2] 張雪婷.企業(yè)面對(duì)網(wǎng)絡(luò)輿情的回應(yīng)博弈策略研究 [J].金融經(jīng)濟(jì),2017(2):125-126.
[3] 曹玖新,吳江林,石偉,等.新浪微博網(wǎng)信息傳播分析與預(yù)測 [J].計(jì)算機(jī)學(xué)報(bào),2014,37(4):779-790.
[4] 侯凱.微博中話題的傳播模型及熱點(diǎn)預(yù)測 [D].北京:北京郵電大學(xué),2015.
[5] 張博,李竹君.微博信息傳播效果研究綜述 [J].現(xiàn)代情報(bào),2017,37(1):165-171.
[6] 劉勘,李晶,劉萍.基于馬爾可夫鏈的輿情熱度趨勢分析 [J].計(jì)算機(jī)工程與應(yīng)用,2011,47(36):170-173.
[7] 鄧青,馬曄風(fēng),劉藝,等.基于BP神經(jīng)網(wǎng)絡(luò)的微博轉(zhuǎn)發(fā)量的預(yù)測 [J].清華大學(xué)學(xué)報(bào)(自然科學(xué)版),2015,55(12):1342-1347.
[8] 聶恩倫,陳黎,王亞強(qiáng),等.基于K近鄰的新話題熱度預(yù)測算法 [J].計(jì)算機(jī)科學(xué),2012,39(S1):257-260.
[9] 曾振東.基于灰色支持向量機(jī)的網(wǎng)絡(luò)輿情預(yù)測模型 [J].計(jì)算機(jī)應(yīng)用與軟件,2014,31(2):300-302+311.
[10] 陳羽中,方明月,郭文忠,等.基于小波變換與差分自回歸移動(dòng)平均模型的微博話題熱度預(yù)測 [J].模式識(shí)別與人工智能,2015,28(7):586-594.
[11] 閆輝輝,朱智慧,劉倫銘,等.基于小波神經(jīng)網(wǎng)絡(luò)時(shí)間序列模型預(yù)測血藥濃度的研究 [J].中國現(xiàn)代應(yīng)用藥學(xué),2016,33(11):1417-1422.
[12] Jin Ran,Li Shengcai. Comparison of occurrence periods of wheat aphids based on artifical neural network and wavelet neural network prediction systems [J]. Journal of Plant Protection,2016,43(3):353-361.
作者簡介:譚鵬(1996-),女,漢族,四川人。研究方向:輿情分析、軟件。