謝 康,姜國(guó)慶,郭杭鑫,劉 崢
(1.公安部第三研究所 網(wǎng)絡(luò)安全技術(shù)研發(fā)中心,上海 200031;2.上海工程技術(shù)大學(xué) 管理學(xué)院,上海 201620)
輿情產(chǎn)生后在網(wǎng)絡(luò)中容易被不斷發(fā)酵,原始輿情在多方面因素綜合影響下隨之異化,形成多個(gè)不切實(shí)際的網(wǎng)絡(luò)謠言。同時(shí)在信息傳播的過(guò)程中,隨著謠言不斷產(chǎn)生和擴(kuò)散,網(wǎng)絡(luò)輿情呈現(xiàn)出信息異化的典型特征。由于社交平臺(tái)實(shí)名制程度不高、網(wǎng)民綜合素質(zhì)不高等客觀原因的存在,如果監(jiān)管部門不采取措施對(duì)輿情進(jìn)行及時(shí)干預(yù),輿情的自由傳播會(huì)導(dǎo)致諸如網(wǎng)絡(luò)集群行為的發(fā)生,易產(chǎn)生負(fù)面的社會(huì)影響,威脅公共安全。因此,對(duì)輿情進(jìn)行監(jiān)控并建立謠言預(yù)警機(jī)制是政府監(jiān)管部門進(jìn)行立體化防控、維護(hù)社會(huì)穩(wěn)定以及增強(qiáng)政府公信力的關(guān)鍵。
目前已有許多學(xué)者對(duì)網(wǎng)絡(luò)輿情的預(yù)警機(jī)制進(jìn)行了定量研究。吳鋒[1]以高校突發(fā)事件網(wǎng)絡(luò)輿情為研究對(duì)象,構(gòu)建了高校公共安全評(píng)估系統(tǒng),運(yùn)用層次分析法對(duì)指標(biāo)檢測(cè)值進(jìn)行處理確定輿情發(fā)展等級(jí)。馬永軍等[2]提出正則化長(zhǎng)短時(shí)記憶(Regularization Long Short-Term Memory,Re-LSTM)網(wǎng)絡(luò)模型對(duì)食品安全網(wǎng)絡(luò)輿情預(yù)警機(jī)制進(jìn)行了研究。周琦萍等[3]以傳染病模型SIS(Susceptible-Infectious-Susceptible)為基礎(chǔ),考慮網(wǎng)絡(luò)輿情擴(kuò)散系數(shù)及遺忘率,提出了一種網(wǎng)絡(luò)輿情無(wú)監(jiān)督預(yù)警策略。孫玲芳等[4]運(yùn)用遺傳算法(Genetic Algorithm,GA)對(duì)BP(Back Propagation)神經(jīng)網(wǎng)絡(luò)的初始權(quán)值和閾值進(jìn)行優(yōu)化,構(gòu)建了基于BP 神經(jīng)網(wǎng)絡(luò)的遺傳算法的輿情發(fā)展預(yù)測(cè)模型。閆婷瑞等[5]將神經(jīng)網(wǎng)絡(luò)與實(shí)踐序列模型結(jié)合,提出一種自回歸-徑向基函數(shù)模型(AutoregRessive model-Radial Basis Function,AR-RBF)對(duì)輿情發(fā)展趨勢(shì)進(jìn)行了預(yù)測(cè)。楊文陽(yáng)[6]通過(guò)信息源理論與信息傳播理論的有機(jī)結(jié)合,提出一種GA 與貪心算法結(jié)合的改進(jìn)算法,研究了網(wǎng)絡(luò)輿情信息源優(yōu)化問(wèn)題。于營(yíng)等[7]針對(duì)復(fù)雜的網(wǎng)絡(luò)輿情數(shù)據(jù),提出一種改進(jìn)的經(jīng)驗(yàn)?zāi)B(tài)分解-自回歸極端梯度提升模型(Empirical Mode Decomposition-AutoRegressive model-XGBoost,EMD.ARXG)對(duì)輿情發(fā)展進(jìn)行了預(yù)測(cè),并與經(jīng)驗(yàn)?zāi)B(tài)分解-反向傳播神經(jīng)網(wǎng)絡(luò)(Empirical Mode Decomposition-Back Propagation Neural Network,EMD-BPNN)模型進(jìn)行了對(duì)比。莫贊等[8]針對(duì)傳統(tǒng)單一模型預(yù)測(cè)能力有限的問(wèn)題,提出一種基于經(jīng)驗(yàn)?zāi)B(tài)分解-自回歸組合模型用于網(wǎng)絡(luò)輿情的預(yù)測(cè)。李啟月等[9]針對(duì)網(wǎng)絡(luò)輿情預(yù)警等級(jí)難以界定問(wèn)題,基于系統(tǒng)安全降維理論將高維預(yù)警指標(biāo)及其影響因素轉(zhuǎn)化為低維指標(biāo),有效降低了預(yù)警難度。章留斌等[10]在現(xiàn)有研究基礎(chǔ)上,從社會(huì)學(xué)角度入手,基于社會(huì)安全閥理論結(jié)合灰色預(yù)測(cè)模型對(duì)微博某政務(wù)事件進(jìn)行了網(wǎng)絡(luò)預(yù)警模型研究。劉巧玲等[11]對(duì)傳統(tǒng)傳染病傳播模型SIR(Susceptible-Infective-Recovered)進(jìn)行改進(jìn),運(yùn)用爬蟲技術(shù)爬取新浪微博平臺(tái)熱點(diǎn)話題內(nèi)容的相關(guān)數(shù)據(jù)并進(jìn)行了參數(shù)反演,以此來(lái)預(yù)測(cè)網(wǎng)絡(luò)輿情的發(fā)展趨勢(shì)。
綜上所述,目前很多學(xué)者運(yùn)用不同的方法對(duì)輿情預(yù)警機(jī)制進(jìn)行了研究,但大多數(shù)研究方法僅僅對(duì)輿情熱點(diǎn)事件的數(shù)據(jù)進(jìn)行了簡(jiǎn)單的靜態(tài)預(yù)測(cè),此外在輿情發(fā)展預(yù)測(cè)指標(biāo)構(gòu)建上僅簡(jiǎn)單地考慮了一些影響社會(huì)關(guān)注度的因素。事實(shí)上,區(qū)別于其他領(lǐng)域的趨勢(shì)預(yù)測(cè),輿情預(yù)測(cè)具有一定的特殊性:一是輿情數(shù)據(jù)受眾多因素影響。在實(shí)際生活中,只有當(dāng)社會(huì)公眾激進(jìn)情緒達(dá)到一定程度才需要“預(yù)警”從而引起高度關(guān)注,因此僅考慮社會(huì)關(guān)注度無(wú)法真實(shí)反映輿情發(fā)展真實(shí)特點(diǎn),故無(wú)法全面預(yù)測(cè)輿情發(fā)展趨勢(shì)。二是輿情數(shù)據(jù)具有高實(shí)時(shí)性和動(dòng)態(tài)性,靜態(tài)模型使相關(guān)因素的自身規(guī)律無(wú)法表達(dá),故許多方法在處理輿情數(shù)據(jù)時(shí)存在一定局限性。
基于當(dāng)前研究的不足,本文的主要工作包括:1)以指標(biāo)能反映輿情發(fā)展特點(diǎn)為原則,構(gòu)建包含社會(huì)關(guān)注度和公眾對(duì)待輿情的態(tài)度兩個(gè)維度的指標(biāo)體系;2)運(yùn)用多因素GM(1,n)灰色預(yù)測(cè)模型對(duì)輿情發(fā)展趨勢(shì)進(jìn)行初步預(yù)測(cè),并運(yùn)用殘差修正原理對(duì)預(yù)測(cè)結(jié)果進(jìn)行一次修正;3)結(jié)合馬爾可夫理論,對(duì)結(jié)果進(jìn)行了二次修正,然后結(jié)合新陳代謝理論,固定預(yù)測(cè)序列長(zhǎng)度不變,進(jìn)一步提升模型預(yù)測(cè)精度;4)以“新疆棉”“成都四十九中”兩個(gè)事件為例,驗(yàn)證了新陳代謝馬爾可夫GM(1,n)模型對(duì)輿情預(yù)測(cè)具有良好的實(shí)用價(jià)值。
網(wǎng)絡(luò)輿情發(fā)展趨勢(shì)的預(yù)測(cè)受到多方面因素的影響,例如微博博主的影響力、微博內(nèi)容的呈現(xiàn)方式等,因此構(gòu)建合理的衡量輿情發(fā)展的指標(biāo)體系是研究輿情預(yù)警機(jī)制的關(guān)鍵。楊小溪等[12]基于信息生態(tài)理論,構(gòu)建了包括信息生態(tài)位寬度、信息繁衍狀態(tài)以及信息間競(jìng)爭(zhēng)與合作關(guān)系的輿情事件預(yù)警綜合評(píng)價(jià)指標(biāo)。張鵬等[13]構(gòu)建了包括網(wǎng)絡(luò)謠言狀態(tài)、網(wǎng)絡(luò)輿情熱度和網(wǎng)絡(luò)謠言趨勢(shì)的輿情發(fā)展評(píng)價(jià)指標(biāo)體系,盡管進(jìn)行了定量研究,但網(wǎng)絡(luò)謠言發(fā)展的衡量標(biāo)準(zhǔn)靠人為打分賦值,存在較強(qiáng)的主觀性;同時(shí),當(dāng)相關(guān)影響因素較多時(shí),容易導(dǎo)致預(yù)測(cè)結(jié)果的偏差。
考慮信息演化的特點(diǎn),輿情發(fā)展程度可以運(yùn)用社會(huì)關(guān)注度和公眾對(duì)待輿情的態(tài)度兩個(gè)方面來(lái)衡量[14]。社會(huì)關(guān)注度是指,原始輿情產(chǎn)生后,公眾通過(guò)搜索、瀏覽、評(píng)論、轉(zhuǎn)發(fā)、點(diǎn)贊等行為表達(dá)自己對(duì)事件的觀點(diǎn),反映了公眾對(duì)該事件的關(guān)注程度。輿情態(tài)度是社會(huì)公眾對(duì)待輿情信息的主觀反映,體現(xiàn)了社會(huì)公眾對(duì)輿情持續(xù)發(fā)展所表現(xiàn)的敏感度,決定了輿情發(fā)展的趨勢(shì),是預(yù)測(cè)輿情發(fā)展趨勢(shì)的關(guān)鍵因素。因此,綜合考慮影響輿情發(fā)展預(yù)測(cè)的重要因素和因素?cái)?shù)量對(duì)預(yù)測(cè)精度的影響,本文選取社會(huì)關(guān)注度和公眾輿情態(tài)度作為預(yù)測(cè)輿情發(fā)展的指標(biāo),其中社會(huì)關(guān)注度包含百度搜索指數(shù)、原創(chuàng)博文數(shù)量、博文評(píng)論量、博文轉(zhuǎn)發(fā)量和博文點(diǎn)贊數(shù)等5 個(gè)二級(jí)指標(biāo)。公眾輿情態(tài)度包含百度搜索指數(shù)變化率和原創(chuàng)信息變化率等2 個(gè)二級(jí)指標(biāo),指標(biāo)體系構(gòu)建如圖1 所示。
灰色系統(tǒng)是指部分信息已知、部分信息未知的“小樣本”以及“貧信息”不確定系統(tǒng),是用來(lái)解決信息不完備系統(tǒng)的數(shù)學(xué)方法[15]。灰色預(yù)測(cè)模型通過(guò)弱化原始數(shù)據(jù)的隨機(jī)性,使其轉(zhuǎn)化為有規(guī)律的新數(shù)列,通過(guò)求解一階線性微分方程,經(jīng)一次累減序列進(jìn)行還原可得到預(yù)測(cè)值。多因素GM(1,n)灰色預(yù)測(cè)模型構(gòu)建過(guò)程如下:
GM(1,n)模型通過(guò)將原始序列累加從而生成較規(guī)律的新序列,挖掘數(shù)據(jù)變化的潛在規(guī)律,從而對(duì)數(shù)據(jù)變化趨勢(shì)進(jìn)行預(yù)測(cè),但多因素GM(1,n)灰色預(yù)測(cè)模型通常用于預(yù)測(cè)數(shù)據(jù)量小、數(shù)據(jù)波動(dòng)不大的數(shù)據(jù)。由于輿情數(shù)據(jù)波動(dòng)性較大,易導(dǎo)致模型預(yù)測(cè)精度不高[16]。
馬爾可夫模型將隨機(jī)序列視為一個(gè)系統(tǒng),該系統(tǒng)在某時(shí)刻對(duì)應(yīng)的狀態(tài)僅取決于該系統(tǒng)上一時(shí)刻對(duì)應(yīng)的狀態(tài),通過(guò)不同狀態(tài)間轉(zhuǎn)移概率的概率預(yù)測(cè)系統(tǒng)發(fā)展的趨勢(shì),對(duì)預(yù)測(cè)波動(dòng)性較大的數(shù)據(jù)具有良好的實(shí)用性[17]。具體地,馬爾可夫GM(1,n)灰色預(yù)測(cè)模型的構(gòu)建過(guò)程如下:
1)狀態(tài)區(qū)間劃分。根據(jù)多因素GM(1,n)灰色預(yù)測(cè)模型預(yù)測(cè)的相對(duì)誤差做散點(diǎn)圖,散點(diǎn)圖內(nèi)每個(gè)區(qū)間對(duì)應(yīng)一種狀態(tài),記作狀態(tài)Ei。
2)轉(zhuǎn)移概率計(jì)算。記狀態(tài)Ei轉(zhuǎn)移到狀態(tài)Ej轉(zhuǎn)移所需次數(shù)為nij,區(qū)間數(shù)量為Ni,則轉(zhuǎn)移概率可以表示為:
3)預(yù)測(cè)值計(jì)算。假設(shè)某一時(shí)刻處于Ei狀態(tài),若概率矩陣中第k行滿足maxPij=Pkl,則下一時(shí)刻有很大可能從狀態(tài)Ei轉(zhuǎn)換到狀態(tài)Ej,此時(shí)預(yù)測(cè)區(qū)間為[E1i,E2i],取其中間值作為下時(shí)刻的預(yù)測(cè)值,即:
4)誤差計(jì)算。得到預(yù)測(cè)值后,計(jì)算相對(duì)誤差。
盡管理論上灰色預(yù)測(cè)模型可預(yù)測(cè)數(shù)據(jù)的數(shù)量是無(wú)限的,但隨著預(yù)測(cè)地不斷進(jìn)行,隨著預(yù)測(cè)數(shù)據(jù)增多,數(shù)據(jù)序列中“非真實(shí)值”數(shù)據(jù)的比例也逐漸增大,從而影響模型預(yù)測(cè)的數(shù)據(jù)精度。從數(shù)據(jù)序列維度角度看,隨著數(shù)據(jù)序列維度逐漸增大,預(yù)測(cè)系統(tǒng)被隨機(jī)性因素干擾,導(dǎo)致預(yù)測(cè)精度降低[18]。
同時(shí),新信息優(yōu)先理論認(rèn)為,新信息對(duì)事件的認(rèn)知能力要高于舊信息,故在預(yù)測(cè)模型中提高新信息的權(quán)重有利于模型預(yù)測(cè)精度的提升。綜合考慮數(shù)據(jù)長(zhǎng)度和數(shù)據(jù)維度兩方面對(duì)模型預(yù)測(cè)精度的影響,本文將新陳代謝理論與灰色預(yù)測(cè)模型相結(jié)合,在原始序列中取出固定的一部分?jǐn)?shù)據(jù)作為預(yù)測(cè)的訓(xùn)練樣本,當(dāng)模型完成階段性預(yù)測(cè)工作產(chǎn)生一個(gè)新數(shù)據(jù)時(shí),便會(huì)自動(dòng)去除序列中最舊的一個(gè)數(shù)據(jù),從而維持固定長(zhǎng)度的數(shù)據(jù)列,建立新的多因素GM(1,n)灰色預(yù)測(cè)模型。具體地,新陳代謝理論用數(shù)學(xué)模型可以表示為:
微博平臺(tái)具有即時(shí)、開放、互動(dòng)的特點(diǎn),網(wǎng)友可以隨時(shí)在微博平臺(tái)上瀏覽或參與熱點(diǎn)話題的討論。從微博發(fā)布的2020 年用戶發(fā)展報(bào)告可知,截至2020 年9 月,微博平臺(tái)月活用戶達(dá)5.11 億,日活用戶達(dá)2.24 億,因其更廣的社交圈子,微博平臺(tái)的消息也傳播得更快,同時(shí)微博的“熱搜”板塊聚集了每個(gè)時(shí)刻最受微博網(wǎng)友關(guān)注的話題,促使熱點(diǎn)話題更容易曝光于其他尚未對(duì)該事件形成初步認(rèn)識(shí)的網(wǎng)友,微博逐漸成為各類信息的第一產(chǎn)地,因此微博輿情管控具有十分重要的現(xiàn)實(shí)意義。本文以“新疆棉”事件作為本次研究的數(shù)據(jù)源進(jìn)行數(shù)據(jù)獲取,通過(guò)對(duì)數(shù)據(jù)的分析,對(duì)微博網(wǎng)絡(luò)輿情的預(yù)警機(jī)制研究。
“新疆棉”事件自爆發(fā)到逐漸平息時(shí)間段內(nèi)的百度搜索指數(shù)如圖2 所示,由圖可知該事件搜索熱度大致呈現(xiàn)“倒U”形,3 月25 日搜索量達(dá)到峰值90 370。
患者常規(guī)禁食8 h,禁飲4 h,所有患者均于術(shù)前進(jìn)行血常規(guī)及凝血功能檢查、血生化檢查包括血離子濃度和空腹血糖測(cè)定、肝、腎功能檢查、心電圖檢查。入手術(shù)室后開放靜脈通路,輸注復(fù)方氯化鈉液 8~10 mL/(kg·h),常規(guī)監(jiān)測(cè)血壓(BP),心率(HR),心電圖(ECG),脈搏氧飽和度(SpO2),呼吸頻率(RR),呼氣末二氧化碳分壓(PETCO2),并擺好截石體位。即刻采集患者非輸液側(cè)手指末梢血及動(dòng)脈血進(jìn)行血糖及血?dú)夥治觥?/p>
圖2 “新疆棉”事件的百度搜索指數(shù)Fig.2 Baidu search index of "Xinjiang cotton" event
本研究將“新疆棉”事件自2021 年3 月22 日至2021 年4月5 日的輿情數(shù)據(jù)作為樣本數(shù)據(jù),以“新疆棉”作為關(guān)鍵詞,通過(guò)網(wǎng)絡(luò)爬蟲爬取微博平臺(tái)“新疆棉”事件在該時(shí)間段內(nèi)每天的原創(chuàng)博文量、博文轉(zhuǎn)發(fā)量、博文評(píng)論量及博文點(diǎn)贊量,并根據(jù)百度搜索指數(shù)與原創(chuàng)博文量計(jì)算搜索變化率及原創(chuàng)信息變化率兩個(gè)指標(biāo)的數(shù)據(jù),具體數(shù)據(jù)如表1 所示。
表1 “新疆棉”事件的原始數(shù)據(jù)Tab.1 Raw data of "Xinjiang cotton" event
研究過(guò)程中,將3 月24 日至4 月2 日共10 d 的數(shù)據(jù)作為預(yù)測(cè)模型的訓(xùn)練集,其余3 d 的數(shù)據(jù)作為測(cè)試集。根據(jù)多因素GM(1,n)灰色預(yù)測(cè)模型構(gòu)建過(guò)程,可得:
由最小二乘參數(shù)估計(jì)可得:
由此可計(jì)算殘差修正前后GM(1,n)模型的預(yù)測(cè)值及誤差值如表2 所示。由表2 可知:GM(1,n)模型預(yù)測(cè)的平均相對(duì)誤差為12.937%,誤差率較高;而經(jīng)殘差修正后的GM(1,n)模型預(yù)測(cè)的平均相對(duì)誤差為1.388%,可見殘差修正可以提升模型預(yù)測(cè)的精度。
表2 殘差修正前后的GM(1,n)模型的誤差對(duì)比Tab.2 Error comparison of GM(1,n)model before and after residual correction
輿情發(fā)展趨勢(shì)預(yù)測(cè)的相對(duì)誤差散點(diǎn)圖如圖3 所示。根據(jù)散點(diǎn)的分布,將狀態(tài)分為4 個(gè)區(qū)間,分別為S1:[-0.4,-0.2),S2:[-0.2,0),S3:[0,0.2),S4:[0.2,0.4]。根據(jù)區(qū)間的劃分,各時(shí)刻預(yù)測(cè)的結(jié)果及所屬區(qū)間如表3所示。
圖3 狀態(tài)區(qū)間Fig.3 State intervals
表3 預(yù)測(cè)值所屬區(qū)間Tab.3 Intervals of predicted values
由表3 及式(10)、(11)可得轉(zhuǎn)移矩陣為:P(1)=,第10 時(shí)刻輿情處于S1狀態(tài),則由概率矩陣可知第11 時(shí)刻輿情最可能處于S4狀態(tài),此時(shí)=0.385,由此可計(jì)算預(yù)測(cè)區(qū)間為[0.385,0.462],則在第11 時(shí)刻輿情預(yù)測(cè)值為=0.426。同理,預(yù)測(cè)第12、13 時(shí)刻的輿情熱度時(shí),先計(jì)算轉(zhuǎn)移矩陣分別為:P(2)=,則在第12、13 時(shí)刻輿情預(yù)測(cè)值分別為0.343 和0.367。
設(shè)定序列長(zhǎng)度為10 固定不變,即在預(yù)測(cè)第12 時(shí)刻的輿情熱度時(shí),去掉第1 時(shí)刻同時(shí)增添第11 時(shí)刻的輿情熱度作為預(yù)測(cè)序列;同理,在預(yù)測(cè)第13 時(shí)刻的輿情熱度時(shí),去掉第2 時(shí)刻同時(shí)增添第12 時(shí)刻的輿情熱度作為預(yù)測(cè)序列。由此可計(jì)算第12 和第13 時(shí)刻輿情熱度預(yù)測(cè)值分別為0.358 和0.308。
針對(duì)“新疆棉”事件,不同預(yù)測(cè)模型的預(yù)測(cè)誤差對(duì)比如表4 所示。
表4 不同預(yù)測(cè)模型對(duì)“新疆棉”事件的預(yù)測(cè)誤差對(duì)比Tab.4 Prediction error comparison among different prediction models on “Xinjiang Cotton” event
由表4 可知,新陳代謝馬爾可夫GM(1,n)模型第12 和13 時(shí)刻的輿情熱度預(yù)測(cè)的相對(duì)誤差分別為1.172% 和5.519%,而隨機(jī)森林的相對(duì)誤差分別為6.591% 和10.020%。相較于GM(1,n)模型、馬爾可夫GM(1,n)模型和隨機(jī)森林模型,新陳代謝馬爾可夫GM(1,n)模型都體現(xiàn)出了更高的網(wǎng)絡(luò)輿情預(yù)測(cè)精度。
為進(jìn)一步驗(yàn)證模型的有效性,還選取“成都四十九中”5月10 日至5 月21 日的數(shù)據(jù)進(jìn)行驗(yàn)證,相關(guān)原始數(shù)據(jù)如表5 所示。對(duì)應(yīng)的模型間預(yù)測(cè)誤差對(duì)比如表6 所示。由表6 可知,針對(duì)“成都四十九中”事件,新陳代謝馬爾可夫GM(1,n)模型對(duì)輿情的預(yù)測(cè)精度同樣要顯著高于其他預(yù)測(cè)模型,這進(jìn)一步說(shuō)明了陳代謝馬爾可夫GM(1,n)模型在網(wǎng)絡(luò)輿情預(yù)警方面具有良好的性能。
表5 “成都四十九中”事件的原始數(shù)據(jù)Tab.5 Raw data of “Chengdu No.49 middle school” event
表6 不同預(yù)測(cè)模型對(duì)“成都四十九中”事件的預(yù)測(cè)誤差對(duì)比Tab.6 Prediction error comparison among different prediction models on “Chengdu No.49 middle school” event
網(wǎng)絡(luò)輿情的演化可能對(duì)社會(huì)穩(wěn)定造成負(fù)面的影響,同時(shí)科學(xué)的輿情發(fā)展分析可以更有效地把握輿情演化,因此輿情預(yù)警機(jī)制的研究具有重要的現(xiàn)實(shí)意義,本文將社會(huì)關(guān)注度與網(wǎng)民輿情態(tài)度作為一級(jí)指標(biāo)構(gòu)建了輿情預(yù)警指標(biāo)體系,在傳統(tǒng)多因素GM(1,n)模型基礎(chǔ)上進(jìn)行改進(jìn),并建立了新陳代謝馬爾可夫GM(1,n)預(yù)測(cè)模型,最后以“新疆棉”事件和“成都四十九中”事件作為案例,通過(guò)模型改進(jìn)前后的縱向?qū)Ρ纫约芭c隨機(jī)森林預(yù)測(cè)模型的橫向?qū)Ρ?,?yàn)證該模型對(duì)輿情預(yù)測(cè)具有良好的預(yù)測(cè)精度。由預(yù)測(cè)結(jié)果誤差對(duì)比可知:新陳代謝馬爾可夫GM(1,n)模型在網(wǎng)絡(luò)輿情預(yù)警方面具有良好的性能。
但本文僅針對(duì)微博平臺(tái)和百度平臺(tái)數(shù)據(jù)進(jìn)行了研究分析,在今后的研究中,將重點(diǎn)對(duì)其他網(wǎng)絡(luò)平臺(tái)的數(shù)據(jù)進(jìn)行深入研究,以提高模型預(yù)測(cè)的普適性。