馬曉晗,羅文華
(中國(guó)刑事警察學(xué)院 公安信息技術(shù)與情報(bào)學(xué)院,遼寧 沈陽(yáng) 110035)
新一輪的科技革命推動(dòng)了互聯(lián)網(wǎng)及相關(guān)領(lǐng)域的迅猛發(fā)展,而互聯(lián)網(wǎng)技術(shù)的不斷革新又進(jìn)一步衍生出了微博、快手等基于網(wǎng)絡(luò)的社交媒體或平臺(tái),上述產(chǎn)品的快速普及在很大程度上打破了傳統(tǒng)媒體對(duì)話語(yǔ)權(quán)的壟斷,互聯(lián)網(wǎng)中的每一個(gè)個(gè)體都有了“直抒胸臆”的機(jī)會(huì),這在疏通民意的同時(shí),也增加了潛在的輿論風(fēng)險(xiǎn)[1]。特別是近年來(lái)社會(huì)影響較大的網(wǎng)絡(luò)輿情事件,如不能及時(shí)對(duì)其進(jìn)行預(yù)警,將很容易演化為社會(huì)中的不穩(wěn)定因素。為此,本文基于40 起具有一定影響力的網(wǎng)絡(luò)輿情事件,構(gòu)建基于動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)的輿情預(yù)警模型,期冀為網(wǎng)絡(luò)輿情的治理提供有益支持。
動(dòng)態(tài)貝葉斯模型相對(duì)于傳統(tǒng)的靜態(tài)貝葉斯模型,主要增加了時(shí)間因素的考量,形成了一個(gè)包含對(duì)于時(shí)間因素具有處理能力的隨機(jī)模型。動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)中的“動(dòng)態(tài)”是指模型中的某些變量隨著時(shí)間的變化而變化,但其模型結(jié)構(gòu)是固定的。
動(dòng)態(tài)貝葉斯模型中的變量值隨著時(shí)間的變化而變化,模型的結(jié)構(gòu)始終不發(fā)生改變[2]。因此,基于動(dòng)態(tài)貝葉斯描述的網(wǎng)絡(luò)輿情事件從時(shí)間角度來(lái)看具有動(dòng)態(tài)性,所描繪的情景符合事件發(fā)展的客觀規(guī)律。本文中使用動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)綜合概率統(tǒng)計(jì)與專(zhuān)家評(píng)價(jià)的方法[3],對(duì)收集和整理好的數(shù)據(jù)進(jìn)行計(jì)算。動(dòng)態(tài)貝葉斯模型主要由初始狀態(tài)的貝葉斯網(wǎng)絡(luò)和具有兩個(gè)或者兩個(gè)以上時(shí)間片段的貝葉斯網(wǎng)絡(luò)構(gòu)成,具體結(jié)構(gòu)如圖1 所示。
圖1 動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)示例
本文以動(dòng)態(tài)貝葉斯為工具,建立多指標(biāo)、多維度的網(wǎng)絡(luò)輿情事件預(yù)警模型,在完成建模后,對(duì)可能影響輿情發(fā)展的主要要素進(jìn)行分析。同時(shí),使用動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)作為網(wǎng)絡(luò)輿情預(yù)警的工具時(shí),應(yīng)當(dāng)注意以下條件:動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)作為傳統(tǒng)靜態(tài)貝葉斯網(wǎng)絡(luò)的延伸,同樣采用概率積分來(lái)對(duì)不確定性進(jìn)行描述,對(duì)于概率積分,相關(guān)聯(lián)事件的概率為其最基本的規(guī)則,具體闡述如下
其中,P(M,N)表示M 事件和N 事件實(shí)際會(huì)發(fā)生的概率,P(N)表示事件N 發(fā)生的絕對(duì)概率,P(M/N)則指的是在事件N 發(fā)生的情況下,事件M 發(fā)生的概率,在多數(shù)的應(yīng)用研究中,式(1)常可以轉(zhuǎn)化為下式
從動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)的角度分析,假設(shè)x 為貝葉斯網(wǎng)絡(luò)中父節(jié)點(diǎn)的集合,y 為貝葉斯網(wǎng)絡(luò)中子節(jié)點(diǎn)的集合,則可以得出x 指向y,其中集合x(chóng) 包含e 個(gè)子元。所謂的動(dòng)態(tài)貝葉斯網(wǎng)絡(luò),指的是在傳統(tǒng)貝葉斯網(wǎng)絡(luò)的基礎(chǔ)上增加了時(shí)間元素,在增加完時(shí)間元素后,事件的發(fā)展過(guò)程便可在“時(shí)間軸”上進(jìn)行展開(kāi),使得在對(duì)事件的演變過(guò)程進(jìn)行分析時(shí),更加符合客觀規(guī)律?,F(xiàn)假設(shè)有T 個(gè)時(shí)間片,有f 個(gè)可以被觀測(cè)的節(jié)點(diǎn)和e 個(gè)無(wú)法被觀測(cè)、隱藏的節(jié)點(diǎn),xij表示第j 個(gè)時(shí)間片的第i 個(gè)節(jié)點(diǎn)的狀態(tài),可以得出
其中,k∈[1,e],i∈[1,T],j∈[1,f]。
將輿情預(yù)警網(wǎng)絡(luò)結(jié)構(gòu)劃分為結(jié)果層、準(zhǔn)則層、指標(biāo)層三個(gè)層次,其中輿情是否預(yù)警作為結(jié)果層節(jié)點(diǎn),準(zhǔn)則層節(jié)點(diǎn)則由主體效力、媒介效力、本體屬性三類(lèi)指標(biāo)構(gòu)成,指標(biāo)層則由評(píng)論增長(zhǎng)速率、點(diǎn)贊增長(zhǎng)速率等具體指標(biāo)構(gòu)成,整體結(jié)構(gòu)如圖2 所示。
圖2 輿情預(yù)警模型網(wǎng)絡(luò)結(jié)構(gòu)
本文抽取了2010 年至2021 年這11 年間的40 個(gè)較為典型的網(wǎng)絡(luò)輿情事件作為研究案例,構(gòu)建用于模型訓(xùn)練的歷史案例數(shù)據(jù)庫(kù),具體研究案例如表1 所示。
表1 訓(xùn)練集網(wǎng)絡(luò)輿情事例
基于動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)的網(wǎng)絡(luò)輿情預(yù)警模型的指標(biāo)體系主要由主體效力、媒介效力和本體屬性三個(gè)部分構(gòu)成,表2 列出了上述指標(biāo)的具體劃分。
表2 評(píng)價(jià)指標(biāo)及具體屬性
在確定網(wǎng)絡(luò)輿情預(yù)警模型的案例指標(biāo)體系后,需要對(duì)指標(biāo)進(jìn)行具體的量化,指標(biāo)量化主要依據(jù)專(zhuān)家意見(jiàn),將以上指標(biāo)劃分為高、中、低三個(gè)等級(jí),具體量化方法如下。
(1)評(píng)論增長(zhǎng)速率:將所有網(wǎng)絡(luò)輿情事件的持續(xù)過(guò)程劃分為前期、中期、后期三個(gè)階段進(jìn)行分析,該指標(biāo)依據(jù)“新浪微博”、“騰訊微博”等主要社交平臺(tái)的統(tǒng)計(jì)數(shù)據(jù)予以確定,每日評(píng)論數(shù)增長(zhǎng)在0~100 記為“低”,101~500 記為“中”,501 以上的記為“高”。
(2)點(diǎn)贊增長(zhǎng)速率:將所有網(wǎng)絡(luò)輿情事件的持續(xù)過(guò)程劃分為前期、中期、后期三個(gè)階段進(jìn)行分析,該指標(biāo)依據(jù)“新浪微博”、“騰訊微博”等主要社交平臺(tái)的統(tǒng)計(jì)數(shù)據(jù)予以確定,每日點(diǎn)贊數(shù)增長(zhǎng)在100~500記為“低”,501~1 000 記為“中”,1 000 以上的記為“高”。
(3)轉(zhuǎn)發(fā)增長(zhǎng)速率:將所有網(wǎng)絡(luò)輿情事件的持續(xù)過(guò)程劃分為前期、中期、后期三個(gè)階段進(jìn)行分析,該指標(biāo)依據(jù)“新浪微博”、“騰訊微博”等主要社交平臺(tái)的統(tǒng)計(jì)數(shù)據(jù)予以確定,每日轉(zhuǎn)發(fā)數(shù)增長(zhǎng)在0~50 記為“低”,51~200 記為“中”,200 以上的記為“高”。
(4)媒體指數(shù)變化速率:將所有網(wǎng)絡(luò)輿情事件的持續(xù)過(guò)程劃分為前期、中期、后期三個(gè)階段進(jìn)行分析,該指數(shù)表明了互聯(lián)網(wǎng)用戶對(duì)關(guān)鍵詞搜索的關(guān)注程度及持續(xù)變化的情況,以“百度指數(shù)”中“搜索指數(shù)”的數(shù)據(jù)為基礎(chǔ),每日搜索指數(shù)增長(zhǎng)在0~30 記為“低”,31~100 記為“中”,100 以上的記為“高”。
(5)咨詢指數(shù)變化速率:該指數(shù)主要統(tǒng)計(jì)網(wǎng)絡(luò)中新聞資訊對(duì)特定關(guān)鍵詞的關(guān)注及報(bào)道程度的持續(xù)變化,以“百度指數(shù)”中“咨詢指數(shù)”的數(shù)據(jù)為基礎(chǔ)。將所有網(wǎng)絡(luò)輿情事件的持續(xù)過(guò)程劃分為前期、中期、后期三個(gè)階段進(jìn)行分析,每日咨詢指數(shù)增長(zhǎng)在0~100 記為“低”,101~300 記為“中”,301 以上記為“高”。
(6)事件敏感程度:該指標(biāo)來(lái)源于專(zhuān)家評(píng)價(jià)。網(wǎng)絡(luò)輿情事件涉及很多種類(lèi),當(dāng)輿情事件的主題涉及到公檢法司、城鄉(xiāng)差異、利益分配等敏感問(wèn)題時(shí),輿情發(fā)酵的概率就大大增加,因此,根據(jù)歷史事件庫(kù)中案例的事件類(lèi)型,通過(guò)專(zhuān)家調(diào)查,將事件敏感程度分為低、中、高三個(gè)等級(jí)。
(7)輿情準(zhǔn)確率:該指標(biāo)來(lái)源于專(zhuān)家評(píng)價(jià)。網(wǎng)絡(luò)時(shí)代某些自媒體可能出于博人眼球、賺取熱度的目的而出現(xiàn)主觀片面報(bào)道的情況,因此,綜合專(zhuān)家調(diào)查意見(jiàn),將輿情準(zhǔn)確率劃分為低、中、高三個(gè)等級(jí)。
將訓(xùn)練實(shí)例庫(kù)中的案例整合為訓(xùn)練集,導(dǎo)入到模型中,得到訓(xùn)練后的模型,如圖3 所示。
圖3 模型訓(xùn)練結(jié)果
將河南醉駕女撞寶馬事件導(dǎo)入訓(xùn)練完畢后的模型中,得到如圖4 所示的輸出結(jié)果,首先將該事件以時(shí)間軸為線索進(jìn)行展開(kāi),對(duì)事件的前因后果進(jìn)行梳理,進(jìn)而剖析網(wǎng)絡(luò)輿情發(fā)酵原因,為輿情的管控提出建議和對(duì)策。
圖4 醉駕女撞寶馬事件模型輸出結(jié)果
(1)情景展開(kāi)。通過(guò)分析得出,河南醉駕女撞寶馬事件是一起具有極大發(fā)酵可能性的網(wǎng)絡(luò)輿情事件。通過(guò)對(duì)基礎(chǔ)數(shù)據(jù)進(jìn)行分析,發(fā)現(xiàn)該事件發(fā)生初期轉(zhuǎn)發(fā)增長(zhǎng)速率為中,評(píng)論增長(zhǎng)速率為高,點(diǎn)贊增長(zhǎng)速率為高,隨著事件的不斷演化,到了該網(wǎng)絡(luò)輿情事件的中期,隨著事件真相的不斷澄清,大眾網(wǎng)民在微博大型社交平臺(tái)上對(duì)于該輿情的熱度呈現(xiàn)降低的趨勢(shì),評(píng)論增長(zhǎng)速率降低為中,點(diǎn)贊增長(zhǎng)速率降低為中,轉(zhuǎn)發(fā)增長(zhǎng)速率降為低,到了事件末期,三個(gè)指標(biāo)的值均出現(xiàn)了一定程度的上升,網(wǎng)民對(duì)于該事件的討論熱情增加。從搜索指數(shù)變化速率和咨詢指數(shù)變化速率兩個(gè)方面來(lái)看,搜索指數(shù)變化速率在前中期均為中,到事件后期變?yōu)楦?,這從很大程度上說(shuō)明了網(wǎng)民對(duì)此事件的熱衷程度是呈現(xiàn)先下降后上升的軌跡,綜合咨詢指數(shù),同樣呈現(xiàn)出先下降后上升的波動(dòng)路線。利用動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)的時(shí)間因素處理優(yōu)勢(shì)對(duì)事件進(jìn)行情景展開(kāi)[4],更加客觀地還原了事件原貌,為進(jìn)一步進(jìn)行輿情分析打下了基礎(chǔ)。
(2)事件分析。1)輿情本體敏感程度高。2019 年7 月3 日晚,事件發(fā)生伊始,微博、豆瓣等各大社交媒體上就有相應(yīng)的視頻流出,視頻中較為完整地記錄了事件過(guò)程,肇事者譚某在清楚酒后駕駛違法的情況下,不顧他人勸阻,在市區(qū)內(nèi)超速行駛,從而造成重大交通事故,被撞車(chē)內(nèi)的三人中兩人死亡一人重傷,其蔑視他人生命的行為觸碰了網(wǎng)民的底線,因此,輿情本體敏感程度為“高”,極易導(dǎo)致網(wǎng)絡(luò)輿論的產(chǎn)生。2)輿情準(zhǔn)確性欠缺。事件發(fā)生后,涉事人的相關(guān)信息就在網(wǎng)上快速傳播,涉事車(chē)輛為世界高端汽車(chē)品牌瑪莎拉蒂,被撞車(chē)輛是寶馬,兩輛豪車(chē)發(fā)生的車(chē)禍給人留下巨大的想象空間?,斏佘?chē)上三人的信息亦被扒出,“肇事車(chē)輛價(jià)值不菲”等信息在網(wǎng)上廣為流傳,此類(lèi)信息雖然存在一定的客觀事實(shí),但有大量社交“大V”出于博人眼球的目的,往往對(duì)這些“半成品”信息進(jìn)行二次加工,使輿情本身的準(zhǔn)確性大大降低,輿情準(zhǔn)確性為“低”。因此,在網(wǎng)絡(luò)輿情蔓延的初期,其內(nèi)容很容易與實(shí)際情況產(chǎn)生偏差,進(jìn)而為輿情的爆發(fā)埋下伏筆。有關(guān)部門(mén)在輿情發(fā)生伊始就應(yīng)該及時(shí)通過(guò)各種方式向公眾說(shuō)明情況,澄清事實(shí),這樣才能將涉網(wǎng)輿情的“火苗”及時(shí)“撲滅”[5]。3)網(wǎng)民關(guān)注度高。2020 年1 月中旬,“醉駕女撞寶馬案”開(kāi)庭審理,經(jīng)過(guò)檢索,該事件在全網(wǎng)的信息量達(dá)到10 萬(wàn)級(jí)別,微博、抖音等知名社交或者短視頻平臺(tái)均成為輿論發(fā)酵的主戰(zhàn)場(chǎng)。以微博為例,熱搜話題“瑪莎拉蒂醉駕案開(kāi)庭審理”在全網(wǎng)的信息量接近5 萬(wàn)條,“醉駕瑪莎拉蒂撞寶馬案16 日開(kāi)庭”的相關(guān)話題閱讀量近3.3 億次,評(píng)論數(shù)達(dá)到1.9 萬(wàn),在庭審的過(guò)程中,“瑪莎拉蒂司機(jī)下跪道歉遭拒”同樣獲得4.2 億次的相關(guān)搜索和閱讀。因此,當(dāng)網(wǎng)民對(duì)于某輿情事件的關(guān)注度極高,對(duì)某一事件閱讀、評(píng)論的頻次顯著高于其他網(wǎng)絡(luò)事件時(shí),該事件引發(fā)網(wǎng)絡(luò)輿論概率極大,相關(guān)部門(mén)要及時(shí)采取行動(dòng),例如撤銷(xiāo)熱搜等較為強(qiáng)硬的手段,才能遏制輿論風(fēng)暴的發(fā)生。
本文基于動(dòng)態(tài)貝葉斯構(gòu)建網(wǎng)絡(luò)輿情預(yù)警模型,對(duì)網(wǎng)絡(luò)輿情從另一個(gè)角度進(jìn)行了研究。首先,對(duì)動(dòng)態(tài)貝葉斯的基本理論進(jìn)行了闡述,然后,結(jié)合專(zhuān)家意見(jiàn)和現(xiàn)實(shí)情況,構(gòu)建了基于動(dòng)態(tài)貝葉斯的網(wǎng)絡(luò)輿情預(yù)警模型。在完成建模后,對(duì)歷史事件庫(kù)中的事件進(jìn)行指標(biāo)體系的構(gòu)建與數(shù)據(jù)的量化。在數(shù)據(jù)歸納整理的過(guò)程中,遵循準(zhǔn)確、客觀、易收集的原則,最大限度地保證了數(shù)據(jù)的完整性,隨后將“河南醉駕女撞寶馬”作為測(cè)試用例導(dǎo)入模型,測(cè)試結(jié)果較為充分地說(shuō)明了模型的有效性。