馮蘭萍 董陳超 徐緒堪
(1.河海大學(xué)商學(xué)院 常州 213022;2.東南大學(xué) 經(jīng)濟(jì)管理學(xué)院 南京 211189;3.常州工業(yè)大數(shù)據(jù)挖掘與知識(shí)管理重點(diǎn)實(shí)驗(yàn)室 常州 213022)
社交媒體的謠言識(shí)別現(xiàn)已得到學(xué)術(shù)界廣泛深入的研究,主要采用傳統(tǒng)的機(jī)器學(xué)習(xí)方法和深度學(xué)習(xí)方法,在微博內(nèi)容特征的基礎(chǔ)上融入更多的輔助特征提升實(shí)時(shí)謠言識(shí)別效果[1]。微博謠言特征主要包括用戶特征、內(nèi)容特征和傳播特征,突發(fā)公共衛(wèi)生事件微博謠言內(nèi)容通常具有一些固定的句式[2],同時(shí)存在較多與疫情相關(guān)的語(yǔ)詞,且分布較為分散;用戶歷史微博情感對(duì)謠言識(shí)別有輔助作用[1,3],且用戶特征和傳播特征并不隨著領(lǐng)域的不同而產(chǎn)生差別[4],因而用戶歷史特征對(duì)謠言識(shí)別亦有一定的輔助作用,而多特征融合中引入用戶歷史特征的研究相對(duì)不多。因此如何充分抽取謠言的關(guān)鍵特征,構(gòu)建多特征融合的謠言識(shí)別模型,提高謠言識(shí)別效果;探討各特征對(duì)謠言識(shí)別的影響,為政府及相關(guān)部門謠言治理、用戶謠言識(shí)別提供參考,是本文研究的問(wèn)題。
相對(duì)于傳統(tǒng)的機(jī)器學(xué)習(xí),深度學(xué)習(xí)自動(dòng)構(gòu)建特征可進(jìn)一步提升謠言檢測(cè)的準(zhǔn)確性與穩(wěn)定性[4]。因此,本文以微博數(shù)據(jù)為研究對(duì)象,提出一種基于混合神經(jīng)網(wǎng)絡(luò)的多特征融合謠言識(shí)別模型。該模型引入用戶歷史特征,充分利用BiLSTM和CNN的優(yōu)勢(shì),采用BiLSTM+CNN抽取微博代表性深度語(yǔ)義特征,與其它多特征融合后,使用全連接DNN網(wǎng)絡(luò)進(jìn)行謠言識(shí)別,在此基礎(chǔ)上分析各個(gè)特征對(duì)謠言識(shí)別的影響,為謠言自動(dòng)識(shí)別研究提供新的思路。
社交媒體謠言識(shí)別主要包括模型和方法選取、特征抽取及其基礎(chǔ)上的謠言判定[5]。
a.在模型和方法方面。傳統(tǒng)的機(jī)器學(xué)習(xí)方法有支持向量機(jī)[5-6]、隨機(jī)森林[7]、決策樹(shù)[8]等,由于分類算法對(duì)謠言的識(shí)別效果有很大影響,因此主要集中于分類算法的選擇和改進(jìn)、特征的有效識(shí)別[9]。深度學(xué)習(xí)因其強(qiáng)大的學(xué)習(xí)能力,不需要人工構(gòu)建特征在謠言識(shí)別領(lǐng)域得到了廣泛的關(guān)注。Ma等[10]通過(guò)構(gòu)建循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)模型首次對(duì)微博謠言事件進(jìn)行檢測(cè),提高了謠言事件自動(dòng)檢測(cè)的效率。尹鵬博等[3]采用卷積神經(jīng)網(wǎng)絡(luò)(CNN)和LSTM分別提取用戶特征和微博文本特征,提出基于C-LSTM的檢測(cè)模型進(jìn)行早期謠言檢測(cè)。趙月華等[11]針對(duì)小樣本領(lǐng)域提出基于BERT虛假信息識(shí)別模型。石鍇文等[2]構(gòu)建BiLSTM+DNN模型對(duì)多特征向量進(jìn)行謠言判別。劉勘等[4]將深度遷移網(wǎng)絡(luò)應(yīng)用于跨領(lǐng)域謠言識(shí)別。Chen等[12]提出注意力機(jī)制與RNN相結(jié)合的謠言檢測(cè)模型,能更準(zhǔn)確地檢測(cè)早期謠言。潘德宇等[13]在CNN網(wǎng)絡(luò)引入了注意力機(jī)制,獲得較好地識(shí)別效果。現(xiàn)有研究多采用單一的CNN、RNN及衍生網(wǎng)絡(luò)進(jìn)行謠言識(shí)別,或者利用注意力機(jī)制作對(duì)已提取特征進(jìn)一步提取關(guān)鍵信息,以提高謠言識(shí)別的精度。但是未能充分利用RNN和CNN網(wǎng)絡(luò)提取文本語(yǔ)義的優(yōu)勢(shì),因而謠言識(shí)別效果仍存在一定的提升空間。
b.在特征抽取挖掘方面。通常在社交媒體謠言檢測(cè)中用到的特征主要有用戶特征、內(nèi)容特征和傳播特征[9]。例如,Castillo 等[8]從字符串長(zhǎng)度、詞語(yǔ)個(gè)數(shù)、符號(hào)(問(wèn)號(hào)、感嘆號(hào)、微笑和皺眉等)、標(biāo)簽、鏈接等維度對(duì)文本特征細(xì)分。賀剛等[14]認(rèn)為淺層的文本特征難以反映微博文本內(nèi)容的可信度,在Yang等[15]提出的微博文本內(nèi)容、用戶屬性信息和傳播深度3個(gè)特征的基礎(chǔ)上,引入了文本的符號(hào)、鏈接、關(guān)鍵詞分布以及時(shí)間差四類新特征。首歡容等[16]構(gòu)建基于情感分析的領(lǐng)域謠言自動(dòng)識(shí)別模型,并運(yùn)用到“食品養(yǎng)生”“醫(yī)學(xué)健康”兩個(gè)領(lǐng)域?qū)崿F(xiàn)領(lǐng)域謠言自動(dòng)識(shí)別。石鍇文等[2]運(yùn)用TF-IDF增強(qiáng)Word2Vec詞向量語(yǔ)義特征,利用LDA模型對(duì)文本進(jìn)行主題分析,從多個(gè)維度融合文本特征。黃學(xué)堅(jiān)等[1]在謠言識(shí)別模型中除了用戶基本特征和內(nèi)容統(tǒng)計(jì)特征,從用戶歷史微博和微博評(píng)論中挖掘用戶深層特征?,F(xiàn)有研究根據(jù)不同的需求,從不同的角度對(duì)微博特征進(jìn)行抽取挖掘,主要集中于文本內(nèi)容特征與其融合其他特征研究,在謠言識(shí)別中融合用戶歷史特征的研究不多。
謠言內(nèi)容、發(fā)布用戶以及傳播是構(gòu)成識(shí)別謠言和非謠言的關(guān)鍵要素[9],不同特征之間的融合將對(duì)謠言識(shí)別起到較大作用。突發(fā)公共衛(wèi)生事件具有公眾參與度高、負(fù)面傾向性強(qiáng)、民眾恐慌加劇和極端用語(yǔ)多等獨(dú)有的特征[2],且用戶特征和傳播特征對(duì)謠言識(shí)別的影響與突發(fā)事件所屬領(lǐng)域無(wú)關(guān),用戶歷史行為對(duì)謠言的識(shí)別具有一定的輔助作用。由于BiLSTM的雙向機(jī)制保證了每一個(gè)詞在充分考慮上下文的條件下獲得語(yǔ)義,實(shí)現(xiàn)微博文本特征的深度抽取[17]。CNN可提取語(yǔ)義表示和捕獲平面結(jié)構(gòu)中的顯著特征[18],具有捕獲局部上下文的優(yōu)勢(shì)[19]。因此本文采用BiLSTM獲取微博內(nèi)容的上下文語(yǔ)義,CNN對(duì)提取特征使用不同的卷積核捕獲多粒度的局部上下文語(yǔ)義信息,從而獲得謠言內(nèi)容語(yǔ)詞間上下文語(yǔ)義結(jié)構(gòu),以最大池化方式抽取代表性語(yǔ)義特征。BiLSTM+CNN輸出語(yǔ)義特征向量為自動(dòng)構(gòu)建的高維向量,解釋性不強(qiáng),全連接DNN的多隱藏層可以抽象地表示特征,具有傳統(tǒng)的算法所不具備的靈活性,對(duì)于大部分非線性函數(shù)的擬合能力都較好,只要通過(guò)增大全連接神經(jīng)網(wǎng)絡(luò)的深度,就可以對(duì)函數(shù)進(jìn)行精確地?cái)M合[20]。因而在語(yǔ)義特征與其他特征拼接融合后,可采用全連接型的DNN網(wǎng)絡(luò)進(jìn)行謠言識(shí)別。綜上,結(jié)合相關(guān)研究成果,在用戶基本特征和內(nèi)容特征、傳播特征的基礎(chǔ)上引入用戶歷史特征,本文提出一種突發(fā)公共衛(wèi)生事件下的多特征融合謠言識(shí)別模型框架(如圖1所示),以實(shí)現(xiàn)微博謠言自動(dòng)有效識(shí)別。
圖1 突發(fā)公共衛(wèi)生事件下的多特征融合微博謠言識(shí)別模型框架
該模型包括數(shù)據(jù)獲取與預(yù)處理、特征抽取、特征融合、分類判別等。具體為首先采用相關(guān)工具或編程爬取微博相關(guān)數(shù)據(jù),并對(duì)其進(jìn)行清洗,根據(jù)微博數(shù)據(jù)標(biāo)簽提取用戶基本信息、傳播信息、微博內(nèi)容信息,對(duì)微博內(nèi)容文本進(jìn)行符號(hào)統(tǒng)計(jì)、Jieba庫(kù)分詞和SnowNLP情感分析[21]、BiLSTM+CNN模型抽取微博內(nèi)容特征,在此基礎(chǔ)上進(jìn)一步處理獲得用戶歷史特征。接著將所提取特征拼接后,輸入DNN全連接層判別謠言的類別。
2.2.1特征構(gòu)建
根據(jù)上文分析,本文謠言微博特征采用用戶基本特征、用戶歷史特征、內(nèi)容特征和傳播特征4個(gè)維度表征。內(nèi)容特征現(xiàn)有的研究主要包括:統(tǒng)計(jì)特征(T1)、情感特征(T2)、語(yǔ)義特征(T3),能夠很好地區(qū)分謠言和非謠言,因此本文將從這3個(gè)維度對(duì)內(nèi)容特征進(jìn)一步細(xì)分。謠言傳播者和普通用戶的基本特征上存在較為明顯的差異,例如謠言用戶具有地域差異,為了增加發(fā)布謠言的曝光度會(huì)在較短的時(shí)間內(nèi)關(guān)注大量用戶,以獲得較多粉絲,話題型用戶名具有更高的可信度等[9]。謠言用戶發(fā)博時(shí)間通常選擇普通用戶刷微博的高峰期,以獲得較高的關(guān)注度,因此傳播特征除了評(píng)論數(shù)、轉(zhuǎn)發(fā)數(shù)、點(diǎn)贊數(shù)外,發(fā)博時(shí)間亦是重要的傳播特征。另外雖然用戶歷史發(fā)博的領(lǐng)域不定,但用戶特征和傳播特征與領(lǐng)域無(wú)關(guān),因此用戶歷史特征可用用戶歷史傳播特征(H1)、歷史發(fā)博特征(H2)、歷史情感特征(H3)表征。結(jié)合清博指數(shù)BCI和相關(guān)研究,用戶基本特征(U)、內(nèi)容特征(T)、傳播特征(S)、用戶歷史特征(H)具體如表1—表3所示。
表1 微博內(nèi)容特征、傳播特征
表2 用戶基本特征
表3 用戶歷史特征
2.2.2特征抽取
用戶基本特征、傳播特征根據(jù)微博數(shù)據(jù)標(biāo)簽提取,統(tǒng)計(jì)特征采用統(tǒng)計(jì)學(xué)方法、python編程或EXCEL統(tǒng)計(jì)文本中包含的符號(hào)數(shù)完成,情感特征值直接采用SnowNLP庫(kù)計(jì)算內(nèi)容情感得分。符號(hào)統(tǒng)計(jì)和SnowNLP情感計(jì)算比較成熟,微博文本語(yǔ)義特征反映微博用戶觀點(diǎn)、意見(jiàn)、情感的語(yǔ)詞表達(dá),具有不確定性,是謠言識(shí)別的關(guān)鍵部分,本文使用BiLSTM+CNN抽取語(yǔ)義特征。其結(jié)構(gòu)圖如圖2所示。
圖2 BiLSTM+CNN語(yǔ)義特征抽取模型
該模型包括三層:詞嵌入、BiLSTM層、CNN層。
a.詞嵌入。將微博內(nèi)容文本分詞后的詞轉(zhuǎn)化為詞向量以作為BiLSTM層的輸入。北師大和人大開(kāi)源的已經(jīng)訓(xùn)練好的詞向量詞典Word + Character + Ngram[22]相比其他全領(lǐng)域的詞向量詞典更適合微博謠言識(shí)別的任務(wù)[1]。因此本文選取Word + Character + Ngram (300d)將文本每個(gè)詞表示為300維的詞向量。
(1)
所有詞向量的語(yǔ)義特征向量構(gòu)成文本特征矩陣A。
c.CNN層。針對(duì)不同語(yǔ)詞在微博內(nèi)容中分布不同,對(duì)文本特征矩陣A進(jìn)行上下文結(jié)構(gòu)局部特征提取,CNN從上下文語(yǔ)義中捕獲結(jié)構(gòu)信息,提取代表性特征,去除冗余信息、消除岐義。本文通過(guò)設(shè)置不同寬度的卷積核對(duì)文本特征矩陣A進(jìn)行卷積運(yùn)算、最大池化,選取寬度16對(duì)微博中句子進(jìn)行編碼,最大池化后再選取寬度4對(duì)句子中四元組作進(jìn)一步的語(yǔ)義編碼,做最大池化。最后將池化后特征向量flatten成一維語(yǔ)義特征向量,形成代表性語(yǔ)義特征向量T3輸出。
特征融合是將不同角度的特征結(jié)合,為分類提供更多可依據(jù)的信息[4]。將用戶基本特征、用戶歷史特征、傳播特征、統(tǒng)計(jì)特征、情感特征等相關(guān)數(shù)據(jù)歸一化后,與BiLSTM+CNN模型提取的256維代表性語(yǔ)義特征向量T3拼接成一個(gè)多元特征向量TU,作為DNN網(wǎng)絡(luò)的輸入。特征融合過(guò)程如公式(2)—(4)所示。
T=T1⊕T2⊕T3
(2)
H=H1⊕H2⊕H3
(3)
TU=U⊕T⊕S⊕H
(4)
式中⊕代表級(jí)聯(lián)操作,即對(duì)各特征向量進(jìn)行拼接。
謠言識(shí)別采用多層DNN網(wǎng)絡(luò)進(jìn)行分類訓(xùn)練,DNN的輸入為多元特征向量TU。分類模型訓(xùn)練過(guò)程中,先對(duì)類別標(biāo)簽進(jìn)行One-Hot編碼,在隱藏層使用tanh作為激活函數(shù),并使用categorical_crossentropy作為模型的損失函數(shù)對(duì)模型參數(shù)進(jìn)行優(yōu)化。最后通過(guò)softmax層進(jìn)行分類,輸出微博文本為謠言和非謠言的概率,二者概率之和為1,其具體計(jì)算過(guò)程如公式(5)、(6)所示。
(5)
(6)
式中Wk是第k個(gè)類別的權(quán)重系數(shù)矩陣,xi表示第i個(gè)文本的多元特征向量,yi表示第i個(gè)文本的類別(謠言或非謠言),χk(xi)為第i個(gè)文本在第k個(gè)類別上的計(jì)算結(jié)果值,K為類別總數(shù)。
為了驗(yàn)證本文模型的有效性,首先對(duì)本文模型中語(yǔ)義特征采用不同的方法處理,對(duì)比實(shí)驗(yàn)結(jié)果分析本文模型語(yǔ)義特征在謠言識(shí)別中的作用及BiLSTM+CNN謠言語(yǔ)義特征學(xué)習(xí)能力;接著與現(xiàn)有謠言模型實(shí)驗(yàn)結(jié)果對(duì)比分析本文模型謠言識(shí)別效果;最后在語(yǔ)義特征的基礎(chǔ)上遞進(jìn)融合特征,分析各特征對(duì)謠言識(shí)別效果的影響。實(shí)驗(yàn)數(shù)據(jù)集訓(xùn)練集比例70%,測(cè)試集比例30%。使用準(zhǔn)確率(Accuracy)、查準(zhǔn)率 (Precision)、查全率(Recall)和F1值作為模型效果評(píng)價(jià)指標(biāo)。
本文實(shí)驗(yàn)數(shù)據(jù)為2020年1月15日—2022年2月7日間新冠疫情相關(guān)微博數(shù)據(jù),謠言數(shù)據(jù)為微博社區(qū)管理中心平臺(tái)已確認(rèn)的新冠疫情謠言,非謠言數(shù)據(jù)根據(jù)微博話題#新冠疫情#,采用Python編程爬取,用戶歷史數(shù)據(jù)通過(guò)循環(huán)滾動(dòng)的方式,獲取用戶最近50條微博歷史特征。最后獲取數(shù)據(jù)為謠言用戶基本信息713個(gè),非謠言用戶基本信息1 177個(gè),謠言微博數(shù)770條,非謠言微博數(shù)1 200條(隨機(jī)選取),謠言用戶歷史微博數(shù)27 939條,非謠言用戶歷史微博數(shù)77 736條。
首先對(duì)爬取到的頁(yè)面進(jìn)行初步清洗,根據(jù)標(biāo)簽獲取本文所需數(shù)據(jù),獲得用戶基本特征、傳播特征和微博內(nèi)容信息,保存為CSV文件。接著主要作如下處理:
a.缺失值處理。用戶自己未填寫相關(guān)特征信息(如性別、所在地等)或者由于微博發(fā)布時(shí)間過(guò)早、用戶主動(dòng)刪除了部分已發(fā)布的微博,導(dǎo)致部分信息缺失時(shí),本文將缺失值全部填充為-1,以區(qū)分缺失值和獲取到的真實(shí)值。例如某條微博的點(diǎn)贊數(shù)為-1表示點(diǎn)贊數(shù)缺失。
b.文本內(nèi)容特征處理。首先對(duì)文本中符號(hào)進(jìn)行統(tǒng)計(jì),獲得統(tǒng)計(jì)特征數(shù)據(jù),采用python編程通過(guò)正則化表達(dá)式去除文本中的表情、標(biāo)點(diǎn)符號(hào)、多媒體等信息,Jieba庫(kù)對(duì)微博文本進(jìn)行分詞,SnowNLP庫(kù)計(jì)算微博文本的情感得分。
c.歸一化處理。采用min-max對(duì)統(tǒng)計(jì)特征、傳播特征等相關(guān)數(shù)據(jù)進(jìn)行歸一化處理,將值轉(zhuǎn)化到區(qū)間[0,1]。
d.微博謠言時(shí)間分布統(tǒng)計(jì)分析。以1小時(shí)為時(shí)間段統(tǒng)計(jì)每個(gè)時(shí)間段內(nèi)謠言發(fā)布量,每個(gè)時(shí)間段內(nèi)謠言發(fā)布量如圖3所示。
圖3 微博謠言時(shí)間分布統(tǒng)計(jì)
由圖3可知,24小時(shí)內(nèi)謠言量呈波動(dòng)狀態(tài),謠言量最少的時(shí)間段是4-5點(diǎn), 5條;最高峰是11-12點(diǎn),63條;每小時(shí)平均約32條。謠言量較多的時(shí)間段為10-13點(diǎn)、20-24點(diǎn),2-7點(diǎn)極少。
本文實(shí)驗(yàn)環(huán)境為Python 3.8、tensorflow 2.1.0、keras 2.3.1等。為了保證公平性和合理性,本文采用網(wǎng)絡(luò)規(guī)模和尺寸保持一致,主要參數(shù)如表4所示。
表4 主要參數(shù)
為研究本文模型的可行性和有效性,在模型結(jié)構(gòu)與參數(shù)不變情況下,與以下3種類別模型對(duì)比謠言識(shí)別效果,分析本文模型中語(yǔ)義特征的作用及BiLSTM+CNN語(yǔ)義特征抽取的性能。具體類別為:a.類別1,不考慮語(yǔ)義特征,其他特征不變;b.類別2,僅考慮語(yǔ)義特征,采用BiLSTM+CNN抽取語(yǔ)義特征;c.類別3,采用常用深度學(xué)習(xí)模型及組合抽取語(yǔ)義特征,其他特征不變;謠言識(shí)別效果評(píng)價(jià)各項(xiàng)指標(biāo)值是按照訓(xùn)練集和測(cè)試集的比例進(jìn)行加權(quán)后計(jì)算得到的,實(shí)驗(yàn)結(jié)果見(jiàn)表5。
表5 不同語(yǔ)義特征抽取模型實(shí)驗(yàn)結(jié)果對(duì)比分析(單位:%)
3.4.1語(yǔ)義特征的作用分析
由表5可知,語(yǔ)義特征是微博謠言識(shí)別的關(guān)鍵要素,其他特征能夠顯著地提高謠言識(shí)別效果。類別2模型與類別1模型相比各評(píng)價(jià)指標(biāo)大幅提高。類別1模型準(zhǔn)確率為83.56%、查準(zhǔn)率81.75%,查全率和F1值不到80%;雖然融合了微博其他特征,但未考慮謠言文本的語(yǔ)義特征,對(duì)謠言識(shí)別能力相對(duì)較弱,因而微博語(yǔ)義特征是識(shí)別謠言的重要特征。本文模型與類別2模型相比,本文模型中語(yǔ)義特征融合了其他特征能夠顯著地提高謠言識(shí)別效果。
3.4.2BiLSTM+CNN語(yǔ)義特征抽取性能分析
由表5可知,BiLSTM+CNN謠言語(yǔ)義特征識(shí)別能力明顯高于其他常用深度學(xué)習(xí)模型及組合。與類別3模型相比,本文模型的查準(zhǔn)率略低于TextRNN、BiLSTM、BiLSTM-CNN模型,但準(zhǔn)確率、查全率、F1值都遠(yuǎn)高于類別3模型,類別3模型(除TextCNN準(zhǔn)確率外)與模型類型1相比各指標(biāo)有顯著提高,具有較好地謠言識(shí)別能力。
a.BiLSTM與TextCNN、TextRNN相比,謠言深度語(yǔ)義特征學(xué)習(xí)能力更強(qiáng)。BiLSTM模型準(zhǔn)確率(94.81%)略低于TextRNN(95.15%),但其準(zhǔn)確率、查全率、F值遠(yuǎn)高于兩者。TextRNN能夠抽取深層語(yǔ)義信息,獲得較高的準(zhǔn)確率,略高于BiLSTM,但明顯降低了查全率。TextCNN抽取局部信息,獲得代表性語(yǔ)義特征,但明顯降低了其查準(zhǔn)率,反而低于模型類型1;雖然獲得較高的查全率,具有較強(qiáng)的泛化能力,相關(guān)指標(biāo)均低于BiLSTM。
b.本文模型查準(zhǔn)率略低于BiLSTM模型,但查全率、F1值指標(biāo)上均有較明顯的提升。表明CNN網(wǎng)絡(luò)對(duì)BiLSTM網(wǎng)絡(luò)抽取的語(yǔ)義特征向量進(jìn)行二次學(xué)習(xí),學(xué)習(xí)到質(zhì)量更高的具有代表性語(yǔ)義特征,具有較強(qiáng)的泛化能力。
c.BiLSTM-CNN模型采用BiLSTM、CNN分別抽取微博語(yǔ)義特征并拼接,語(yǔ)義特征向量維度增加提高了語(yǔ)義特征的專指度,查準(zhǔn)率高于本文模型,但準(zhǔn)確率、查全率和F1值明顯低于本文模型。
d.本文模型相關(guān)指標(biāo)均高于LSTM+CNN。說(shuō)明BiLSTM謠言深層語(yǔ)義特征能力學(xué)習(xí)優(yōu)于LSTM。
綜上所述,本文模型采用BiLSTM抽取文本內(nèi)容上下文深度語(yǔ)義特征,CNN進(jìn)一步捕獲代表性上下文語(yǔ)義結(jié)構(gòu),查全率和綜合性能更好,具有更強(qiáng)地泛化能力。
為了進(jìn)一步驗(yàn)證文本模型的有效性,在本文數(shù)據(jù)集上對(duì)現(xiàn)有謠言識(shí)別模型S-SVM[6]、TextCNN+Attention[14]、 C-LSTM[3]和BiGRU+Attention[1]進(jìn)行復(fù)現(xiàn),與本文模型謠言識(shí)別效果對(duì)比分析。相關(guān)評(píng)估指標(biāo)值的計(jì)算與3.4一致,實(shí)驗(yàn)結(jié)果見(jiàn)表6。
a.S-SVM模型較為簡(jiǎn)單,相關(guān)指標(biāo)均低于本文模型,這是由于S-SVM無(wú)法充分學(xué)習(xí)到謠言的文本特征,將不能確定為謠言的文本統(tǒng)一分類為非謠言文本,導(dǎo)致謠言文本的查準(zhǔn)率較低,獲得較好的查全率。
b.除S-SVM模型外,本文模型查準(zhǔn)率(94.43%)低于現(xiàn)有謠言模型,查全率(96.40%)、準(zhǔn)確率(96.46%)、F1值(95.40%)均高于現(xiàn)有謠言模型,說(shuō)明現(xiàn)有謠言模型提取語(yǔ)義特征相對(duì)較深,但本文模型的泛化能力較強(qiáng)、綜合性能較高。BiGRU+Attention、TextCNN+Attention模型對(duì)謠言文本的查準(zhǔn)率較高,結(jié)合表5可知,這是由于Attention機(jī)制進(jìn)一步識(shí)別了謠言的關(guān)鍵信息,提高了謠言語(yǔ)義特征深度,但明顯地降低了查全率,遠(yuǎn)低于本文模型。
表6 本文模型與其他模型效果對(duì)比分析(單位:%)
查準(zhǔn)率和查全率是一對(duì)矛盾的度量。當(dāng)查全率較高時(shí),雖然降低了將非謠言識(shí)別為謠言的可能性,但降低了查準(zhǔn)率,提高非謠言識(shí)別為謠言的可能性。突發(fā)公共衛(wèi)生事件謠言滋生后,由于信息不對(duì)稱、認(rèn)知、資源、經(jīng)濟(jì)等的有限性,公眾極易產(chǎn)生恐慌、焦慮情緒[23],嚴(yán)重時(shí)甚至對(duì)社會(huì)安定和民生保障構(gòu)成巨大威脅。公眾、政府及相關(guān)機(jī)構(gòu)期望應(yīng)用平臺(tái)盡可能識(shí)別網(wǎng)絡(luò)中潛在的謠言,幫助自身快速地識(shí)別謠言,從而降低公眾自身的損失(例如經(jīng)濟(jì)損失、恐慌、焦慮情緒等),政府及相關(guān)機(jī)構(gòu)及時(shí)采取相應(yīng)的措施以遏制謠言的傳播和消除謠言的影響。而如果誤判的話,政府、相關(guān)機(jī)構(gòu)及應(yīng)用平臺(tái)可能會(huì)失去公眾的信任等,因此在此背景下不能僅考慮查準(zhǔn)率或查全率作為評(píng)價(jià)模型好壞的指標(biāo)。F1值表示模型的綜合性能,兼容查準(zhǔn)率和查全率;準(zhǔn)確率兼顧謠言和非謠言的查準(zhǔn)率,本文將此作為評(píng)價(jià)模型的指標(biāo)。本文模型準(zhǔn)確率、查全率、F1值均明顯高于現(xiàn)有模型,因此從查全率、F1值和準(zhǔn)確率來(lái)看,本文模型對(duì)謠言的識(shí)別效果更佳。
參考黃學(xué)堅(jiān)等[1]、石鍇文等[2]的研究, 本文選取不同的特征組合進(jìn)行特征消融實(shí)驗(yàn),分析各個(gè)特征對(duì)謠言識(shí)別的影響。 結(jié)合3.4,語(yǔ)義特征是影響謠言識(shí)別的關(guān)鍵因素,在保持網(wǎng)絡(luò)結(jié)構(gòu)和參數(shù)不變、特征不同的情況下,在語(yǔ)義特征(T3)的基礎(chǔ)上,對(duì)比分析遞進(jìn)融合特征后模型對(duì)謠言識(shí)別效果的影響。設(shè)極差表示各模型訓(xùn)練集和測(cè)試集準(zhǔn)確率之差,反映出模型的平均性能和泛化能力。準(zhǔn)確率差值、F1值差值為僅語(yǔ)義特征模型與其他模型的準(zhǔn)確率與F1值的差值。具體實(shí)驗(yàn)結(jié)果如表7所示。
表7 不同特征融合的模型實(shí)驗(yàn)結(jié)果對(duì)比(單位:%)
3.6.1不同特征融合對(duì)謠言識(shí)別效果的影響分析
a.單個(gè)特征的融入模型能夠不同程度地提高謠言識(shí)別效果。由表7可知,根據(jù)準(zhǔn)確率和F值,單個(gè)特征影響程度由高到低,依次為統(tǒng)計(jì)特征、傳播特征、用戶基本特征、用戶歷史特征和情感特征。其中統(tǒng)計(jì)特征和用戶基本特征全面提升了謠言預(yù)測(cè)查準(zhǔn)率和查全率,傳播特征、用戶歷史特征和情感特征提升了謠言預(yù)測(cè)的查全率,而查準(zhǔn)率略有降低。查準(zhǔn)率貢獻(xiàn)最大的是統(tǒng)計(jì)特征,用戶歷史特征貢獻(xiàn)其次,最后是傳播特征和情感特征。查全率貢獻(xiàn)最大的是傳播特征,其次為用戶基本特征,最后是傳播特征和用戶歷史特征。單個(gè)特征分別融合后,F(xiàn)1值都明顯的提升,提高了模型的綜合性能。
b.內(nèi)容特征仍然是謠言識(shí)別的主要特征。由表7可知,T3融入T1、T2后,即內(nèi)容特征(T1+T2+T3)明顯提高謠言識(shí)別預(yù)測(cè)的查全率(92.27%)、查準(zhǔn)率(91.86%)、F1值(92.06%)。
c.基于內(nèi)容特征,隨著融入特征增加,模型謠言識(shí)別能力越強(qiáng)。由表7可知,融入S,模型查準(zhǔn)率持平,查全率持續(xù)提升;遞進(jìn)融入U(xiǎn)后,模型查準(zhǔn)率、查全率顯著提高;遞進(jìn)融入H后,模型查準(zhǔn)率持平,查全率提升,所有指標(biāo)達(dá)到最高,準(zhǔn)確率和F1值分別達(dá)到了96.27%和95%。
因此,公眾或政府部門相關(guān)機(jī)構(gòu)及應(yīng)用平臺(tái)等可根據(jù)微博特征對(duì)謠言識(shí)別的影響程度采取相關(guān)的措施,例如關(guān)注和識(shí)別微博文本特征,尤其是在謠言高發(fā)階段10—13點(diǎn)和20—24點(diǎn)(見(jiàn)圖3),重點(diǎn)關(guān)注微博語(yǔ)義特征(例如語(yǔ)詞表達(dá))、情感表達(dá)(符號(hào)、情感詞的使用等),及其引起的傳播效果;同時(shí)建立用戶信息數(shù)據(jù)庫(kù)保存用戶基礎(chǔ)信息和用戶歷史信息,以輔助謠言識(shí)別。在謠言爆發(fā)初期,其他信息較少的情況下,可充分利用用戶的歷史信息對(duì)謠言進(jìn)行識(shí)別。
3.6.2特征融合對(duì)謠言識(shí)別模型性能影響分析
隨著融合特征遞進(jìn)增加,模型平均性能、泛化能力越強(qiáng),預(yù)測(cè)效果更好。由表7差值可知,僅使用T3模型在訓(xùn)練集和測(cè)試集上的準(zhǔn)確率之差最大,達(dá)到1.91%。而融入了任一單特征后,模型極差明顯下降,表明模型的泛化能力得到明顯提升。而遞進(jìn)融入2個(gè)以上特征后,極差大幅下降,泛化能力大幅提升,預(yù)測(cè)能力更強(qiáng)。
在公共衛(wèi)生事件發(fā)展過(guò)程中準(zhǔn)確、高效的謠言自動(dòng)識(shí)別模型能夠輔助公眾、政府及相關(guān)部門更早地發(fā)現(xiàn)謠言并阻斷謠言傳播。本文在現(xiàn)有研究的基礎(chǔ)上,從用戶基本特征、用戶歷史特征、內(nèi)容特征、傳播特征4個(gè)維度,構(gòu)建基于混合神經(jīng)網(wǎng)絡(luò)的多特征融合的公共突發(fā)事件謠言識(shí)別模型。該模型采用BiLSTM+CNN網(wǎng)絡(luò)抽取代表性的語(yǔ)義深度特征、DNN網(wǎng)絡(luò)對(duì)謠言進(jìn)行分類。實(shí)驗(yàn)結(jié)果表明:a.本文模型取得了較好地識(shí)別效果,綜合性能優(yōu)于常用的深度學(xué)習(xí)模型和現(xiàn)有的謠言識(shí)別模型;b.文本語(yǔ)義特征是影響謠言識(shí)別的關(guān)鍵要素,統(tǒng)計(jì)特征、傳播特征、用戶基本特征和歷史特征都能夠不同程度地提升謠言識(shí)別效果。
本文研究還存在一些局限性,例如未考慮謠言評(píng)論內(nèi)容特征的影響、本文提出模型僅使用新冠疫情數(shù)據(jù)驗(yàn)證等,下一步將在此基礎(chǔ)上做進(jìn)一步探討,以更好為相關(guān)部門的決策參考提供依據(jù)。