張斌,王莉,楊延杰
聯(lián)合立場的過程跟蹤式多任務(wù)謠言驗證模型
張斌,王莉*,楊延杰
(太原理工大學(xué) 大數(shù)據(jù)學(xué)院,山西 晉中 030600)(?通信作者電子郵箱wangli@tyut.edu.cn)
當(dāng)前,社交媒體平臺成為人們發(fā)布和獲取信息的主要途徑,但簡便的信息發(fā)布也導(dǎo)致了謠言更容易迅速傳播,因此驗證信息是否為謠言并阻止謠言傳播,已經(jīng)成為一個亟待解決的問題。以往的研究表明,人們對信息的立場可以協(xié)助判斷信息是否為謠言。在此基礎(chǔ)上,針對謠言泛濫的問題,提出了一個聯(lián)合立場的過程跟蹤式多任務(wù)謠言驗證模型(JSP?MRVM)。首先,分別使用拓?fù)鋱D、特征圖和公共圖卷積網(wǎng)絡(luò)(GCN)對信息的三種傳播過程進行表征;然后,利用注意機制獲取信息的立場特征,并融合立場特征與推文特征;最后,設(shè)計多任務(wù)目標(biāo)函數(shù)使立場分類任務(wù)更好地協(xié)助驗證謠言。實驗結(jié)果表明,所提模型在RumorEval數(shù)據(jù)集上的準(zhǔn)確度和Macro?F1較基線模型RV?ML分別提升了10.7個百分點和11.2個百分點,可以更有效地檢驗謠言,減少謠言的泛濫。
謠言驗證;立場;多任務(wù);圖卷積網(wǎng)絡(luò);傳播過程;目標(biāo)函數(shù)
隨著在線社交媒體的迅速發(fā)展,Twitter、Facebook、微博等社交平臺已成為信息傳播、交流的主要平臺。由Dixon[1]和Thomala[2]的統(tǒng)計數(shù)據(jù)可以看出,絕大部分用戶主要通過這些平臺獲取信息。用戶通過在社交媒體上閱讀推文來獲取新聞,同時還可以分享自己對各種事件的立場。由于用戶在社交媒體上發(fā)布信息的門檻較低,所以可以很自由地發(fā)布信息,這就為謠言的發(fā)布和傳播創(chuàng)造了有利條件。根據(jù)Zubiaga等[3]對謠言的定義,“謠言是一個在發(fā)布時尚未確定真實性的且需要驗證的流通信息”。例如,有人在用手機拍攝閃電時看到閃電劈向自己,之后將視頻在社交賬號上發(fā)布,有網(wǎng)友以此發(fā)布“雷雨天手機會引雷”的話題一度登上熱搜。隨著話題熱度的上升,為防止人們誤信此話題,有關(guān)專家對打雷和避雷的原理進行了解釋,這個話題信息最終被認(rèn)定為謠言。又比如“不吃藥,吃大蒜就能治幽門螺旋桿菌”這種“土方法”在人們生活中被傳播,誤導(dǎo)人們在得病的第一時間選擇吃大蒜,導(dǎo)致病情惡化、感染人數(shù)驟增等情況。但是隨著多位醫(yī)學(xué)專家在主流社交平臺進行醫(yī)學(xué)常識講解,這個信息最終被人們當(dāng)作謠言。
這些未經(jīng)驗證的信息的擴散,不僅阻礙了社交平臺的健康發(fā)展,而且如果不及時發(fā)現(xiàn),這些聳人聽聞的謠言可能會在緊急事件中引發(fā)社會恐慌;所以信息在社交平臺上的可信度變得至關(guān)重要,Twitter、Facebook、微博等社交平臺都急切尋找有效的解決方案來識別謠言。
謠言的識別過程可以分為四個步驟[3]。1)謠言初期篩查階段:這個過程將那些可以直接確定客觀存在或真實的信息過濾出來,初步將信息分類為真實信息和不確定信息;2)信息跟蹤階段:這一過程將收集上一步被判斷為不確定信息的相關(guān)推文信息;3)立場分類階段:基于所收集的相關(guān)推文信息,這一過程將得出網(wǎng)絡(luò)用戶對事件所持有的態(tài)度(即立場);4)謠言驗證階段:這一過程是為了確定在跟蹤不確定信息一段時間后(即收集了一段時間的相關(guān)推文和評論信息),此信息是否可以被證實為真實(T)、虛假(F)或未驗證(U)[4]。其中,對立場的分類[5]如下:
1)支持(S):用戶所發(fā)表的推文和評論信息中所持有的態(tài)度是支持其相關(guān)事件的立場,對其內(nèi)容表示支持;
2)反對(D):對其內(nèi)容表示不認(rèn)同;
3)查詢(Q):對其內(nèi)容表示不確定,想要獲取更多相關(guān)信息;
4)評論(C):對其內(nèi)容不做評價,僅僅進行了無立場的信息表達(dá)。
圖1展示了一個謠言的樹狀會話中源推文及其評論的立場。
圖1 謠言的樹狀會話
已有的研究[6-8]表明,對于已發(fā)布的未經(jīng)驗證的信息,其源推文和相應(yīng)的評論中的立場可以幫助識別謠言。比如,對于一個發(fā)布了不確定信息的推文,會有越來越多的評論對源推文進行否認(rèn)、質(zhì)疑等[9],并且直接給出相應(yīng)的評論內(nèi)容。因為人們在接收過各種各樣的虛假信息后,對于信息的真實度有了比較高的判斷力。Ma等[10]曾對100件謠言進行分析后得出,用戶更傾向于對謠言推文信息進行否認(rèn)或質(zhì)疑的評論;而對于非謠言推文信息,則更多的是支持與肯定的評論。由此說明推文信息和其評論的立場可以為謠言驗證提供指示性線索[11]。
相較于單獨的立場分類和謠言驗證任務(wù),通過多任務(wù)學(xué)習(xí)(Multi?Task Learning, MTL)模型將兩個任務(wù)聯(lián)合會更有效地降低擬合,通過增加訓(xùn)練集標(biāo)簽數(shù),從而提高訓(xùn)練集模型精度。MTL通常用于相似或相關(guān)任務(wù)的并行學(xué)習(xí),利用每個任務(wù)各自特征的獨立參數(shù)和共同特征的共享參數(shù)來幫助其他任務(wù)更好地訓(xùn)練。近年來,MTL在自然語言處理(Natural Language Processing, NLP)任務(wù)中頻頻出現(xiàn),基于MTL的模型在謠言驗證任務(wù)[12]中也有相關(guān)應(yīng)用和發(fā)展。受此啟發(fā),本文將謠言識別過程表示為多任務(wù)問題,其中謠言驗證任務(wù)是主要任務(wù),立場分類任務(wù)是輔助任務(wù),利用輔助任務(wù)來提高謠言驗證分類器的性能。
本文提出了一個聯(lián)合立場的過程跟蹤式多任務(wù)謠言驗證模型(Joint Stance Process tracking Multi?task Rumor Verification Model, JSP?MRVM)。其中,利用立場分類任務(wù)協(xié)助謠言驗證任務(wù)確定一個信息為真實(T)、虛假(F)或未經(jīng)驗證(U),試圖在這個統(tǒng)一的體系結(jié)構(gòu)中,通過相互反饋的特征和參數(shù)來加強謠言檢測和立場分類準(zhǔn)確度。其中使用了一個共享層、兩個任務(wù)特定層和兩個特征融合層來容納不同目標(biāo)的任務(wù)表示及其相應(yīng)的參數(shù)。由于兩個任務(wù)共同訓(xùn)練,數(shù)據(jù)特征得以增加,并且MTL可以降低每個單獨任務(wù)的過擬合風(fēng)險。得益于此,本文提出的JSP?MRVM在謠言驗證方面的準(zhǔn)確度有了明顯提高。
現(xiàn)階段關(guān)于單獨的立場分類任務(wù)方面的研究比較少,大多數(shù)研究都是將立場分類任務(wù)作為一個子任務(wù)進行研究。最初,關(guān)于信息的立場研究都是人工分析提取特征為主。Mendoza等[13]發(fā)表了一項開拓性的研究,在人工分析不同類型的謠言立場時,他們發(fā)現(xiàn)大多數(shù)與真實信息相關(guān)的推文都保持著支持的立場,而且在謠言信息相關(guān)推文中,有大約一半的推文保持著質(zhì)疑或反對的立場。隨著立場分類在不同的研究領(lǐng)域得到了越來越廣泛的應(yīng)用,研究者們探索了在包含評論的數(shù)據(jù)集中每個用戶角度下的觀點[14-15]。
而后,機器學(xué)習(xí)方法應(yīng)用到了立場分類任務(wù)中,Zeng等[16]研究提取了多種特征,將立場分類由支持和反對變?yōu)槎喾诸惾蝿?wù),形成細(xì)粒度的劃分,包括支持、反對、查詢和評論??紤]到信息傳播過程的時序性,Zubiaga等[5]利用樹結(jié)構(gòu)會話構(gòu)建了樹狀條件隨機場(Conditional Random Field, CRF),其中每一個分支都是根據(jù)時序性構(gòu)建的線性鏈CRF,以此學(xué)習(xí)樹結(jié)構(gòu)會話(如Twitter推文及其評論)中的立場,而不僅僅對推文進行分類。
隨著深度神經(jīng)網(wǎng)絡(luò)在立場分類中的應(yīng)用,Kochkina等[17]使用長短期記憶(Long Short?Term Memory, LSTM)網(wǎng)絡(luò)對推文立場分類。之后Chen等[18]使用卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network, CNN)獲取每條推文的表示,根據(jù)推文表示進行分類。但是,以往的研究都將源推文和評論拼成序列進行立場分類,雖然有研究者利用樹狀會話,但還是提取了樹分支的序列特征,并沒有充分利用樹狀會話傳播的過程和圖結(jié)構(gòu)信息。
在謠言驗證的相關(guān)研究中,Zubiaga等[9]將不確定信息歸類為真實(T)、虛假(F)和未經(jīng)驗證的(U)。剛開始,Zhao等[19]關(guān)注于推文傳播過程中的質(zhì)疑詞分布(比如,“not”“true”“unconfirmed”或“really?”等),利用質(zhì)疑和否認(rèn)詞在傳播過程的分布來檢測謠言。隨著深度學(xué)習(xí)在各個領(lǐng)域的廣泛應(yīng)用,Ma等[20]提出了利用循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network, RNN)提取信息傳播過程中不同時間點的推文表示,進而驗證謠言。之后Ma等[21]又提出了利用傳播結(jié)構(gòu)和核函數(shù)來識別謠言,這是對傳播的過程信息的進一步應(yīng)用。隨著研究的深入,立場作為特征也有了相關(guān)研究,Li等[22]利用立場特征和用戶特征進行了多任務(wù)學(xué)習(xí),同時進行立場分類任務(wù)和謠言驗證任務(wù)。MTL在識別未驗證信息的任務(wù)中也有了越來越多的研究與應(yīng)用。
多任務(wù)學(xué)習(xí)(MTL)的概念由Caruana[23]提出,是為了通過使用其他相關(guān)任務(wù)來提高原任務(wù)的性能。大多數(shù)MTL或聯(lián)合學(xué)習(xí)模型都可以看作是參數(shù)共享的模型,即在多個任務(wù)中共同訓(xùn)練模型,共享參數(shù)或特征。在NLP任務(wù)中,已經(jīng)有大量關(guān)于MTL的研究與應(yīng)用。最近,關(guān)于立場分類和謠言驗證的MTL也受到了廣泛關(guān)注,主要可以分為兩類。
其一是將推文與評論進行拼接,以長文本為輸入。Ma等[10]提出了聯(lián)合模型MT?ES(MultiTask?learning? Enhanced Shared?layer architecture),設(shè)計構(gòu)造了基于RNN的深度神經(jīng)網(wǎng)絡(luò)模型進行立場分類和謠言驗證任務(wù)。隨后,Kochkina等[12]提出了利用RNN的變形體即LSTM網(wǎng)絡(luò)作為共享層,提取原推文與評論的共享特征,再分別設(shè)計子任務(wù)層。而后Lv等[24]在Kochkina等[12]研究的基礎(chǔ)上提出了多任務(wù)謠言驗證模型RV?ML(Rumor Verification scheme based on Multitask Learning model),謠言驗證子任務(wù)用CNN對特征進行細(xì)化提取,從而提高謠言驗證任務(wù)的準(zhǔn)確度。Li等[22]借鑒了Kochkina等[12]和Ma等[20]的思想,在利用LSTM提取特征的同時加入了用戶特征,從而利用用戶和推文特征構(gòu)造共享層。隨著Transformer在各個領(lǐng)域的廣泛應(yīng)用,F(xiàn)ajcik等[25]用預(yù)訓(xùn)練的基于Transformer的雙向編碼表征提取文本表征,然后用softmax函數(shù)進行立場分類和謠言驗證。Khandelwal[26]在此基礎(chǔ)上,增加了統(tǒng)計特征、情感特征等特征后,再加入Transformer提取特征表征,以實現(xiàn)動態(tài)立場分類和謠言驗證。以上提及的多任務(wù)模型中,只有共享層同時受到了多任務(wù)的反饋影響。本文則研究了如何使多任務(wù)模型間可以更多地互相影響反饋從而提升主任務(wù)性能,最終提出并設(shè)計了融合層。
其二是將推文與評論構(gòu)造成樹狀會話作為輸入。Kochkina等[17]從源推文的樹狀會話中提取構(gòu)造了分支LSTM(Branch?LSTM)模型,在Branch?LSTM模型的每一個時間步中進行立場分類,最終進行謠言驗證。其后,Kumar等[27]借鑒了Branch?LSTM思想,以樹狀會話為基礎(chǔ)構(gòu)造LSTM模型,在每個分支進行立場分類,在樹根進行謠言驗證。
已有的研究關(guān)注到了傳播結(jié)構(gòu)對信息真假判斷的作用,但主要基于其分支序列結(jié)構(gòu),并沒有考慮信息傳播過程中的圖結(jié)構(gòu)信息。由于評論只能回復(fù)一個推文,但是其立場可能同時受多個評論的影響,所以中心評論與周圍評論的相互影響也有助于發(fā)現(xiàn)其立場,但很少有人研究這方面。另外,MTL模型在損失函數(shù)的設(shè)計上,都是將多個任務(wù)的損失進行加和,超參數(shù)對模型影響較大,不能使模型參數(shù)達(dá)到最優(yōu)化。
本文提出了一個聯(lián)合立場的過程跟蹤式多任務(wù)謠言驗證模型——JSP?MRVM,模型框架如圖2。主要包括:
輸入層將語句轉(zhuǎn)化為向量表征,s為源推文表征,c為評論表征。
共享層利用LSTM網(wǎng)絡(luò)獲取上下文源推文表征s和評論表征c。
子任務(wù)表征層中,經(jīng)過立場分類任務(wù)表征層得到源推文表征gs和評論表征gc;經(jīng)過謠言驗證任務(wù)表征層得到會話表征cs。
融合層以子任務(wù)表征層和共享層為輸入,得到源推文融合表征fs和評論融合表征fc。
最后立場分類為S(支持)、D(反對)、Q(查詢)、C(評論);謠言驗證為T(真)、F(假)和U(未驗證)。
本文工作包括:
1)利用拓?fù)鋱D、特征圖和公共圖的圖卷積網(wǎng)絡(luò)(Graph Convolutional Network, GCN)從三個角度的傳播過程和圖結(jié)構(gòu)信息來豐富立場特征;
2)設(shè)計融合門(Fusion?GATE, F?GATE)融合共享層和子任務(wù)表征層輸出,提升多任務(wù)模型間的相互作用,聯(lián)合立場特征進行謠言驗證;
3)設(shè)計可優(yōu)化目標(biāo)函數(shù)全面優(yōu)化模型參數(shù),并且本文模型在兩個數(shù)據(jù)集上的準(zhǔn)確度分別達(dá)到了70%和39.5%。
圖2 JSP?MRVM的模型框架
相較于單任務(wù)學(xué)習(xí)模型,MTL模型可以利用相關(guān)任務(wù)來學(xué)習(xí)更易于識別虛假信息的復(fù)雜特征。因為多個任務(wù)在共享特征層的基礎(chǔ)上進行不同子任務(wù),所以反向梯度傳播時,兩個不同的子任務(wù)表征層的反向傳播可以讓共享層更好地學(xué)習(xí)利于立場分類和謠言驗證的特征。
受Lv等[24]的啟發(fā),本文選擇帶有LSTM單元的雙向長短期記憶網(wǎng)絡(luò)作為共享層。LSTM不僅可以對上下文信息進行整體建模,提取會話表征,還可以獲取每個單元的表征。
在MTL模型中,每個任務(wù)都有其重視的推文特征,所以應(yīng)對不同任務(wù),用相應(yīng)適合的模型才能更好地捕獲相應(yīng)任務(wù)的重要的特征。為了能充分提取傳播結(jié)構(gòu)的結(jié)構(gòu)信息并跟蹤其傳播過程,本文提出在立場分類任務(wù)中用GCN模型,并且分別從拓?fù)鋱D、特征圖和公共圖三種圖結(jié)構(gòu)提取立場特征。在謠言驗證任務(wù)中,為了獲取細(xì)粒度的局部語義特征,利用文本卷積神經(jīng)網(wǎng)絡(luò)TextCNN模型。
2.3.1立場分類任務(wù)表征層
特征圖是由節(jié)點間相似性為邊構(gòu)成的,所以利用如下公式構(gòu)造特征圖:
公共圖是為了提取兩個圖的公共圖結(jié)構(gòu),如式(11):
由于每種圖都有其結(jié)構(gòu)信息,為了融合三個圖的結(jié)構(gòu)信息,本文利用了注意力機制,使同一節(jié)點在不同結(jié)構(gòu)中的重要信息得以融合。注意機制公式如下:
2.3.2謠言驗證任務(wù)表征層
在模型中,謠言驗證子任務(wù)表征層采用TextCNN。因為無論是源推文還是評論,其本質(zhì)是字符構(gòu)成的文本內(nèi)容,而利用TextCNN可以有效捕捉到推文的局部特征,并提取推文的細(xì)粒度特征。
在卷積層中,使用不同窗口大小的濾波器來捕捉特征。與單窗口大小的濾波器相比,三種不同窗口大小的濾波器可以獲得多個特征。單個濾波器的公式如下:
為了克服以往研究中只有共享層受多任務(wù)的影響反饋的不足,本文在子任務(wù)表征層后增加了融合層,使立場任務(wù)和謠言檢測任務(wù)可以互相反饋,提升主任務(wù)性能。
經(jīng)過子任務(wù)表征層的特征抽取,模型會丟失一些共享層的重要特征,同時也會丟失立場特征,所以本文設(shè)計F?GATE來融合共享層和子任務(wù)表征層特征,獲取任務(wù)相關(guān)的重要特征。對于立場分類表征層的融合如下所示:
對于謠言驗證任務(wù)表征層的融合與立場分類任務(wù)表征層的融合相似,但是輸入不同。如下所示:
最終聯(lián)合多任務(wù)的損失函數(shù)為:
在兩個公開的數(shù)據(jù)集RumourEval[12]和PHEME[3]上測試本文模型,它們的詳細(xì)統(tǒng)計和類分布如表1和表2。
RumourEval數(shù)據(jù)集中包含與謠言事件對應(yīng)的twitter會話。在RumourEval數(shù)據(jù)集中,每個會話都被標(biāo)記為真、假或未驗證的,會話中的每個源推文和評論都被標(biāo)記為支持、否認(rèn)、查詢或評論。該數(shù)據(jù)集分為訓(xùn)練集、驗證集和測試集:訓(xùn)練集和驗證集包括與8個謠言事件相關(guān)的297個會話;測試數(shù)據(jù)包括從8個謠言事件中提取的20個會話和從另外2個謠言事件中提取的8個會話。
PHEME數(shù)據(jù)集包含了9個事件的2 402個會話,同樣包括了立場標(biāo)簽和謠言標(biāo)簽。為了與基線模型對比,本文每次將其中一個事件作為測試集,剩下的事件作為8∶2的訓(xùn)練集和驗證集,進行多次交叉驗證實驗。
表 1 RumorEval數(shù)據(jù)集分布
表 2 PHEME數(shù)據(jù)集分布
對數(shù)據(jù)集中的推文進行以下預(yù)處理:1)去除非字母字符;2)刪除文本內(nèi)容的網(wǎng)站鏈接;3)將所有單詞轉(zhuǎn)換為小寫并標(biāo)記文本。對推文文本進行預(yù)處理后,使用word2vec預(yù)訓(xùn)練的的谷歌新聞數(shù)據(jù)集獲取推文中每個詞的嵌入表征,并取其平均值,得到每條推文表示。
為了驗證本文模型JSP?MRVM的性能,分別在上述兩個數(shù)據(jù)集中進行對比實驗。在對比實驗中選擇了同樣基于立場分類和謠言驗證任務(wù)的MTL的模型,包括:
BranchLSTM[3]:該模型是將樹狀會話分成會話分支,利用LSTM進行分類,然后將同一源推文分支結(jié)果進行投票。
MTL?2[12]:該模型是基于MTL的謠言分類模型,模型中的共享層和謠言準(zhǔn)確度驗證都使用了LSTM單元。
MT?ES[10]:該模型提出了增強型共享架構(gòu),共享層和任務(wù)層都利用GRU提取特征。
RV?ML[24]:該模型在LSTM共享層的基礎(chǔ)上利用CNN對準(zhǔn)確度驗證進行進一步特征的局部提取。
從表1和表2可以看出,兩個數(shù)據(jù)集中的立場標(biāo)簽類別不平衡且不同事件的數(shù)量落差大,所以本文使用準(zhǔn)確度和Macro?F1來評估模型。本文模型有兩種,UO和O后綴分別代表非優(yōu)化和優(yōu)化的目標(biāo)函數(shù)的模型。
表3為在RumourEval和PHEME數(shù)據(jù)集上本文的模型和Baseline模型的結(jié)果對比??梢钥闯?,在RumourEval數(shù)據(jù)集上,模型JSP?MRVM(O)在準(zhǔn)確度和Macro?F1上分別比RV?ML模型高了10.7個百分點和11.2個百分點;在PHEME數(shù)據(jù)集,JSP?MRVM(O)模型在準(zhǔn)確度和Macro?F1都超過了基線模型。在兩個數(shù)據(jù)集上,本文模型都超過了基線模型,在RumourEval數(shù)據(jù)集上尤為明顯,說明了本文模型的優(yōu)越性。同時如圖3所示,本文模型在非優(yōu)化模型上仍然大幅超越了基線模型的準(zhǔn)確度(Accuracy, Acc)和Macro?F1。
為了分析本文模型各個組成部分的重要性,在RumourEval數(shù)據(jù)集作消融實驗,結(jié)果如表5。表5中模型JSP?MRVM?G、JSP?MRVM?C和JSP?MRVM?F分別表示去掉了GCN、CNN和F?Gate。
首先,O和UO模型在同基礎(chǔ)上的性能,前者都優(yōu)于后者,說明優(yōu)化的目標(biāo)函數(shù)可以獲取模型的最優(yōu)參數(shù)。其次,模型中的GCN部分對整個模型的性能影響最大,說明從三個圖結(jié)構(gòu)中提取的立場特征和謠言的過程表征對謠言驗證的輔助作用還是很大的。
從表3中可以明顯看出,本文模型在PHEME數(shù)據(jù)集上提升效果不如RumorEval明顯,本文做了如下分析:
在表2和圖3中可以看到,PHEME數(shù)據(jù)集中各事件的真、假和未驗證的比例嚴(yán)重失衡,在Ferguson和Putinmissing事件中真假標(biāo)簽數(shù)量遠(yuǎn)遠(yuǎn)低于未驗證標(biāo)簽數(shù)量,而Ottawashooting事件中則是真標(biāo)簽數(shù)量遠(yuǎn)高于假和未驗證標(biāo)簽數(shù)量。在Putinmissing、Prince?toronto、Gurlitt和Ebola?essien事件中甚至出現(xiàn)了沒有某一類標(biāo)簽的情況,嚴(yán)重影響了用其中一個事件為測試集的交叉測試。從表4中五個主要事件的真、假和未驗證的準(zhǔn)確度結(jié)果來看,其中Ferguson事件中,分類為假出現(xiàn)了0%準(zhǔn)確度,Ottawashooting、Charliehebdo和Sydneysiege事件中都出現(xiàn)了分類為真的準(zhǔn)確度遠(yuǎn)高于其他兩類準(zhǔn)確度,這些結(jié)果印證了上述由數(shù)據(jù)集比例失衡而影響到預(yù)測某一類偏低的猜測。
表 3 RumorEval和PHEME數(shù)據(jù)集上本文模型與基線模型的對比 單位: %
表 4 本文模型在RumorEval和PHEME數(shù)據(jù)集上的子類準(zhǔn)確度 單位:%
表 5 RumorEval數(shù)據(jù)集上的消融實驗結(jié)果 單位: %
圖3 PHEME數(shù)據(jù)集中各事件真、假和未驗證的事件數(shù)
本文模型在立場分類任務(wù)中提取了會話中的三種圖結(jié)構(gòu)信息,并在融合層中利用輔助任務(wù)豐富了準(zhǔn)確度驗證任務(wù)的特征表征,所以性能表現(xiàn)更優(yōu)。而且,本文設(shè)計的優(yōu)化的損失函數(shù)使得模型的參數(shù)可以盡可能地達(dá)到最優(yōu)值。
本文基于MTL框架提出了一個聯(lián)合立場的過程跟蹤式多任務(wù)謠言驗證模型,該模型采用立場分類作為輔助任務(wù),提高了謠言驗證任務(wù)的性能。在RumourEval和PHEME數(shù)據(jù)集上的實驗表明,本文所提出的JSP?MRVM(O)獲得了最好的謠言驗證性能,從消融實驗看出優(yōu)化目標(biāo)函數(shù)的模型總體性能優(yōu)于非優(yōu)化模型。在未來的工作中,將探索加入推文和用戶的其他特征,從更多角度獲取識別謠言的特征進行謠言檢測。
[1] DIXON S. Twitter: number of monthly active users 2010 — 2019[EB/OL]. (2022-07-27)[2022-08-10].https://www.statista.com/statistics/282087/number?of?monthly?active?twitter?users/.
[2] THOMALA L L. Number of Sina Weibo users in China 2017?2021[EB/OL]. (2019-11-08)[2021-08-13].https://www.statista.com/statistics/941456/china?number?of?sina?weibo?users/.
[3] ZUBIAGA A, AKER A, BONTCHEVA K, et al. Detection and resolution of rumours in social media: a survey[J]. ACM Computing Surveys, 2019, 51(2): No.32.
[4] CAPLOW T. Rumors in war[J]. Social Forces, 1947, 25(3): 298?302.
[5] ZUBIAGA A, KOCHKINA E, LIAKATA M, et al. Stance classification in rumours as a sequential task exploiting the tree structure of social media conversations[C]// Proceedings of the 26th International Conference on Computational Linguistics: Technical Papers. [S.l.]: The COLING 2016 Organizing Committee, 2016: 2438-2448.
[6] ENAYET O, EL?BELTAGY S R. NileTMRG at SemEval?2017 task 8: determining rumour and veracity support for rumours on Twitter[C]// Proceedings of the 11th International Workshop on Semantic Evaluation. Stroudsburg, PA: Association for Computational Linguistics, 2017: 470-474.
[7] LUKASIK M, SRIJITH P K, VU D, et al. Hawkes processes for continuous time sequence classification: an application to rumour stance classification in Twitter[C]// Proceedings of the 54th Annual Meeting of the Association for Computational Linguistics (Volume 2: Short Papers). Stroudsburg, PA: Association for Computational Linguistics, 2016: 393-398.
[8] 魏武揮. 謠言的傳播與辟謠[J]. 新聞記者, 2012(5): 28-31.(WEI W H. The spread and refutation of rumors[J]. Journalist Review, 2012(5): 28-31.)
[9] ZUBIAGA A, LIAKATA M, PROCTER R, et al. Analysing how people orient to and spread rumours in social media by looking at conversational threads[J]. PLoS ONE, 2016, 11(3): No.e0150989.
[10] MA J, GAO W, WONG K F. Detect rumor and stance jointly by neural multi?task learning[C]// Proceedings of the 2018 Web Conference. Republic and Canton of Geneva: International World Wide Web Conferences Steering Committee, 2018: 585-593.
[11] 李嶠,劉宇. 基于機器學(xué)習(xí)的推特謠言立場分析研究[J]. 電子設(shè)計工程, 2019, 27(21): 36-39, 44.(LI Q, LIU Y. Research on Twitter rumor standpoint analysis based on machine learning[J]. Electronic Design Engineering, 2019, 27(21): 36-39, 44.)
[12] KOCHKINA E, LIAKATA M, ZUBIAGA A. All?in?one: multi? task learning for rumour verification[C]// Proceedings of the 27th International Conference on Computational Linguistics. Stroudsburg, PA: Association for Computational Linguistics, 2018: 3402-3413.
[13] MENDOZA M, POBLETE B, CASTILLO C. Twitter under crisis: Can we trust what we RT?[C]// Proceedings of the 1st Workshop on Social Media Analytics. New York: ACM: 2010: 71-79.
[14] CHUANG J H, HSIEH S. Stance classification on PTT comments[C/OL]// Proceedings of the 29th Pacific Asia Conference on Language, Information and Computation: Posters. [2021-08-11].https://aclanthology.org/Y15?2004.pdf.
[15] RANADE S, SANGAL R, MAMIDI R. Stance classification in online debates by recognizing users’ intentions[C]// Proceedings of the 4th Annual Meeting of the Special Interest Group on Discourse and Dialogue. Stroudsburg, PA: Association for Computational Linguistics, 2013: 61-69.
[16] ZENG L, STARBIRD K, SPIRO E S. #Unconfirmed: classifying rumor stance in crisis?related social media messages[C]// Proceedings of the 10th International AAAI Conference on Web and Social Media. Palo Alto, CA: AAAI Press, 2016: 747-750.
[17] KOCHKINA E, LIAKATA M, AUGENSTEIN I. Turing at SemEval?2017 Task 8: sequential approach to rumour stance classification with branch?LSTM[C]// Proceedings of the 11th International Workshop on Semantic Evaluation. Stroudsburg, PA: Association for Computational Linguistics, 2017: 475-480.
[18] CHEN Y C, LIU Z Y, KAO H Y. IKM at SemEval?2017 Task 8: convolutional neural networks for stance detection and rumor verification[C]// Proceedings of the 11th International Workshop on Semantic Evaluation. Stroudsburg, PA: Association for Computational Linguistics, 2017: 465-469.
[19] ZHAO Z, RESNICK P, MEI Q Z. Enquiring minds: early detection of rumors in social media from enquiry posts[C]// Proceedings of the 24th International Conference on World Wide Web. Republic and Canton of Geneva: International World Wide Web Conferences Steering Committee, 2015: 1395-1405.
[20] MA J, GAO W, MITRA P, et al. Detecting rumors from microblogs with recurrent neural networks[C]// Proceedings of the 25th International Joint Conference on Artificial Intelligence. California: ijcai.org, 2016: 3818-3824.
[21] MA J, GAO W, WONG K F. Detect rumors in microblog posts using propagation structure via kernel learning[C]// Proceedings of the 55th Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers). Stroudsburg, PA: Association for Computational Linguistics, 2017: 708-717.
[22] LI Q Z, ZHANG Q, SI L. Rumor detection by exploiting user credibility information, attention and multi?task learning[C]// Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics. Stroudsburg, PA: Association for Computational Linguistics, 2019: 1173-1179.
[23] CARUANA R. Multitask learning[J]. Machine Learning, 1997, 28(1): 41-75.
[24] LV Q, WANG Y F, ZHANG B, et al. RV?ML: an effective rumor verification scheme based on multi?task learning model[J]. IEEE Communications Letters, 2020, 24(11): 2527-2531.
[25] FAJCIK M, SMRZ P, BURGET L. BUT?FIT at SemEval?2019 Task 7: determining the rumour stance with pre?trained deep bidirectional transformers[C]// Proceedings of the 13th International Workshop on Semantic Evaluation. Stroudsburg, PA: Association for Computational Linguistics, 2019: 1097-1104.
[26] KHANDELWAL A. Fine?tune Longformer for jointly predicting rumor stance and veracity[C] // Proceedings of the 8th ACM IKDD CODS and 26th COMAD. New York: ACM, 2021: 10-19.
[27] KUMAR S, CARLEY K M. Tree LSTMs with convolution units to predict stance and rumor veracity in social media conversations[C]// Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics. Stroudsburg, PA: Association for Computational Linguistics, 2019: 5047-5058.
[28] CIPOLLA R, GAL Y, KENDALL A. Multi?task learning using uncertainty to weigh losses for scene geometry and semantics[C]// Proceedings of the 2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition. Piscataway: IEEE, 2018: 7482-7491.
[29] MIKOLOV T, CHEN K, CORRADO G, et al. Efficient estimation of word representations in vector space[EB/OL]. (2013-09-07)[2021-08-13].https://arxiv.org/pdf/1301.3781.pdf.
Process tracking multi?task rumor verification model combined with stance
ZHANG Bin, WANG Li*, YANG Yanjie
(,,030600,)
At present, social media platforms have become the main ways for people to publish and obtain information, but the convenience of information publish may lead to the rapid spread of rumors, so verifying whether information is a rumor and stoping the spread of rumors has become an urgent problem to be solved. Previous studies have shown that peoples stance on information can help determining whether the information is a rumor or not. Aiming at the problem of rumor spread, a Joint Stance Process Multi?Task Rumor Verification Model (JSP?MRVM) was proposed on the basis of the above result. Firstly, three propagation processes of information were represented by using topology map, feature map and common Graph Convolutional Network (GCN) respectively. Then, the attention mechanism was used to obtain the stance features of the information and fuse the stance features with the tweet features. Finally, a multi?task objective function was designed to make the stance classification task better assist in verifying rumors. Experimental results prove that the accuracy and Macro?F1 of the proposed model on RumorEval dataset are improved by 10.7 percentage points and 11.2 percentage points respectively compared to those of the baseline model RV?ML (Rumor Verification scheme based on Multitask Learning model), verifying that the proposed model is effective and can reduce the spread of rumors.
rumor verification; stance; multi?task; Graph Convolutional Network (GCN); propagation process; objective function
This work is partially supported by National Natural Science Foundation of China (61872260).
ZHANG Bin, born in 1995, M. S. candidate. His research interests include natural language processing, rumor detection.
WANG Li, born in 1971, Ph. D., professor. Her research interests include data mining, artificial intelligence, machine learning..
YANG Yanjie, born in 1995, M. S. candidate. His research interests include natural language processing, data mining.
1001-9081(2022)11-3371-08
10.11772/j.issn.1001-9081.2021122148
2021?12?21;
2022?02?28;
2022?03?04。
國家自然科學(xué)基金資助項目(61872260)。
TP391.1
A
張斌(1995—),男,山西永濟人,碩士研究生,CCF會員,主要研究方向:自然語言處理、謠言檢測;王莉(1971—),女,山西太原人,教授,博士,CCF高級會員,主要研究方向:數(shù)據(jù)挖掘、人工智能、機器學(xué)習(xí);楊延杰(1995—),男,山西原平人,碩士研究生,主要研究方向:自然語言處理、數(shù)據(jù)挖掘。