亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        聯(lián)合可信度學(xué)習(xí)的雙向相關(guān)GCN網(wǎng)絡(luò)謠言檢測方法

        2025-04-05 00:00:00鄧磊云靜班琪
        現(xiàn)代電子技術(shù) 2025年7期

        摘" 要: 針對目前謠言檢測研究存在謠言傳播言論與其標簽關(guān)聯(lián)性不足和傳播結(jié)構(gòu)特征丟失的問題,提出一種聯(lián)合可信度學(xué)習(xí)的雙向相關(guān)GCN網(wǎng)絡(luò)謠言檢測新方法。首先,根據(jù)謠言傳播言論立場與其標簽關(guān)系構(gòu)建言論動機(善意或惡意)關(guān)系,訓(xùn)練可信度特征提取模型,以獲取謠言言論可信度潛在表示;其次,融合嵌入表示和可信度潛在表示,分別對自上而下和自下而上傳播方向節(jié)點進行相關(guān)性計算,隨后使用Bi?GCN模型捕獲雙向傳播特征;最后,將雙向傳播特征融合后輸入到分類器中,以獲取謠言檢測分類結(jié)果。在微博數(shù)據(jù)集下進行實驗,結(jié)果表明基于可信度學(xué)習(xí)方法優(yōu)于基于立場檢測方法,綜合表現(xiàn)也超過先進的基線模型方法,尤其在謠言早期還未經(jīng)傳播,就可達到91.1%的檢測準確率。

        關(guān)鍵詞: 謠言檢測; 可信度學(xué)習(xí); 動機關(guān)系; 立場檢測; Bi?GCN; 相關(guān)性計算

        中圖分類號: TN711?34; TP181" " " " " " " " " " "文獻標識碼: A" " " " " " " " " " 文章編號: 1004?373X(2025)07?0085?10

        Joint credibility learning for rumor detection in bi?directional

        correlated GCN

        DENG Lei1, 2, YUN Jing1, 2, BAN Qi1, 2

        (1. College of Data Science and Application, Inner Mongolia University of Technology, Hohhot 010080, China;

        2. Inner Mongolia Autonomous Region Engineering amp; Technology Research Center of Big Data Based Software Service, Hohhot 010080, China)

        Abstract: In view of the insufficient correlation between rumor spreading statements and their labels and the loss of communication structure features in the current rumor detection research, a new method based on joint credibility learning for rumor detection in bi?directional correlated GCN (graph convolutional network) is proposed. Firstly, according to the relationship between the rumor spreading statement stances and their labels, which is constructed as the relationship of statement motivation (goodwill or badwill), a credibility feature extraction model is trained to obtain the potential representation of rumor statement credibility. Secondly, the embedding representation and credibility potential representation are fused, and the relevance is computed for the nodes of the top?down and bottom?up propagation directions, respectively, and then the bi?directional propagation features are captured by the Bi?GCN model. Finally, the bi?directional propagation features are fused and input into the classifier in order to obtain the results of rumor detection classification. The results of experiments conducted under the microblogging dataset show that the credibility?based learning approach outperforms the stance?based detection approach, and the comprehensive performance of the former also outperforms that of the advanced baseline modeling approach. In particular, an detection accuracy rate of 91.1% can be achieved at the early stage when the rumor has not yet spread.

        Keywords: rumor detection; credibility learning; motivation relationship; stance detection; Bi?GCN; correlation computation

        0" 引" 言

        隨著在線社交媒體的快速發(fā)展,用戶能夠便捷地發(fā)布信息和獲取信息。然而由于社交媒體對于用戶發(fā)布的消息缺乏嚴格審核,并且用戶在瀏覽信息時往往不會投入太多精力對其真實性進行求證,因此為謠言的滋生和傳播創(chuàng)造了有利條件。謠言,指的是在發(fā)布時未經(jīng)證實的信息。例如新冠疫情期間的“用微波爐加熱口罩可以消毒”以及“熏艾可以預(yù)防新冠肺炎”等。這些謠言不僅可能誤導(dǎo)公眾采取有害或無效的措施,還可能對人民的身體健康造成危害。因此,盡早發(fā)現(xiàn)并遏制謠言傳播是至關(guān)重要的,因為這可以最大程度地減少不實言論的危害,對于維護社會穩(wěn)定具有重大現(xiàn)實意義[1]。

        然而,謠言衍生迅速,數(shù)據(jù)龐大且內(nèi)容繁雜,人工識別謠言雖能夠保證一定的準確率,但不僅成本高昂,還效率低下。近年來,隨著深度學(xué)習(xí)方法的快速發(fā)展,這種方法因其無需復(fù)雜的特征工程、能夠自動從原始數(shù)據(jù)中提取高層次特征表示的特點,較傳統(tǒng)的機器學(xué)習(xí)方法在謠言檢測研究領(lǐng)域中更受關(guān)注和使用。不過,基于深度學(xué)習(xí)的謠言檢測方法仍面臨兩大主要挑戰(zhàn)。

        1) 如何有效地捕捉謠言傳播言論與其標簽之間的關(guān)聯(lián)性,很多研究人員采用多任務(wù)方法,通過在原本文本語義中挖掘其他語義特征,如情感和立場信息,來捕獲真假謠言的語義差異。例如文獻[2]為謠言數(shù)據(jù)集引入情感標簽和新穎性標簽,利用BERT和GloVe提取前提和假設(shè)內(nèi)容文本語義特征,將這些特征拼接后輸入到以前饋神經(jīng)網(wǎng)絡(luò)組成的新穎性檢測模型、情感檢測模型和謠言檢測模型,以最小化三個模型損失加權(quán)和為目標。文獻[3]設(shè)計了一種將不規(guī)則謠言樹構(gòu)建為規(guī)則樹的方法,利用樹自注意力算法提取謠言傳播路徑每個節(jié)點及其分支的局部特征進行立場檢測,通過使用提取到所有節(jié)點的立場特征進行樹卷積和樹池化操作,用于謠言檢測。盡管這些方法豐富了語義表達,卻未能將謠言言論與其標簽建立深層次的對應(yīng)關(guān)系,限制了謠言傳播言論在謠言判斷中的有效性。

        2) 為了在傳播過程中提取緊湊的結(jié)構(gòu)特征,研究人員對謠言傳播過程進行建模,提取事件本身的局部關(guān)系、全局關(guān)系以及與其他事件的關(guān)系等。然而,謠言傳播路徑往往不具備統(tǒng)一規(guī)律,因此很難用一種方法對所有謠言的傳播路徑進行建模。早期的建模方法,如RvNN[4?5]、RNN[6?7]和CNN[8]方法,在捕獲結(jié)構(gòu)特征時存在深度和廣度局限性。而GNN網(wǎng)絡(luò)則通過圖結(jié)構(gòu)更有效地捕捉節(jié)點之間的復(fù)雜關(guān)系,成為主流的建模方法,其變體模型GCN和GAT也備受關(guān)注。然而,傳統(tǒng)的GNN方法未能充分考慮到謠言傳播路徑中雙向傳播方向中節(jié)點間影響的異質(zhì)性,無法自適應(yīng)地關(guān)注不同鄰居節(jié)點的信息。

        基于上述挑戰(zhàn)和缺點,本文提出聯(lián)合可信度學(xué)習(xí)的雙向相關(guān)GCN網(wǎng)絡(luò)謠言檢測方法,該模型包括可信度特征提取模塊和節(jié)點相關(guān)性計算模塊。為了進一步探究謠言傳播言論與其標簽的對應(yīng)關(guān)系,本文將謠言傳播言論與其標簽的立場關(guān)系重新構(gòu)建為動機關(guān)系(善意或惡意),采用多任務(wù)學(xué)習(xí)方法,使用重構(gòu)的動機關(guān)系數(shù)據(jù)集對可信度學(xué)習(xí)網(wǎng)絡(luò)進行預(yù)訓(xùn)練,并與謠言檢測主任務(wù)進行聯(lián)合訓(xùn)練和微調(diào)。為了增強節(jié)點更新的動態(tài)性,本文在雙向傳播過程中,于節(jié)點更新之前引入注意力機制算法,對源方向節(jié)點進行相關(guān)性計算,得出相關(guān)性系數(shù);對源方向節(jié)點特征表示進行加權(quán)求和,從而更新GCN網(wǎng)絡(luò)中節(jié)點表示,以更有效地捕獲謠言傳播的結(jié)構(gòu)特征。

        綜上所述,本文的主要貢獻包括以下三個方面。

        1) 提出可信度學(xué)習(xí)子任務(wù),將傳統(tǒng)的立場關(guān)系重構(gòu)為動機關(guān)系,并建立多任務(wù)學(xué)習(xí)模型,結(jié)果表明可信度學(xué)習(xí)子任務(wù)的性能高于立場檢測。

        2) 提出一種方法來計算謠言雙向傳播節(jié)點間的相關(guān)性,節(jié)點融合直接傳播源鄰居節(jié)點的特征更具相關(guān)性,更有效提升對謠言傳播特征的捕獲能力。

        3) 在真實微博數(shù)據(jù)集中,實驗結(jié)果表明,本文所提方法綜合性能優(yōu)于最先進的基線,并且在謠言早期傳播階段,檢測準確率可達91.1%。

        1" 相關(guān)工作

        1.1" 基于多任務(wù)學(xué)習(xí)的謠言檢測

        多任務(wù)學(xué)習(xí)的目的是利用不同任務(wù)之間的相關(guān)性,通過聯(lián)合訓(xùn)練來改善各個任務(wù)的泛化能力和準確性。多任務(wù)學(xué)習(xí)應(yīng)用廣泛,在謠言檢測領(lǐng)域主要體現(xiàn)在聯(lián)合立場檢測和聯(lián)合情感分析任務(wù)中。

        情感分析任務(wù)是通過分析帖子內(nèi)容中的情感表達來識別用戶的情感狀態(tài),如討厭、害怕、傷心等。研究表明,虛假謠言通常具有煽動性和誤導(dǎo)性,更易引發(fā)更強烈的情感反應(yīng),特別是消極情感[9]。文獻[10]將帖子聲明和評論的語義特征與情感特征拼接后,分別輸入謠言檢測分類器和情感檢測分類器,通過加權(quán)求和二者損失作為共同損失,以優(yōu)化模型參數(shù)。類似地,文獻[11]采用詞嵌入方法將帖子聲明轉(zhuǎn)換為嵌入向量,分別進行情感檢測和謠言檢測,并最小化二者損失來優(yōu)化模型參數(shù)。文獻[12]在情感檢測的基礎(chǔ)上,增加了新穎性檢測,并對兩者進行數(shù)據(jù)適應(yīng)性的預(yù)訓(xùn)練,使用GloVe提取新穎性特征,BERT提取情感特征,融合它們用于謠言檢測。

        立場檢測任務(wù)定義為辨別帖子內(nèi)容對目標謠言的態(tài)度,即支持、否定或中立。據(jù)研究,謠言傳播期間,虛假謠言往往比真實謠言更容易受到否定或質(zhì)疑,導(dǎo)致其立場分布方面存在顯著差異[13]。文獻[14]利用GRU網(wǎng)絡(luò)構(gòu)建元網(wǎng)絡(luò)和多個任務(wù)網(wǎng)絡(luò),元網(wǎng)絡(luò)收集所有任務(wù)共享的高層元知識,謠言檢測和立場檢測執(zhí)行時需要結(jié)合各自的語義和元知識特征,緩解了多任務(wù)間的語義差異。文獻[15]分別研究了自下而上和自上而下的傳播方向使用RvNN的效果。首先使用RvNN對傳播節(jié)點進行立場檢測以獲取立場特征;然后運算傳播節(jié)點與帖子聲明的語義特征得到每個節(jié)點的注意力分數(shù);最后通過加權(quán)求和立場特征用于謠言檢測,結(jié)果表明自上而下的性能要更好。文獻[16]構(gòu)建了一個基于單詞和帖子異構(gòu)圖的模型,通過自適應(yīng)圖注意力層來捕獲鄰居特征更新節(jié)點進行立場檢測,隨后再經(jīng)過圖池化層和自適應(yīng)圖注意力層進行謠言檢測,將二者損失累加以實現(xiàn)聯(lián)合訓(xùn)練。

        在以上描述的謠言檢測子任務(wù)中,雖然其綜合性能優(yōu)于單一任務(wù),但情感分析和立場檢測任務(wù)并未深入探索謠言立場與真假標簽的關(guān)聯(lián)性,導(dǎo)致與謠言檢測任務(wù)的關(guān)聯(lián)性不足。在這一背景下,對傳統(tǒng)的立場檢測任務(wù)進行改進,引入了可信度學(xué)習(xí)的概念。通過區(qū)分帖子和評論的善意與惡意來判斷其可信度,基于這個思路,可以認為善意的帖子很可能是真實的,而惡意的帖子則很可能是虛假的。因此,模型在解決謠言檢測這個二分類問題上具有積極的作用。

        1.2" 基于傳播結(jié)構(gòu)的謠言檢測

        謠言在傳播過程中具有“自我糾正”的特性,用戶分享對謠言的看法也可以作為謠言檢測的重要依據(jù)[17]??紤]到謠言傳播路徑的復(fù)雜性,很難用統(tǒng)一的方法去提取不同謠言的層次特征。圖神經(jīng)網(wǎng)絡(luò)(GNN)能夠在不規(guī)則和非結(jié)構(gòu)化的圖數(shù)據(jù)中提取和挖掘特征,所以成為了建模謠言傳播結(jié)構(gòu)的主流方法[18]。而GCN和GAT作為GNN的變體,同樣廣泛應(yīng)用于謠言檢測任務(wù)中。

        文獻[19]提出兩種根據(jù)謠言傳播的時間和順序生成快照的方式,并利用雙向GCN網(wǎng)絡(luò)更新每個快照包含的節(jié)點特征,以捕獲謠言傳播的動態(tài)性特征。文獻[20]提出多跳GAT網(wǎng)絡(luò),使節(jié)點更新能夠融合更遠視野域的全局特征,并引入差分時間感知網(wǎng)絡(luò)以捕獲謠言傳播的時間特征。文獻[21]使用GNN網(wǎng)絡(luò)更新節(jié)點特征以捕獲傳播特征,同時使用CNN網(wǎng)絡(luò)獲取謠言的語義特征,并通過對比學(xué)習(xí)分析這兩種特征的關(guān)系以約束模型的學(xué)習(xí)。文獻[22]提出基于GNN的雙層特征聚合方法,從文本內(nèi)容和謠言傳播結(jié)構(gòu)中學(xué)習(xí)單詞和文本粒度的高級表示來進行謠言檢測。文獻[23]通過GCN網(wǎng)絡(luò)建模用戶與謠言聲明以及謠言聲明與其評論之間的關(guān)系,拼接這兩種關(guān)系后用于謠言檢測。

        以上方法說明了基于鄰居節(jié)點重要性進行節(jié)點更新的重要性,以及結(jié)合兩個傳播方向的結(jié)構(gòu)特征的重要性。然而,據(jù)了解并沒有相關(guān)方案能同時聯(lián)合這二者的優(yōu)點來改進謠言檢測任務(wù)。本文方法受雙向GCN和GAT方法的啟發(fā),使用注意力機制算法來計算相關(guān)性,在每個傳播方向節(jié)點更新時,依據(jù)相關(guān)性將直接傳播源節(jié)點的特征加權(quán)融合,以提高模型對傳播結(jié)構(gòu)特征的捕獲能力。

        2" 聯(lián)合可信度學(xué)習(xí)的雙向相關(guān)GCN網(wǎng)絡(luò)

        2.1" 問題描述

        定義1:謠言事件。[r=r1,r2,…,rm]是一組用于謠言檢測的所有事件實例,其中[ri]是第[i]個事件,[m]是事件數(shù)量。[ri]由帖子聲明及其評論組成,表示為[ri={pi,0,pi,1,…,pi,n}],[n]是[ri]評論的個數(shù),[pi,j]是謠言[ri]的第[j]個評論,其中[pi,0]表示第[i]個事件的聲明。

        定義2:可信度檢測函數(shù)。謠言傳播結(jié)構(gòu)中,每個評論內(nèi)容對于根帖子(謠言聲明)有著不同的態(tài)度,支持、否定或中立。

        如圖1所示,當謠言標簽為真時,其支持的言論設(shè)定為善意,否定的言論設(shè)定為惡意;同樣,當謠言標簽為假時,其支持的言論設(shè)定為惡意,否定的言論設(shè)定為善意。給定一個謠言[ri],判斷其所有交互[pi,j]的交互類型,即[fcd:pi,j→ycdi,j],其中[ycdi,j∈]{善意,惡意}。

        定義3:謠言檢測函數(shù)。通過對傳播樹建模,給定一個謠言[ri],結(jié)合謠言傳播樹中的帖子和評論,判斷[ri]的標簽,即[frd:ri→yrdi],其中[yrdi∈]{非謠言,假謠言}。

        2.2" 模型概述

        本文提出了聯(lián)合可信度學(xué)習(xí)的雙向相關(guān)GCN網(wǎng)絡(luò)謠言檢測方法(CDR?aBiGCN),框架如圖2所示,主要由以下三個組件組成。

        1) 可信度特征提取網(wǎng)絡(luò)模塊。負責提取參與謠言傳播的言論與標簽之間的可信度特征關(guān)系。

        2) 雙向相關(guān)GCN網(wǎng)絡(luò)模塊。負責聚合謠言文本嵌入和可信度特征,并構(gòu)建自上而下和自下而上傳播圖。該模塊通過計算雙向節(jié)點間的相關(guān)性,利用GCN網(wǎng)絡(luò)更新節(jié)點特征,獲取謠言傳播結(jié)構(gòu)特征。

        3) 判別輸出模塊。將所有謠言傳播過程中的節(jié)點表示融合為一個整體表達,送入線性分類層,用于生成謠言的分類結(jié)果,同時計算損失函數(shù)數(shù)值實現(xiàn)更新雙向相關(guān)GCN網(wǎng)絡(luò)和微調(diào)可信度特征提取網(wǎng)絡(luò)。

        2.3" 傳播關(guān)系構(gòu)建

        通過對謠言傳播關(guān)系建模,可以學(xué)習(xí)到其結(jié)構(gòu)特征。以往的研究已經(jīng)證明同時利用雙向特征作為互相補充,可以提升模型的性能。

        同樣,本文也選擇使用兩個傳播方向。在事件[ri]中涵蓋多個節(jié)點[pi,0],[pi,1],…,使用圖(Graph)的數(shù)據(jù)結(jié)構(gòu)構(gòu)建關(guān)系。

        1) 自上而下(Top?Down, TD)的傳播圖,從根節(jié)點到葉子節(jié)點路徑方向中,所有節(jié)點的連接關(guān)系能夠有效地捕獲節(jié)點傳播的特點,反映事件傳播的自然序列,展示節(jié)點之間的層次結(jié)構(gòu)和因果關(guān)系。

        2) 自下而上(Bottom?Up, BU)的傳播圖,從葉子節(jié)點到根節(jié)點路徑方向中,所有節(jié)點的連接關(guān)系可以揭示帖子的自我糾正特征,凸顯信息的反饋機制,強調(diào)了事件最終狀態(tài)對整個傳播過程的關(guān)鍵影響。

        自上而下的傳播圖[GTD=V,E],其中[V]是節(jié)點信息,[E]表示節(jié)點的傳播方向(根節(jié)點[→]葉子節(jié)點)。[V=ri=pi,0,pi,1,…,pi,n],包含事件中所有節(jié)點信息。同理,可得出自下而上傳播圖[GBU]。

        2.4" 可信度特征提取網(wǎng)絡(luò)模塊

        以往的研究人員使用多任務(wù)學(xué)習(xí)方法來增強語義表達能力。在此基礎(chǔ)上,本文提出了一個新的子任務(wù),即可信度學(xué)習(xí),通過將謠言傳播言論與其標簽建立聯(lián)系,以提取利于謠言判斷的可信度特征。文本嵌入采用基于Transformer的雙向編碼器BERT[24],以捕獲豐富的語義特征,此前,BERT已被廣泛應(yīng)用于翻譯和摘要等任務(wù)中,顯示出強大的文本理解能力。給定一個帖子內(nèi)容[pi, j],對其分詞并按順序建模得列表[pi, j=w1,w2,…,wo],[o]為單詞總數(shù),隨后使用BERT獲取特征嵌入。

        [hti, j=BERTpi, j=BERTw1,w2,…,wo] (1)

        式中,[hti, j∈Rdw]是BERT預(yù)訓(xùn)練模型中最后一層CLS的隱藏狀態(tài),[dw]是文本嵌入的維度。

        然后,將文本嵌入[hti,j]作為模型原始輸入[hd0i, j],進行一系列的線性變換和非線性激活函數(shù),得到了逐層變換的可信度特征表示:

        [hd1i, j=σW1hd0i, j+b1] (2)

        [hd2i, j=σW2hd1i, j+b2] (3)

        式中:[σ]為激活函數(shù);[W1]、[W2]分別是線性變化操作第一層和第二層的權(quán)重矩陣;[b1]、[b2]分別是線性變化操作第一層和第二層的偏置向量。這一系列變換實現(xiàn)了對文本嵌入的逐層特征提取,通過非線性映射和權(quán)重調(diào)整,逐步形成了更抽象的表示[hd2i,j]。

        最后,獲取[hd2i,j]的可信度標簽概率,應(yīng)用Softmax函數(shù)將可信度特征轉(zhuǎn)換為類別概率。具體而言,使用以下公式計算概率分布。

        [Ycdi, j=SoftmaxW3hd2i, j+b3] (4)

        式中:[Ycdi, j∈]{善意,惡意}是可信度的預(yù)測概率;[W3]和[b3]是全連接層的權(quán)重和偏置。

        2.5" 雙向相關(guān)GCN網(wǎng)絡(luò)模塊

        GCN網(wǎng)絡(luò)能夠自適應(yīng)地學(xué)習(xí)圖結(jié)構(gòu)中節(jié)點的特征和關(guān)系,因此可以有效地對不同長度和形狀的謠言傳播網(wǎng)絡(luò)進行建模。然而,傳統(tǒng)的雙向GCN網(wǎng)絡(luò)的節(jié)點更新方法存在不足,無法根據(jù)節(jié)點與不同鄰居節(jié)點的相關(guān)性獲得不同的更新,導(dǎo)致動態(tài)性缺乏。本文使用雙向相關(guān)GCN網(wǎng)絡(luò),節(jié)點更新之前先進行相關(guān)性計算,隨后使用GCN網(wǎng)絡(luò)捕獲結(jié)構(gòu)特征,從而使得節(jié)點間的結(jié)構(gòu)更加緊湊。在可信度特征提取模塊中,得到了可信度特征嵌入[hdi, j],通過[concat]函數(shù)拼接原始文本嵌入[hti, j],可得特征增強后的節(jié)點特征:

        [hi, j=concathdi, j,hti, j] (5)

        謠言傳播的結(jié)構(gòu)特征捕獲通常使用節(jié)點更新方法,具體而言:計算自身節(jié)點和其他節(jié)點的相關(guān)性,將其他節(jié)點的特征根據(jù)相關(guān)性添加到自身節(jié)點表示中。

        節(jié)點之間的相關(guān)性通過注意力算法進行計算,逐個評估節(jié)點[j]與其直接傳播源節(jié)點[v]的相關(guān)性。

        [ei, j,v=aWhi, jWhi,v] (6)

        [ai, j,v=Softmaxei, j,v] (7)

        式中:[v∈Nj],[Nj]是[j]的直接傳播源的相鄰節(jié)點集合;[,,]是拼接操作;[a]和[W]是線性變化權(quán)重參數(shù);Softmax是歸一化函數(shù)。

        然后獲取相鄰節(jié)點的特征,更新節(jié)點特征表示為:

        [hi, j=σv∈Ni, jai, j,vWhi,v] (8)

        在自上而下的傳播結(jié)構(gòu)中,重復(fù)式(6)~式(8),可以融合更遠視野域節(jié)點特征,融合兩跳結(jié)構(gòu)信息的節(jié)點[j]的計算公式為:

        [hTDi, j=h1i, j=σv∈Ni, jai, j,vWhi,v] (9)

        [hTDi, j=h2i, j=σv∈Ni, jai, j,vWh1i,v] (10)

        式中:[hTDi=hTDi,0,hTDi,1,…,hTDi,n],[hTDi∈Rn×64]表示謠言[i]的整個傳播過程所有傳播節(jié)點;[hTDi, j∈hTDi]表示謠言[i]的傳播節(jié)點[j]的特征表示,同理,可計算得到自下而上傳播過程的表示[hBUi]。為了獲取整體傳播結(jié)構(gòu)特征,將兩個傳播方向的節(jié)點按照式(11)進行融合。

        [H*i=mean(h*i)=meanh*i,0,h*i,1,…,h*i,n] (11)

        式中:[H?i∈R1×64]表示傳播方向為“[?]”的傳播結(jié)構(gòu)特征;“[?”∈TD,BU];mean為平均函數(shù)。

        2.6" 分類輸出

        給定謠言[ri],經(jīng)過BERT嵌入后得到其表示為[hti]。隨后,將該表示向量與可信度檢測模塊的輸出[hci]進行拼接,分別通過不同的傳播結(jié)構(gòu)更新后得到[hTDi]和[hBUi]。接著,使用平均函數(shù)(mean)分別對這兩個向量求平均得到[HTDi]和[HBUi]。最后,通過合并函數(shù)([concat])拼接后輸入到線性分類層,謠言分類概率表述為:

        [Yrdi=SoftmaxW4concatHTDi,HBUi+b4] (12)

        式中:[Yrdi∈]{非謠言,假謠言}為謠言[i]是謠言與否的預(yù)測概率;[W4]和[b4]是全連接層的權(quán)重和偏置。

        3" 實" 驗

        3.1" 數(shù)據(jù)集

        本文在可信度學(xué)習(xí)子任務(wù)中,采用SemEval?2019的task7英文立場數(shù)據(jù)集,通過百度翻譯接口將其翻譯為中文,以構(gòu)建中文動機數(shù)據(jù)集,該立場數(shù)據(jù)集來源于真實的社交網(wǎng)絡(luò)——Twitter和Reddit,具體數(shù)據(jù)分布情況如表1和表2所示。

        而在謠言檢測的主任務(wù)中,使用Weibo16數(shù)據(jù)集,這是當前謠言檢測研究中使用最廣泛的中文數(shù)據(jù)集之一,其數(shù)據(jù)來自于中國的微博平臺,數(shù)據(jù)分布情況如表3所示。

        3.2" 對比實驗

        為了進一步驗證本文所提出的謠言檢測方法的有效性,與以下13種研究方法進行對照實驗。

        1) DTC[25],基于決策樹分類器提取和分析信息傳播的帖子特征。

        2) RFC[26],基于隨機森林分類器,利用用戶、內(nèi)容和結(jié)構(gòu)屬性作為手工特征。

        3) SVM?TS[27],基于線性SVM分類器,利用手工制作的社交上下文特征,使用時間序列對特征值隨時間的變化進行建模。

        4) SVM?RBF[28],基于SVM的RBF內(nèi)核模型,與DTC類似,使用謠言帖子的手工特征。

        5) SVM?TK[29],基于樹核的SVM分類器,通過核學(xué)習(xí)方法捕獲傳播結(jié)構(gòu)特征。

        6) SVM?HK[30],使用混合核的SVM分類器,通過核學(xué)習(xí)方法捕獲傳播結(jié)構(gòu)特征。

        7) RvNN[17],將帖子及其評論建模為對話樹,并采用遞歸神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)傳播特征。

        8) TD?RvNN?GA[4],在之前的研究上[17],將每一個傳播過程中的言論通過注意力機制賦予權(quán)重。

        9) Bi?GCN[31],建模謠言傳播言論,使用雙向圖卷積網(wǎng)絡(luò)捕獲雙向(自上而下和自下而上)結(jié)構(gòu)特征。

        10) GLAN[32],使用CNN網(wǎng)絡(luò)力機制融合帖子間的語義潛在表示,而后將帖子、轉(zhuǎn)發(fā)和用戶關(guān)系建模為全局關(guān)系異構(gòu)圖,捕獲結(jié)構(gòu)特征。

        11) HAGNN[22],設(shè)置GCN來捕獲結(jié)構(gòu)特征,再設(shè)置門控GNN來更新文本和單詞的聚合表示,池化后經(jīng)Softmax函數(shù)輸出分類結(jié)果。

        12) SBAG[33],首先預(yù)訓(xùn)練多層感知網(wǎng)絡(luò)捕獲社交機器人特征,然后嵌入特征構(gòu)建多個GNN網(wǎng)絡(luò)對帖子建模。

        13) SDR?aBiGCN,將本文的可信度檢測子任務(wù)替換為立場檢測子任務(wù),在謠言檢測網(wǎng)絡(luò)訓(xùn)練時,建模融合謠言傳播言論的態(tài)度立場潛在特征,隨后使用雙向相關(guān)GCN網(wǎng)絡(luò)訓(xùn)練。

        3.3" 實驗設(shè)置

        在實驗環(huán)節(jié),采用BERT預(yù)訓(xùn)練模型進行文本嵌入表示,其維度設(shè)定為默認的768維。在可信度學(xué)習(xí)子任務(wù)中,使用Adam優(yōu)化器,批尺寸大小為64,學(xué)習(xí)率為0.001,訓(xùn)練輪次為100,Dropout率為0.5。為了確保訓(xùn)練的有效性,引入早停機制。具體而言,如果驗證集損失在10個epoch后仍未減少,將認為模型已經(jīng)收斂,便會停止訓(xùn)練并保存模型權(quán)重,以備用于后續(xù)處理檢測模塊輸入數(shù)據(jù)。

        在謠言檢測主任務(wù)中,同樣采用了Adam優(yōu)化器,訓(xùn)練輪次為100,學(xué)習(xí)率為0.000 1,批尺寸大小為64。為了更好地捕捉謠言傳播特征,構(gòu)建有向圖數(shù)據(jù)結(jié)構(gòu),并設(shè)置GCN卷積層數(shù)為2。

        3.4" 實驗表現(xiàn)

        實驗結(jié)果如表4所示,本文提出的聯(lián)合可信度學(xué)習(xí)的多任務(wù)方法優(yōu)于其他多任務(wù)學(xué)習(xí)基線方法0.004~0.01,優(yōu)于單謠言檢測方法0.006~0.035,優(yōu)于基于傳統(tǒng)手工特征方法0.065~0.149。

        在第一組實驗中,明顯可見基于傳統(tǒng)手工特征提取的方法效果明顯低于基于深度學(xué)習(xí)方法的效果。具體而言,前四類方法(DTC、RFC、SVM?TS和SVM)的性能較低,這可能是由于手工特征的質(zhì)量受到限制,而這些特征可能并不適合直接用于模型判斷,從而導(dǎo)致準確率較低。相比之下,SVM?HK和SVM?TK通過核方法捕獲結(jié)構(gòu)特征,顯示出了更好的性能,也表明了傳播結(jié)構(gòu)特征對于謠言判斷是有益的特征。

        在第二組實驗中,探索了不同傳播結(jié)構(gòu)特征捕獲能力的差異。TD?RvNN和TD?RvNN?GA對比得知,加入注意力機制可以選擇有效的內(nèi)容數(shù)據(jù)進行謠言判斷。Bi?GCN方法要比RvNN方法優(yōu)0.013左右,其原因是RvNN方法是一種深度遍歷方法,對于捕獲廣度結(jié)構(gòu)特征能力不足。GLAN雖然可以捕獲到更遠距離的節(jié)點結(jié)構(gòu)特征,但是CNN網(wǎng)絡(luò)局部特征提取有限,容易造成對復(fù)雜傳播結(jié)構(gòu)特征捕獲不足。HAGNN和Bi?GCN在第二組實驗中表現(xiàn)最好,證明了GNN類模型在捕獲傳播結(jié)構(gòu)特征方面的能力,也進一步驗證了使用雙向傳播特征(Bi?GCN)優(yōu)于單向傳播(HAGNN)的性能。

        在第三組實驗中,相比于一般的傳播結(jié)構(gòu)上的研究方法,通過增加輔助任務(wù)(SBGA、SDR?aBiGCN)可以明顯提高檢測性能。SBGA的假謠言檢測性能要優(yōu)于SDR?aBiGCN和本文提出的CDR?aBiGCN,證明了用戶特征對于謠言判別的有效性,但其非謠言的檢測能力不足,原因可能為用戶信息并不真實,進而無法準確判斷是否是機器人,用戶特征不明顯,將真人識別為機器人。CDR?aBiGCN和SDR?aBiGCN的實驗結(jié)果顯示,基于可信度學(xué)習(xí)的子任務(wù)方法要比基于立場檢測的子任務(wù)在謠言檢測方面具有更佳的檢測性能。

        本文提出的謠言檢測方法,相比以上提到的基線模型,在非謠言的精確率和假謠言的召回率方面表現(xiàn)略低,但在其他指標上均取得了最好的表現(xiàn)。因此,本文提出的方法具有較高的檢測性能。

        3.5" 消融實驗

        本文提出的CDR?aBiGCN模型主要由可信度學(xué)習(xí)網(wǎng)絡(luò)、相關(guān)性計算和BiGCN網(wǎng)絡(luò)三部分組成。為了評估本文方法中各個組件的有效性,設(shè)計以下幾個變異模型,并將其性能與相關(guān)方法進行比較。

        w/o CD:刪除可信度學(xué)習(xí)模塊,取消可信度特征嵌入,使用文本初始嵌入用于分類。

        w/o A:去除雙向相關(guān)性計算方法,節(jié)點更新方式采用傳統(tǒng)GCN網(wǎng)絡(luò)更新方法。

        w/o BU:刪除自下而上的謠言傳播特征,只使用自上而下傳播特征。

        w/o TD:刪除自上而下的謠言傳播特征,只使用自下而上傳播特征。

        如表5所示,可以觀察到每個組件對整個模型都是不可或缺的。由傳播結(jié)構(gòu)的變異模型中可見,捕獲的傳播特征網(wǎng)絡(luò)方法的性能表現(xiàn)為:Bi?GCNgt;BU?GCNgt;TD?GCN。在去除TD后,性能下降并不明顯,這表明自上而下捕獲的傳播特征對整體模型判斷的貢獻度相對較小。然而,當去除BU后,模型性能下降明顯,表明了來自于子節(jié)點的自下而上表示的重要性,證明了謠言在傳播過程中具有自我糾正的特點,可以作為謠言判斷的重要依據(jù)特征。綜合考慮二者的結(jié)合對優(yōu)化模型性能具有顯著作用。

        在相同條件下的變異模型中,當去除可信度特征提取模塊后,模型的準確率下降幅度為0.01~0.025。表明可信度特征增強了語義表示,在謠言檢測任務(wù)中,起到了重要的作用。當去除雙向相關(guān)性計算權(quán)重方法后,模型性能下降,證明了在GCN網(wǎng)絡(luò)中傳統(tǒng)的節(jié)點更新方法的節(jié)點間更新相關(guān)性不足,從而導(dǎo)致傳播特征的缺失。

        綜上所述,本文提出的模型的各個組件對于整個模型都具有關(guān)鍵作用,證明了該框架的有效性。

        3.6" 早期檢測表現(xiàn)

        如果能夠盡早識別判斷謠言,就可以盡可能地降低對社會的危害,為此很多研究開始了對早期謠言檢測。對于這項工作,本文采用兩種類型:一種是根據(jù)帖子聲明發(fā)布后經(jīng)過的時間;另一種是根據(jù)傳播樹深度的不同數(shù)據(jù)比例設(shè)置,來驗證模型是否能夠根據(jù)當前早期時刻攜帶的有限信息正確識別謠言。實驗結(jié)果如圖3所示。

        可以觀察到,在謠言傳播的早期階段,由于交互數(shù)據(jù)較少,所有方法的性能都顯著降低,唯有本文提出的方法表現(xiàn)出相對較高的性能,在只有0.1%數(shù)據(jù)下準確率可達91.1%。隨著評論數(shù)據(jù)的逐漸增多,檢測的準確率也在不斷提高,這進一步證明了謠言傳播具有“自我糾正”的特點。與傳統(tǒng)的立場檢測子任務(wù)方法相比,本文方法能夠在早期獲取謠言聲明的可信度特征,分析言論動機是否出于善意或惡意,從而為謠言判斷提供了有效支持。

        3.7" 特征可視化

        圖4展示了模型訓(xùn)練過程中的標簽可視化。其中:0表示非謠言;1表示假謠言。

        圖4a)展示了僅使用文本嵌入的情況,不同類別的謠言表示存在較高的重合度,表明僅靠文本嵌入無法有效區(qū)分謠言與真實信息。

        圖4b)展示了帖子聲明經(jīng)可信度特征提取后的分類結(jié)果,顯著增強不同類別間的區(qū)分差異,這進一步證明了在謠言檢測中利用可信度特征的有效性。

        圖4c)展示了真實標簽樣本的分布情況,為模型分類提供了參考。

        圖4d)展示了本文方法的預(yù)測結(jié)果,此方法結(jié)合可信度特征和雙向相關(guān)GCN網(wǎng)絡(luò),使不同類別之間的特征區(qū)別更加顯著,進一步提高了模型對真假謠言的區(qū)分能力。

        4" 結(jié)" 語

        本文提出一種聯(lián)合可信度學(xué)習(xí)的雙向相關(guān)GCN網(wǎng)絡(luò)謠言檢測方法,該模型采用可信度檢測作為子任務(wù)進行多任務(wù)學(xué)習(xí),在真實世界的微博數(shù)據(jù)集進行訓(xùn)練和測試,主要結(jié)論有:

        1) 基于可信度學(xué)習(xí)的子任務(wù)方法相較于基于立場檢測子任務(wù)方法,建立了謠言傳播言論與其標簽的深層次對應(yīng)關(guān)系,謠言檢測性能表現(xiàn)更優(yōu)秀;

        2) 謠言傳播網(wǎng)絡(luò)節(jié)點更新方式采用雙向相關(guān)性計算,能夠更好地捕捉節(jié)點在雙向傳播過程中的異質(zhì)性特征,從而有助于提取出更為緊湊的結(jié)構(gòu)特征。

        本文在捕獲結(jié)構(gòu)特征時,特征更新局限于網(wǎng)絡(luò)的兩跳范圍,無法捕獲較遠距離的節(jié)點特征。因此,下一步研究的重點將集中在擴展結(jié)構(gòu)特征融合的范圍,以捕獲更遠距離的節(jié)點特征,從而進一步提升謠言檢測的性能。

        注:本文通訊作者為云靜。

        參考文獻

        [1] 孟凡森,魏霞,黃德啟,等.基于ACON?Transformer的謠言檢測研究[J].現(xiàn)代電子技術(shù),2022,45(21):67?76.

        [2] KUMARI R, ASHOK N, GHOSAL T, et al. Misinformation detection using multitask learning with mutual learning for novelty detection and emotion recognition [J]. Information processing amp; management, 2021, 58(5): 102631.

        [3] BAI N, MENG F R, RUI X B, et al. A multi?task attention tree neural net for stance classification and rumor veracity detection [J]. Applied intelligence, 2023, 53(9): 10715?10725.

        [4] MA J, GAO W, JOTY S R, et al. An attention?based rumor detection model with tree?structured recursive neural networks [J]. ACM transactions on intelligent systems and technology, 2020, 11(4): 1?28.

        [5] HUANG Q, ZHOU C, WU J, et al. Deep structure learning for rumor detection on twitter [C]// 2019 International Joint Conference on Neural Networks (IJCNN). New York: IEEE, 2019: 1?8.

        [6] LIU Y, WU Y F B. Early detection of fake news on social media through propagation path classification with recurrent and convolutional networks [C]// Proceedings of the AAAI Conference on Artificial Intelligence. [S.l.]: AAAI, 2018: 354?361.

        [7] CHEN T, LI X, YIN H Z, et al. Call attention to rumors: Deep attention based recurrent neural networks for early rumor detection [C]// Trends and Applications in Knowledge Discovery and Data Mining. Heidelberg: Springer, 2018: 40?52.

        [8] YU F, LIU Q, WU S, et al. A convolutional approach for misinformation identification [EB/OL]. [2022?03?21]. https://doi.org/10.24963/ijcai.2017/545.

        [9] GHANEM B, ROSSO P, RANGEL F. An emotional analysis of 1 information in social media and news articles [J]. ACM transactions on internet technology (TOIT), 2020, 20(2): 1?18.

        [10] 馬儀,邵玉斌,杜慶治,等.基于聯(lián)合情感的多任務(wù)謠言檢測方法[J].云南大學(xué)學(xué)報(自然科學(xué)版),2024,46(4):642?653.

        [11] CHOUDHRY A, KHATRI I, JAIN M, et al. An emotion?aware multitask approach to fake news and rumor detection using transfer learning [J]. IEEE transactions on computational social systems, 2022, 11(1): 588?599.

        [12] KUMARI R, ASHOK N, GHOSAL T, et al. What the fake? Probing misinformation detection standing on the shoulder of novelty and emotion [J]. Information processing amp; management, 2022, 59(1): 102740.

        [13] MENDOZA M, POBLETE B, CASTILLO C. Twitter under crisis: Can we trust what we RT? [C]// Proceedings of the First Workshop on Social Media Analytics. New York: ACM, 2010: 71?79.

        [14] ZHANG H W, QIAN S S, FANG Q, et al. Multi?modal meta multi?task learning for social media rumor detection [J]. IEEE transactions on multimedia, 2022, 24: 1449?1459.

        [15] YANG R C, MA J, LIN H Z, et al. A weakly supervised propagation model for rumor verification and stance detection with multiple instance learning [C]// Proceedings of the 45th International ACM SIGIR Conference on Research and Development in Information Retrieval. New York: ACM, 2022: 1761?1772.

        [16] LI C, PENG H, LI J X, et al. Joint stance and rumor detection in hierarchical heterogeneous graph [J]. IEEE transactions on neural networks and learning systems, 2022, 33(6): 2530?2542.

        [17] MA J, GAO W, WONG K F. Rumor detection on twitter with tree?structured recursive neural networks [C]// Proceedings of the 56th Annual Meeting of the Association for Computational Linguistics. [S.l.]: ACL, 2018: 1980?1989.

        [18] YAN Y Q, WANG Y J, ZHENG P. Rumor detection on social networks focusing on endogenous psychological motivation [J]. Neurocomputing, 2023, 552: 126548.

        [19] CHOI J, KO T, CHOI Y, et al. Dynamic graph convolutional networks with attention mechanism for rumor detection on social media [J]. Plos one, 2021, 16(8): e0256039.

        [20] CHEN J H, ZHANG W Y, MA H C, et al. Rumor detection in social media based on multi?hop graphs and differential time series [J]. Mathematics, 2023, 11(16): 3461.

        [21] GAO Y, WANG X, HE X N, et al. Rumor detection with self?supervised learning on texts and social graph [J]. Frontiers of computer science, 2023, 17(4): 174611.

        [22] XU S Z, LIU X D, MA K, et al. Rumor detection on social media using hierarchically aggregated feature via graph neural networks [J]. Applied intelligence, 2023, 53(3): 11?14.

        [23] LIU T R, CAI Q, XU C X, et al. Rumor detection with a novel graph neural network approach [EB/OL]. [2024?04?09]. https://doi.org/10.48550/arXiv.2403.16206.

        [24] DEVLIN J, CHANG M W, LEE K, et al. BERT: Pre?training of deep bidirectional transformers for language understanding [EB/OL]. [2022?09?26]. https://doi.org/10.18653/v1/n19?1423.

        [25] CASTILLO C, MENDOZA M, POBLETE B. Information credibi?lity on twitter [C]// Proceedings of the 20th International Conference on World Wide Web. New York: ACM, 2011: 675?684.

        [26] KWON S, CHA M, JUNG K. Rumor detection over varying time windows [J]. PloS one, 2017, 12(1): e0168344.

        [27] MA J, GAO W, WEI Z Y, et al. Detect rumors using time series of social context information on microblogging websites [C]// Proceedings of the 24th ACM International on Conference on Information and Knowledge Management. [S.l.: s.n.], 2015: 1751?1754.

        [28] YANG F, LIU Y, YU X H, et al. Automatic detection of rumor on Sina Weibo [C]// Proceedings of the ACM SIGKDD Workshop on Mining Data Semantics. [S.l.: s.n.], 2012: 1?7.

        [29] MA J, GAO W, WONG K F. Detect rumors in microblog posts using propagation structure via kernel learning [C]// Con?ference of the European Chapter of the Association for Computational Linguistics. [S.l.: s.n.], 2017: 708?717.

        [30] WU K, YANG S, ZHU K Q. False rumors detection on Sina Weibo by propagation structures [C]// 2015 IEEE 31st International Conference on Data Engineering. New York: IEEE, 2015: 651?662.

        [31] BIAN T, XIAO X, XU T Y, et al. Rumor detection on social media with bi?directional graph convolutional networks [J]. Proceedings of the AAAI Conference on Artificial Intelligence, 2020, 34(1): 549?556.

        [32] YUAN C Y, MA Q W, ZHOU W, et al. Jointly embedding the local and global relations of heterogeneous graph for rumor detection [C]// 2019 IEEE International Conference on Data Mining (ICDM). New York: IEEE, 2019: 796?805.

        [33] HUANG Z, Lü Z L, HAN X Y, et al. Social bot?aware graph neural network for early rumor detection [C]// Proceedings of the 29th International Conference on Computational Linguistics. [S.l.]: ICCL, 2022: 6680?6690.

        [34] 趙東波,李輝.一種改進的FCM遙感圖像變化檢測方法[J].電子設(shè)計工程,2023,31(9):156?160.

        作者簡介:鄧" 磊(1999—),男,內(nèi)蒙古興和人,碩士研究生,主要研究方向為自然語言處理、謠言檢測。

        云" 靜(1980—),女,內(nèi)蒙古呼和浩特人,副教授,碩士生導(dǎo)師,主要研究方向為圖像處理、自然語言處理、機器學(xué)習(xí)。

        班" 琪(1999—),女,內(nèi)蒙古錫林郭勒人,碩士研究生,主要研究方向為自然語言處理、跨語言摘要生成。

        收稿日期:2024?07?20" " " " " "修回日期:2024?08?12

        基金項目:國家自然科學(xué)基金資助項目(62062055)

        aa视频在线观看播放免费| 欧美a级毛欧美1级a大片| 成熟丰满熟妇av无码区| 777国产偷窥盗摄精品品在线 | 好爽…又高潮了毛片免费看| 日韩在线看片| 美女露屁股无内裤视频| 精品国产中文字幕久久久| 亚洲免费观看视频| 99久久亚洲精品日本无码| 免费看黄色电影| 少妇高潮惨叫喷水在线观看| 人妻久久999精品1024| 2020国产精品久久久久| 日韩亚洲一区二区三区在线| 丰满人妻熟妇乱又仑精品| 真实国产老熟女粗口对白| 麻豆第一区MV免费观看网站| 在线观看日本一区二区| 亚洲乱码中文字幕综合| 久久精品国产9久久综合| 特黄 做受又硬又粗又大视频| 亚洲色成人网站www永久| 亚洲国产另类久久久精品黑人| 国产亚洲欧洲AⅤ综合一区| 精品免费看国产一区二区白浆| 精品不卡视频在线网址| 国产精品一区二区三区卡| 国产动作大片中文字幕| 成人做爰69片免费看网站| 国产成人精品蜜芽视频| 久久影院最新国产精品| 五月激情综合婷婷六月久久| 国产精品永久免费| 亚洲欧美日韩激情在线观看| 国内视频一区| 国内精品女同一区二区三区| 亚洲一区二区在线观看免费视频| 深夜福利啪啪片| 亚洲国产精品日韩av专区| 五月婷一本到五月天|