【摘要】隨著信息技術(shù)的迅猛發(fā)展與社交媒體的廣泛普及,網(wǎng)絡(luò)謠言的傳播速度和影響力呈現(xiàn)出前所未有的增強(qiáng)趨勢(shì)。網(wǎng)絡(luò)謠言的精準(zhǔn)識(shí)別與有效治理成為當(dāng)下亟待解決的重要問(wèn)題。針對(duì)這一挑戰(zhàn),基于自然語(yǔ)言處理技術(shù)在網(wǎng)絡(luò)謠言智能識(shí)別與治理策略研究,旨在建構(gòu)一種基于自然語(yǔ)言處理技術(shù)網(wǎng)絡(luò)謠言智能識(shí)別與治理框架:建立知識(shí)驅(qū)動(dòng)的分層檢測(cè),突破傳統(tǒng)單維度文本分析的局限;提升跨平臺(tái)溯源能力,解決“平臺(tái)孤島”導(dǎo)致的治理碎片化問(wèn)題;優(yōu)化學(xué)習(xí)動(dòng)態(tài)治理策略,適應(yīng)謠言傳播的復(fù)雜博弈環(huán)境;加強(qiáng)政府、企業(yè)和社會(huì)組織等各方合作與協(xié)同,形成強(qiáng)大的治理合力。
【關(guān)鍵詞】自然語(yǔ)言處理;網(wǎng)絡(luò)謠言;謠言治理;機(jī)器學(xué)習(xí)
在信息爆炸的互聯(lián)網(wǎng)時(shí)代,網(wǎng)絡(luò)謠言作為一種特殊的信息形態(tài),其快速傳播與廣泛影響已成為一個(gè)不容忽視的社會(huì)現(xiàn)象。在當(dāng)下的學(xué)術(shù)研究語(yǔ)境中,自然語(yǔ)言處理(Natural Language Processing,以下簡(jiǎn)稱(chēng)NLP)技術(shù)于近年來(lái)經(jīng)歷了高速的演進(jìn)歷程。這一技術(shù)在謠言治理這一特定領(lǐng)域中,正逐步彰顯出極為廣闊的應(yīng)用潛力與前景。NLP技術(shù)作為人工智能學(xué)科體系內(nèi)的關(guān)鍵構(gòu)成分支,其核心研究目標(biāo)聚焦于探索計(jì)算機(jī)系統(tǒng)對(duì)于人類(lèi)自然語(yǔ)言的理解與處理機(jī)制。NLP技術(shù)以自然語(yǔ)言為主要研究主體,借助計(jì)算機(jī)技術(shù)手段,對(duì)自然語(yǔ)言進(jìn)行系統(tǒng)性的分析、精準(zhǔn)的理解以及高效的處理。在此過(guò)程中,NLP技術(shù)運(yùn)用量化研究方法,對(duì)語(yǔ)言信息進(jìn)行深度挖掘與解析,進(jìn)而構(gòu)建起一套適用于人機(jī)交互場(chǎng)景的語(yǔ)言描述體系。通過(guò)對(duì)人類(lèi)自然語(yǔ)言處理能力的模擬,NLP技術(shù)能夠?qū)ξ谋拘畔?shí)施深層次的語(yǔ)義理解與智能化的特征分析,由此衍生出機(jī)器翻譯、情感傾向分析、文本內(nèi)容生成、語(yǔ)音信號(hào)識(shí)別等一系列多元化的應(yīng)用場(chǎng)景。這些應(yīng)用成果為解決復(fù)雜語(yǔ)句在理解與生成過(guò)程中所面臨的諸多難題,提供了堅(jiān)實(shí)且強(qiáng)大的技術(shù)保障與支撐。
然而,盡管NLP在網(wǎng)絡(luò)謠言識(shí)別中的應(yīng)用廣泛,但也面臨著諸多挑戰(zhàn)。謠言文本往往具有模糊性、多樣性及隱蔽性等特點(diǎn),使得NLP技術(shù)對(duì)其特征提取和模型訓(xùn)練的過(guò)程變得更為復(fù)雜;不同文化背景下的謠言傳播機(jī)制也存在差異,需要針對(duì)不同地域、不同語(yǔ)言環(huán)境下的謠言進(jìn)行深入研究。值得注意的是,隨著人工智能在新媒體領(lǐng)域廣泛應(yīng)用,“AI污染”問(wèn)題泛濫,其生成的迷惑性?xún)?nèi)容成為謠言源頭且易被惡意利用,自動(dòng)化傳播算法也加劇了謠言的擴(kuò)散,增加了識(shí)別難度。這種“AI污染”與傳統(tǒng)問(wèn)題交織,令新媒體時(shí)代網(wǎng)絡(luò)謠言識(shí)別任務(wù)更加艱巨。本文基于NLP技術(shù)在網(wǎng)絡(luò)謠言智能識(shí)別與治理策略研究,旨在構(gòu)建一套有效的謠言識(shí)別與治理框架,以提高謠言識(shí)別的準(zhǔn)確性和效率,為謠言治理提供科學(xué)依據(jù)和技術(shù)支持。
一、NLP技術(shù)在謠言識(shí)別中的應(yīng)用
NLP技術(shù)在謠言識(shí)別過(guò)程中通過(guò)一系列精細(xì)的文本分析步驟,能夠有效揭示謠言的特征,從而實(shí)現(xiàn)對(duì)謠言的智能識(shí)別。這一過(guò)程主要分為三個(gè)關(guān)鍵環(huán)節(jié):文本預(yù)處理、特征提取與選擇、模型構(gòu)建與訓(xùn)練。
(一)文本預(yù)處理:奠定謠言識(shí)別的基礎(chǔ)
文本預(yù)處理作為謠言識(shí)別的起始且至關(guān)重要的環(huán)節(jié),其核心目標(biāo)在于將未經(jīng)加工的原始文本數(shù)據(jù),通過(guò)一系列特定操作,轉(zhuǎn)化為契合后續(xù)分析與處理流程的規(guī)范化形式。此環(huán)節(jié)涵蓋了數(shù)據(jù)清洗、分詞以及詞性標(biāo)注等主要步驟。在謠言信息內(nèi)容所依托的原始文本數(shù)據(jù)中,普遍存在大量諸如無(wú)關(guān)字符、標(biāo)點(diǎn)符號(hào)以及停用詞等類(lèi)型的噪聲信息。從謠言識(shí)別的研究視角來(lái)看,此類(lèi)信息無(wú)法為識(shí)別過(guò)程提供實(shí)質(zhì)性的助力,反而會(huì)在計(jì)算層面增加不必要的復(fù)雜度?;诖?,實(shí)施數(shù)據(jù)清洗這一關(guān)鍵步驟便顯得尤為必要。通過(guò)數(shù)據(jù)清洗,能夠有效篩除上述噪聲信息,從而切實(shí)提升數(shù)據(jù)質(zhì)量,為后續(xù)的分析流程創(chuàng)造有利條件;中文文本的分詞操作,在NLP技術(shù)的研究范疇內(nèi)屬于一項(xiàng)基礎(chǔ)性且不可或缺的任務(wù),分詞效果的優(yōu)劣,會(huì)對(duì)后續(xù)的特征提取環(huán)節(jié)以及模型訓(xùn)練成效產(chǎn)生直接且關(guān)鍵的影響。特別是針對(duì)謠言文本而言,其文本構(gòu)成往往涵蓋大量專(zhuān)業(yè)術(shù)語(yǔ)以及網(wǎng)絡(luò)新興用語(yǔ)等特殊詞匯,這就要求在分詞過(guò)程中,選用更為精準(zhǔn)、適配的分詞算法,例如基于深度學(xué)習(xí)架構(gòu)所構(gòu)建的分詞模型,以此來(lái)顯著提升分詞的準(zhǔn)確率,保障后續(xù)分析的可靠性;詞性標(biāo)注本質(zhì)上是針對(duì)文本中的每一個(gè)詞匯進(jìn)行詞性分類(lèi)的過(guò)程。在謠言識(shí)別的研究體系里,詞性標(biāo)注能夠?yàn)樯钊肜斫馕谋镜慕Y(jié)構(gòu)特征以及語(yǔ)義內(nèi)涵提供有力支持,進(jìn)而為后續(xù)的特征提取工作輸送豐富且有價(jià)值的信息。
(二)特征提取與選擇:揭示謠言的本質(zhì)特征
在謠言識(shí)別的研究與實(shí)踐框架中,特征提取與選擇占據(jù)著極為關(guān)鍵的地位。此環(huán)節(jié)需從完成預(yù)處理的文本數(shù)據(jù)里,抽取出可有效區(qū)分謠言與真實(shí)信息的特征要素。其涵蓋的特征提取方式豐富多樣,主要包括詞匯特征、語(yǔ)法特征以及語(yǔ)義特征。詞匯特征的提取主要通過(guò)對(duì)文本中詞匯出現(xiàn)頻率的統(tǒng)計(jì)分析來(lái)實(shí)現(xiàn)。在謠言文本中,部分特定詞匯往往呈現(xiàn)出較高的出現(xiàn)頻率,通過(guò)對(duì)這類(lèi)詞匯頻率的統(tǒng)計(jì),可獲取具有指示意義的詞匯特征;語(yǔ)法特征則側(cè)重于對(duì)文本語(yǔ)法結(jié)構(gòu)的剖析,諸如句子長(zhǎng)度、復(fù)雜句式的運(yùn)用情況等,均是語(yǔ)法特征分析的重要維度。這些語(yǔ)法層面的特征能夠從結(jié)構(gòu)角度為謠言識(shí)別提供依據(jù);語(yǔ)義特征的提取借助詞向量模型,如經(jīng)典的Word2Vec、GloVe等模型得以實(shí)現(xiàn)。此類(lèi)模型具備強(qiáng)大的能力,能夠精準(zhǔn)捕捉詞匯間的語(yǔ)義關(guān)聯(lián),從而從語(yǔ)義層面挖掘文本信息,為謠言識(shí)別提供深層次的特征支持。[1]統(tǒng)計(jì)特征的提取同樣具有重要價(jià)值。例如文本的整體長(zhǎng)度、標(biāo)點(diǎn)符號(hào)的使用頻率等統(tǒng)計(jì)量,均能從不同側(cè)面反映文本的特征,且在謠言識(shí)別中發(fā)揮作用。
(三)模型構(gòu)建與訓(xùn)練:實(shí)現(xiàn)謠言的智能識(shí)別
經(jīng)過(guò)特征的提取與選擇,選擇合適的機(jī)器學(xué)習(xí)或深度學(xué)習(xí)算法進(jìn)行模型構(gòu)建與訓(xùn)練,是謠言識(shí)別的最后一步,也是謠言識(shí)別的核心步驟。鑒于謠言識(shí)別所呈現(xiàn)出的獨(dú)特特征與實(shí)際需求,既能夠選用諸如支持向量機(jī)(SVM)、隨機(jī)森林(RF)、樸素貝葉斯(NB)等經(jīng)典的機(jī)器學(xué)習(xí)算法,也可考慮采用卷積神經(jīng)網(wǎng)絡(luò)(CNN)、循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)等深度學(xué)習(xí)算法。在訓(xùn)練過(guò)程中,模型參數(shù)的動(dòng)態(tài)調(diào)整至關(guān)重要,諸如學(xué)習(xí)率、迭代次數(shù)等關(guān)鍵參數(shù),均需通過(guò)不斷的試驗(yàn)與優(yōu)化,以實(shí)現(xiàn)模型性能的提升。為探尋最優(yōu)的模型參數(shù)組合,還需引入交叉驗(yàn)證、網(wǎng)格搜索等行之有效的優(yōu)化方法,以此保障模型訓(xùn)練的科學(xué)性與高效性;當(dāng)模型訓(xùn)練完畢后,即可運(yùn)用測(cè)試集數(shù)據(jù)對(duì)模型進(jìn)行全面評(píng)估。評(píng)估所涉及的指標(biāo)包含準(zhǔn)確率、召回率、F1分?jǐn)?shù)等,這些指標(biāo)能夠從不同側(cè)面精準(zhǔn)反映模型在謠言識(shí)別任務(wù)中的性能表現(xiàn)?;谠u(píng)估所獲取的結(jié)果,能夠?qū)δP蛯?shí)施針對(duì)性的調(diào)優(yōu)操作,進(jìn)而提升模型在謠言識(shí)別方面的精度以及泛化能力,確保模型在實(shí)際應(yīng)用場(chǎng)景中具備更為可靠的性能表現(xiàn)。
2019年4月1日,阿里巴巴達(dá)摩院機(jī)器智能實(shí)驗(yàn)室發(fā)布了一項(xiàng)用于識(shí)別網(wǎng)絡(luò)謠言和假新聞的AI模型——“AI謠言粉碎機(jī)”。該模型基于深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)技術(shù),通過(guò)對(duì)信息的多維度分析,實(shí)現(xiàn)了快速且準(zhǔn)確的謠言識(shí)別。在2019年舉辦的SemEval國(guó)際語(yǔ)義測(cè)試大賽中,“AI謠言粉碎機(jī)”以81%的準(zhǔn)確率刷新了假新聞識(shí)別的世界紀(jì)錄,顯著提升了謠言識(shí)別的效率。該模型通過(guò)分析信息源、用戶(hù)畫(huà)像、傳播路徑以及與權(quán)威知識(shí)庫(kù)的匹配驗(yàn)證等多方面數(shù)據(jù),能夠在1秒內(nèi)判斷新聞的真實(shí)性。此外,“AI謠言粉碎機(jī)”不僅能夠快速識(shí)別謠言,還能通過(guò)傳播路徑索引,向曾經(jīng)接觸過(guò)虛假信息的用戶(hù)推送官方辟謠信息,有效遏制謠言的擴(kuò)散。這一技術(shù)的應(yīng)用為社交媒體平臺(tái)和新聞網(wǎng)站提供了高效的謠言治理工具,有望承擔(dān)60%的審核工作量。[2]
二、NLP技術(shù)在謠言識(shí)別運(yùn)用中的困境
NLP技術(shù)在謠言識(shí)別的應(yīng)用中,盡管其強(qiáng)大的文本分析能力和信息提取技術(shù)為謠言識(shí)別和傳播路徑分析提供了有力支持,但仍面臨著來(lái)自技術(shù)層面、數(shù)據(jù)質(zhì)量層面、法律倫理層面、社會(huì)心理層面和AI層面等一系列困境。
(一)技術(shù)層面困境
從技術(shù)層面來(lái)看,語(yǔ)言的復(fù)雜性和多樣性給NLP技術(shù)在謠言治理的應(yīng)用方面帶來(lái)了巨大挑戰(zhàn)。語(yǔ)言的多義性、歧義性以及語(yǔ)境依賴(lài)性使得準(zhǔn)確理解和分析文本變得困難[3]。同一個(gè)詞匯在不同的語(yǔ)境中可能具有完全不同的含義,這就容易導(dǎo)致NLP算法在提取文本特征和進(jìn)行語(yǔ)義理解時(shí)出現(xiàn)偏差。不僅如此,語(yǔ)言的表達(dá)方式豐富多樣,包括隱喻、反諷等修辭手法,這些也增加了NLP技術(shù)準(zhǔn)確識(shí)別謠言的難度。網(wǎng)絡(luò)謠言的不斷演變和創(chuàng)新也給NLP技術(shù)的適應(yīng)性提出了更高要求。新的謠言形式和內(nèi)容不斷涌現(xiàn),可能涉及新的話題、新的語(yǔ)言風(fēng)格或新的傳播渠道。NLP技術(shù)需要不斷地進(jìn)行更新和優(yōu)化,以跟上謠言變化的步伐。
(二)數(shù)據(jù)質(zhì)量層面困境
標(biāo)注數(shù)據(jù)是訓(xùn)練NLP謠言識(shí)別模型的基礎(chǔ),但由于謠言的復(fù)雜性和主觀性,不同的標(biāo)注者可能對(duì)同一文本的標(biāo)注結(jié)果存在差異。這種標(biāo)注不一致性會(huì)影響模型的訓(xùn)練效果,降低謠言識(shí)別的準(zhǔn)確性。此外,數(shù)據(jù)的時(shí)效性也是一個(gè)問(wèn)題。網(wǎng)絡(luò)謠言傳播速度快,新的謠言不斷產(chǎn)生,而現(xiàn)有的數(shù)據(jù)可能已經(jīng)過(guò)時(shí)。如果不能及時(shí)更新數(shù)據(jù),NLP技術(shù)就難以有效地識(shí)別新出現(xiàn)的謠言。數(shù)據(jù)的代表性也會(huì)影響NLP技術(shù)的性能。如果數(shù)據(jù)集中只包含特定類(lèi)型的謠言,那么對(duì)于其他類(lèi)型的謠言,模型可能無(wú)法進(jìn)行準(zhǔn)確識(shí)別。
(三)法律倫理層面困境
在運(yùn)用NLP技術(shù)治理網(wǎng)絡(luò)謠言的情境下,法律與倫理層面的問(wèn)題呈現(xiàn)出高度的復(fù)雜性和敏感性,對(duì)技術(shù)的合理應(yīng)用形成了多維度的制約。從法律視角來(lái)看,NLP技術(shù)依賴(lài)大量的網(wǎng)絡(luò)文本數(shù)據(jù)來(lái)訓(xùn)練模型,而這些數(shù)據(jù)的來(lái)源可能涉及復(fù)雜的版權(quán)、授權(quán)以及隱私法律規(guī)定,在收集和整理網(wǎng)絡(luò)文本數(shù)據(jù)時(shí),如果未經(jīng)用戶(hù)明確同意或違反相關(guān)服務(wù)協(xié)議,可能會(huì)引發(fā)侵犯知識(shí)產(chǎn)權(quán)或違反數(shù)據(jù)保護(hù)法規(guī)的法律風(fēng)險(xiǎn)。從倫理角度審視,謠言的定義邊界模糊性是一個(gè)核心問(wèn)題。由于不同文化、社會(huì)群體以及個(gè)體在價(jià)值觀、認(rèn)知水平和信息解讀方式上存在差異,對(duì)于某一信息是否構(gòu)成謠言的判斷可能存在主觀性。NLP技術(shù)所依據(jù)的模型和算法通常是基于一定的標(biāo)準(zhǔn)和規(guī)則構(gòu)建的,但這些標(biāo)準(zhǔn)可能與部分社會(huì)群體的觀點(diǎn)不一致,過(guò)度嚴(yán)格的謠言治理可能會(huì)限制公眾表達(dá)自己觀點(diǎn)的權(quán)利,阻礙社會(huì)的多元化發(fā)展。
(四)社會(huì)心理層面困境
人作為社會(huì)性動(dòng)物,具有強(qiáng)烈的從眾傾向,因此,從眾心理也在謠言傳播過(guò)程中扮演著關(guān)鍵角色。當(dāng)一個(gè)謠言在網(wǎng)絡(luò)中開(kāi)始傳播時(shí),個(gè)體往往會(huì)受到周?chē)巳盒袨榈挠绊懀吹剿宿D(zhuǎn)發(fā)或討論某一謠言,自己也會(huì)在未經(jīng)充分思考的情況下跟風(fēng)參與。此類(lèi)從眾行為在謠言傳播進(jìn)程中不僅明顯助其傳播速率提升,還極大拓展了其傳播范圍,致使謠言在較短時(shí)間跨度內(nèi)催生大規(guī)模的傳播效能。具體到謠言傳播的特定情境中,大規(guī)模的傳播群體集結(jié)、高度一致的傳播趨向,以及部分具備虛假權(quán)威性表征的傳播源頭,諸如不實(shí)的專(zhuān)家論斷或者知名賬號(hào)的不實(shí)分享等,均會(huì)強(qiáng)化個(gè)體的從眾心理傾向,進(jìn)而為謠言的進(jìn)一步擴(kuò)散提供持續(xù)的驅(qū)動(dòng)力。
(五)AI層面困境
網(wǎng)絡(luò)謠言識(shí)別與治理中面臨著AI污染風(fēng)險(xiǎn)?!癆I污染”風(fēng)險(xiǎn)指人工智能技術(shù)在謠言生成、傳播及演化過(guò)程中引發(fā)的雙重異化效應(yīng):一方面體現(xiàn)為AI作為技術(shù)工具被惡意用于自動(dòng)化生產(chǎn)深度偽造內(nèi)容,如換臉視頻、AI生成虛假新聞,通過(guò)語(yǔ)義變異、多模態(tài)合成等技術(shù)繞過(guò)傳統(tǒng)檢測(cè)機(jī)制,實(shí)現(xiàn)謠言批量化制造;另一方面源于AI系統(tǒng)自身的數(shù)據(jù)缺陷與算法漏洞,例如訓(xùn)練數(shù)據(jù)遭病毒攻擊導(dǎo)致模型輸出偏見(jiàn)信息,或大語(yǔ)言模型無(wú)意識(shí)生成事實(shí)錯(cuò)誤表述。此類(lèi)風(fēng)險(xiǎn)具有隱蔽性強(qiáng)、傳播規(guī)模大及自我進(jìn)化快等特征,不僅加劇了謠言治理的技術(shù)復(fù)雜度,更可能引發(fā)公眾認(rèn)知失調(diào)與社會(huì)信任危機(jī)。AI謠言的傳播速度和影響力在不斷增強(qiáng)。清華大學(xué)新聞與傳播學(xué)院新媒體研究中心發(fā)布的《揭秘AI謠言:傳播路徑與治理策略全解析》研究報(bào)告指出,2023年以來(lái),網(wǎng)絡(luò)謠言整體態(tài)勢(shì)平穩(wěn),但AI謠言量近半年增長(zhǎng)65%。[4]此外,AI謠言的治理也面臨成本增加的問(wèn)題,由于其生成速度快、數(shù)量多且形式多樣,平臺(tái)需要投入更多的人力、物力和技術(shù)資源進(jìn)行識(shí)別和處理。今日頭條在2024年累計(jì)攔截不實(shí)信息超500萬(wàn)條,封禁造謠、傳謠等違規(guī)賬號(hào)4.77萬(wàn)。[5]
三、基于NLP技術(shù)網(wǎng)絡(luò)謠言治理框架
(一)基于知識(shí)增強(qiáng)的分層謠言識(shí)別體系
針對(duì)謠言語(yǔ)義的復(fù)雜性,構(gòu)建知識(shí)增強(qiáng)的分層識(shí)別框架顯得尤為重要。該框架采用分層識(shí)別機(jī)制,結(jié)合知識(shí)增強(qiáng)型預(yù)訓(xùn)練模型與多粒度語(yǔ)義分析技術(shù),實(shí)現(xiàn)對(duì)謠言?xún)?nèi)容的高效檢測(cè)。在數(shù)據(jù)層,集成多源異構(gòu)數(shù)據(jù)(社交媒體、新聞平臺(tái))與權(quán)威知識(shí)庫(kù),如世界衛(wèi)生數(shù)據(jù)平臺(tái)辟謠庫(kù),構(gòu)建覆蓋多領(lǐng)域的謠言語(yǔ)料庫(kù)。在模型層,提出知識(shí)注入型預(yù)訓(xùn)練模型(Knowledge-enhanced BERT),通過(guò)實(shí)體鏈接技術(shù)將醫(yī)學(xué)、法律等領(lǐng)域知識(shí)嵌入語(yǔ)義表示,實(shí)現(xiàn)詞級(jí)(謠言高頻詞匹配)、句級(jí)(夸張修辭識(shí)別)與篇章級(jí)(事理圖譜驗(yàn)證)的多粒度檢測(cè)。這種多粒度的檢測(cè)方法能夠從不同層面揭示謠言的特征,提高識(shí)別的準(zhǔn)確性和魯棒性。[6]在應(yīng)用層,部署實(shí)時(shí)預(yù)警系統(tǒng),響應(yīng)延遲控制在10秒內(nèi),并輸出可信度分級(jí)標(biāo)簽,如“疑似謠言”“已核實(shí)虛假”等,以便及時(shí)采取相應(yīng)的治理措施。
(二)跨平臺(tái)傳播路徑的智能溯源機(jī)制
在謠言治理中,跨平臺(tái)傳播路徑的智能溯源機(jī)制具有重要的意義。該機(jī)制通過(guò)追蹤和分析謠言在不同平臺(tái)之間的傳播路徑,解決了謠言跨平臺(tái)傳播的治理碎片化問(wèn)題,實(shí)現(xiàn)了對(duì)謠言源頭的準(zhǔn)確追溯。具體而言,該機(jī)制首先將用戶(hù)信息和推文內(nèi)容作為用戶(hù)的特征,通過(guò)預(yù)訓(xùn)練語(yǔ)言模型將其轉(zhuǎn)化為用戶(hù)特征向量。對(duì)于完全沒(méi)有發(fā)送過(guò)推文的用戶(hù),采用隨機(jī)初始化向量作為其節(jié)點(diǎn)特征,并隨著后續(xù)訓(xùn)練更新特征向量。融合網(wǎng)絡(luò)結(jié)構(gòu)和用戶(hù)特征向量,通過(guò)圖神經(jīng)網(wǎng)絡(luò)對(duì)多個(gè)平臺(tái)之間的用戶(hù)節(jié)點(diǎn)進(jìn)行學(xué)習(xí),得到每個(gè)用戶(hù)節(jié)點(diǎn)的最終特征向量表示。最后,計(jì)算每個(gè)用戶(hù)之間的余弦相似度,將高于閾值的用戶(hù)增加虛擬邊,以對(duì)不同平臺(tái)之間的用戶(hù)進(jìn)行對(duì)齊。[7]這種跨平臺(tái)的用戶(hù)對(duì)齊方法能夠有效追蹤謠言的傳播路徑,準(zhǔn)確識(shí)別謠言的源頭,從而采取針對(duì)性的治理措施,有效阻斷謠言的傳播。
(三)基于強(qiáng)化學(xué)習(xí)的動(dòng)態(tài)治理策略
強(qiáng)化學(xué)習(xí)(Reinforcement Learning)作為機(jī)器學(xué)習(xí)領(lǐng)域的重要分支,是一種借助與環(huán)境展開(kāi)交互從而探尋最優(yōu)策略的學(xué)習(xí)范式。在網(wǎng)絡(luò)謠言治理的研究與實(shí)踐場(chǎng)景下,多智能體強(qiáng)化學(xué)習(xí)(Multi-AgentReinforcement Learning,簡(jiǎn)稱(chēng)為MARL)作為對(duì)強(qiáng)化學(xué)習(xí)框架的拓展被提出。該方法聚焦于多個(gè)智能體之間既存在協(xié)作又存在競(jìng)爭(zhēng)的復(fù)雜關(guān)系,尤其適用于動(dòng)態(tài)調(diào)整網(wǎng)絡(luò)謠言治理策略,以此契合持續(xù)變化的謠言傳播模式以及復(fù)雜多變的網(wǎng)絡(luò)環(huán)境。在網(wǎng)絡(luò)謠言治理的研究中,可將整個(gè)治理流程抽象為一個(gè)馬爾可夫決策過(guò)程(Markov Decision Process,簡(jiǎn)稱(chēng)為MDP)。在此過(guò)程中,狀態(tài)空間的構(gòu)成要素包含謠言的傳播階段以及用戶(hù)的情感傾向等關(guān)鍵維度;動(dòng)作空間則囊括了諸如限流、辟謠推送等一系列切實(shí)可行的治理措施;而獎(jiǎng)勵(lì)函數(shù)的設(shè)定,則以謠言轉(zhuǎn)發(fā)量的下降率以及社會(huì)公信力的提升幅度作為核心衡量指標(biāo)。在對(duì)智能體開(kāi)展訓(xùn)練時(shí),選用近端策略?xún)?yōu)化(Proximal Policy Optimization,簡(jiǎn)稱(chēng)為PPO)算法作為訓(xùn)練手段。PPO算法展現(xiàn)出獨(dú)特的優(yōu)勢(shì),其在樣本復(fù)雜度、算法簡(jiǎn)潔性以及計(jì)算耗時(shí)等方面實(shí)現(xiàn)了出色的權(quán)衡。這種平衡特性使得PPO算法能夠?yàn)榇笠?guī)模應(yīng)急智能決策場(chǎng)景構(gòu)建起一套切實(shí)有力且具備高度可行性的解決方案,從而極大地推動(dòng)應(yīng)急智能決策領(lǐng)域在實(shí)際應(yīng)用中的發(fā)展與完善。
(四)加強(qiáng)合作與協(xié)同
在網(wǎng)絡(luò)謠言治理的復(fù)雜體系中,強(qiáng)化政府、企業(yè)、社會(huì)組織等多元主體間的合作與協(xié)同機(jī)制,是實(shí)現(xiàn)高效治理的關(guān)鍵路徑。政府作為社會(huì)治理的核心力量,應(yīng)充分發(fā)揮主導(dǎo)性作用,通過(guò)制定并完善相關(guān)政策法規(guī)、加大對(duì)網(wǎng)絡(luò)謠言傳播行為的監(jiān)管力度,嚴(yán)厲打擊各類(lèi)謠言滋生與擴(kuò)散現(xiàn)象。企業(yè)憑借其在技術(shù)領(lǐng)域的獨(dú)特優(yōu)勢(shì),能夠?yàn)橹{言治理提供堅(jiān)實(shí)的技術(shù)支撐以及可靠的平臺(tái)保障,助力構(gòu)建高效的謠言監(jiān)測(cè)與處置體系。社會(huì)組織則可有效匯聚民間力量,積極開(kāi)展謠言識(shí)別科普工作以及辟謠宣傳活動(dòng),致力于提升社會(huì)公眾對(duì)網(wǎng)絡(luò)謠言的防范意識(shí)與辨別能力。NLP技術(shù)作為當(dāng)下前沿的信息技術(shù)手段,能夠?yàn)楦鞣街黧w參與網(wǎng)絡(luò)謠言治理提供有力的技術(shù)賦能,促進(jìn)信息在不同主體間的高效共享,進(jìn)而推動(dòng)協(xié)同治理模式的深度發(fā)展。
四、結(jié)語(yǔ)
以上研究表明,NLP技術(shù)在網(wǎng)絡(luò)謠言的智能識(shí)別與治理中展現(xiàn)出了巨大的潛力和價(jià)值。在謠言識(shí)別維度,NLP技術(shù)所涵蓋的文本特征提取方法以及機(jī)器學(xué)習(xí)算法等應(yīng)用,為精準(zhǔn)判別謠言提供了極為有效的技術(shù)支撐。其借助文本預(yù)處理、特征提取與篩選、模型構(gòu)建與訓(xùn)練等一系列連貫且關(guān)鍵的環(huán)節(jié),能夠敏銳捕捉并及時(shí)遏制謠言的擴(kuò)散態(tài)勢(shì),對(duì)于維護(hù)社會(huì)穩(wěn)定秩序以及公眾信任體系具有重要意義。然而不可忽視的是,NLP技術(shù)在實(shí)際應(yīng)用進(jìn)程中仍面臨諸多現(xiàn)實(shí)困境。為應(yīng)對(duì)日益復(fù)雜多變的網(wǎng)絡(luò)謠言識(shí)別與治理工作,本文提出了綜合性的治理框架,包括知識(shí)增強(qiáng)的分層謠言識(shí)別體系、跨平臺(tái)傳播路徑的智能溯源機(jī)制、基于強(qiáng)化學(xué)習(xí)的動(dòng)態(tài)治理策略以及加強(qiáng)各方合作與協(xié)同。隨著技術(shù)的持續(xù)迭代升級(jí)以及各方主體的協(xié)同奮進(jìn),NLP技術(shù)必將在網(wǎng)絡(luò)謠言治理實(shí)踐中發(fā)揮更為關(guān)鍵的作用,為營(yíng)造真實(shí)、可信、健康的網(wǎng)絡(luò)環(huán)境筑牢堅(jiān)實(shí)的技術(shù)根基。
參考文獻(xiàn):
[1]曾明睿,袁夢(mèng)奇,邵曦,等.文本特征提取的研究進(jìn)展[J].南京信息工程大學(xué)學(xué)報(bào)(自然科學(xué)版),2019,11(06):706-715.
[2]阿里云.最快1秒鑒定真假,AI謠言粉碎機(jī)來(lái)了![EB/OL].[2019-04-01].https://developer.aliyun.com/article/696241.
[3]王子威.論AIGC對(duì)文本中心主義的發(fā)展與挑戰(zhàn)[J].福建師范大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版),2024(1):75-87+170.
[4]張?jiān)姮?揭秘AI謠言:傳播路徑與治理策略全解析[R].北京:清華大學(xué)新聞與傳播學(xué)院新媒體研究中心,2024.
[5]每日經(jīng)濟(jì)新聞.新的AI謠言加劇“認(rèn)知戰(zhàn)爭(zhēng)” 面對(duì)低質(zhì)AI內(nèi)容治理,今日頭條如何接招?[EB/OL].[2025-02-25].https://news.qq.com/rain/a/20250225A04KUT00.
[6]韓毅,喬林波,李東升,等.知識(shí)增強(qiáng)型預(yù)訓(xùn)練語(yǔ)言模型綜述[J].計(jì)算機(jī)科學(xué)與探索,2022,16(07):1439-1461.
[7]Alsuwat E,Alsuwat H .An improved multi-modal framework for fake news detection using NLP and Bi-LSTM[J].The Journal of Supercomputing,2024,81(1):177-177.
作者簡(jiǎn)介:王曉雨,中國(guó)傳媒大學(xué)新聞學(xué)院博士生(北京 100024);王燦發(fā),中國(guó)傳媒大學(xué)新聞學(xué)院教授、博士生導(dǎo)師(北京 100024)。
編校:鄭 艷