孔杉杉 張 軍 馮立超
(山東理工大學(xué)管理學(xué)院 淄博 255000)
數(shù)字技術(shù)的發(fā)展使微信、微博等為代表的開(kāi)放式互動(dòng)平臺(tái)成為大眾獲取和分享健康信息的重要渠道,然而健康信息類(lèi)型多樣、內(nèi)容豐富、信息質(zhì)量卻參差不齊[1],不同于網(wǎng)絡(luò)上真實(shí)的健康信息,虛假健康信息往往以“故事”的形式,既借助誘導(dǎo)性、欺騙性文本匯集偽科學(xué)、哲學(xué)、民俗等復(fù)雜深刻的人文概念,又采用獨(dú)特的數(shù)據(jù)敘事策略迎合了大眾健康需求和情感需求,說(shuō)服那些專(zhuān)業(yè)醫(yī)學(xué)知識(shí)缺乏的在線用戶(hù)[2],誤導(dǎo)其健康決策和行為。
為準(zhǔn)確識(shí)別和阻斷虛假健康信息傳播,學(xué)者們從信息源、主題標(biāo)簽、文本內(nèi)容等多個(gè)角度開(kāi)展虛假健康信息的特征提取和建模,發(fā)現(xiàn)根據(jù)信息來(lái)源和信息生成意圖來(lái)進(jìn)行信息可信度分析并不可靠[3-4],通過(guò)文本主題也很難辨別信息真?zhèn)蝃5]。關(guān)于文本內(nèi)容的研究發(fā)現(xiàn)語(yǔ)言特征、語(yǔ)義特征和敘事方式等在辨別虛假信息時(shí)作用顯著[6]。但是如何將這些特征抽取出來(lái)成為研究過(guò)程中的一個(gè)難點(diǎn)。計(jì)算敘事的研究范式可以通過(guò)標(biāo)識(shí)事物、概念和組織等要素,抽取、泛化和構(gòu)建語(yǔ)義三元組來(lái)刻畫(huà)文本中的敘事特征,對(duì)于甄別虛假健康信息將非常有效。然而,以往的計(jì)算敘事研究對(duì)虛假信息特征的建模和語(yǔ)義分析方法時(shí)依賴(lài)于工作者的經(jīng)驗(yàn)或知識(shí),而虛假健康信息的甄別包含了大量的生活健康常識(shí)、觀念和行為,涉及了專(zhuān)業(yè)的醫(yī)學(xué)知識(shí)和技術(shù)[4],人工識(shí)別存在諸多困難。因此現(xiàn)有的計(jì)算敘事方法應(yīng)用于虛假健康信息特征分析時(shí)效果較差,不能深入解釋虛假健康信息特征之間的關(guān)聯(lián)。
鑒于此,本文基于計(jì)算敘事的基本分析框架,提出虛假健康信息的計(jì)算敘事模型,通過(guò)文本挖掘技術(shù)提取敘事內(nèi)容、敘事邏輯和敘事鏈接模式,實(shí)現(xiàn)虛假健康信息敘事特征的量化研究,并對(duì)比分析不同類(lèi)型的虛假健康信息敘事特征。一方面創(chuàng)新了虛假健康信息特征識(shí)別研究視角,另一方面可以為政府和互聯(lián)網(wǎng)平臺(tái)阻斷虛假健康信息傳播提供決策支持。
社交媒體上各類(lèi)信息正處于爆炸式的增長(zhǎng)階段,從海量信息中準(zhǔn)確識(shí)別虛假健康信息并采取措施阻斷其傳播,需要以厘清虛假健康信息特征為基礎(chǔ)。目前相關(guān)研究可以分為特征提取和特征建模兩條主線。
虛假健康信息特征提取多圍繞信息來(lái)源、信息內(nèi)容、信息傳播者等傳播要素特征開(kāi)展。Winker等的研究發(fā)現(xiàn)虛假健康信息來(lái)源的可信度不高[3],因此構(gòu)建了一套基于信息源的可信標(biāo)注標(biāo)準(zhǔn),包括作者信息完整性、單位來(lái)源權(quán)威性、利益沖突聲明規(guī)范性等具體指標(biāo)。后續(xù)研究關(guān)注到信息來(lái)源的內(nèi)容生成意圖,是無(wú)意散布錯(cuò)誤信息,還是有意制造虛假健康信息并欺騙工作[4,8-9]。隨著社交媒體應(yīng)用的深入,結(jié)合文本挖掘技術(shù)提取虛假健康信息特征研究成為熱點(diǎn)。Ghenai等以Twitter上的zika相關(guān)虛假健康信息和權(quán)威機(jī)構(gòu)發(fā)布信息為研究對(duì)象,利用LDA技術(shù)對(duì)比了二者在主題數(shù)量、主題詞等方面的差異,研究發(fā)現(xiàn)虛假健康信息主題數(shù)量多,且會(huì)頻繁使用疫苗、發(fā)燒等詞匯,而健康信息中不僅主題數(shù)量少,且上述詞匯的使用頻率也比較低[10]。Kabir通過(guò)Bert方法研究了新冠肺炎疫情發(fā)生后的虛假健康信息,結(jié)果顯示宗教信仰主題和社會(huì)文化主題在識(shí)別算法中的作用比較顯著[11]。Sicilia和Safarnejad的研究結(jié)果顯示虛假健康信息文本的主題具有高度多樣性,只用文本主題很難區(qū)分信息的真假[6,12]。
虛假健康信息特征建模研究大多是在社會(huì)影響、行為認(rèn)知等多學(xué)科理論基礎(chǔ)上開(kāi)展。Metzger基于MAIN可信度模型構(gòu)建了網(wǎng)絡(luò)健康新聞可信度語(yǔ)料庫(kù),在此基礎(chǔ)上通過(guò)SVM方法發(fā)現(xiàn)虛假健康信息不同主題可信度的關(guān)聯(lián)十分微弱[13]。 Kumar 等基于“持續(xù)影響效應(yīng)”理論[14],解釋了虛假健康信息文本中存在大量負(fù)面情緒,且恐懼和憤怒等能在公眾心里留下深刻印象,并且這種效應(yīng)的持續(xù)時(shí)間比真實(shí)信息要長(zhǎng)。Zhao等提出了基于精細(xì)化似然模型的虛假健康信息特征模型,其中文本主題特征是中心級(jí)特征,外圍級(jí)特征包括語(yǔ)言特征、情感特征和用戶(hù)行為特征等,且語(yǔ)言特征在甄別虛假信息過(guò)程中作用顯著[2]。張帥等通過(guò)程序化編碼的方法構(gòu)建了虛假健康信息的關(guān)鍵特征清單,發(fā)現(xiàn)了夸張等語(yǔ)義特征是說(shuō)服公眾接受的一個(gè)主要原因[15]。此外,由于政府和機(jī)構(gòu)辟謠策略,虛假健康信息語(yǔ)言表達(dá)更隱晦,學(xué)者們開(kāi)始廣泛的采用知識(shí)圖譜等文本挖掘技術(shù)嘗試對(duì)虛假健康信息中的錯(cuò)誤觀點(diǎn)和事實(shí)進(jìn)行挖掘和建模。
19世紀(jì)80年代早期,社會(huì)學(xué)領(lǐng)域和心理學(xué)領(lǐng)域開(kāi)啟了敘事學(xué)研究,逐漸認(rèn)識(shí)到“故事化”是形成社會(huì)認(rèn)同和集體行動(dòng)決策的有效引擎。在此基礎(chǔ)上著名學(xué)者沃爾特·費(fèi)希爾提出了敘事傳播理論,他認(rèn)為所有的人類(lèi)交流活動(dòng)都是敘事活動(dòng),是通過(guò)講故事的形式反映社會(huì)經(jīng)濟(jì)中的不同實(shí)體之間的關(guān)聯(lián)[16]。由于敘事傳播的內(nèi)容描述了某些特殊經(jīng)歷,它比邏輯嚴(yán)謹(jǐn)?shù)目茖W(xué)論證更符合公眾的認(rèn)知水平[17],因此更容易激發(fā)大眾的興趣,并具有較高的說(shuō)服力[18]。鑒于此,醫(yī)學(xué)健康領(lǐng)域較早地引入這一理論來(lái)解釋健康信息的作用機(jī)制。醫(yī)學(xué)知識(shí)科普中會(huì)設(shè)計(jì)敘事內(nèi)容對(duì)錯(cuò)誤信息“增強(qiáng)糾正”[19],影響人們對(duì)疫苗的信念[20],激勵(lì)和支持健康行為的改變[21]。在社交媒體上不同敘事邏輯對(duì)健康信息的采納產(chǎn)生了差異化影響[22]。
人工智能和機(jī)器學(xué)習(xí)與NLP的深度融合,推動(dòng)了諸如傳播學(xué)、社會(huì)學(xué)等學(xué)科轉(zhuǎn)向數(shù)據(jù)驅(qū)動(dòng)的研究范式。在此背景下,Shiller等研究者提出可以利用互聯(lián)網(wǎng)上的數(shù)字化痕跡,通過(guò)文本挖掘、數(shù)據(jù)分析等可計(jì)算性方法,對(duì)人類(lèi)交流活動(dòng)中的敘事特征開(kāi)展描述、解釋,并發(fā)現(xiàn)其背后的驅(qū)動(dòng)機(jī)制,并將此領(lǐng)域命名為計(jì)算敘事學(xué)(Computational Narrative)[23]。研究者發(fā)現(xiàn)通過(guò)計(jì)算敘事研究范式,可以識(shí)別經(jīng)濟(jì)學(xué)、傳統(tǒng)文化、醫(yī)學(xué)等特定領(lǐng)域的社會(huì)思維和行為模式,而這些模式往往無(wú)法通過(guò)日?;?dòng)或閱讀個(gè)人故事或想法來(lái)觀察[24]。相關(guān)研究多通過(guò)標(biāo)識(shí)事物、概念和組織等要素,抽取、泛化和構(gòu)建<實(shí)體-關(guān)系-實(shí)體>三元組來(lái)刻畫(huà)文本中的敘事特征[25]。例如, Ash等人利用語(yǔ)義中的行為三元組
此外,常用的計(jì)算敘事技術(shù)實(shí)現(xiàn)可以分成兩類(lèi):一是基于規(guī)則模板的圖譜技術(shù),二是基于語(yǔ)義角色標(biāo)注的淺層語(yǔ)言分析方法?;谝?guī)則模板構(gòu)建實(shí)體和關(guān)系的過(guò)程中,需要人工編寫(xiě)因果關(guān)系、條件關(guān)系、順承關(guān)系等規(guī)則模板,其優(yōu)勢(shì)是可以精準(zhǔn)的發(fā)現(xiàn)實(shí)體關(guān)系。但是它依賴(lài)工作者的經(jīng)驗(yàn)和知識(shí),可能遺漏實(shí)體關(guān)聯(lián)方式,泛化能力較差[29]?;谡Z(yǔ)言角色標(biāo)注的方法是通過(guò)識(shí)別句子中的謂詞和句法成分,自動(dòng)抽取語(yǔ)義三元組并以<施動(dòng)者-動(dòng)詞-受動(dòng)者>的形式記錄,其優(yōu)勢(shì)是不依賴(lài)人工標(biāo)注就能產(chǎn)生結(jié)果。這種方法適用于處理文本內(nèi)容中概念明確且邏輯關(guān)系簡(jiǎn)單的語(yǔ)料集,如新聞?wù)Z料、政策語(yǔ)料等。但是在處理語(yǔ)義邏輯比較復(fù)雜的文本時(shí),會(huì)以冗余的方式保留施動(dòng)者和受動(dòng)者,實(shí)體和關(guān)系的對(duì)齊效果差。而虛假健康信息文本中的實(shí)體關(guān)系類(lèi)型多,多數(shù)句子的邏輯結(jié)構(gòu)復(fù)雜。由此,準(zhǔn)確識(shí)別和分析虛假健康信息的計(jì)算敘事特征,需要重新改進(jìn)語(yǔ)義角色標(biāo)注算法,既要盡量保留文本中的語(yǔ)義信息,還要適當(dāng)對(duì)實(shí)體和關(guān)系進(jìn)行降維。
綜合上述文獻(xiàn)可以發(fā)現(xiàn),現(xiàn)有研究已經(jīng)從多方面刻畫(huà)了虛假健康信息的文本特征,且從計(jì)算敘事角度開(kāi)展醫(yī)療健康研究是一種有效的途徑。但是研究結(jié)果不能深入解釋虛假健康信息特征之間的關(guān)聯(lián),對(duì)虛假健康信息特征的建模和語(yǔ)義分析方法研究還有待深入。借助計(jì)算敘事研究范式可以揭示虛假健康信息中有哪些錯(cuò)誤健康知識(shí)和健康行為規(guī)范[30],解釋其如何影響公眾健康認(rèn)知構(gòu)建的方式[31]。因此,本文構(gòu)建虛假健康信息的敘事模型,解決以下3個(gè)方面的問(wèn)題:①虛假健康信息的計(jì)算敘事模型是什么?②如何提取虛假健康信息敘事特征?③不同類(lèi)型虛假健康信息的敘事特征有哪些差異?
社交媒體上虛假健康信息的敘事過(guò)程基于社交媒介支持,通過(guò)復(fù)雜文本結(jié)構(gòu)實(shí)現(xiàn)了健康知識(shí)、行為和態(tài)度等相關(guān)事件的組織邏輯,導(dǎo)致公眾對(duì)自身健康狀態(tài)和風(fēng)險(xiǎn)感知錯(cuò)位、形成健康知識(shí)的錯(cuò)誤意義建構(gòu),產(chǎn)生認(rèn)知偏差。本文基于計(jì)算敘事視角,對(duì)虛假健康信息的潛在邏輯和隱含語(yǔ)義進(jìn)行建模,將虛假健康信息文本解構(gòu)為敘事內(nèi)容、敘事邏輯和二者特定鏈接方式共同組成的符號(hào)體系,用敘事網(wǎng)絡(luò)G(V,L,E)抽象和表達(dá)其中的語(yǔ)義網(wǎng)絡(luò)。
V={v1,v2,…vn}是網(wǎng)絡(luò)中的節(jié)點(diǎn)集合,表示敘事內(nèi)容。一般而言,敘事內(nèi)容可以表示人、事、物、地點(diǎn)等故事化概念。本文將虛假健康信息的敘事內(nèi)容擴(kuò)展到醫(yī)療組織、疾病、癥狀、身體部位等術(shù)語(yǔ)和概念。
L={l1,l2,…lm}是網(wǎng)絡(luò)中邊的標(biāo)識(shí)集合,表示敘事過(guò)程中采用的因果、順承、夸張等敘事邏輯。本文根據(jù)Harris等提出的CARS分類(lèi)結(jié)果[32],將敘事邏輯分為6類(lèi):包括夸張、行為誘導(dǎo)、心理認(rèn)同、假借權(quán)威、消極、因果。每類(lèi)敘事邏輯的代表性邏輯詞和示例如表 1 所示。
E={e1,e2,…eq}是網(wǎng)絡(luò)中的邊集合,?es∈E記為es
2.2.1研究設(shè)計(jì)
本文按照數(shù)據(jù)獲取、敘事內(nèi)容抽取、敘事邏輯發(fā)現(xiàn)、敘事特征計(jì)算的順序開(kāi)展研究,具體過(guò)程如圖1所示。首先進(jìn)行文本數(shù)據(jù)收集。根據(jù)辟謠平臺(tái)上標(biāo)識(shí)的虛假健康信息標(biāo)題,收集微信、微博、新聞網(wǎng)站上的虛假健康信息文本,形成False_text={ft1,ft2,…ftp}。然后構(gòu)建虛假健康信息對(duì)應(yīng)的敘事網(wǎng)絡(luò)。本文借助語(yǔ)義角色標(biāo)注算法對(duì)虛假健康信息文本中的敘事內(nèi)容和敘事邏輯進(jìn)行發(fā)現(xiàn)和泛化,經(jīng)過(guò)命名實(shí)體識(shí)別、語(yǔ)義角色標(biāo)注、詞向量嵌入聚類(lèi)等計(jì)算方法,實(shí)現(xiàn)從純文本語(yǔ)料到低維敘述性語(yǔ)義的直觀映射。最后,借助復(fù)雜網(wǎng)絡(luò)理論構(gòu)建進(jìn)行計(jì)算敘事特征分析,解釋不同類(lèi)型虛假健康信息敘事內(nèi)容、敘事邏輯和敘事鏈接模式的差異。
圖1 研究框架
表1 敘事邏輯及示例
2.2.2基于語(yǔ)義角色標(biāo)注的敘事網(wǎng)絡(luò)構(gòu)建方法
本文針對(duì)虛假健康信息文本中冗余信息多、語(yǔ)法邏輯復(fù)雜的特點(diǎn),提出了DR-SRL(Dimensionality Reduction based on Semantic Role Labeling)方法構(gòu)建敘事網(wǎng)絡(luò),目的是對(duì)文本中語(yǔ)義進(jìn)行識(shí)別和結(jié)構(gòu)化表示。具體步驟如下:
第一步,基于SRL的語(yǔ)義結(jié)構(gòu)分析。
輸入False_text={ft1,ft2,…ftp}集合,基于Allennlp框架對(duì)文本中的單個(gè)句子進(jìn)行語(yǔ)義角色標(biāo)注(SRL)[33],處理邏輯如圖2所示。匯集處理結(jié)果,得到語(yǔ)義角色標(biāo)注集Sinit={Srl1,Srl2,…Srlt},其中Srli=<施動(dòng)者A0i,謂語(yǔ)Vmodi,受動(dòng)者A1i>。
圖2 文本處理邏輯
如圖2所示,Sinit語(yǔ)義角色標(biāo)注集是對(duì)虛假健康信息文本的淺層語(yǔ)義分析結(jié)果,其主要作用是高維語(yǔ)義特征刻畫(huà)句子中單詞之間的對(duì)應(yīng)關(guān)系。
第二步,基于語(yǔ)義降維的敘事內(nèi)容抽取。
Sinit比虛假健康信息敘事網(wǎng)絡(luò)蘊(yùn)含了更多的冗余信息,對(duì)此本文通過(guò)加權(quán)詞向量聚類(lèi)進(jìn)行降維,合并施動(dòng)者A0i和受動(dòng)者A1i,刪除多余謂語(yǔ)Vmodi。
下一步,石家莊市教育局將把小學(xué)生免費(fèi)托管工作與校外培訓(xùn)機(jī)構(gòu)專(zhuān)項(xiàng)治理行動(dòng)結(jié)合起來(lái),創(chuàng)造條件、加大投入、完善政策,不斷強(qiáng)化中小學(xué)校在課后服務(wù)中的主渠道作用,進(jìn)一步完善課后托管各項(xiàng)制度,幫助學(xué)生培養(yǎng)興趣、發(fā)展特長(zhǎng)、開(kāi)拓視野、增強(qiáng)實(shí)踐,不斷提高課后托管服務(wù)水平。
Step1:基于spaCy框架對(duì)False_text進(jìn)行命名實(shí)體識(shí)別[34],得到命名實(shí)體集合NES={en1,en2,…enr}。
Step2:其次遍歷Sinit,取出Srli中的施動(dòng)者A0i和受動(dòng)者A1i,若A0i或A1i∈NES,將其添加到敘事內(nèi)容集合V中;否則,生成詞向量Vec_A0i或Vec_A1i。
Step3:用SIF方法確定每個(gè)施動(dòng)者A0i和受動(dòng)者A1i的加權(quán)平均詞向量,計(jì)算方式如公式(1)。用K-means對(duì)加權(quán)平均詞向量進(jìn)行聚類(lèi),取類(lèi)心關(guān)鍵詞添加到敘事內(nèi)容集合V中。
(1)
第三步,敘事鏈接構(gòu)建。
根據(jù)敘事內(nèi)容集合V,再次遍歷Sinit={Srl1,Srl2,…Srlt},若Srli的施動(dòng)者A0i和受動(dòng)者A1i為NES中的元素,或者其詞向量與類(lèi)心詞向量相似度>0.5,則將謂語(yǔ)Vmodi添加到敘事邏輯集合L中,則生成es
本文虛假健康信息文本采集依據(jù)是“科普中國(guó)-科學(xué)辟謠”辟謠平臺(tái),于2019年8月由中央網(wǎng)信辦指導(dǎo)上線。該平臺(tái)不僅標(biāo)注了美容健身、食品安全、疾病防治、營(yíng)養(yǎng)健康等4類(lèi)虛假健康信息,并對(duì)每條虛假信息發(fā)布了辟謠信息。由于辟謠信息本身包含虛假信息本體,因此可以借助這些內(nèi)容反向提取虛假信息,進(jìn)而達(dá)到不依賴(lài)大量專(zhuān)業(yè)知識(shí)標(biāo)注來(lái)獲取虛假健康信息的目的[35],反向提取示例如圖3所示。
圖3 依據(jù)辟謠信息反向提取虛假健康信息示例
本文采集平臺(tái)上2019年8月15日至2022年12月1日期間發(fā)布的辟謠信息,在社交平臺(tái)反向提取對(duì)應(yīng)虛假健康信息,最終得到683條虛假健康信息語(yǔ)料,其中美容健身91條,食品安全178條,疾病防治204條,營(yíng)養(yǎng)健康210條。
依據(jù)上文DR-SRL方法對(duì)4類(lèi)虛假健康信息分別構(gòu)建敘事網(wǎng)絡(luò),并用Gephi軟件的進(jìn)行統(tǒng)計(jì)網(wǎng)絡(luò)結(jié)構(gòu)統(tǒng)計(jì)和可視化分析。敘事網(wǎng)絡(luò)結(jié)構(gòu)統(tǒng)計(jì)結(jié)果如表2所示,除了節(jié)點(diǎn)和連邊數(shù)量之外,聚集系數(shù)、平均路徑長(zhǎng)度、網(wǎng)絡(luò)直徑和模塊度取值都相近。網(wǎng)絡(luò)的基本特征是平均路徑長(zhǎng)度短、模塊度高,說(shuō)明任意兩個(gè)敘事內(nèi)容(節(jié)點(diǎn))可以通過(guò)少量的敘事邏輯(連邊)連接起來(lái),并形成了局部的“團(tuán)塊”。
表2 不同類(lèi)型虛假健康信息敘事網(wǎng)絡(luò)指標(biāo)
結(jié)合圖4(a-d)的可視化結(jié)果可以看出,虛假健康信息的敘事網(wǎng)絡(luò)主要由關(guān)于人、事、物、醫(yī)學(xué)術(shù)語(yǔ)等概念為核心形成明顯的語(yǔ)義團(tuán)塊。觀察這些團(tuán)塊的結(jié)構(gòu)可以發(fā)現(xiàn),它們多數(shù)是由一個(gè)或多個(gè)中心節(jié)點(diǎn)為核心,沿著不同敘事邏輯發(fā)散,并通過(guò)hub節(jié)點(diǎn)將不同團(tuán)塊鏈接起來(lái)。這些中心節(jié)點(diǎn)多為“人們”“身體”“孩子”“減肥”“維生素”等一些常見(jiàn)易懂的概念,發(fā)散鏈接起來(lái)的節(jié)點(diǎn)包括了“鍛煉”“癌癥”“膽固醇”等健康知識(shí)術(shù)語(yǔ)。敘事網(wǎng)絡(luò)上中心節(jié)點(diǎn)的作用是塑造普通民眾都能嵌入的敘事情景,敘事邏輯的功能是引導(dǎo)公眾形成概念間關(guān)聯(lián)的認(rèn)知圖譜,增加虛假健康信息內(nèi)容的多樣性。
(a)美容健身 (b)疾病防治
3.2.1敘事內(nèi)容特點(diǎn)
社交媒體上的虛假健康信息以講述事實(shí)的方式呈現(xiàn)在用戶(hù)面前,通過(guò)詞匯構(gòu)建健康概念和情景,吸引互聯(lián)網(wǎng)用戶(hù)注意力。本文通過(guò)敘事網(wǎng)絡(luò)節(jié)點(diǎn)度分布和詞云可視化兩個(gè)方法,展示虛假健康信息中的重要敘事內(nèi)容。
圖5(a)展示了雙對(duì)數(shù)坐標(biāo)系下4種虛假健康信息敘事網(wǎng)絡(luò)的分布,橫軸是節(jié)點(diǎn)度k,縱軸是度為k的節(jié)點(diǎn)在網(wǎng)絡(luò)種的出現(xiàn)頻率P(k)。圖像展示節(jié)點(diǎn)度分布特征是長(zhǎng)尾分布,即極少的敘事內(nèi)容被經(jīng)常使用,大部分?jǐn)⑹聝?nèi)容使用頻率較低,說(shuō)明敘事內(nèi)容即存在一定的集中特性,也具備多樣性特征。結(jié)合圖5(b)中的敘事內(nèi)容詞云,可以發(fā)現(xiàn)那些經(jīng)常被使用的敘事內(nèi)容有兩類(lèi)。第一類(lèi)是“人們”“老人”“孩子”“女士”“專(zhuān)家”等故事化文本中的人物,即虛假健康敘事是通過(guò)講述與這些特殊人群相關(guān)的內(nèi)容,明晰身份認(rèn)同并形成有效互動(dòng)。第二類(lèi)敘事內(nèi)容是“身體”“癌癥”“血液循環(huán)”“維生素”等事、物概念,立足人們的日常生活提供健康知識(shí),進(jìn)一步增加虛假健康信息的可用性。
(a) 敘事內(nèi)容節(jié)點(diǎn)度分布 (b)虛假健康信息敘事內(nèi)容詞云圖
此外,4種虛假健康信息的詞云可視化結(jié)果還具體展示了不同類(lèi)型虛假健康信息的敘事內(nèi)容的差異。在美容健身類(lèi)型中以“體重”“皮膚”“減肥”等為主要敘事內(nèi)容;在疾病防治類(lèi)型多圍繞“藥物”“效果”“感冒”等疾病、治療手段和藥物展開(kāi)敘述;食品安全類(lèi)則主要涉及“水”“西瓜”“小龍蝦”等食品使用的敘事內(nèi)容;營(yíng)養(yǎng)健康類(lèi)敘事內(nèi)容更多樣,其關(guān)注的敘事內(nèi)容為與其他3種類(lèi)型信息的敘事內(nèi)容重疊較多。每個(gè)類(lèi)型虛假健康信息敘事中經(jīng)常出現(xiàn)的敘事內(nèi)容往往是這些領(lǐng)域中最為關(guān)注的問(wèn)題,這些敘事內(nèi)容對(duì)人們的生活產(chǎn)生了直接的影響,用戶(hù)對(duì)于這些敘事內(nèi)容更為敏感和關(guān)注,因此虛假信息往往會(huì)通過(guò)宣傳產(chǎn)品或服務(wù)能夠解決人們最為關(guān)注的問(wèn)題來(lái)吸引消費(fèi)者的注意力和購(gòu)買(mǎi)欲望。
3.2.2敘事邏輯分布
亞里士多德的說(shuō)服力理論中提到人類(lèi)決策過(guò)程中邏輯的作用超出了信任。類(lèi)似的,社交媒體用戶(hù)很難確定信息的來(lái)源是否可信,因此信息中的敘事邏輯對(duì)其是否接受和轉(zhuǎn)發(fā)行為起到了重要的作用。
圖6(a)展示了4種虛假健康信息的六類(lèi)敘事邏輯占比情況,表明雖然虛假健康信息的類(lèi)型不同,但是大都主要采用行為誘導(dǎo)和夸張的敘事邏輯,加之心理認(rèn)同和因果來(lái)強(qiáng)化表達(dá),再輔以假供權(quán)威和消極騙取網(wǎng)民信任。不同敘事邏輯中常見(jiàn)的邏輯詞在各類(lèi)虛假健康信息分布情況如圖6(b)所示。具體而言,“吃”“喝”“使用”“購(gòu)買(mǎi)”等行為誘導(dǎo)型邏輯詞在四類(lèi)主題中使用最多,通過(guò)這些邏輯詞構(gòu)建了諸如“感冒的人吃水果真的有助于恢復(fù)”等敘事鏈接,給網(wǎng)民提供了一個(gè)可以參照的健康知識(shí)或者健康行為選項(xiàng),促使他們接受信息。占比較多的另一類(lèi)敘事邏輯夸張?jiān)诿廊萁∩眍?lèi)虛假健康信息中高達(dá)36%,這是由于此類(lèi)信息的生成目的是宣傳“膠原蛋白”“面膜”等產(chǎn)品,通過(guò)“增加”“緩解”“提升”“促進(jìn)”等的邏輯修辭可以加深公眾對(duì)產(chǎn)品的印象,吸引人們的注意力和興趣,使產(chǎn)品或方法看起來(lái)更加有效,從而增加用戶(hù)的信任或引起消費(fèi)者的購(gòu)買(mǎi)欲望,導(dǎo)致他們接受了其中隱含的歸類(lèi)描述。排名第三的是心理認(rèn)同敘事邏輯。認(rèn)同是個(gè)體對(duì)自我和周?chē)h(huán)境有用性或價(jià)值的判斷和評(píng)估,若個(gè)體對(duì)某個(gè)人和事產(chǎn)生認(rèn)同感,就容易失去自己的客觀判斷能力。因此,虛假健康信息中使用“知道”“認(rèn)為”等詞語(yǔ)喚起公眾的共鳴,也是欺騙公眾的一種常用手段。因果型邏輯詞的占比也比較顯著。尤其是在疾病治理類(lèi)虛假健康信息中,通過(guò)“導(dǎo)致”“引起”“影響”“依賴(lài)于”等詞匯展示特定結(jié)論,用貌似嚴(yán)謹(jǐn)?shù)倪壿嫹糯罅思膊〉娘L(fēng)險(xiǎn),促使公眾相信并傳播虛假信息。消極型邏輯的作用是從情感上喚起恐懼感,戴維·邁爾斯[36]的研究表明面對(duì)網(wǎng)絡(luò)上紛繁復(fù)雜的信息時(shí)個(gè)體的恐懼程度越高,信息的說(shuō)服效果越好。通過(guò)“遭受”“損害”“感染”等邏輯詞的使用,能令公眾產(chǎn)生焦慮、恐懼的情緒,從而增加虛假信息的關(guān)注度及說(shuō)服效果。假借權(quán)威型邏輯詞包括“發(fā)現(xiàn)”“發(fā)布”“證明”“研究”等,它們以官方口吻編造所謂權(quán)威信息,采用訴諸可信的方式來(lái)增加信息的可信度,獲得公眾的信任。
(a)敘事邏輯分布
3.2.3敘事鏈接模式
敘事網(wǎng)絡(luò)的形成是通過(guò)若干的es
三階模體可以分為結(jié)構(gòu)洞和集聚型兩大類(lèi)[37],如圖7所示,其中v表示敘事內(nèi)容,type(l)表示邊標(biāo)識(shí)所屬敘事邏輯類(lèi)型。對(duì)這兩類(lèi)三階模體分析可以幫助我們發(fā)現(xiàn)敘事網(wǎng)絡(luò)中的語(yǔ)義結(jié)構(gòu)及鏈接模式,即敘事內(nèi)容之間的邏輯組合模式。
(a)結(jié)構(gòu)洞三階模體 (b)集聚型三階模體
利用Batagelj提出的三元組普查(Triad Census)算法[38]統(tǒng)計(jì)不同類(lèi)型虛假信息的敘事網(wǎng)絡(luò)中三階模體的出現(xiàn)的次數(shù),結(jié)果如圖8所示。結(jié)構(gòu)洞鏈接類(lèi)型數(shù)量明顯多于集聚型,這說(shuō)明敘事內(nèi)容之間存在某些隱含的邏輯關(guān)系。在線用戶(hù)遇到結(jié)構(gòu)洞鏈接時(shí),會(huì)關(guān)注作為中介的敘事內(nèi)容,忽略錯(cuò)誤的邏輯漏洞,從而接受和傳播虛假健康信息。在結(jié)構(gòu)洞類(lèi)型中,021D數(shù)量最多,這說(shuō)明虛假健康信息敘事網(wǎng)絡(luò)中往往以某個(gè)敘事內(nèi)容為中心,通過(guò)不同類(lèi)型的敘事邏輯指向其他敘事內(nèi)容。在集聚型模體中,030T數(shù)量最多,表明敘事內(nèi)容通過(guò)邏輯鏈接呈現(xiàn)集聚、發(fā)散和傳遞傾向。
(a)結(jié)構(gòu)洞頻次分布
在結(jié)構(gòu)洞的鏈接模式中,通過(guò)敘事鏈接共形成21種敘事邏輯組合模式,主要的邏輯組合模式如表3所示,按照邏輯組合在每種數(shù)據(jù)類(lèi)型中占比總和進(jìn)行從高到低排序,其中“心理認(rèn)同-行為誘導(dǎo)”“夸張-行為誘導(dǎo)”“夸張-心理認(rèn)同”“行為誘導(dǎo)-行為誘導(dǎo)”的邏輯組合形式在不同類(lèi)型虛假信息中使用頻率均較高,說(shuō)明這些虛假健康信息往往通過(guò)行為誘導(dǎo)與其他類(lèi)型邏輯詞進(jìn)行結(jié)合實(shí)現(xiàn)目的。此外,“因果”型邏輯詞與“夸張”型邏輯詞組合頻率高于與其他類(lèi)型邏輯詞組合頻率,“消極”“假借權(quán)威”型邏輯詞與“行為誘導(dǎo)”型邏輯詞組合頻率高于與其他類(lèi)型邏輯詞組合頻率。
表3 結(jié)構(gòu)洞類(lèi)型鏈接模式的主要邏輯組合
從虛假健康信息類(lèi)型來(lái)看,美容健身類(lèi)虛假信息的邏輯組合中“夸張-夸張”占比較高,說(shuō)明此類(lèi)虛假信息對(duì)敘事內(nèi)容的描述偏向于夸大其詞;疾病防治類(lèi)虛假信息中“因果-夸張”邏輯組合使用高于其他類(lèi)型虛假信息,表明此類(lèi)信息通過(guò)因果邏輯詞結(jié)合夸張手法實(shí)現(xiàn)說(shuō)服效果。
在集聚型的鏈接模式中,敘事邏輯類(lèi)型組合模式較為多樣,可以劃分為三大類(lèi),如圖9(a)所示,發(fā)現(xiàn)A+A+B型邏輯組合模式在每類(lèi)虛假健康信息中占比均最高,虛假健康信息多利用“2+1”組合模式,這表明虛假健康信息敘事時(shí)采用兩個(gè)相同的邏輯增強(qiáng)信息的說(shuō)服力,同時(shí)添加一個(gè)不同的邏輯則可以實(shí)現(xiàn)目的。圖9(b)表示三種類(lèi)型主要邏輯組合示例,其中“夸張-行為誘導(dǎo)-心理認(rèn)同”的邏輯組合在不同類(lèi)型虛假健康信息中使用頻率均較高,這個(gè)敘事邏輯組合模式能夠產(chǎn)生一種針對(duì)性策略,通過(guò)夸大虛假健康信息的可信度、認(rèn)同感,借助行為誘導(dǎo)的方式實(shí)現(xiàn)目的。在美容健身及營(yíng)養(yǎng)健康類(lèi)虛假信息邏輯組合模式使用頻率最高的均為“夸張-夸張-心理認(rèn)同”,通過(guò)雙重夸張,利用用戶(hù)的需求和認(rèn)同感,以實(shí)現(xiàn)夸大作用、推銷(xiāo)產(chǎn)品的目的。
(a)三種類(lèi)型邏輯組合占比圖 (b)三種類(lèi)型邏輯組合示例
針對(duì)目前虛假健康信息特征提取和建模問(wèn)題,本文提出了計(jì)算敘事視角下的虛假健康信息特征模型和實(shí)現(xiàn)方法。研究結(jié)果顯示,虛假健康計(jì)算敘事模型不僅能解決和適用于“敘事”——人類(lèi)交流活動(dòng)的抽象和表示問(wèn)題,而且還能準(zhǔn)確的量化敘事內(nèi)容、敘事邏輯和敘事鏈接的程度和模式。它比經(jīng)典的主題建模和扎根分析等質(zhì)性研究具備兩個(gè)方面的優(yōu)勢(shì):可計(jì)算性和適應(yīng)性??捎?jì)算性是指能對(duì)文本中人類(lèi)交流活動(dòng)意圖和策略進(jìn)行表示和量化。主題建模等方法是從關(guān)鍵詞的角度刻畫(huà)文本內(nèi)容的重點(diǎn),無(wú)法說(shuō)明這些重點(diǎn)內(nèi)容之間的邏輯勾連程度。本研究構(gòu)建虛假健康信息的計(jì)算敘事模型,能對(duì)敘事內(nèi)容概率統(tǒng)計(jì)、敘事邏輯分類(lèi)統(tǒng)計(jì)和敘事鏈接模式分析等進(jìn)行計(jì)算,統(tǒng)計(jì)結(jié)果為傳播學(xué)與敘事學(xué)等相關(guān)研究提供了更廣闊的探索思路。適應(yīng)性是指可以適用于不同類(lèi)型虛假健康信息的特征建模需求。盡管不同類(lèi)型虛假健康信息的文本數(shù)量有差異,但計(jì)算敘事模型構(gòu)建不會(huì)因?yàn)槲谋疽?guī)模差異就失效,并能通過(guò)量化結(jié)果識(shí)別出不同類(lèi)型之間的特征差異。而質(zhì)性研究與建模者的知識(shí)理論和經(jīng)驗(yàn)有關(guān),研究過(guò)程不能快速?gòu)?fù)制和迭代。
從實(shí)證分析結(jié)果來(lái)看,虛假健康信息敘事特征主要有三點(diǎn):a.虛假健康信息的敘事網(wǎng)絡(luò)中以人、物等特定概念為核心形成明顯語(yǔ)義團(tuán)塊,且敘事內(nèi)容多樣化程度高,給不同區(qū)域、不同年齡段甚至不同健康狀態(tài)網(wǎng)民提供了豐富的內(nèi)容。b.虛假健康信息類(lèi)型不同,所采用的敘事邏輯不同。使用頻率比較高的敘事邏輯類(lèi)型是行為誘導(dǎo)、夸張和心理認(rèn)同,是導(dǎo)致普通網(wǎng)民難以分辨信息真假的重要原因。c.由敘事鏈接構(gòu)成的三階模體可以分為結(jié)構(gòu)洞和集聚兩大類(lèi)。統(tǒng)計(jì)每一類(lèi)模體連邊上的敘事邏輯標(biāo)記,可以發(fā)現(xiàn)虛假健康信息采用的內(nèi)容生成策略是相對(duì)集中的,通過(guò)夸大提升虛假健康知識(shí)的有效性,再獲取用戶(hù)心理認(rèn)同。因此,在進(jìn)行虛假健康信息的辟謠內(nèi)容設(shè)計(jì)時(shí),應(yīng)該注重每個(gè)領(lǐng)域中最為關(guān)注的問(wèn)題,并且針對(duì)不同人群,應(yīng)該提供不同的內(nèi)容,針對(duì)老人群體關(guān)注的健康問(wèn)題,如心血管疾病、骨質(zhì)疏松等,并提供相應(yīng)的預(yù)防和治療建議。針對(duì)女士群體,在美容健身領(lǐng)域關(guān)注的健康問(wèn)題,如減肥、美白等,并提供相應(yīng)的科學(xué)指導(dǎo)和建議;針對(duì)虛假健康信息中經(jīng)常使用的行為誘導(dǎo)、夸張、心理認(rèn)同等敘事邏輯,可以從多個(gè)角度進(jìn)行解釋和說(shuō)明,同時(shí)在設(shè)計(jì)健康信息或辟謠信息時(shí),應(yīng)該注重邏輯的使用方法,以提高信息的說(shuō)服性;針對(duì)虛假健康信息中存在的敘事鏈接,可以從不同鏈路進(jìn)行打破和反駁,澄清敘事內(nèi)容之間的真實(shí)邏輯關(guān)系,突破虛假健康信息中的結(jié)構(gòu)洞,建立科學(xué)的敘事鏈接,提供準(zhǔn)確可靠的健康知識(shí)。
盡管本文在計(jì)算敘事學(xué)理論和實(shí)踐方面做出了一定探索,但研究結(jié)果仍然存在一些局限。首先,本研究是基于科學(xué)辟謠平臺(tái)的辟謠信息提取的虛假健康信息,其結(jié)論是否具有普適性,還需結(jié)合其他平臺(tái)進(jìn)一步研究。其次,尚未將時(shí)間、空間因素納入研究范疇,筆者在未來(lái)研究中將進(jìn)行進(jìn)一步的優(yōu)化。