安 寧,安 璐,2
(1.武漢大學(xué)信息管理學(xué)院,武漢 430072;2.武漢大學(xué)信息資源研究中心,武漢 430072)
群體智慧(collective intelligence),是指群體所具有的優(yōu)于個(gè)體或個(gè)體總和的智慧與能力,是群體本身所固有的資產(chǎn)[1-2]?,F(xiàn)代科學(xué)對(duì)復(fù)雜性的研究表明,動(dòng)物常常會(huì)利用群體智慧進(jìn)行集體狩獵、相互掩護(hù)和躲避捕食者等活動(dòng)[3]。在人類社會(huì)中,最優(yōu)決策事實(shí)上通常也是基于群體智慧形成的[4]。社交媒體的發(fā)展不僅豐富了信息交流的模式,也為群體的互動(dòng)和知識(shí)的構(gòu)建開辟了新的途徑[5],尤其是在危機(jī)情境下,社交媒體成為公眾表達(dá)觀點(diǎn)與情感的重要渠道,同時(shí)促進(jìn)了網(wǎng)絡(luò)輿情環(huán)境的形成。從某種程度上來說,網(wǎng)絡(luò)輿情是群體智慧涌現(xiàn)的一種表現(xiàn)形式,承載了公眾對(duì)突發(fā)事件的認(rèn)知與理解,甚至具有對(duì)事件演化的前瞻性,在突發(fā)事件的應(yīng)急響應(yīng)工作中具有重要意義[5]。因此,本研究將突發(fā)公共衛(wèi)生事件輿情環(huán)境下的群體智慧涌現(xiàn)概述為公眾在圍繞突發(fā)公共衛(wèi)生事件進(jìn)行觀點(diǎn)的傳遞、碰撞與發(fā)酵的過程中,通過自組織活動(dòng)而呈現(xiàn)出優(yōu)于個(gè)體的智慧與能力的復(fù)雜現(xiàn)象。
社交媒體中的信息往往具有標(biāo)題化、碎片化、語言簡潔等特點(diǎn),那么在這看似雜亂無章的輿情信息環(huán)境下如何表征群體智慧?群體智慧的涌現(xiàn)是否存在某種規(guī)律?圍繞這些問題,本研究提出一種從突發(fā)公共衛(wèi)生事件的輿情信息中提取群體智慧的方法,即從輿情信息中提取知識(shí)三元組集合來表征公眾的知識(shí),探究微博、評(píng)論中三元組數(shù)量的分布情況以及知識(shí)密度的動(dòng)態(tài)變化,實(shí)現(xiàn)對(duì)突發(fā)公共衛(wèi)生事件輿情環(huán)境中群體智慧的結(jié)構(gòu)化表示及量化分析。同時(shí),本研究引入復(fù)雜網(wǎng)絡(luò)的思想構(gòu)建輿情知識(shí)網(wǎng)絡(luò),通過網(wǎng)絡(luò)結(jié)構(gòu)關(guān)系的時(shí)序變化反映和揭示突發(fā)公共衛(wèi)生事件輿情環(huán)境下公眾知識(shí)涌現(xiàn)的規(guī)律與模式,以期為管理部門在對(duì)突發(fā)公共衛(wèi)生事件網(wǎng)絡(luò)輿情進(jìn)行引導(dǎo)與決策時(shí)提供參考。
近年來,世界各地的自然災(zāi)害、事故災(zāi)害等多種危機(jī)事件逐漸呈現(xiàn)出日益高發(fā)、規(guī)模擴(kuò)大、危害程度加深等態(tài)勢[6]。不同于其他情境,突發(fā)公共衛(wèi)生事件等危機(jī)情境將嚴(yán)重威脅人類生活與社會(huì)秩序,通常還伴隨不確定性、破壞性、聚焦性等特征[7]。在此情境下,社交媒體毋庸置疑成為公眾信息交流、情感表達(dá)和維持社會(huì)化關(guān)系的重要渠道[8]。突發(fā)事件暴發(fā)后,用戶在社交媒體平臺(tái)上通過生成、評(píng)論和轉(zhuǎn)發(fā)等多種形式,傳遞著與事件、新聞、思想以及情感等相關(guān)的近乎瞬時(shí)信息,形成與突發(fā)事件相關(guān)的網(wǎng)絡(luò)輿情。然而,社交媒體雖然為信息交流帶來了便捷,但也存在著不可忽視的“回音室”現(xiàn)象。社交媒體的“回音室”具有封閉且高度同質(zhì)化的特征,即公眾在“回音室效應(yīng)”下常常會(huì)固守在符合自己偏好的信息圈子里,過濾與自己意見相左的觀點(diǎn)或情感,而相近的意見與觀點(diǎn)將被反復(fù)傳播,極易造成輿情群體極化現(xiàn)象[9]。
網(wǎng)絡(luò)輿情的演變關(guān)乎著社會(huì)的穩(wěn)定和發(fā)展,而危機(jī)事件通常易造成公眾情緒波動(dòng),產(chǎn)生悲傷、憤怒以及恐慌等負(fù)面情緒,進(jìn)而危害社會(huì)秩序穩(wěn)定[10]。因此,國內(nèi)外學(xué)者逐漸開始關(guān)注突發(fā)事件網(wǎng)絡(luò)輿情信息的相關(guān)研究,主要聚焦于網(wǎng)絡(luò)輿情的主題和情感的分析與挖掘[11]。在輿情主題方面,現(xiàn)有研究多基于LDA(latent Dirichlet allocation)主題模型[12]進(jìn)行主題識(shí)別,探索突發(fā)公共衛(wèi)生事件輿情主題的演變模式和時(shí)間特征[13]。在輿情情感方面,學(xué)者們通?;谇楦性~典和機(jī)器學(xué)習(xí)等相關(guān)方法進(jìn)行研究。前者需要利用已標(biāo)注好的情感詞典,如大連理工大學(xué)情感詞典、How Net情感詞典等分析用戶的情感強(qiáng)度與情感傾向[14];后者則需要大量人工標(biāo)注的語料作為訓(xùn)練集,提取文本特征,構(gòu)建分類器以實(shí)現(xiàn)情感分類[15]。
群體智慧是在個(gè)體交流、協(xié)作、競爭、頭腦風(fēng)暴等過程中產(chǎn)生的,常出現(xiàn)在如公共決策、投票活動(dòng)、社交網(wǎng)絡(luò)和眾包等領(lǐng)域中[16]。在早期,“群體智慧”概念曾遭到大多數(shù)學(xué)者的抨擊,例如,MacKay[17]直接表示群體所產(chǎn)生的智慧遠(yuǎn)不如單獨(dú)個(gè)體所擁有的智慧,甚至認(rèn)為群體的匯聚是愚蠢的。直至1907年,Galton[18]在《自然》(Nature)雜志上發(fā)表了一篇文章,證明了群體在某些情況下可以超越專家的智慧,這標(biāo)志著群體智慧得到了科學(xué)家們的廣泛認(rèn)可。群體智慧是群體內(nèi)自下而上和自上而下過程相互作用所產(chǎn)生的新特征[19],與群體內(nèi)交流的公平性和群體的社會(huì)感知之間有密切關(guān)聯(lián)[2]。Web 2.0打破了傳統(tǒng)門戶網(wǎng)站單向傳輸?shù)哪J?,充分發(fā)掘了個(gè)體的智慧和力量,極大地提升了互聯(lián)網(wǎng)的整體創(chuàng)造力[20],例如,Yuan等[21]從Web 2.0視角構(gòu)建了互聯(lián)網(wǎng)上群體智慧新框架,分析了群體智慧在互聯(lián)網(wǎng)上的演化機(jī)制,指出互聯(lián)網(wǎng)中的群體智慧是一種由集體行為所產(chǎn)生的涌現(xiàn)現(xiàn)象。易明等[22]認(rèn)為,協(xié)同標(biāo)注信息行為是一個(gè)基于群體智慧涌現(xiàn)的分類知識(shí)產(chǎn)生過程,這種群體智慧的涌現(xiàn)是一個(gè)從量變到質(zhì)變的過程。
重大突發(fā)事件的應(yīng)急管理是國家治理體系現(xiàn)代化的重要組成部分,如何聚力情報(bào)智慧、科學(xué)應(yīng)對(duì)重大突發(fā)事件,儼然成為總體國家安全觀下亟待研究的關(guān)鍵問題[23]。突發(fā)事件中的輿情信息不僅是重要情報(bào)資源,更是群體智慧在危機(jī)情景下的一種具體表現(xiàn),反映了群體對(duì)事件態(tài)勢的認(rèn)知與研判,是感知、理解和預(yù)測民眾關(guān)于突發(fā)事件的群體決策與應(yīng)對(duì)行為的重要渠道。因此,挖掘與分析社交媒體上的輿情信息,有助于探究群體智慧的形成與演化機(jī)理,對(duì)突發(fā)公共衛(wèi)生事件的應(yīng)急管理具有重要意義[5]。社交媒體不僅是公眾信息交流的重要渠道,也是了解公眾態(tài)度與行為的重要數(shù)據(jù)來源[24]。在應(yīng)急管理工作實(shí)踐中,已有研究將在線社交媒體信息用于開發(fā)基于GIS(geographic information system)的實(shí)時(shí)地圖[25]、龍卷風(fēng)預(yù)警系統(tǒng)[26]和網(wǎng)絡(luò)故障檢測系統(tǒng)[27]等,充分發(fā)揮了信息資源的選擇與決策功能[28]。輿情信息作為群體智慧的一種具體表現(xiàn)形式,能夠指導(dǎo)相關(guān)部門和機(jī)構(gòu)科學(xué)應(yīng)對(duì)各類突發(fā)事件,降低不確定性,減小風(fēng)險(xiǎn)與損失,容災(zāi)減災(zāi),提升群體的凝聚力[29-30]。
綜上所述,群體智慧得到了國內(nèi)外學(xué)者的廣泛認(rèn)可?,F(xiàn)有研究成果主要是探究Web 2.0模式下群體智慧框架、用戶協(xié)同標(biāo)注行為等,鮮有研究挖掘突發(fā)事件輿情環(huán)境下的群體智慧涌現(xiàn)的規(guī)律與模式。因此,本研究基于特定突發(fā)公共衛(wèi)生事件下的網(wǎng)絡(luò)輿情信息,利用依存句法分析提取輿情信息中的知識(shí)三元組,以結(jié)構(gòu)化表示突發(fā)公共衛(wèi)生事件輿情環(huán)境下公眾的知識(shí)條目,基于輿情知識(shí)網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu),揭示突發(fā)公共衛(wèi)生事件網(wǎng)絡(luò)輿情環(huán)境中群體智慧涌現(xiàn)的規(guī)律與模式。
突發(fā)事件的出現(xiàn)通常會(huì)促進(jìn)公眾之間的信息共享、討論和交流,形成特定的輿情環(huán)境。在此環(huán)境下,公眾在圍繞突發(fā)事件進(jìn)行觀點(diǎn)的傳遞、碰撞與發(fā)酵的過程中,通過自組織活動(dòng)將呈現(xiàn)出優(yōu)于個(gè)體的群體智慧。三元組作為知識(shí)圖譜常用的知識(shí)表示方法,可以描述真實(shí)世界中存在的各種實(shí)體或概念及其復(fù)雜聯(lián)系。因此,本研究利用三元組表示突發(fā)事件輿情信息中所包含的公眾的知識(shí)條目,即以所提取的知識(shí)三元組集合來表征突發(fā)公共衛(wèi)生事件輿情環(huán)境下公眾的群體智慧,進(jìn)而展開研究。首先,本研究將所獲得的微博、評(píng)論等文本內(nèi)容切割成句,形成語料庫;其次,利用自然語言處理工具HanLP(Han language processing)對(duì)語料庫進(jìn)行分詞、詞性標(biāo)注、命名實(shí)體識(shí)別和依存句法分析;最后,基于李明耀等[31]提出的基于依存分析的開放式中文實(shí)體關(guān)系抽取方法REDP(relation extraction with dependency parsing),從語料庫中抽取實(shí)體關(guān)系,從而得到<head,relation,tail>形式的知識(shí)三元組。
根據(jù)REDP方法,中文實(shí)體關(guān)系可以表述為“狀語*動(dòng)詞+補(bǔ)語?賓語?”。其中,“*”表示出現(xiàn)0次或任意多次;“+”表示出現(xiàn)1次或任意多次;“?”表示出現(xiàn)0次或1次。其依存句法關(guān)系結(jié)構(gòu)如圖1所示。
圖1 依存句法關(guān)系結(jié)構(gòu)
實(shí)驗(yàn)結(jié)果[31]表明,REDP方法在中文實(shí)體關(guān)系抽取方面性能良好,其F值比基于卷積樹核的無監(jiān)督層次聚類方法提高了16.68%,在準(zhǔn)確率和召回率上都有較大幅度的提高,能夠保證本研究的準(zhǔn)確性。
最后,對(duì)初步抽取到的知識(shí)三元組進(jìn)行清洗。首先,剔除有缺失的無效三元組,因?yàn)檫@些有缺失的三元組無法完整、準(zhǔn)確地表達(dá)出一條知識(shí)內(nèi)容;其次,根據(jù)“哈工大停用詞表”,剔除head或tail中含有停用詞的三元組,進(jìn)一步保證所獲三元組更具知識(shí)含義;最后,得到突發(fā)公共衛(wèi)生事件輿情環(huán)境中公眾的知識(shí)三元組集合。
基于突發(fā)公共衛(wèi)生事件輿情信息提取的知識(shí)三元組集合,蘊(yùn)含了公眾在突發(fā)公共衛(wèi)生事件情景下所產(chǎn)生的群體智慧。隨著網(wǎng)絡(luò)思維引入圖書情報(bào)學(xué)領(lǐng)域,基于復(fù)雜網(wǎng)絡(luò)的思想對(duì)知識(shí)和知識(shí)關(guān)聯(lián)關(guān)系進(jìn)行研究已經(jīng)得到了學(xué)術(shù)界的普遍認(rèn)可。因此,本研究將三元組的head與tail實(shí)體作為知識(shí)單元,將relation看作兩個(gè)知識(shí)單元之間的關(guān)聯(lián)關(guān)系,以知識(shí)單元為節(jié)點(diǎn),以關(guān)聯(lián)關(guān)系為邊,構(gòu)建輿情知識(shí)網(wǎng)絡(luò)。在構(gòu)建輿情知識(shí)網(wǎng)絡(luò)的過程中發(fā)現(xiàn),輿情知識(shí)網(wǎng)絡(luò)中存在自環(huán),即一條邊的兩個(gè)節(jié)點(diǎn)為同一知識(shí)單元。鑒于該拓?fù)浣Y(jié)構(gòu)無法揭示知識(shí)單元之間的關(guān)聯(lián)信息,因此去除輿情知識(shí)網(wǎng)絡(luò)中的自環(huán),形成輿情知識(shí)網(wǎng)絡(luò)的簡單圖。
網(wǎng)絡(luò)科學(xué)領(lǐng)域的著名學(xué)者Newman[32]曾指出,許多實(shí)際的大規(guī)模復(fù)雜網(wǎng)絡(luò)都是非連通的,往往會(huì)存在一個(gè)包含整個(gè)網(wǎng)絡(luò)中相當(dāng)比例節(jié)點(diǎn)的最大分支(又稱巨分支),如圖2所示。其中,虛線圓圈中的節(jié)點(diǎn)和邊構(gòu)成該網(wǎng)絡(luò)的巨分支。對(duì)于大規(guī)模網(wǎng)絡(luò)而言,網(wǎng)絡(luò)的連通性較為脆弱,單個(gè)節(jié)點(diǎn)或者相當(dāng)少部分的節(jié)點(diǎn)的行為都可能破壞該性質(zhì),因此,往往基于巨分支探究網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)[33]。鑒于在突發(fā)公共衛(wèi)生事件的發(fā)展過程中,大眾群體所表達(dá)出的知識(shí)內(nèi)容較為分散、無序,同時(shí),知識(shí)單元及其關(guān)聯(lián)關(guān)系也會(huì)發(fā)生興衰更迭的變化,這些因素促使輿情知識(shí)網(wǎng)絡(luò)包含不連通的小分支群落。因此,本研究基于網(wǎng)絡(luò)的連通性,提取輿情知識(shí)網(wǎng)絡(luò)中規(guī)模最大且連通的分支,即保留其中的節(jié)點(diǎn)、邊等拓?fù)浣Y(jié)構(gòu)要素,形成輿情知識(shí)網(wǎng)絡(luò)的巨分支。本研究以巨分支內(nèi)包含的知識(shí)單元及知識(shí)關(guān)系表示公眾知識(shí)的主流方向,進(jìn)而探索突發(fā)公共衛(wèi)生事件輿情環(huán)境中群體知識(shí)的演變模式與規(guī)律。
圖2 網(wǎng)絡(luò)結(jié)構(gòu)中的巨分支
知識(shí)網(wǎng)絡(luò)是一種具有層次結(jié)構(gòu)的復(fù)雜網(wǎng)絡(luò)[34],本研究基于k-核理論對(duì)輿情知識(shí)網(wǎng)絡(luò)的巨分支結(jié)構(gòu)進(jìn)行分解,探索輿情知識(shí)網(wǎng)絡(luò)巨分支的“核心-邊緣”結(jié)構(gòu),以洞悉突發(fā)公共衛(wèi)生事件輿情環(huán)境中群體所涌現(xiàn)出的知識(shí)結(jié)構(gòu)。k-核是網(wǎng)絡(luò)節(jié)點(diǎn)的一個(gè)最大子集,在該子集中的每個(gè)節(jié)點(diǎn)至少與子集中其他k個(gè)節(jié)點(diǎn)直接相連,是探索網(wǎng)絡(luò)層次結(jié)構(gòu)的代表性方法。從本質(zhì)上來看,k-核的分解過程是根據(jù)節(jié)點(diǎn)的度值來劃分網(wǎng)絡(luò)層次結(jié)構(gòu),從外層向內(nèi)層延伸式擴(kuò)展進(jìn)行的。圖3所示為一個(gè)簡單網(wǎng)絡(luò)的k-核分解示意圖。
圖3 網(wǎng)絡(luò)的k-核分解
在對(duì)輿情知識(shí)網(wǎng)絡(luò)巨分支進(jìn)行k-核分解時(shí),首先,去除網(wǎng)絡(luò)中度值小于1的節(jié)點(diǎn),由剩下的節(jié)點(diǎn)和邊構(gòu)成網(wǎng)絡(luò)1-核。需要說明的是,本研究以輿情知識(shí)網(wǎng)絡(luò)的巨分支為研究對(duì)象,而巨分支是網(wǎng)絡(luò)的最大連通子圖,因此,1-核網(wǎng)絡(luò)即輿情知識(shí)網(wǎng)絡(luò)的巨分支。其次,去除巨分支中度值小于2的節(jié)點(diǎn),剩下的節(jié)點(diǎn)和邊構(gòu)成巨分支的2-核網(wǎng)絡(luò)結(jié)構(gòu)。再次,去除度值小于3的節(jié)點(diǎn),剩下的構(gòu)成3-核網(wǎng)絡(luò)。以此類推,重復(fù)這種去除操作,最后實(shí)現(xiàn)對(duì)巨分支的k-核分解,即去除輿情知識(shí)網(wǎng)絡(luò)連通的巨分支中度值小于k的所有節(jié)點(diǎn)及其連邊,直至網(wǎng)絡(luò)中剩下的節(jié)點(diǎn)的度值都不小于k。對(duì)輿情知識(shí)網(wǎng)絡(luò)巨分支進(jìn)行k-核分解,能有效地識(shí)別出知識(shí)的核心區(qū)域,即最大k-核節(jié)點(diǎn)位于巨分支的最內(nèi)層,是輿情知識(shí)網(wǎng)絡(luò)巨分支中核心、稠密的區(qū)域。
突發(fā)公共衛(wèi)生事件爆發(fā)后,微博平臺(tái)中的用戶會(huì)在相關(guān)話題下發(fā)表微博帖子,每篇微博又會(huì)被不同用戶進(jìn)行評(píng)論,形成“話題-微博-評(píng)論”的結(jié)構(gòu),如圖4所示。在新冠疫情的社會(huì)背景下,本研究以新浪微博為基礎(chǔ)數(shù)據(jù)源,于2020年7月1日以“群體免疫”為檢索詞,獲取新浪微博平臺(tái)上“#群體免疫#”“#世衛(wèi)組織質(zhì)疑英國群體免疫方法#”“#李蘭娟談群體免疫#”等相關(guān)的145個(gè)話題,以及各話題所包含的9992條微博和75905條評(píng)論數(shù)據(jù)。經(jīng)過清洗、去重等預(yù)處理后,最終得到共計(jì)8798條微博、62729條評(píng)論信息,時(shí)間跨度為2020年3月13日至2020年6月30日。
圖4 話題-微博-評(píng)論結(jié)構(gòu)
發(fā)表微博和評(píng)論是公眾參與突發(fā)公共衛(wèi)生事件輿情討論的主要形式,探究微博與評(píng)論之間的關(guān)系,有助于掌握公眾在突發(fā)公共衛(wèi)生事件輿情環(huán)境下的行為模式,為探索群體智慧涌現(xiàn)的規(guī)律與模式提供依據(jù)。因此,令g={p1,p2,…,pn}表示評(píng)論的概率分布,其中,p n為一條微博評(píng)論數(shù)量為n的概率,對(duì)突發(fā)公共衛(wèi)生事件情景下的微博評(píng)論數(shù)量的概率分布進(jìn)行統(tǒng)計(jì),在對(duì)數(shù)坐標(biāo)系下的相關(guān)結(jié)果如圖5所示。
在圖5中,橫坐標(biāo)表示一條微博的評(píng)論次數(shù);縱坐標(biāo)表示概率,是一條微博能夠產(chǎn)生對(duì)應(yīng)數(shù)量的評(píng)論的概率。可以發(fā)現(xiàn),微博不被評(píng)論(即具有0條評(píng)論)的概率為71.15%,具有1條評(píng)論的概率為8.14%,而微博中所含評(píng)論數(shù)量不多于7條的概率已高達(dá)90.61%,評(píng)論的期望值約為7.13??梢猿醪降贸鼋Y(jié)論,在突發(fā)公共衛(wèi)生事件輿情環(huán)境中,公眾發(fā)表的微博評(píng)論概率分布在總體上趨近于冪律分布,具有無標(biāo)度特性,即大多數(shù)的微博會(huì)被少量用戶評(píng)論,僅有少量微博會(huì)擁有大量評(píng)論。
圖5 一條微博下評(píng)論數(shù)量的概率分布
根據(jù)第3.1節(jié)的方法將微博、評(píng)論的文本內(nèi)容切割成句,其中從微博文本中共切割出87343句,從評(píng)論內(nèi)容中切割出144216句?;谒懈畛龅木渥犹崛≈R(shí)三元組,共47426個(gè),部分節(jié)選如表1所示。本研究以三元組的形式將突發(fā)公共衛(wèi)生事件輿情環(huán)境下的群體智慧結(jié)構(gòu)化,即一個(gè)輿情知識(shí)三元組表示了突發(fā)事件輿情信息中公眾的知識(shí)條目。為判斷突發(fā)事件的演變,以及輿情熱度和群體智慧涌現(xiàn)的關(guān)系與特征,本研究分析了時(shí)間-微博評(píng)論數(shù)-知識(shí)三元組之間的數(shù)量關(guān)系,如圖6所示。
圖6 時(shí)間-微博評(píng)論數(shù)-知識(shí)三元組之間的數(shù)量關(guān)系
表1 突發(fā)公共衛(wèi)生事件輿情環(huán)境下的三元組(節(jié)選)
群體智慧涌現(xiàn)與突發(fā)公共衛(wèi)生事件和網(wǎng)絡(luò)輿情的演變過程存在顯著關(guān)聯(lián)。通過分析時(shí)間、微博評(píng)論與知識(shí)三元組之間的數(shù)量關(guān)系,能夠?qū)θ后w智慧涌現(xiàn)、突發(fā)公共衛(wèi)生事件和網(wǎng)絡(luò)輿情三者之間的關(guān)系以及群體智慧涌現(xiàn)的模式特征作出直觀的判斷。由于微博評(píng)論與知識(shí)三元組在量綱和取值范圍方面存在差異,因此,需要根據(jù)公式對(duì)數(shù)據(jù)進(jìn)行Z-score標(biāo)準(zhǔn)化處理。其中,μ是平均值;σ為標(biāo)準(zhǔn)差;x是觀測值。
在圖6中,x軸表示時(shí)間,其刻度為“日”;y軸表示微博評(píng)論數(shù)量的Z-score標(biāo)準(zhǔn)化;z軸表示知識(shí)三元組數(shù)量的Z-score標(biāo)準(zhǔn)化。圖6中的數(shù)據(jù)散點(diǎn)分別表示每日新增與每日累計(jì)兩種。觀察每日新增的變化趨勢可以發(fā)現(xiàn),微博數(shù)量和知識(shí)三元組數(shù)量在初期呈現(xiàn)爆發(fā)式增長,此后趨于平緩,但仍然會(huì)出現(xiàn)短暫爆發(fā)的現(xiàn)象。這說明群體智慧在經(jīng)歷初期的爆炸增長后,仍會(huì)在新熱點(diǎn)的激發(fā)下再次被激活。群體智慧涌現(xiàn)的現(xiàn)象貫穿于突發(fā)公共衛(wèi)生事件與網(wǎng)絡(luò)輿情演變的全周期。
每日累計(jì)數(shù)據(jù)在初期經(jīng)歷了同樣的爆發(fā)式增長后,表現(xiàn)出明顯的階梯式上升特征,表明累計(jì)的知識(shí)三元組數(shù)量并不是平穩(wěn)線性增加的。在較長時(shí)間的平緩且微量的增長后,會(huì)突現(xiàn)一次短暫的大幅度跳躍式增長。這與每日新增數(shù)據(jù)是相對(duì)應(yīng)的,說明在突發(fā)公共衛(wèi)生事件中的群體智慧涌現(xiàn)是一種臨界現(xiàn)象。群體智慧涌現(xiàn)不僅貫穿于突發(fā)公共衛(wèi)生事件與網(wǎng)絡(luò)輿情演變的全周期,其對(duì)于群體智慧的表達(dá)與演變的貢獻(xiàn)也要高于長期的知識(shí)積累。
為探究公眾基于微博、評(píng)論等不同形式產(chǎn)生知識(shí)的特征,以一條微博(或評(píng)論)中的三元組數(shù)量為橫坐標(biāo),以一條微博(或評(píng)論)中能夠產(chǎn)生的三元組數(shù)量的概率為縱坐標(biāo),對(duì)三元組數(shù)量的概率分布進(jìn)行統(tǒng)計(jì),如圖7所示??梢园l(fā)現(xiàn),圖7中明顯存在重尾現(xiàn)象,即大多微博(或評(píng)論)含有較少的知識(shí)三元組,從少量微博(或評(píng)論)可以提取出較多的知識(shí)三元組。為探究微博、評(píng)論中各自的知識(shí)貢獻(xiàn)度,本研究對(duì)每日三元組的新增總數(shù)Tall、在新增微博中提取的三元組Tw以及在新增評(píng)論中提取的三元組的數(shù)量Tc進(jìn)行統(tǒng)計(jì),如圖8a所示。為消除規(guī)模差異的影響,本研究根據(jù)新增微博中提取的三元組Tw與微博的新增數(shù)量W之比Tw/W、新增評(píng)論中提取的三元組的數(shù)量Tc與評(píng)論的新增數(shù)量C之比Tc/C,來考察微博、評(píng)論中對(duì)知識(shí)三元組的貢獻(xiàn)情況,如圖8b所示。
圖7 一條微博(或評(píng)論)中三元組數(shù)量的概率分布
由圖8a可知,在3月14日至3月18日,從評(píng)論中提取出的知識(shí)三元組數(shù)量多于從微博中提取的知識(shí)三元組數(shù)量。但結(jié)合圖5可以發(fā)現(xiàn),在這幾個(gè)時(shí)間窗口中,公眾發(fā)表評(píng)論的新增數(shù)量C同樣也高于微博新增數(shù)量W。因此,需結(jié)合圖8b中的Tw/W和Tc/C兩個(gè)比值考察微博、評(píng)論中對(duì)知識(shí)三元組的貢獻(xiàn)情況,消除微博和評(píng)論的數(shù)量差異的影響。在3月14日窗口中,一條新增微博可以提取出0.944個(gè)知識(shí)三元組,而一條新增評(píng)論僅可提取出0.311個(gè)知識(shí)三元組。隨著時(shí)間窗口的滑動(dòng),在3月21日、4月11日、5月6日等窗口下,從一條微博中提取出的知識(shí)三元組數(shù)量明顯高于從一條評(píng)論內(nèi)容中提取的知識(shí)三元組數(shù)量。在6月8日窗口下,一條新增微博可以提取出高達(dá)9個(gè)知識(shí)三元組,而一條新增評(píng)論僅提取出0.485個(gè)知識(shí)三元組。這一現(xiàn)象反映出,在突發(fā)公共衛(wèi)生事件輿情環(huán)境中,評(píng)論信息數(shù)量雖然遠(yuǎn)高于微博數(shù)量,但群體智慧涌現(xiàn)出的知識(shí)條目主要集中于微博,而非評(píng)論信息。換句話說,在突發(fā)公共衛(wèi)生事件輿情環(huán)境下,公眾所發(fā)表的微博內(nèi)容更具知識(shí)性,與評(píng)論內(nèi)容相比,所含的知識(shí)密度更大。
圖8 每日新增微博、評(píng)論中提取的知識(shí)三元組數(shù)量及比值
4.3.1 輿情知識(shí)網(wǎng)絡(luò)及巨分支的統(tǒng)計(jì)分析
為更好地反映群體智慧的涌現(xiàn)特性,本研究根據(jù)第3.2節(jié)中所涉及的方法理論,以1天為時(shí)間切片,基于累計(jì)值構(gòu)建輿情知識(shí)網(wǎng)絡(luò),并提取其巨分支結(jié)構(gòu)以表示突發(fā)公共衛(wèi)生事件輿情環(huán)境中大眾群體的主流知識(shí)方向。將2020年3月13日至2020年6月30日劃分成110個(gè)時(shí)間窗口,即t1時(shí)間窗口含有3月13日出現(xiàn)的知識(shí)單元,t2時(shí)間窗口包含3月13日至3月14日知識(shí)單元的累計(jì)數(shù)據(jù),依此類推。此外,對(duì)t1~t110各時(shí)間窗口下輿情知識(shí)網(wǎng)絡(luò)節(jié)點(diǎn)數(shù)量、邊數(shù)量以及巨分支的基本指標(biāo)特征進(jìn)行測度與統(tǒng)計(jì),以期通過網(wǎng)絡(luò)巨分支拓?fù)浣Y(jié)構(gòu)的時(shí)序變化反映和揭示突發(fā)公共衛(wèi)生事件輿情環(huán)境下群體智慧演變的規(guī)律與模式。部分節(jié)選如表2所示。
由表2可知,與領(lǐng)域知識(shí)網(wǎng)絡(luò)[35]有所不同,突發(fā)事件輿情環(huán)境下的輿情知識(shí)網(wǎng)絡(luò)在各個(gè)時(shí)間窗口下的巨分支結(jié)構(gòu)平均來看,僅涵蓋了整體網(wǎng)絡(luò)約50%的知識(shí)節(jié)點(diǎn),囊括了約69%的知識(shí)單元之間的關(guān)聯(lián)關(guān)系。這表明輿情知識(shí)網(wǎng)絡(luò)的連通性較弱,在突發(fā)事件的網(wǎng)絡(luò)輿情環(huán)境下,公眾產(chǎn)生的知識(shí)具有分散性,知識(shí)單元一般形成了規(guī)模較小且互不關(guān)聯(lián)的分支群落。表2中,在t1時(shí)間窗口下僅有2個(gè)知識(shí)節(jié)點(diǎn),知識(shí)關(guān)聯(lián)關(guān)系為1,說明突發(fā)公共衛(wèi)生事件輿情環(huán)境初始狀態(tài)之下,群體智慧涌現(xiàn)的知識(shí)并不多,知識(shí)關(guān)聯(lián)關(guān)系也較為簡單。隨著時(shí)間窗口滑動(dòng),突發(fā)事件的輿情環(huán)境不斷發(fā)展,逐漸涌現(xiàn)出大量知識(shí)單元以及知識(shí)關(guān)聯(lián)關(guān)系,使得輿情知識(shí)網(wǎng)絡(luò)巨分支的規(guī)模逐漸增大。輿情知識(shí)網(wǎng)絡(luò)巨分支時(shí)間序列的密度在總體趨勢上持續(xù)降低,說明盡管巨分支在整體上處于增長狀態(tài),但仍然是一個(gè)較為稀疏的網(wǎng)絡(luò)結(jié)構(gòu)。
表2 每日累計(jì)的輿情知識(shí)網(wǎng)絡(luò)及巨分支的統(tǒng)計(jì)特征(節(jié)選)
為進(jìn)一步探究輿情知識(shí)網(wǎng)絡(luò)中知識(shí)單元的群聚程度,本研究構(gòu)建了同等規(guī)模(即節(jié)點(diǎn)數(shù)量、連數(shù)量相同)的隨機(jī)網(wǎng)絡(luò)以作比較,發(fā)現(xiàn)輿情知識(shí)網(wǎng)絡(luò)巨分支的聚類系數(shù)高于同等規(guī)模的隨機(jī)網(wǎng)絡(luò),但整體上低于領(lǐng)域知識(shí)網(wǎng)絡(luò)[35]。聚類系數(shù)是對(duì)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)中閉合三元組的測量,輿情知識(shí)網(wǎng)絡(luò)巨分支的低聚類系數(shù)表明,在突發(fā)公共衛(wèi)生事件的輿情討論中所涌現(xiàn)的知識(shí)單元之間的傳遞性并不高,即知識(shí)較為松散且聚集程度不高。在時(shí)間序列下,輿情知識(shí)網(wǎng)絡(luò)巨分支的平均路徑為4.72跳,表明在大多情況下輿情知識(shí)網(wǎng)絡(luò)中的各知識(shí)單元經(jīng)較短的路徑就可以相互連接。因此,與同等規(guī)模的隨機(jī)網(wǎng)絡(luò)相比,在突發(fā)公共衛(wèi)生事件情景下的輿情知識(shí)網(wǎng)絡(luò)巨分支具有較高聚類系數(shù)、較短特征路徑長度的小世界特性。
4.3.2 輿情知識(shí)網(wǎng)絡(luò)巨分支的k-核分析
經(jīng)過上述研究發(fā)現(xiàn),突發(fā)公共衛(wèi)生事件輿情環(huán)境下的知識(shí)網(wǎng)絡(luò)的巨分支雖然整體上處于連通狀態(tài),但仍是較為稀疏、松散的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)。因此,根據(jù)第3.3節(jié)中提及的k-核分解方法,觀察輿情知識(shí)網(wǎng)絡(luò)核心知識(shí)單元以及其關(guān)聯(lián)關(guān)系。本研究對(duì)終態(tài)網(wǎng)絡(luò)(即t110時(shí)間窗口)的巨分支結(jié)構(gòu)進(jìn)行k-核分解,獲取輿情知識(shí)網(wǎng)絡(luò)巨分支的核心-邊緣知識(shí)單元的層級(jí)結(jié)構(gòu),如圖9所示。
圖9 輿情知識(shí)網(wǎng)絡(luò)巨分支的k-核分解
經(jīng)過k-核分解后,輿情知識(shí)網(wǎng)絡(luò)巨分支中最高核為7-核,包含了48個(gè)知識(shí)單元節(jié)點(diǎn),這些知識(shí)單元之間的關(guān)聯(lián)緊密,即每個(gè)知識(shí)單元至少與子群中其他7個(gè)知識(shí)單元具有直接關(guān)聯(lián)關(guān)系。在知識(shí)單元數(shù)量上,7-核中包含的知識(shí)節(jié)點(diǎn)數(shù)量僅占巨分支中節(jié)點(diǎn)數(shù)量的0.43%,說明在輿情知識(shí)網(wǎng)絡(luò)中的核心知識(shí)數(shù)量并不多,也進(jìn)一步證明了輿情知識(shí)網(wǎng)絡(luò)中的知識(shí)較為松散,聚集程度不高。當(dāng)k=7時(shí),所劃分形成的子群是輿情知識(shí)網(wǎng)絡(luò)巨分支的核心部分,其中,“英國”“美國”“中國”“瑞典”等知識(shí)單元節(jié)點(diǎn)的度值較大,說明在重大突發(fā)公共衛(wèi)生背景下,公眾通過社交媒體交流所涌現(xiàn)出的核心知識(shí)多與國家層面相關(guān),多涉及疫苗研發(fā)、隔離措施等與各國政府的角色直接相關(guān)。在k=1時(shí)出現(xiàn)如“購物”“BBC報(bào)道”“學(xué)?!薄敖煌ā钡戎R(shí)單元,涌現(xiàn)的群體智慧更多的是涵蓋了貼近人們的日常生活信息。
由圖9可知,各個(gè)節(jié)點(diǎn)之間連邊的粗細(xì)可以反映兩個(gè)知識(shí)單元之間的關(guān)聯(lián)關(guān)系的緊密程度,如“群體免疫”與“疫苗”兩個(gè)節(jié)點(diǎn)之間的連邊較粗,表明這兩個(gè)知識(shí)單元之間的關(guān)聯(lián)關(guān)系較為緊密:在新冠疫情重大突發(fā)公共衛(wèi)生事件背景下,英國政府提出的群體免疫引發(fā)了很大爭議,社交媒體上的言論表明了公眾對(duì)英國采取不需要醫(yī)療部門參與的群體免疫政策主要持批判性態(tài)度,認(rèn)為這將是一場不負(fù)責(zé)任的“屠殺”,在突發(fā)公共衛(wèi)生事件輿情環(huán)境下涌現(xiàn)出的群體智慧認(rèn)為,通過疫苗的研發(fā)與科學(xué)的治療才能實(shí)現(xiàn)群體免疫。又如,“病毒”與“變異”兩個(gè)節(jié)點(diǎn)之間連邊權(quán)重為34(即這兩個(gè)知識(shí)單元共同出現(xiàn)的頻次為34),為了進(jìn)一步動(dòng)態(tài)跟蹤突發(fā)公共衛(wèi)生事件輿情環(huán)境中大眾對(duì)這兩個(gè)知識(shí)單元的認(rèn)知過程,本研究結(jié)合第3.1節(jié)提取出的三元組集合來追蹤“病毒”與“變異”兩個(gè)知識(shí)單元之間的具體關(guān)聯(lián)關(guān)系,如表3所示。研究結(jié)果發(fā)現(xiàn),在突發(fā)公共衛(wèi)生事件輿情討論環(huán)境下公眾的知識(shí)條目并不是固定不變的,公眾的認(rèn)知在事件的發(fā)展和公眾的交流過程中存在轉(zhuǎn)變,甚至是完全否定的變化過程。如在輿情討論初期,t2和t3時(shí)間窗口下,公眾所涌現(xiàn)出的知識(shí)條目認(rèn)為新冠病毒不會(huì)發(fā)生變異;隨著時(shí)間窗口的滑動(dòng),在t24時(shí)間窗口下,公眾對(duì)所涌現(xiàn)出的“病毒不會(huì)變異”的知識(shí)條目產(chǎn)生了質(zhì)疑;在后期,公眾的認(rèn)知發(fā)生轉(zhuǎn)變認(rèn)為該病毒會(huì)發(fā)生變異,甚至病毒變異速度將加快。
表3 時(shí)間序列下“病毒”與“變異”知識(shí)單元關(guān)聯(lián)關(guān)系變化
三元組作為知識(shí)圖譜常用的知識(shí)表示方法,可以描述真實(shí)世界中存在的各種實(shí)體或概念及其復(fù)雜聯(lián)系。因此,在探究“如何表征突發(fā)公共衛(wèi)生事件的輿情環(huán)境下的群體智慧”問題時(shí),本研究利用三元組表示突發(fā)事件輿情信息中所包含的公眾的知識(shí)條目,即以所提取的知識(shí)三元組集合來表征突發(fā)公共衛(wèi)生事件輿情環(huán)境下公眾的群體智慧,進(jìn)而展開研究?;谳浨橹R(shí)三元組、網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)來分析群體智慧的涌現(xiàn)是否存在某種規(guī)律,本研究得出以下突發(fā)公共衛(wèi)生事件輿情環(huán)境下的群體智慧涌現(xiàn)的規(guī)律特征。
(1)群體智慧涌現(xiàn)不僅貫穿于突發(fā)公共衛(wèi)生事件與網(wǎng)絡(luò)輿情演變的全周期,而且其對(duì)于群體智慧的表達(dá)與演變的貢獻(xiàn)也要高于長期的知識(shí)積累。隨著突發(fā)公共衛(wèi)生事件的演變,群體智慧在較長時(shí)間的平緩且微量的積累后,會(huì)突現(xiàn)短暫的大幅增長。在突發(fā)事件輿情環(huán)境下群體智慧的分布明顯存在重尾現(xiàn)象,即大多微博(或評(píng)論)含有較少的知識(shí)三元組,從少量微博(或評(píng)論)可以提取出較多的知識(shí)三元組。公眾在突發(fā)事件輿情形成的過程中,傾向于參加評(píng)論形式下的討論,但其所含知識(shí)密度較低,群體智慧的涌現(xiàn)主要集中在微博內(nèi)容中。
(2)突發(fā)事件輿情環(huán)境下的群體智慧涌現(xiàn)過程中具有小世界性和稀疏性的特征。相對(duì)于同等規(guī)模的隨機(jī)網(wǎng)絡(luò),輿情知識(shí)網(wǎng)絡(luò)的巨分支具有較高聚類系數(shù)、較短特征路徑長度的小世界性。輿情知識(shí)網(wǎng)絡(luò)的巨分支涵蓋知識(shí)節(jié)點(diǎn)以及知識(shí)關(guān)聯(lián)關(guān)系的數(shù)量比例遠(yuǎn)小于領(lǐng)域知識(shí)網(wǎng)絡(luò),核心知識(shí)單元的數(shù)量以及比重并不多,這說明在突發(fā)公共衛(wèi)生事件的輿情環(huán)境中,大眾通過社交媒體進(jìn)行交流、討論,在一定程度上促進(jìn)了群體智慧的涌現(xiàn),但是所涌現(xiàn)的知識(shí)較為分散、稀疏,體現(xiàn)了大數(shù)據(jù)低價(jià)值密度的特點(diǎn)。
(3)在突發(fā)事件輿情環(huán)境下的群體智慧涌現(xiàn)過程中,知識(shí)條目具有動(dòng)態(tài)屬性,知識(shí)單元存在核心-邊緣結(jié)構(gòu)。隨著突發(fā)公共衛(wèi)生事件的發(fā)展,公眾在討論過程中所涌現(xiàn)的知識(shí)條目會(huì)存在被質(zhì)疑、被否定的情況,即群體認(rèn)知會(huì)發(fā)生轉(zhuǎn)變。輿情知識(shí)網(wǎng)絡(luò)的巨分支具有層次結(jié)構(gòu),知識(shí)單元存在核心與邊緣之分,處于核心地位的知識(shí)單元至少與網(wǎng)絡(luò)子群中其他7個(gè)核心知識(shí)單元存在直接關(guān)聯(lián)。
本研究所得出的分析結(jié)論,不僅豐富了對(duì)突發(fā)公共事件輿情環(huán)境下大眾行為研究的理論與方法,而且也有助于應(yīng)急管理部門及時(shí)了解并引導(dǎo)輿情未來發(fā)展,防止事態(tài)蔓延與升級(jí)。另外,本研究工作也存在有待完善的方面,所選擇的數(shù)據(jù)源尚不能窮盡所有類型的突發(fā)事件。因此,在未來的研究中將進(jìn)一步采集更加全面豐富的數(shù)據(jù)資源,從多個(gè)角度對(duì)突發(fā)事件情景下的群體智慧涌現(xiàn)問題進(jìn)行深入研究與探索。
致謝感謝圖書情報(bào)國家級(jí)實(shí)驗(yàn)教學(xué)示范中心為本研究提供的實(shí)驗(yàn)支持!