齊 珉,齊文華,蘇桂武
(中國地震局地質(zhì)研究所,北京 100029)
中國互聯(lián)網(wǎng)信息中心(CNNIC)2019年發(fā)布的第43次《中國互聯(lián)網(wǎng)絡發(fā)展狀況統(tǒng)計報告》顯示:截至2018年12月,中國網(wǎng)民規(guī)模為8.29億,互聯(lián)網(wǎng)普及率達59.6%;網(wǎng)絡新聞用戶為6.75億,占網(wǎng)民總數(shù)的81.4%;微博用戶3.51億,占網(wǎng)民總數(shù)的42.3%[1]。隨著互聯(lián)網(wǎng)和移動通信技術的高速發(fā)展和日臻成熟,越來越多人通過網(wǎng)絡獲取新聞資訊,并在網(wǎng)絡上表達個人對于新聞事件的觀點、看法、情感態(tài)度等。網(wǎng)絡的開放性、便利性、互動性等特點促使其成為輿情孕育、產(chǎn)生、變化和消亡的承載平臺,網(wǎng)絡輿情應運而生[2]。關于網(wǎng)絡輿情的概念,不同學科領域?qū)W者有不同的見解,但都體現(xiàn)了網(wǎng)絡空間、多元化的生成模式和傳播路徑等共性特征[3-5]。本文將討論地震災害網(wǎng)絡輿情方面的研究,主要關注網(wǎng)絡平臺/空間上傳播的多元主體對地震災害事件的相關報道、態(tài)度、情感和行為傾向等。因此,這里將地震災害網(wǎng)絡輿情界定為由公眾(包括個人和各種社會群體)、各類媒體和政府機構(gòu),由于地震事件的刺激而產(chǎn)生,通過互聯(lián)網(wǎng)傳播的對于該地震事件的所有認知、態(tài)度、情感和行為傾向的集合。
微博是在Web2.0上興起的一個基于用戶關系的信息分享和傳播平臺,用戶可以通過WEB、WAP以及各種客戶端組建個人社區(qū),以140字左右的文字更新信息,并實現(xiàn)即時分享。微博的實時性、互動性、強擴散性等特點,特別是地震等重大災害性事件發(fā)生后,大量用戶在微博平臺上發(fā)表言論,使得網(wǎng)絡輿情成為反映災害特征、社會行為活動、公眾情感傾向等的重要數(shù)據(jù)源。及時、充分地挖掘和分析地震災害網(wǎng)絡輿情信息,不僅能快速了解災區(qū)災情特征,還能及時把握社會各層次主體對具體地震事件的關注點等,對于政府進行輿情監(jiān)測和引導具有十分重要的意義。新浪微博是由新浪網(wǎng)于2009年推出的提供微型博客服務的類Twitter網(wǎng)站,是當前中國用戶數(shù)最多、活躍度最高的微博產(chǎn)品。本文在簡要綜述中國學者針對地震災害網(wǎng)絡輿情相關研究的基礎上,以2017年四川九寨溝7.0級地震為例,基于新浪微博數(shù)據(jù),重點分析了微博用戶對于此次地震事件表現(xiàn)出的情感傾向特征,總結(jié)了影響用戶情感波動的主要因素。
快速、動態(tài)、準確地獲取震后災情信息是地震應急工作的關鍵之一;震后快速產(chǎn)生的地震相關網(wǎng)絡輿情數(shù)據(jù)可為獲取災情信息提供一種途徑。一方面,地震災害網(wǎng)絡輿情中含有大量災情相關的文本、圖片和視頻信息,如人和各類器物的反應、房屋破壞、生命線破壞等等;另一方面,網(wǎng)絡輿情的實時性也可滿足災情信息的快速和動態(tài)獲取。因此,充分挖掘地震災害網(wǎng)絡輿情中的災情數(shù)據(jù),可為地震應急決策提供有效的輔助。胡素平等[6]、帥向華等[7-8]構(gòu)建了網(wǎng)絡地震災情信息智能獲取和處理模型,通過對互聯(lián)網(wǎng)上2008年汶川地震災情信息的獲取和處理,快速估計了汶川地震的有感范圍,并實現(xiàn)了利用網(wǎng)絡地震災情信息進行地震烈度判定。2013年四川蘆山7.0級地震后,這方面的研究引起了相關學者和地震行業(yè)人員的高度關注,之后歷次破壞性地震都有相關論文發(fā)表?;诨ヂ?lián)網(wǎng)網(wǎng)站數(shù)據(jù)的主要研究有:張穎等介紹了四川省輿情監(jiān)控系統(tǒng)在蘆山地震中的應用,由該系統(tǒng)產(chǎn)出的輿情簡報為地震應急指揮系統(tǒng)和災情上報系統(tǒng)提供了重要的災情信息補充[9];張方浩等制定了互聯(lián)網(wǎng)地震災情信息分類編碼規(guī)則,以2014年云南魯?shù)?.5級地震為例,利用互聯(lián)網(wǎng)地震災情信息生成了災區(qū)范圍和受災程度分布圖[10]?;谛吕宋⒉┑壬缃幻襟w數(shù)據(jù)的主要研究有:徐敬海等[11]、褚俊秀等[12]發(fā)展了一套基于位置微博的地震應急災情提取方法,分別以2014年云南永善5.0級地震和2014年云南魯?shù)?.5級地震為例,實現(xiàn)了微博地震災情的快速提取與展示;曹彥波等[13-15]通過調(diào)用新浪微博API,獲取了2014年云南景谷6.6級地震、2017年四川九寨溝7.0級地震和2018年云南通海5.0級地震的災區(qū)范圍內(nèi)微博輿情信息,分析了上述地震相關微博數(shù)據(jù)所反映的災情時空演變特征,其結(jié)果為救災決策部署提供了宏觀參考。上述研究表明,基于網(wǎng)絡輿情數(shù)據(jù),尤其是移動/手機微博信息,快速、動態(tài)挖掘和分析地震災情信息正逐漸成為相關學者和地震行業(yè)人員的研究熱點,并得到了初步的應用;但仍需借助計算機技術和語義分析等其他學科的成熟技術方法,進一步深入和細化相關提取結(jié)果,為地震應急工作提供更加及時、準確和動態(tài)的災情信息。
網(wǎng)絡輿情主題演化是一個周期性的過程,但隨時會受到周圍環(huán)境擾動,而產(chǎn)生動態(tài)變化,且這種變化具有隨機性、衍生性、難預測性。因此,隨著事件的發(fā)展及時識別網(wǎng)絡輿情的主題及其關鍵節(jié)點,一方面有助于深化對網(wǎng)絡輿情的認知,更好地掌握網(wǎng)絡輿情的演化動態(tài),另一方面有助于實現(xiàn)網(wǎng)絡輿情的及時疏導。對于地震災害而言亦是如此。地震發(fā)生后,海量的網(wǎng)絡輿情中,除上述震情、災情信息外,還含有數(shù)量龐大的以社會行為為主題的相關信息,以及大量衍生信息,如社會捐助、尋人、祈福、災區(qū)需求、謠言、質(zhì)疑等主題的信息。關于這方面的研究,有學者主要關注地震災害網(wǎng)絡輿情的主題提取方法,如王昊等利用HITS算法對日本“3·11”地震發(fā)生后一周內(nèi)爬取的新浪微博數(shù)據(jù)進行事件分析,得到每日的主題詞[16];蘇曉慧等提出了一種改進的TF-PDF算法,通過發(fā)布微博的博主影響力以及微博的關注度確定地震主題特征項的權重,從而獲得地震信息的熱門主題詞,并以2013年四川蘆山7.0級地震和2012年云南彝良5.7級地震的微博信息為例進行了對比研究[17]。有學者主要研究了地震災害網(wǎng)絡輿情的主題/議題演進,如李紫薇等以2017年四川九寨溝7.0級地震網(wǎng)絡輿情為例,基于Matlab軟件擬合的地震輿情周期和Gephi軟件繪制的地震輿情可視化云圖,利用網(wǎng)絡結(jié)構(gòu)分析了該次地震網(wǎng)絡輿情話題的演進規(guī)律[18];劉麗群等以2010年青海玉樹7.1級地震、2013年四川蘆山7.0級地震和2014年云南魯?shù)?.5級地震中的微博輿情為例,借助內(nèi)容分析法,通過主題類目構(gòu)建和分析,研究了3次地震災害網(wǎng)絡輿情的主題演進[19];崔滿豐分析了國內(nèi)不同區(qū)域網(wǎng)絡用戶對2015年尼泊爾8.1級地震熱點事件的關注程度和輿論走向[20]。也有學者就地震災害網(wǎng)絡輿情中的某個或幾個特定主題的產(chǎn)生、發(fā)展和消亡開展研究,其中,以地震相關謠言為主題的研究居多,如余歡歡[21]、韓國良等[22]、秦琦瑯[23]、徐昕等[24]借助不同震例中出現(xiàn)的地震微博謠言,詳細探討了微博等新媒體網(wǎng)絡社交平臺中,地震相關謠言傳播的特點及傳播的生成動因和防范與解決措施。及時動態(tài)識別地震災害網(wǎng)絡輿情的各類主題,分析其演化規(guī)律,并針對性加以引導,對于災后應急救援工作也至關重要。當前,開展地震災害輿情演化與監(jiān)測方面研究的人員多為新聞傳播學或信息與情報學背景的學者,亟需地震行業(yè)或應急管理方面研究人員的介入,以從災害學視角深入理解地震網(wǎng)絡輿情的演化和應對。
情感分析是對帶有情感色彩的主觀性文本進行分析、處理、歸納和推理的過程[25]。新媒體為社會各層次主體提供了自由發(fā)表觀點/見解和充分表達情感/情緒的廣闊平臺,也為地震災害社會影響與響應議題注入了新的內(nèi)容,分析了解這些內(nèi)容有助于掌握相關的網(wǎng)絡輿情演化情況,為輿情監(jiān)測、引導和應對等提供科學支持。劉雯等以2013年四川蘆山7.0級地震為例,基于新浪微博博文內(nèi)容,通過情感分析與時間序列聯(lián)合建模的方法,對此次地震中各類輿情情感走勢進行分析,為災后情報服務和應急管理提供建議[26];沙勇忠等仍以蘆山地震為例,借助微博數(shù)據(jù)情感分析,研究了震后紅十字會的公眾信任問題,揭示了網(wǎng)民情感與公眾信任存在映射關系,可將網(wǎng)民情感作為公眾信任的測度工具和診斷手段[27];Cheng等以2011年日本東部9.0級大地震為例,調(diào)查了社會媒體如何影響人們對災難的看法,及其在災后恢復活動方面的行為意圖,分析了人們對災難感知產(chǎn)生的不同影響[28];Li等獲取了2011年日本地震和2010年海地地震的Twitter數(shù)據(jù),基于情感詞典分析了隨著時間的推移人們在地震中的情感反應特征[29]。
除上述3個方面,不同學者還從多個角度開展了地震災害網(wǎng)絡輿情研究,但整體而言系統(tǒng)性不強。如,張群燕等[30]、蘇曉慧等[31]利用微博平臺用戶群大、公眾參與性強和實時性等特點,以四川蘆山地震為例,嘗試了在網(wǎng)絡微博平臺中及時提取地震前后宏觀異常信息,結(jié)果表明,微博信息可以作為地震宏觀異常信息的一個及時來源,有助于發(fā)揮群測群防在防震減災工作中的作用;楊菁等以四川蘆山地震為例,采用內(nèi)容分析法,探索了重大突發(fā)事件中微博輿情結(jié)構(gòu)和應急反應特征[32];張芝霞等[33]、車玥[34]定性論述了微博類新興網(wǎng)絡自媒體在地震應急處置工作中的作用,如廣泛調(diào)動社會力量參與應急救援、有力推動線下活動等。類似研究也說明了地震災害網(wǎng)絡輿情包含了多方面、多層次的相關信息,如能從多個角度對其進行深入和細致地挖掘和分析,得到的結(jié)果將會為地震應急救援、社會影響分析、甚至恢復重建提供關鍵支持。
綜上所述,由于目前地震災害網(wǎng)絡輿情傳播的覆蓋面及社會影響日益擴大,其既能夠及時提供一些災區(qū)災情或救助需求信息,同時也會存在一些負面因素,影響應急救災工作及災區(qū)社會秩序,因此及時地收集、分析和管理地震災害網(wǎng)絡輿情,可為多視角、多主體地震災害響應提供必要的信息補充,這對于減少自然災害損失和維護社會穩(wěn)定具有重要意義。需要說明的是,本文所列文獻只是網(wǎng)絡輿情在地震災害中的相關研究,且不全面;即便如此,仍能反映出網(wǎng)絡輿情在助力地震災害減災救災工作方面的巨大潛力。因此,今后如能充分借助數(shù)據(jù)挖掘等先進技術和借鑒傳播學等相鄰學科對于網(wǎng)絡輿情的理論和實踐研究,將大力提升網(wǎng)絡輿情在減輕地震災害方面的作用。
2017年8月8日21時19分四川省九寨溝縣發(fā)生7.0級地震(33.20°N,103.82°E),共造成25人死亡,525人受傷(截至8月13日20時)[35]。震中九寨溝縣是全球著名旅游景點九寨溝景區(qū)所在地;震時又恰逢暑期,國內(nèi)外大量游客聚集,該次地震得到社會各界的高度關注。微博用戶亦是如此,騰訊微博熱搜榜顯示:至8月9日熱搜榜前十均為該次地震相關信息。除該次地震的震情災情信息外,大量微博用戶發(fā)布了對該次地震相關議題的評論、觀點等輿情信息,蘊含了豐富的情感內(nèi)容。分析這些富有情感信息的觀點、評論和見解有助于掌握相關的網(wǎng)絡輿情演化情況,為輿情監(jiān)測、引導和應對等提供科學支持。在前人研究成果的基礎上,本文以四川九寨溝7.0級地震為例,以新浪微博博文內(nèi)容為數(shù)據(jù)來源,分析了微博用戶對于此次地震事件表現(xiàn)出的情感傾向特征。
采用網(wǎng)絡爬蟲技術[36-37]和調(diào)用新浪微博應用程序接口[15,38]是獲取新浪微博內(nèi)容的2種常用方法。本文以“九寨溝地震”為話題關鍵詞,采用Python語言編寫網(wǎng)絡爬蟲,獲取了此次九寨溝地震震后7天(即2017年8月8日震后至8月14日)的新浪微博博文數(shù)據(jù)。
上述通過網(wǎng)絡爬蟲技術直接獲取的新浪微博數(shù)據(jù)存在重復、無效的信息和異常符號,如同一用戶發(fā)布的多條內(nèi)容相同的博文、各種廣告信息、特殊符號或句子內(nèi)空格等。這些重復或無效信息會對博文情感分析的有效性造成影響,因此需要去除。同樣采用Python語言編程進行數(shù)據(jù)去重,刪除重復、無效和異常數(shù)據(jù),將預處理后的數(shù)據(jù)存儲為csv格式,最終得到用于“九寨溝地震”情感分析的新浪微博博文4 256條。
本文從博文數(shù)量的時間變化特征、博文詞頻特征和博文發(fā)文者區(qū)域特征3個方面簡述了九寨溝地震震后新浪微博數(shù)據(jù)特征。
2.2.1 博文數(shù)量的時間變化特征
九寨溝地震震后7天微博發(fā)布數(shù)量的時間變化特征如圖1所示。震后當天和第2天(即8月8日和8月9日)是微博發(fā)布的高峰期,相關微博發(fā)布數(shù)量總計達2 604條,占總數(shù)的61%;其中,在8月9日達到頂峰。之后,隨時間推移,微博發(fā)布數(shù)量逐漸減少,微博用戶對該次地震事件的關注度降低,但在震后第7天(即8月14日)出現(xiàn)小幅度反彈。分析相關博文發(fā)現(xiàn),小幅度反彈與九寨溝景區(qū)自然景觀恢復有關—“8月13日,中科院成都山地災害與環(huán)境研究所專家陳曉清對九寨溝景區(qū)實地勘察發(fā)現(xiàn),包括五花海、金鈴海、鏡海等許多海子的水,幾乎已經(jīng)跟地震前一樣?!?。該條微博首先由“四川日報”在微博平臺發(fā)布,并引起不少微博用戶關注。
圖 1 九寨溝地震震后7天新浪微博發(fā)布數(shù)量分布圖
2.2.2 博文詞頻統(tǒng)計特征
利用Python的jieba庫對上述4 256條博文進行中文分詞和詞頻統(tǒng)計,詞頻超過100的詞語如表1所示。
表1所列新浪微博博文高頻詞不僅直接反映了九寨溝地震,如“地震”、“九寨溝”、“四川”的詞頻均過千,更涵蓋了此次地震造成的社會影響和各主體的響應。社會影響方面有“受傷”“遇難”“生活”“震后”等;社會響應方面有“救援”“應急”“撤離”“祈福”“宣傳”“捐款”等,既有政府的響應又有社會組織和社會公眾的行動?!坝慰汀薄熬皡^(qū)”等高頻詞則反映出景區(qū)游客是此次地震的主要受災群體之一。
2.2.3 博文區(qū)域分析
圖2顯示了不同地區(qū)微博用戶針對九寨溝地震事件的發(fā)博數(shù)量。從圖2可以看出,九寨溝地震災區(qū)所在的四川微博發(fā)布數(shù)量最高;北京作為各類國家級地震科研和業(yè)務部門、各大媒體所在地,是高活力城市,來自該地區(qū)的微博數(shù)量僅次于四川;而其他發(fā)博數(shù)量較多的省份多為東部經(jīng)濟較發(fā)達地區(qū),如廣東、江蘇、山東、福建、上海、浙江、湖北等。值得注意的是,海外微博用戶對該次地震也表現(xiàn)出很高的關注度。
本文使用沈陽教授團隊開發(fā)的Rost CM軟件進行九寨溝地震相關新浪博文情感傾向分析[26]。Rost CM軟件是一款開源的文本挖掘工具,可以實現(xiàn)文本或其他形式內(nèi)容的情感分析、聚類分析、語義網(wǎng)絡和社會網(wǎng)絡分析等。該工具利用語義詞典將情感詞分類,構(gòu)建了詞語權重詞典、自定義的否定詞詞典、程度詞詞典和感嘆詞詞典;對待分析文本的每一個子句計算權重,將所有權重相加得到整句或整個文本的情感指數(shù)。Rost情感分析工具可以將博文情感分成積極、中立和消極3類,其定義的各類情感值區(qū)間分別為:積極情緒(5,+∞)、中性情緒[-5,5]和消極情緒(-∞,-5)。該工具交叉檢驗的結(jié)果表明其微博情感值計算準確率達到80.6%。
表 1 九寨溝地震新浪微博輿情詞頻統(tǒng)計表
圖 2 九寨溝地震新浪微博博文區(qū)域分布
將上述預處理后的4 256條微博數(shù)據(jù)導入Rost情感分析工具,計算得到每條博文的情感值(圖3),并統(tǒng)計3類博文情感傾向的結(jié)果如表2所示:在抓取到的7天微博數(shù)據(jù)中,表達積極情緒的占了最大比例,為75.30%,表明網(wǎng)友對于九寨溝地震事件整體情緒是趨于積極的。
圖 3 九寨溝地震新浪微博輿情網(wǎng)民情感值分布及情感極性統(tǒng)計
表 2 九寨溝地震新浪微博輿情網(wǎng)民情感極性統(tǒng)計表
中性情感博文所反映的網(wǎng)民情感不明顯,因此本文只對積極和消極的博文內(nèi)容進行分析。此外,單純轉(zhuǎn)發(fā)的博文不計入分析范圍。通過對九寨溝地震發(fā)生后抓取的7天微博文本內(nèi)容的分析,將表達積極情緒的微博分為4類(圖4),分別是表達祝福、災后救援、災后重建、其他。
通過對九寨溝地震相關積極情感的微博內(nèi)容分析,發(fā)現(xiàn)網(wǎng)民主要針對災后救援、災后重建等信息發(fā)表了自己的觀點;當然,還有相當一部分網(wǎng)民在地震發(fā)生后表達了自己對受災群眾的祝福和希望。整體來看,在積極博文中,表達祝福這一類積極文本占最大比例,為29%;其次是災后救援和針對災后重建工作發(fā)表的觀點,分別是23%和7%。這主要是因為本次研究選取的是震后7天的數(shù)據(jù),所以對于災后重建的內(nèi)容會比較少,而實時的關注和祈福是最多的微博內(nèi)容,同時人們也十分關注災后的救援。
圖 4 九寨溝地震新浪微博中積極博文內(nèi)容的分類及占比
通過對九寨溝地震發(fā)生后抓取的7天微博文本內(nèi)容的分析,將表達消極情緒的微博分為5類(圖5),分別是緬懷悼念、政府公信力問題、對社會各界的質(zhì)疑、災后救援重建問題、其他。
圖 5 九寨溝地震新浪微博中消極博文內(nèi)容的分類及占比
分析九寨溝地震相關的消極情感的微博內(nèi)容可知,災后救援問題主要表現(xiàn)在應急效率、物資、醫(yī)療、志愿者、救援道路擁堵、防疫以及災后重建等方面;分析消極情感的微博內(nèi)容可知,對社會各界的質(zhì)疑主要包括對中國各地地震局、非營利機構(gòu)的作用和意義的質(zhì)疑;政府公信力問題主要包括面對災害應急管理政府存在不作為的現(xiàn)象、對政府的相關決策不信任、反對強制捐款、認為相關政府部門上報的災害損失數(shù)額過大,存在貪腐傾向。
地震等重大自然災害發(fā)生后,越來越多的民眾通過網(wǎng)絡來獲取和發(fā)布災情信息、表達個人觀點和情感等,產(chǎn)生海量的地震災害網(wǎng)絡數(shù)據(jù)。本文簡要概述了中國學者針對地震災害網(wǎng)絡輿情數(shù)據(jù)的相關研究,其多圍繞地震災情信息挖掘和分析、地震災害輿情演化與監(jiān)測、地震災害輿情情感分析3個大的方面。此外,不少學者還從多個角度開展了地震災害網(wǎng)絡輿情研究,但整體而言系統(tǒng)性不強?;谘芯空邚氖戮唧w工作視角,地震行業(yè)人員主要關注地震災害震情和災情提取,傳播學及管理學人員多重視地震災害輿情演化、監(jiān)測和輿情內(nèi)容情感分析。雖然本文所列文獻只是網(wǎng)絡輿情在地震災害中的相關研究,且不全面,但仍反映了網(wǎng)絡輿情在助力地震災害減災救災工作方面的巨大潛力。因此,今后如能充分借助數(shù)據(jù)挖掘等先進技術和借鑒傳播學、管理學等相鄰學科對于網(wǎng)絡輿情的理論和實踐研究,將大大提升網(wǎng)絡輿情在減輕地震災害方面的作用。
基于本文綜述,以2017年四川九寨溝7.0級地震為例,將從新浪微博獲取的該次地震7天內(nèi)的4 256條微博作為分析數(shù)據(jù),分析了社會民眾對于此次地震事件表現(xiàn)出的情感傾向特征。結(jié)果表明,對于此次九寨溝地震災害網(wǎng)民整體表現(xiàn)了積極的情緒:有75.30%的博文表現(xiàn)為積極情感傾向,17.95%表現(xiàn)為消極情感傾向。通過對積極和消極博文的內(nèi)容分析,初步總結(jié)影響網(wǎng)民情緒波動的主要因素有:政府有效響應、救援進度、政府公信力、媒體報道形式、其他衍生話題等。