亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于微博網(wǎng)絡爬蟲的巴黎圣母院大火輿情分析

        2019-11-13 09:25:52周義棋田向亮鐘茂華
        關鍵詞:巴黎圣母院大火發(fā)文

        周義棋,田向亮,鐘茂華

        (1.清華大學 工程物理系,北京 100084;2.清華大學 公共安全研究院,北京 100084)

        北京時間2019年4月16日凌晨,法國巴黎標志性建筑巴黎圣母院突發(fā)大火。大火造成巴黎圣母院塔尖倒塌,建筑毀損嚴重。社交媒體的流行,迅速讓世界各個角落的人們目睹了這場災難。得知消息后,人們很快通過微信、論壇、微博等社交媒體發(fā)送大量與巴黎圣母院大火事件相關的信息、照片和視頻。

        隨著網(wǎng)絡技術的推廣,網(wǎng)絡輿情分析越來越多地被應用于各類突發(fā)事件。網(wǎng)絡輿情分析有助于掌握民眾情感動態(tài),為政府及官方媒體引導輿論走向提供參考。在自然災害研究方面,劉雯等[1]將情感分析和時序分析引入到災害網(wǎng)絡輿情分析中,總結(jié)了網(wǎng)民情感波動的因素,預測了不同情感的輿情走勢;崔滿豐[2]通過我國網(wǎng)民對尼泊爾地震的關注度、觀點和態(tài)度,分析了中國網(wǎng)民對尼泊爾地震的情感發(fā)展變化和輿論走向。在事故災難研究方面,張展[3]通過對網(wǎng)絡輿論的持續(xù)監(jiān)測,對“7·23”動車事故發(fā)生后各媒體發(fā)布信息的時間和數(shù)量變化進行了探析;MA等[4]從輿論傳播來源和傳播規(guī)律兩方面研究了網(wǎng)絡輿論在大型火災災害中的作用。在公共衛(wèi)生事件研究方面,王心瑤等[5]采用百度指數(shù)和新浪微輿情系統(tǒng)對比分析了2013年和2017年H7N9事件網(wǎng)絡輿情的演變情況;盧文剛等[6]收集人民網(wǎng)輿情監(jiān)測系統(tǒng)公布的數(shù)據(jù),從發(fā)展趨勢、媒介分布、輿情走勢、地域分布、輿情話題分析了山東省非法疫苗事件。

        目前,網(wǎng)絡輿情分析的主要手段是通過網(wǎng)絡爬蟲等數(shù)據(jù)挖掘方法,從微博、微信、論壇等媒體平臺獲取輿論信息,采用量化分析、情感特征提取、關鍵詞聚類等方法對輿情信息進行處理。李世豪等[7]通過Python爬蟲在微博上爬取中美貿(mào)易相關的輿情數(shù)據(jù),運用量化研究方法對傳播內(nèi)容和用戶進行了分析,研究表明民間輿論逐漸趨于理性與成熟;卞增惠等[8]使用新浪輿情通系統(tǒng)對南京市流感相關輿情進行監(jiān)測,采用描述流行病學方法對資料進行分析,有效回應了公眾意愿和訴求,引導了輿情平穩(wěn)發(fā)展;HAN等[9]以新浪微博為載體,研究了2018壽光水災相關輿情信息的時空分布及其內(nèi)容,并探討了壽光水災期間的公眾情緒;金占勇等[10]運用全面數(shù)據(jù)分析法,以微博數(shù)據(jù)為主要樣本,對鹽城龍卷風事件的網(wǎng)絡輿情傳播進行了實證研究;孫帥等[11]以“北京發(fā)布”在“7·21”北京特大暴雨期間發(fā)布的相關微博為數(shù)據(jù)樣本,探討了政務微博如何引導突發(fā)事件網(wǎng)絡輿情走勢。此外,一些外國學者以Twitter、Facebook等為輿論載體,分析網(wǎng)絡輿情以掌握公眾的情緒。如CODY等[12]采集Twitter上含“氣候”一詞的推文,通過情感分析探討了公眾情緒隨氣候和自然災害的變化情況;KARAMI等[13]提出了基于Twitter的輿情分析框架,用于了解災害發(fā)生時的公眾情緒,可為決策提供參考;DOAN等[14]和SHIBUYA等[15]分別搜集了Twitter和Facebook信息,分析了2011年日本地震和海嘯后公眾的情緒。

        筆者以新浪微博為輿論載體,基于網(wǎng)絡爬蟲采集巴黎圣母院大火事件的輿情數(shù)據(jù),運用量化分析和詞頻分析等方法,探討我國民眾對巴黎圣母院大火事件的輿論關注程度以及輿情信息的地域分布與情感走向。

        1 研究方法

        1.1 輿情信息獲取平臺

        微博是基于用戶關系的社交媒體平臺,用戶可以通過PC、手機等多種移動終端接入,以文字、圖片等多媒體形式,實現(xiàn)信息共享。新浪微博現(xiàn)已成為我國最受關注的社交媒體之一,根據(jù)新浪微博數(shù)據(jù)中心發(fā)布的《2018微博用戶發(fā)展報告》顯示,微博月活躍用戶達4.62億。熱點事件發(fā)生時,微博發(fā)文數(shù)有著增長快、數(shù)據(jù)量大的特點。爬取新浪微博的數(shù)據(jù)進行分析,其結(jié)果具有一定的代表性。此外,微博提供了高級搜索功能,可以根據(jù)需要按照指定關鍵詞,在指定時間范圍內(nèi)對指定地區(qū)(指用戶資料中填寫的所在地)的微博用戶發(fā)送的博文進行檢索,這為采集輿情信息提供了方便。

        1.2 輿情信息采集工具

        輿情信息采集的工具為“八爪魚”?!鞍俗︳~”是一款網(wǎng)絡爬蟲軟件,可以識別各種網(wǎng)頁元素,實現(xiàn)打開網(wǎng)頁、翻頁、頁面滾動、采集元素文本等功能。簡而言之,“八爪魚”可以模擬人的操作進行網(wǎng)頁的瀏覽和批量保存指定的文本數(shù)據(jù),做到了眼見即可采,可以滿足一定時間范圍內(nèi)微博發(fā)文數(shù)據(jù)的采集。

        筆者所采用的數(shù)據(jù)來源于關鍵詞“巴黎圣母院大火”微博高級搜索,采集輿情信息的時間范圍為2019年4月16日0時到2019年4月17日24時,采集的信息內(nèi)容為用戶昵稱、發(fā)文內(nèi)容、發(fā)文時間等。最終獲取的數(shù)據(jù)為我國34個省級行政地區(qū)(包括臺灣、香港、澳門)以及海外/其他地區(qū)在每個小時內(nèi)的微博發(fā)文數(shù)量及其發(fā)文內(nèi)容。

        1.3 分析方法

        筆者使用的分析方法主要為對發(fā)文數(shù)量進行量化分析、對發(fā)文內(nèi)容進行詞頻分析。對發(fā)文數(shù)量進行量化分析的目的是獲取各個地區(qū)每小時內(nèi)微博上關于巴黎圣母院大火的所有發(fā)文數(shù)量,以便繪制出發(fā)文數(shù)量隨著時間變化的曲線及輿情信息的地域分布。但是在微博上,若某地區(qū)一個小時內(nèi)發(fā)文數(shù)量超過50頁內(nèi)容,超出的部分內(nèi)容將被隱藏而導致無法采集,這就需要對被隱藏的信息數(shù)量進行一個估計。

        為了方便描述,首先做以下定義:

        (1)一小時內(nèi)微博信息總量Si等于各個地區(qū)該小時內(nèi)的信息總數(shù)量之和,如式(1)所示;某地區(qū)微博信息總量Sj等于該地區(qū)各個小時內(nèi)的信息總數(shù)量之和,如式(2)所示。

        (1)

        (2)

        式中:i表示4月16日0時至4月17日24時這48小時內(nèi)的任意一個小時;j表示我國34個省級行政地區(qū)(包括臺灣、香港和澳門)和海外/其他地區(qū)。

        (2)一小時內(nèi)某地的有效采集時間tij,eff為該小時內(nèi)采集到的信息所處的時間區(qū)間長度。一般情況下,tij,eff=60 min,若該地區(qū)一小時內(nèi)發(fā)文數(shù)量超過50頁內(nèi)容,則tij,eff可能小于60 min。

        (3)一小時內(nèi)某地的有效采集數(shù)量Sij,eff是指在有效采集時間tij,eff內(nèi)采集到的信息數(shù)量。

        (4)一小時內(nèi)某地的信息數(shù)量增長速率為vij,如式(3)所示。筆者假設在一個小時內(nèi)vij保持不變。

        (3)

        (5)一個小時內(nèi)某地的總發(fā)文數(shù)量Sij:

        Sij=60vij

        (4)

        以4月16日7時到8時北京的數(shù)據(jù)為例,在這一個小時內(nèi),北京用戶的發(fā)文數(shù)量超過50頁。在7:33—8:00期間,北京用戶發(fā)文數(shù)量達50頁,7:00—7:32之間的信息無法獲取。由于7時33分的信息也可能采集不全,取7:34-8:00為有效采集范圍,即t7-8,eff=26 min。在這26 min內(nèi),有效采集數(shù)量S7-8,eff=961,則對應的信息數(shù)量增長速率為:

        (5)

        那么,北京用戶在7時—8時的總發(fā)文數(shù)量估計為:

        S7-8=36.96×60≈2 218

        (6)

        以此類推,可以計算出全國34個省級行政地區(qū)和海外/其他地區(qū)每小時內(nèi)微博發(fā)文數(shù)量,從而通過求和計算出每小時的總發(fā)文數(shù)量以及每個地區(qū)的總發(fā)文數(shù)量。

        對發(fā)文內(nèi)容進行詞頻分析的目的是在輿論內(nèi)容中提取出現(xiàn)頻率相對較大的詞匯,從而獲取輿論的關注點與感情傾向。利用Python的jieba庫對發(fā)文內(nèi)容進行分詞,統(tǒng)計每個詞匯的出現(xiàn)頻次,并根據(jù)出現(xiàn)頻次從大到小對詞匯進行排列。

        2 結(jié)果分析

        2.1 熱度分析

        根據(jù)采集所得數(shù)據(jù),經(jīng)過數(shù)量統(tǒng)計發(fā)現(xiàn),4月16日當天,新浪微博關于巴黎圣母院大火總發(fā)文數(shù)量約為167 232條。4月17日,即大火發(fā)生后的第二天,微博發(fā)文總數(shù)量約為22 712條??梢妰H過一天,輿論熱度便大幅度降低。兩天內(nèi),微博平臺關于巴黎圣母院大火的發(fā)文數(shù)量隨著時間的變化關系如圖1所示。

        圖1 微博輿情信息時間分布

        巴黎圣母院大火發(fā)生于4月16日凌晨0點50分左右,微博上有關大火的首條博文是由海外博主“@Eventyra”在01:19時發(fā)送的博文:“惹巴黎圣母院著大火了…里面墻上那些畫啊”。而首條由官方認證賬號發(fā)送的博文,是由“@俄羅斯衛(wèi)星通訊社”于01時25分發(fā)送的博文:“據(jù)法新社周一報道,在巴黎的主要景點之一——巴黎圣母院發(fā)生火災”。由此可知,民眾網(wǎng)絡輿論信息的傳播可能早于官方信息。在大火發(fā)生后的一小時之內(nèi),便有1 849條有關大火的博文。而且此時處于凌晨,正是大多數(shù)人睡覺的時候,就已經(jīng)得到了不少的關注。這也預示著這將成為一件熱度極高的事件。

        4月16日早上的7時至10時,正值人們開始工作、學習的時間,人們看到消息后紛紛轉(zhuǎn)發(fā),這時達到發(fā)文和轉(zhuǎn)發(fā)的高峰期,每小時發(fā)文數(shù)迅速增長。7時—12時,每小時發(fā)文數(shù)便超過1萬條,其中8時和9時達到峰值,每小時發(fā)文數(shù)超過兩萬條,具體數(shù)值如表1所示。10時之后,每小時發(fā)文數(shù)便迅速下降。7時—15時期間,每小時發(fā)文數(shù)量超過5 000條,巴黎圣母院大火事件在這8小時里保持了最高的熱度。對比兩天數(shù)據(jù)可知,17日的輿情信息數(shù)據(jù)量遠遠不及16日,體現(xiàn)了網(wǎng)絡輿情傳播的即時性、高速爆發(fā)的特點。

        表1 4月16日和4月17日有關大火的輿情信息統(tǒng)計表

        2.2 地域分析

        將輿情信息按照地區(qū)進行數(shù)量統(tǒng)計,統(tǒng)計了我國34個省級行政地區(qū)(包括臺灣、香港、澳門)以及海外/其他地區(qū)的微博輿情信息數(shù)量情況,統(tǒng)計的范圍為4月16日與17日兩天的所有數(shù)據(jù),具體統(tǒng)計結(jié)果如表2所示。通過分析表2中數(shù)據(jù)可知,兩天內(nèi)發(fā)文數(shù)量最多的地區(qū)是北京,然后依次是廣東、江蘇、山東、浙江、上海等地,發(fā)文數(shù)量最少的地區(qū)是西藏。值得注意的是,大火發(fā)生后的兩天內(nèi),有3 069條來自海外微博用戶的發(fā)文,而這些海外用戶大多是華人華僑,可見中國人不管身處何處,都時刻關心世界上的大事,為巴黎圣母院突發(fā)大火感到震驚與惋惜。

        表2 微博輿情信息地域分布統(tǒng)計表

        注:“其他”表示該微博用戶沒有明確填寫用戶所在地

        輿情信息地域分布情況如圖2所示,可以看出發(fā)文數(shù)量較多的為首都北京以及東部沿海、東南部沿海地區(qū),我國中部地區(qū)也有著不少的發(fā)文數(shù)量。綜合表2和圖2數(shù)據(jù)可以得出,微博關于巴黎圣母院大火事件的輿情信息最多的地區(qū)為北京和廣東,其余主要分布在我國東部、中部和東南部地區(qū),而我國西南部、西北部地區(qū)關于巴黎圣母院大火事件的輿情信息數(shù)量則比較少。

        2.3 詞頻分析

        對微博用戶的發(fā)文內(nèi)容進行詞頻分析,獲取出現(xiàn)頻率相對較大的一些詞語,出現(xiàn)頻次排前10的詞語如圖3所示。

        圖3 詞頻分析柱狀圖

        其中“巴黎圣母院”、“大火”、“法國”、“塔尖”等詞跟事件直接相關,其高出現(xiàn)頻次亦在意料之中。此外,詞語“圓明園”的出現(xiàn)頻次相當高,表明有不少人由巴黎圣母院大火想到一百多年前的火燒圓明園。兩個事件都是文物受到了毀損,文明受到了創(chuàng)傷,但兩把火燒出的是不一樣的痛。不少人將兩件事情放到一起進行討論,這便是詞語“圓明園”出現(xiàn)頻率很高的原因。此外,在這10個詞當中,讓人感到比較陌生的是“卡西莫多”,但它也是這次事件中的熱詞之一,原因來自于人們的嘆息“卡西莫多失去了心愛的姑娘,終究也失去了他心愛的鐘樓”。

        2.4 情感分析

        在出現(xiàn)頻率較高的詞語當中,前10位都是對事件的客觀描述,這些詞語不具有感情色彩。若列出更多的詞頻分析結(jié)果,從中篩選出具有感情色彩的詞語,便能從一定程度上把握民眾的感情傾向。出現(xiàn)頻率較高而且具有感情色彩的詞語如表3所示。

        表3 具有感情色彩的詞語及其出現(xiàn)頻次

        由此可知,人們對巴黎圣母院大火事件的感情傾向主要分為2類:

        (1)心痛與惋惜?!巴锵А薄ⅰ翱上А?、“心痛”、“遺憾”等詞語的高頻率出現(xiàn),說明輿論對該事件的主流感情是心痛與惋惜。大多數(shù)人都對歷史文明受到損失感到悲痛。

        (2)祈愿。通過表3中數(shù)據(jù)可以得知,“希望”一詞高頻率出現(xiàn)。根據(jù)“希望”這個詞語檢索微博用戶的發(fā)文內(nèi)容可發(fā)現(xiàn),大多數(shù)人“希望大火造成的損失小一點”,“希望人類文明不要再受到摧殘”。官方微博賬號“@圓明園遺址公園”更是發(fā)聲:“衷心祈愿文物都能夠遠離災難,代代傳承?!?/p>

        除了表3中展示的詞語外,還有一些出現(xiàn)頻率較小的其他詞,比如“幸災樂禍”出現(xiàn)的頻次為3 469?!靶覟臉返湣边@一詞語主要出現(xiàn)在人們對于該現(xiàn)象的批評與譴責的評論中,真正表達出幸災樂禍態(tài)度的博文中不會包含該詞語。該現(xiàn)象表明仍然存在一些人在巴黎圣母院大火面前“拍手叫好”。甚至有人發(fā)文:“一百多年前你燒我園子,今天有人替我燒你院子”。同樣都是人類文明的瑰寶,同樣都是人類文明的損失,在巴黎圣母院大火面前,卻只是冷笑一聲,這樣的行為值得我們思考。

        官方微博賬號“@圓明園遺址公園”對巴黎圣母院大火事件發(fā)聲的時間是4月16日17時,通過對比官微發(fā)聲前后民眾的情感變化,可以分析官微在引導輿論走向上起到的作用。對官微發(fā)聲前后的微博內(nèi)容進行詞頻分析,以便了解民眾的情感變化,結(jié)果如圖4所示(柱狀圖表示詞語的出現(xiàn)次數(shù),折線圖表示出現(xiàn)次數(shù)與對應時間段內(nèi)發(fā)文總數(shù)量的比值)。

        圖4 官微發(fā)聲前后民眾的情感變化

        由圖4可知,在官微發(fā)聲之后,“可惜”和“心痛”兩詞的出現(xiàn)頻率相對而言略有減小,但程度不大,“惋惜”和“遺憾”兩詞的出現(xiàn)頻率幾乎不變。變化較為明顯的是“希望”和“幸災樂禍”,相比于官微發(fā)聲之前,出現(xiàn)頻率幾乎增長了一倍。

        “希望”一詞出現(xiàn)頻率的增加,表明多數(shù)的人贊成官方微博“@圓明園遺址公園”的觀點,祈愿文物都能遠離災難。而“幸災樂禍”一詞出現(xiàn)頻率的增加,反映了批評幸災樂禍行為的人增多。由此可知,官微“@圓明園遺址公園”發(fā)聲之后,民眾輿論中出現(xiàn)了更多的正向言論。以上分析說明官方微博能夠引導輿論的走向,在熱點事件當中,各官方微博應積極引導網(wǎng)絡輿情朝著正能量的方向發(fā)展。

        3 結(jié)論

        (1)民眾對巴黎圣母院大火事件頗為關注,僅一天之內(nèi),微博發(fā)文數(shù)量便超過16萬條。4月16日8時—10時之間是巴黎圣母院大火事件熱度最高的時期,7時—15時之間的發(fā)文數(shù)量均超過5 000條/h,該事件以極高的熱度維持了大約8 h,體現(xiàn)了輿情信息在短時間內(nèi)的爆發(fā)性。

        (2)微博關于巴黎圣母院大火的輿情信息主要分布在我國東部、中部、東南部地區(qū),其中北京、廣東用戶最多。此外,海外華人華僑也對巴黎圣母院大火事件有所關注。

        (3)輿論的主流傾向是對人類文明的瑰寶遭到損失表示心痛與惋惜,衷心祈愿文物都能遠離災難。巴黎圣母院大火事件為我國文化遺產(chǎn)敲響了警鐘,我國必須始終保持高度警惕,增強憂患意識,加大對文化遺產(chǎn)的保護力度。

        (4)官方微博賬號能夠引導輿論的走向。在熱點事件當中,官方微博的積極引導,有助于民眾輿論朝著正能量的方向發(fā)展。

        猜你喜歡
        巴黎圣母院大火發(fā)文
        巴黎圣母院的神秘石棺
        軍事文摘(2022年14期)2022-08-26 08:14:42
        巴黎圣母院之殤——紀念巴黎圣母院
        少兒美術(2020年10期)2020-11-05 09:01:22
        10條具體舉措! 山東發(fā)文做好返鄉(xiāng)留鄉(xiāng)農(nóng)民工就地就近就業(yè)
        拯救巴黎圣母院
        巴黎圣母院在2019年
        哈爾濱“8·25”大火 燒出了什么
        勞動保護(2019年3期)2019-05-16 02:37:48
        面對一場大火
        快樂語文(2018年7期)2018-05-25 02:31:55
        校園拾趣
        爺孫趣事
        以牙還牙
        黑人大群体交免费视频| 亚洲AV专区一专区二专区三| 国产大全一区二区三区| 在线观看 国产一区二区三区 | 亚洲中文字幕午夜精品| 18禁黄久久久aaa片| 在线视频99| 一区二区三区国产精品| 国产一区二区黄色的网站| 亚洲日韩国产欧美一区二区三区| 亚洲一区二区观看播放| 手机AV片在线| 美女脱掉内裤扒开下面让人插 | 亚洲乱码一区二区三区成人小说| 一区二区亚洲精美视频| 欧美高清精品一区二区| 国产av无码专区亚洲av极速版| 国产精品一区二区久久乐下载| 成年女人18毛片观看| 4455永久免费视频| 亚洲人成无码www久久久| 色yeye在线观看| 成人久久精品人妻一区二区三区| 国产午夜手机精彩视频| 国产人碰人摸人爱视频| 厕所极品偷拍一区二区三区视频 | 亚洲精品精品日本日本| 91九色成人蝌蚪首页| аⅴ资源天堂资源库在线| 538任你爽精品视频国产| 日产一区一区三区区别| 中文精品久久久久人妻不卡 | 久久人人做人人妻人人玩精| 日韩亚洲精选一区二区三区 | 一区二区无码中出| 日本高清一区二区三区不卡 | 国产盗摄xxxx视频xxxx| 在线观看亚洲AV日韩A∨| 五月综合丁香婷婷久久| 欧美成人www在线观看| 人人妻人人澡人人爽精品欧美|