亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于微博數(shù)據(jù)和情感分析法的臺(tái)風(fēng)“米克拉”災(zāi)情過(guò)程探測(cè)

        2021-04-13 07:50:12陳齊超林廣發(fā)梁春陽(yáng)黃瀟張明鋒陳鑫周星辰
        關(guān)鍵詞:博文災(zāi)情詞典

        陳齊超,林廣發(fā),2,3*,梁春陽(yáng),黃瀟,張明鋒,2,3,陳鑫,周星辰

        (1.福建師范大學(xué) 地理科學(xué)學(xué)院,福州 350007;2.福建省陸地災(zāi)害監(jiān)測(cè)評(píng)估工程技術(shù)研究中心,福州 350007;3.海西地理國(guó)情動(dòng)態(tài)監(jiān)測(cè)與應(yīng)急保障研究中心,福州 350007)

        0 引言

        臺(tái)風(fēng)災(zāi)害不僅影響范圍廣、破壞性強(qiáng),而且發(fā)生頻率高,是造成中國(guó)社會(huì)經(jīng)濟(jì)損失最嚴(yán)重的自然災(zāi)害之一[1]??焖?、準(zhǔn)確地了解災(zāi)害過(guò)程,獲取災(zāi)損信息和識(shí)別受災(zāi)區(qū)域,并以圖表形式進(jìn)行直觀展示,可為防災(zāi)減災(zāi)部門開展搶險(xiǎn)救援工作提供重要參考。微博作為一種社交媒介,已經(jīng)成為了人們記錄事件、分享現(xiàn)場(chǎng)、發(fā)表看法、宣泄情感的一個(gè)平臺(tái),大量、實(shí)時(shí)、廣域覆蓋的社交媒體信息充斥在網(wǎng)絡(luò)中[2]。對(duì)其中含有地理位置的微博文本進(jìn)行采集、信息抽取和分析,從而得到數(shù)據(jù)中包含的臺(tái)風(fēng)災(zāi)害相關(guān)事件發(fā)生的地理位置、時(shí)間和影響范圍,以及各種實(shí)時(shí)災(zāi)情信息,逐漸成為災(zāi)害大數(shù)據(jù)領(lǐng)域的一個(gè)研究熱點(diǎn)。這些信息可用于臺(tái)風(fēng)天氣過(guò)程跟蹤、災(zāi)害事件檢測(cè)、預(yù)警和災(zāi)情準(zhǔn)實(shí)時(shí)評(píng)估,對(duì)于災(zāi)害研究和防范、應(yīng)急救災(zāi)具有獨(dú)特的價(jià)值。

        近十年來(lái),國(guó)內(nèi)外學(xué)者對(duì)于含有時(shí)空信息的社交媒體數(shù)據(jù)在自然災(zāi)害領(lǐng)域的應(yīng)用研究方興未艾,其中一些熱點(diǎn)話題包括洪澇區(qū)域識(shí)別[3]、干旱風(fēng)險(xiǎn)管理[4]、火災(zāi)蔓延[5]、地震震情評(píng)估[6-7]、臺(tái)風(fēng)災(zāi)情評(píng)估[8]等。這些應(yīng)用的主要算法基礎(chǔ),包括文本主題模型和文本情感分析模型。文本主題模型抽取一段文本所包含的特征詞,并對(duì)文本集包含的所有特征詞進(jìn)行語(yǔ)義聚類,從而建立每個(gè)文本的主題概率分布矩陣,識(shí)別文本中所蘊(yùn)含的災(zāi)情相關(guān)的主題信息。如梁春陽(yáng)等綜合隱含狄利克雷分布 (Latent Dirichlet Allocation,LDA)主題模型和支持向量機(jī)模型將微博文本分為“災(zāi)情”“救援”等主題,實(shí)現(xiàn)對(duì)災(zāi)情信息的快速識(shí)別[9];蘇凱等采用Biterm主題模型(Biterm Topic Model,BTM)實(shí)現(xiàn)“災(zāi)害地點(diǎn)”相關(guān)信息的識(shí)別[10]。因此,通過(guò)主題模型能夠快速地識(shí)別蘊(yùn)含在文本中的災(zāi)情相關(guān)信息。文本情感分析模型主要思想是在災(zāi)害事件描述文本所反映的情緒類型及其強(qiáng)烈程度與災(zāi)情嚴(yán)重程度之間建立一種對(duì)應(yīng)關(guān)系。常見的情感分析方法有基于情感詞典的文本匹配、基于統(tǒng)計(jì)機(jī)器學(xué)習(xí)的方法和基于深度學(xué)習(xí)的方法?;谇楦性~典的方法是借助情感詞典,如HowNet情感詞典、NTUSD情感詞典、清華大學(xué)李軍中文褒貶義詞典、BosonNLP情感詞典等,結(jié)合句式對(duì)情感詞加權(quán)計(jì)算得到文本的情感值;基于統(tǒng)計(jì)機(jī)器學(xué)習(xí)的分類是提取語(yǔ)料文本特征通過(guò)樸素貝葉斯、支持向量機(jī)等分類模型訓(xùn)練文本情感分類器,使用文本分類器對(duì)未標(biāo)注標(biāo)簽的文本進(jìn)行情感分類;基于深度學(xué)習(xí)的方法是使用卷積神經(jīng)網(wǎng)絡(luò)、長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)等神經(jīng)深度學(xué)習(xí)模型自動(dòng)提取文本特征,實(shí)現(xiàn)文本情感分級(jí)。不少學(xué)者基于以上情感分析方法開展了環(huán)境狀況監(jiān)測(cè)、災(zāi)情事件感知、受災(zāi)區(qū)域識(shí)別等方面的研究。如陳顧遠(yuǎn)等使用樸素貝葉斯分類器和情感詞典對(duì)文本情感進(jìn)行正負(fù)極分類并打分,分析認(rèn)為公眾情感能夠較好地反映當(dāng)前環(huán)境狀態(tài)[11];陳凌等采用長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)構(gòu)建情感分析模型,將情感分類結(jié)果結(jié)合詞云對(duì)災(zāi)害期間的輿情事件進(jìn)行感知[12];Gruebner等使用EMOTIVE高級(jí)情感檢測(cè)程序識(shí)別具有消極情緒的受災(zāi)者推文,從而挑選出最需要救援的區(qū)域[13];張巖等使用樸素貝葉斯情感分類方法,通過(guò)分析表明情感指數(shù)能較好的用于重災(zāi)區(qū)的判斷[14]。

        在上述研究的基礎(chǔ)上,本研究將LDA主題模型、情感分析模型結(jié)合可視化技術(shù)引入臺(tái)風(fēng)災(zāi)情過(guò)程探測(cè)中。以2020年第6號(hào)臺(tái)風(fēng)“米克拉”為例,挖掘了臺(tái)風(fēng)災(zāi)害事件相關(guān)微博中蘊(yùn)含的災(zāi)情信息、主題信息和情感信息并對(duì)其進(jìn)行可視化,分析臺(tái)風(fēng)災(zāi)害前后用戶發(fā)文主題和情感值的變化與時(shí)空分布,進(jìn)而探測(cè)臺(tái)風(fēng)災(zāi)害的時(shí)空過(guò)程。

        1 數(shù)據(jù)采集與處理

        1.1 數(shù)據(jù)采集

        2020年第6號(hào)臺(tái)風(fēng)“米克拉”于8月11日7時(shí)許在福建省漳州市漳浦縣登陸,于12日6時(shí)許消逝。本研究以新浪微博作為數(shù)據(jù)源,選擇“米克拉 臺(tái)風(fēng)”作為采集關(guān)鍵詞,以臺(tái)風(fēng)預(yù)報(bào)前一天至預(yù)警解除后一天(8月9日0時(shí)至8月13日0時(shí))作為采集的起止時(shí)間,使用基于模擬登錄的方法,利用前期開發(fā)并部署于華為云端的爬蟲采集微博數(shù)據(jù)。采集得到的微博數(shù)據(jù)包括用戶id、微博發(fā)文時(shí)間、文本信息、簽到位置、用戶注冊(cè)位置等字段信息。通過(guò)對(duì)字段不完整和字?jǐn)?shù)少于6的信息進(jìn)行過(guò)濾,合計(jì)采集與臺(tái)風(fēng)“米克拉”相關(guān)原創(chuàng)微博數(shù)據(jù)共5 916條。

        1.2 數(shù)據(jù)預(yù)處理

        微博文本數(shù)據(jù)是一種非結(jié)構(gòu)化的數(shù)據(jù),其中雖蘊(yùn)含著各類屬性信息,但未經(jīng)處理則不能直接用于分析使用。“詞”是組成文本的最小單位,準(zhǔn)確的中文詞匯切分是文本特征提取和文本分析的基礎(chǔ)。但中文分詞的準(zhǔn)確度并不高,詞語(yǔ)時(shí)常被分詞器誤切分,因此需要通過(guò)構(gòu)造領(lǐng)域用戶詞典,實(shí)現(xiàn)詞典內(nèi)的詞匯能夠被準(zhǔn)確切分。使用HanLP中文分詞工具的基于條件隨機(jī)場(chǎng)(Conditional Random Field,CRF)的分詞模式[15],實(shí)現(xiàn)文本詞語(yǔ)的準(zhǔn)確切分。中文分詞對(duì)專業(yè)領(lǐng)域名詞識(shí)別效果不佳,時(shí)常出現(xiàn)誤切分的情況,因此引入自定義的臺(tái)風(fēng)災(zāi)害事件詞匯作為用戶詞典。分詞結(jié)果中往往存在大量與分析目的無(wú)關(guān)且頻率很高的詞匯,此類詞匯參與分析則會(huì)影響分析結(jié)果,需要構(gòu)建停用詞表對(duì)無(wú)關(guān)詞匯進(jìn)行過(guò)濾。本研究在哈工大停用詞典的基礎(chǔ)上補(bǔ)充了微博文本常出現(xiàn)的無(wú)關(guān)詞,實(shí)現(xiàn)微博無(wú)關(guān)詞的過(guò)濾。

        微博中含有3種位置信息:注冊(cè)位置、簽到位置以及文本位置。注冊(cè)位置,是用戶設(shè)置個(gè)人信息時(shí)選擇的位置,該位置可獲得的最小范圍為地市尺度,一般與具體某個(gè)微博所描述事件的地點(diǎn)沒(méi)有什么關(guān)系;簽到位置,為用戶發(fā)微博時(shí)自行定位的位置,多是體現(xiàn)微博用戶發(fā)微博時(shí)所在的位置,該位置的準(zhǔn)確度取決于微博用戶,從省域到非常具體的某個(gè)興趣點(diǎn)均可,但不一定是事件發(fā)生的地點(diǎn);文本位置,是微博文本中所蘊(yùn)含的位置,該位置一般是微博描述事件所在的位置,具有較高的準(zhǔn)確性。在位置的選擇上優(yōu)先使用文本位置,當(dāng)文本位置空缺時(shí)采用簽到位置。文本位置蘊(yùn)含在文本中,不像注冊(cè)位置和簽到位置一樣能夠輕易的獲取。本研究使用基于CRF的方法[16]對(duì)文本中的位置實(shí)體進(jìn)行識(shí)別,從而抽取出文本包含的位置信息。使用以上方法獲得有效的位置信息共4 912條,占微博總數(shù)的83%。本研究使用百度地圖提供的地理編碼服務(wù)將文本地理位置轉(zhuǎn)為經(jīng)緯度坐標(biāo),實(shí)現(xiàn)文本數(shù)據(jù)的地圖可視化展示。

        2 研究方法

        2.1 基于LDA的臺(tái)風(fēng)主題模型詞提取

        采用Blei提出的LDA主題生成模型[17]實(shí)現(xiàn)臺(tái)風(fēng)“米克拉”微博文本的主題分類。LDA主題模型屬于無(wú)監(jiān)督分類的3層貝葉斯概率模型,包含詞、主題、文檔3層結(jié)構(gòu)。該模型假設(shè)文檔是由若干個(gè)隱含主題構(gòu)成,而這些主題由文檔中若干個(gè)特定詞匯構(gòu)成。

        由于模型計(jì)算是反復(fù)迭代的過(guò)程,本研究設(shè)置迭代次數(shù)為200次,為了能得到較好的效果、較快收斂,先驗(yàn)參數(shù)根據(jù)經(jīng)驗(yàn)取值,α=50/k,β=0.01[18]。文本-主題概率分布矩陣表示每條微博文本數(shù)據(jù)可能包含的主題的概率,文本以概率最大的那個(gè)主題作為單條微博文本的主題,最終所有微博被分為16個(gè)主題類別,其中出現(xiàn)頻率排前10位的特征詞及主題序號(hào)矩陣如表1所示。通過(guò)對(duì)特征詞的判讀可以將相似主題進(jìn)行分類:1、5、8、15劃分為預(yù)警類信息,是災(zāi)害發(fā)生前氣象臺(tái)等政府部門發(fā)布的預(yù)警信號(hào)及臺(tái)風(fēng)運(yùn)動(dòng)軌跡等信息;6、9、10、12、13劃分為防御類信息,是關(guān)于交通班次停運(yùn)、航線停航、公園關(guān)閉等相關(guān)信息;3、4、7、11、14劃分為災(zāi)損類信息,是用戶報(bào)道的大風(fēng)、暴雨、路面損失等描述信息。0、2為無(wú)關(guān)信息。

        2.2 臺(tái)風(fēng)微博情感分析

        使用基于情感詞典的方法進(jìn)行劃分,通過(guò)建立通用情感詞、程度副詞、否定詞和專業(yè)領(lǐng)域詞典,結(jié)合句式詞庫(kù)對(duì)情感詞加權(quán)計(jì)算得到微博文本的情感值,然后通過(guò)人工設(shè)定正負(fù)傾向的閾值來(lái)進(jìn)行情感的分類,該方法簡(jiǎn)單易行且通用性好。BosonNLP情感詞典是從微博、新聞、論壇等渠道獲取的文本數(shù)據(jù)經(jīng)過(guò)情感標(biāo)注構(gòu)建生成。該詞典囊括了大量的網(wǎng)絡(luò)用語(yǔ),對(duì)微博文本的情感分析有很好的實(shí)用性。因此,使用BosonNLP詞典作為具有情感分值詞的情感詞詞典,情感值計(jì)算公式[19]如式(1)所示。

        表 1 “主題-特征詞”矩陣 Table 1 Subject-word matrix

        (1)

        degree(t)是文本t的情感值得分,qi為一篇文章中第i個(gè)情感詞,wi為情感詞qi對(duì)應(yīng)的程度副詞,k為情感詞qi前否定詞的個(gè)數(shù)。通過(guò)對(duì)文本的句式劃分,對(duì)文本中多個(gè)情感詞語(yǔ)程度副詞進(jìn)行加權(quán)累加,最終得到一篇文章的情感值,情感值大于0為積極正面的微博,小于0則為消極負(fù)面消極的微博。

        3 結(jié)果分析

        圖 1 微博數(shù)量-時(shí)間序列Figure 1 The number of microblogs-time series

        本研究以小時(shí)作為時(shí)間分辨率,對(duì)微博文本數(shù)量、內(nèi)容、主題類別和情感極性進(jìn)行時(shí)空統(tǒng)計(jì)分析。從相關(guān)微博數(shù)量隨時(shí)間變化情況來(lái)看,8月9日晚21時(shí)發(fā)布了第一條與“米克拉”臺(tái)風(fēng)相關(guān)的微博,隨后氣象部門等發(fā)布了大量的預(yù)警信號(hào),該臺(tái)風(fēng)事件逐漸被人們所關(guān)注,在10日15時(shí)許達(dá)到第一個(gè)小高峰;由于午夜時(shí)分用戶休息,微博數(shù)量在凌晨0時(shí)至6時(shí)降為低谷;隨著臺(tái)風(fēng)在11日8時(shí)許登陸漳州市漳浦縣并對(duì)當(dāng)?shù)鼐用癯鲂泻蜕?、生產(chǎn)造成影響,微博數(shù)量在11日10時(shí)達(dá)到第二個(gè)高峰;臺(tái)風(fēng)登陸后逐漸減弱并于11日14時(shí)降為熱帶低壓,此后相關(guān)微博也逐漸減少(圖1)。

        3.1 “米克拉”臺(tái)風(fēng)事件主題分析

        圖 2 事件主題類別-時(shí)間序列Figure 2 Text category-time series

        按預(yù)警、災(zāi)損與防御類文本主題,分別統(tǒng)計(jì)其發(fā)文數(shù)量和高頻詞隨時(shí)間的變化(圖2),可以看出,與“米克拉”臺(tái)風(fēng)相關(guān)的第一條微博是屬于預(yù)警類信息,描述了臺(tái)風(fēng)即將生成,并逐漸向臺(tái)灣、福建和廣東地區(qū)靠近的情況;在臺(tái)風(fēng)登陸前,關(guān)于臺(tái)風(fēng)風(fēng)向、風(fēng)力強(qiáng)度、預(yù)計(jì)路徑和預(yù)計(jì)暴雨強(qiáng)度等的預(yù)警類信息占主要部分;其次是關(guān)于漁船撤離、景點(diǎn)關(guān)閉、航班取消、列車停運(yùn)等相關(guān)的防御信息;關(guān)于大風(fēng)大雨影響描述的災(zāi)情信息只占少數(shù)。隨著臺(tái)風(fēng)逐漸向內(nèi)陸靠近,微博中災(zāi)損類信息大量增加,在11日8時(shí)左右微博中的災(zāi)損類信息超過(guò)預(yù)警類信息,這反映11日8時(shí)臺(tái)風(fēng)登陸漳州市漳浦縣并對(duì)周邊地區(qū)造成大量的災(zāi)害損失,其中的“福建、漳州、廈門、樹木、車輛、道路、交通”等高頻詞,可以看出“米克拉”臺(tái)風(fēng)災(zāi)害在漳州、廈門兩地,主要造成了樹木倒塌、道路交通堵塞等災(zāi)損影響。在降為熱帶低壓且逐漸消逝的過(guò)程中,災(zāi)損類信息仍占主導(dǎo)地位,其中高頻詞語(yǔ)有“廠房、樹木、護(hù)欄、道路”等,是對(duì)臺(tái)風(fēng)影響整個(gè)過(guò)程中造成的廠房被吹倒、樹木倒塌、護(hù)欄壓到民警、道路擁堵等事件的描述。

        圖 3 臺(tái)風(fēng)登陸前后災(zāi)損類信息點(diǎn)密度Figure 3 Density of damage information before and after typhoon landing

        將主題分類后微博文本信息中的文本位置轉(zhuǎn)換成地圖上的點(diǎn)事件,并通過(guò)核密度聚類生成熱力圖對(duì)災(zāi)損類信息進(jìn)行空間可視化,從而與實(shí)際災(zāi)情進(jìn)行比較(圖3)??梢园l(fā)現(xiàn):臺(tái)風(fēng)登陸前,漳州、廈門有些許災(zāi)損信息,主要描述大風(fēng)大雨對(duì)民眾出行造成影響;臺(tái)風(fēng)入境后,泉州、福州等沿海地區(qū)有些許災(zāi)情信息生成,廈門、漳州兩地有大量災(zāi)情信息生成,主要描述了樹木倒塌、道路交通堵塞、倉(cāng)庫(kù)倒塌、停電等信息;漳浦、平和、南靖、廈門市有大量的災(zāi)損類事件聚集,反映了此次臺(tái)風(fēng)事件的災(zāi)情分布,主要存在于福建省閩南沿海一帶。

        根據(jù)氣象部門預(yù)報(bào),“米克拉”臺(tái)風(fēng)在福建漳浦登陸后向西北方向移動(dòng),途徑漳浦、平和、南靖地區(qū),造成福建東南沿海大風(fēng)和暴雨,導(dǎo)致漳州多縣區(qū)房屋受損、樹木倒伏、電力受毀等。因此,對(duì)微博數(shù)據(jù)進(jìn)行文本抽取、可視化展示并分析,能夠快速直觀地了解此次臺(tái)風(fēng)事件造成的災(zāi)情影響、影響區(qū)域等信息。

        3.2 “米克拉”臺(tái)風(fēng)微博用戶情感趨勢(shì)

        在臺(tái)風(fēng)災(zāi)害事件中,身處受災(zāi)區(qū)的用戶會(huì)發(fā)布大量關(guān)于災(zāi)情相關(guān)的微博,此類微博多是對(duì)災(zāi)情的描述,其情感值大多是負(fù)向消極的。因此,對(duì)用戶的情感進(jìn)行分析可以探測(cè)臺(tái)風(fēng)災(zāi)害的影響區(qū)域和程度?!懊卓死迸_(tái)風(fēng)的文本情感分析結(jié)果顯示有72.4%的微博用戶對(duì)此次臺(tái)風(fēng)持積極的態(tài)度,27.6%的微博用戶持消極態(tài)度。此次臺(tái)風(fēng)事件微博情感值最低值為-16,該微博發(fā)布于廈門市湖里區(qū)東百蔡塘廣場(chǎng),描述了廈門市的大風(fēng)、停電和服務(wù)業(yè)受影響等多個(gè)消極事件;情感值最高分為27,該微博發(fā)布于12日,聲稱臺(tái)風(fēng)為廈門市降溫降雨,并且在晚上能夠看到英仙座流星雨。

        從時(shí)序和主題分析上來(lái)看,在8月9日9時(shí)之前,尚未確定臺(tái)風(fēng)會(huì)影響中國(guó)時(shí),關(guān)于“米克拉”的話題幾乎沒(méi)有用戶討論,此時(shí)屬于輿情傳播的潛伏期。在8月10日有大量預(yù)警類報(bào)道,確定臺(tái)風(fēng)會(huì)登陸福建閩南一帶,此時(shí)微博大量發(fā)布。在10日15時(shí)達(dá)到一個(gè)小高峰,此時(shí)持積極態(tài)度的預(yù)警類和無(wú)關(guān)類微博占主體地位,根據(jù)高頻詞匯可知主要是因?yàn)榇舜闻_(tái)風(fēng)預(yù)測(cè)強(qiáng)度不大且前期一直處于高溫狀態(tài),大量用戶渴望臺(tái)風(fēng)能夠給當(dāng)?shù)貛?lái)降雨和降溫,此類微博主要分布在廈門、福州等高溫地區(qū)。在11日8時(shí)“米克拉”登陸漳州市漳浦縣,持消極態(tài)度的微博大量生成,主要描述護(hù)欄被吹倒、樹木倒伏、暴雨肆虐等災(zāi)情信息,此類微博主要發(fā)布在廈門、漳州等地區(qū)(圖4)。

        圖 4 登陸前后積極無(wú)關(guān)類與消極災(zāi)損類信息點(diǎn)密度 Figure 4 Density of positive irrelevant and negative damage information before and after landing

        超強(qiáng)臺(tái)風(fēng)“莫蘭蒂”于2016年9月15日登陸福建省廈門市,登陸時(shí)恰逢天文大潮,對(duì)福建、浙江、江西等省造成了嚴(yán)重的影響,大面積的基礎(chǔ)設(shè)施損壞嚴(yán)重,上百萬(wàn)人受災(zāi)。本研究當(dāng)時(shí)收集了臺(tái)風(fēng)災(zāi)害事件相關(guān)微博共52 882條,其中有43.4%的微博用戶對(duì)此次臺(tái)風(fēng)持積極的態(tài)度,56.6%的微博用戶持消極態(tài)度。其中持消極態(tài)度的微博多是災(zāi)損類信息,分布于以廈門為中心的福建沿海地區(qū)。情感值最低為-30,該微博發(fā)布于廈門市瑞景商業(yè)廣場(chǎng),描述了廈門當(dāng)?shù)赝K?、停電、斷網(wǎng)、物資緊缺、道路堵塞、交通癱瘓等多種災(zāi)情信息;情感值最高分為33,因臺(tái)風(fēng)登陸時(shí)正好碰上傳統(tǒng)節(jié)日中秋節(jié),該微博描述了中秋佳節(jié)的祝福信息;其他積極態(tài)度的文本包括描述中秋佳節(jié)祝福、停課放假的欣喜、以及對(duì)災(zāi)區(qū)的祈愿等,多分布在不受災(zāi)害影響或受災(zāi)不嚴(yán)重的地區(qū)。通過(guò)對(duì)比兩次臺(tái)風(fēng)可以發(fā)現(xiàn),發(fā)布負(fù)向極性的微博多是來(lái)自于受災(zāi)區(qū),且描述的是當(dāng)?shù)厥転?zāi)害信息。“莫蘭蒂”臺(tái)風(fēng)用戶情感持正向態(tài)度的多處于無(wú)災(zāi)區(qū)或輕災(zāi)區(qū);“米克拉”臺(tái)風(fēng)持消極態(tài)度的微博占比與持積極的微博都位于臺(tái)風(fēng)影響范圍的區(qū)域。同樣是臺(tái)風(fēng)災(zāi)害事件,由于造成災(zāi)害影響程度的不同,微博文本的情感極性占比和文本類別也大不相同。嚴(yán)重的臺(tái)風(fēng)事件帶來(lái)大量的災(zāi)損類消極信息,而較弱的臺(tái)風(fēng)帶來(lái)大量積極的信息。因此,通過(guò)對(duì)微博主題類別和情感極性進(jìn)行時(shí)空分析,可用于臺(tái)風(fēng)災(zāi)害事件的影響范圍和災(zāi)損影響程度的輿情監(jiān)測(cè)。

        4 結(jié)論與展望

        (1)基于LDA主題模型對(duì)“米克拉”臺(tái)風(fēng)事件的微博進(jìn)行聚類,分為災(zāi)損信息類、防御信息類、預(yù)警信息類和無(wú)關(guān)信息類。分析各類微博的時(shí)間過(guò)程可以看出,臺(tái)風(fēng)登陸前有大量預(yù)警類信息;隨著臺(tái)風(fēng)逐漸向內(nèi)陸靠近,受災(zāi)地區(qū)的災(zāi)損類微博大量增加,災(zāi)損類微博在臺(tái)風(fēng)登陸時(shí)達(dá)到最高峰。因此,通過(guò)對(duì)主題類別的時(shí)序統(tǒng)計(jì)可以輔助探測(cè)臺(tái)風(fēng)的登陸過(guò)程及其災(zāi)情時(shí)空分布。(2)利用情感分析方法,挖掘微博文本所蘊(yùn)含的情感值,并通過(guò)空間統(tǒng)計(jì)制圖分析,發(fā)現(xiàn)臺(tái)風(fēng)登陸前后的微博中存在情感較為復(fù)雜:在臺(tái)風(fēng)登陸前,對(duì)福建高溫地區(qū)的微博文本存在明顯的正面影響,文本多是描述渴望降溫、降雨的信息;在臺(tái)風(fēng)登陸后,對(duì)受災(zāi)區(qū)用戶的微博文本存在明顯的負(fù)面影響,文本多是描述災(zāi)情信息,這很好地佐證了臺(tái)風(fēng)并不總是帶來(lái)負(fù)面影響的觀點(diǎn)[20]。臺(tái)風(fēng)登陸雖給受影響地區(qū)帶來(lái)了一定的自然災(zāi)害,但同時(shí)也帶來(lái)了降溫、降雨,往往給前期受高溫干旱天氣影響的當(dāng)?shù)鼐用駧?lái)積極的影響。(3)持負(fù)向態(tài)度的微博多是來(lái)自于受災(zāi)區(qū)。通過(guò)對(duì)比2016年“莫蘭蒂”和2020年“米克拉”這兩次臺(tái)風(fēng)的微博輿情可以發(fā)現(xiàn),較弱的臺(tái)風(fēng)會(huì)帶來(lái)較多的積極信息。因此,正、負(fù)向微博的占比可以側(cè)面反映臺(tái)風(fēng)的災(zāi)情程度;臺(tái)風(fēng)災(zāi)害期間,也可以利用實(shí)時(shí)產(chǎn)生的微博數(shù)據(jù)進(jìn)行分析,快速識(shí)別受災(zāi)區(qū)域和災(zāi)損影響程度,從而輔助政府部門掌握臺(tái)風(fēng)動(dòng)態(tài)發(fā)展趨勢(shì)。

        利用微博數(shù)據(jù)雖能夠較好地探測(cè)出臺(tái)風(fēng)登陸的時(shí)間節(jié)點(diǎn),但是對(duì)于具體臺(tái)風(fēng)災(zāi)害事件發(fā)生位置并不能很準(zhǔn)確地探測(cè)。其限制因素包括:(1)微博用戶多集中于大中城市,當(dāng)災(zāi)害事件在廣大農(nóng)村、山區(qū)發(fā)生時(shí),事發(fā)地并不會(huì)大量發(fā)布微博;(2)用戶的隱私保護(hù)意識(shí)也使得微博地理位置精度受限,在不開放具體坐標(biāo)信息時(shí)無(wú)法獲得位置信息或者僅標(biāo)注到縣市單元;(3)從微博文本中識(shí)別位置的精度則依賴于地理特征詞抽取準(zhǔn)確性及足夠詳細(xì)且現(xiàn)勢(shì)性強(qiáng)的地理編碼庫(kù)的支持。鑒于微博中往往包括很多照片、視頻等多媒體信息,其中經(jīng)常嵌入了拍攝時(shí)間和地理坐標(biāo),因此如何利用這些信息提取地理位置,以及基于機(jī)器學(xué)習(xí)方法從照片中直接提取路標(biāo)、災(zāi)害場(chǎng)景特征等信息,以改進(jìn)本研究前述方法是目前一個(gè)研究熱點(diǎn)。

        猜你喜歡
        博文災(zāi)情詞典
        2022年6月全球?yàn)?zāi)情
        第一次掙錢
        2021年12月全球?yàn)?zāi)情
        長(zhǎng)慶油田:災(zāi)情就是命令
        米沃什詞典
        文苑(2019年24期)2020-01-06 12:06:50
        誰(shuí)和誰(shuí)好
        評(píng)《現(xiàn)代漢語(yǔ)詞典》(第6版)
        詞典例證翻譯標(biāo)準(zhǔn)探索
        災(zāi)情再顯城市短板
        Review on Tang Wenzhi’s The Gist of Chinese Writing Gamut
        久久精品伊人久久精品伊人| 国产美女网站视频| AV无码免费不卡在线观看| 蜜桃码一区二区三区在线观看| 色哟哟亚洲色精一区二区| 国内精品卡一卡二卡三| 国产精美视频| 日本人妻伦理片在线观看| 一本久道竹内纱里奈中文字幕| 国自产精品手机在线观看视频| 午夜国产在线| 亚洲av免费高清不卡| 亚洲三级视频一区二区三区| 99国产精品人妻噜啊噜| 国产亚洲精品自在久久蜜tv| 国内自拍视频在线观看h| 久久精品亚洲熟女av蜜謦| 国产精品无码久久久久久久久久| 日韩av在线毛片| 日韩日本国产一区二区| 精品精品国产高清a毛片| 99偷拍视频精品一区二区| 日韩激情网| 丝袜美足在线视频国产在线看| 国产成人精品a视频一区| 高清无码一区二区在线观看吞精| 亚洲av有码精品天堂| 精品福利一区二区三区蜜桃| 成人综合婷婷国产精品久久蜜臀| 日韩精品欧美激情亚洲综合| 国产大屁股熟女流白浆一区二区| 久久天天躁夜夜躁狠狠| 日韩精品无码久久一区二区三| 宅男久久精品国产亚洲av麻豆 | 久久亚洲精彩无码天堂| 护士人妻hd中文字幕| 国产真实乱对白精彩| 少妇无码av无码去区钱| 最新日本女优中文字幕视频| 亚洲av永久无码一区二区三区| 亚洲网站地址一地址二|