張 揚(yáng) 陳 軼
(南京工業(yè)大學(xué)建筑學(xué)院,南京 211816)
城市是人類經(jīng)濟(jì)活動(dòng)的高度聚集體,洪澇災(zāi)害頻發(fā)會(huì)造成重大人員傷亡和高昂經(jīng)濟(jì)損失,有效降低災(zāi)害損失至關(guān)重要。社交媒體數(shù)據(jù)作為一種時(shí)空大數(shù)據(jù),具有實(shí)時(shí)性和位置服務(wù)的特點(diǎn),近年來(lái),在美國(guó)、德國(guó)、日本等國(guó)家的洪水風(fēng)險(xiǎn)管理中得到運(yùn)用。例如,美國(guó)通過(guò)社交媒體數(shù)據(jù)中的降雨強(qiáng)度文本評(píng)估災(zāi)害全過(guò)程[1];德國(guó)使用社交媒體中帶有地理定位的照片快速繪制洪水淹沒(méi)地圖[2];日本將社交媒體數(shù)據(jù)與災(zāi)害監(jiān)測(cè)數(shù)據(jù)有效整合,為應(yīng)急管理人員提供早期預(yù)警等[3]。
有別于傳統(tǒng)遙感、氣象觀測(cè)數(shù)據(jù)在監(jiān)測(cè)災(zāi)害進(jìn)程、解析致災(zāi)程度、模擬結(jié)果準(zhǔn)確度等方面的不足,社交媒體數(shù)據(jù)可通過(guò)實(shí)時(shí)地理時(shí)空分析和災(zāi)情信息傳遞實(shí)現(xiàn)快速救災(zāi)部署,但也存在不容忽視的問(wèn)題,如地理定位準(zhǔn)確性和信息可信度不足[4]。如何進(jìn)一步優(yōu)化社交媒體數(shù)據(jù)處理和分析的算法模型與技術(shù),有效融合多源信息并運(yùn)用于洪水風(fēng)險(xiǎn)管理全過(guò)程是目前研究的趨勢(shì)。針對(duì)現(xiàn)有洪水監(jiān)測(cè)技術(shù)的不足及社交媒體的優(yōu)勢(shì),國(guó)內(nèi)外學(xué)者積極探討社交媒體數(shù)據(jù)在洪水風(fēng)險(xiǎn)管理中的應(yīng)用技術(shù)方法。本文選取最新的基于社交媒體數(shù)據(jù)的洪澇災(zāi)害研究成果,歸納社交媒體洪水信息的提取與分析的技術(shù)手段,探討社交媒體數(shù)據(jù)在洪水風(fēng)險(xiǎn)管理中的應(yīng)用方向。
社交媒體數(shù)據(jù)具有巨大的信息量,但其中存在許多無(wú)用或虛假的信息。考慮到大多數(shù)推文可能包含與洪澇事件無(wú)關(guān)的信息,因此,精準(zhǔn)提取與洪水風(fēng)險(xiǎn)相關(guān)的有效信息是首要工作。按照常見的數(shù)據(jù)類型和處理方式可將現(xiàn)有社交媒體數(shù)據(jù)分為“文本”“圖像”“視頻”。
1.1.1 文本提取
早期社交媒體數(shù)據(jù)處理一般選用文本形式,現(xiàn)階段通常采用人工智能方法實(shí)現(xiàn)數(shù)據(jù)的分類和歸納,此外,基于深度學(xué)習(xí)的自然語(yǔ)言處理技術(shù)可以有效提升洪水信息的完整性和可靠性。如De Albuquerque 等[5]以2013 年德國(guó)洪水為例,通過(guò)將社交媒體與傳統(tǒng)地理數(shù)據(jù)相結(jié)合,發(fā)現(xiàn)洪澇嚴(yán)重地區(qū)與推文數(shù)量成正比。Wang 等[6]通過(guò)文獻(xiàn)回顧,探討了從空間、時(shí)間、內(nèi)容和網(wǎng)絡(luò)4個(gè)方面挖掘的社交媒體數(shù)據(jù)在災(zāi)害管理方面的研究進(jìn)展,提出社交媒體數(shù)據(jù)應(yīng)與統(tǒng)計(jì)數(shù)據(jù)、調(diào)查數(shù)據(jù)等相結(jié)合。Liu 等[7]通過(guò)分析中國(guó)新聞機(jī)構(gòu)在社交媒體平臺(tái)推送的信息,進(jìn)一步補(bǔ)充和校核中國(guó)自然災(zāi)害數(shù)據(jù)庫(kù)。Mondal 等[8]通過(guò)構(gòu)建檢測(cè)謠言信息的概率模型,提高了社交媒體數(shù)據(jù)災(zāi)情分析的準(zhǔn)確性。Gründer-Fahrer 等[9]以2013 年中歐洪水為例,使用主題模型(Topic Model Analysis)分析方法,通過(guò)分析社交媒體內(nèi)容主題隨時(shí)間的發(fā)展,識(shí)別災(zāi)害不同階段的特征。Yang等[10]以颶風(fēng)“哈維”為例,通過(guò)構(gòu)建可信度框架進(jìn)一步提升Twitter 數(shù)據(jù)分析結(jié)果在災(zāi)害管理的真實(shí)性和完整性。de Bruijn 等[11]通過(guò)構(gòu)建全球歷史洪澇推文數(shù)據(jù)庫(kù),實(shí)現(xiàn)全球范圍實(shí)時(shí)的洪澇動(dòng)態(tài)監(jiān)測(cè)。Bai 等[12]運(yùn)用機(jī)器學(xué)習(xí)模型對(duì)社交媒體數(shù)據(jù)的災(zāi)害信息進(jìn)行高效分類,為救災(zāi)部署提供了及時(shí)的反饋信息。
1.1.2 圖像提取
隨著人工智能和機(jī)器學(xué)習(xí)技術(shù)的不斷發(fā)展,圖像的自動(dòng)分類得以實(shí)現(xiàn)。支持向量機(jī)、決策樹、貝葉斯方法等傳統(tǒng)的分類計(jì)數(shù)方法已經(jīng)廣泛應(yīng)用于圖像分類領(lǐng)域,并取得了一定的成果。卷積神經(jīng)網(wǎng)絡(luò)是近年來(lái)計(jì)算機(jī)視覺(jué)領(lǐng)域的一個(gè)研究熱點(diǎn),其具有優(yōu)秀的特征提取和分類能力,在海量的社交媒體圖像信息的提取和解譯方面取得了突出成果,已成為圖像分類領(lǐng)域的主流方法之一。典型研究如:Chaudhary 等[13]基于計(jì)算機(jī)視覺(jué)系統(tǒng),提取社交媒體洪澇圖像水位數(shù)據(jù),從而構(gòu)建實(shí)時(shí)洪水地圖。Feng 等[14]以颶風(fēng)“哈維”為例,采用深度卷積神經(jīng)網(wǎng)絡(luò)技術(shù),從社交媒體洪水圖像中提取水位數(shù)據(jù),繪制洪水淹沒(méi)圖。Lopez-Fuentes等[15]運(yùn)用神經(jīng)網(wǎng)絡(luò)模型,通過(guò)分析社交媒體圖像中受洪水影響地區(qū)的道路的可通行性,提高了救援效率。
近年來(lái),計(jì)算機(jī)硬件的進(jìn)步推動(dòng)了深度學(xué)習(xí)的應(yīng)用,提升了將文本和圖像相結(jié)合的可能性,兩者同時(shí)提取和分析可以實(shí)現(xiàn)相互校核并提升準(zhǔn)確性。典型研究如:Huang等[16]運(yùn)用深度學(xué)習(xí)方法,實(shí)現(xiàn)文本與圖像相結(jié)合的災(zāi)害數(shù)據(jù)自動(dòng)提取。Wang 等[17]綜合運(yùn)用基于深度學(xué)習(xí)的模型提取社交媒體數(shù)據(jù)中的圖像和文本,進(jìn)一步識(shí)別災(zāi)害不同階段造成的社會(huì)影響和受災(zāi)位置信息。Fan 等[18]以颶風(fēng)“哈維”為例,通過(guò)提取社交媒體數(shù)據(jù)中的文本和圖像信息,分析洪澇事件中的基礎(chǔ)設(shè)施中斷情況。
1.1.3 視頻提取
移動(dòng)網(wǎng)絡(luò)和智能手機(jī)的快速發(fā)展使得社交媒體用戶可以實(shí)時(shí)、快速地分析視頻數(shù)據(jù)。視頻數(shù)據(jù)量大且具有動(dòng)態(tài)特征,盡管已有研究表明從視頻中提取洪水風(fēng)險(xiǎn)信息的可行性,但相關(guān)研究仍舊較少。典型研究如:Michelsen 等[19]從YouTube 視頻中提取水位數(shù)據(jù),彌補(bǔ)了缺乏監(jiān)測(cè)地區(qū)的洪水信息獲取的可能性。Jiang等[20]運(yùn)用機(jī)器學(xué)習(xí)模型從視頻圖像中提取出城市內(nèi)澇深度信息。Re等[21]將Twitter文本與YouTube視頻結(jié)合,補(bǔ)充了城市洪澇模擬的數(shù)據(jù)。
社交媒體數(shù)據(jù)作為一種地理空間大數(shù)據(jù),為致災(zāi)強(qiáng)度、災(zāi)害損失和求助信息評(píng)估提供了新的途徑。但受制于個(gè)人隱私設(shè)置及受眾群,只有小于1%的社交媒體數(shù)據(jù)帶有準(zhǔn)確的位置信息[22]。因此,社交媒體數(shù)據(jù)分析常與多源數(shù)據(jù)(如遙感數(shù)據(jù)、水文數(shù)據(jù)、其他媒體數(shù)據(jù)等)相結(jié)合,以補(bǔ)充和修正現(xiàn)有數(shù)據(jù)的不足。
1.2.1 單一社交媒體數(shù)據(jù)源
單一社交媒體數(shù)據(jù)源通常用于進(jìn)行時(shí)間序列的災(zāi)情分析和地理時(shí)空分析,典型研究如:Arthur等[22]通過(guò)Twitter推文中涉及地名的信息進(jìn)一步推斷定位信息,并繪制高分辨率洪水風(fēng)險(xiǎn)地圖。Kankanamge等[23]以昆士蘭東南部洪水為例,通過(guò)提取社交媒體數(shù)據(jù)中的洪水信息識(shí)別嚴(yán)重受災(zāi)區(qū)。Sattaru 等[24]以2015 年印度洪水為例,通過(guò)提取和處理含洪水信息的社交媒體推文,快速識(shí)別洪澇高風(fēng)險(xiǎn)區(qū)域。
1.2.2 社交媒體數(shù)據(jù)與遙感數(shù)據(jù)結(jié)合
遙感影像是早期洪澇災(zāi)害研究中提取洪水范圍的主要數(shù)據(jù)源。然而,受城市化影響,城市中的建筑物和植物陰影的遮擋可能導(dǎo)致洪水監(jiān)測(cè)范圍出現(xiàn)誤差。此外,洪水監(jiān)測(cè)采用的遙感影像會(huì)受到天氣影響而導(dǎo)致延遲。因此,具有時(shí)效性的社交媒體數(shù)據(jù)可作為遙感數(shù)據(jù)源的有益補(bǔ)充,典型研究如:Fohringer 等[25]通過(guò)將社交媒體數(shù)據(jù)和遙感數(shù)據(jù)相結(jié)合,提取圖像信息中有關(guān)洪水深度和范圍的數(shù)據(jù),實(shí)現(xiàn)洪水淹沒(méi)范圍和深度的實(shí)時(shí)監(jiān)測(cè)。Jongman 等[26]以菲律賓和巴基斯坦洪水為例,通過(guò)整合衛(wèi)星監(jiān)測(cè)的實(shí)時(shí)洪水信息和Twitter 的分析數(shù)據(jù)可實(shí)現(xiàn)洪水的位置、時(shí)間、成因和影響的快速確定。Li 等[27]通過(guò)文獻(xiàn)綜述,探討社交媒體與遙感數(shù)據(jù)整合的研究進(jìn)展,表明社交媒體可以改進(jìn)遙感數(shù)據(jù)在災(zāi)害應(yīng)急響應(yīng)方面的不足。Huang 等[28]將社交媒體數(shù)據(jù)與遙感影像結(jié)合,突破了傳統(tǒng)洪水淹沒(méi)概率計(jì)算方法的局限性。Wang 等[29]提出一種融合異構(gòu)數(shù)據(jù)的算法框架,利用遙感和社交媒體數(shù)據(jù)生成有效的洪水地圖,突破了單一數(shù)據(jù)的局限性。Xu等[30]將社交媒體數(shù)據(jù)和遙感圖像相結(jié)合,通過(guò)計(jì)算洪水淹沒(méi)概率生成更精確的洪水淹沒(méi)范圍圖。Bruneau 等[31]以颶風(fēng)“哈維”為例,將Twitter 和遙感數(shù)據(jù)相結(jié)合估算洪水淹沒(méi)面積。Yang等[32]將社交媒體數(shù)據(jù)和遙感影像相結(jié)合評(píng)估長(zhǎng)江三角洲地區(qū)洪澇災(zāi)情信息。
1.2.3 社交媒體數(shù)據(jù)與水文數(shù)據(jù)結(jié)合
社交媒體數(shù)據(jù)與水文數(shù)據(jù)相結(jié)合可以有效實(shí)現(xiàn)水力模型的模擬洪澇與現(xiàn)實(shí)洪澇的相互校核,提升洪澇模擬結(jié)果的準(zhǔn)確度。典型研究如:Lee提出通過(guò)融合多源數(shù)據(jù)的概率性框架(probabilistic framework)評(píng)估洪澇發(fā)生概率,增加洪水風(fēng)險(xiǎn)預(yù)測(cè)的準(zhǔn)確性[33]。Annis 等[34]通過(guò)整合社交媒體數(shù)據(jù)與水文數(shù)據(jù)改進(jìn)水力模型,實(shí)現(xiàn)實(shí)時(shí)的洪水風(fēng)險(xiǎn)圖。Scotti 等[35]以颶風(fēng)“哈維”為例,將衛(wèi)星圖像、水力模型和社交媒體數(shù)據(jù)相結(jié)合,繪制出更精確的洪水風(fēng)險(xiǎn)地圖。Giler-Ormaza 等[36]以厄瓜多爾洪災(zāi)為例,將YouTube 視頻、二維水力模型和DEM 模型相結(jié)合,準(zhǔn)確估測(cè)了洪災(zāi)后河流的流量峰值。
1.2.4 社交媒體數(shù)據(jù)與其他媒體數(shù)據(jù)結(jié)合
將多平臺(tái)社交媒體數(shù)據(jù)融合與網(wǎng)絡(luò)問(wèn)卷、在線電子表格、報(bào)紙等其他媒體數(shù)據(jù)相結(jié)合,可作為單一社交媒體數(shù)據(jù)的補(bǔ)充,改進(jìn)單一來(lái)源數(shù)據(jù)的質(zhì)量,為洪水研究提供更全面的數(shù)據(jù)集合。典型研究如:Stephenson 等[37]搜集并對(duì)比Facebook 和Twitter 在洪水期間的社交媒體數(shù)據(jù),發(fā)現(xiàn)不同的用戶結(jié)構(gòu)和活動(dòng)偏好導(dǎo)致了數(shù)據(jù)內(nèi)容的差異。Wang等[38]從Twitter 和MyCoast 收集并驗(yàn)證了洪水災(zāi)害數(shù)據(jù),表明社交媒體數(shù)據(jù)可以監(jiān)控大范圍地區(qū)的洪澇事件,但存在較多噪音;眾包數(shù)據(jù)更適合特定地點(diǎn)的洪水監(jiān)控且數(shù)據(jù)更可靠,兩者結(jié)合可以實(shí)現(xiàn)互補(bǔ)。Baranowski 等[39]利用Twitter數(shù)據(jù)和報(bào)紙?zhí)峁┑谋姲鼣?shù)據(jù)分析蘇門答臘島洪水的氣象成因,提高了當(dāng)?shù)睾樗L(fēng)險(xiǎn)的可預(yù)測(cè)性。
社交媒體數(shù)據(jù)與無(wú)人機(jī)攝像、遙感影像、水力數(shù)據(jù)等多源數(shù)據(jù)結(jié)合,可實(shí)現(xiàn)實(shí)時(shí)、動(dòng)態(tài)的洪水監(jiān)測(cè),從而提升洪澇預(yù)警的準(zhǔn)確性和及時(shí)性,典型研究如:Restrepo-Estrada等[40]將社交媒體數(shù)據(jù)與遙感影像、水文數(shù)據(jù)等相結(jié)合,提高了洪澇模擬的精度,表明社交媒體數(shù)據(jù)可以改進(jìn)洪水預(yù)警系統(tǒng)。Chen 等[41]以臺(tái)灣洪水為例,將從社交媒體文本中提取的災(zāi)害信息與應(yīng)急管理信息云數(shù)據(jù)結(jié)合,建立了更精準(zhǔn)的預(yù)警機(jī)制。Shoyama 等[3]以2019 年日本東部臺(tái)風(fēng)為例,對(duì)比分析洪澇相關(guān)推文數(shù)量與洪水監(jiān)測(cè)數(shù)據(jù)的時(shí)間變化,得出推文數(shù)量的暴發(fā)與災(zāi)害事件的發(fā)生密切相關(guān),并且根據(jù)推文與降雨量和水位數(shù)據(jù)的相關(guān)性特征,改進(jìn)了洪澇災(zāi)害預(yù)警機(jī)制。
時(shí)間序列的災(zāi)情分析和地理時(shí)空分析是社交媒體數(shù)據(jù)應(yīng)用于洪水風(fēng)險(xiǎn)管理的基本方法。早期,社交媒體數(shù)據(jù)的定位點(diǎn)直接表示在地圖上,后期的研究通過(guò)空間算法將帖文中具有位置信息(如地名)轉(zhuǎn)化為坐標(biāo)?,F(xiàn)階段的研究進(jìn)一步將時(shí)間和空間相結(jié)合,進(jìn)行時(shí)間序列災(zāi)情變化的對(duì)比分析,典型研究如:Fang等[42]以2016年武漢暴雨為例,提取微博文本信息分析洪澇災(zāi)害災(zāi)前、災(zāi)中、災(zāi)后不同階段的特征及影響,并繪制洪澇災(zāi)害熱點(diǎn)地圖。Zhao 等[43]通過(guò)提取微博文本中與臺(tái)風(fēng)路徑相關(guān)的信息,繪制臺(tái)風(fēng)路徑時(shí)空變化及受影響地區(qū)的災(zāi)情圖。Arapostathis 等[44]通過(guò)計(jì)算機(jī)腳本自動(dòng)處理社交媒體數(shù)據(jù),生成洪澇時(shí)空演變圖。
基于社交媒體文本數(shù)據(jù)的情緒和行為分析也是學(xué)界熱點(diǎn)。早期的研究采用人工解譯和判斷的方法加上后期引入機(jī)器學(xué)習(xí)技術(shù),通過(guò)訓(xùn)練情緒分析模型實(shí)現(xiàn)自動(dòng)化文本處理。現(xiàn)階段的研究將情緒和行為分析與時(shí)空數(shù)據(jù)相結(jié)合,分析災(zāi)害動(dòng)態(tài)變化特征及其對(duì)人群和社會(huì)造成的影響。典型研究如:Tyshchuk 等[45]利用社交媒體數(shù)據(jù)分析用戶對(duì)災(zāi)害警報(bào)的行為反應(yīng),為應(yīng)急管理人員采取措施提供參考。Cheng等[46]以武漢為例,分析了微博用戶在災(zāi)害期間使用微博的行為特征,結(jié)果表明中國(guó)社交媒體用戶對(duì)災(zāi)害事件的參與度低于西方國(guó)家,缺少政府與公眾的雙向溝通,社交媒體尚未被有效用于災(zāi)害管理。Karmegam 等[47]以2015 年印度洪水為例,通過(guò)對(duì)災(zāi)害期間Twitter數(shù)據(jù)中的負(fù)面情緒進(jìn)行時(shí)空分析,識(shí)別出受災(zāi)嚴(yán)重的地區(qū)和人群。Karami等[48]提出利用Twitter文本信息挖掘公眾擔(dān)憂情緒的分析框架,用以替代傳統(tǒng)民意調(diào)查分析。Zhang 等[49]以颶風(fēng)“哈維”為例,通過(guò)對(duì)社交媒體文本信息的主題和情感分析,得到洪澇事件中基礎(chǔ)設(shè)施的中斷情況及社會(huì)影響。Geng等[50]以山東壽光市洪水為例,探討了微博用戶災(zāi)害感知和響應(yīng)行為的時(shí)空差異,表明社交媒體數(shù)據(jù)能夠有效拓寬社會(huì)感知的研究領(lǐng)域。
由于洪水造成的損壞是快速的,通過(guò)對(duì)社交媒體文本、圖像和視頻的解譯的可以提取災(zāi)害損失信息,幫助災(zāi)害管理者快速獲取災(zāi)害損失狀況并及時(shí)地做出災(zāi)害響應(yīng)。同時(shí),通過(guò)將社交媒體的災(zāi)損信息與現(xiàn)有調(diào)查數(shù)據(jù)相結(jié)合,可以實(shí)現(xiàn)更精準(zhǔn)的災(zāi)損評(píng)估。典型研究如:Cervone等[51]以2013年科羅拉多洪水為例,通過(guò)提取社交媒體的位置信息與遙感影像相結(jié)合實(shí)現(xiàn)對(duì)交通基礎(chǔ)設(shè)施的快速災(zāi)損評(píng)估。Hao 等[52]通過(guò)提取社交媒體有關(guān)災(zāi)害的文本和圖像數(shù)據(jù),補(bǔ)充了傳統(tǒng)的災(zāi)損評(píng)估方法。Liu等[53]以2016年武漢洪水為例,整合社交媒體數(shù)據(jù)、POI數(shù)據(jù)等多源數(shù)據(jù)和洪水淹沒(méi)地圖,準(zhǔn)確定位洪水淹沒(méi)道路并快速估計(jì)受影響人口。Tan等[54]以重慶洪澇為例,將社交媒體數(shù)據(jù)中的災(zāi)損信息分為物理?yè)p失和情感損失兩類,評(píng)估并分析了兩個(gè)方面的損失程度和恢復(fù)狀況。Eckhardt 等[55]綜述了基于社交媒體數(shù)據(jù)的洪澇災(zāi)害損失經(jīng)濟(jì)評(píng)估方法,并以2019年里約洪澇災(zāi)害為案例證明了該方法的可行性。
根據(jù)社交媒體用戶發(fā)布的災(zāi)害求助信息,災(zāi)害管理者通過(guò)提取相關(guān)推文識(shí)別不同群體的救災(zāi)需求,從而優(yōu)化各項(xiàng)救災(zāi)部署措施,典型研究如:Schempp等[56]提出以多源數(shù)據(jù)整合的分析框架模擬洪澇災(zāi)害情境下的救災(zāi)需求,優(yōu)化救援部署與物資分配。Lin 等[57]以武漢為例,通過(guò)從社交媒體、眾包等大數(shù)據(jù)中提取人口動(dòng)態(tài)時(shí)空分布信息,準(zhǔn)確估算救災(zāi)物資的需求。Wu等[58]以2016年合肥暴雨為例,通過(guò)分析災(zāi)前、災(zāi)中、災(zāi)后微博話題的轉(zhuǎn)變,提出相應(yīng)的災(zāi)害應(yīng)對(duì)策略。Belcastro 等[59]通過(guò)分析社交媒體推文預(yù)先發(fā)現(xiàn)洪澇次生災(zāi)害,為災(zāi)害管理者制定應(yīng)對(duì)措施提供參考。
社交媒體數(shù)據(jù)可作為傳統(tǒng)洪澇風(fēng)險(xiǎn)評(píng)估的補(bǔ)充數(shù)據(jù)源。相關(guān)的研究包括,Chong 等[60]以2015 年印度洪水為例,從Twitter 提取文本信息評(píng)估城市基礎(chǔ)設(shè)施韌性。Barker等[61]以英國(guó)洪水為例,通過(guò)挖掘全國(guó)范圍內(nèi)的Twitter 災(zāi)害地理數(shù)據(jù),分析洪澇對(duì)社區(qū)的潛在影響。Wu 等[62]以鄭州為例,利用社交媒體數(shù)據(jù)建立洪澇脆弱性曲線模型,實(shí)現(xiàn)城市洪澇脆弱性的定量評(píng)估。Karimiziarani 等[63]以颶風(fēng)“哈維”為例,基于社交媒體數(shù)據(jù)構(gòu)建災(zāi)害風(fēng)險(xiǎn)意識(shí)指數(shù),用于評(píng)估縣級(jí)尺度居民的災(zāi)害風(fēng)險(xiǎn)意識(shí)。
(1)實(shí)時(shí)的洪水信息。傳統(tǒng)的洪澇風(fēng)險(xiǎn)監(jiān)測(cè)信息來(lái)自氣象站、水文站、衛(wèi)星遙感等,觀測(cè)數(shù)據(jù)往往具有滯后性[35]。社交媒體數(shù)據(jù)可以更快提供最新的洪水風(fēng)險(xiǎn)信息,幫助應(yīng)急管理部門快速掌握洪澇災(zāi)害的實(shí)時(shí)變化趨勢(shì),從而采取更精準(zhǔn)的響應(yīng)措施。社交媒體用戶通過(guò)分享洪澇災(zāi)害相關(guān)的文本、圖片和視頻,有效傳遞雨情、水位、道路交通狀況、積水點(diǎn)等洪澇災(zāi)情信息。
(2)多類型的洪水信息。社交媒體的洪水信息形式類型多樣,包括文本、圖片、視頻等。文本包含求助信息、災(zāi)情、救災(zāi)進(jìn)展、災(zāi)后恢復(fù)情況等,圖片和視頻涵蓋洪澇災(zāi)害影響范圍、積水點(diǎn)具體位置、洪澇嚴(yán)重程度等,帶有地理定位的社交媒體數(shù)據(jù)為應(yīng)急管理者提供了準(zhǔn)確的需求信息。此外,社交媒體數(shù)據(jù)來(lái)源廣泛,包括公眾、新聞媒體、政府機(jī)構(gòu)等多渠道[46],可以幫助管理者及時(shí)制定救災(zāi)策略和恢復(fù)計(jì)劃。
(3)洪水信息可視化。將帶有洪水信息的社交媒體數(shù)據(jù)以地圖、圖表等形式可視化呈現(xiàn),可以直觀地傳達(dá)洪澇災(zāi)害的分布和變化趨勢(shì)信息。數(shù)據(jù)的可視化可以幫助應(yīng)急管理者更快速地了解洪澇災(zāi)情并制定相應(yīng)的救災(zāi)策略。
(1)數(shù)據(jù)質(zhì)量與精度不足。社交媒體數(shù)據(jù)量大但相關(guān)帖文數(shù)量少[64],且存在位置信息誤差[65],致使其數(shù)據(jù)質(zhì)量和精度不足。深度學(xué)習(xí)算法提高了從社交媒體數(shù)據(jù)提取信息的準(zhǔn)確度,但依然難以控制原始數(shù)據(jù)質(zhì)量[25]。例如由洪澇引發(fā)的通信設(shè)施中斷會(huì)影響用戶發(fā)送災(zāi)情相關(guān)微博,或者受災(zāi)者往往在撤離洪澇淹沒(méi)區(qū)后發(fā)微博,造成數(shù)據(jù)時(shí)間和定位標(biāo)簽的偏差[29]。
(2)虛假信息大量存在。社交媒體平臺(tái)發(fā)布的信息未經(jīng)證實(shí),存在大量的虛假信息。虛假信息往往會(huì)影響社交媒體數(shù)據(jù)分析結(jié)果,甚至造成災(zāi)害管理策略的錯(cuò)誤部署。因此,識(shí)別和過(guò)濾虛假信息至關(guān)重要,針對(duì)謠言開發(fā)檢測(cè)模型成了目前研究者的重要關(guān)注點(diǎn)[8]。此外,還需要在數(shù)據(jù)分析階段對(duì)分析結(jié)果進(jìn)行可信度評(píng)估,降低虛假信息的潛在影響[10]。
(3)用戶群體受限。社交媒體活躍用戶往往是年輕人,不能代表所有群體。城市往往比鄉(xiāng)村擁有更多的社交媒體使用者,在收入較高的社區(qū)其社交媒體的信息更容易受到關(guān)注,而收入較低的社區(qū)其信息往往受到忽視。此外,年輕人是社交媒體的主要用戶,而年長(zhǎng)者較少使用社交媒體。為了更好地理解社交媒體在洪水風(fēng)險(xiǎn)管理中的作用和影響,需要考慮社交媒體的用戶差異,并將其納入決策過(guò)程中,以確保決策的公平性和全面性。
(4)文化差異影響。文化差異會(huì)影響社交媒體用戶對(duì)災(zāi)害事件信息的描述,從而導(dǎo)致研究者對(duì)社交媒體文本解讀的偏差。此外,文化差異可能導(dǎo)致中英文社交媒體的用戶使用特點(diǎn)不同,需要采用不同的研究方法和策略。目前,社交媒體數(shù)據(jù)研究主要集中在以Twitter 為代表的英文平臺(tái),而對(duì)中文社交媒體的研究相對(duì)較少。然而,在中國(guó)的城市洪澇災(zāi)害事件中,社交媒體發(fā)揮了重要作用,尤其是在災(zāi)害響應(yīng)階段的信息共享和態(tài)勢(shì)感知方面。盡管如此,仍然存在一些問(wèn)題,包括中文社交媒體數(shù)據(jù)的未充分利用及社交媒體活動(dòng)中民眾和政府之間的雙向溝通不足等[46]。因此,對(duì)中文社交媒體的洪水風(fēng)險(xiǎn)管理研究值得進(jìn)一步深入。
社交媒體作為應(yīng)急管理部門的新興數(shù)據(jù)源,近年來(lái)受到越來(lái)越多的關(guān)注。由于觀測(cè)數(shù)據(jù)和遙感數(shù)據(jù)存在一定的滯后性,具有較強(qiáng)實(shí)時(shí)性和公眾參與性的社交媒體數(shù)據(jù)可以為應(yīng)急管理部門提供更準(zhǔn)確的洪澇災(zāi)害時(shí)空分布信息,從而進(jìn)行高效的救災(zāi)部署。本文選取最新的研究成果,綜述了社交媒體洪水信息提取和應(yīng)用的研究進(jìn)展。
社交媒體數(shù)據(jù)具有豐富的社會(huì)感知信息和傳統(tǒng)調(diào)查數(shù)據(jù)無(wú)法比擬的大數(shù)據(jù)特征,一定程度上彌補(bǔ)了傳統(tǒng)觀測(cè)數(shù)據(jù)全面性、系統(tǒng)性的不足。研究方法上,從單一社交媒體的洪水信息的提取和分析,發(fā)展為多源數(shù)據(jù)與多學(xué)科的融合分析和應(yīng)用,運(yùn)用以機(jī)器學(xué)習(xí)為代表的算法模型優(yōu)化是近期研究的熱點(diǎn)。研究?jī)?nèi)容上,目前多采用帶有定位信息的社交媒體數(shù)據(jù),初步反映洪澇災(zāi)害的強(qiáng)度和空間分布,或用以輔助修正洪水風(fēng)險(xiǎn)分布圖。
社交媒體數(shù)據(jù)的應(yīng)用可以涵蓋洪水風(fēng)險(xiǎn)管理的全過(guò)程,具體包括災(zāi)前的洪澇監(jiān)測(cè)預(yù)警,災(zāi)中的災(zāi)情時(shí)空分析、受災(zāi)群眾的情緒與行為分析,以及通過(guò)提取文本、圖像和視頻中的災(zāi)損信息,實(shí)現(xiàn)精準(zhǔn)的災(zāi)后救災(zāi)部署和交通基礎(chǔ)設(shè)施、住房、公共服務(wù)設(shè)施等多方面的災(zāi)害損失評(píng)估。通過(guò)社交媒體數(shù)據(jù)反映的實(shí)時(shí)災(zāi)情信息,可以提高災(zāi)情統(tǒng)計(jì)結(jié)果的準(zhǔn)確度;社交媒體中反映的受災(zāi)群眾情緒與輿情走向,可以用于提高應(yīng)急管理部門的管理效率。
目前,由于多方面原因,我國(guó)應(yīng)急管理部門較少采用社交媒體數(shù)據(jù)部署救災(zāi)工作,盡管社交媒體存在地理位置模糊、虛假信息等問(wèn)題,但仍不可否認(rèn)社交媒體數(shù)據(jù)能提供大量的社會(huì)感知信息,未來(lái)研究需要在社交媒體數(shù)據(jù)處理、多源數(shù)據(jù)融合及應(yīng)急管理體系構(gòu)建方面取得突破。