黃崇福,田 雯,,王潤東
(1.北京師范大學,環(huán)境演變與自然災害教育部重點實驗室,北京 100875; 2.應急管理部/教育部減災與應急管理研究院,北京 100875)
《國家綜合防災減災規(guī)劃(2016—2020年)》明確提出,確保自然災害發(fā)生12 小時之內(nèi)受災人員基本生活得到有效救助。在研的國家重點研發(fā)計劃項目“重大自然災害評估、救助與恢復重建技術研究與示范”(2018-2021年)考核要求,重大自然災害啟動應急響應起算的3小時內(nèi),所制定的救助方案中,救助資源須精準配置災區(qū)的救助需求,最大限度地發(fā)揮救助資源的效用。由于重大自然災害發(fā)生后的幾個小時內(nèi),人們?nèi)λ丫仁転娜藛T,救助需求并不明了,因此,急需關鍵技術,快速而較準確地評估救助需求,較大程度提高精準救助決策能力,確保受災人員在災后12小時內(nèi)得到有效救助。
救助需求與災情有必然的聯(lián)系,但救助需求復雜而多變。國內(nèi)外對災情的快速評估,已有大量的研究和實踐[1-3]。廣泛使用的HAZUS、PAGER等系統(tǒng),雖已有了互聯(lián)網(wǎng)的元素,但主要功能,還是用經(jīng)驗、半經(jīng)驗和分析模型:根據(jù)記錄或推測到的自然事件量級,用統(tǒng)計回歸歷史災害數(shù)據(jù)得出的經(jīng)驗公式,根據(jù)災區(qū)的自然和社會經(jīng)濟情況,推測出人員傷亡等災情。例如,一旦發(fā)生破壞性地震,可根據(jù)震級對災情進行粗估[4]。這類遠隔千山萬水的快速評估,我們稱之為“隔空判災”[5],缺點是精度較低,大多只能保證不出數(shù)量級錯誤(相差在10倍之內(nèi)),而且只能在縣或縣以上地理單元進行[6],無法細化到鄉(xiāng)鎮(zhèn),評估結(jié)果支撐不了精準救助。
互聯(lián)網(wǎng)的普及,為較高精度地快速評估災情和救助需求,提供了一條路徑,文中稱之為“采點外推”:由已觀測地理單元得到的數(shù)據(jù),推測空白地理單元中的情況。已觀測單元是采點,空白單元是信息孤島。外推的依據(jù),是從已觀測地理單元得到的數(shù)據(jù)中總結(jié)的因果關系。推測,是一種判斷各種各樣情況的行為,甚至于有純主觀性的層次分析法[7],半主觀的模糊綜合評價[8],常見的則是統(tǒng)計回歸[9]。
當我們將災情或救助需求以地理單元為數(shù)據(jù)采集點時,災后第一時間能獲得的數(shù)據(jù)量并不多,樣本較小,加之非線性問題,傳統(tǒng)的統(tǒng)計回歸,精度難以保證。信息擴散模型對樣本容量的要求不高,能構(gòu)造出可用的因果型模糊關系[10],而且,信息擴散原理不僅在概率空間有效,Mako用解析幾何學的方式證明了在幾何空間中也有效[11],從而產(chǎn)生了地理空間上的信息擴散技術,我們能夠借助自然屬性和社會經(jīng)濟屬性的背景數(shù)據(jù)推測空白單元的災情數(shù)據(jù)[5],自然也可以實現(xiàn)災害救助需求推測。雖然人們也可以利用傳染病模型近似模擬災害擴散過程,預測救助需求[12],但沒有采點信息的支持,只能是空談。應用可變集理論建立災害應急物資分配模型[13],需用人的經(jīng)驗知識對各種目標相對重要度進行量化,更不具有客觀性。
“采點外推”的基礎是及時獲得災區(qū)現(xiàn)場的部分信息。這一工作,只能在互聯(lián)網(wǎng)平臺上才能實現(xiàn)。我們在智聯(lián)網(wǎng)[14]中加上救助需求模塊,使之能在線推測信息孤島中災情和救助需求。這類的智聯(lián)網(wǎng),稱為救災智聯(lián)網(wǎng)[15]。本文以采點外推重大自然災害中信息孤島應急救助需求為目的,研究有針對性的空間信息擴散模型,并以2019年長寧6.0級地震為例,演示了推測過程。
為便于讀者較系統(tǒng)地了解本文的工作,我們先界定一些與救助需求相關的概念,然后介紹智聯(lián)網(wǎng)中的救助需求模塊。以此為基礎,才展開空間信息擴散模型和案例的研究。
2007年11月1日起施行的《中華人民共和國突發(fā)事件應對法》,自然災害事件發(fā)生后,人民政府采取應急處置措施,保障食品、飲用水、燃料等基本生活必需品的供應。根據(jù)中華人民共和國國務院于2010年7月8日發(fā)布,自2010年9月1日起施行《自然災害救助條例》,人民政府須緊急轉(zhuǎn)移安置受災人員;緊急調(diào)撥、運輸自然災害救助應急資金和物資,及時向受災人員提供食品、飲用水、衣被、取暖、臨時住所、醫(yī)療防疫等應急救助,保障受災人員基本生活。
重大自然災害救助屬于社會救助的子系統(tǒng)[16],指某地發(fā)生自然災害且對當?shù)丶跋嚓P地區(qū)造成重大破壞后,政府組織社會各界力量對受災地區(qū)災民進行緊急搶救和援助,使災區(qū)盡快恢復災前狀態(tài)。而隨著研究的深入,災害救助需求的范圍逐步豐富,不僅包括物質(zhì)需求,還包括精神需求、心理需求,即災后情感的溝通、心理的恢復。具有代表性的研究,如孫燕娜等[17]認為救助需求是指當某種自然災害突然發(fā)生,災害發(fā)生地區(qū)的居民身體和房屋受到損害,日常生活受到破壞,災民為維持身心健康和基本生活,對外界提出生命生活心理救助的需要。王玉海等[18]認為災害救助需求不僅僅是物資需求,還有更為特別的心理需求,不只立足于災民的個體需求,還有更為重要的安全秩序整體需求,即基于災民整體的治安保障需求和生命線需求,以及基于災民個體的生命健康需求、生活保障需求和心理撫慰需求。綜上,災害救助的各種需求可歸結(jié)為恢復災前狀態(tài)的需要。
廣義而言,災后的人員搜救活動和對災區(qū)的物資援助等許多工作,甚至于宣傳鼓動,都屬于自然災害應急救助的任務。顯然,羅列萬象的應急救助任務涉及的救助需求,并不必都要及時滿足。但文中所指大災中的救助需求,僅指災民對食品、飲用水、衣被、取暖、臨時住所、醫(yī)療防疫等應急物資的需求。
早在1972年,聯(lián)合國經(jīng)濟委員會為拉丁美洲和加勒比地區(qū)提出的損害和損失評估(Damage and Loss Assessment, DaLA)方法中,就已經(jīng)考慮了災害對個人生計和收入的影響。目前,聯(lián)合國相機構(gòu)對救助需求評估主要涵蓋4 個方面的內(nèi)容:①評估災害對社會產(chǎn)生的影響;②災害應急搶險需求與方案優(yōu)化;③救助資源可獲得性;④促進和加速災后恢復與區(qū)域發(fā)展的可行性。2012年8月28日,我國民政部印發(fā)《關于加強自然災害救助評估工作的指導意見》包括倒損農(nóng)房重建救助需求評估、過渡期救助需求評估、冬春救助需求評估以及相應的倒損農(nóng)房恢復重建救助、過渡期救助和冬春救助工作的災后救助績效評估。
通常,人們將救助需求評估,作為災害救助評估一部分,被認為是一種用于決策、控制與規(guī)劃自然災害應急救助活動管理的重要手段[19-21]。陳鵬等[22]將自然災害救助評估按照應急救助過程分為為災害應急救助活動提供決策支持的自然災害應急快速評估、為災害恢復重建提供決策支持的災后詳細評估,其中,應急快速評估以災情評估和應急救助需求評估為主要內(nèi)容。胡俊鋒等[23]認為救援救助反映區(qū)域綜合減災能力。廖永豐等[19]認為救助需求與救助資源可獲得性是災害救助評估的核心。因此,災害救助評估重點在于災害救助需求的評估。如今,災害救助需求評估對象逐漸由傳統(tǒng)的受災個體外延到社會影響、經(jīng)濟以及生態(tài)環(huán)境等。
從災害應急決策的理想化角度講,救助需求評估,應該細化到各受災點對各種應急物資的需求量。根據(jù)大量的歷史救災實踐和數(shù)據(jù),很容易用回歸方法隔空對各種應急物資的需求量進行評估,但對鄉(xiāng)鎮(zhèn)而言,精度太低,支撐不了精準救助。
本文根據(jù)“采點外推”的原理,由已觀測地理單元得到的(并非隔空評估所得),能表征應急救助需求的數(shù)據(jù),推測空白地理單元中的救助需求。在已觀測地理單元數(shù)量遠大于空白地理單元數(shù)量時,空白地理單元稱為信息孤島。由于大災后第一時間,須全力組織搜救,盡最大努力減少人員傷亡,防范次生災害發(fā)生,短時間內(nèi),無法統(tǒng)計并核實各種應急物資的具體需求量,“采點外推”只能推測出與應急救助需求相關的某種表征量。具體應急物資的需求量,則是根據(jù)表征量與需求量的關系,建立回歸關系,進行評估。本文所指大災中救助需求的評估,是指對信息孤島中救助需求強度的評估,而非應急物資需求量的具體評估。
由于“采點外推”須依據(jù)已觀測地理單元得到數(shù)據(jù),推測空白地理單元中的救助需求,所以本文所指大災中救助需求的推測,是指用周邊已知事實對信息孤島內(nèi)情況的推測。這種推測,是以各地理單元的自然屬性和社會經(jīng)濟屬性等背景數(shù)據(jù)為橋梁而實現(xiàn)的。
應急響應精準救助的要點是“快”?!安牲c外推”必須依托互聯(lián)網(wǎng),只有能及時采集和處理數(shù)據(jù),在規(guī)定的時間之內(nèi),推測信息孤島中救助需求。任何離線系統(tǒng),都承擔不了這項工作。我們將本文建議的空間信息擴散模型,嵌入智聯(lián)網(wǎng),形成救災智聯(lián)網(wǎng)中的救助需求模塊。
由互聯(lián)網(wǎng)聯(lián)結(jié)多個智能體,并通過嵌入的模型集個體小智慧為群體大智慧的網(wǎng)絡平臺,稱為智聯(lián)網(wǎng),用于風險分析可緩解假設規(guī)律、數(shù)據(jù)不足、風險變化、難保可靠等4個問題[24]。目前,在自然災害研究領域,人們已經(jīng)研制出6個智聯(lián)網(wǎng)平臺。臺風災害風險分析智聯(lián)網(wǎng)[25]中以柔性知識捕獲器作為處理模型,應用于溫州地區(qū)的臺風災害水產(chǎn)養(yǎng)殖保險的可行性需求調(diào)查,對智聯(lián)網(wǎng)平臺的理念和模型進行了成功的驗證。內(nèi)澇風險分析智聯(lián)網(wǎng)服務平臺[26]使用屬性拼圖技術對原始的經(jīng)驗信息進行優(yōu)化整合,通過“雨強-水深”模糊關系模型,在線實現(xiàn)了基于降雨強度的積水風險估計。海洋環(huán)境風險管理智聯(lián)網(wǎng)平臺[27]智聯(lián)網(wǎng)平臺信息來源和預處理方面提出優(yōu)化方案,即中心化信息收集技術,并在圍填海造地項目對天津自然災害抵御能力的影響評價實例研究中取得良好效果。地震宏觀異常的智聯(lián)網(wǎng)服務平臺[28]基于模糊數(shù)學方法,將一線地震工作者對地震宏觀異常群強度的經(jīng)驗判斷值作為輸入,建立了以模糊關系矩陣表達的共識性宏觀異常群測度空間,為通過觀測震前宏觀異常來預報地震提供了一種可能的輔助手段。風險時效性評價的智聯(lián)網(wǎng)服務平臺[29]借助因素藤理論構(gòu)建了風險時效性評價模型,并用于北京延慶區(qū)果樹冰雹災害概率風險評價。風險溝通智聯(lián)網(wǎng)服務平臺[30]搭建了針對洪水災害的風險溝通平臺,并將其嘗試用于寧波市洪水災害風險管理實踐。上述智聯(lián)網(wǎng),是為風險分析和管理而研制,對反應時間并無要求。推測信息孤島中救助需求的救災智聯(lián)網(wǎng),則要求在很短時間內(nèi)完成工作。因此,除了嵌入推測需要的數(shù)學模型,還需要有災前的背景數(shù)據(jù)庫,更需要采集災后信息的工具。
在救災智聯(lián)網(wǎng)中,我們使用MySQL作為數(shù)據(jù)庫管理系統(tǒng),使用服務器端網(wǎng)絡編程語言PHP來進行數(shù)據(jù)庫操作和數(shù)學計算,并使用HTML等前端語言將數(shù)據(jù)庫中的信息按照用戶要求的方式,通過終端界面來呈現(xiàn)給用戶,而采集災后信息的工具是網(wǎng)絡爬蟲。
救災智聯(lián)網(wǎng)數(shù)據(jù)庫包括背景數(shù)據(jù)、災情數(shù)據(jù)、用戶信息3個主體,對應設計3張數(shù)據(jù)表[15],如圖1所示。救災智聯(lián)網(wǎng)的用戶為災害管理人員,用戶信息表包括編號、姓名、學歷、工作單位等字段,用于記錄其基本身份信息,同時據(jù)此劃分用戶等級,對應享有不同的數(shù)據(jù)管理權(quán)限。背景數(shù)據(jù)表和災情數(shù)據(jù)表均以研究區(qū)行政單元為單位進行記錄,前者用于記錄各行政單元的自然地理屬性和政治經(jīng)濟屬性,后者用于記錄災害發(fā)生后各行政單元的災情信息。背景數(shù)據(jù)表的完善需要在實際應用前完成,屬于數(shù)據(jù)庫中的基礎數(shù)據(jù),可依據(jù)統(tǒng)計年鑒等進行日常維護。災情數(shù)據(jù)表中的各字段是隨著災害發(fā)展而動態(tài)變化的,在救災期間由災害管理人員進行實時更新,同時也作為快速評估的輸出值以彌補統(tǒng)計途徑所得數(shù)據(jù)的不完備。
圖1 救災智聯(lián)網(wǎng)數(shù)據(jù)庫結(jié)構(gòu)Fig.1 Database structure of Internet of Intelligences
模型計算代碼單獨編寫進PHP文件并歸于控制器模塊,實現(xiàn)與數(shù)據(jù)庫的交互,即數(shù)據(jù)讀取和更新。開發(fā)工作用Yii框架,采用模塊-視圖-控制器(Model-View-Controller,MVC)的基本模式,其中模型代表數(shù)據(jù)、業(yè)務邏輯和規(guī)則,視圖展示模型的輸出,控制器接受出入并將其轉(zhuǎn)換為模型和視圖命令。采用Yii框架來搭建救災智聯(lián)網(wǎng)時,借助了其gii模塊快速生成模型、視圖和控制器模板,不需要重新編寫業(yè)務邏輯,從而可以極大地壓縮開發(fā)周期。在救災智聯(lián)網(wǎng)平臺中嵌入災情快速評估模塊,充分發(fā)揮MVC模式邏輯清晰的特點,將任務合理分配至3個模塊中配合實現(xiàn)。
災情快速評估模塊需及時采集和處理數(shù)據(jù),互聯(lián)網(wǎng)時代的到來使得災情數(shù)據(jù)的實時獲取成為可能。據(jù)《中國互聯(lián)網(wǎng)發(fā)展報告2019》顯示,我國網(wǎng)民規(guī)模已達8.54億人,互聯(lián)網(wǎng)普及率達61.2%,網(wǎng)站數(shù)量518萬個[32],因此,網(wǎng)絡數(shù)據(jù)是災情背景數(shù)據(jù)的重要數(shù)據(jù)源。目前,數(shù)據(jù)采集方法主要有4大類,即數(shù)據(jù)庫采集,采集對象需為開放性數(shù)據(jù)庫;系統(tǒng)日志采集,主要用于收集業(yè)務平臺日常產(chǎn)生的大量日志數(shù)據(jù);基于智能終端的感知設備數(shù)據(jù)采集,對智能終端的數(shù)量和質(zhì)量要求較高;基于網(wǎng)絡爬蟲和API的網(wǎng)絡數(shù)據(jù)采集,其中,網(wǎng)絡爬蟲又稱為Web信息采集器,是一種按照一定的規(guī)則從網(wǎng)站上自動下載網(wǎng)絡資源的計算機技術[33],它能夠高效率的批量下載網(wǎng)絡數(shù)據(jù),且能夠獲取位置信息[34],更為符合救災智聯(lián)網(wǎng)的背景數(shù)據(jù)采集需求和數(shù)據(jù)源特點,因此,救災智聯(lián)網(wǎng)使用Python編程語言編寫網(wǎng)絡爬蟲程序,收集與災情和緊急救援有關的互聯(lián)網(wǎng)上的信息,包括指定關鍵字用從微博和微信收集信息。此外,我們提供了一種改進的基于屬性向量的TextRank算法[31],用于數(shù)據(jù)挖掘和處理,該算法可以獲取災難說明,以幫助決策者了解災難情況。其技術路徑如圖2所示。
圖2 災情數(shù)據(jù)獲取路徑Fig.2 Path of disaster data crawler
在重大自然災害救助中出現(xiàn)信息孤島時,有兩條途徑來獲得信息。一條途徑是盡快同孤島中的災民取得聯(lián)系;另一條途徑是用數(shù)學模型進行插值。由于時間或成本的制約,途徑一常常走不通;由于有一定跨度的相鄰地理單元上的大多數(shù)地理特征的屬性值并不連續(xù),插值法生成的數(shù)據(jù),并無價值。
用地理空間信息擴散模型來推測信息孤島的救助需求,基本原理是將信息孤島周邊的救助需求信息,擴散到信息孤島中去。災區(qū)各地理單元中的背景數(shù)據(jù),為信息擴散起到橋梁作用。
不失一般性,假設某一重大自然災害發(fā)生后,待救助區(qū)域G由n個地理單元g1,g2, ...,gn組成,其中q個地理單元的救助需求已知,n-q個的救助需求未知,且n-q遠遠小于q。救助需求已知的地理單元稱為已觀測單元,救助需求未知的地理單元稱為空白單元。信息孤島是救助需求未知的空白地理單元,量不多,有n-q個。同時,我們假設所有地理單元的自然地理特征、人口、經(jīng)濟狀況、自救能力等背景數(shù)據(jù)已知。這類與救助需求有關且能在災害發(fā)生前就能收集備用的數(shù)據(jù),稱為背景數(shù)據(jù)。
設一個地理單元的背景數(shù)據(jù)有t個分量,記為x1,x2,…,xt。救助需求記為y。于是,重大自然災害發(fā)生后,我們能獲得個一個數(shù)據(jù)集:
W={w1,w2,…,wq}
={(x11,x12,…,x1t,y1),(x21,x22,…,x2t,y2),…,(xq1,xq2,…,xqt,yq)}.
(1)
式中,wi=(xi1,xi2,...,xit,yi),i=1,2,…,q,是第i個地理單元的背景數(shù)據(jù)和救助需求數(shù)據(jù)。我們稱W為救助需求學習樣本。
用空間信息擴散模型推測救助需求,就是用信息擴散方式從W中學習y與x1,x2,...,xt的模糊關系,從而由信息孤島地理單元的背景數(shù)據(jù),推測救助需求。類似的工作,由傳統(tǒng)的統(tǒng)計回歸和人工神經(jīng)元網(wǎng)絡,都可以做。但多元統(tǒng)計回歸的樣本須很大,人工神經(jīng)元網(wǎng)絡遇到樣本點之間不協(xié)調(diào)時無法收斂。信息擴散模型則同時解決了這兩個問題。
空間信息擴散模型由多維正態(tài)擴散、模糊關系生成和近似推理三部分組成。
將式(1)W中第j個背景數(shù)據(jù)分量組成的集合記為Xj,即
Xj={x1j,x2j,…,xqj},j=1,2,…,t.
(2)
W中所有救助需求組成的集合記為Y,即
Y={y1,y2,…,yq}.
(3)
設Uj,j=1,2,...,t是用于擴散背景數(shù)據(jù)Xj,j=1,2,...,t的監(jiān)控空間,而Ut+1是用于擴散救助需求數(shù)據(jù)Y。令λ=t+1,則背景數(shù)據(jù)監(jiān)控空間和救助需求監(jiān)控空間構(gòu)成了一個λ維監(jiān)控空間:
U1×U2…×Uλ.
(4)
式中,Uj={uj1,uj2,…,ujmj},j=1,2,…,λ理論上講,監(jiān)控空間中的監(jiān)控點個數(shù)mj,可以因j的不同而不同,但為方便起見,通常所有監(jiān)控空間中的監(jiān)控點個數(shù)都用同一個數(shù),并記為m。
令xiλ=yi,i=1,2,…,q,式(1)中W的樣本點wi=(xi1,xi2,…,xit,yi),記為λ維樣本點:
xi=(xi1,xi2,…,xiλ)∈W.
(5)
式(4)中的一個λ維監(jiān)控點記為,
u=(u1k1,u2k2,…,uλkλ)∈U1×U2…×Uλ.
(6)
(此處kj∈{1,2,…,m},j=1,2,…,λ),我們用式(7)的λ維正態(tài)擴散公式,將x的信息擴散到u.
(7)
式中的擴散系數(shù)hj根據(jù)式(1)中的背景數(shù)據(jù)和救助需求數(shù)據(jù),分別用式(8)進行計算[10]。
(8)
令
(9)
我們獲得了一個U1×U2…×Uλ上的,由已觀測單元得到的救助需求學習樣本W(wǎng)的信息矩陣,如式(10)所示:
(10)
?kλ∈{1,2,…,m},令
(11)
和
(12)
我們依據(jù)學習樣本W(wǎng),構(gòu)造出了背景數(shù)據(jù)x1,x2,…,xt和救助需求y之間的因果型模糊關系矩陣:
(13)
設z=(z1,z2,…,zt)為空白單元的背景數(shù)據(jù),且
uλ-1=(u1k1,u2k2,…,uλ-1kλ-1)∈U1×U2…×Uλ-1.
我們可以用式(14)的λ-1線性信息分配公式將此z變?yōu)檎撚騏1×U2…×Uλ-1上的一個模糊集,并取其隸屬度最大值用式(15)進行歸一化。
(14)
式中
(15)
ak1k2…kλ-1,kj=1,2,…,m,j=1,2,…,λ-1.
(16)
(17)
需要說明的是,在推測信息孤島中救助需求時,我們使用的是多維線性信息分配公式將背景數(shù)據(jù)轉(zhuǎn)化為模糊輸入,而不是通??臻g信息擴散模型中使用的多維正態(tài)信息擴散公式[35]。主要原因是,當可學習的樣本點只有10個或稍多一點的話,統(tǒng)計規(guī)律并不明顯,用較為粗糙的線性信息分配公式,符合反精確原理[36],可達到更好的效果。
以背景數(shù)據(jù)作為推測空白單元的橋梁,可以將已有觀測數(shù)據(jù)的地理單元上的信息擴散到空白單元。只有背景數(shù)據(jù)與救助需求存在顯著的因果關系,用地理空間信息擴散模型得出的救助需求才能較好地反應真實情況。根據(jù)大量數(shù)據(jù)分析,我們選用相對暴露度、人口,以及GDP作為推測救助需求的背景數(shù)據(jù)??臻g信息擴散模型在救災智聯(lián)網(wǎng)的作用如圖3所示。
圖3 空間信息擴散模型在救災智聯(lián)網(wǎng)推測救助需求的示意圖Fig.3 Inference of rescue need in Internet of Intelligences based on geospacial information dissusion technology
這里的暴露度,是指提自然災害風險暴露度,即,生命和財產(chǎn)在未來是否容易遭受自然事件或力量打擊的一種狀態(tài)。度量“相對暴露”比度量“暴露”容易一些。設A,B是兩個面對同一風險源的風險承受體。如果此風險源暴發(fā)時,A比B更容易遭受打擊,稱A的相對暴露比B高[37]。
例如,對易發(fā)洪水的某一河流而言,離河較近的村子,相對暴露較高;地勢較高的村子,相對暴露較低。約定相對暴露度最高的村子其相對暴露度為1,其它村子的相對暴露度,就可以通過與最高者的比較而確定下來。只有兩個風險承受體與同一風險源的關系完全相同時,他們自身的屬性,才會左右各自的相對暴露度。在同一設防水平下,人口和財富較多的風險承受體的相對暴露度比人口和財富較少者高。
2019年6月17日22時55分,四川省宜賓市長寧縣(北緯28°34′N,104°9′E)發(fā)生6.0級地震,震源深度16 km。這是當年我國大陸地區(qū)震級最高、災情最重的地震。地震災害造成四川省宜賓、樂山2市16個縣(市、區(qū))35.9萬人受災,13人死亡,9.5萬人緊急轉(zhuǎn)移安置,3 500余間房屋倒塌,22.3萬間不同程度損壞,直接經(jīng)濟損失56.2億元。
長寧縣位于四川盆地南緣,宜賓市腹心地帶,經(jīng)濟發(fā)展以農(nóng)業(yè)和旅游業(yè)為主,受自然災害影響較為嚴重,應對災害的能力有限。對于地震災害來說,該區(qū)域處于較為活躍的云南昭通東側(cè)到宜賓北東向地震帶,地震災害風險較高(長寧縣地處江安、合江東西向斷裂附近,又是華瑩山、岷江、江安、合江斷裂的復合區(qū),地下介質(zhì)破碎,不易積累大量應變能量,故以弱震形式釋放),但其歷史上未發(fā)生過破壞性地震。
根據(jù)已經(jīng)獲得數(shù)據(jù)的情況,我們以長寧縣的梅硐鎮(zhèn)、雙河鎮(zhèn)、龍頭鎮(zhèn)、硐底鎮(zhèn)、花灘鎮(zhèn)、竹海鎮(zhèn)、老翁鎮(zhèn)、古河鎮(zhèn)、井江鎮(zhèn)、梅白鎮(zhèn)、銅鼓鎮(zhèn)、銅鑼鎮(zhèn)、長寧鎮(zhèn)等13個鎮(zhèn)為地理單元展開研究。
由于2020突發(fā)新冠病毒疫情的影響,本文的研究小組無法按計劃前往長寧縣,查實2019年6月17日地震發(fā)生后上述13個鎮(zhèn)各種應急物資的具體需求量。我們用啟動應急響應3小時內(nèi)網(wǎng)絡爬蟲數(shù)據(jù)中受災鄉(xiāng)鎮(zhèn)名字出現(xiàn)頻率的強弱表征應急救助需求強度。老翁鎮(zhèn)、古河鎮(zhèn)和梅白鎮(zhèn)在網(wǎng)絡爬蟲數(shù)據(jù)中沒有出現(xiàn),被視為信息信息孤島。
(1)數(shù)據(jù)來源
數(shù)據(jù)來源于基于Python的網(wǎng)絡爬蟲模塊,通過設置“長寧”、“長寧地震”、 “長寧6.0級地震”、“四川省長寧縣6.0級地震”為主題關鍵詞向量,以2019年6月17日22:55-2019年6月18日2:00為搜索時間段,以四川地區(qū)微博、新聞網(wǎng)站、長寧縣政府網(wǎng)站為數(shù)據(jù)源,共獲得四川地區(qū)微博數(shù)據(jù)17 547條、官方網(wǎng)站數(shù)據(jù)751條。
(2)數(shù)據(jù)處理
根據(jù)初步的改進TextRank算法對數(shù)據(jù)進行處理。通過增加屬性向量,即通過災害發(fā)生區(qū)域內(nèi)的鄉(xiāng)鎮(zhèn)名稱進行構(gòu)造,記為Pi。對于給定的文本W(wǎng),其中包含n個句子,經(jīng)過預處理,即通過調(diào)用python的jieba庫進行分詞處理,得到詞向量,并進一步得到各個句子的特征向量Si,進一步得到文本的特征向量矩陣,記為D={S1i,S2i,…,Sni};根據(jù)各個句子的特征向量,通過歐氏距離計算句子之間的相似度,最終得到相似度矩陣Q;對于特征空間中的每一個特征詞Ki,通過TF-IDF(term frequency-inverse document frequency)算法進行評估,確定出詞頻較高的前n個詞向量Fn;通過計算Fn中各個詞與Pi的相似度,并對其進行從(0-1]等步長賦值,得到權(quán)重向量Wn;通過相似度矩陣Qi與權(quán)重向量Wn相乘得到向量Ai,即可以選擇得分較高的幾個句子產(chǎn)生文摘,并對應輸出詞向量Fn中的關鍵詞。通過處理爬蟲所得每條數(shù)據(jù),獲得文摘數(shù)據(jù),部分災情數(shù)據(jù)如表1所示。
(3)背景數(shù)據(jù)和救助需求強度
對于各項背景數(shù)據(jù)指標值,其中,人口數(shù)據(jù)、GDP數(shù)據(jù)來源于2017長寧縣年鑒以及長寧縣委縣政府官方認證平臺;相對暴露度為通過震中距計算所得[38],計算方法為首先通過經(jīng)緯度計算各個地理單元震中距,根據(jù)震中距與相對暴露度成反比的情況[37],假設該地震的地震波衰減80km后,不會再對村鎮(zhèn)建筑物造成破壞,設A為所研究地理單元建筑物,B為震中區(qū)域建筑物,以單元1梅硐鎮(zhèn)為例,震中距αA=10.815 km,αB=0 km,則相對暴露度EA(B) = (80-10.815) / 80 = 0.865。相對暴露度的結(jié)果列入表2中。對于損失指標值,由于災后1~3個小時人口傷亡數(shù)據(jù)仍是未知數(shù),而地理單元名稱的出現(xiàn)頻率一定程度上能夠反映災害嚴重程度[39],因此,根據(jù)數(shù)據(jù)處理所得文摘,對地理單元進行詞頻統(tǒng)計,得到部分地理單元的出現(xiàn)頻率次數(shù),通過將其進行標準化,并計算各個鄉(xiāng)鎮(zhèn)出現(xiàn)頻率占總頻率的比例,得出能夠一定程度上反映災情嚴重級別的指標值,同時也反映了救助需求強度。數(shù)據(jù)結(jié)果如表2中的“救助需求強度”列所示,其他3個未知地理單元將帶入地理空間信息擴散模型進行計算。
表2 四川省宜賓市長寧縣6.0級地震災情背景數(shù)據(jù)和救助需求強度Table 2 Background data and rescue need data to Changning Ms 6.0 earthquake
由表2,我們得到容量為10的損失學習樣本:
W={w1,w2,…,w10}
={(0.865,26794,59737,0.1187),(0.947,50635,105086,0.2658),…,(0.67,108989,350800,0.1031)}
我們用空間信息擴散模型來學習此W, 構(gòu)造出以相對暴露度、人口和GDP為因,以救助需求為果的模糊關系矩陣,推測老翁鎮(zhèn)、古河鎮(zhèn)和梅白鎮(zhèn)的救助需求。
根據(jù)W中的各分量的最大、最小值,向左右各延長0.67倍,即,(最大值-最小)/1.5,在其上取20個等長的監(jiān)控點,構(gòu)成監(jiān)控空間來進行信息擴散:
U1={u1,1,u1,2,…,u1,20}={0.479,0.513, …,1.134}, 步長3.4508776E-02
U2={u2,1,u2,2,…,u2,20}={-49926,-38216.473,…,172555}, 步長11709.53
U3={u3,1,u3,2,…,u3,20}={-207306.672,-166183.016,…,574042.750}, 步長41123.65
U4={u4,1,u4,2,…,u4,20}={-0.109,-0.081,…,0.416}, 步長2.7607016E-02
這些監(jiān)控空間中的一些點,并不在其參數(shù)的定義域內(nèi)。例如,相對暴露的定義域是[0,1],但U1中的最大值是1.134。這類監(jiān)控點稱為輔助監(jiān)控點,以確保兩邊樣本點和其它點有相同的信息價值。增加延長幅度和監(jiān)控點密度,除了增加計算量之外,并不會提升模型的精度。
由式(8)計算出的相對暴露度、人口、GDP和救助需求的信息擴散系數(shù)是:
h1=0.0839,h2=28471,h3= 99990,h4= 0.0671.
對表3給出的,容量為10的救助需求學習樣本W(wǎng),用式(7)進行4維正態(tài)擴散,我們得到一個20×20×20×20的信息矩陣Q={Qk1k2k3k4}20×20×20×20。4維矩陣的書寫非常復雜,通常用降維方式來表達。對監(jiān)控點u1,10=0.789,u2,11=67169.266而言,對應信息矩陣的k1=10,k2=11, 于是4維矩陣降維為一個二維的20×20的信息矩陣{Q11k3k4}20×20。由救助需求學習樣本W(wǎng)得到的此20×20信息矩陣的中間部分是:
{Q10,11,k3,k4}20×20=…u3,8u3,9u3,10u3,11u3,12u3,13……u4,8u4,9u4,10u4,11u4,12u4,13…………………………1.93361.82611.50001.08110.70150.4336……1.81391.74141.45121.05880.69420.4329……1.49421.45711.22980.90610.59790.3740……1.08921.07750.91930.68210.45110.2810……0.71640.71780.61780.46020.30350.1866……0.44340.44920.38910.29000.18960.1136………………………?è??????????
用式(11)、(12)將其轉(zhuǎn)化為模糊關系矩陣,{r11k3k4}20×20的中間部分是:
{r10,11,k3,k4}20×20=…u3,8u3,9u3,10u3,11u3,12u3,13……u4,8u4,9u4,10u4,11u4,12u4,13…………………………0.40160.42490.43740.43980.41750.3583……0.37670.40520.42320.43070.41310.3578……0.31030.33900.35860.36860.35590.3091……0.22620.25070.26810.27750.26850.2322……0.14880.16700.18020.18720.18060.1542……0.09210.10450.11350.11800.11280.0939………………………?è??????????
對空白單元老翁鎮(zhèn)、古河鎮(zhèn)和梅白鎮(zhèn)的背景數(shù)據(jù):
z老翁鎮(zhèn)=(0.652,30876,40510),z古河鎮(zhèn)=(0.53,21625,66760),z老翁鎮(zhèn)=(0.523,22778,10009)
在式(14)、(15)中令λ-1=3,進行3維線性信息分配,分別得模糊輸入老翁鎮(zhèn),古河鎮(zhèn),梅白鎮(zhèn)。例如,老翁鎮(zhèn)中的元素a6,7,7=0.1105,a6,7,8=0.002964,a6,8,7=1。由式(16)得相應的模糊輸出。例如,
再由式(17),我們們推測出老翁鎮(zhèn)、古河鎮(zhèn)和梅白鎮(zhèn)的救助需求強度分別是:
y老翁鎮(zhèn)=0.01925,y古河鎮(zhèn)=0.004999,y梅白鎮(zhèn)=0.005328
。
根據(jù)計算結(jié)果將長寧縣各鄉(xiāng)鎮(zhèn)救助需求進行分級,并導入救災智聯(lián)網(wǎng)平臺制作災情圖,如圖4所示,可以直觀的看出此次地震各鄉(xiāng)鎮(zhèn)的救助需求緊迫程度。其中,紅色表示緊迫度高,橙色較高,藍色表示較輕。
圖4 救災智聯(lián)網(wǎng)系統(tǒng)中長寧縣6.0級地震救助需求緊迫程度展示圖Fig.4 Map of rescue need intensity of Changning Ms 6.0 earthquake(make in Internet of Intelligences)
以“隔空判災”的方式快速評估重大自然災害中的救助需求,所得結(jié)論精度過低,難以支撐精準救助。在互聯(lián)網(wǎng)普及的今天,以“采點外推”的方式獲得部分地理單元上的數(shù)據(jù),采用空間信息擴散模型推測空白地理單元中的災情情況,精度大大提高。
應急響應精準救助要求時效性強,因而“采點外推”必須依托互聯(lián)網(wǎng),才能及時采集和處理數(shù)據(jù),在規(guī)定的時間之內(nèi),推測信息孤島中救助需求。任何離線系統(tǒng),都無法實現(xiàn)這項任務。本文將空間信息擴散模型嵌入智聯(lián)網(wǎng),形成救災智聯(lián)網(wǎng)中的救助需求模塊,能較好地完成這一任務。
大災后的第一時間是盡最大努力減少人員傷亡,無法統(tǒng)計并核實各種應急物資的具體需求量。用空間信息擴散模型推測出與應急救助需求相關的某種表征量后,即可根據(jù)表征量與需求量回歸關系,評估出具體應急物資的需求量。
以網(wǎng)絡爬蟲數(shù)據(jù)中受災鄉(xiāng)鎮(zhèn)名字出現(xiàn)頻率的強弱表征應急救助需求強度,對2019年長寧6.0級地震中信息孤島鎮(zhèn)的救助需求強度的推測說明,用嵌入空間信息擴散模型的救災智聯(lián)網(wǎng),在“相對暴露度”、“人口”和“GDP”等背景數(shù)據(jù)庫和網(wǎng)絡爬蟲工具的支持下,推測信息孤島救助需求強度是可行的。
大量的計算仿真實驗結(jié)果已經(jīng)證明:空間信息擴散模型具有普適性。對于填補存在較大面積空白地理單元的區(qū)域而言,通過平均預測誤差和平均基準誤差比較的方法已經(jīng)證明:地理空間信息擴散模型比地理加權(quán)回歸和反向傳播神經(jīng)網(wǎng)絡更有效[33]。主要原因有三,一是該模型具有識別非線性關系的能力;二是該模型不同于許多空間插值模型,受空間參數(shù)連續(xù)性假設的約束;三是在采點得到的樣本中,允許存在矛盾樣本點,不同于人工神經(jīng)網(wǎng)絡,出現(xiàn)學習不收斂的問題。
雖然根據(jù)大量的歷史救災實踐和數(shù)據(jù),很容易統(tǒng)計出救助需求強度與各種應急物資需求量的關系,但本文限于支撐項目無法提供歷史數(shù)據(jù)的情況,并沒有提供這方面的研究成果。有興趣并有條件開展這方面工作的讀者,不妨一試。