孫豐霖
中國海洋大學海洋與大氣學院, 山東 青島 266100
風暴潮災害是造成我國海洋災害損失的重要來源之一(隋意 等, 2020)。據統(tǒng)計, 從2000 年至2019年, 風暴潮災害造成的直接經濟損失占我國海洋災害總損失的92%, 人口損失也占到了總體的32%,嚴重威脅著我國沿海地區(qū)的經濟發(fā)展和人民生命財產安全。為了減輕風暴潮災害的損失, 災前及時預警、災后制定有效的救援措施顯得尤為重要, 而這一過程離不開對風暴潮致災機理的分析, 以及運用合理的模型方法, 實現風暴潮災害損失評估(王志強等, 2015; 羅金炎 等, 2020)。
目前風暴潮災害損失評估方面的研究大多集中在災害損失或災級的單一目標分類上。例如, 許啟望等(1998)采用線性、多項式、對數以及指數回歸等方法建立了風暴潮災害損失與風暴潮強度之間的關系, 但模型的擬合結果仍存在較大的提升空間;葉雯等(2004)利用感知器算法通過死亡人數、受災面積、直接經濟損失這3 個指標對災情等級進行了判斷; 謝麗等(2010)對中國風暴潮災害強度與損失之間的關系以及時序特征進行了初步的分析討論;趙領娣等(2012)探究了直接經濟損失、地區(qū)經濟密度、受災人口數、人口密度與風暴潮災害損失之間的相關關系, 并以此將災害損失劃分為5 個等級;王志強等(2015)通過對風暴潮災害人口損失與經濟損失的評估方法進行總結, 認為由于風暴潮災害損失數據的缺乏, 以及研究方法較為單一, 現有災害評估結果的實用性較低; 石先武等(2015)根據不同原則對風暴潮災害劃分等級的劃分結果進行了比較;江斯琦等(2020)利用BP 神經網絡和GIS 空間分析對風暴潮路徑進行相似度判斷, 并根據發(fā)生時期的實際環(huán)境調整風暴潮災害損失, 給出了災害損失的區(qū)間估計。
從以往學者的研究中可以發(fā)現, 探究風暴潮自然屬性和社會屬性與損失之間的定量關系的研究相對較少, 主要原因在于風暴潮災害致災過程所涉及的影響因素較多, 且相互之間的關系復雜, 整個致災過程充滿了模糊性和不確定性(紀燕新 等, 2007),加之損失評估所需的歷史數據不足(王志強 等,2015), 導致難以通過一般的定量模型來反映變量之間的關系, 因此需要選擇合理的模型方法在有限的數據樣本下表達和處理不確定性, 從而實現風暴潮災害損失評估的目標。
Dempster-Shafer 證據理論(DS 證據理論)是由Dempster(1967)提出, 并由他的學生 Shafer(1976)進一步發(fā)展, 憑借其在表達和處理不確定性方面的優(yōu)勢, 已經在目標識別、決策制定等領域得到了廣泛的應用(Yager, 2018; Chen et al, 2020; Pan et al, 2020)。該理論的核心是基本概率分配函數和DS 融合規(guī)則, 前者能夠表達信息的不確定性, 后者能夠將來自不同信息源的證據進行融合, 并根據融合結果得出結論, 這恰好能夠解決風暴潮災害損失評估所面臨的困難, 即充滿不確定性的信息融合。
對風暴潮災害而言, 影響災害損失的因素包括兩個方面: 自然因素和社會因素。為了降低模型的復雜性, 需要選擇這兩個因素中具有代表性的主要指標進行研究, 并合成證據。在自然因素方面, 由于沿海損失主要由風暴潮增水和近岸浪造成(王志強等, 2015), 因此本文選擇最大風暴增水和最大有效波高這兩個指標來衡量致災因子強度。對于社會因素, 本文選擇防災減災能力作為主要方面, 通過構建指標體系, 實現對防災減災能力的衡量。此外, 考慮證據理論的適用條件, 本文采用物元分析的思想對風暴潮直接經濟損失進行災害等級的劃分, 針對不同等級建立區(qū)間數模型, 實現證據建模的目的。
綜合上述分析, 本文從最大增水高度、最大有效波高以及防災減災能力三個方面分別生成相應的證據, 通過DS 證據融合規(guī)則可以實現最終災害等級的判斷。然而, DS 融合規(guī)則在處理證據融合過程中存在一個問題, 即所有證據均處于同等重要的位置(因為DS 融合規(guī)則滿足交換律)。但事實上, 由于信息源自身問題, 使得不同證據之間可能存在矛盾或部分矛盾的情形, 這極大地影響了信息融合的質量。針對這一不足, 許多學者提出了一些調整證據權重的方法(Chen et al, 2020; Pan et al, 2020)。受這些方法的啟發(fā), 本文提出了一種使用相關系數調整證據權重的改進Murphy 方法。相關系數通過風暴潮災害直接經濟損失與最大增水高度、最大有效波高和防災減災能力來計算。通過實證分析表明, 與樸素貝葉斯法、支持向量機、神經網絡和決策樹方法相比, 證據融合方法在風暴潮災害損失評估中所得結果的準確性較高, 且經過權重調整后的Murphy 方法的實驗結果優(yōu)于DS 融合規(guī)則和一般Murphy 方法。
風暴潮災害評估流程見圖1。首先, 利用物元模型, 將風暴潮災害直接經濟損失進行災級的劃分。然后, 計算直接經濟損失與3 個主要指標之間的相關系數, 歸一化后作為證據融合過程的權重。根據不同災級中3 個主要指標的歷史數據建立區(qū)間數模型, 利用待測樣本在 3 個主要指標上的數據生成證據, 結合證據權重進行證據融合, 從而得到災害等級的評價。下面從物元分析、證據理論、證據生成和證據融合這4 個部分進行簡要介紹。
圖1 災害評估流程Fig. 1 Flow chart of disaster loss assessment
物元分析是研究在某些條件下, 用一般方法無法達到預期目標的不相容問題的分析方法(李超,2006)。受物元分析中經典域和節(jié)域的啟發(fā), 建立如下函數來確定災害損失等級:
本文選擇風暴潮直接經濟損失值作為損失量x,進而劃分樣本災級, 并根據不同災級的特征屬性,建立災害損失的評估流程與方法。
證據理論是實現多源信息融合的重要方法之一。在證據理論中, 假設Θ={θ1,θ2, …,θn}為識別框架,θi為互不相交的命題, 2Θ={{θ1}, …, {θn}, {θ1,θ2}, …, {θ1,θ2, …,θn},?}為Θ的所有子集組成的冪集,?為空集, 定義基本概率分配函數(basic probability assignment, BPA)為m: 2Θ→[0, 1], 滿足:
在BPA 中,m(A)是對命題A賦予信度的大小,代表該證據支持命題A的程度(Chen et al, 2020)。如果m(A)>0, 則A稱為焦元, 所有的焦元組成BPA 的核, 也稱為一個證據。下面以故障識別進行舉例, 一個機器的故障包括兩種——A和B, 則該問題的識別框架為Θ={A,B}, 冪集2Θ={{A}, {B}, {A,B},?}。某個傳感器P可以通過機器的振動情況對故障進行判斷, 認為A故障的信度為0.5,B故障的信度為0.2,A故障或者B故障的信度為 0.3, 則形成證據:m(A)=0.5,m(B)=0.2,m(A,B)=0.3。證據理論的優(yōu)勢在于可通過復合命題對不確定性進行表達, 如例中的m(A,B)=0.3。
本文的證據生成方法主要參照康兵義等(2012)介紹的區(qū)間數模型。以最大風暴潮增水指標為例,首先在不同災級i(i=1, 2, …,n)下, 計算該指標數據樣本的最小值和最大值, 記為[mini, maxi], 得到區(qū)間數模型。不同災級之間的區(qū)間數可能存在相交的區(qū)域, 而這些相交的區(qū)域就是復合災級的區(qū)間數,例如災級1 和災級2 的區(qū)間數分別為[a,b]和[c,d](a 給定待測樣本最大風暴潮增水指標的指標數值h, 為了判斷該樣本的災級, 首先需要計算該指標與不同單一災級和復合災級的區(qū)間數H=[Hmin,Hmax]的相似度Sim(h,H): 其中,D(h,H)代表距離,α是支持系數, 能夠提高相似度之間的離散性, 本文取α=5(康兵義 等, 2012)。最后, 利用下式對所有單災級和復合災級的相似度進行歸一化, 即可得到該指標判斷災級的證據, 為證據融合過程提供原始信息。 當從多個信息源得到證據時, 需要將這些證據按照一定的規(guī)則進行融合, 從而實現目標的識別和判斷。在證據理論中, Dempster 融合規(guī)則可以將相互獨立的證據m1和m2進行融合: 其中, 權重ωi反映了證據的來源指標對災害損失的重要性, 即計算指標Ii與風暴潮直接經濟損失Lost之間的相關系數corr, 并歸一化: 由于Murphy 方法中MAE 的計算采用簡單平均的方法, 忽視了不同證據源的重要性存在差異的事實。同時, 以往的改進方法大多從證據之間的距離和熵等方面定義證據權重, 權重隨著證據的不同也會發(fā)生變化。而本文研究目標是建立自然和社會屬性指標與風暴潮災害損失評估之間的關系, 證據權重反映了指標造成風暴潮災害損失的影響程度大小,需要根據損失與指標的相關關系來確定證據權重,因此本文通過相關系數來確定證據權重的方法更為合理。 風暴潮災害損失是自然和社會兩個方面造成的結果。由于風暴潮損失的致災因子是潮位升高及近岸浪, 因此選擇最大風暴潮增水和最大有效波高來衡量。隨著政府對防災減災工作的重視程度不斷增加, 防災減災能力在風暴潮災害損失過程中也扮演著重要角色。因此, 本文通過多個相關指標來反映防災減災能力, 包括GDP、一般公共預算支出、鐵路公路網密度、移動電話數量、森林覆蓋率、醫(yī)院數量、醫(yī)生數量、床位數量等(數據來自1990—2019年的《中國統(tǒng)計年鑒》), 并通過主客觀賦權方法得到防災減災能力的衡量。 為驗證本文方法的有效性, 采用留一法驗證本文方法對災級判斷的準確率, 即隨機抽取一個樣本作為測試樣本, 以剩余樣本作為訓練集建立區(qū)間數模型, 將測試樣本按照1.3 節(jié)的證據生成方法形成3個證據, 并采用1.4 節(jié)的證據融合方法進行信息融合, 采用Pignistic 概率來確定最終災級的歸屬。將這個隨機過程循環(huán)所有樣本, 以保證結果的穩(wěn)定性。所有樣本的實際災級、各個證據的預測結果以及最終融合結果見表1。 表1 樣本數據及留一法樣本測試結果Tab. 1 Sample data and results of the leave-one-out method 根據1.4 節(jié)中的證據融合規(guī)則, 在證據融合前,需要使用證據權重來調整證據間的沖突性。分別計算防災減災能力、最大增水高度以及最大有效波高與直接經濟損失之間的相關系數, 并將相關系數的絕對值進行歸一化, 得到防災減災能力、最大增水高度以及最大有效波高3 個證據的權重向量, 記為: 從證據權重結果來看, 防災減災能力和最大風暴潮增水對災害損失的影響最大, 最大有效波高對損失的影響相對較小, 這符合風暴潮致災機理分析的結果(王志強 等, 2015)。因此, 在證據融合中, 防災減災能力和最大增水高度所得到的證據對最終證據融合的影響最大。 從測試集模擬結果(表2)來看, 本文方法判斷災級的總正確率達到93.1%。其中, 三級的正確率達到100%, 一級和二級的正確率也在90%左右, 說明本文方法在識別風暴潮災害損失的災級上效果比較理想。本文方法共出現2 次錯判, 分別為200010 號和200108 號風暴潮, 在這兩組樣本中, 防災減災能力和最大增水高度所生成的證據均判斷為三級, 導致最終預測結果偏大。 表2 風暴潮災害災級識別結果Tab. 2 Results of disaster loss level for storm surge 為了驗證本文1.4 節(jié)調整權重方法的有效性,采用DS 融合規(guī)則和一般Murphy 方法進行信息融合,發(fā)現這兩種融合規(guī)則的識別正確率均為83%, 低于本文方法的正確率。 下面采用樸素貝葉斯、支持向量機、神經網絡以及決策樹等方法對災級進行識別, 并與本文方法進行對比。輸入變量為防災減災能力、最大風暴潮增水和最大有效波高, 采用留一法對災害損失識別的正確率進行模擬。從表3 可見, 識別正確率由大到小為: 本文方法>樸素貝葉斯>支持向量機>神經網絡>決策樹。災級為一級樣本中, 幾種方法的正確率差距不大; 而在二級樣本識別中, 支持向量機和決策樹方法表現較差; 在三級樣本中, 樸素貝葉斯和神經網絡識別能力較差。造成這個結果的原因可能在于本文訓練模型的樣本量不夠, 而支持向量機、神經網絡等方法需要大量的訓練樣本來發(fā)現樣本中的規(guī)律, 以提高模型的準確度, 因此在樣本量不大的情況下, 這些方法難以充分發(fā)揮自身優(yōu)勢。 表3 多種方法的結果比較Tab. 3 Comparison of results of five methods 綜上所述, 本文方法無論是整體識別正確率,還是單類樣本的識別正確率, 均優(yōu)于樸素貝葉斯、支持向量機、神經網絡等常用的方法, 且證據融合方法所需樣本量不大、計算量小、易于實現, 可以作為一種風暴潮災害損失評估的方法。 風暴潮是威脅我國沿海地區(qū)社會和經濟安全的主要海洋災害之一, 實現風暴潮災害損失評估對防災減災工作尤為重要。本文給出了一種基于Dempster-Shafer 證據理論的風暴潮災害損害評估方法, 分別從風暴潮增水、海浪以及防災減災能力3個方面生成風暴潮災害損失評估的證據, 對風暴潮致災過程中的不確定性進行合理的表達和處理。同時, 在證據融合過程中, 本文提出了一種改進的Murphy 證據融合算法, 所用權重并非為以往所使用的相等權重, 而是根據指標與損失之間的相關性大小計算證據的權重, 該權重更能符合指標對風暴潮災害損失的影響程度。在實證分析中, 以福建省為例, 根據本文提出的方法對風暴潮災害損失進行模擬, 結果發(fā)現本文方法對風暴潮災害損失等級判斷的平均準確率達到93.1%, 在災害等級一、二、三級的測試樣本中, 準確率分別達到92.3%、87.5%和100%, 優(yōu)于樸素貝葉斯、神經網絡、支持向量機和決策樹等模型。相較于傳統(tǒng)Murphy 方法, 本文方法的平均準確率得到了約10.1%的提升。 此外, 本文方法計算量小, 隨著訓練樣本數量的不斷增加, 可以對模型訓練集作進一步擴充, 使災害損失的劃分更為細致, 從而使該方法能夠適應更加精細的災害損失評估。本文是風暴潮災害損失評估與證據理論結合的初步研究結果, 在未來風暴潮災害損失的評估中, 可以嘗試納入更多的影響指標, 進行更多證據的融合, 從而進一步提升該方法的預測精度。本文給出的災害損失評估方法也可以應用于其他類型的自然災害損失評估工作中, 如何選擇合適的影響因素是解決這些問題的關鍵。1.4 證據融合規(guī)則
2 實證分析
3 結論與討論