郝 婧, 劉 強
(中國海洋大學工程學院, 山東 青島 266100)
隨著全球氣候變暖加劇,中國沿海地區(qū)遭受臺風風暴潮災害頻率不斷增加,人員和財產(chǎn)的損失逐漸加大,嚴重威脅人民健康安全和經(jīng)濟社會發(fā)展[1]。因此,對臺風風暴潮進行快速、有效和準確的損失評估,是保障海洋經(jīng)濟可持續(xù)發(fā)展刻不容緩的研究課題,是防災減災的重要環(huán)節(jié)。
災害損失的評估方法在災害理論上來說主要分為兩大類,一類是基于統(tǒng)計模型的評估,另一類是基于風險關聯(lián)的評估[2]?;诮y(tǒng)計模型的評估,國外有FCHLPM[3]、FPHL[4]和HAZUS[5]模型等,國內(nèi)學者趙昕等[6]運用投入產(chǎn)出模型從經(jīng)濟學角度進行了風暴潮損失評估分析。基于風險關聯(lián)的評估,主要包括危險概率評估、脆弱性曲線和指標體系評估等[2]。Manik等[7]通過GIS分析物理和人口變量,評估了沿岸風暴潮的脆弱性;Yang等[8-9]基于擴展卡爾曼濾波和極限理論建立了中國風暴潮災害風險預測模型,實現(xiàn)了對直接經(jīng)濟損失和傷亡人口的預測。目前,很多學者將機器學習方法應用于風暴潮損失評估。Sun等[10]、江斯琦等[11]、劉曉慶等[12]使用XGBoost算法、BP神經(jīng)網(wǎng)絡和ELman神經(jīng)網(wǎng)絡等機器學習方法有效的對風暴潮災害的各方面損失進行定量預測?;趯σ延械臑暮ρ芯?,各模型均有其優(yōu)缺點,為進一步提高傳統(tǒng)模型的評估效果和普適性,本文應用天牛須搜索(BAS)算法優(yōu)化ELman神經(jīng)網(wǎng)絡進行臺風風暴潮損失測度,評估結果表明該方法進一步提高了預測精確度。
廣東省坐落于中國東南沿海地區(qū),位于太平洋西岸,每年臺風風暴潮的成災率高且經(jīng)濟損失過重,因此本文選取了廣東省1995—2018年的50組記錄完整的臺風風暴潮信息及損失數(shù)據(jù)。其中臺風風暴潮信息、災害損失和氣候數(shù)據(jù)主要來源于自然資源部和《中國風暴潮災害史料集》[13],人口、設施和經(jīng)濟等數(shù)據(jù)主要來源于廣東省統(tǒng)計局。
快速準確的測度災害損失的前提是建立合理全面的災害損失指標體系,依托風險評估理論,結合臺風風暴潮的形成機制和實際數(shù)據(jù)的易取性,從氣候變化、危險性、易損性和防災減災能力4個角度構建損失評估指標體系。其中,氣候變化5個指標包括X11沿海海平面高度、X12年平均降雨量、X13年平均氣溫、X14年日照時數(shù)、X15二氧化碳濃度;危險性6個指標包括X21最大增水、X22中心最低氣壓、X23最大風力、X24最大風速、X25超警戒水位、X26災害過程持續(xù)日數(shù);易損性8個指標包括X31總人口、X32人口密度、X33人口自然增長率、X34地區(qū)生產(chǎn)總值、X35人均地區(qū)生產(chǎn)總值、X36海洋生產(chǎn)總值、X37耕地面積、X38大陸海岸線長度;防災減災能力6個指標包括X41森林覆蓋率、X42醫(yī)療衛(wèi)生機構數(shù)、X43衛(wèi)生機構人員、X44醫(yī)療機構床位數(shù)、X45人均可支配收入、X46電話普及率。災情選取了X01受災人口、X02死亡(含失蹤)人數(shù)、X03直接經(jīng)濟損失、X04農(nóng)田受災面積、X05海水養(yǎng)殖受災面積、X06海岸工程損毀、X07倒塌房屋、X08船只損毀8個指標進行損失評估。
1.2.1 熵權法-灰色關聯(lián)分析 災害損失的發(fā)生由多種因素導致,單一的指標無法全面刻畫災害信息和社會因素,但簡約冗余因素可以提高預測效率和評估準確性。灰色關聯(lián)分析法對于小樣本無規(guī)律評價問題具有較高的決策準確性,是建立在客觀數(shù)據(jù)的基礎上,計算評價指標與最優(yōu)理想方案的接近度[14]。針對于本文選取的8個災情評估指標,原始的灰色關聯(lián)分析使用平權處理或?qū)<掖蚍钟嬎汴P聯(lián)度,不能使權重達到最好的分配。但熵權法可以充分利用客觀數(shù)據(jù)的信息來確定權重,進行客觀賦權,避免了主觀臆斷對結果的影響。
1.2.2 影響因子預處理 根據(jù)熵權法的公式步驟[14],計算出災情評估8個因子的權重,如表1所示。將灰色關聯(lián)分析中災情評估的8個因子賦予權重后,根據(jù)步驟[15]得出各評價指標的關聯(lián)度進行排序,篩選出前12個指標為預測的輸入因子,其中:氣候變化相關因子包括年平均降雨量X12、年平均氣溫X13、年日照小時X14、二氧化碳濃度X15;危險性相關因子有最大增水X21、超警戒水位X25、最大風速X24、最大風力X23、災害過程持續(xù)日數(shù)X26、中心最低氣壓X22;易損性相關因子包括人口自然增長率X33;防災減災能力相關因子包括森林覆蓋率X41(見表2)。
表1 災情評估指標的權重值Table 1 Weight value of disaster assessment index
表2 前12個指標的關聯(lián)度Table 2 Correlation degree of top 12 indicators
ELman神經(jīng)網(wǎng)絡是在1990年由ELman提出的動態(tài)遞歸神經(jīng)網(wǎng)絡,在前饋網(wǎng)絡結構的隱含層中增加了一個承接層,作為延時算子來記憶和存儲隱含層前一時刻的輸出值,使該網(wǎng)絡具有時變特性,相比前饋式BP神經(jīng)網(wǎng)絡具有更強的網(wǎng)絡穩(wěn)定性和計算能力[16],其結構如圖1所示。
(u1為第一個輸入層的輸入向量;un為第n個輸入層的輸入向量;x為隱含層節(jié)點向量,xc1為第一個承接層的反饋狀態(tài)向量;xcn為第n個承接層的反饋狀態(tài)向量;y為輸出層的輸出向量;w1為承接層到隱含層的連接權值;w2為輸入層到隱含層的連接權值;w3為隱含層到輸出層的連接權值。u1 is the input vector of the first input layer; un is the input vector of the nth input layer; x is the hidden layer node vector; xc1 is the feedback state vector of the first undertaking layer; xcn is the feedback state vector of the nth undertaking layer; y is the output vector of the output layer; w1 is the connection weight from the undertaking layer to the hidden layer; w2 is the connection weight of the input layer to the hidden layer; w3 is the connection weight from the hidden layer to the output layer.)
Elman神經(jīng)網(wǎng)絡的數(shù)學模型表達式為:
y(n)=g(w3x(n)),
(1)
x(n)=f(w1xc(n)+w2(u(n-1))),
(2)
xc(n)=x(n-1)。
(3)
式中:y為輸出層的輸出向量;n為輸入層的樣本數(shù)量;g為輸出層神經(jīng)元的傳遞函數(shù);w1、w2和w3分別為承接層到隱含層、輸入層到隱含層和隱含層到輸出層的連接權值;x為隱含層節(jié)點向量;xc為承接層的反饋狀態(tài)向量;f為中間層神經(jīng)元的傳遞函數(shù),常采用Sigmoid函數(shù)。
天牛須搜索(Beetle Antennae Search,BAS)算法[17]是受天牛覓食原理啟發(fā)的新型智能算法,天牛無法分辨食物的方位,需依靠食物氣味的強弱來找到食物。食物的氣味相當于函數(shù),此函數(shù)在三維空間的任意不同值點,天牛通過兩須感知氣味的強弱,目的是尋找空間內(nèi)氣味值最強的點,通過這一原理來求解函數(shù)的最優(yōu)值。
BAS算法步驟如下[18]:
(1)建立天牛須朝向的隨機向量且歸一化處理:
(4)
式中:n為空間維度;rands為隨機函數(shù):
(2)建立天牛左右須空間向量:
(5)
(3)確定均方根誤差MSE為適應度函數(shù)fitness來判斷左右須氣味強弱,函數(shù)表達式為:
(6)
(4)迭代更新天牛位置:
(7)
式中:δt為第t次迭代時的步長因子;sign為符號函數(shù)。
傳統(tǒng)ELman神經(jīng)網(wǎng)絡進行訓練時,連接權值和閾值通常依賴于訓練者的試錯訓練和先驗經(jīng)驗,沒有一定的理論基礎依據(jù),往往導致全局搜索性差且易導致訓練失敗。BAS算法作為高效的全局尋優(yōu)算法,其優(yōu)化后的權值閾值能較大程度的提高訓練效果和網(wǎng)絡性能,避免隨機初始化導致網(wǎng)絡陷入局部最優(yōu)、網(wǎng)絡不穩(wěn)定等問題。
BAS-ELman模型構建具體步驟如下[16,18]。
(1)確定ELman網(wǎng)絡的拓撲結構。
(2)建立天牛左右須空間向量和設置步長因子。
(3)確定均方根誤差MSE為適應度評價函數(shù)f,迭代停止時函數(shù)值最小的味值為該模型最優(yōu)解。
(4)迭代更新得出最優(yōu)解,判斷適應度函數(shù)值是否達到精度要求,滿足則生成最優(yōu)解,否則繼續(xù)迭代更新。
(5)將BAS算法優(yōu)化后的最優(yōu)權值閾值帶入ELman神經(jīng)網(wǎng)絡進行二次訓練,直至誤差收斂至給定精度,訓練結束,形成最終的臺風風暴潮損失測度模型。
本次實驗按時間序列選取較近年份的10個樣本為測試集,其余40個樣本為訓練集,神經(jīng)網(wǎng)絡部分使用MATLAB自帶的神經(jīng)網(wǎng)絡工具箱。使用熵權法-灰色關聯(lián)分析篩選的12個指標作為輸入因子,災情評估中的受災人口、直接經(jīng)濟損失、海水養(yǎng)殖受災面積、海岸工程損毀分別作為輸出因子。引入均方根誤差(Root mean square error, RMSE)進行參數(shù)選擇,歸一化均方根誤差(Normalized root mean square error, NRMSE)、相關系數(shù)(Related coefficient, CC)和單次運行時間作為模型評估的檢驗指標。NRMSE越接近于0、CC越接近于1的預測效果越好,精確度越高,計算公式如下[19]:
(8)
(9)
經(jīng)過多次反復實驗,受災人口評估的BAS-Elman神經(jīng)網(wǎng)絡采用12-2-1的結構,步長更改系數(shù)eta為0.994;直接經(jīng)濟損失評估模型采用12-5-1結構,eta為0.988;海水養(yǎng)殖受災面積評估模型采用12-10-1結構,eta為0.99;海岸工程損毀評估模型采用12-3-1結構,eta為0.995,迭代次數(shù)和d0均為200次和0.5。
為了測試BAS-ELman(以下均稱:優(yōu)化BAS-Elman)模型相較于其他算法是否具有優(yōu)越性,本文選擇傳統(tǒng)的ELman神經(jīng)網(wǎng)絡、BAS-BP、隨機森林(Random forest,RF)和支持向量回歸(Support vector machine for regression,SVR)模型進行比較。同時,為了體現(xiàn)熵權法對灰色關聯(lián)分析客觀賦權的有效性,采用傳統(tǒng)平權處理的灰色關聯(lián)分析篩選出12個新輸入因子后的模型,作為對比BAS-ELman(以下均稱:BAS-Elman)模型。結果見表3、圖2所示。
表3 四種損失指標測試集擬合結果Table 3 Fitting results of four loss indicators test sets
綜上可以看出,4種災情評估指標均呈現(xiàn)優(yōu)化BAS-ELman相比于傳統(tǒng)的ELman的擬合效果更好,NRMSE平均優(yōu)化0.241,CC平均提高0.095;優(yōu)化BAS-ELman相比于BAS-BP的誤差更低,NRMSE平均優(yōu)化0.223,CC平均提高0.156;優(yōu)化BAS-ELman的預測效果優(yōu)于隨機森林模型,NRMSE平均優(yōu)化0.704,CC平均提高0.235;優(yōu)化BAS-ELman較支持向量回歸模型的預測誤差更好,NRMSE平均優(yōu)化0.501,CC平均提高0.083,雖然支持向量回歸模型在海水養(yǎng)殖受災面積的預測CC值較優(yōu),但NRMSE值較大,因此從總體的擬合效果來看,優(yōu)化BAS-ELman模型的預測準確性更高。熵權法客觀賦權灰色關聯(lián)分析的BAS-ELman模型比傳統(tǒng)模型的預測精度要好,NRMSE平均優(yōu)化0.094,CC平均提高0.115。單次預測的支持向量回歸模型收斂速度最快,優(yōu)化BAS-ELman模型相比于其他3個模型均較緩慢,但相差不大。從圖2的多個峰值預測效果可以看出,對于中小型臺風風暴潮的預測效果較好,但對于出現(xiàn)重大災害時的預測效果還需提高。從4種評估指標和6個回歸模型的整體預測效果來看,優(yōu)化BAS-ELman回歸預測模型的預測效果最佳、精確度較高,對臺風風暴潮損失測度方面具有較高的適用性。
((a)受災人口擬合結果Fitting result of affected population;(b)直接經(jīng)濟損失擬合結果Fitting result of direct economic loss;(c)海水養(yǎng)殖受災面積擬合結果。Fitting result of affected area of mariculture;(d)海岸工程損毀擬合結果Fitting result of damage of coastal engineering.)
本文從氣候變化、危險性、易損性和防災減災能力4個方面構建臺風風暴潮損失評估指標體系,基于8個災情評估指標篩選主要影響因子,通過熵權法對灰色關聯(lián)分析進行8個災情評估指標的客觀賦權,篩選出與災害損失相關性較大的12個指標作為輸入因子。經(jīng)模型預測效果對比,表明熵權法優(yōu)化灰色關聯(lián)分析后篩選的指標有更好的評估效果。
使用BAS優(yōu)化ELman神經(jīng)網(wǎng)絡預測模型,將優(yōu)化后的權值和閾值帶入ELman模型中,經(jīng)對照傳統(tǒng)ELman神經(jīng)網(wǎng)絡、BAS-BP、隨機森林、支持向量回歸模型的預測效果有較大提高,避免了ELman算法出現(xiàn)的隨機初始化導致網(wǎng)絡陷入局部最優(yōu)的問題,預測模型具有較好的適用性。
本次實驗較好的對受災人口、直接經(jīng)濟損失、海水養(yǎng)殖受災面積和海岸工程損毀4種臺風風暴潮損失進行了測度,為今后研究提供了新的方法。但在樣本數(shù)據(jù)搜集時,完整數(shù)據(jù)較少,重大災情的評估樣本不足,對模型整體影響較大。需提高輸入指標的全面性,尤其氣候類數(shù)據(jù)搜集應加強GIS和遙感工具的使用,進一步提高災害損失測度的準確性,為防災減災工作提供依據(jù)。