陳燕璇,劉合香,譚金凱
(廣西師范學(xué)院 數(shù)學(xué)與統(tǒng)計(jì)科學(xué)學(xué)院,廣西 南寧 530023)
?
基于等距特征映射降維的臺(tái)風(fēng)災(zāi)情概率神經(jīng)網(wǎng)絡(luò)預(yù)評(píng)估模型*
陳燕璇,劉合香,譚金凱
(廣西師范學(xué)院 數(shù)學(xué)與統(tǒng)計(jì)科學(xué)學(xué)院,廣西 南寧 530023)
摘要:臺(tái)風(fēng)致災(zāi)因子、承災(zāi)體和災(zāi)情之間是一個(gè)復(fù)雜的非線性動(dòng)力系統(tǒng),準(zhǔn)確高效地提取重要指標(biāo)對(duì)臺(tái)風(fēng)災(zāi)情等級(jí)進(jìn)行預(yù)評(píng)估,是防災(zāi)救災(zāi)工作的重要依據(jù)。采用主成分分析、等距特征映射和信息熵特征提取的承災(zāi)體關(guān)鍵指標(biāo),和致災(zāi)源作為輸入神經(jīng)元,災(zāi)情等級(jí)作為輸出神經(jīng)元,建立臺(tái)風(fēng)災(zāi)情概率神經(jīng)網(wǎng)絡(luò)預(yù)評(píng)估模型。結(jié)果表明,基于等距映射非線性特征提取的概率神經(jīng)網(wǎng)絡(luò)預(yù)評(píng)估模型的準(zhǔn)確率達(dá)到90%。
關(guān)鍵詞:概率神經(jīng)網(wǎng)絡(luò);等距特征映射;信息熵;臺(tái)風(fēng);災(zāi)害;預(yù)評(píng)估
熱帶氣旋是生成于熱帶或副熱帶洋面上,具有對(duì)流和確定氣旋性環(huán)流的非鋒面性漩禍[1]。臺(tái)風(fēng)作為熱帶氣旋的一種,登陸我國(guó)的臺(tái)風(fēng)平均每年有7個(gè)左右,影響廣西的臺(tái)風(fēng)平均每年有5個(gè)左右。據(jù)不完全統(tǒng)計(jì),1984-2012年,廣西因臺(tái)風(fēng)災(zāi)害造成的受災(zāi)人數(shù)為8 148萬(wàn)人次,死亡801人,直接經(jīng)濟(jì)損失1 205億元(占?xì)庀鬄?zāi)害總經(jīng)濟(jì)損失的12.3%)[2]。災(zāi)害發(fā)生過(guò)程根據(jù)氣象致災(zāi)因子預(yù)報(bào)與承災(zāi)體脆弱性快速預(yù)測(cè)災(zāi)情等級(jí)是災(zāi)害的預(yù)評(píng)估。人工神經(jīng)網(wǎng)絡(luò)是非線性自適應(yīng)系統(tǒng),與耗散、復(fù)雜的高階非線性自然災(zāi)害系統(tǒng)相似[3],災(zāi)情等級(jí)預(yù)評(píng)估實(shí)際是人工神經(jīng)網(wǎng)絡(luò)模式識(shí)別問(wèn)題[4]。
近年來(lái),很多專家學(xué)者從不同角度對(duì)臺(tái)風(fēng)災(zāi)害進(jìn)行預(yù)評(píng)估研究[5-8]。魏章進(jìn)等[9]基于聚類與回歸方法建立臺(tái)風(fēng)災(zāi)情預(yù)評(píng)估模型;芮建勛等[10]設(shè)計(jì)了基于元組時(shí)間標(biāo)記法的臺(tái)風(fēng)災(zāi)害評(píng)估的多尺度數(shù)據(jù)管理模式。在地理信息系統(tǒng)方面,劉合香等[11]利用模糊數(shù)學(xué)、非線性數(shù)據(jù)處理方法和ArcGIS空間進(jìn)行Kriging插值,分析廣西洪澇災(zāi)害發(fā)生的頻率,結(jié)果表明洪澇多發(fā)生地與實(shí)際洪澇災(zāi)害擬合較好;劉少軍等[12]采用可拓分析方法計(jì)算綜合關(guān)聯(lián)度判斷災(zāi)害損失的等級(jí),建立基于GIS的臺(tái)風(fēng)災(zāi)害損失評(píng)估模型,以實(shí)現(xiàn)臺(tái)風(fēng)災(zāi)害動(dòng)態(tài)評(píng)估。
承災(zāi)體的脆弱性是指受到危險(xiǎn)因素威脅所有人生命和財(cái)產(chǎn)的損害程度,是災(zāi)害風(fēng)險(xiǎn)形成的關(guān)鍵因素[13],一般當(dāng)承災(zāi)體指標(biāo)比較多時(shí),會(huì)導(dǎo)致數(shù)據(jù)的高維特征,增加數(shù)據(jù)處理的困難。鞏在武等[14]利用相關(guān)分析從致災(zāi)因子、承災(zāi)體和防災(zāi)減災(zāi)能力方面選取重要影響因子,實(shí)例證明所選指標(biāo)的合理性。但相關(guān)分析只表示變量間線性關(guān)系,不能反映變量間的非線性關(guān)系,且易受觀測(cè)值影響。流形學(xué)習(xí)是根據(jù)高維數(shù)據(jù)空間的內(nèi)部幾何結(jié)構(gòu),構(gòu)造低維流形嵌入,以實(shí)現(xiàn)數(shù)據(jù)降維,提高計(jì)算效率[15]。非線性流形降維方法主要由有局部線性嵌入(LLE)和等距特征映射(ISOMAP)。黃穎等[16]利用局部線性嵌入與逐步回歸相結(jié)合的預(yù)報(bào)因子挖掘技術(shù),建立非線性人工智能集合預(yù)報(bào)模型,為臺(tái)風(fēng)強(qiáng)度客觀預(yù)報(bào)提供了新方法;等距特征映射算法(ISOMAP)是Tenenbaum等[17]于2000年提出的,它結(jié)合了主成分分析(PCA)和多維標(biāo)度法(MDS)的算法特征,在醫(yī)學(xué)方面的肺癌基因數(shù)據(jù)分析中,在低維空間揭示出數(shù)據(jù)集的本質(zhì)結(jié)構(gòu),實(shí)現(xiàn)非線性數(shù)據(jù)降維[18],而在臺(tái)風(fēng)災(zāi)害系統(tǒng)指標(biāo)降維方面的應(yīng)用還鮮為少見(jiàn)。
針對(duì)上述問(wèn)題,為了比較不同的變量選取方法的預(yù)評(píng)估效果,本研究運(yùn)用主成分分析(PCA)、等距特征映射(ISOMAP)和信息熵特征提取方法試圖建立概率神經(jīng)網(wǎng)絡(luò)模型,并將該模型應(yīng)用于臺(tái)風(fēng)災(zāi)情預(yù)評(píng)估工作中。
1模型輸入的特征提取方法
1.1ISOMAP降維方法
ISOMAP的思想關(guān)鍵在于用測(cè)地距離代替歐氏距離,通過(guò)等距映射獲得高維數(shù)據(jù)空間在低維空間的表示,更好地實(shí)現(xiàn)非線性數(shù)據(jù)降維[17]。ISOMAP算法設(shè)定K個(gè)近鄰點(diǎn)是相互連接的,通過(guò)歐氏距離構(gòu)造臨接矩陣,用Floyd算法計(jì)算樣本點(diǎn)的最短距離,作為測(cè)地距離的逼近[19],主要包括以下的步驟。
(a)構(gòu)造鄰域圖G。在空間X中的樣本點(diǎn)xi和xj,其歐氏距離為dx(i,j)。若xi是xj的K個(gè)近鄰點(diǎn)之一,說(shuō)明鄰域圖G有邊,邊長(zhǎng)為dx(i,j)。
(b)計(jì)算最短距離。當(dāng)xi和xj之間有一條邊,則dG(i,j)=dx(i,j);當(dāng)xi和xj之間無(wú)邊,則dG(i,j)= ∞;對(duì)K=1,2,…,N,dG(xi,xj)= min{dG(xi,xj),dG(xi,xk)+dG(xk,xj)},D={dG(xi,xj)}是鄰域圖G中所有點(diǎn)的最短距離構(gòu)成。
1.2信息熵方法
信息論中,若某項(xiàng)指標(biāo)提供的信息越多,則對(duì)決策的精度和可靠性越大[20]?;陟貦?quán)理論構(gòu)建臺(tái)風(fēng)災(zāi)情指數(shù),可以避免人為確定指標(biāo)權(quán)重的主觀性,具有更高的客觀性和科學(xué)性。熵權(quán)也可作為選取關(guān)鍵指標(biāo)的辦法,主要計(jì)算步驟如下所示。
(a)計(jì)算熵值Hj
(b)計(jì)算熵權(quán)ωj
(1)
2概率神經(jīng)網(wǎng)絡(luò)模型
鑒于臺(tái)風(fēng)災(zāi)情與變化的致災(zāi)氣象因子和承災(zāi)體脆弱性之間是非線性關(guān)系,復(fù)雜的相互作用和變化增加了預(yù)評(píng)估的困難。概率神經(jīng)網(wǎng)絡(luò)(PNN)是基于貝葉斯原理,構(gòu)造概率密度函數(shù)(PDF)分類估計(jì),在處理非線性問(wèn)題和模式識(shí)別方面比BP等更具有顯著優(yōu)勢(shì)[21-23]。PNN的拓?fù)浣Y(jié)構(gòu)由輸入層、模式層、求和層和輸出層組成,主要計(jì)算步驟如下所示。
(a)輸入層
將提取的承災(zāi)體關(guān)鍵指標(biāo)作為輸入層神經(jīng)元,神經(jīng)元數(shù)目與輸入樣本維數(shù)相等。
(b)模式層(神經(jīng)元與給定類別以權(quán)值連接)
(2)
式中:X為降維后提取的關(guān)鍵指標(biāo)矩陣; Xji為類別j第i個(gè)訓(xùn)練向量;m為訓(xùn)練樣本數(shù)目;δ為平滑系數(shù);P為待分類的向量X及訓(xùn)練向量的維數(shù)。
(c)求和層(屬于某一類別的概率累積)
(3)
(d)輸出層(競(jìng)爭(zhēng)神經(jīng)元)
PDF最大的神經(jīng)元輸出為1,表示所對(duì)應(yīng)的那一類為待識(shí)別的模式類別,其他輸出神經(jīng)元輸出為0,即:
(4)
3模型應(yīng)用與分析
3.1數(shù)據(jù)來(lái)源及預(yù)處理
本研究的致災(zāi)源數(shù)據(jù)來(lái)自《熱帶氣旋年鑒》中1985-2013年之間登陸或影響廣西的60個(gè)臺(tái)風(fēng)致災(zāi)的降水過(guò)程數(shù)據(jù),1985-2013年的社會(huì)經(jīng)濟(jì)情況數(shù)據(jù)取自《廣西統(tǒng)計(jì)年鑒》。災(zāi)情數(shù)據(jù)來(lái)自廣西氣象信息中心、廣西農(nóng)業(yè)廳、廣西民政廳和廣西防汛抗旱指揮部的災(zāi)情綜述統(tǒng)計(jì)。
為了消除指標(biāo)間的量綱影響,進(jìn)行歸一化處理:
(5)
式中:xmin和xmax表示同一指標(biāo)下的最小值和最大值,將指標(biāo)數(shù)據(jù)范圍壓縮到0~1之間。
3.2構(gòu)造災(zāi)情指數(shù)與劃分災(zāi)情等級(jí)
考慮到臺(tái)風(fēng)災(zāi)害對(duì)生命財(cái)產(chǎn)和社會(huì)經(jīng)濟(jì)的影響,選取受災(zāi)人口C1(萬(wàn)人)、死亡人口C2(人)、農(nóng)作物受災(zāi)面積C3(khm2)、倒塌房屋C4(千間)和直接經(jīng)濟(jì)損失C5(千萬(wàn)元)這5個(gè)指標(biāo)作為構(gòu)造災(zāi)情指數(shù)的關(guān)鍵指標(biāo)。
臺(tái)風(fēng)災(zāi)情的綜合評(píng)價(jià)方法是對(duì)各指標(biāo)在災(zāi)情評(píng)估的權(quán)重進(jìn)行確定,利用綜合指數(shù)來(lái)衡量災(zāi)情的嚴(yán)重程度[24]。本文以信息熵構(gòu)造綜合災(zāi)情指數(shù)為:
(6)
表1 基于熵權(quán)的臺(tái)風(fēng)災(zāi)情評(píng)估指標(biāo)權(quán)重
由表1可以看出,受災(zāi)人口C1和直接經(jīng)濟(jì)損失C5的權(quán)重較大,其次是農(nóng)作物受災(zāi)面積C3和倒塌房屋C4的權(quán)重,死亡人口C2的權(quán)重最小。受災(zāi)人口指的是因?yàn)?zāi)傷亡人數(shù)、因?yàn)?zāi)失蹤人數(shù)等,直接經(jīng)濟(jì)損失指的是農(nóng)業(yè)、林業(yè)、漁業(yè)和建筑及室內(nèi)財(cái)產(chǎn)的損失[25],二者是反映災(zāi)情的生命財(cái)產(chǎn)損失情況的核心指標(biāo),因此二者權(quán)重較大。而死亡人數(shù)由氣象因子導(dǎo)致的具有偶然性,受災(zāi)區(qū)經(jīng)濟(jì)、居住環(huán)境等條件影響的程度更大[26],因此其權(quán)重最小是客觀合理。根據(jù)災(zāi)情指數(shù)的大小,我們將災(zāi)情劃分為幾個(gè)等級(jí),這是災(zāi)后評(píng)價(jià)、災(zāi)情預(yù)估進(jìn)行救助與管理的重要依據(jù)。系統(tǒng)聚類方法基本思想是將個(gè)樣品分成若干類,距離最小的一對(duì)合并成新一類,計(jì)算新類與其他類之間的距離,再將距離最近的兩類合并,依次聚類直至所有的樣品合為一類為止。本文參考馬宗晉等[27]等級(jí)劃分的思想,結(jié)合系統(tǒng)聚類方法,采用歐氏距離將災(zāi)情指數(shù)劃分為5個(gè)等級(jí)(I級(jí)為微災(zāi),II級(jí)為小災(zāi),III級(jí)為中災(zāi),IV級(jí)為大災(zāi),V級(jí)為巨災(zāi))(見(jiàn)表2),避免了主觀劃分災(zāi)情指數(shù)等級(jí)。
據(jù)廣西區(qū)民政廳的災(zāi)情綜述,2008年9月24-27日全區(qū)受強(qiáng)臺(tái)風(fēng)“黑格比”的影響,受災(zāi)人口664.99萬(wàn)人,農(nóng)作物受災(zāi)面積656.570 khm2,倒塌房屋19 358間,直接經(jīng)濟(jì)損失高達(dá)69.7億元,由表2可知,災(zāi)情指數(shù)為0.621,災(zāi)情等級(jí)為大災(zāi)(IV級(jí)),是受臺(tái)風(fēng)災(zāi)害很嚴(yán)重的災(zāi)情。2013年8月14-20日全區(qū)受熱帶風(fēng)暴“尤特”的影響,造成農(nóng)作物受災(zāi)面積59.28 khm2,直接經(jīng)濟(jì)損失12.82億元,災(zāi)情指數(shù)為0.529,災(zāi)情等級(jí)為大災(zāi)(IV級(jí))。同年8月22日20時(shí)-25日20時(shí),受臺(tái)風(fēng)“潭美”減弱后的環(huán)流和西南季風(fēng)共同影響,造成9市30縣(市、區(qū))25.37萬(wàn)人受災(zāi),農(nóng)作物受災(zāi)面積15.18 khm2,直接經(jīng)濟(jì)損失6 600.82萬(wàn)元?!疤睹馈钡囊苿?dòng)速度快,在廣西的持續(xù)降水時(shí)間與“尤特”相比要短得多[28],受災(zāi)情況較為輕,由表2可知,災(zāi)情指數(shù)為0.165,災(zāi)情等級(jí)為微災(zāi)(I級(jí))。上述表明該災(zāi)情等級(jí)劃分合理,符合實(shí)際情況,可以作為災(zāi)后救助與管理的重要依據(jù)。
表2 廣西1985-2013年臺(tái)風(fēng)災(zāi)情指數(shù)與災(zāi)情等級(jí)
3.3基于ISOMAP降維、PCA降維和熵權(quán)特征提取的PNN預(yù)評(píng)估模型
承災(zāi)體是指一個(gè)地區(qū)的社會(huì)經(jīng)濟(jì)和發(fā)展?fàn)顩r,比如人員、農(nóng)作物、房屋等方面的指標(biāo)。因此,本文選取單位面積GDPB1(億元)、人口密度B2(人/km2)、農(nóng)作物總播種面積B3(khm2)、城鎮(zhèn)居民人均居住面積B4(m2)、農(nóng)村居民人均生活用房面積B5(m2)、人均GDPB6(元/人)、就業(yè)人數(shù)B7(萬(wàn)人)、每萬(wàn)人在校大學(xué)生人數(shù)B8(人)、公路網(wǎng)密度B9(km/104km2)、每萬(wàn)人擁有床位B10(床)、每萬(wàn)人擁有醫(yī)生B11(人)、電話普及率B12(部/萬(wàn)人)共12項(xiàng)指標(biāo)。在致災(zāi)源方面,本研究選取暴雨過(guò)程的時(shí)間長(zhǎng)度A1(h)、暴雨過(guò)程降水極值A(chǔ)2(mm)和暴雨過(guò)程降水均值A(chǔ)3(mm)。
通過(guò)ISOMAP方法進(jìn)行非線性降維。在構(gòu)造鄰域圖G圖時(shí),采用K-近鄰方法確定樣本鄰域,為了保持圖連通性,確定最小值K=8,用Floyd算法計(jì)算最短距離,作為測(cè)地距離的逼近,降維后的殘差曲線圖如圖1所示。
圖1 ISOMAP降維的殘差曲線圖
ISOMAP算法降維維數(shù)的方法一是當(dāng)殘差曲線出現(xiàn)拐點(diǎn),方法二是殘差值小于一定的閾值[12]。由圖1可知,當(dāng)維數(shù)降到3維時(shí),殘差曲線出現(xiàn)明顯拐點(diǎn),且殘差值為3.199×10-4<0.05,確定采用ISOMAP降維后的3維向量代表承災(zāi)體原始矩陣的多維向量。
采用主成分分析(PCA)對(duì)承災(zāi)體原始矩陣進(jìn)行線性降維,見(jiàn)表3。主成分1和主成分2的累積貢獻(xiàn)率是96%>80%,符合主成分降維的要求,將標(biāo)準(zhǔn)化后的原始數(shù)據(jù)代入主成分表達(dá)式得到承災(zāi)體主成分得分矩陣。
表3 基于PCA降維的特征值、貢獻(xiàn)率和累積貢獻(xiàn)率
采用信息熵計(jì)算承災(zāi)體各個(gè)指標(biāo)的權(quán)重,計(jì)算結(jié)果見(jiàn)表4,選取對(duì)承災(zāi)體系統(tǒng)起重要影響的指標(biāo)(權(quán)重值>0.1)為單位面積GDPB1(億元)、每萬(wàn)人擁有床位B10(床)這2項(xiàng)關(guān)鍵指標(biāo)。
表4 基于熵權(quán)的承災(zāi)體指標(biāo)提取
分別將ISOMAP降維后的三維向量、PCA降維后的主成分得分矩陣和信息熵提取的關(guān)鍵指標(biāo),聯(lián)合致災(zāi)源數(shù)據(jù)作為神經(jīng)網(wǎng)絡(luò)的輸入神經(jīng)元(矩陣p),將災(zāi)情等級(jí)作為期望輸出(矩陣t),進(jìn)行概率神經(jīng)網(wǎng)絡(luò)的分類訓(xùn)練和預(yù)測(cè)。Matlab創(chuàng)建PNN網(wǎng)絡(luò)的調(diào)用函數(shù)為net=newpnn(p,t,spread),其中,spread為網(wǎng)絡(luò)的擴(kuò)展速度,spread值過(guò)大,需較多的神經(jīng)元適應(yīng)網(wǎng)絡(luò)快速變化,計(jì)算效率差;spread值過(guò)小,需較多的神經(jīng)元適應(yīng)網(wǎng)絡(luò)緩慢變化,網(wǎng)絡(luò)訓(xùn)練性能差。經(jīng)過(guò)多次實(shí)驗(yàn),最終確定spread取0.1,創(chuàng)建的PNN是個(gè)近鄰分類器,訓(xùn)練準(zhǔn)確度高。PNN具有網(wǎng)絡(luò)訓(xùn)練性能好,訓(xùn)練不需大量樣本等優(yōu)點(diǎn),故本文選取10組登陸或影響廣西的重要臺(tái)風(fēng)災(zāi)害作為測(cè)試樣本,其他50組樣本作為訓(xùn)練樣本,PNN預(yù)測(cè)結(jié)果如圖2~4所示。
圖2 基于ISOMAP降維的PNN預(yù)評(píng)估結(jié)果
圖3 基于PCA降維的PNN預(yù)評(píng)估結(jié)果
圖4 基于信息熵特征提取的PNN預(yù)評(píng)估結(jié)果
由圖2可知,在10組預(yù)測(cè)樣本中,基于ISOMAP降維的PNN預(yù)評(píng)估只有8號(hào)樣本(1311號(hào)臺(tái)風(fēng))誤判,其他樣本預(yù)判類別和實(shí)際類別重合說(shuō)明預(yù)判準(zhǔn)確,分類效果最好。由圖3可知,基于主成分分析降維的PNN預(yù)評(píng)估中,6號(hào)樣本(1213號(hào)臺(tái)風(fēng))和8號(hào)樣本(1311號(hào)臺(tái)風(fēng))誤判,其他樣本預(yù)判準(zhǔn)確。由圖4可知,基于信息熵特征提取的重要指標(biāo)的PNN預(yù)評(píng)估模型,4號(hào)樣本(1117號(hào)臺(tái)風(fēng))、8號(hào)樣本(1311號(hào)臺(tái)風(fēng))和10號(hào)樣本(1330號(hào)臺(tái)風(fēng))誤判,其他樣本預(yù)判準(zhǔn)確?;谌N變量提取方法的PNN預(yù)評(píng)估結(jié)果對(duì)比如表5所示。
根據(jù)表5可知,基于ISOMAP降維的PNN預(yù)測(cè)災(zāi)情等級(jí)的準(zhǔn)確率最高(90%),運(yùn)行時(shí)間最短(0.227 1 s),預(yù)評(píng)估效果最好。造成不同預(yù)測(cè)效果的原因是,PNN模型輸入指標(biāo)提取的方法將直接或間接影響預(yù)評(píng)估結(jié)果的準(zhǔn)確度,因此要深入分析致災(zāi)源、承災(zāi)體與災(zāi)情之間的信息傳遞,有效的特征選取方法能提高PNN預(yù)評(píng)估的精準(zhǔn)度。
在三種特征選取方法中,基于信息熵特征提取模型,因只選取對(duì)承災(zāi)體系統(tǒng)的2項(xiàng)關(guān)鍵指標(biāo)對(duì)
預(yù)評(píng)估會(huì)造成一定的信息損失,雖然計(jì)算效率有所提高,但對(duì)預(yù)評(píng)估的精確度有一定影響?;谥鞒煞痔卣魈崛〉哪P?,提取了承災(zāi)體系統(tǒng)線性相關(guān)度高的特征分量,比信息熵方法減少信息損失,但忽略了高維數(shù)據(jù)內(nèi)部的非線性結(jié)構(gòu)。實(shí)驗(yàn)結(jié)果表明,ISOMAP比PCA更好的地將高維數(shù)據(jù)的非線性流形結(jié)構(gòu)挖掘,保留更多原始信息,計(jì)算效率最高,采用ISOMAP算法對(duì)承災(zāi)體指標(biāo)進(jìn)行非線性降維過(guò)程中,鄰域K的取值和降維維數(shù)n是決定其降維效果優(yōu)劣的重要參數(shù)[17],K取值過(guò)大會(huì)導(dǎo)致數(shù)據(jù)集變成局部鄰域,K取值過(guò)小會(huì)導(dǎo)致鄰域圖不連通,本實(shí)驗(yàn)K取最優(yōu)值8。在K取定值情況下,由殘差曲線圖的明顯拐點(diǎn)確定降維維數(shù)n。若n值過(guò)大,會(huì)增加數(shù)據(jù)冗余度,若n值過(guò)小,會(huì)導(dǎo)致數(shù)據(jù)集分離部分被映射到一起。本實(shí)驗(yàn)由殘差曲線圖確定n為3,降維效果最好。
此外,我們注意到1311號(hào)臺(tái)風(fēng)“尤特”在三種特征選取的PNN預(yù)評(píng)估模型均預(yù)測(cè)錯(cuò)誤,可視作異常點(diǎn)分析。1311號(hào)臺(tái)風(fēng)“尤特”以熱帶風(fēng)暴強(qiáng)度進(jìn)入廣西,先后造成15日(15日08時(shí)—16日08時(shí))和18日(18日08時(shí)—19日08時(shí)) 2個(gè)特大暴雨,部分暴雨落區(qū)重疊,造成當(dāng)?shù)刂卮笊?cái)產(chǎn)損失[29]。根據(jù)廣西民政廳統(tǒng)計(jì),臺(tái)風(fēng)“尤特”造成全區(qū)直接經(jīng)濟(jì)損失12.82億元,153.17萬(wàn)人受災(zāi),災(zāi)情等級(jí)劃分為大災(zāi)(IV級(jí))較合理。
4結(jié)論與展望
(1)基于概率神經(jīng)網(wǎng)絡(luò)的災(zāi)情等級(jí)識(shí)別是利用其強(qiáng)大的非線性處理能力,將致災(zāi)因子和承災(zāi)體的特征空間映射到災(zāi)情等級(jí)類型空間中,形成了一個(gè)較強(qiáng)容錯(cuò)能力和自適應(yīng)能力的識(shí)別網(wǎng)絡(luò)系統(tǒng),網(wǎng)絡(luò)訓(xùn)練不需大量樣本,總收斂于Bayes優(yōu)化解,穩(wěn)定性高。
表5 基于三種方法選指標(biāo)的PNN預(yù)評(píng)估結(jié)果
(2)在采用概率神經(jīng)網(wǎng)絡(luò)進(jìn)行臺(tái)風(fēng)災(zāi)情等級(jí)預(yù)評(píng)估模型時(shí),模型輸入的影響因子選擇是一個(gè)重要問(wèn)題,選擇起關(guān)鍵作用的因子,提高計(jì)算效率和模型預(yù)評(píng)估的精確度。主成分分析方法本質(zhì)是個(gè)二階統(tǒng)計(jì)特征的線性映射方法,而很多自然災(zāi)害系統(tǒng)的數(shù)據(jù)信息都包含高階非線性關(guān)系中?;诘染嘤成涞姆蔷€性特征提取方法可以充分有效地挖掘預(yù)報(bào)因子的信息,算法效率高,具有全局優(yōu)化性和漸近收斂性的優(yōu)點(diǎn),且在臺(tái)風(fēng)災(zāi)情評(píng)估指標(biāo)選取方面鮮少研究。
(3)ISOMAP算法適用于自然災(zāi)害系統(tǒng)的指標(biāo)降維。本研究基于等距映射的非線性特征提取建立概率神經(jīng)網(wǎng)絡(luò)預(yù)評(píng)估模型,該模型預(yù)測(cè)精度高,對(duì)臺(tái)風(fēng)可能造成的災(zāi)害進(jìn)行有效的預(yù)評(píng)估,有助于相關(guān)部門更好的對(duì)災(zāi)情的預(yù)防與救助做出有效的決策。
(4)采用信息熵構(gòu)造災(zāi)情指數(shù),對(duì)災(zāi)情指數(shù)采用系統(tǒng)聚類方法進(jìn)行災(zāi)情劃分等級(jí),克服了人為劃分災(zāi)情等級(jí)的主觀隨意性。
(5)本研究對(duì)異常極值點(diǎn)的預(yù)測(cè)仍存在誤差,還需對(duì)臺(tái)風(fēng)災(zāi)情預(yù)評(píng)估模型進(jìn)一步優(yōu)化。臺(tái)風(fēng)災(zāi)害系統(tǒng)是由致災(zāi)源的強(qiáng)度、承災(zāi)體的脆弱性及防災(zāi)減災(zāi)應(yīng)急能力等因素共同作用的結(jié)果,關(guān)于臺(tái)風(fēng)災(zāi)情的預(yù)評(píng)估工作還需考慮更多實(shí)際的影響因素,例如臺(tái)風(fēng)登陸路徑、最大風(fēng)速和最低氣壓等預(yù)報(bào)因素,還可以將城市護(hù)林、排水和城市建設(shè)實(shí)施的損害情況等因素一并考慮到災(zāi)情預(yù)評(píng)估的研究中。
參考文獻(xiàn):
[1]溫克剛,楊年珠.中國(guó)氣象災(zāi)害大典-廣西卷[M].北京:氣象出版社,2007.
[2]黃雪松,廖雪萍,覃衛(wèi)堅(jiān).廣西熱帶氣旋特征變化與災(zāi)損變化態(tài)勢(shì)[J].氣象研究與應(yīng)用,2014,35(1):2-6.
[3]彭昱忠,王謙,元昌安,等.數(shù)據(jù)挖掘技術(shù)在氣象預(yù)報(bào)研究中的應(yīng)用[J].干旱氣象,2015,33(1):19-27.
[4]葉雯,劉美南,陳曉宏,等.基于模式識(shí)別的臺(tái)風(fēng)風(fēng)暴潮災(zāi)情[J].海洋通報(bào),2004,23(4):65-70.
[5]劉合香,簡(jiǎn)茂球.基于粒子群-投影尋蹤和遺傳-神經(jīng)網(wǎng)絡(luò)集成的預(yù)測(cè)模型[J].中山大學(xué)學(xué)報(bào):自然科學(xué)版,2012,51(5):113-119.
[6]陳佩燕,楊玉華,雷小途.我國(guó)臺(tái)風(fēng)災(zāi)害成因分析及災(zāi)情預(yù)估[J].自然災(zāi)害學(xué)報(bào),2009,18(1):64-73.
[7]徐明,雷小途,楊秋珍.應(yīng)用聯(lián)合極值分布評(píng)估熱帶氣旋影響風(fēng)險(xiǎn)——以“??睂?duì)上海地區(qū)影響為例[J].災(zāi)害學(xué),2014,29(3):124-130.
[8]吳先華,徐中兵,袁迎蕾,等.臺(tái)風(fēng)災(zāi)害的關(guān)聯(lián)經(jīng)濟(jì)損失評(píng)估——以江蘇省為例[J].災(zāi)害學(xué),2014,29(2):77-83.
[9]魏章進(jìn),隋廣軍,唐丹玲.基于聚類與回歸方法的臺(tái)風(fēng)災(zāi)情統(tǒng)計(jì)評(píng)估[J].數(shù)理統(tǒng)計(jì)與管理,2014,33(3):400-407.
[10]芮建勛,張發(fā)勇,鮑曙明,等.面向臺(tái)風(fēng)事件與災(zāi)害影響評(píng)估的時(shí)空數(shù)據(jù)管理模式[J].災(zāi)害學(xué),2015,30(3):43-46.
[11]劉合香,秦川,倪增華.組合權(quán)重和ArcGIS相結(jié)合的廣西洪澇災(zāi)害風(fēng)險(xiǎn)分析[J].災(zāi)害學(xué),2015,30(3):76-79.
[12]劉少軍,張京紅,何政偉,等.基于GIS的臺(tái)風(fēng)災(zāi)害損失評(píng)估模型研究[J].災(zāi)害學(xué),2010,25(2):64-67.
[13]Blaikie P,Cannon T,Davis I,et al.At Risk:Natural Hazard,People’s Vulnerability and Disasters[M].London:Routledge,1994:210.
[14]鞏在武,胡麗.臺(tái)風(fēng)災(zāi)害評(píng)估中的影響因子分析[J].自然災(zāi)害學(xué)報(bào),2015,24(1):203-213.
[15]倪艷.Isomap算法在地震屬性參數(shù)降維中的應(yīng)用[J].西南民族大學(xué)學(xué)報(bào):自然科學(xué)版,2008,34(2):397-400.
[16]黃穎,金龍,黃小燕,等.基于局部線性嵌人的人工智能臺(tái)風(fēng)強(qiáng)度集合預(yù)報(bào)模型[J].氣象,2014,40(7):806-815.
[17]Tenenbaum J B,Silva V,Langford J C.A global geometric framework for nonliner dimensionnality reduction[J].Science,2000,290(5500):2319-2323.
[18]翁時(shí)鋒,張長(zhǎng)水,張學(xué)工.非線性降維在高維醫(yī)學(xué)數(shù)據(jù)處理中的應(yīng)用[J].清華大學(xué)學(xué)報(bào):自然科學(xué)版,2004,44(4):485-488.
[19]尹煥.基于ISOMAP的機(jī)械故障診斷方法研究與應(yīng)用[D].廣州:華南理工大學(xué),2012:15-22.
[20]張星.自然災(zāi)害災(zāi)情的熵權(quán)綜合評(píng)價(jià)模型[J].自然災(zāi)害學(xué)報(bào),2009,18(6):189-191.
[21]Specht D F.Probabilistic neural networks[J].Neural Networks,1990,3(1):109-118.
[22]郭聯(lián)金,羅炳軍.PNN與BP神經(jīng)網(wǎng)絡(luò)在鋼板表明缺陷分類中的應(yīng)用研究[J].機(jī)電工程,2015,32(3):352-357.
[23]王雨虹,付華,張洋,等.基于KPCA和CIPSO-PNN的煤與瓦斯突出強(qiáng)度辨識(shí)模型[J].傳感技術(shù)學(xué)報(bào),2015,28(2):271-277.
[24]胡永宏,賀思輝.綜合評(píng)價(jià)方法[M].北京:科學(xué)出版社,2000.
[25]王志強(qiáng),陳思宇,呂雪鋒,等.風(fēng)暴潮災(zāi)害受災(zāi)人口與直接經(jīng)濟(jì)損失評(píng)估方法研究進(jìn)展[J].北京師范大學(xué)學(xué)報(bào),2015,51(3):274-279.
[26]陳舜華,呂純濂,李吉順.福建省臺(tái)風(fēng)災(zāi)害評(píng)估試驗(yàn)[J].中國(guó)減災(zāi),1994,4(3):31-34.
[27]趙阿興,馬宗晉.自然災(zāi)害損失評(píng)估指標(biāo)體系的研究[J].自然災(zāi)害學(xué)報(bào),1993,2(3):1-7.
[28]張芳琳.“潭美”入桂待一天暴雨集中桂中北[N].南寧晚報(bào),2013-8-24(5).
[29]陳見(jiàn),賴珍權(quán),羅小莉,等.“尤特”超強(qiáng)臺(tái)風(fēng)殘留低渦引發(fā)的廣西特大暴雨成因分析[J].暴雨災(zāi)害,2014,33(1):20-25.
*收稿日期:2016-01-13修回日期:2016-03-11
基金項(xiàng)目:國(guó)家自然科學(xué)基金(41465003);廣西研究生教育創(chuàng)新計(jì)劃項(xiàng)目(YCSZ201585)
第一作者簡(jiǎn)介:陳燕璇(1988-),女,廣東汕頭人,碩士研究生,研究方向?yàn)楦怕式y(tǒng)計(jì)、數(shù)學(xué)模型、自然災(zāi)害風(fēng)險(xiǎn)分析. E-mail:colourful48@qq.com 通訊作者:劉合香(1962-),女,山東荏平人,教授,碩士生導(dǎo)師,研究方向?yàn)楦怕式y(tǒng)計(jì)、數(shù)學(xué)模型、自然災(zāi)害風(fēng)險(xiǎn)分析. E-mail:hx_post@163.com
中圖分類號(hào):X43;TP3
文獻(xiàn)標(biāo)志碼:A
文章編號(hào):1000-811X(2016)03-0020-07
doi:10.3969/j.issn.1000-811X.2016.03.004
Probabilistic Neural Network Pre-Assessment Model Based on Isometric Feature Mapping Dimentional Reduction in Typhoon Disaster
CHEN Yanxuan, LIU Hexiang and TAN Jinkai
(CollegeofMathematicsandStatisticsSciences,GuangxiTeachersEducationUniversity,Nanning530023,China)
Abstract:Typhoon hazard, between hazard bearing body and the disaster is a complex nonlinear dynamical system; accurately and efficiently extract the important indicators for the pre-assessment of typhoon disaster grade is an important basis for disaster prevention and relief work. In this paper, we apply principal component analysis, isometric feature mapping and entropy to extract key indicators of hazard bearing body, with hazard source as the input neurons, and disaster grade as output neurons, establishing probabilistic neural network pre-assessment model in typhoon disaster. The results show that the accuracy of probabilistic neural network pre-assessment model based on the non-linear feature extraction isometric feature mapping reaches 90%, the model has a satisfactory level of accuracy and generalization ability, provide a new way for natural disaster risk assessment, having certain reference value.
Key words:probabilistic neural network; Isometric Feature Mapping; entropy; typhoon; disaster; pre-assessment
陳燕璇,劉合香,譚金凱. 基于等距特征映射降維的臺(tái)風(fēng)災(zāi)情概率神經(jīng)網(wǎng)絡(luò)預(yù)評(píng)估模型[J]. 災(zāi)害學(xué),2016,31(3):20-25,30. [CHEN Yanxuan, LIU Hexiang and TAN Jinkai.Probabilistic Neural Network Pre-Assessment Model Based on Isometric Feature Mapping Dimentional Reduction in Typhoon Disaster[J].Journal of Catastrophology,2016,31(3):20-25,30.]