呂福財,付 強,朱建華,周 兵
(1.東北農(nóng)業(yè)大學,哈爾濱150030;2.穆棱市水利勘測設計隊,黑龍江穆棱157500)
洪水災害損失評價就是根據(jù)已有災情指標值建立災情評價模型,對因洪水災害造成的破壞程度進行評價。黑龍江省是我國主要的糧食產(chǎn)地,全省境內(nèi)江河湖泊眾多,有黑龍江、烏蘇里江、松花江、嫩江和綏芬河五大水系,現(xiàn)有湖泊、水庫6 000余個,水面達80多萬公頃。及時有效地對黑龍江省進行洪水災害損失評價工作,對洪水災害管理工作和災害的救濟具有重要的指導意義。
洪水災情涉及自然環(huán)境與社會經(jīng)濟等許多因素,目前國內(nèi)外尚無統(tǒng)一的洪水災情評估指標體系和對各指標的災情等級標準,洪水災害損失災情評價至今仍是洪災研究的難點和熱點之一。我國在洪水災害損失評價方面相繼提出了災度判別法、模糊綜合評判、物元分析、神經(jīng)網(wǎng)絡等災情等級模型[1-4],但上述方法需要災情評價的標準。黑龍江省正是沒用洪水災害損失的評價標準或標準已經(jīng)不適用,因而一直無法對其進行洪災損失的評價分析。本文將改進的GA方法—基于實數(shù)編碼的加速遺傳算法(Real coding based Accelerating Genetic Algorithm,簡稱 RAGA)與投影尋蹤分類模型(Projection Pursuit Classification Model,簡稱PPC模型)有機結合[5],通過RAGA優(yōu)化PPC模型中的投影方向參數(shù),完成高維數(shù)據(jù)向低維空間的轉換,即將每個樣本的多個評價指標綜合成一個綜合指標,然后按投影值進行排序與識別,從而實現(xiàn)對黑龍江省洪水災害損失評價。為沒有評價指標標準的評價研究提供一條新的方法與思路。
投影尋蹤分類模型(Projection Pursuit Classification Model,簡稱PPC)的建模過程包括如下幾步:
步驟1:樣本評價指標集的歸一化處理。設各指標值的樣本集為{x*(i,j)|i=1,2,…,n,j=1,2,…,p},其中x*(i,j)為第i個樣本第j個指標值,n、p分別為樣本的個數(shù)(樣本容量)和指標的數(shù)目。為消除各指標值的量綱和統(tǒng)一各指標值的變化范圍,可采用下式進行極值歸一化處理例如對于越小越優(yōu)的指標:
其中,xmax(j)、xmin(j)分別為第j個指標值的最大值和最小值,x(i,j)為指標特征值歸一化的序列。
步驟2:構造投影指標函數(shù)Q(a)。PP方法就是把p維數(shù)據(jù){x(i,j)|j=1,2,…,p}綜合成以a={a(1),a(2),a(3),…,a(p)}為投影方向的一維投影值z(i):
然后根據(jù){z(i)|i=1,2,…,n}的一維散布圖進行分類。式(3)中a為單位長度向量。綜合投影指標值時,要求投影值z(i)的散布特征應為:局部投影點盡可能密集,最好凝聚成若干個點團;而在整體上投影點團之間盡可能散開。因此。投影指標函數(shù)可以表達成:
其中,Sz為投影值z(i)的標準差,Dz為投影值z(i)的局部密度,即:
其中,E(z)為序列{z(i)|i=1,2,…,n}的平均值;R為局部密度的窗口半徑,它的選取既要使包含在窗口內(nèi)的投影點的平均個數(shù)不太少,避免滑動平均偏差太大,又不能使它隨著n的增大而增加太高,R可以根據(jù)試驗來確定;r(i,j)表示樣本之間的距離,r(i,j)=|z(i)-z(j)|;u(t)為一單位階躍函數(shù),當t≥0時,其值為1,當t<0時其函數(shù)值為0。
步驟3:優(yōu)化投影指標函數(shù)。當各指標值的樣本集給定時,投影指標函數(shù)Q(a)只隨著投影方向a的變化而變化。不同的投影方向反映不同的數(shù)據(jù)結構特征,最佳投影方向就是最大可能暴露高維數(shù)據(jù)某類特征結構的投影方向,因此可以通過求解投影指標函數(shù)最大化問題來估計最佳投影方向,即:
這是一個以{a(j)|j=1,2,…,p}為優(yōu)化變量的復雜非線性優(yōu)化問題,用傳統(tǒng)的優(yōu)化方法處理較難。因此,本文應用模擬生物優(yōu)勝劣汰與群體內(nèi)部染色體信息交換機制的基于實數(shù)編碼的加速遺傳算法(Real coded Accelerating Genetic Algorithm,簡稱RAGA)來解決其高維全局尋優(yōu)問題(RAGA的結構在下節(jié)介紹)。
步驟4:分類(優(yōu)序排列)。把由步驟3求得的最佳投影方向a*代入式(3)后可得各樣本點的投影值Z*(i)。將z*i與z*(j)進行比較,二者越接近,表示樣本i與j越傾向于分為同一類。若按z*(i)值從大到小排序,則可以將樣本從優(yōu)到劣進行排序。
遺傳算法由美國密執(zhí)安大學的Holland教授提出的,是模擬生物在自然環(huán)境中的遺傳和進化過程而形成的一種自適應全局優(yōu)化概率搜索算法。主要包括選擇(selection)、交叉(crossover)和變異(mutation)等操作。例如求解如下最優(yōu)化問題:Maxf(x),st,a(j)≤x(j)≤b(j)。
共有8個步驟:①在各個決策變量的取值變化區(qū)間隨機生成N組均勻分布的隨機變量;②計算目標函數(shù)值,從大到小排列;③計算基于序的評價函數(shù)(用eval(V)表示);④進行選擇操作,產(chǎn)生新的種群;⑤對步驟④產(chǎn)生的新種群進行交叉操作;⑥對步驟⑤產(chǎn)生的新種群進行變異操作;⑦進化迭代;⑧上述⑦個步驟構成標準遺傳算法(SGA)。由于SGA不能保證全局收斂性,在實際應用中常出現(xiàn)在遠離全局最優(yōu)點的地方SGA即停滯尋優(yōu)工作。為此,可以采用第1次、第2次進化迭代所產(chǎn)生的優(yōu)秀個體的變量變化區(qū)間作為變量新的初始變化區(qū)間,算法進入步驟①,重新運行SGA,形成加速運行,則優(yōu)秀個體區(qū)間將逐漸縮小,與最優(yōu)點的距離越來越近。直到最優(yōu)個體的優(yōu)化準則函數(shù)值小于某一設定值或算法運行達到預定加速次數(shù),結束整個算法運行。此時,將當前群體中最佳個體指定為RAGA的結果。上述8個步驟構成基于實碼的加速遺傳算法(RAGA)。
災情資料取自《黑龍江省防汛資料匯編》。
表1中為黑龍江省1992-2001年的洪水災害損失的10個評價樣本,每個樣本有7個評價指標,即屬于7維數(shù)據(jù)。對表1中黑龍江省洪水災害損失的10個評價樣本建立綜合效益分類評價的PPC模型。RAGA過程中選定父代初始種群規(guī)模為N=400,交叉概率PC=0.80,變異概率pm=0.8c,優(yōu)秀個體數(shù)目選定為20個,a=0.05,加速次數(shù)為20,得出密度窗寬R=7.9170,最大投影值943.0534,最佳投影方向a*= (0.3993,0.4040,0.3988,0.0352,0.4071,0.4199,0.4185),將a*帶入式(3)中即得黑龍江省洪水災害損失的投影值(見圖1)為:z*(i)=(0.1473,0.1394,0.7833,0.0937,0.2309,0.2855,2.4494,0.1366,0.0434,0.0323)。
表1 黑龍江省洪水災害災情評價指標原始數(shù)據(jù)
從圖1可以看出,黑龍江省1992-2001年10 a間有兩年的洪災損失非常嚴重,分別為1998和1994兩年的投影值分別為2.4494和0.7833比其他年份均高可以肯定這兩年的損失嚴重。1994年的評價結果與潘華盛[11]利用模糊綜合評價法的結論相符;1998年松花江、嫩江發(fā)生了超百年一遇的特大洪水,黑龍江省洪水損失達到歷史洪水災害損失最大。由此,說明了再不需要評價標準的情況下,RAGA的PPC模型的評價結果可靠。
另外,最佳投影方向各分量的大小實際上反映了各評價指標對洪水災害損失的影響程度(見圖2),最佳投影方向a*表明,各評價指標對洪水災害損失評價的影響程度大小依次為直接經(jīng)濟損失、水利設施經(jīng)濟損失、房屋倒塌數(shù)、洪澇的成災面積、洪澇的受災面積、受災人口、死亡人口。由此可以看出洪水災害損失實質主要是經(jīng)濟的損失,為防洪減災的有關部門提供了及時有效地減災救災依據(jù)。
圖1 1992~2001年黑龍江省洪水災害損失的投影值z*(i)
圖2 黑龍江省洪水災害損失綜合評價指標的投影方向a*
黑龍江省在洪水災害無評價標準或評價標準不適用的情況下,嘗試了不用評價標準的RAGA的PPC模型進行了1992-2001年10 a的洪水災害損失評價工作。實例的計算結果說明,該方法避免了主觀賦權的人為干擾,取得了較好效果,為沒有評價指標標準的評價研究提供一條新的方法與思路;并且分析了各指標的影響程度,為防洪減災提供了依據(jù)。
[1] 金菊良,魏一鳴,楊曉華.基于遺傳算法的洪水災情評估神經(jīng)網(wǎng)絡模型探討[J].災害學,1998,13(2):6-11.
[2] 于慶東.災度等級判別方法的局限性及其改進[J].自然災害學報,1993,2(2):8-10.
[3] 趙黎明,王康,邱佩華.災害綜合評估研究[J].系統(tǒng)工程理論與實踐,1997,17(3):63-69.
[4] 李祚泳,鄧新民.自然災害的物元分析災情評估模型初探[J].自然災害學報,1994,3(2):28-33.
[5] 付強,趙小勇.投影尋蹤模型原理及其應用[M].北京:科學出版社,2006.
[6] 付強,王志良,梁川.基于RAGA的PPC模型在土壤質量變化評價中的應用研究[J].水土保持學報,2002,16(5):109-110.
[7] 項靜恬,史久恩.非線性系統(tǒng)中數(shù)據(jù)處理的統(tǒng)計方法[M].北京:科學出版社,2000.
[8] 張欣莉.投影尋蹤及其在水文水資源中的應用[M].成都:四川大學,2000.
[9] 周明,孫樹棟.遺傳算法原理及其應用[M].北京:國防工業(yè)出版社,2000.
[10] 付強.數(shù)據(jù)處理方法及其農(nóng)業(yè)應用[M].北京:科學出版社,2006.
[11] 潘華盛,張桂華,董淑華.黑龍江省洪水災害等級評估模型—模糊綜合評價法[J].黑龍江氣象,2000,2(1):1-4.