呂 鴻,吳澤寧,管新建,王慧亮,孟 鈺,江鵬昆
(鄭州大學水利科學與工程學院,河南 鄭州 450001)
在全球極端氣候頻發(fā)和高速城市化雙重因素主導下,城市洪澇災害發(fā)生的頻率和強度正急劇增加,嚴重威脅城市安全[1]。量化與評估城市受淹區(qū)域的損失,不僅可以及時采取減輕災害的針對性措施,還可對災后的恢復和重建提供參考依據[2]。對于自然災害保險業(yè)來說,精確的洪水損失評估結果對災后理賠不可或缺[3]。因此,科學、合理、高效地量化洪災損失,對實施城市洪災風險管理和應急決策具有重要意義。洪災損失評估受區(qū)域降雨特征、地理條件、社會經濟水平等多重要素的影響,具有多維性、復雜性和多學科交叉的特點,評估手段形式多樣[4-5]。利用損失率函數結合洪水淹沒深度、土地類型和經濟要素形成損失結果,是國際上廣泛采用的洪災損失評估方法[6]。很多城市因缺乏洪災災情資料,使得這種評估方法實施困難,提出普適的缺資料城市洪災損失率函數構建方法,對量化缺資料城市洪災損失十分必要。
以洪災淹沒水深為自變量、社會經濟價值損失率為因變量,是國內外構建洪災損失率函數的主要形式。利用區(qū)域的歷史洪災統(tǒng)計資料,采用相關分析、回歸函數、神經網絡等,建立不同淹沒水深和洪災損失率的函數關系[2,4,6-7],這類研究方法對基礎數據資料的要求較高,很多城市缺乏甚至沒有歷史災情資料[8],難以滿足直接構建洪災損失率函數要求。針對災情資料較缺乏的情況,部分研究者做了一些損失率數據移植嘗試,主要分為直接移植[9-10]和間接移植[8,11-12]。直接移植是將引用區(qū)洪災損失率數據直接應用到研究區(qū);間接移植是選取能夠代表區(qū)域洪災影響的指標,通過比擬原理,將離散的引用區(qū)損失率數據間接移植到研究區(qū)。由于區(qū)域間致災、承災和防災等要素差異,引用區(qū)的損失率存在區(qū)域局限性,直接移植到其他區(qū)域準確性較差[10];間接移植采用單一轉換因子(引用對象和比擬指標)存在偶然性和主觀性等不確定性。此外,移植后引用區(qū)數據多以二維表格或者離散數據展示,缺乏連續(xù)型函數擬合[8],或者采用單一擬合函數形式也存在偶然性和主觀性等不確定性。若將對象、指標、函數的維度增加,則需要解決不確定性與最優(yōu)性問題[8]。
本文以洪災災情資料缺乏的鄭州市為例,針對損失率數據移植中的不確定性,以比擬原理為基礎,考慮多引用對象和多特征指標,將比擬因子擴充后形成損失率移植矩陣,通過建立多函數擬合情景,優(yōu)化構建缺災情資料城市洪災損失率函數,以期為缺資料城市或地區(qū)的洪災損失提供一種評估方法。
水文比擬法借鑒傳統(tǒng)代數學中等比例替代思想,常用來解決很多水文學中的缺資料或無資料問題[8]。本研究的基本思路如式(1)所示,利用已知災情資料的引用城市損失率(R0)、影響洪災損失的比擬指標I(研究區(qū))和I0(引用城市),推求研究區(qū)損失率(R)。即通過雙向比擬因子擴充,基于比擬原理變換為移植矩陣;利用“損失率移植矩陣變差系數最小、概率最大和相關系數最大”3個目標準則,驅動多擬合情景,構建研究區(qū)洪災損失率函數。形成一種“因子變異-動態(tài)比擬-目標驅動-情景擬合”的缺資料城市洪災損失率函數構建方法。
(1)
式中:λ為移植系數。
(1)變異引用對象。考慮多引用對象,通過數據挖掘得到多個有資料城市的損失率數據,若m個引用城市存在損失率數據R0m(i=1,2,…,m),可組成引用損失率矩陣R0,即
(2)
(2)變異比擬指標??紤]多特征指標,分析影響損失率的城市經濟水平、承災和防災等要素,選取K個代表性特征指標,建立特征指標體系I=(I1,I2,…,IK)。利用隨機組合方案替代單一性比擬指標,將K個特征指標隨機組合形成n種特征組合方案(式(3))。比擬因子是單一數值,利用投影尋蹤模型將特征組合方案轉化為特征綜合值[8]。令Zj表示研究區(qū)第j個方案下的特征綜合值,j=1,2,…,n;令Z0ij表示第i個引用區(qū)第j個方案下的特征綜合值,i=1,2,…,m。
(3)
(1)移植系數矩陣。依據式(1),設λij為第i個引用城市的第j個方案的移植系數,令λij=Zj/Z0ij,可得到m×n種組合方案的移植系數矩陣A:
(4)
(2)損失率移植矩陣。聯合式(2)和(4),通過式(1)可轉變?yōu)閙×n階的研究區(qū)損失率移植矩陣R(式6)。但它僅僅是某一淹沒水深下的移植矩陣。
(5)
步驟一:每個特征方案下的損失率集對應著矩陣R的列向量,并計算每1個列向量的變差系數CVj,構成變差系數集CV。
(6)
式中:uj為第j組列向量的平均值;σj為第j組列向量的方差。
(7)
(8)
為降低引用數據的統(tǒng)計不確性,采取構建Beta分布提取概率最大值R′作為某一淹沒水深的采用損失率。選擇Beta分布的原因:① 自變量x取值范圍為[0,1],契合洪災損失率函數的定義域;② Beta分布契合損失率分布“中間多兩邊少“的統(tǒng)計學特征;③ 已有部分研究[8,12-13]采用多樣本數據擬合損失率的Beta分布。
Beta分布的概率密度函數如下:
(9)
(10)
式中:α和β是Beta分布的參數,α>0且β>0。
(11)
(12)
式中:μ與σ為樣本均值與方差。
(13)
式中:P是第h級水深下損失率的Beta分布的所有可能概率。
(3)確定函數擬合序列。依次重復H次前述步驟,即可得到一種財產類型H個最優(yōu)損失率值組成的待擬合序列FS,如下:
(14)
目前洪災損失率函數尚未形成統(tǒng)一形式,表1展示了目前國內外研究中出現的多種函數形式。如將洪災損失特征概化為初期較慢、中期迅急、后期再趨緩狀態(tài)的3種S型增長函數;國外研究者使用較多的線性-指數型函數,擬合穩(wěn)定且能簡略概化損失機制;初期無先驗知識的研究者普遍使用的多項式擬合。將這些函數形式作為本研究待擬合函數集。
表1 目前研究中存在的洪災損失率函數Table 1 Water depth-loss rate function in current research
(1)設置不同擬合情景。與單一比擬因子的不確定性問題相似,如果簡單地選擇某一個函數形式也存在主觀性和偶然性。本研究在函數集的基礎上,設置3種擬合情景:簡單獨立型、分段隨機型和組合隨機型,通過相關系數最大原則來改善單一函數的不確定性問題及提升序列擬合的契合度。
情景1:簡單獨立型擬合 簡單獨立型擬合是最為普遍的函數擬合方法,將函數擬合序列FS分別擬合F1—F6,即情景1存在6種擬合形式。此情景原理簡單便捷,但缺點突出,如單一函數往往會出現局部擬合較好整體較差的情況,無法充分利用多維函數組合的高維組合特征優(yōu)勢。
情景2:分段隨機型擬合 由于單一函數的固定曲線圖像,使其擬合時存在“中間擬合好兩邊擬合差”的現象,本研究提出了“分段隨機型擬合”情景,即依據函數擬合序列FS的聚類性質自動尋找其間斷點,然后進行分區(qū)間擬合(式(15)),以提高整體擬合效果。實施步驟為:先依據輪廓系數法確定最優(yōu)分段數目(d),即分段中心與同簇類距離盡可能近,異簇類距離盡可能遠;再基于分段數目,采用K-means聚類算法,進行擬合序列的區(qū)間劃分;最后在每一區(qū)間上進行簡單獨立型擬合。情景2具有了6d種擬合形式。
(15)
式中:S0~Sd是水深區(qū)間起始值;Fx是函數集F1—F6的隨機選擇。
(16)
(2)設置相關系數最大原則。3種情景共有6+6d+57種擬合形式,依據相關系數(CC),最大原則遴選出最優(yōu)的函數形式(式17),即構建了土地類型的水深-損失率函數。
F*=max{CC|CC(FS,ytr),t∈[1,3]r∈[1,R]}
(17)
式中:r表示第t種情景下的擬合形式數;ytr表示第t種情景下的第r種擬合形式。
2.1.1 研究區(qū)概況
河南省鄭州市,地處華北平原南部,國家中心城市,2019年常住人口超過1 000萬。受溫帶季風氣候和城市化水文效應的影響,65%以上的降雨量集中于汛期(7—9月),且排水設施不完善,城市極易遭受內澇。洪災頻率高、空間分布數量多,但受災強度不大、量級小,缺乏洪災損失的系統(tǒng)調查與資料存儲[17]。隨著極端氣候激增和城市化的高速發(fā)展,城市洪災風險增高,經濟損失已經不容忽視。迫切需要提出洪災損失的量化評估方法,為城市洪災災害風險管理提供支撐。
2.1.2 數據挖掘和處理
(1)數據挖掘建立引用數據庫。以中國所有城市為對象,利用數據挖掘技術,挖掘得到11個引用城市的災情數據:上海[11]、深圳[12]、溫州[15]、天津[18]、西安[19]、濮陽[20]、沈陽[21]、廣州[22]、無錫[23]、哈爾濱[24]、珠海[25]等城市,將被研究的水深離散為40級(0.1~4.0 m,即H=40),建立引用城市的損失率數據庫。
(2)建立特征指標體系。按照變異比擬指標構建方法,考慮鄭州及各個引用城市的指標數據獲取性,選取5個代表性指標建立特征指標體系(表2),即K=5,n=31。
表2 影響洪災損失率的特征指標體系Table 2 Characteristic indicator system affecting flood loss ratio
(3)城市土地類型劃分。為體現城市土地利用的復雜特征以及挖掘數據的分類特征,采用多源數據融合及人工目視解譯輔助,將城市土地類型劃為4種,分別為工業(yè)、商業(yè)、住宅和公共服務,最終得到這4種土地類型的損失率函數。
圖2 4種土地類型的40級水深的最大概率損失率值R′和擬合序列FSFig.2 Maximum probability loss rate R′ value and the fitted sequence FS of the 40-level water depth of the 4 land types
圖3 3種擬合情景下的擬合相關系數展示Fig.3 Fitting correlation coefficients under 3 fitting scenarios of the 4 land types
圖4 3種擬合情景下的平均相關系數對比Fig.4 Comparison chart of average correlation coefficients under 3 fitting scenarios of the 4 land types
圖5 4種土地類型的洪災損失率函數Fig.5 Flood loss rate function diagram of 4 land types
圍繞缺災情資料城市洪災損失率函數構建問題,本文考慮多引用對象、多特征指標、多擬合情景的多維度優(yōu)化,提出“因子變異-動態(tài)比擬-目標驅動-情景擬合”的建??蚣?克服缺資料城市災情數據局限性,主要結論如下:
(1)借鑒等比例替代的數學思想,通過提出洪災損失率函數參數化的構建模式,實現以多引用城市災情資料為數據源、缺資料城市的特征指標為參數輸入、損失率函數為輸出的方法體系,為缺災情資料城市或地區(qū)提供技術參考。
(2)在基于比擬指標的災情數據間接移植過程中,不同土地類型和不同水深對應的特征指標都存在差異化現象,表明單一比擬指標會忽視不同城市間和城市內不同承災體洪災損失影響要素的差異,存在指標選取的偶然性和主觀性等不確定性。
(3)用多種函數的隨機線性組合擬合洪災淹沒水深-損失率數據,能顯著提高擬合的相關性,降低單一函數選擇和主觀性影響,可改善分段函數擬合的階段點不連續(xù)問題,為樣本-函數擬合研究提供了新思路。