王艷錦,武曉春,郭榮昌
(蘭州交通大學(xué) 自動(dòng)化與電氣工程學(xué)院,蘭州 730070)
泥石流自身的復(fù)雜性和不確定性使得泥石流的評(píng)估成為研究難點(diǎn),文獻(xiàn)[1-2]研究表明,泥石流多發(fā)生在山區(qū),大雨則更可能直接導(dǎo)致泥石流的爆發(fā);文獻(xiàn)[3]利用多元回歸計(jì)算風(fēng)險(xiǎn)因子權(quán)重,計(jì)算過程較復(fù)雜;文獻(xiàn)[4]提出使用數(shù)字高程模型(digital elevation model,DEM)進(jìn)行了區(qū)域敏感性評(píng)估,DEM作為評(píng)估的唯一數(shù)據(jù)集;文獻(xiàn)[5]利用基于模糊數(shù)學(xué)的層次分析方法,對(duì)研究區(qū)內(nèi)泥石流災(zāi)害進(jìn)行危險(xiǎn)性評(píng)估,但主觀性較強(qiáng);文獻(xiàn)[6]運(yùn)用遙感和GIS技術(shù)進(jìn)行數(shù)據(jù)處理與綜合分析,對(duì)各條泥石流溝的危險(xiǎn)性進(jìn)行評(píng)估;文獻(xiàn)[7]以單溝危險(xiǎn)度及易損度作為基礎(chǔ)評(píng)價(jià)指標(biāo),在不同降雨頻率下評(píng)估單溝泥石流災(zāi)害風(fēng)險(xiǎn),但評(píng)估方法不適用于未發(fā)生泥石流的區(qū)域;文獻(xiàn)[8]以雨強(qiáng)、坡降和物源作為三要素進(jìn)行泥石流危險(xiǎn)性的評(píng)價(jià),但未考慮因素之間的相關(guān)性.綜上研究,對(duì)泥石流災(zāi)害嚴(yán)重度的評(píng)估多采用主觀賦權(quán)或者客觀驗(yàn)證的方法,主觀賦予權(quán)重易造成評(píng)估準(zhǔn)確度的降低,且未能考慮因素間的關(guān)聯(lián)性;基于歷史數(shù)據(jù)的客觀權(quán)重則對(duì)未發(fā)生過泥石流區(qū)域的評(píng)估適應(yīng)性較差.
基于此,首先選出與泥石流災(zāi)害嚴(yán)重度相關(guān)的因素;對(duì)各因素進(jìn)行預(yù)排序,考慮因素間的影響和作用,采用網(wǎng)絡(luò)分析法(analytic network process,ANP)計(jì)算主觀權(quán)重;采用隨機(jī)森林(random forest,RF)計(jì)算客觀權(quán)重,并利用相對(duì)熵建立數(shù)學(xué)模型求解組合權(quán)重;最后以成康鐵路為例,綜合加權(quán)得出沿線泥石流災(zāi)害嚴(yán)重度結(jié)果,并對(duì)照四川省泥石流風(fēng)險(xiǎn)區(qū)劃圖,驗(yàn)證評(píng)估方法的合理性和準(zhǔn)確性.
ANP是在層次分析法的基礎(chǔ)上,考慮了各層次內(nèi)部元素的依存性、低層元素對(duì)高層元素的支配作用后得到的一種系統(tǒng)決策方法.ANP結(jié)構(gòu)模型包括控制層和網(wǎng)絡(luò)層,網(wǎng)絡(luò)層包含受控制層支配的所有元素[9-11].典型的ANP結(jié)構(gòu)模型如圖1所示.
圖1 網(wǎng)絡(luò)分析法的結(jié)構(gòu)模型Fig.1 Structure model of analytic network process
設(shè)ANP模型中的控制層中有準(zhǔn)則B1,B2,B3,…,Bm;網(wǎng)絡(luò)層有元素組C1,C2,C3,…,Cn,其中元素組Ci包含元素Di1,Di2,…,Dini,以Bs(s=1,2,…,m)為準(zhǔn)則,以Cj(j=1,2,…,n)中元素Djl(l=1,2,…,nj)為次準(zhǔn)則,比較Ci中各元素對(duì)Djl的影響程度,構(gòu)造判斷矩陣并進(jìn)行一致性檢驗(yàn);同理,構(gòu)造Ci中各元素對(duì)Cj中其他各元素影響程度的判斷矩陣,然后對(duì)各判斷矩陣求其特征向量矩陣Wij(i=1,2,…,n;j=1,2,…,n),Wij反映了元素組Ci與Cj間的依存關(guān)系,合并所有的Wij便可得到超矩陣W,如式(1)所示.
(1)
以Bs(s=1,2,…,m)為準(zhǔn)則,以元素組Cj(j=1,2,…,n)為次準(zhǔn)則,構(gòu)造網(wǎng)絡(luò)層各元素對(duì)Cj的重要度判斷矩陣,檢驗(yàn)一致性,得到特征向量,從而得出加權(quán)矩陣,如式(2)所示.
(2)
(3)
隨機(jī)森林是采用多棵決策樹進(jìn)行訓(xùn)練,通過集成學(xué)習(xí)將多棵樹集成的一種算法[12-13].該算法對(duì)樣本數(shù)據(jù)進(jìn)行有放回的抽取,建立多棵決策樹后,以少數(shù)服從多數(shù)的原則,得到最終決策結(jié)果.隨機(jī)森林進(jìn)行特征重要性的評(píng)估,本質(zhì)是確定每個(gè)特征在每棵樹上所做貢獻(xiàn)的大小,然后取平均值,從而得出各特征權(quán)重.RF算法生成決策樹、進(jìn)行決策的流程框圖如圖2所示.
計(jì)算組合權(quán)重的方法有很多,其中:組合權(quán)重中的“乘法”適用于因素多、權(quán)重均勻分布的主、客觀權(quán)重的組合;“加法”在參數(shù)大小確定上不具有唯一性.因此確定最終權(quán)重時(shí)仍受決策者的主觀影響,或者存在主、客觀一強(qiáng)一弱的問題[14-16].本文最終選擇了利用相對(duì)熵計(jì)算組合權(quán)重的方法.相對(duì)熵的思想就是使最后權(quán)重與所有單一權(quán)重之間的叉熵總和達(dá)到最小[17].計(jì)算過程如下:
設(shè)有s個(gè)概率分布,假定組合權(quán)重結(jié)果為W0=(ω01,ω02,…,ω0l),為了計(jì)算方便,假定初始權(quán)重各自的合成結(jié)果為1/s,建立如下模型:
(4)
(5)
圖2 RF算法流程框圖Fig.2 RF algorithm flow chart
川藏鐵路起于四川省成都市,經(jīng)雅安、康定、林芝,抵達(dá)西藏拉薩,成康鐵路是川藏鐵路的重要組成部分,該段鐵路位于四川省境內(nèi),全長(zhǎng)約300 km,由于特定的地質(zhì)地貌和水文氣象環(huán)境,鐵路沿線泥石流災(zāi)害極為活躍,具有活動(dòng)規(guī)模大、危害程度高、影響范圍廣的特點(diǎn).
分析泥石流災(zāi)害風(fēng)險(xiǎn)嚴(yán)重度時(shí),指標(biāo)選取依據(jù)泥石流發(fā)生的三要素,即地形地貌、物質(zhì)來源和誘發(fā)原因.泥石流發(fā)生的可能性不等同于泥石流發(fā)生的嚴(yán)重度高低,當(dāng)各指標(biāo)對(duì)泥石流的發(fā)生有利時(shí)會(huì)引發(fā)更嚴(yán)重的泥石流.地形地貌有利固體、液體物質(zhì)流動(dòng),豐富的物質(zhì)來源和堆積物在外界因素的誘發(fā)下會(huì)爆發(fā)較為嚴(yán)重的泥石流.海拔和坡度可以為泥石流的發(fā)生提供一定的能量,植被覆蓋度、土壤類型、土地利用類型等因素會(huì)影響泥石流發(fā)生的物質(zhì)來源;匯流積累量、降雨等是泥石流的誘發(fā)因素,坡向可以決定發(fā)生的泥石流是否沖向鐵路線路;線路與歷史災(zāi)害點(diǎn)距離、線路與地面高差與發(fā)生泥石流后鐵路受損情況密切相關(guān),從已有研究看,不同線路類型在同樣泥石流發(fā)生下受損情況也不一樣.綜上,從災(zāi)害的致險(xiǎn)性和承災(zāi)體的脆弱性兩方面考慮,共選取了11個(gè)風(fēng)險(xiǎn)因素,見表1.
表1 風(fēng)險(xiǎn)因素表
泥石流發(fā)生時(shí)各因素之間并不是完全獨(dú)立的,存在相互影響和作用,例如土地利用類型和土壤類型都受限于坡度,坡度的改變會(huì)使匯流積累量隨之改變.因此,采用ANP方法進(jìn)行分析.ANP在分析多因素存在相互影響的問題中有明顯優(yōu)勢(shì),但其計(jì)算量大、一致性檢驗(yàn)不符合標(biāo)準(zhǔn)時(shí),需要重新調(diào)整打分結(jié)果的特點(diǎn)使其未得到廣泛應(yīng)用,本文在打分前運(yùn)用預(yù)排序的方法改進(jìn)傳統(tǒng)ANP,即專家對(duì)各因素重要性進(jìn)行預(yù)先的重要性排序,然后進(jìn)行打分,從而減少了計(jì)算量和一致性檢驗(yàn)等繁瑣步驟.由表1生成風(fēng)險(xiǎn)因素結(jié)構(gòu)模型,如圖3所示.
在風(fēng)險(xiǎn)因素ANP結(jié)構(gòu)模型中的控制層有B1,B2兩個(gè)準(zhǔn)則;網(wǎng)絡(luò)層災(zāi)害致險(xiǎn)性包括D11、D12、D13、D14、D15、D16、D17、D18,承災(zāi)體脆弱性包括D21、D22、D23.分別以B1、B2為準(zhǔn)則,以Cj(j=1,2)中元素Djl(l=1,2,…,nj)為次準(zhǔn)則,構(gòu)造判斷矩陣并進(jìn)行一致性檢驗(yàn),求其特征向量后得矩陣Wij(i=1,2;j=1,2),合并Wij得到超矩陣W.
圖3 風(fēng)險(xiǎn)因素ANP結(jié)構(gòu)模型Fig.3 ANP structural model of risk factors
(6)
以B1、B2為準(zhǔn)則,以元素組Cj(j=1,2)為次準(zhǔn)則,構(gòu)造網(wǎng)絡(luò)層各元素對(duì)Cj的重要度判斷矩陣,進(jìn)行一致性檢驗(yàn),得出加權(quán)矩陣
求超矩陣最大特征值對(duì)應(yīng)的特征向量即可得到各因素對(duì)應(yīng)的主觀權(quán)重.
采用Python對(duì)200組數(shù)據(jù)進(jìn)行訓(xùn)練、測(cè)試,其中訓(xùn)練占75%,即用于訓(xùn)練的數(shù)據(jù)為150組,用于測(cè)試的數(shù)據(jù)為50組,得到各因素客觀權(quán)重,算法流程圖如圖4所示.
圖4 RF計(jì)算客觀權(quán)重流程圖Fig.4 RF calculation objective weight flow chart
綜合參考文獻(xiàn)[18-19]等相關(guān)規(guī)范,生成了以死亡或重傷人數(shù)、線路行車中斷時(shí)間和需要轉(zhuǎn)移或救助的人數(shù)為指標(biāo)的鐵路沿線泥石流災(zāi)害嚴(yán)重度等級(jí)表,見表2.
本研究對(duì)象是川藏線成康鐵路,對(duì)其沿線泥石流災(zāi)害嚴(yán)重度進(jìn)行評(píng)估,各因素?cái)?shù)據(jù)隨著線路的改變差異也愈加明顯,因此將研究對(duì)象劃分成小段進(jìn)行評(píng)估.從成都至康定依次經(jīng)過新津、蒲江、名山、雅安、天全、瀘定,以地方為分界點(diǎn),以相鄰地點(diǎn)之間的區(qū)段為具體研究對(duì)象,進(jìn)行離散化.
數(shù)據(jù)來源多樣化,其中土壤類型數(shù)據(jù)來自中國(guó)土壤數(shù)據(jù)庫中的1∶100萬數(shù)字化土壤圖(2009年制圖),土壤利用類型和植被覆蓋度采用地理國(guó)情監(jiān)測(cè)云平臺(tái)中的數(shù)據(jù),年平均降雨選取了中國(guó)氣象數(shù)據(jù)網(wǎng)的1959年至2009年的數(shù)據(jù),坡度、坡向、海拔和匯流積累量數(shù)據(jù)來自國(guó)家基礎(chǔ)地理信息中心官網(wǎng)(取2010年),災(zāi)害發(fā)生的歷史數(shù)據(jù)來自中國(guó)地質(zhì)環(huán)境監(jiān)測(cè)局,共計(jì)200組數(shù)據(jù)(包括發(fā)生和未發(fā)生),數(shù)據(jù)格式見表3,以其中10條進(jìn)行示意.
表2 泥石流災(zāi)害嚴(yán)重度等級(jí)表
表3 各因素?cái)?shù)據(jù)示意
按照2.1所述計(jì)算方法得到各因素主觀權(quán)重,見表4.以Python中的Sklearn模塊實(shí)現(xiàn)隨機(jī)森林算法,其中:max_feature設(shè)為3,即每次分裂時(shí)選出信息增益最大的3個(gè)最優(yōu)特征變量,小于本文中所選因素個(gè)數(shù),且計(jì)算速度不會(huì)明顯降低;n_estimators設(shè)為201,即樹的個(gè)數(shù);利用feature_importances函數(shù)得出每個(gè)因素的重要性,即所需客觀權(quán)重.結(jié)果見表5.
表4 主觀權(quán)重計(jì)算結(jié)果
表5 客觀權(quán)重計(jì)算結(jié)果
對(duì)照數(shù)據(jù)范圍、歷史災(zāi)害中因素?cái)?shù)據(jù)量、災(zāi)害嚴(yán)重度,將各因素?cái)?shù)據(jù)進(jìn)行五等級(jí)的劃分,即與嚴(yán)重度等級(jí)對(duì)應(yīng),得出每個(gè)區(qū)段的11個(gè)數(shù)據(jù)等級(jí),和其對(duì)應(yīng)的權(quán)重進(jìn)行加權(quán)和運(yùn)算,結(jié)果在0~5之間,所得結(jié)果四舍五入后得出該段災(zāi)害風(fēng)險(xiǎn)嚴(yán)重度等級(jí).所得結(jié)果見表7,其中:雅安至天全泥石流災(zāi)害嚴(yán)重度最高,應(yīng)加強(qiáng)管理防范措施;名山至雅安、天全至瀘定、瀘定至康定嚴(yán)重度較高,也應(yīng)引起重視以減少人員傷亡,降低經(jīng)濟(jì)損失.
表6 組合權(quán)重計(jì)算結(jié)果
表7 成康段各區(qū)段評(píng)價(jià)結(jié)果
本文提出了一種基于ANP-RF算法的泥石流嚴(yán)重度評(píng)估方法,以川藏線成康鐵路沿線泥石流嚴(yán)重度為研究對(duì)象,得出以下結(jié)論:
1) ANP-RF評(píng)估方法可以解決泥石流嚴(yán)重度評(píng)估中各因素之間存在相互影響和作用的問題,且采用預(yù)排序法改進(jìn)傳統(tǒng)的ANP,簡(jiǎn)化了運(yùn)算過程,提高了評(píng)估效率.
2) 隨機(jī)森林中隨機(jī)抽取樣本和因素避免了機(jī)器學(xué)習(xí)中的過擬合問題,對(duì)各因素貢獻(xiàn)取平均值增加了該方法的泛化能力,最終使得ANP-RF方法具有更加廣泛的適用性.
3) 將成康段泥石流嚴(yán)重度評(píng)估結(jié)果與四川省泥石流風(fēng)險(xiǎn)區(qū)劃圖對(duì)比,二者基本吻合,說明本文計(jì)算方法可靠、準(zhǔn)確,具有良好的應(yīng)用價(jià)值,同時(shí),該評(píng)估方法也可應(yīng)用于其他線路、其他地質(zhì)類災(zāi)害、其他評(píng)估領(lǐng)域.