王衛(wèi)東, 何卓磊, 韓 征, 錢 于
(1.中南大學(xué) 土木工程學(xué)院, 湖南 長沙 410075; 2.中南大學(xué) 重載鐵路工程結(jié)構(gòu)教育部重點(diǎn)實(shí)驗(yàn)室, 湖南 長沙 410075;3.南卡羅來納大學(xué) 土木與環(huán)境工程系, 哥倫比亞 29208)
滑坡敏感性是指在綜合分析相關(guān)地質(zhì)和地形條件的基礎(chǔ)上,某一區(qū)域發(fā)生滑坡的可能性.在確定了致災(zāi)因子之后,評(píng)估模型是編制滑坡敏感性區(qū)劃圖的一個(gè)關(guān)鍵問題.過去幾十年的研究提供了多種可選擇模型,一般可分為兩類,即定性模型和定量模型.定性方法是基于專家經(jīng)驗(yàn)的知識(shí)驅(qū)動(dòng)型方法,如層次分析法[1-2]等,具有不確定性和主觀性.隨著計(jì)算機(jī)技術(shù)、遙感技術(shù)以及地理信息系統(tǒng)技術(shù)的全面發(fā)展,研究人員更傾向于采用定量方法來進(jìn)行地質(zhì)災(zāi)害區(qū)劃.定量方法是基于統(tǒng)計(jì)學(xué)的數(shù)據(jù)驅(qū)動(dòng)型方法,如邏輯回歸(LR)分析法[3]等.在機(jī)器學(xué)習(xí)逐漸發(fā)展起來后,一些學(xué)者開始使用支持向量機(jī)法[4]等方法來進(jìn)行滑坡敏感性分析.定量方法具有較好的確定性和客觀性.
Polykretis等[5]的研究認(rèn)識(shí)到由于致災(zāi)因子之間的復(fù)雜非線性關(guān)系、缺乏相關(guān)數(shù)據(jù)以及環(huán)境動(dòng)態(tài)變化的整合,導(dǎo)致編制滑坡敏感性區(qū)劃圖存在困難.然而迄今為止,大多數(shù)的分類和回歸學(xué)習(xí)方法都是淺層結(jié)構(gòu)的算法,不同特征之間的非線性關(guān)系沒有得到充分反映.深度學(xué)習(xí)的本質(zhì)是通過構(gòu)建具有許多隱藏層和大量訓(xùn)練數(shù)據(jù)的模型來學(xué)習(xí)更多特性,實(shí)現(xiàn)對(duì)上層的特征抽象,一定程度上對(duì)傳統(tǒng)模型所暴露出的目標(biāo)函數(shù)優(yōu)化和收斂不足等問題進(jìn)行了提升與改進(jìn).因此,這種方法提高了分類或預(yù)測的準(zhǔn)確性.本研究首次將深度信念網(wǎng)絡(luò)(DBN)模型用于滑坡地質(zhì)災(zāi)害評(píng)估,并將結(jié)果與LR和BPNN模型進(jìn)行比較分析.
四川省具有明顯的西高東低、高低懸殊的地形特點(diǎn).西部是川西高原,主要為高原和山地;東部是四川盆地,主要為平原和丘陵.四川處在中國1級(jí)和2級(jí)階梯交界處和地震分布帶中,省內(nèi)存在岷江斷裂帶、龍門山斷裂帶等一些大規(guī)模的斷裂帶,構(gòu)造運(yùn)動(dòng)活躍,對(duì)滑坡的形成提供了充足的地質(zhì)條件.由于地貌和地質(zhì)背景復(fù)雜,水文條件豐富,該地區(qū)每年都會(huì)發(fā)生大量滑坡災(zāi)害.
在編制滑坡敏感性區(qū)劃圖的過程中,通過模型對(duì)歷史滑坡分布數(shù)據(jù)進(jìn)行分析可以獲取每個(gè)因子之間的內(nèi)在聯(lián)系,從而最終預(yù)測每個(gè)點(diǎn)的滑坡發(fā)生概率.本文將調(diào)研得到的四川省滑坡分布圖在GIS環(huán)境下數(shù)字化,制成四川省滑坡歷史災(zāi)害分布圖(圖1).從圖1可以看出,四川省滑坡歷史災(zāi)點(diǎn)主要分布在南部、東北部和中部.
滑坡災(zāi)害是多因素相互作用的結(jié)果.評(píng)價(jià)指標(biāo)的選取是否合理對(duì)滑坡評(píng)價(jià)過程和結(jié)果有著重要的影響.根據(jù)以往相關(guān)研究經(jīng)驗(yàn)[6-7]并結(jié)合四川省的自然條件情況,本文選取了高程、地貌、巖性、坡度、與構(gòu)造帶距離、與水系距離、年均降雨量等7個(gè)致災(zāi)因子(圖2),每個(gè)因子具體的來源和格式見表1.
表1 數(shù)據(jù)來源與格式
深度學(xué)習(xí)的概念來源于對(duì)人工神經(jīng)網(wǎng)絡(luò)的研究.它將低級(jí)特性結(jié)合起來形成更抽象的高級(jí)表示(屬性類或特性),以發(fā)現(xiàn)數(shù)據(jù)的分布式特性.DBN是一種高效的無監(jiān)督學(xué)習(xí)算法.迄今為止,它已廣泛應(yīng)用于圖像分類、語音識(shí)別和其他領(lǐng)域[8-9].
DBN在編制滑坡敏感性區(qū)劃圖中的一個(gè)顯著優(yōu)勢是,它從可能對(duì)滑坡的發(fā)生至關(guān)重要的因素中學(xué)習(xí)特征.本文的7個(gè)致災(zāi)因子是研究者經(jīng)常使用的,但這些因素之間的復(fù)雜相互作用和內(nèi)在聯(lián)系難以解釋和量化.傳統(tǒng)的網(wǎng)絡(luò)訓(xùn)練方法如反向傳播BPNN和徑向基函數(shù)(RBF)對(duì)因素的原始特征依賴性很強(qiáng),缺乏揭示因素組合效應(yīng)的能力.在這種情況下,DBN被認(rèn)為是解決這個(gè)問題的較好的方法.鑒于此,本研究嘗試將DBN應(yīng)用于四川省的滑坡敏感性區(qū)劃圖.
DBN是一個(gè)雙向深度網(wǎng)絡(luò),是由受限玻爾茲曼機(jī)器(RBM)組成的概率生成模型.RBM由輸入數(shù)據(jù)層(可視層v)和隱藏層h組成,各層神經(jīng)元之間不存在連接(圖3).
將若干個(gè)RBM連接起來則構(gòu)成了一個(gè)DBN,其中,上一個(gè)RBM的隱層即為下一個(gè)RBM的顯層,上一個(gè)RBM的輸出即為下一個(gè)RBM的輸入.訓(xùn)練過程中,需要充分訓(xùn)練上一層的RBM后才能訓(xùn)練當(dāng)前層的RBM,直至最后一層(圖4).
2.2.1 LR分析
LR模型是分類問題中常用的廣義線性回歸分析模型.在編制滑坡敏感性區(qū)劃圖的過程中,LR分析了致災(zāi)因子之間的線性關(guān)系,對(duì)每個(gè)點(diǎn)的滑坡發(fā)生率進(jìn)行分類和預(yù)測.各致災(zāi)因子的權(quán)重記錄在表2中.隨后,歷史滑坡數(shù)據(jù)集和所有致災(zāi)因子圖層疊加在GIS平臺(tái)下的6 391個(gè)柵格單元中.
2.2.2 BPNN
反向傳播神經(jīng)網(wǎng)絡(luò)BPNN是人工神經(jīng)網(wǎng)絡(luò)中應(yīng)用最廣泛、最具代表性的模型.它是一種由誤差反向傳播算法訓(xùn)練的多層前饋網(wǎng)絡(luò).BPNN具有大規(guī)模并行處理能力、自適應(yīng)性、自學(xué)習(xí)能力、強(qiáng)容錯(cuò)性、魯棒性和分布式信息存儲(chǔ)等特點(diǎn).本研究采用Matlab環(huán)境下的人工神經(jīng)網(wǎng)絡(luò)工具箱進(jìn)行建模分析.
本研究選取典型的4層DBN,包含3個(gè)RBM和一個(gè)輸出層來對(duì)已有數(shù)據(jù)進(jìn)行訓(xùn)練.整個(gè)訓(xùn)練過程分為兩步:首先是對(duì)RBM進(jìn)行預(yù)訓(xùn)練,神經(jīng)元數(shù)量、學(xué)習(xí)率和批次更新數(shù)量等參數(shù)需要在訓(xùn)練過程中根據(jù)研究需要不斷調(diào)整;最終確定RBM的三層神經(jīng)元數(shù)量分別為100,50和20,訓(xùn)練方法為SGD,學(xué)習(xí)率為1,每批次更新數(shù)量為100,采用適用于概率預(yù)測的性能函數(shù)MSE和激活函數(shù)Sigmoid.在對(duì)前三層RBM訓(xùn)練之后,對(duì)整個(gè)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,輸入層節(jié)點(diǎn)選擇7個(gè),代表7個(gè)致災(zāi)因子,最后一層網(wǎng)絡(luò)節(jié)點(diǎn)數(shù)為1,表示單元滑坡敏感預(yù)測值;優(yōu)化函數(shù)使用Adam,損失函數(shù)采用MSE,學(xué)習(xí)率為0.01,迭代次數(shù)為1 000次,以70%的數(shù)據(jù)(4 474個(gè)單元)為訓(xùn)練集,30%的數(shù)據(jù)(1 917個(gè)單元)為測試集,整個(gè)網(wǎng)絡(luò)準(zhǔn)確率為83%.
表2 致災(zāi)因子分類及權(quán)重
利用訓(xùn)練好的DBN,對(duì)四川省進(jìn)行滑坡敏感性預(yù)測,預(yù)測范圍為0~0.990 5.根據(jù)自然斷點(diǎn)法將滑坡敏感性分為低0~0.205 5,中0.205 5~0.509 3,高0.509 3~0.760 3和極高0.760 3~0.990 5四個(gè)等級(jí),得到四川省滑坡敏感性區(qū)劃圖(圖5a).
在LR分析中,單個(gè)歷史滑坡被視為因變量.存在則標(biāo)記為1,不存在標(biāo)記為0.數(shù)據(jù)導(dǎo)出到SPSS,得到代表各致災(zāi)因子之間線性關(guān)系的值:
z=-5.273+1.444I高程+2.285I地貌+3.705I巖性+0.867I坡度+2.068I構(gòu)造帶+3.151I水系+3.569I降雨,
十八大報(bào)告指出,要堅(jiān)定理想信念,堅(jiān)守共產(chǎn)黨人的精神追求。習(xí)近平在參觀《復(fù)興之路》展覽后,強(qiáng)調(diào)“空談?wù)`國、實(shí)干興邦”。這就要求我們各級(jí)黨員領(lǐng)導(dǎo)干部,要腳踏實(shí)地、真抓實(shí)干,帶領(lǐng)廣大員工推動(dòng)公司各項(xiàng)事業(yè)創(chuàng)新發(fā)展。
(1)
(2)
式中,I因子代表各個(gè)致災(zāi)因子的權(quán)重.
根據(jù)式(1)和式(2),推導(dǎo)出四川地區(qū)P的分布范圍為0.019 5~0.799 1.根據(jù)自然斷點(diǎn)分類法,將滑坡敏感性區(qū)劃圖分為低(0.019 5~0.160 6),中(0.160 6~0.318 6),高(0.318 6~0.508 9)和極高(0.508 9~0.799 1).預(yù)測結(jié)果如圖5b所示.
選取典型的3層BPNN對(duì)輸入數(shù)據(jù)進(jìn)行訓(xùn)練.隱含層和輸出層傳遞函數(shù)分別采用Tansig和Logsig,訓(xùn)練函數(shù)采用Traingdx,閾值和權(quán)值的學(xué)習(xí)函數(shù)采用Learngd,性能函數(shù)采用MSE.輸入層節(jié)點(diǎn)數(shù)設(shè)為7,即本文選取的滑坡一級(jí)致災(zāi)因子個(gè)數(shù) ;輸出層節(jié)點(diǎn)數(shù)設(shè)為1,表示單元滑坡敏感性值.
利用BPNN得到四川省滑坡敏感性分布范圍為0~0.992 5,根據(jù)自然斷點(diǎn)分類法分為低(0~0.348 7),中(0.348 7~0.536 7),高(0.536 7~0.726 7)和極高(0.726 7~0.992 5).預(yù)測結(jié)果如圖5c所示.
ROC曲線分析是評(píng)估模型預(yù)測結(jié)果準(zhǔn)確性的常用方法.為了進(jìn)一步討論DBN的特點(diǎn),利用ROC來評(píng)估3個(gè)模型編制滑坡敏感性區(qū)劃圖結(jié)果的準(zhǔn)確性.其中,曲線下面積(AUC)是模型精度的最終評(píng)價(jià)標(biāo)準(zhǔn).DBN,LR和BPNN的ROC曲線如圖6所示,AUC值分別為0.899,0.782和0.867.從這些數(shù)據(jù)來看,DBN在3個(gè)模型中具有最好的預(yù)測精度,表明了深層神經(jīng)網(wǎng)絡(luò)處理復(fù)雜因素特征的優(yōu)勢.
圖5從幾個(gè)方面揭示了結(jié)果的差異.首先,3個(gè)模型編制的滑坡敏感性區(qū)劃結(jié)果具有相似的特征,即低、中敏感區(qū)主要集中在西部,而高、極高敏感區(qū)則分布在南部.其次,3個(gè)模型預(yù)測得到不同比例的4種敏感性水平.顯然,DBN和BPNN之間的差異并不顯著,而DBN和LR之間的差異主要集中在西北和東部地區(qū).LR與DBN及BPNN在四川省西北部和中部地區(qū)的區(qū)劃差異明顯地揭示了三者數(shù)據(jù)挖掘能力的不同,同為非線性處理模型的DBN和BPNN有更接近的結(jié)果,而兩者在四川省西北部的區(qū)劃結(jié)果相比于LR模型更符合實(shí)際情況.
圖7和圖8探討了3個(gè)模型結(jié)果的差異,最明顯的是3個(gè)模型中DBN對(duì)敏感性進(jìn)行了保守的預(yù)測,“極高”和“高”敏感性覆蓋的面積分別占總面積的27.57%和18.57%.同時(shí),52.72%的歷史滑坡被確定為“極高”敏感性等級(jí),優(yōu)于BPNN的 33.75%和LR 的43.06%.另外,計(jì)算了不同敏感性等級(jí)中的歷史滑坡數(shù),DBN預(yù)測處于“極高”和“高”敏感性的歷史滑坡占總量的81.04%,為3個(gè)模型中最好.
為了探究不同模型中致災(zāi)因子的影響,進(jìn)行了統(tǒng)計(jì)試驗(yàn)以探討預(yù)測得到的滑坡敏感性與各級(jí)不同致災(zāi)因子面積的比例(圖9).由該圖可知,DBN和BPNN都反映了平均年降雨量和與水系距離跟滑坡發(fā)生之間的正相關(guān)關(guān)系,因?yàn)轭A(yù)測的“高”和“極高”的敏感滑坡集中在年降雨量較大且與水系距離較近的區(qū)域,這與先前研究的結(jié)論一致[10-11].如圖9所示,高程因素也起著至關(guān)重要的作用.LR的結(jié)果表明,海拔1~2 km 的區(qū)域覆蓋了大部分“極高”的敏感區(qū)域,而DBN更傾向于小于1 km的區(qū)域.
在3個(gè)模型中,坡度因素對(duì)滑坡發(fā)生的影響沒有如此顯著的統(tǒng)計(jì)意義,因?yàn)榛略谠撘蛩氐牟煌缴戏植紟缀蹙鶆?,這與側(cè)重于個(gè)別滑坡機(jī)制的研究的預(yù)期和結(jié)論有些差異.這一現(xiàn)象的出現(xiàn)可以解釋為四川省內(nèi)的歷史滑坡同時(shí)存在土質(zhì)滑坡和巖質(zhì)滑坡,而坡度對(duì)土質(zhì)滑坡影響較大,對(duì)巖質(zhì)滑坡影響較小.
總的來說,DBN和BPNN的結(jié)果顯示出非常相似的分布特征,在高程、與水系距離和年平均降雨量等因素上差異不大,而在剩下的4個(gè)因素上則存在較大差異.LR的結(jié)果與DBN和BPNN有顯著差異,特別是在地貌因素上,LR預(yù)測大多數(shù)高敏感區(qū)域?qū)⒎植荚谂_(tái)地中.這一發(fā)現(xiàn)雖然是初步的,但仍然有助于理解每個(gè)模型對(duì)致災(zāi)因子的響應(yīng).
1) 基于DBN和LR,BPNN模型進(jìn)行滑坡敏感性評(píng)價(jià),結(jié)果表明四川西南部和東南部更容易發(fā)生滑坡.其中DBN模型區(qū)劃結(jié)果顯示整個(gè)四川省處于“極高”和“高”敏感性的比例為46.14%,LR模型為37.44%,BPNN模型為40.35%.
2) DBN具有較好的假陰性率控制性能,區(qū)劃結(jié)果精度高于LR和BPNN,驗(yàn)證了該方法的準(zhǔn)確性.
3) DBN與LR,BPNN模型對(duì)致災(zāi)因子的響應(yīng)不同.利用深度學(xué)習(xí)DBN模型能綜合反映致災(zāi)因子在外在條件下復(fù)雜的內(nèi)在相互關(guān)系,尤其是在大范圍、大數(shù)據(jù)量的區(qū)域中,可以成為以后地質(zhì)災(zāi)害區(qū)劃研究的重要手段.
東北大學(xué)學(xué)報(bào)(自然科學(xué)版)2020年5期