薛蒙蒙,文海家,2,3,林 渝,孫德亮
(1.重慶大學(xué) 土木工程學(xué)院,重慶 400045;2.山地城鎮(zhèn)建設(shè)新技術(shù)教育部 重點(diǎn)實(shí)驗(yàn)室,重慶 400045;3.庫區(qū)環(huán)境地質(zhì)災(zāi)害防治國家地方聯(lián)合工程研究中心,重慶 400045;4.重慶師范大學(xué) GIS應(yīng)用研究重慶市高校重點(diǎn)實(shí)驗(yàn)室,重慶 401331)
中國的西南地區(qū)大部分是山地地形,交通道路等都是依山而建。道路的修建致使道路沿線斜坡的脆弱性增加,再加上氣候和環(huán)境的變化,公路沿線斜坡常發(fā)生變形和破壞。斜坡的變形和破壞不僅僅取決于其脆弱性,還取決于變形和破壞時(shí)的抗災(zāi)能力和災(zāi)后的恢復(fù)能力[1-2]??篂?zāi)能力和災(zāi)后的恢復(fù)能力又分為物理層面和社會(huì)層面[3],其中,物理層面的抗災(zāi)能力和恢復(fù)能力,主要表現(xiàn)為巖土體自身的韌性能力(即物理韌性),受氣象條件、地形、植被覆蓋等多個(gè)方面的影響。了解不同區(qū)域中公路沿線斜坡的物理韌性,可為邊坡防治措施提供一個(gè)合理的依據(jù)。國內(nèi)外關(guān)于公路沿線斜坡物理韌性的研究還比較少,且大部分的研究均針對斜坡韌性的定義。2007年,James等人[4]在加拿大和印度部分地區(qū)為研究區(qū),研究恢復(fù)力對山區(qū)災(zāi)害發(fā)生的影響,在面臨危險(xiǎn)時(shí),韌性的社會(huì)—生態(tài)系統(tǒng)有能力學(xué)習(xí)和調(diào)整,還會(huì)與周圍的其他社會(huì)—生態(tài)系統(tǒng)建立有利的聯(lián)系;2014年,Ayyub[5]提供了一個(gè)可以滿足與可靠性和風(fēng)險(xiǎn)相關(guān)抽象概念的度量有明確關(guān)系的需求的韌性定義,為多個(gè)危險(xiǎn)性的環(huán)境的開發(fā)的決策提供了一個(gè)依據(jù);Molden等人[6]綜述了提高山區(qū)和山區(qū)環(huán)境的恢復(fù)力的現(xiàn)有研究和相關(guān)政策,以及恢復(fù)力研究的現(xiàn)有問題。雖然現(xiàn)在對斜坡物理韌性的研究還比較少,但應(yīng)用地理信息技術(shù)結(jié)合數(shù)學(xué)模型的研究技術(shù)也已經(jīng)成熟,很多的數(shù)學(xué)模型被應(yīng)用到研究中,例如邏輯回歸(Logistic)[7]、熵指數(shù)(EI)[8]、人工神經(jīng)網(wǎng)絡(luò)(ANN)[9]等,這些傳統(tǒng)的機(jī)器學(xué)習(xí)模型計(jì)算過程都比較簡單,計(jì)算方法嚴(yán)密等優(yōu)點(diǎn),但是也有很多的不足之處,例如邏輯回歸模型只處理線性問題,人工神經(jīng)網(wǎng)絡(luò)無法對數(shù)據(jù)量較小的樣本正常運(yùn)算等,而且這些模型的精度也受到限制,會(huì)出現(xiàn)過擬合的現(xiàn)象[10]。為了避免上述問題,提出了一些新的機(jī)器學(xué)習(xí)模型,例如支持向量機(jī)(SVM)[11]、卷積神經(jīng)網(wǎng)絡(luò)(CNN)[12]、隨機(jī)森林(RF)[13]等,這些模型也被陸續(xù)運(yùn)用到斜坡災(zāi)害的研究中。2015年,Goetz和Brenning等人[14]運(yùn)用交叉驗(yàn)證的方法對支持向量機(jī)、隨機(jī)森林、邏輯回歸、證據(jù)加權(quán)、廣義加性模型、bootstrap聚合分類樹和BPLDA這7種機(jī)器學(xué)習(xí)方法對滑坡敏感性進(jìn)行評估,得出結(jié)論,隨機(jī)森林的預(yù)測效果相對較好,所以本次研究中選用隨機(jī)森林建立山區(qū)道路沿線斜坡物理韌性評價(jià)模型。隨機(jī)森林算法是一種有多棵決策樹組成的集成學(xué)習(xí)模型[15],在進(jìn)行回歸應(yīng)用的時(shí)候,其結(jié)果取所有決策樹的平均值。隨機(jī)森林對數(shù)據(jù)挖掘的效果較好,可以處理一些非線性的問題和非高斯問題,且不易出現(xiàn)過擬合的現(xiàn)象,被廣泛的應(yīng)用于各種領(lǐng)域的研究中[16]。吳潤澤和胡旭東[17]等人運(yùn)用隨機(jī)森林和GIS結(jié)合,選取高程、坡度、傾坡類型等9個(gè)影響因子研究三峽庫區(qū)湖北段的滑坡易發(fā)性,結(jié)果表明隨機(jī)森林模型預(yù)測性較好;扈秀宇和秦勝伍[18]等人運(yùn)用隨機(jī)森林模型結(jié)合GIS系統(tǒng),以吉林省洮南市為研究區(qū),選用高程、坡度、坡向等10個(gè)因子為影響因子,結(jié)合歷史泥石流數(shù)據(jù),建立泥石流災(zāi)害預(yù)測模型,結(jié)果顯示隨機(jī)森林模型具有較好的預(yù)測性。復(fù)雜的地形地貌條件、地質(zhì)構(gòu)造發(fā)育、氣候條件以及人類工程活動(dòng)等的影響,具有典型山地地貌的茂縣是斜坡破壞至災(zāi)的多發(fā)區(qū),且在茂縣縣域中,由于道路的修建,道路周圍發(fā)生變形和破壞的斜坡很多,甚至一個(gè)斜坡上會(huì)發(fā)生多次破壞。因此,本文以四川省茂縣公路沿線6 km范圍內(nèi)區(qū)域?yàn)檠芯繀^(qū),以30 m精度柵格建立研究區(qū)地理空間數(shù)據(jù)庫,基于隨機(jī)森林模型,建立茂縣公路沿線斜坡物理韌性評價(jià)模型。
茂縣位于四川省西北部(東經(jīng)102°56′—104°10′,北緯31°25′—32°16′),青藏高原的東南部邊緣。屬龍門山斷裂帶地區(qū)[19],地跨岷江和涪江上游高山河谷地帶[20]。茂縣東部為中山地帶,地勢由西北向東南傾斜,山峰海拔高度在4 000 m左右,相對海拔高度為1 500~2 500 m。巖土體類型主要由夾沙灰、黑色頁巖、砂板巖及火成巖等組成[21]。氣候?qū)儆诟咴约撅L(fēng)氣候,年平均溫度為11 ℃,降雨集中在夏季,常有暴雨發(fā)生,年平均降雨量為486.3 mm,植被類型主要是以針葉林為主。茂縣的境內(nèi)有170多條河流,主要的河流有黑水河、土門河和岷江河。
茂縣的地形地貌條件復(fù)雜,各種節(jié)理和裂隙發(fā)育較多,而且?guī)r土體中頁巖和板巖的抗風(fēng)化能力較弱,因此其斜坡的穩(wěn)定性較低。而且由于夏季經(jīng)常有暴雨發(fā)生,雨水對斜坡巖土體的靜水壓力作用、沖刷作用、泥化作用和動(dòng)水壓力作用等使得斜坡的穩(wěn)定性進(jìn)一步的降低,易于發(fā)生變形甚至滑動(dòng)。茂縣對外交通以公路為主,國道213線、省道302線縱貫全境,大部分道路依山而建,道路兩旁的斜坡經(jīng)人工改造較多,巖土體較為松散,且過多的人工開挖改變了地應(yīng)力的分布,致使道路沿線斜坡破壞至災(zāi)多發(fā)。如2014年7月17日,國道213線的K774+600 m處路段發(fā)生大體積斜坡破壞,100 m的道路被掩埋,造成21人受傷,10人遇難。而在對該斜坡破壞點(diǎn)采集的過程中,發(fā)現(xiàn)這些破壞點(diǎn)集中分布在道路沿線一定范圍內(nèi)。這可能是由于道路修建過程中,沿線斜坡一定范圍內(nèi)的地應(yīng)力發(fā)生改變。因此,經(jīng)過實(shí)際勘察和研究[20],選取道路沿線6 km范圍內(nèi)作為研究區(qū)。
本研究的斜坡破壞點(diǎn)數(shù)據(jù)來源于四川省國土資源廳的2019年斜坡隱患點(diǎn)排查數(shù)據(jù),包括了斜坡破壞點(diǎn)的編號、類型和位置坐標(biāo);高程圖、路網(wǎng)、河網(wǎng)來源于谷歌遙感影像,地質(zhì)圖由全國地質(zhì)資料館的1∶20萬地質(zhì)圖矢量獲得,植被數(shù)據(jù)來源于NASA的MODIS遙感成品數(shù)據(jù),年平均降雨數(shù)據(jù)來源于國家氣象局網(wǎng)站。
山區(qū)公路斜坡物理韌性受到多個(gè)因素的影響,影響因子的選擇是基于物理韌性機(jī)理進(jìn)行選擇。通過對茂縣地質(zhì)條件和環(huán)境條件的研究分析,可以了解到茂縣的斜坡物理韌性受到地形地貌、地質(zhì)構(gòu)造、環(huán)境條件以及人類工程活動(dòng)的影響。經(jīng)過對現(xiàn)有研究中的評價(jià)因子的統(tǒng)計(jì),發(fā)現(xiàn)地形地貌中高程、坡度、坡向這3個(gè)因子是經(jīng)常被選用的,因?yàn)檫@3個(gè)因子是描述地形地貌的基本指標(biāo)。除此之外,曲率[22-23]、微地貌和坡位[20]也是經(jīng)常考慮的地形地貌因素,曲率展現(xiàn)了地表的起伏度,微地貌和坡位表現(xiàn)了一個(gè)斜坡的微觀地形變化。巖性也是影響斜坡物理韌性的重要因素之一,巖土體的抗風(fēng)化能力會(huì)影響到斜坡的穩(wěn)定性。由于茂縣位于龍門山斷裂帶地區(qū),地層活動(dòng)性較強(qiáng),斷層節(jié)理發(fā)育較多,這些構(gòu)造周圍的斜坡的巖土體破碎程度較大,所以斜坡的物理韌性較低。巖質(zhì)邊坡中順逆向坡也是影響斜坡物理韌性的一個(gè)重要因素,一般來說,順向坡的物理韌性較差,易于發(fā)生斜坡失穩(wěn)。茂縣的氣候條件為高原性季風(fēng)氣候,夏季經(jīng)常有強(qiáng)降雨天氣,降雨會(huì)降低的斜坡的物理韌性。而且茂縣的縣域中水系較多,河流對坡岸具有沖刷作用,降低河流沿線的斜坡穩(wěn)定性。在現(xiàn)有的研究中,植被條件也是一個(gè)在研究斜坡穩(wěn)定時(shí)經(jīng)常被考慮的因素,一方面,植被可以降低雨水等對斜坡的沖刷作用,另一方面植物的根對巖土體具有錨固作用,增強(qiáng)斜坡的物理韌性。歸一化植被指數(shù)可以描述植被的覆蓋率和生長狀況,所以一般選用它作為植被指標(biāo)。綜上所述,選取了高程、坡度、坡位、坡向、曲率、微地貌、巖性、順逆向坡、歸一化植被指數(shù)、距斷層距離、距水系距離、距道路距離以及多年平均降雨量這13個(gè)因素作為本次研究的評價(jià)因子。
高程圖是在谷歌0.5 m影像通過裁剪獲得;坡度、坡位、坡向、曲率、微地貌是將高程圖通過GIS軟件處理獲得;順逆向坡是地層傾向與斜坡坡向疊加分析后按照相應(yīng)的規(guī)律重分類獲得;巖性、斷層均對1∶20萬地質(zhì)圖矢量化獲得。由于高程圖的柵格圖層是30 m×30 m,所以本次研究中以30 m×30 m柵格單元作為最小研究單元,將整個(gè)研究區(qū)按照柵格單元法進(jìn)行劃分,即在ArcMap中建立30 m×30 m的漁網(wǎng),得到了208 828個(gè)柵格單元。為了方便后期的數(shù)據(jù)處理,對坡向、坡位、微地貌、順逆向坡、巖性這5個(gè)非量化的評價(jià)因子進(jìn)行量化處理并重分類。同時(shí)對斷層、道路、水系進(jìn)行多級緩沖,并采用重分類數(shù)據(jù),重分類標(biāo)準(zhǔn)詳見表1。其他5個(gè)定量評價(jià)指標(biāo)直接采用原始數(shù)據(jù)。
表1 山區(qū)公路沿線斜坡物理韌性影響因子分類
為了降低數(shù)據(jù)離散性,對全部13個(gè)因子進(jìn)行歸一化,將每個(gè)因子的值進(jìn)行線性變換,使數(shù)值歸一到[0,1]之間,歸一化的方法為:
(1)
式中:X*為歸一化后的數(shù)據(jù);X為原始數(shù)據(jù);Xmin為數(shù)據(jù)的最小值;Xmax為數(shù)據(jù)的最大值。
并在ArcGIS中構(gòu)建研究區(qū)13個(gè)斜坡物理韌性評價(jià)因子專題圖層(如圖1所示)。最終得到含13個(gè)斜坡物理韌性評價(jià)因子所有柵格單元的地理空間數(shù)據(jù)庫。
圖1 茂縣公路沿線斜坡物理韌性評價(jià)因子圖層
隨機(jī)森林方法是美國科學(xué)家Leo Breiman[24-26]于2001年提出的一種機(jī)器學(xué)習(xí)方法,它是由并行式集成學(xué)習(xí)理論的Bagging 方法以及隨機(jī)子空間方法相結(jié)合而形成。隨機(jī)森林包含了多個(gè)由bagging集成學(xué)習(xí)技術(shù)訓(xùn)練得到的決策樹,是一種基于決策樹基本分類器的一個(gè)集成學(xué)習(xí)模型[27]。隨機(jī)森林模型各個(gè)回歸樹之間的相關(guān)性較低,對噪聲數(shù)據(jù)和異常性的容忍度較高,具有較好的準(zhǔn)確性[28]。其主要思想是通過自助法從原始數(shù)據(jù)集中隨機(jī)且有放回地抽取K個(gè)訓(xùn)練集,形成K棵決策樹;每棵決策樹內(nèi)部的節(jié)點(diǎn)從N個(gè)韌性評價(jià)因子中隨機(jī)選取n個(gè)因子作為分裂標(biāo)準(zhǔn)(n≤N);每棵樹都不做剪枝處理,任其自由生長;最后,使K棵決策樹組成隨機(jī)森林,對K個(gè)結(jié)果采用投票的方式得到最終分類結(jié)果[29],計(jì)算公式為:
(2)
式中:K為RF中決策樹的數(shù)目;c為斜坡破壞與否(c=0,1,0表示斜坡發(fā)生破壞,1表示斜坡沒有發(fā)生破壞);P為概率函數(shù)。
通過對斜坡破壞災(zāi)害的數(shù)據(jù)統(tǒng)計(jì),共有498柵格單元發(fā)生脆性破壞,將其記為0。在實(shí)際的情況下,斜坡破壞災(zāi)害并不是以點(diǎn)的形式存在,而是發(fā)生在一定范圍內(nèi)。在ArcGIS中對歷史破壞點(diǎn)進(jìn)行緩沖,緩沖的范圍選為600 m,緩沖范圍以外的區(qū)域未受到地災(zāi)的影響發(fā)生變形破壞,記為1。隨機(jī)選取2 000個(gè)未受影響點(diǎn)和200個(gè)破壞點(diǎn)作為一組樣本,總共選取5組訓(xùn)練樣本。將訓(xùn)練樣本通過R語言進(jìn)行隨機(jī)森林訓(xùn)練,在建立隨機(jī)森林模型之前,將樣本數(shù)據(jù)按照7∶3的比例分為訓(xùn)練樣本數(shù)據(jù)和驗(yàn)證樣本數(shù)據(jù)。在運(yùn)用訓(xùn)練樣本數(shù)據(jù)建立隨機(jī)森林模型,獲得斜坡物理韌性預(yù)測的訓(xùn)練模型。再對驗(yàn)證樣本數(shù)據(jù)進(jìn)行預(yù)測,選擇預(yù)測效果最好的一組作為最終訓(xùn)練模型。
在隨機(jī)森林模型中對13個(gè)評價(jià)因子的重要性進(jìn)行排序,得到的結(jié)果如圖2所示。%IncMSE是指在對一個(gè)指標(biāo)進(jìn)行隨機(jī)賦值,如果這個(gè)指標(biāo)重要的話,那么預(yù)測時(shí)誤差也會(huì)增大。IncNodePurity中的Node Purity是RSS(殘差平方和)的減少,Node Purity的增減也就是基尼指數(shù)的減少。%IncMSE指標(biāo)中高程、距道路距離、距水系距離、NDVI以及降雨這5個(gè)評價(jià)因子的作用比重較大,而IncNodePurity中距道路距離、距水系距離、高程、距斷層距離和坡向這5個(gè)評價(jià)因子的作用比重較大。綜合上述兩個(gè)指標(biāo)的排序可知高程、距道路距離、距水系距離這3個(gè)評價(jià)因子對斜坡物理韌性的影響最大。
圖2 各評價(jià)因子的重要性排序
為檢測模型的有效性,常采用混淆矩陣來分析模型的預(yù)測精度。即將無破壞看作正類(positive)、有破壞視為負(fù)類(negative),實(shí)例是正類且被預(yù)測為正類,稱為真正類(true positive,TP);實(shí)例是負(fù)類但被預(yù)測為正類,稱之為假正類(false positive,F(xiàn)P),如果實(shí)例是負(fù)類且被預(yù)測為負(fù)類,稱為真負(fù)類(true negative,TN);實(shí)例是正類但被預(yù)測成負(fù)類,則稱之為假負(fù)類(false negative,F(xiàn)N)。如表2所示,1代表正類,無破壞發(fā)生;0代表負(fù)類,有破壞發(fā)生。將本文的訓(xùn)練樣本數(shù)據(jù)代入隨機(jī)森林模型中,計(jì)算得到樣本數(shù)據(jù)的抵抗災(zāi)變破壞的能力P。以0.5為閾值,P大于0.5,表示抵抗災(zāi)變破壞能力大,預(yù)測結(jié)果為無災(zāi)變;P小于0.5,表示抵抗災(zāi)變破壞能力小,預(yù)測結(jié)果有災(zāi)變。從表2中可以看出,訓(xùn)練樣本的總體預(yù)測精度達(dá)到98.9%,召回率和精密度分別為1.000和0.988,效果較好。
表2 訓(xùn)練樣本觀測值與預(yù)測值的對比
除此之外,也可用ROC曲線對模型的準(zhǔn)確度進(jìn)行研究。ROC曲線下的面積(AUC),可以定量的表示模型預(yù)測的準(zhǔn)確率[30]。將訓(xùn)練數(shù)據(jù)、驗(yàn)證數(shù)據(jù)和整個(gè)研究區(qū)的數(shù)據(jù)進(jìn)行ROC曲線分析,分析結(jié)果顯示,訓(xùn)練數(shù)據(jù)集、驗(yàn)證數(shù)據(jù)集和研究區(qū)全體數(shù)據(jù)集仿真結(jié)果的AUC值分別為1.000,0.870和0.978,驗(yàn)證數(shù)據(jù)集和其他兩個(gè)數(shù)據(jù)集差異相差不大,且3個(gè)AUC值都較高,為1或接近于1,說明該模型具有良好的可靠性。
將訓(xùn)練模型對驗(yàn)證數(shù)據(jù)進(jìn)行訓(xùn)練,并仿真到整個(gè)研究區(qū)中,得到整個(gè)研究區(qū)的斜坡物理韌性概率圖。為了方便研究將得到的概率圖分為5個(gè)等級,經(jīng)過反復(fù)的試算,劃分的標(biāo)準(zhǔn)為極低(p<0.85)、低(0.85
0.99)。得到研究區(qū)的斜坡物理韌性等級圖(圖3)。通過圖3可以看出大部分的破壞點(diǎn)分布在斜坡物理韌性較低和低的地方,而韌性高的地方發(fā)生的破壞點(diǎn)較少,這個(gè)結(jié)果是和理論分析一致的。
圖3 茂縣公路沿線斜坡物理韌性等級
對得到的茂縣公路沿線斜坡物理韌性等級圖進(jìn)行進(jìn)一步的定量的研究。統(tǒng)計(jì)每個(gè)物理韌性等級的面積占比以及其中的斜坡破壞點(diǎn)和破壞點(diǎn)占比,再根據(jù)破壞點(diǎn)占比和面積占比計(jì)算滑坡密度(表3)。通過表3可以看出,隨著物理韌性等級的增加,其面積占比也在隨之增加,而其區(qū)域的破壞點(diǎn)占比則隨之減少,滑坡密度也是隨之減少的。物理韌性極低和低等級區(qū)域的占比比較少,只有19.57%,但是其中的斜坡破壞點(diǎn)卻占到了占到了整個(gè)研究區(qū)的49.8%,斜坡破壞點(diǎn)的密度也較高。這表示訓(xùn)練模型的仿真程度較好。
表3 茂縣公路沿線斜坡物理韌性分級統(tǒng)計(jì)
(1) 本研究對山區(qū)公路沿線斜坡物理韌性進(jìn)行了研究,確認(rèn)地形地貌、地質(zhì)環(huán)境、降雨等因素會(huì)影響斜坡物理韌性。因此選取高程、坡度、坡位、坡向、曲率、微地貌、巖性、順逆向坡、歸一化植被指數(shù)、距斷層距離、距水系距離、距道路距離以及多年平均降雨量這13個(gè)因子作為斜坡物理韌性的評價(jià)因子,構(gòu)建地理空間數(shù)據(jù)庫。
(2) 山區(qū)公路沿線斜坡物理韌性受多種因素耦合影響,簡單的線性模型的預(yù)測準(zhǔn)確度較低,所以選擇隨機(jī)森林模型。將隨機(jī)森林模型結(jié)合地理空間數(shù)據(jù)庫和歷史斜坡破壞點(diǎn)進(jìn)行建模,建立山區(qū)道路沿線斜坡物理韌性評價(jià)模型,并對評價(jià)因子進(jìn)行排序,高程、距道路距離、距水系距離這3個(gè)評價(jià)因子的權(quán)重較大。運(yùn)用混淆矩陣和ROC曲線驗(yàn)證建立的物理韌性評價(jià)模型的準(zhǔn)確性。其混淆矩陣的召回率和精密度分別為1.000和0.988,精度達(dá)到98.9%;訓(xùn)練數(shù)據(jù)集、驗(yàn)證數(shù)據(jù)集以及區(qū)域仿真的ROC曲線AUC值分別為1.000,0.870和0.978模型具有較高的預(yù)測性。
(3) 將模型仿真到真?zhèn)€研究區(qū)域中,得到山區(qū)道路斜坡物理韌性評價(jià)圖。運(yùn)用統(tǒng)計(jì)分析驗(yàn)證仿真的精確度,極低和低等級區(qū)域的占比比較少,只有19.57%,但是其中的歷史災(zāi)變點(diǎn)卻占到了整個(gè)研究區(qū)的49.8%,歷史斜坡破壞點(diǎn)主要分布在物理韌性低和較低的區(qū)域中。綜合表明該模型具有較高的可靠性與穩(wěn)定性。