【編者按】黃河上游干流庫壩群段是黃河的安全屏障,對于保障黃河長治久安、全流域生態(tài)保護(hù)和高質(zhì)量發(fā)展具有重要的基礎(chǔ)支撐作用。由于黃河上游地質(zhì)新構(gòu)造活動強(qiáng)烈、地貌類型復(fù)雜、生態(tài)系統(tǒng)脆弱,地震、崩滑流、暴雨與山洪等復(fù)合鏈生災(zāi)害具有非線性、疊加與“碰頭”等顯著特征,因此難以實(shí)現(xiàn)對其孕育、發(fā)展、演化過程的精準(zhǔn)解析與建模,使得黃河上游梯級水庫系統(tǒng)安全及流域人民生命財(cái)產(chǎn)存在直接威脅。為解決國家與行業(yè)在黃河上游干流庫壩群段多災(zāi)種應(yīng)對方面面臨的現(xiàn)實(shí)難題,在“十四五”國家重點(diǎn)研發(fā)計(jì)劃項(xiàng)目“黃河上游干流庫壩群段多災(zāi)種應(yīng)對關(guān)鍵技術(shù)\"的支持下,聯(lián)合、、、等單位,開展了系統(tǒng)深入的研究工作,取得了系列創(chuàng)新技術(shù)成果,針對黃河上游干流庫壩群段地質(zhì)地貌特征與工程系統(tǒng)組成,提出了多災(zāi)種耦合模擬及高危險(xiǎn)區(qū)定量識別方法,研發(fā)了多災(zāi)種多源數(shù)據(jù)準(zhǔn)實(shí)時(shí)/實(shí)時(shí)優(yōu)化-建模-集成技術(shù),開發(fā)了多源信息集成共享的實(shí)景化大數(shù)據(jù)智能預(yù)警平臺,構(gòu)建了多災(zāi)種快速評估與精準(zhǔn)損失評估天空地一體化關(guān)鍵技術(shù)體系,集成了高海拔缺氧環(huán)境下多災(zāi)種高效指揮應(yīng)對智能決策支持系統(tǒng),全面提升黃河上游干流庫壩群段多災(zāi)種系統(tǒng)應(yīng)對能力。本刊擇其主要成果予以集中刊發(fā),以饗讀者。
關(guān)鍵詞:滑坡;敏感性;GIS;地理探測器模型;隨機(jī)森林模型中圖分類號:P642.22;TV882.1 文獻(xiàn)標(biāo)志碼:A doi:10.3969/j.issn.1000-1379.2025.07.001引用格式;胡少偉,郭要輝,許耀群,等.耦合地理探測器和機(jī)器學(xué)習(xí)模型的滑坡致災(zāi)因子敏感性分析[J].人民黃河,2025,47(7):1-7,34.
Sensitivity Analysis of Landslide Hazard Factors by Coupling Geographic Detector and Machine Learning Model
HU Shaowei1,GUO Yaohui 2,XU Yaoqun1,LI Liang2,LONG Kun2,WANG Chenfeng (1.College of Water Conservancy and Transportation,Zhengzhou University,Zhengzhou 45ooo1,China; 2.School of Civil Engineering,Chongqing University,Chongqing 40OO45,China )
Abstract:Inrdertoprovidereferencesforlandslidehazardpreventionandresearchonthesensivityoflandslide-causingfactors,the Longyangxia-JishiasectionofteupperYelowRiverasinasseleedasthesudyarea,nd1factorssuchaselevationloain roughnessandlilereakstypaldslidardfactos.ecollaritsasadoutypeancoelatiot methodtoselectlndslideaardfactors wisrogoelation.Gwassedtoassfylandsliddsstercausingfactorsadaaetir weights with geographicdetectors.TegeogaphicdetectionmodelresultswerecoupledwithandomforestodeltoobtainlandsldepredictionprobabilitsunderdiferentcausativefactorsROCcurveasusedtoverifyteauracyofpredictionresults.Thersultsindicatehat a)theexplaaoyoerofthiteractiotecausatiectorsisgeatertantatofdiiduafctos,witsesticetofele vationandotrpogapicraetersngprticlalyant.b)eiportaeofragdsityopgapcoud filecurvatureisearlosuestitatteausyotedtoscantoelaoilndocche arenotablediferencesintecontributionofcusativefactorstothepredictionesults,withthelevation-sopecombinationbeingtheore drivingunitforlndslidedevelopmentinthsdyarea.d)TheAUCvalueofrandomforestmodelhasachevedO93,ndicatingstroglasification performance.
Key words: landslide; sensitivity;GIS;geographical detector model; RF
0 引言
滑坡是一種常見的地質(zhì)災(zāi)害,廣泛分布于山地、丘陵等地形復(fù)雜的區(qū)域[]?;碌男纬蓹C(jī)制復(fù)雜,通常為多因素共同作用,主要的影響因素包括降雨、地質(zhì)條件、地形地貌、植被覆蓋和人類活動等[2-3]。在全球氣候變化持續(xù)加劇與人類工程活動雙重驅(qū)動下,滑坡災(zāi)害呈現(xiàn)顯著增長趨勢,對人類生命財(cái)產(chǎn)安全及生態(tài)環(huán)境穩(wěn)定構(gòu)成嚴(yán)重威脅[4-5] O
近年來,滑坡易發(fā)性評價(jià)是滑坡風(fēng)險(xiǎn)研究的熱點(diǎn)之一[6]?;乱装l(fā)性是指在特定的地理環(huán)境條件下,某一區(qū)域發(fā)生滑坡的可能性大小[7]。對滑坡易發(fā)性的定量分析不僅可以識別滑坡高風(fēng)險(xiǎn)區(qū)域,為災(zāi)害預(yù)警和防控提供支持,而且能夠揭示滑坡的空間分布規(guī)律及其主要驅(qū)動因素,為區(qū)域可持續(xù)發(fā)展提供科學(xué)指導(dǎo)[8]。目前,國內(nèi)學(xué)者對滑坡易發(fā)性的研究經(jīng)歷了從定性分析到定量建模的演變,分析方法逐漸由經(jīng)驗(yàn)判斷向基于數(shù)據(jù)的科學(xué)建模方向發(fā)展[9-10],研究主要分為基于統(tǒng)計(jì)的方法、基于機(jī)器學(xué)習(xí)的方法和基于空間分析的方法三類。基于統(tǒng)計(jì)的方法分為定性和定量兩大類,定性分析側(cè)重于通過專家知識、經(jīng)驗(yàn)或歷史研究來對滑坡易發(fā)性進(jìn)行評估,主觀性較強(qiáng)[\"],主要包括專家打分法[12]、經(jīng)驗(yàn)法[13]和層次分析法[14];定量分析可以較為客觀地揭示影響因素之間的關(guān)系,減少人為主觀因素的影響,但需要較為詳盡和可靠的數(shù)據(jù)支持,數(shù)據(jù)質(zhì)量的高低直接影響分析結(jié)果,主要包括邏輯回歸法[15]判別分析法[16]和加權(quán)疊加法[17]。隨著計(jì)算能力的提升,機(jī)器學(xué)習(xí)方法逐漸成為滑坡易發(fā)性評價(jià)的主流方法[18]。機(jī)器學(xué)習(xí)方法通過學(xué)習(xí)大量的歷史數(shù)據(jù),自動提取特征并建立非線性關(guān)系模型,能夠有效解決傳統(tǒng)方法中線性假設(shè)的局限性,包括隨機(jī)森林法[19]、梯度提升樹法[20]、XGBoost 法[2I]、長短期記憶網(wǎng)絡(luò)法[22]、支持向量機(jī)法(SVM)[23]、神經(jīng)網(wǎng)絡(luò)法[24]和Transformer法[25]等??臻g分析方法主要依賴地理信息系統(tǒng)技術(shù),結(jié)合空間統(tǒng)計(jì)模型,揭示滑坡易發(fā)性的空間異質(zhì)性。常見的空間分析方法包括地理加權(quán)回歸法(GWR)[26]和地理探測器法[27]等。盡管現(xiàn)有方法在滑坡易發(fā)性研究領(lǐng)域取得了顯著成效,但是仍面臨一些挑戰(zhàn)。首先,不同研究方法的適用性和預(yù)測性可能因區(qū)域差異而表現(xiàn)出顯著的不一致性。其次,多源數(shù)據(jù)的融合與質(zhì)量控制對模型的魯棒性提出了更高要求。此外,滑坡易發(fā)性受多種自然和人為因素的影響,其分布通常具有明顯的空間異質(zhì)性。因此,開發(fā)既適用于不同區(qū)域,又具備高精度與良好解釋性的滑坡易發(fā)性分析方法,仍然是當(dāng)前研究的主要方向。
隨機(jī)森林法雖在預(yù)測精度上表現(xiàn)出色,但作為“黑箱”模型,其內(nèi)部機(jī)制難以解釋。地理探測器法可以量化分析影響因子的獨(dú)立效應(yīng)和交互效應(yīng),揭示各個(gè)因子如何驅(qū)動滑坡的發(fā)生,從而提供更具解釋性的研究成果。地理探測器法能夠識別空間異質(zhì)性的驅(qū)動因子,并量化其對滑坡易發(fā)性影響的程度,而隨機(jī)森林法能夠在這種異質(zhì)性空間背景下,通過充分挖掘多因子之間復(fù)雜的非線性關(guān)系,提供較為精準(zhǔn)的預(yù)測。此外,隨機(jī)森林法具有較強(qiáng)的多源數(shù)據(jù)融合能力,可以處理多個(gè)變量對滑坡易發(fā)性的影響,而地理探測器法則有助于量化分析這些數(shù)據(jù)的相關(guān)性及相互作用,識別出關(guān)鍵因子和各因子的交互效應(yīng)。在此背景下,本文以黃河上游龍羊峽至積石峽段流域?yàn)檠芯繀^(qū)域,利用斯皮爾曼相關(guān)系數(shù)篩選出相關(guān)性較強(qiáng)的滑坡致災(zāi)因子,耦合隨機(jī)森林模型和地理探測器法,量化主要影響因子對滑坡易發(fā)性的貢獻(xiàn)率及其交互作用,以期為滑坡災(zāi)害防治和滑坡致災(zāi)因子敏感性研究提供參考。
1 研究區(qū)概況
黃河上游龍羊峽至積石峽段流域地處青藏高原東部邊緣,地形地貌復(fù)雜多樣,以高山和峽谷為主,具有典型的黃河流域高原地貌特征。研究區(qū)海拔為 1 651~ 5290m ,地勢總體西高東低,沿黃河主流流向逐漸降低,涉及青海省共和縣、貴南縣、貴德縣、湟中區(qū)、尖扎縣、化隆縣、循化縣以及民和縣等,面積為57010.17km2 。研究區(qū)降水量時(shí)空分布不均,多年平均降水量350~450mm ,呈現(xiàn)由東南向西北遞減趨勢,其中7—9月雨季集中全年 70% 以上降水量。短時(shí)強(qiáng)降雨現(xiàn)象多發(fā),最大雨強(qiáng)達(dá) 50mm/h ,尤其在峽谷區(qū)易形成局地暴雨中心。氣候以高原大陸性氣候?yàn)橹?,氣溫較低,降水量受海拔影響顯著。區(qū)內(nèi)水系密集,黃河干流及其支流構(gòu)成了重要的水文體系,水量豐富但分布不均,水庫調(diào)蓄使水文條件發(fā)生了顯著變化。此外,研究區(qū)地質(zhì)構(gòu)造復(fù)雜,分布有多種巖性類型和斷裂構(gòu)造,地質(zhì)災(zāi)害風(fēng)險(xiǎn)較高,滑坡、泥石流等災(zāi)害多發(fā)。研究區(qū)概況見圖1。
2 致災(zāi)因子選擇
滑坡致災(zāi)因子的選擇是滑坡易發(fā)性評價(jià)的重要環(huán)節(jié),本文依據(jù)研究區(qū)滑坡發(fā)育特征和已有學(xué)者研究成果,從地質(zhì)、地形、植被與水文、人類活動等方面選取滑坡致災(zāi)因子。
2.1 地質(zhì)因子
1)巖性。一般包括巖石和土兩種類型。軟弱巖層或松散沉積物易吸水軟化,抗剪強(qiáng)度低,風(fēng)險(xiǎn)極高。2)與斷層距離。某點(diǎn)與最近地質(zhì)斷層的直線距離,斷層帶附近巖體破碎、裂隙發(fā)育,易滲水失穩(wěn)。
2.2 地形因子
1)高程。影響滑坡發(fā)育的重要因子之一,在中高海拔區(qū)凍融作用強(qiáng),巖體易破碎。2)坡度。即坡面的垂直高度與水平寬度之比,較陡的坡度往往為滑坡體提供充足動力。3)坡向。影響陽光照射時(shí)長、植被生長和土體含水率,這些因素間接影響坡體的力學(xué)狀態(tài)。4)剖面曲率。沿斜坡垂直方向(水流方向)的曲率,反映地表凹凸形態(tài)。凹形區(qū)水流匯聚,易積水增重加大滑動可能性;凸形區(qū)水流發(fā)散,易產(chǎn)生張力裂縫導(dǎo)致坡體失穩(wěn)。
5)平面曲率。沿水平方向的曲率,反映地表橫向凹凸形態(tài)。凹形區(qū)易因水力集中而易觸發(fā)淺層滑坡,凸形區(qū)易因側(cè)蝕而導(dǎo)致坡腳失穩(wěn)。
6)地形起伏度。區(qū)域內(nèi)最高點(diǎn)與最低點(diǎn)的高差,反映地勢陡峭程度。高起伏區(qū)勢能大、侵蝕強(qiáng),易發(fā)生深層滑坡。7)地形粗糙度。地表微觀起伏的復(fù)雜程度,量化反映地形不規(guī)則性。高粗糙度可能阻礙水流,但也可能因微地形起伏大而形成局部堵塞,增加滑坡風(fēng)險(xiǎn)。8)地表切割深度。一般來講,地表切割深度越大表明侵蝕越強(qiáng)烈,越易形成滑坡。9)高程變異系數(shù)。區(qū)域內(nèi)高程值的離散程度,反映地形變化情況。高程離散程度高的區(qū)域地形復(fù)雜,可能產(chǎn)生陡坡、破碎帶等高風(fēng)險(xiǎn)區(qū)。
2.3 植被與水文因子
1)歸一化植被指數(shù)(NDVI)。反映研究區(qū)植被疏密程度,高覆蓋度植被通過根系固結(jié)土壤、通過樹冠截留降水減少徑流,使坡體更穩(wěn)定。2)年降雨量。降雨入滲增加孔隙水壓力,降低巖土抗剪強(qiáng)度,暴雨可直接觸發(fā)滑坡3)河網(wǎng)密度。單位面積內(nèi)河流總長度,反映水系發(fā)育程度。高密度河網(wǎng)加劇側(cè)向侵蝕和坡腳沖刷,破壞坡體穩(wěn)定性。
2.4 人類活動因子
1)土地利用類型。地表的土地利用方式(如森林、農(nóng)田、建設(shè)用地)和人類建設(shè)活動往往改變斜坡荷載。
2)路網(wǎng)密度。即單位面積內(nèi)道路總長度。道路開挖破壞坡體結(jié)構(gòu),增加荷載,改變排水路徑,易誘發(fā)滑坡。
2.5 數(shù)據(jù)來源
本文所用高程數(shù)據(jù)來源于地理空間數(shù)據(jù)云;坡度、坡向、曲率、平面曲率、剖面曲率、地形起伏度、地形粗糙度、地表切割深度和高程變異系數(shù)數(shù)據(jù)通過高程數(shù)據(jù)處理得到;河網(wǎng)密度數(shù)據(jù)來源于ScienceDateBank,路網(wǎng)密度數(shù)據(jù)基于第三次全國國土調(diào)查縣級數(shù)據(jù)計(jì)算而得;歸一化植被指數(shù)源于國家生態(tài)數(shù)據(jù)中心資源共享服務(wù)平臺;年降雨量數(shù)據(jù)源于中國氣象局氣象數(shù)據(jù)中心;與斷層距離來源于中國活動斷層數(shù)據(jù)庫。對于連續(xù)型致災(zāi)因子,采用自然斷點(diǎn)分級法進(jìn)行分級;對于離散型致災(zāi)因子,以現(xiàn)有分類為主,根據(jù)數(shù)據(jù)實(shí)際情況進(jìn)行重分類。致災(zāi)因子分級分類見圖2。
3 研究方法
通過斯皮爾曼相關(guān)系數(shù)法篩選出與滑坡災(zāi)害相關(guān)性較強(qiáng)的致災(zāi)因子,利用地理探測器得到滑坡致災(zāi)因子權(quán)重,將地理探測結(jié)果耦合隨機(jī)森林模型,得到不同致災(zāi)因子作用下的滑坡預(yù)測概率,使用ROC曲線驗(yàn)證預(yù)測結(jié)果的準(zhǔn)確度。
3.1 斯皮爾曼相關(guān)系數(shù)法
斯皮爾曼相關(guān)系數(shù)法(Spearman’sRankCorrelationCoefficient)用于衡量兩個(gè)變量之間的單調(diào)關(guān)系。與皮爾遜相關(guān)系數(shù)法不同,斯皮爾曼相關(guān)系數(shù)法不要求數(shù)據(jù)具備正態(tài)分布或線性關(guān)系,它是一種基于數(shù)據(jù)值排序來度量變量之間關(guān)系的非參數(shù)統(tǒng)計(jì)方法,能夠評估兩個(gè)變量的關(guān)聯(lián)程度,尤其適用于處理順序數(shù)據(jù)或無法進(jìn)行數(shù)值轉(zhuǎn)換的數(shù)據(jù)。在本研究中,斯皮爾曼相關(guān)系數(shù)法被用來評估不同因素之間的單調(diào)相關(guān)性,尤其是在滑坡易發(fā)性研究中,用于分析高程、巖性、年降雨量和土壤類型等對滑坡發(fā)生的潛在影響。通過這種方法,能夠更清晰地揭示各因子間的相互關(guān)系,為進(jìn)一步的滑坡易發(fā)性預(yù)測和評估提供理論依據(jù)。斯皮爾曼相關(guān)系數(shù)計(jì)算公式為
式中 :ρ 為斯皮爾曼相關(guān)系數(shù), di 為第 i 個(gè)觀測值的秩次差, n 為樣本數(shù)。
3.2 地理探測器法
地理探測器法是一種用于研究空間數(shù)據(jù)中不同變量之間關(guān)系的統(tǒng)計(jì)方法,尤其適用于分析地理現(xiàn)象與其影響因素之間的空間關(guān)系。該方法由我國學(xué)者王勁峰及其團(tuán)隊(duì)提出,操作簡單,且具有較強(qiáng)的解釋性,不需要假設(shè)變量之間的關(guān)系形式,因此能夠適應(yīng)非線性、非正態(tài)的情況[28]。它可以識別不同風(fēng)險(xiǎn)因子之間的交互作用,即兩個(gè)評估因子共同作用時(shí)是否會增強(qiáng)或減弱對目標(biāo)變量Y(本研究為滑坡發(fā)生的核密度)的解釋力,或這些因子對 Y 的影響是相互獨(dú)立的,從而幫助分析復(fù)雜的地理現(xiàn)象和空間分布規(guī)律。通過比較各單因子解釋力 和交互解釋力 q(x1∩x2) 的大小,可以判斷交互作用的類型,表1為因子交互作用類型。與其他傳統(tǒng)方法相比,地理探測器法能夠更好地應(yīng)對復(fù)雜的非線性關(guān)系和區(qū)域差異性,為滑坡災(zāi)害的預(yù)測、風(fēng)險(xiǎn)評估和防治提供強(qiáng)有力的理論支撐。
表1因子交互作用類型
Tab.1 Types of Factors Interaction
3.3 隨機(jī)森林模型
隨機(jī)森林模型(RandomForest)是一種集成學(xué)習(xí)算法,它通過建立多個(gè)決策樹并結(jié)合各個(gè)樹的預(yù)測結(jié)果,來進(jìn)行分類或回歸[29]。隨機(jī)森林模型已經(jīng)廣泛應(yīng)用于滑坡易發(fā)性評價(jià),其能夠處理復(fù)雜的非線性關(guān)系,具有較高的準(zhǔn)確性和較強(qiáng)的魯棒性,是滑坡易發(fā)性預(yù)測的理想選擇。盡管隨機(jī)森林模型在計(jì)算資源和模型復(fù)雜度方面存在一定的挑戰(zhàn),但其在處理高維、復(fù)雜、噪聲較多的地理數(shù)據(jù)時(shí)仍然表現(xiàn)出明顯的優(yōu)勢。隨機(jī)森林模型通過數(shù)據(jù)隨機(jī)抽樣、特征隨機(jī)選擇、決策樹訓(xùn)練和集成預(yù)測與優(yōu)化做出最終判定。
結(jié)果與分析
4.1 單因子探測結(jié)果
利用地理探測器法進(jìn)行致災(zāi)因子探測分析結(jié)果表明,所選的16個(gè)致災(zāi)因子均通過了顯著性水平為0.05的檢驗(yàn),可認(rèn)為是導(dǎo)致研究區(qū)滑坡發(fā)生的因子,對滑坡災(zāi)害發(fā)生有不同程度貢獻(xiàn)。由致災(zāi)因子探測分析結(jié)果(見圖3)可知:高程的影響最大(為0.359),與斷層距離的影響最小(為0.003)。各致災(zāi)因子對滑坡災(zāi)害發(fā)生的解釋力大小為:高程 (0.359)gt; 路網(wǎng)密度 (0.159)gt; 高程變異系數(shù)(0.131) gt; 年降雨量 (0.114)gt; 土地利用類型 (0.100)gt; 地形起伏度 (0.086)gt; 地表切割深度(0.078)gt; 巖性 (0.075)gt; 坡度(0.061) gt; 剖面曲率(0.057)gt;平面曲率 (0.055)gt; 地形粗糙度 (0.032)gt; 歸一化植被指數(shù)(0.029) gt; 河網(wǎng)密度 (0.015)gt; 坡向(0.006)gt; 距斷層距離(0.003)。從單個(gè)致災(zāi)因子對滑坡的解釋力來看,最大僅為 36% ,單一致災(zāi)因子對于研究區(qū)滑坡災(zāi)害發(fā)生的解釋力較小,從某種程度說明滑坡災(zāi)害是由多因子共同作用引起的。
4.2 致災(zāi)因子交互作用探測結(jié)果
本研究通過雙因子交互效應(yīng)模型對滑坡災(zāi)害驅(qū)動機(jī)制進(jìn)行解析,結(jié)果見表2。對比單一因子解釋力發(fā)現(xiàn),雙因子交互作用對滑坡災(zāi)害的驅(qū)動作用呈顯著增強(qiáng)特征,具體表現(xiàn)為雙因子增強(qiáng)效應(yīng)或非線性協(xié)同作用。定量分析表明,所有交互組合的預(yù)測效能均超越單因子獨(dú)立作用,且呈現(xiàn)以下規(guī)律:在因子交互組合中,高程因子與其他地形參數(shù)的協(xié)同作用尤為突出。
其中,高程與坡度組合( q=0.465 )、高程與地形起伏度組合 ( ?q=0.462 )、高程與地表切割深度組合( q= 0.445)高程與高程變異系數(shù)組合( q=0.454) 的交互解釋力均超過單一地形因子的最大值。特別值得關(guān)注的是高程-坡度協(xié)同機(jī)制,其在高海拔區(qū)凍融循環(huán)導(dǎo)致基巖裂隙擴(kuò)展,疊加陡坡的重力勢能累積,顯著降低了坡體抗剪強(qiáng)度,導(dǎo)致其為研究區(qū)滑坡發(fā)育的核心驅(qū)動力。此外,高程與地形起伏度的解釋力顯著,劇烈地形起伏、高水力梯度促進(jìn)高海拔區(qū)地下水向坡腳集中排泄,導(dǎo)致孔隙水壓力超限,影響邊坡穩(wěn)定。環(huán)境要素交互同樣呈現(xiàn)顯著增強(qiáng)特征,高程與 NDVI組合( q= 0.484)揭示出高海拔區(qū)植被退化與凍融侵蝕的協(xié)同放大效應(yīng),其解釋力較最大單因子高程( q=0.359 提升 0.125 工程活動相關(guān)組合中,高程-路網(wǎng)密度交互作用( q= 0.411)反映出山地道路建設(shè)對天然排水系統(tǒng)的破壞程度隨海拔升高呈指數(shù)型增長。上述探測結(jié)果證實(shí),滑坡災(zāi)害本質(zhì)上是多因子非線性耦合作用的結(jié)果,其中地形因子間的交互增效作用對災(zāi)害發(fā)育具有決定性影響。研究結(jié)果對構(gòu)建山地災(zāi)害風(fēng)險(xiǎn)預(yù)警模型有重要理論價(jià)值。
4.3 隨機(jī)森林模型
4.3.1 解釋力分析
以滑坡為預(yù)測對象,采用隨機(jī)森林模型對給定數(shù)據(jù)集進(jìn)行建模,系統(tǒng)性探討了模型在特征重要性分析和預(yù)測精度評估方面的表現(xiàn),并通過可視化手段驗(yàn)證了模型的可靠性。研究中使用的數(shù)據(jù)集包含16個(gè)特征變量 (X1~X16) 和1個(gè)目標(biāo)變量 Y 。為確保數(shù)據(jù)質(zhì)量與模型的魯棒性,數(shù)據(jù)預(yù)處理環(huán)節(jié)采用中位數(shù)填充的方法,以盡量減少因缺失值導(dǎo)致的分布偏差。數(shù)據(jù)劃分比例設(shè)定為訓(xùn)練集與測試集 7:3 ,同時(shí),為進(jìn)一步研究特征變量對目標(biāo)變量的影響,在模型訓(xùn)練前將地理探測權(quán)重結(jié)果引入特征變量。各致災(zāi)因子對滑坡的重要性排序見圖4,從圖4可以看出,各致災(zāi)因子對預(yù)測結(jié)果的解釋力存在顯著差異,呈現(xiàn)出明顯的長尾分布,其中高程為核心特征變量,解釋力約0.44,顯著高于其他變量。這表明高程對預(yù)測滑坡具有核心影響力,是直接影響滑坡的關(guān)鍵因子。NDVI和年降雨量緊隨其后,其解釋力分別約為0.15和0.10。盡管它們的解釋力不及高程,但仍對滑坡的預(yù)測起到關(guān)鍵作用。
坡向、路網(wǎng)密度、高程變異系數(shù)和巖性的解釋力為0.02~0.08 ,盡管這些特征變量的解釋力不如核心變量,但它們對預(yù)測結(jié)果具有一定的補(bǔ)充作用。河網(wǎng)密度、地形粗糙度和剖面曲率的解釋力幾乎為0,表明它們對滑坡的發(fā)生幾乎沒有影響,在一定程度上反映了這些特征變量可能與滑坡發(fā)生沒有直接或顯著的相關(guān)性,在進(jìn)一步的模型優(yōu)化中,這些低解釋力變量可以被剔除,以提高模型的效率和預(yù)測穩(wěn)定性。
4.3.2 模型性能評估ROC曲線分析
ROC(Receiver OperatingCharacteristic)曲線與AUC(AreaUnderCurve)值是評估模型性能的重要工具,在分類問題中具有廣泛的應(yīng)用價(jià)值。本研究利用ROC曲線對隨機(jī)森林模型的分類性能進(jìn)行了評估。隨機(jī)森林模型和隨機(jī)猜測模型的ROC曲線見圖5,曲線下方的面積(AUC)被用作評價(jià)分類器整體性能的重要指標(biāo),AUC的取值范圍為 0.5~1.0 ,其中0.5表示模型的性能與隨機(jī)猜測相當(dāng),1.0則代表最強(qiáng)分類能力。從圖5可以看出,隨機(jī)森林模型的AUC值達(dá)到0.93,表明隨機(jī)森林模型具有非常強(qiáng)的分類能力,在區(qū)分正負(fù)樣本方面表現(xiàn)出色,具有較高的準(zhǔn)確性。隨機(jī)森林模型的ROC曲線(藍(lán)色實(shí)線)遠(yuǎn)離隨機(jī)猜測的基準(zhǔn)線(紅色虛線),并在靠近左上角處表現(xiàn)優(yōu)異。這種特性表明模型在同時(shí)保證較低的假陽性率和較高的真陽性率方面有較強(qiáng)的能力。
5結(jié)論
本文通過斯皮爾曼相關(guān)系數(shù)法篩選出相關(guān)性較強(qiáng)的滑坡致災(zāi)因子,利用GIS將滑坡致災(zāi)因子重分類后使用地理探測器分析得到各致災(zāi)因子權(quán)重,將各致災(zāi)因子權(quán)重耦合到隨機(jī)森林模型,得到不同致災(zāi)因子作用下的滑坡預(yù)測概率,并通過ROC曲線驗(yàn)證預(yù)測結(jié)果的準(zhǔn)確度,得到以下結(jié)論:
1)致災(zāi)因子交互作用的解釋力均大于單個(gè)致災(zāi)因子的解釋力。交互作用結(jié)果顯示雙因子增強(qiáng)或非線性增強(qiáng),在因子交互組合中,高程與其他地形參數(shù)的協(xié)同作用尤為突出,對滑坡災(zāi)害發(fā)生的解釋力增大明顯。
2)河網(wǎng)密度、地形粗糙度和剖面曲率的解釋力幾乎為0,在一定程度上說明這些特征變量可能與滑坡發(fā)生沒有直接或顯著的相關(guān)性。在進(jìn)一步的模型優(yōu)化中,這些低解釋力變量可以被剔除,以提高模型的效率和預(yù)測穩(wěn)定性。
3)各致災(zāi)因子對預(yù)測結(jié)果的解釋力存在顯著差異,其中高程-坡度協(xié)同作用下,高海拔區(qū)凍融循環(huán)導(dǎo)致基巖裂隙擴(kuò)展,疊加陡坡的重力勢能累積,顯著降低了坡體抗剪強(qiáng)度,該組合是研究區(qū)滑坡發(fā)育的核心驅(qū)動力。此外,高程與地形起伏度的解釋力顯著,劇烈地形起伏、高水力梯度促進(jìn)高海拔區(qū)地下水向坡腳集中排泄,導(dǎo)致孔隙水壓力超限,影響邊坡穩(wěn)定。
4)隨機(jī)森林模型的AUC值達(dá)到0.93,表明隨機(jī)森林模型具有較高的分類能力,在區(qū)分正負(fù)樣本方面表現(xiàn)出色,具有較高的準(zhǔn)確性。同時(shí),該模型在保證較低的假陽性率和較高的真陽性率方面有較強(qiáng)的能力。
參考文獻(xiàn):
[1]李子豪,王鈞,郭婷婷,等.基于降雨強(qiáng)度-歷時(shí)的安徽省黃山市滑坡分組閾值研究[J].水土保持通報(bào),2022,42(1):184-190.
[2] 尚敏,王殿鵬,易慶林,等.基于最大信息系數(shù)法的臥沙溪滑坡變形相關(guān)性分析及預(yù)警模型研究[J].工程地質(zhì)學(xué)報(bào),2025,33(2):572-580.
[3] 耿豪鵬,徐子怡,郭宇,等.基于粒子群優(yōu)化算法的東構(gòu)造結(jié)滑坡清單建立與侵蝕速率估算[J].水土保持學(xué)報(bào),2025,39(2) :338-347.
[4] 郭鐘群,劉凌峰,劉顏碩,等.風(fēng)化殼淋積型稀土礦區(qū)滑坡預(yù)測方法及適用性探討[J].稀土,1-15(2024-11-28)[2024-12-21].https://kns.cnki.net/kcms/detail/15.1099.TF.20241127.1544.003.html.
[5]路昌明,王祚鵬,吳靚,等.基于環(huán)剪試驗(yàn)的蠕變型滑坡滑帶力學(xué)性質(zhì):以甘肅舟曲地區(qū)鎖兒頭滑坡為例[J].地球科學(xué)與環(huán)境學(xué)報(bào),2024,46(5):677-688.
[6]余紹淮,徐喬,余飛.聯(lián)合光學(xué)和SAR遙感影像的山區(qū)公路滑坡易發(fā)性評價(jià)方法[J].自然資源遙感,2023,35(4):81-89.
[7]洪浩源,王德生,朱阿興.面向機(jī)器學(xué)習(xí)型區(qū)域滑坡易發(fā)性評價(jià)的訓(xùn)練樣本采樣方法[J].地理學(xué)報(bào),2024,79(7):1718-1736.
[8]MERGHADI A,YUNUS A P,DOU J,et al.Machine LearningMethods for Landslide SusceptibiLity Studies:A ComparativeOverview of Algorithm Performance[J].Earth-Science Re-views,2020,207:103225.
[9]周超,殷坤龍,曹穎,等.基于集成學(xué)習(xí)與徑向基神經(jīng)網(wǎng)絡(luò)耦合模型的三峽庫區(qū)滑坡易發(fā)性評價(jià)[J].地球科學(xué),2020,45(6) :1865-1876.
[10]李郎平,蘭恒星,郭長寶,等.基于改進(jìn)頻率比法的川藏鐵路沿線及鄰區(qū)地質(zhì)災(zāi)害易發(fā)性分區(qū)評價(jià)[J].現(xiàn)代地質(zhì),2017,31(5) :911-929.
[11]劉長江,羅曉東.南疆鹽漬土峽谷景區(qū)滑坡易發(fā)性評價(jià)[J].科技與創(chuàng)新,2024(5):71-74,77.
[12]王烜,李英,趙利軍,等.基于雙重層次分析法的地質(zhì)災(zāi)害易發(fā)性評價(jià):以遼寧省為例[J].資源環(huán)境與工程,2025,39(2):215-223,233.
[13]謝琳琳,喻子宜,楊強(qiáng),等.HOPSCA 項(xiàng)目施工安全風(fēng)險(xiǎn)評價(jià)[J].土木工程與管理學(xué)報(bào),2024,41(6):53-60.
[14] 丁思蒙,韓尚鵬,田仕雄,等.基于GIS技術(shù)的乃東區(qū)斜坡類地質(zhì)災(zāi)害易發(fā)性評價(jià)[J].防災(zāi)減災(zāi)學(xué)報(bào),2024,40(4):13-20.
[15]余淙蔚,柳侃,殷杰,等.一種適用于邏輯回歸模型評價(jià)淺層滑坡易發(fā)性的網(wǎng)格尺度劃分方法:以2019年福建省三明市群發(fā)淺層滑坡為例[J].山地學(xué)報(bào),2022,40(1) :106-119.
[16]CARRARA A. Multivariate Models for Landslide HazardEvaluation[J].Mathematical Geology,1983,15:403-426.
[17]秦佳松,李為樂,單云鋒,等.融合時(shí)序InSAR形變的石棉縣滑坡易發(fā)性評價(jià)[J/OL].地質(zhì)科技通報(bào),1-14(2024-08-29)[2024 - 12 - 22]. htps://doi.org/10.19509/j.cnki.dzkq.tb20240342.
[18]張清,何毅,陳學(xué)業(yè),等,基于多尺度卷積神經(jīng)網(wǎng)絡(luò)的深圳市滑坡易發(fā)性評價(jià)[J].中國地質(zhì)災(zāi)害與防治學(xué)報(bào),2024,35(4) :146-162.
[19]周書東,丁其樂,王奕仁,等.基于隨機(jī)森林算法和物理模型試驗(yàn)的軟土滑坡運(yùn)動特性預(yù)測研究[J/OL].水利水電技術(shù)(中英文),1-14(2024-12-13)[2024-12-22].http://kns.cnki.net/kcms/detail/10.1746.TV.20241213.1423.006.html.
[20]劉伊銘,徐勝華,劉春陽,等.顧及多方法集成特征選擇與負(fù)樣本優(yōu)化的滑坡易發(fā)性評價(jià)[J].測繪通報(bào),2024(9) :74-79.
[21]鄭德鳳,潘美伊,高敏,等.集中降雨影響下遼南仙人洞國家級自然保護(hù)區(qū)滑坡災(zāi)害多因子風(fēng)險(xiǎn)評價(jià)[J].地質(zhì)科技通報(bào),2025,44(2):48-58.
[22]林娜,譚力兵,張迪,等.時(shí)序InSAR和LSTM結(jié)合的滑坡形變時(shí)空分析與預(yù)測方法[J].地球信息科學(xué)學(xué)報(bào),2024,26(12) :2772-2787.
[23]劉金滄,王歡歡,李云,等.基于支持向量機(jī)的華南斜坡類地質(zhì)災(zāi)害易發(fā)性評價(jià):以肇慶市懷集縣為例[J].時(shí)空信息學(xué)報(bào),2024,31(6):785-794.
[24]李世琦,姚國清.基于CNN與 SETR 的特征融合滑坡體檢測[J].自然資源遙感,2024,36(4):158-164.
[25]于長獅.基于可解釋性Transformer 網(wǎng)絡(luò)的滑坡易發(fā)性預(yù)測研究[D].南昌:南昌大學(xué),2024:8-23.
[26]黎承球,蘇小婷,王盈,等.雅襲江流域大型滑坡分布規(guī)律及成因機(jī)制[J].第四紀(jì)研究,2025,45(1):132-148.
[27]郭飛,吳迪,葛民榮,等.連續(xù)變量因子分級和機(jī)器學(xué)習(xí)模型對滑坡易發(fā)性評價(jià)精度的影響[J/OL].武漢大學(xué)學(xué)報(bào)(信息科學(xué)版),1-17(2024-09-20)[2024-12-22].https://doi.org/10.13203/j.whugis20230413.
[28]王勁峰,徐成東.地理探測器:原理與展望[J].地理學(xué)報(bào),2017,72(1) :116-134.
[29]劉聰林,李盛,崔曉寧,等.融合XGBoost和SHAP的混凝土抗壓強(qiáng)度預(yù)測分析模型[J].水利水電技術(shù)(中英文),2025.56(2):246-258.