亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于集成學(xué)習(xí)和考慮滑坡負(fù)樣本的滑坡易發(fā)性評價(jià)

        2025-07-29 00:00:00鄭元?jiǎng)?/span>周康康胡少偉張海超于國卿徐路凱彭浩
        人民黃河 2025年7期
        關(guān)鍵詞:易發(fā)分類器滑坡

        關(guān)鍵詞:滑坡易發(fā)性;集成學(xué)習(xí);信息量法;滑坡負(fù)樣本;黃河上游中圖分類號:TP181;P642.22;TV882.1 文獻(xiàn)標(biāo)志碼:A doi:10.3969/j.issn.1000-1379.2025.07.019引用格式:,,,等.基于集成學(xué)習(xí)和考慮滑坡負(fù)樣本的滑坡易發(fā)性評價(jià)[J].人民黃河,2025,47(7):116-123

        Landslide Susceptibility Evaluation Based on Integrated Learning and Considering Landslide Negative Samples

        ENG Yuanxun1, ZHOU Kangkang1,HU Shaowei1, ZHANG Haichao2,YU Guoqing3, XU Lukai 3 ,PENG Hao2 (1.College of Water Conservancy and Transportation, Zhengzhou University,Zhengzhou 45ooo1,China; 2.Power China Guiyang Engineering Corporation Limited, Guiyang 55O081, China; 3.Yellow River Institute of Hydraulic Research,YRCC,Zhengzhou 45OOO3,China)

        Abstract:TevaluatioflndslidesuseptibitisofgeatgficanforgioaldisasterpreventionditigatioIviefei suesthatesinglecaifeintelandslidesuseptibilityvaluatiousingmacinlangalgodporpresn,dleo ofnegativesamplesoflanslidesaselatielybirarylndslidsuscetilityeaationoelaspropod,hchombdl tionmethodofnegativesamplesoflandslidesbasedonteinformationquantymetodwithmachineleaingintegrationalgorithms.Taking thesectionfromLijaxiatoGongboxiainteuppereachsoftheYllowRiverasthestudyaea3evaluationfactorssuchaselevation, slopegradientndpreipitaoneresecedasthevalatofctorsforlndslidurceresetionetdsfrgieples flandslides,namelyuferzon,lowslopeadientandifoatioquantityereadoptedBylingtheladslidesuscebilityevuationmodelsoftheasficationndessontree(AR)andeeitegatedlngrits(Bagng,oosting,ndadofor est),theperfomaeofteeuatiooelsunderdientintegatedeaingagritsanddintselectionetdsfotie plesoflandslideswasaalyzd.Thsultssowtatteintegatedleaigalgoritcasignificantlyimprovetepeformanceofthesingle baseclssifierandteiprovemenefetofteBoostingalgoiisteostpromientTeselectionmetodofegatiesamplebased onthe informationquantitytakesmostoftheevaluationfactorsintofullconsideration,andthereliabilityofthemodelishigher.

        Keywords:landslidesusceptibility;integratedlearning;informationvaluemethod;landslidenegativesamples;upperreachesofthe Yellow River

        0 引言

        黃河上游李家峽至公伯峽區(qū)間地質(zhì)結(jié)構(gòu)復(fù)雜、晝夜溫差大、生態(tài)環(huán)境脆弱、河流下切作用強(qiáng)烈,眾多因素導(dǎo)致該區(qū)域地質(zhì)災(zāi)害發(fā)生頻繁[1],防治形勢嚴(yán)峻。因此,開展滑坡易發(fā)性評價(jià)對于該地區(qū)防災(zāi)減災(zāi)具有重要意義。

        滑坡易發(fā)性評價(jià)模型的選擇對評價(jià)結(jié)果有重要影響。目前,廣泛用于滑坡易發(fā)性評價(jià)的模型有統(tǒng)計(jì)模型[2]和機(jī)器學(xué)習(xí)模型[3]。頻率比模型[4]、信息量模型[5]和確定性系數(shù)[]等統(tǒng)計(jì)模型可以定量評價(jià)不同影響因子與滑坡發(fā)生之間的概率關(guān)系。機(jī)器學(xué)習(xí)模型則能夠捕捉滑坡與滑坡影響因子之間的非線性關(guān)系,從而取得更好的分類結(jié)果。常用的機(jī)器學(xué)習(xí)模型[7-8]包括邏輯回歸、支持向量機(jī)、隨機(jī)森林和神經(jīng)網(wǎng)絡(luò)等。然而,當(dāng)前常用的機(jī)器學(xué)習(xí)模型大多為單個(gè)模型,或者是基于某個(gè)模型的參數(shù)優(yōu)化[9]。集成學(xué)習(xí)算法[10-12]通過組合多個(gè)機(jī)器學(xué)習(xí)模型,提高了模型整體的泛化能力和預(yù)測結(jié)果的準(zhǔn)確性。鄔禮揚(yáng)等[13]基于袋裝法(Bagging)、提升法(Boosting)、堆疊法(Stacking)3種集成學(xué)習(xí)算法進(jìn)行滑坡易發(fā)性評價(jià)表明,基于Boosting的集成學(xué)習(xí)算法的模型預(yù)測精度提升最為顯著。本文以決策樹為基分類器,選擇Bagging和Boosting兩種集成學(xué)習(xí)算法,以及封裝好的決策樹集成學(xué)習(xí)算法—隨機(jī)森林,研究3種集成學(xué)習(xí)算法對決策樹性能的提升作用,

        此外,在進(jìn)行滑坡易發(fā)性評價(jià)時(shí),滑坡負(fù)樣本的選擇至關(guān)重要,合理選擇負(fù)樣本對于提高區(qū)域滑坡易發(fā)性評價(jià)結(jié)果的準(zhǔn)確性和可靠性具有重要意義。然而,大部分學(xué)者在選擇負(fù)樣本時(shí)較為隨意,例如低坡度取樣[14]、緩沖區(qū)外取樣[15]、半監(jiān)督多層感知機(jī)法取樣[6]等。從低坡度和溝谷地區(qū)選擇負(fù)樣本容易加大某一評價(jià)因子的權(quán)重[17;隨機(jī)選擇負(fù)樣本則約束較小,容易選擇與滑坡點(diǎn)具有相同條件的負(fù)樣本。因此,選擇合適的負(fù)樣本對于提升模型的預(yù)測精度和可靠性具有重要作用。

        基于此,以黃河上游李家峽至公伯峽段為研究對象,選取13個(gè)評價(jià)因子,在3種負(fù)樣本選擇方式下,基于決策樹的3種集成學(xué)習(xí)算法構(gòu)建機(jī)器學(xué)習(xí)模型進(jìn)行滑坡易發(fā)性評價(jià),分析不同集成學(xué)習(xí)算法對模型預(yù)測性能的提升效果,以及不同滑坡負(fù)樣本選擇方式對評價(jià)結(jié)果的影響。

        1 研究區(qū)概況

        研究區(qū)為黃河上游李家峽至公伯峽段兩側(cè)山體,包括兩側(cè)各 10km 的緩沖區(qū),總面積為 2 880km2 。該河段全長 75km ,途徑李家峽、直崗拉卡、康揚(yáng)、公伯峽4個(gè)水電站(見圖1),屬于黃河上游中段。周邊與化隆回族自治縣、尖扎縣、循化撒拉族自治縣接壤,河兩岸分布著眾多居民區(qū)。研究區(qū)地處青藏高原東北部,地形以高原峽谷為主,屬高原大陸性氣候區(qū),寒冷干燥。夏季溫度在 20% 左右,冬季溫度為 -5~0°C 。年降水量為 300~400mm ,且主要集中在6—9月。研究區(qū)地質(zhì)構(gòu)造主要由北側(cè)的中祁連山南緣斷裂帶、拉脊山南緣斷裂帶、中部宗務(wù)隆山-青海南山大斷裂帶和西南側(cè)的多福屯斷裂帶4條大斷裂帶和若干條未探明的小斷裂帶組成。巖性主要為第三系西寧群和早中三疊世大連加組,以砂巖、粉砂巖、泥巖為主。這些特征共同構(gòu)成了誘發(fā)滑坡的關(guān)鍵因素

        圖1研究區(qū)地理位置和滑坡分布Fig.1 Geographical Location and Landslide Distribution of the Study Area

        2 評價(jià)因子選擇與分析

        根據(jù)InSAR數(shù)據(jù)和遙感解譯結(jié)果,經(jīng)野外地質(zhì)調(diào)查,共計(jì)167處滑坡隱患點(diǎn)。研究區(qū)高程采用 30m 空間分辨率的ASTERGDEM數(shù)據(jù),其他數(shù)據(jù)包括道路和水系分布矢量數(shù)據(jù), 1:250 萬地層巖性、斷層數(shù)據(jù),貴德、化隆、尖扎、循化、同仁5個(gè)氣象站的降水量數(shù)據(jù),2022年中國 30m 分辨率歸一化植被指數(shù)(NDVI)數(shù)據(jù),2020年中國土壤類型空間分布數(shù)據(jù)。

        2.1 評價(jià)因子選擇與提取

        研究區(qū)位于青藏高原峽谷之中,裸地廣泛分布、地質(zhì)災(zāi)害頻發(fā)。本研究在總結(jié)前人對庫區(qū)[18-20]地質(zhì)災(zāi)害影響因子研究的基礎(chǔ)上,結(jié)合研究區(qū)特點(diǎn),從地形地貌、地質(zhì)條件、水文條件以及人類活動等多個(gè)維度,選取影響滑坡發(fā)生的因子,包括高程(DEM)A、坡度 B 、坡向 c 、巖性 D 、曲率 E 、歸一化植被指數(shù) F 、降水量 G 、土地利用類型 H 距河流距離 距斷層距離 J 距道路距離 K 地形起伏度 L 、地形濕度指數(shù) M 。

        為提高數(shù)據(jù)處理效率,采用柵格數(shù)據(jù)開展計(jì)算。矢量數(shù)據(jù)如道路、水系等基于空間插值分析方法進(jìn)行處理,得到柵格數(shù)據(jù)。選用WGS-84大地坐標(biāo)系為參考系,分辨率選擇 30m×30m 。研究區(qū)數(shù)據(jù)轉(zhuǎn)換為柵格數(shù)據(jù)后,基于自然斷點(diǎn)法對各評價(jià)因子進(jìn)行重分類,將滑坡隱患點(diǎn)提取至各分級單元,用于分析各評價(jià)因子之間的相關(guān)關(guān)系和信息量值。

        2.2 相關(guān)性分析

        以上選擇的13個(gè)評價(jià)因子之間可能存在相關(guān)關(guān)系,當(dāng)評價(jià)因子間的相關(guān)性過強(qiáng)時(shí),構(gòu)建機(jī)器學(xué)習(xí)模型的復(fù)雜性增大,極易產(chǎn)生過擬合現(xiàn)象。相關(guān)性分析作為一種統(tǒng)計(jì)方法,主要用于評估兩個(gè)變量間是否存在統(tǒng)計(jì)關(guān)聯(lián),并量化其關(guān)聯(lián)程度。相關(guān)性分析方法主要有皮爾遜相關(guān)系數(shù)法、肯德爾等級相關(guān)系數(shù)法和斯皮爾曼等級相關(guān)系數(shù)法3種,其中皮爾遜相關(guān)系數(shù)法[21]適用范圍廣,原理簡單易懂,應(yīng)用效果較好。因此,采用皮爾遜相關(guān)系數(shù)法計(jì)算評價(jià)因子間的相關(guān)系數(shù),計(jì)算公式如下:

        式中: xi,yi 為評價(jià)因子 i,j 的實(shí)測值, 為實(shí)測值的平均值; r 為相關(guān)系數(shù), -1?r?1 , rgt;0 表示評價(jià)因子 i,j 正相關(guān), rlt;0 表示評價(jià)因子 i,j 負(fù)相關(guān), r=0 表示評價(jià)因子 i,j 不相關(guān)。

        ∣r∣ 越大相關(guān)性越強(qiáng),其中 ∣r∣lt;0.3 為基本不相關(guān),0.3lt;∣r∣?0.5 為低度相關(guān), 0.5lt;∣r∣?0.8 為中度相關(guān),0.8lt;∣r∣?1 為高度相關(guān)。利用SPSS軟件計(jì)算各評價(jià)因子間的皮爾遜相關(guān)系數(shù),結(jié)果見表1。選取的評價(jià)因子之間的相關(guān)性較弱,大部分評價(jià)因子之間的相關(guān)性處于基本不相關(guān)范圍,只有少數(shù)評價(jià)因子之間的相關(guān)性略高,如DEM與NDVI、坡度與土地利用類型、巖性與地形起伏度等為低度相關(guān);高程與距河流距離、坡度與地形起伏度為中度相關(guān)。因此,選取的評價(jià)因子之間的相關(guān)性相對較弱,均可以用于滑坡易發(fā)性評價(jià)。

        表1皮爾遜相關(guān)系數(shù)

        Tab.1 ResultsofPearsonCorrelationCoefficient

        3基于信息量法的滑坡負(fù)樣本選擇

        3.1 信息量法

        信息量法[5]源于信息理論,是一種在環(huán)境地質(zhì)災(zāi)害風(fēng)險(xiǎn)評估領(lǐng)域廣泛應(yīng)用的統(tǒng)計(jì)方法,是用于評估變量與分類結(jié)果之間關(guān)系緊密程度的統(tǒng)計(jì)學(xué)手段,信息量法的計(jì)算公式:

        式中: Ii 為因子 i 的信息量值; Ni 為評價(jià)因子在分類區(qū)間內(nèi)出現(xiàn)的滑坡數(shù)量; N 為研究區(qū)內(nèi)滑坡總數(shù)量; Si 為評價(jià)因子在分類區(qū)間內(nèi)的面積; s 為研究區(qū)總面積;FR 為頻率比。

        Igt;0 表示評價(jià)因子與滑坡發(fā)生正相關(guān), I 值越大,正相關(guān)性越強(qiáng); Ilt;0 表示評價(jià)因子與滑坡發(fā)生負(fù)相關(guān), I 值越小,負(fù)相關(guān)性越強(qiáng); I=0 表示評價(jià)因子與滑坡的發(fā)生不相關(guān)。

        3.2 評價(jià)因子統(tǒng)計(jì)分析

        基于信息量法計(jì)算公式,計(jì)算各評價(jià)因子在各自分區(qū)上的信息量值,結(jié)果見表2(其中DEM、地形起伏度、距道路距離、距河流距離、距斷層距離分級單位為m ,降水量分級單位為 mm ,坡度分級單位為°,曲率分級單位為 m-1 )。

        3.3 基于信息量法的滑坡易發(fā)性指數(shù)

        將各評價(jià)因子的信息量值進(jìn)行疊加,得到基于信息量法的滑坡易發(fā)性指數(shù)。一般情況下滑坡低易發(fā)性分區(qū)的面積大于高易發(fā)性分區(qū)的。為便于與后續(xù)模型開展對比分析,避免因分級面積差異而造成滑坡數(shù)量關(guān)系的可比性降低,采用分位數(shù)法進(jìn)行滑坡易發(fā)性分區(qū)。將研究區(qū)面積按照易發(fā)性指數(shù)劃分為10份,按照4:2:2:1:1 的面積比劃分出極低、低、中、高、極高

        5個(gè)級別的滑坡易發(fā)性分區(qū),并計(jì)算各個(gè)分區(qū)內(nèi)的滑坡數(shù)量和頻率比,結(jié)果見表3、圖2。可以看出,基于信息量法的滑坡易發(fā)性分區(qū)結(jié)果較為合理,隨著易發(fā)性等級的提高,面積占比減小,但滑坡數(shù)量和頻率比呈現(xiàn)明顯上升趨勢。

        表2評價(jià)因子的信息量值

        Tab.2 Information Value of Evaluation Factors

        3.4 滑坡負(fù)樣本的選擇

        確保滑坡負(fù)樣本的低易發(fā)性和隨機(jī)性是機(jī)器學(xué)習(xí)模型建模的重要前提。基于信息量法初步得到了滑坡的易發(fā)性分區(qū),從其預(yù)測的極低易發(fā)性分區(qū)中隨機(jī)選擇與正樣本數(shù)量相同的點(diǎn)作為后續(xù)機(jī)器學(xué)習(xí)的負(fù)樣本點(diǎn),同時(shí)在滑坡點(diǎn) 800m 緩沖區(qū)外和坡度小于 3° 的地本選擇方式對滑坡易發(fā)性評價(jià)結(jié)果的影響。采用不同負(fù)樣本選擇方式得到滑坡負(fù)樣本分布,見圖3。

        表3各級別分區(qū)內(nèi)滑坡數(shù)量和頻率比Tab.3Number and FrequencyRatio ofLandslide Points
        "
        "

        4基于集成學(xué)習(xí)和考慮滑坡負(fù)樣本的易發(fā)性評價(jià)

        4.1 集成學(xué)習(xí)算法

        1)決策樹。目前最常用的決策樹算法為分類回歸樹(CART),首先基于訓(xùn)練數(shù)據(jù)集生成決策樹,生成的決策樹要盡量大;然后用驗(yàn)證數(shù)據(jù)集對已生成的樹進(jìn)行剪枝并選擇最優(yōu)子樹,這時(shí)將損失函數(shù)最小作為剪枝的標(biāo)準(zhǔn)。對于分類任務(wù),一般采用基尼系數(shù)最小化準(zhǔn)則來進(jìn)行特征選擇并生成二叉樹。

        2)Bagging算法。Bagging算法是一種并行式集成學(xué)習(xí)算法,通過組合多個(gè)模型來降低泛化誤差進(jìn)而提高模型預(yù)測的準(zhǔn)確率。此次選擇CART決策樹作為Bagging算法的基分類器。Bagging算法分為自助采樣、訓(xùn)練基分類器、模型集成三步。自助采樣:有放回簡單隨機(jī)抽樣,即從一個(gè)包含 m 個(gè)樣本的源數(shù)據(jù)集中隨機(jī)抽取一個(gè)樣本放人樣本集中,再將其復(fù)制后放回源數(shù)據(jù)集中,重復(fù) m 次隨機(jī)抽樣,獲取一個(gè)包含 m 個(gè)樣本的樣本集,重復(fù) n 次,最終得到 n 個(gè)包含 m 個(gè)樣本的樣本集;訓(xùn)練基分類器:對自助采樣的 n 個(gè)樣本集分別訓(xùn)練一個(gè)基分類器,對于決策樹算法就是構(gòu)建 n 個(gè)決策樹模型;模型集成:對于分類任務(wù),通常采用多數(shù)投票的方式來決定最終分類結(jié)果

        3)Boosting算法。Boosting算法是一種串行式集成學(xué)習(xí)算法,核心思想是按順序逐步訓(xùn)練弱學(xué)習(xí)器來構(gòu)建強(qiáng)學(xué)習(xí)器,每個(gè)新的弱學(xué)習(xí)器逐步糾正前一個(gè)模型的錯(cuò)誤。此次選擇CART決策樹作為Boosting算法的基分類器。在模型訓(xùn)練中,為訓(xùn)練集中的每個(gè)樣本分配初始權(quán)重,在初始權(quán)重下,訓(xùn)練第一個(gè)弱分類器如果某個(gè)樣本未被準(zhǔn)確分類,那么在構(gòu)造下一個(gè)訓(xùn)練集時(shí)提高它的權(quán)重,這樣下一個(gè)弱分類器就會重點(diǎn)關(guān)注未被正確分類的樣本,并逐步調(diào)整樣本權(quán)重。各個(gè)弱分類器訓(xùn)練結(jié)束后,加大分類誤差小的弱分類器的權(quán)重,使其在最終分類函數(shù)中起較大的決定作用。

        4)隨機(jī)森林(RF)算法。RF算法屬于封裝好的決策樹集成學(xué)習(xí)算法。該算法與Bagging算法存在相似之處,但在自助采樣方面二者有顯著區(qū)別。RF算法的自助采樣過程不僅對樣本進(jìn)行隨機(jī)選取,而且針對樣本的特征實(shí)施隨機(jī)選取,這一獨(dú)特操作極大地提升了模型的多樣性。相比Bagging算法,RF算法通過這種更為全面的隨機(jī)化策略,有效增強(qiáng)了模型應(yīng)對各種數(shù)據(jù)變化的能力,從而展現(xiàn)出更高的穩(wěn)定性。這種穩(wěn)定性使得RF算法在處理復(fù)雜多變的數(shù)據(jù)時(shí),能夠更為可靠地輸出結(jié)果,在眾多實(shí)際應(yīng)用場景中具有顯著優(yōu)勢。

        4.2 不同集成學(xué)習(xí)算法的評價(jià)結(jié)果

        CART決策樹作為集成學(xué)習(xí)算法的基分類器,其核心參數(shù)(如最大樹深度、最小葉節(jié)點(diǎn)樣本數(shù)、分裂準(zhǔn)則等)的選擇對后續(xù)模型的精度起著關(guān)鍵作用。本次構(gòu)建模型過程中,最大樹深度選擇為10,并采用剪枝策略構(gòu)建CART決策樹;為提升模型的泛化能力,設(shè)置最小葉節(jié)點(diǎn)樣本數(shù)應(yīng)滿足:父分支樣本數(shù)量占樣本總數(shù)的 6% 以上,子分支樣本數(shù)量占樣本總數(shù)的 3% 以上;此外,將基尼系數(shù)作為模型的分裂準(zhǔn)則。將以上參數(shù)的CART決策樹作為Bagging算法和Boosting算法的基分類器,集成學(xué)習(xí)的投票數(shù)量設(shè)置為15。RF算法也選擇與Bagging算法和Boosting算法相同的參數(shù)?;谝陨夏P停?jì)算在不同滑坡負(fù)樣本下,各集成學(xué)習(xí)算法的精確率( Pre) 、召回率( Rc′ ) F1 分?jǐn)?shù) (F1) 以及ROC曲線下面積(AUC)4項(xiàng)性能指標(biāo),結(jié)果見表4。

        表4不同滑坡負(fù)樣本下各算法的性能指標(biāo)Tab.4Performance Indicators of Various Algorithms Under Different Landslide Negative Samples

        從緩沖區(qū)負(fù)樣本訓(xùn)練集和測試集的整體情況來看,3種集成學(xué)習(xí)算法在測試集中性能均有所下降,表明模型均出現(xiàn)過擬合現(xiàn)象。究其原因,可能是緩沖區(qū)負(fù)樣本數(shù)據(jù)集具有較強(qiáng)的隨機(jī)性,數(shù)據(jù)中存在過多噪聲,對基分類器產(chǎn)生了較大干擾。集成學(xué)習(xí)算法通過組合多棵決策樹來提升性能,但在面對緩沖區(qū)負(fù)樣本數(shù)據(jù)集時(shí),這種方式反而導(dǎo)致集成學(xué)習(xí)算法對噪聲的敏感度顯著增強(qiáng)。在模型構(gòu)建過程中,算法可能將噪聲數(shù)據(jù)納人分裂準(zhǔn)則,從而干擾了對真實(shí)數(shù)據(jù)規(guī)律的學(xué)習(xí),導(dǎo)致模型的泛化能力降低。對訓(xùn)練集的4項(xiàng)性能指標(biāo)進(jìn)一步觀察發(fā)現(xiàn),由于CART分類樹的精確率較高,因此3種集成學(xué)習(xí)算法對CART分類樹提升效果并不明顯,甚至出現(xiàn)精確率降低的現(xiàn)象。在召回率方面,3種集成學(xué)習(xí)算法對模型性能均有明顯提升效果,其中Bagging算法對模型性能的提升效果較小,Boosting算法和RF算法對模型性能的提升效果較為突出,Boosting算法對模型性能的提升效果最佳。對F1分?jǐn)?shù)來說3種算法的集成效果與召回率類似。對于ROC曲線下面積來說,RF算法對模型性能的提升效果最佳,Boosting算法次之,Bagging算法對模型性能的提升效果一般。綜上,在緩沖區(qū)負(fù)樣本中,Bagging算法對模型性能的提升效果較為一般,Boosting算法和RF算法對模型性能的提升效果較為顯著,且二者差距較小。對比Boosting算法和RF算法在測試集中的表現(xiàn)可以看出,RF算法的4項(xiàng)性能指標(biāo)均高于Boosting算法的。由此可見,在緩沖區(qū)負(fù)樣本中,RF算法對模型性能的提升效果最佳。

        從低坡度負(fù)樣本訓(xùn)練集和測試集的整體表現(xiàn)看,3種集成學(xué)習(xí)算法均未出現(xiàn)過擬合現(xiàn)象。進(jìn)一步觀察訓(xùn)練集的4項(xiàng)性能指標(biāo),Bagging算法對模型性能的提升效果依然較為有限,而Boosting算法展現(xiàn)出較為顯著的性能提升效果,RF算法略微次之。在測試集中同樣如此。綜上,在低坡度負(fù)樣本中,Boosting算法對模型性能的提升效果最佳。

        在信息量法負(fù)樣本中,3種集成學(xué)習(xí)算法也未出現(xiàn)過擬合現(xiàn)象。在訓(xùn)練集和測試集中,算法對模型性能提升效果的表現(xiàn)與低坡度負(fù)樣本的情況類似,同樣是Bagging算法對模型性能的提升效果一般,Boosting算法對模型性能的提升效果最好,RF算法次之。綜上,在信息量法負(fù)樣本中,Boosting算法對模型性能的提升效果最佳。

        綜上所述,3種集成學(xué)習(xí)算法相比較于基分類器,對模型性能均有明顯提升效果。其中,Bagging算法在3種負(fù)樣本中,對模型性能提升效果相對有限。而Boosting算法和RF算法在3種負(fù)樣本條件下,均對模型性能呈現(xiàn)較為顯著的提升效果。具體而言,在緩沖區(qū)負(fù)樣本中,RF算法對模型性能的提升效果優(yōu)于Boosting算法的。但在低坡度負(fù)樣本和信息量法負(fù)樣本中,Boosting算法對模型性能的提升效果則優(yōu)于RF算法的。總體來看,Boosting算法在不同負(fù)樣本中展現(xiàn)了較好的性能提升效果。究其原因,地形、降水、水文等因子為非線性關(guān)系,3種集成學(xué)習(xí)算法對該類型特征的處理方式不同,導(dǎo)致最終結(jié)果存在差異。Bagging算法僅對滑坡正負(fù)樣本開展了自助采樣,在此過程中,所形成的多個(gè)基分類器在模型構(gòu)建時(shí)選擇的特征大致相同,未能充分考慮多個(gè)因子對滑坡發(fā)生的綜合作用,導(dǎo)致其模型性能提升效果較為一般。RF算法不僅對樣本進(jìn)行了自助采樣,而且對特征進(jìn)行了自助采樣,形成的基分類器能夠選擇多個(gè)特征,充分考慮了多個(gè)因子對滑坡發(fā)生的綜合作用,因此模型性能得到了明顯提升。Boosting算法通過不斷調(diào)整被錯(cuò)誤分類樣本的權(quán)重逐步形成強(qiáng)學(xué)習(xí)器,能夠更好地逼近復(fù)雜決策邊界,充分考慮了特征之間的相互作用關(guān)系,因此其對模型性能的提升效果最為出色。

        4.3 基于Boosting算法的滑坡易發(fā)性評價(jià)

        采用Boosting算法,針對不同滑坡負(fù)樣本選擇方式構(gòu)建滑坡易發(fā)性評價(jià)模型,并計(jì)算各項(xiàng)性能指標(biāo),結(jié)果見表5。從表5可知,緩沖區(qū)負(fù)樣本的性能指標(biāo)最小,低坡度和信息量法負(fù)樣本的性能指標(biāo)較大,且兩種負(fù)樣本選擇方式的性能指標(biāo)差距較小,其中低坡度負(fù)樣本選擇方式模型性能稍占優(yōu)勢

        "

        由于低坡度負(fù)樣本選擇方式可能極大提升坡度特征的重要性,導(dǎo)致泛化能力下降,因此對這兩種負(fù)樣本選擇方式進(jìn)行評價(jià)因子重要性分析。基于Boosting算法,低坡度負(fù)樣本選擇方式下,坡度、地形起伏度、地形濕度指數(shù)、距河流距離、巖性、DEM、降水量、NDVI、距斷層距離、距道路距離、坡向、曲率、土地利用類型的重要性指數(shù)分別為0.353、0.324、0.229、0.040、0.013、0.012、0.011、0.005、0.003、0.005、0.002、0.002、0.001;信息量法負(fù)樣本選擇方式下,地形濕度指數(shù)、地形起伏度、降水量、DEM、距斷層距離、土地利用類型、NDVI、坡度、巖性、距河流距離、坡向、曲率、距道路距離的重要性指數(shù)分別為0.178、0.157、0.154、0.078、0.077、0.072、0.065、0.063、0.059、0.053、0.033、0.006、0.005。

        低坡度負(fù)樣本選擇方式下,坡度、地形起伏度、地形濕度指數(shù)的重要性指數(shù)顯著大于其他評價(jià)因子的。值得注意的是,地形起伏度和地形濕度指數(shù)均是借助坡度計(jì)算得出的。由此可見,低坡度負(fù)樣本選擇方式極大提升了坡度在滑坡分類中的重要程度。若依據(jù)這種方式開展滑坡易發(fā)性評價(jià),處于特定坡度區(qū)間的山體都將被劃定為高易發(fā)性分區(qū),而未充分權(quán)衡其他因子對滑坡發(fā)生的影響,這顯然與實(shí)際情況不符。信息量法負(fù)樣本選擇方式下,地形濕度指數(shù)和地形起伏度的重要性指數(shù)雖然均較大,但與其他評價(jià)因子之間的差距并不懸殊,且該方式考慮了大多數(shù)評價(jià)因子,僅曲率和距道路距離的重要性指數(shù)相對較小。由此可以看出,基于Boosting算法,采用信息量法負(fù)樣本選擇方式構(gòu)建的滑坡易發(fā)性評價(jià)模型,能夠綜合考慮更多的評價(jià)因子,對滑坡易發(fā)性分區(qū)更為全面、準(zhǔn)確,

        綜合權(quán)衡兩種負(fù)樣本選擇方式,以及評價(jià)因子的重要性指數(shù),最終確定基于Boosting算法,采用信息量法負(fù)樣本選擇方式構(gòu)建滑坡易發(fā)性評價(jià)模型,對研究區(qū)滑坡易發(fā)性展開評價(jià),結(jié)果見圖4、表6。從滑坡數(shù)量上看,高、極高滑坡易發(fā)性分區(qū)的滑坡數(shù)量遠(yuǎn)大于極低滑坡易發(fā)性分區(qū)的。從滑坡頻率比看,隨著滑坡易發(fā)性分區(qū)級別的提高,頻率比逐漸增大。高、極高滑坡易發(fā)性分區(qū)主要分布在黃河左岸峽谷地區(qū)和部分黃河右岸峽谷,極低、低滑坡易發(fā)性分區(qū)主要分布在李家峽右岸和黃河流向由南北向轉(zhuǎn)為東西向的右岸高山區(qū)以及公伯峽下游。

        "

        5 結(jié)論

        以黃河上游李家峽至公伯峽段為研究區(qū)域,探究了不同集成學(xué)習(xí)算法對滑坡易發(fā)性評價(jià)模型性能的提升效果和不同滑坡負(fù)樣本選擇方式對滑坡易發(fā)性評價(jià)結(jié)果的影響。

        相較于基分類器CART,3種集成學(xué)習(xí)算法對評價(jià)模型均展現(xiàn)出顯著的性能提升效果。其中,Bagging算法的提升幅度相對有限,而Boosting算法和隨機(jī)森林算法由于充分考量了多個(gè)評價(jià)因子的綜合作用,因此提升效果更為顯著。在這兩者中,Boosting算法由于對評價(jià)因子間相互關(guān)系更為關(guān)注,在處理多特征數(shù)據(jù)的分類預(yù)測任務(wù)時(shí),表現(xiàn)出更高的適用性,因此對模型性能的提升效果最為突出。緩沖區(qū)負(fù)樣本選擇方式的性能指標(biāo)最小,低坡度和信息量法負(fù)樣本選擇方式的性能指標(biāo)較大,且兩者差距較小。從評價(jià)因子重要性指數(shù)來看,低坡度負(fù)樣本選擇方式夸大了坡度和地形起伏等地形因子的影響,導(dǎo)致模型的可靠性降低;信息量法負(fù)樣本選擇方式各評價(jià)因子之間重要性指數(shù)差距并不懸殊,充分考慮了大多數(shù)評價(jià)因子,模型可靠性更高。

        因此,基于Boosting算法,采用信息量法負(fù)樣本選擇方式構(gòu)建滑坡易發(fā)性評價(jià)模型,對研究區(qū)滑坡易發(fā)性展開評價(jià),結(jié)果表明:高、極高滑坡易發(fā)性分區(qū)主要分布在黃河左岸峽谷地區(qū)和部分黃河右岸峽谷,極低、低滑坡易發(fā)性分區(qū)主要分布在李家峽右岸和黃河流向由南北向轉(zhuǎn)為東西向的右岸高山區(qū)以及公伯峽下游

        參考文獻(xiàn):

        [1] 趙淑芬,曾潤強(qiáng),張宗林,等.黃河上游潛在滑坡早期識別及影響因素[J].山地學(xué)報(bào),2022,40(2):249-264.

        [2] 古騰飛,段平,王偉鵬,等.滑坡易發(fā)性評價(jià)方法綜述[J].自然災(zāi)害學(xué)報(bào),2024,33(6):1-16.

        [3]] 蘇志萍,楊成生,王子倩.結(jié)合負(fù)樣本優(yōu)化與機(jī)器學(xué)習(xí)模型的怒江州峽谷段滑坡易發(fā)性評價(jià)[J].地球信息科學(xué)學(xué)報(bào),2025,27(4):979-993.

        [4] 郭子正,殷坤龍,黃發(fā)明,等.基于滑坡分類和加權(quán)頻率比模型的滑坡易發(fā)性評價(jià)[J].巖石力學(xué)與工程學(xué)報(bào),2019,38(2) :287-300.

        [5] 王炳亮,裴超,李寶泉,等.基于信息量模型的黑山峽地區(qū)滑坡易發(fā)性風(fēng)險(xiǎn)評價(jià)[J].人民黃河,2025,47(1):134-140.

        [6] 鄭迎凱,陳建國,王成彬,等.確定性系數(shù)與隨機(jī)森林模型在云南芒市滑坡易發(fā)性評價(jià)中的應(yīng)用[J].地質(zhì)科技通報(bào),2020,39(6):131-144.

        [7]文海家,胡東萍,王桂林.汶川縣地震滑坡易發(fā)性 LR與 NN評價(jià)比較研究[J].土木工程學(xué)報(bào),2014,47(增刊1):17-23.

        [8]黃發(fā)明,潘李含,姚池,等.基于半監(jiān)督機(jī)器學(xué)習(xí)的滑坡易發(fā)性預(yù)測建模[J].浙江大學(xué)學(xué)報(bào)(工學(xué)版),2021,55(9) :1705-1713.

        [9]金必晶,曾韜睿,桂蕾,等.考慮未來土地利用動態(tài)情景的滑坡易發(fā)性制圖[J].地球信息科學(xué)學(xué)報(bào),2024,26(6):1486-1499.

        [10]MIENYE I D,SUN Y.A Survey of Ensemble Learning:Con-cepts,Algorithms,Applications,and Prospects[J]. IEEEAccess,2022,10:99129-99149.

        [11]FERREIRA A J,F(xiàn)IGUEIREDO M A T.Boosting Algorithms :AReview of Methods,Theory,and Applications[J].EnsembleMachine Learning,2012(1) :35-85.

        [12]BARTON M,LENNOX B.Model Stacking to Improve Predic-tion and Variable Importance Robustness for Soft Sensor De-velopment[J].DigitalChemical Engineering,2022,3:100034.

        [13]鄔禮揚(yáng),曾韜睿,劉謝攀,等.基于集成學(xué)習(xí)建模的滑坡易發(fā)性評價(jià)[J].地球科學(xué),2024,49(10):3841-3854.

        [14]KAVZOGLU T,SAHIN E K,COLKESEN I.Landslide Sus-ceptibility Mapping Using Gis-Based Multi-Criteria DecisionAnalysis,Support Vector Machines,and Logistic Regression[J].Landslides,2014,11(3) :425-439.

        [15]GU Tengfei,LI Jia, WANG Mingguo,et al.Landslide Sus-ceptibility Assessment in Zhenxiong County of China Basedon Geographically Weighted Logistic Regression Model[J].Geocarto International,2022,37(17) :4952-4973.

        [16]HUANG Faming,CAO Zhongshan,JIANG Shuihua,et al.Landslide Susceptibility Prediction Based on a Semi-Super-vised Multiple-Layer Perceptron Model[J]. Landslides,2020,17(12) :1-12.

        [17]周超,甘露露,王悅,等.綜合非滑坡樣本選取指數(shù)與異質(zhì)集成機(jī)器學(xué)習(xí)的區(qū)域滑坡易發(fā)性建模[J].地球信息科學(xué)學(xué)報(bào),2023,25(8) :1570-1585.

        [18]李明,蔣委君,董佳慧,等.基于機(jī)器學(xué)習(xí)的滑坡災(zāi)害易發(fā)性評價(jià):以三峽庫區(qū)為例[J].華南地質(zhì),2023,39(3):413-427.

        [19]周超,殷坤龍,曹穎,等.基于集成學(xué)習(xí)與徑向基神經(jīng)網(wǎng)絡(luò)耦合模型的三峽庫區(qū)滑坡易發(fā)性評價(jià)[J].地球科學(xué),2020,45(6) :1865-1876.

        [20]石菊松,徐瑞春,石玲,等.基于RS 和GIS 技術(shù)的清江隔河巖庫區(qū)滑坡易發(fā)性評價(jià)與制圖[J].地學(xué)前緣,2007,14(6) :119-128.

        [21]YANG Wei,TAN Shucheng,ZHU Tao,et al.SusceptibilityEvaluation of Slip Avalanche-Slip Geohazards in Xiangyun(Southwest China) Based on IM-LR Coupling[J].NaturalHazards,2024,121(5) :1-18.

        【責(zé)任編輯 呂艷梅】

        猜你喜歡
        易發(fā)分類器滑坡
        EL-CSO-NN在線監(jiān)測變壓器故障預(yù)測
        中國測試(2025年7期)2025-08-20 00:00:00
        基于邏輯回歸模型的黃土滑坡易發(fā)性評價(jià)
        “山體滑坡”
        某磷礦礦山排土場滑坡成因分析
        科技資訊(2025年12期)2025-08-12 00:00:00
        基于信息熵的自適應(yīng)多分類器交通數(shù)據(jù)插值模型
        基于機(jī)器學(xué)習(xí)的地質(zhì)災(zāi)害易發(fā)性研究
        雪熱村小扎雜組滑坡穩(wěn)定性分析及治理方案
        使用NGN算法改進(jìn)不平衡數(shù)值數(shù)據(jù)的研究
        国产欧美高清在线观看| 亚洲人成网站18男男| 久久夜色精品国产九色| 亚洲高清一区二区三区在线播放| 久久不见久久见免费影院国语| 免费黄色电影在线观看| 日本韩国三级aⅴ在线观看| 亚洲av少妇一区二区在线观看| 国产丝袜美女| 亚洲中文有码字幕青青| 久久久久久岛国免费网站| 亚洲精品美女中文字幕久久| 日本一卡二卡3卡四卡免费观影2022| 伊人色综合视频一区二区三区| 国产99页| 免费看片的网站国产亚洲| 777精品出轨人妻国产| 99久久国语露脸精品国产| 丝袜 亚洲 另类 欧美| 国产激情在线观看免费视频| 真人做人试看60分钟免费视频| 91精品一区国产高清在线gif| 国产丝袜在线精品丝袜| 樱花AV在线无码| 久久精品国产亚洲av日韩精品| 日本三级吃奶头添泬 | 精品久久久久久中文字幕大豆网| 亚洲成AV人在线观看网址| 青青草手机免费播放视频| 国产女主播白浆在线观看| 国产尤物AV尤物在线看| 国产女人高潮的av毛片| 日韩亚洲精品中文字幕在线观看| 国产精品igao视频网 | 日韩精品中文字幕人妻中出| 最新中文字幕一区二区| 亚洲av综合久久九九| 精品一二区| 中文国产乱码在线人妻一区二区| 久久久老熟女一区二区三区| 91白浆在线视频|