常志璐,黃發(fā)明,蔣水華,張崟瑯,周創(chuàng)兵,黃勁松,3
(1.南昌大學(xué) 工程建設(shè)學(xué)院,江西 南昌 330031;2.帕多瓦大學(xué) 地質(zhì)科學(xué)院,意大利 帕多瓦 35131;3.紐卡斯?fàn)柎髮W(xué) 巖土科學(xué)與工程卓越研究中心,澳大利亞 紐卡斯?fàn)?2287)
滑坡是中國(guó)發(fā)生最頻繁、危害最大的地質(zhì)災(zāi)害類型之一,給當(dāng)?shù)鼐用竦娜松砗拓?cái)產(chǎn)安全造成巨大損失[1–2]。區(qū)域滑坡易發(fā)性預(yù)測(cè)是一種預(yù)測(cè)潛在滑坡空間位置的有效途徑,可以準(zhǔn)確地預(yù)測(cè)“潛在滑坡”發(fā)育的空間概率[3–4]。其評(píng)價(jià)過程主要包括:構(gòu)建歷史滑坡數(shù)據(jù)庫(kù)、劃分制圖單元、提取研究區(qū)域的環(huán)境因子、構(gòu)建易發(fā)性預(yù)測(cè)模型、模型的精度評(píng)價(jià)和繪制區(qū)域滑坡易發(fā)性圖[5–8]。其中,歷史滑坡數(shù)據(jù)主要通過歷史影像識(shí)別和野外實(shí)地調(diào)查獲得[9],易發(fā)性模型的預(yù)測(cè)精度主要通過ROC曲線和頻率比精度兩種方法評(píng)價(jià),滑坡易發(fā)性圖主要分為極高、高、中等、低和極低5個(gè)等級(jí)[10]。
當(dāng)前的滑坡易發(fā)性制圖單元主要有柵格單元、地域單元、均一條件單元、斜坡單元和地貌單元[6,11]。其中,柵格單元和斜坡單元應(yīng)用最廣泛。柵格單元具有形狀規(guī)則、便于快速剖分、模型計(jì)算效率高等優(yōu)點(diǎn),但難以表達(dá)真實(shí)地形地貌且與基礎(chǔ)環(huán)境因子聯(lián)系不夠緊密,導(dǎo)致預(yù)測(cè)結(jié)果缺乏明確的物理意義。另外,柵格單元的預(yù)測(cè)結(jié)果難以準(zhǔn)確定位具體滑坡位置和范圍。與柵格單元相比,斜坡單元依據(jù)真實(shí)地形地貌進(jìn)行劃分,具有較明確的地質(zhì)特征意義,能夠相對(duì)準(zhǔn)確地反映滑坡區(qū)域的不同地形特征。因此,越來越多的學(xué)者嘗試?yán)眯逼聠卧M(jìn)行區(qū)域滑坡易發(fā)性預(yù)測(cè)。但是,如何快速準(zhǔn)確地自動(dòng)劃分斜坡單元仍是目前阻礙斜坡單元應(yīng)用的主要因素。
目前,應(yīng)用最廣泛的斜坡單元?jiǎng)澐址椒ㄊ撬姆治龇╗12–13]。該方法將斜坡單元定義為分水線和匯水線圍成的一塊區(qū)域,借助ArcGIS軟件和通過正反向DEM水文過程分析劃分斜坡單元。但是,該方法獲得的斜坡單元過于零散、數(shù)量眾多且難以調(diào)控,可操作性和自動(dòng)化程度很低,需要大量的后期人工修正。另外,分水線和匯水線圍成的一塊區(qū)域可以是一個(gè)單坡或多個(gè)斜坡,甚至可以是一個(gè)小流域。在實(shí)際應(yīng)用過程中,一些學(xué)者對(duì)水文分析法進(jìn)行了修正。例如,張曦[14]和顏閣[15]等提出了曲率分水嶺法,通過正反向曲率分別提取出凸型和凹型地貌元素,但是,這些方法本質(zhì)仍然屬于基于正反向曲率地表水文過程分析的范疇。近年來,研究者對(duì)斜坡單元進(jìn)行了新的定義,例如:Jia等[16]認(rèn)為斜坡單元需要確保內(nèi)部最大均質(zhì)性和不同單元之間的最大異質(zhì)性;王凱等[11]基于滑坡穩(wěn)定性力學(xué)分析的均一性基本假定,將斜坡單元定義為三維空間中的一個(gè)連續(xù)、均質(zhì)且閉合的小區(qū)域?;诖?,出現(xiàn)了一些新的斜坡單元?jiǎng)澐址椒?。例如:Alvioli等[17]基于斜坡單元的最大均質(zhì)化定義,提出一種新的斜坡單元提取方法r.slopeunits,該方法在斜坡單元提取結(jié)果的精細(xì)化和均質(zhì)化程度上比傳統(tǒng)方法有所進(jìn)步;Wang等[18]建立一種新的斜坡單元提取方法MIA–HSU,利用形態(tài)影像學(xué)算法提取山脊、山谷形態(tài)骨架線。雖然當(dāng)前斜坡單元提取方法取得了一些進(jìn)展,但是,仍然存在不足之處,主要表現(xiàn)在:1)難以適用于缺乏高精度DEM的地區(qū),2)難以快速準(zhǔn)確地實(shí)現(xiàn)自動(dòng)提取斜坡單元,3)提取結(jié)果受人為設(shè)定的閾值影響[11]。
選擇合適的環(huán)境因子是區(qū)域滑坡易發(fā)性預(yù)測(cè)過程中的重要步驟,輸入變量信息的質(zhì)量直接決定著模型的優(yōu)劣和易發(fā)性結(jié)果的準(zhǔn)確性。在采用斜坡單元進(jìn)行滑坡易發(fā)性建模時(shí),需要提取每個(gè)斜坡單元內(nèi)部的環(huán)境因子信息。目前,最常采用的方法是基于一定分辨率的環(huán)境因子?xùn)鸥駭?shù)據(jù),通過ArcGIS 10.2軟件“空間分析”工具中的區(qū)域分析功能,分別提取每個(gè)斜坡單元范圍內(nèi)環(huán)境因子?xùn)鸥裰档钠骄担ㄟB續(xù)型數(shù)據(jù))或眾數(shù)值(離散型數(shù)據(jù))作為這個(gè)斜坡單元的環(huán)境因子值[19]。但是,由于各個(gè)環(huán)境因子在空間上具有空間變異性,例如一些地形因子(如高程、坡度、剖面曲率等)在不同位置表現(xiàn)出較高的變異性,而巖性、坡向等環(huán)境因子在斜坡單元中變異性較小。并且,一個(gè)斜坡單元內(nèi)可能包含幾百個(gè)柵格數(shù)據(jù),僅僅采用平均值無法準(zhǔn)確反映斜坡單元內(nèi)部的真實(shí)情況,造成數(shù)據(jù)信息的過度簡(jiǎn)化和缺失。因此,為了獲得更加準(zhǔn)確的滑坡易發(fā)性預(yù)測(cè)模型和結(jié)果,應(yīng)該充分考慮和挖掘斜坡單元內(nèi)部環(huán)境因子的空間非均質(zhì)性。
常用的滑坡易發(fā)性預(yù)測(cè)模型主要分為:基于滑坡編錄的概率分析模型、啟發(fā)式模型、確定性模型、數(shù)學(xué)統(tǒng)計(jì)模型和人工智能模型[20]。其中,人工智能模型能有效解決統(tǒng)計(jì)模型預(yù)測(cè)區(qū)域滑坡易發(fā)性時(shí)存在的問題,并得到了廣泛的應(yīng)用,主要包括邏輯回歸(logistic regression, LR)[21]、人工神經(jīng)網(wǎng)絡(luò)[22]、支持向量機(jī)(support vector machine, SVM)[23]、模糊邏輯[24]、決策樹和隨機(jī)森林[25]模型等,其中SVM和LR模型應(yīng)用最多并且評(píng)價(jià)效果最好。
綜上所述,本文以江西省崇義縣為例,基于多尺度分割算法提出一種斜坡單元?jiǎng)澐址椒ǎ浞挚紤]斜坡單元內(nèi)部環(huán)境因子的空間變異性,選取均值、變化值和標(biāo)準(zhǔn)差3個(gè)變量表征斜坡單元內(nèi)部環(huán)境因子的非均質(zhì)性,并分別采用SVM和LR模型來預(yù)測(cè)并繪制研究區(qū)域滑坡易發(fā)性圖。
本研究基于斜坡單元和斜坡單元內(nèi)部環(huán)境因子的非均質(zhì)性特征,采用機(jī)器學(xué)習(xí)模型構(gòu)建了區(qū)域滑坡易發(fā)性的預(yù)測(cè)模型,具體建模步驟如下:
1)基礎(chǔ)數(shù)據(jù)的收集。從國(guó)家地質(zhì)調(diào)查局網(wǎng)站及91位圖助手軟件下載DEM影像圖(分辨率為8.9 m)、Landsat TM8遙感影像1景(2013–07–03,軌道號(hào)119/041)、地層圖(1∶25 000)、地表覆被、人類工程活動(dòng)和歷史滑坡數(shù)據(jù)庫(kù),并通過ArcGIS10.2軟件進(jìn)行管理。
2)斜坡單元的劃分。從研究區(qū)域DEM圖層中通過ArcGIS10.2分別提取坡向和地形陰影圖,采用多尺度分割方法劃分斜坡單元,分別對(duì)斜坡單元進(jìn)行定性定量評(píng)價(jià),并與傳統(tǒng)的水文方法劃分的斜坡單元進(jìn)行對(duì)比分析。
3)環(huán)境因子的提取。基于斜坡單元,分別提取研究區(qū)域的地形地貌、地層、水文、地表覆被和人類工程活動(dòng)因素,考慮斜坡單元內(nèi)部環(huán)境因子的變異性,分別采用平均值、變化值和標(biāo)準(zhǔn)差3個(gè)變量表征每一個(gè)環(huán)境因子。隨后對(duì)所有環(huán)境因子變量進(jìn)行相關(guān)性分析。
4)樣本數(shù)據(jù)集的構(gòu)建。根據(jù)歷史滑坡信息分別提取滑坡樣本的環(huán)境因子信息,在非滑坡區(qū)域隨機(jī)選取與滑坡樣本相同數(shù)量的非滑坡樣本并提取相應(yīng)的環(huán)境因子信息,滑坡和非滑坡樣本信息共同構(gòu)成建模的基本數(shù)據(jù)集。
5)易發(fā)性預(yù)測(cè)模型構(gòu)建。選擇機(jī)器學(xué)習(xí)模型(SVM和LR模型)分別構(gòu)建基于斜坡單元的易發(fā)性預(yù)測(cè)模型(Slope–SVM/LR模型)和考慮斜坡單元內(nèi)部環(huán)境因子非均質(zhì)性的易發(fā)性預(yù)測(cè)模型(Variant Slope–SVM/LR模型)。
6)模型精度評(píng)價(jià)。分別采用ROC曲線和頻率比精度對(duì)比上述4個(gè)模型的預(yù)測(cè)精度。
7)繪制全區(qū)易發(fā)性圖。將全區(qū)數(shù)據(jù)導(dǎo)入各個(gè)易發(fā)性預(yù)測(cè)模型以預(yù)測(cè)易發(fā)性指數(shù),使用自然間斷點(diǎn)法將其劃分為極高、高、中、低和極低5個(gè)易發(fā)性等級(jí),繪制滑坡易發(fā)性圖。
1.2.1 基于多尺度分割算法的斜坡單元?jiǎng)澐?/p>
多尺度分割(multi-scale segmentation method,MSS)的核心算法是基于異質(zhì)性最小區(qū)域合并算法,使對(duì)象內(nèi)部的異質(zhì)性最小,對(duì)象之間的異質(zhì)性最大[26]。MSS方法是一種采用自底向上的區(qū)域增長(zhǎng)法,即基于像素層自底向上區(qū)域合并完成對(duì)象提取?;贛SS方法的基本原理,可以將斜坡單元定義為連續(xù)、均勻、封閉的對(duì)象,在特定的分割尺度閾值下,呈現(xiàn)出對(duì)象內(nèi)部異質(zhì)性最小和相鄰對(duì)象之間異質(zhì)性最大的特征。
MSS方法提取斜坡單元的流程示意圖如圖1所示。具體步驟為:
圖1 MSS方法提取斜坡單元流程圖Fig. 1 Flowchart for slope unit extraction by MSS method
1)收集研究區(qū)域的基礎(chǔ)高程影像圖和歷史滑坡數(shù)據(jù)庫(kù)。分別提取坡向和山體陰影圖作為MSS方法的基本輸入影像,另外,統(tǒng)計(jì)所有歷史滑坡的形態(tài)和尺度特征。
2)參數(shù)的設(shè)置。MSS方法中需要設(shè)置的參數(shù)包括尺度、形狀特征權(quán)重和緊致度權(quán)重參數(shù),通過試錯(cuò)法并結(jié)合研究區(qū)域內(nèi)歷史滑坡的形態(tài)和尺度特征(修正試錯(cuò)法)來確定。
3)斜坡單元的劃分。從像素層開始,先將相鄰區(qū)域特征相似的像素聚合成小影像區(qū)域。然后將相似的小影像區(qū)域基于異質(zhì)性最小原則合并成大的影像區(qū)域,每一次合并,都計(jì)算兩區(qū)域合并后區(qū)域的異質(zhì)性是否大于尺度閾值(scale)。若大于尺度閾值,則不對(duì)該兩區(qū)域進(jìn)行合并;若小于尺度閾值,則進(jìn)行合并,生成新的更大的影像區(qū)域。直至合并后的區(qū)域的異質(zhì)性都大于尺度閾值,或所有的區(qū)域都合并完畢,則停止合并[27]。
4)后處理優(yōu)化過程。將步驟3)中的影像對(duì)象進(jìn)行分割、合并和平滑等優(yōu)化處理,消除局部“孤島效應(yīng)”的對(duì)象,最后獲得研究區(qū)域內(nèi)的斜坡單元。
1.2.2 輸入影像和參數(shù)設(shè)置
在采用MSS方法劃分斜坡單元時(shí),選取坡向和山體陰影圖作為基本的輸入影像。其中,山體陰影是一種由光源和高程表面的坡度和坡向確定地形的技術(shù),可以反映一定的地形信息,其影像灰度值介于0~255之間。坡向定義為坡面法線在水平面上投影的方向,可以用來識(shí)別地面上某個(gè)位置的最陡下降方向。因此,根據(jù)坡向和地形陰影的特征,MSS方法可以最大限度地提高坡單元內(nèi)部的均勻性,最大限度地提高斜坡單元之間的非均勻性。
MSS方法中需要設(shè)置的參數(shù)主要包括尺度、形狀特征權(quán)重和緊致度權(quán)重。若尺度參數(shù)取值太大,則會(huì)出現(xiàn)分割不完全的現(xiàn)象;反之,則會(huì)出現(xiàn)分割破碎的現(xiàn)象。最優(yōu)尺度應(yīng)該表現(xiàn)為:對(duì)象大小與地物目標(biāo)輪廓相當(dāng),大小接近;對(duì)象多邊形既不能太破碎,也不能邊界模糊,且光譜變異情況較小。緊致度參數(shù)是用來描述對(duì)象單元的飽滿程度,即接近正方形和接近圓形的程度。緊致度權(quán)重越高,圖像對(duì)象越緊湊,對(duì)象單元的形狀越規(guī)則。因?yàn)橛跋駭?shù)據(jù)中最重要的信息是光譜信息,形狀特征的權(quán)重太高會(huì)降低分割結(jié)果的質(zhì)量。
1.2.3 最優(yōu)參數(shù)組合的確定
參數(shù)組合的選擇直接決定著斜坡單元的劃分結(jié)果,本研究通過修正試錯(cuò)法來選擇最佳的參數(shù)組合。具體步驟如下:
1)根據(jù)歷史滑坡數(shù)據(jù)庫(kù),計(jì)算研究區(qū)域內(nèi)滑坡的面積和形狀特征。形狀特征通過形狀指數(shù)(R值)來表示,R值可以通過式(1)計(jì)算獲得:
式中,L、S分別為滑坡面的周長(zhǎng)和面積。
2)根據(jù)傳統(tǒng)的試錯(cuò)法確定幾組參數(shù)值,分別采用每一個(gè)參數(shù)組合來劃分斜坡單元。
3)分別計(jì)算每組參數(shù)組合條件下斜坡單元面積和形狀指數(shù)的平均值和標(biāo)準(zhǔn)差,并與滑坡面積和形狀指數(shù)的平均值和標(biāo)準(zhǔn)差做比較。當(dāng)劃分的斜坡單元面積和形狀指數(shù)的平均值和標(biāo)準(zhǔn)差是滑坡相應(yīng)數(shù)據(jù)的1~2倍,并且R值介于16.00~20.78之間時(shí),認(rèn)為劃分的斜坡單元是合理的,其對(duì)應(yīng)的參數(shù)組合是最優(yōu)組合。
1.3.1 支持向量機(jī)模型
1.3.2 邏輯回歸模型
LR模型是一種能有效處理二元分類問題的非線性回歸模型,其基本思想是尋找最佳擬合函數(shù)來表示目標(biāo)變量與因子變量之間的相關(guān)關(guān)系[30–31]。假設(shè)變量因子為xi(i=1,2,···,l),目標(biāo)變量為y=0和1。LR模型計(jì)算公式如式(3)和(4)所示:
式(3)~(4)中:z為變量疊加后的線性權(quán)重值之和;a為L(zhǎng)R模型常數(shù);bl為L(zhǎng)R模型的系數(shù);p為事件發(fā)生的概率,其值域?yàn)閇0,1]。
崇義縣位于江西省西南部,介于113°55′E ~ 114°38′E,25°24′N ~ 25°55′N之間,總面積約2 206.3 km2。崇義縣屬于贛南丘陵區(qū),海拔在140~2 019 m之間。地形主要為中、低山(≥500 m)、丘陵(300~500 m)和河谷階地(≤300 m),分別占總面積的47.67%、45.06%和7.27%。縣域地質(zhì)單元十分復(fù)雜,包括寒武紀(jì)至泥盆紀(jì)期間的變質(zhì)巖(變質(zhì)細(xì)砂巖和板巖)、碳酸鹽巖(石灰?guī)r)、火成巖(花崗巖)及碎屑巖等。該地區(qū)屬亞熱帶季風(fēng)氣候,雨量充沛,濕度較高。年平均降雨量達(dá)1 615.2 mm,平均氣溫約為17.8℃。土地覆蓋類型主要包括森林、農(nóng)田、草地和水體。
野外滑坡編錄主要包括滑坡的位置、發(fā)生時(shí)間、基本環(huán)境因子信息、運(yùn)動(dòng)模式、規(guī)模大小及誘發(fā)因素等信息。根據(jù)崇義縣自然資源局的數(shù)據(jù)和野外調(diào)查可知:縣域內(nèi)自1970年至今共發(fā)生滑坡254次,其分布如圖2所示。滑坡主要為覆蓋層滑坡,具有規(guī)模小、群發(fā)性的特點(diǎn)?;麦w主要為第四系殘坡積層,由粉質(zhì)黏土夾層和碎塊石組成。滑坡面積介于在4.2×103~3.2×104m2之間,平均面積約為7.6×103m2?;潞穸仍?.8~8.0 m之間。研究區(qū)域內(nèi)的滑坡分布不均勻,北部滑坡較多,東部滑坡較少。
圖2 崇義縣滑坡分布Fig. 2 Distribution of landslides in Chongyi County
基于分辨率為8.9 m的DEM數(shù)據(jù),通過ArcGIS軟件分別提取坡向和山體陰影圖作為MSS方法的輸入圖像,研究區(qū)域的山體陰影和坡向圖如圖3所示。在尺度、形狀特征權(quán)重和緊致度權(quán)重參數(shù)組合中,尺度參數(shù)分別取10、20、30、40和50,形狀特征權(quán)重參數(shù)分別取0.5、0.6、0.7、0.8 和0.9,緊致度權(quán)重參數(shù)也分別取0.5、0.6、0.7、0.8和0.9,在每一組參數(shù)組合下,分別采用MSS方法劃分斜坡單元。根據(jù)研究區(qū)域的地形特征,分別在丘陵區(qū)和中低山區(qū)各選取一個(gè)區(qū)域(圖3),對(duì)比分析斜坡單元的劃分效果。
圖3 山體陰影和坡向圖Fig. 3 Shaded relief and aspect images
通過崇義縣滑坡發(fā)育特征和自然地理分析并參考相關(guān)文獻(xiàn)[20–21],最后選擇高程、坡度、坡向、平面曲率、剖面曲率、地形起伏度、巖土類型、地形濕度指數(shù)(topographic wetness index,TWI)、歸一化植被指數(shù)(normalized difference vegetation index, NDVI)、歸一化建筑指數(shù)(normalized difference building index,NDBI)和斜坡單元形態(tài)等15個(gè)環(huán)境因子??紤]斜坡單元內(nèi)部環(huán)境因子的非均質(zhì)性時(shí),每一個(gè)環(huán)境因子可以采用平均值、變化值和標(biāo)準(zhǔn)差3個(gè)變量表征。其中,需要說明的是離散型變量(巖性、坡向)采用眾數(shù)來表示,無法獲得類似的3個(gè)變量。因此,考慮斜坡單元內(nèi)部連續(xù)型環(huán)境因子的非均質(zhì)性時(shí),可將15個(gè)環(huán)境因子擴(kuò)展為38個(gè)環(huán)境因子。其中,斜坡單元形態(tài)特征主要通過斜坡單元的形狀指數(shù)和緊致度來表征。
為了降低環(huán)境因子之間的多重共線性對(duì)模型構(gòu)建的影響,需要對(duì)38個(gè)環(huán)境因子進(jìn)行相關(guān)性分析。38個(gè)環(huán)境因子時(shí)間的相關(guān)系數(shù)可以通過SPSS 22軟件計(jì)算獲得,當(dāng)兩個(gè)變量相關(guān)系數(shù)的絕對(duì)值小于0.3時(shí),認(rèn)為兩個(gè)變量之間無相關(guān)性。根據(jù)該規(guī)則,本研究共有22個(gè)環(huán)境因子的相關(guān)系數(shù)小于0.3,主要包括:高程、高程變化值、坡度、坡度變化值、坡度標(biāo)準(zhǔn)差、剖面曲率、平面曲率、平面曲率變化值、平面曲率標(biāo)準(zhǔn)差、TWI、NDVI、NDBI、公路密度、公路密度變化值、河流密度、河流密度變化值、覆蓋層厚度、形狀指數(shù)、緊致度、坡向、巖土類型和距水系距離。其部分環(huán)境因子的空間分布如圖4所示。
圖4 研究區(qū)域環(huán)境因子空間分布Fig. 4 Conditioning factor maps in study area
將上述的22個(gè)環(huán)境因子的信息作為機(jī)器學(xué)習(xí)模型的輸入變量,模型的輸出變量為1(滑坡)和0(非滑坡)。其中,輸入變量主要包括滑坡樣本(標(biāo)簽值為1)和非滑坡樣本(標(biāo)簽值為0),按一定比例劃分為訓(xùn)練集和測(cè)試集,分別用于訓(xùn)練機(jī)器學(xué)習(xí)模型和測(cè)試機(jī)器學(xué)習(xí)模型。本研究中,滑坡樣本是歷史滑坡所在斜坡單元,非滑坡樣本是從滑坡區(qū)之外的斜坡單元內(nèi)隨機(jī)選取與滑坡斜坡單元相同數(shù)量的斜坡單元?;聵颖竞头腔聵颖景?∶3的比例劃分為訓(xùn)練集和測(cè)試集。
根據(jù)MSS方法在不同參數(shù)組合條件下斜坡單元的劃分結(jié)果,分別統(tǒng)計(jì)了不同參數(shù)組合條件下斜坡單元的面積和形狀指數(shù)特征,如表1所示。從表1可以看出,當(dāng)尺度、形狀特征權(quán)重和緊致度權(quán)重分別為20、0.8和0.8時(shí),劃分的斜坡單元的面積和形狀指數(shù)統(tǒng)計(jì)特征與研究區(qū)域歷史滑坡的統(tǒng)計(jì)特征最相近,斜坡單元?jiǎng)澐中Ч詈?。因此,研究區(qū)域共被劃分為53 05 5個(gè)斜坡單元。 區(qū)域內(nèi)MSS方法和水文法分別在丘陵區(qū)和中低山區(qū)的斜坡單元?jiǎng)澐纸Y(jié)果如圖5所示。從圖5可以看出:MSS方法適用于不同地形地貌條件下的斜坡單元?jiǎng)澐?。與傳統(tǒng)的水文法劃分的斜坡單元結(jié)果相比, MSS方法劃分的斜坡單元更均勻,更符合斜坡的實(shí)際地形地貌條件,避免出現(xiàn)斜坡單元面積過大和多個(gè)斜坡包含在同一個(gè)斜坡單元內(nèi)的錯(cuò)誤。另外,MSS方法劃分的斜坡單元形狀更規(guī)則,不存在狹長(zhǎng)細(xì)條狀的斜坡單元,不需要進(jìn)行人工調(diào)整。
圖5 典型區(qū)域MSS方法和水文法的斜坡單元?jiǎng)澐纸Y(jié)果Fig. 5 Slope units of typical cases divided by MSS and hydrological methods
表1 斜坡單元面積和形狀指數(shù)統(tǒng)計(jì)特征Tab. 1 Statistical characteristics of the area and shape index (R index) for slope units
3.2.1 斜坡單元的定性評(píng)價(jià)
通過對(duì)比滑坡及其所在的斜坡單元之間的空間位置關(guān)系可以定性地評(píng)價(jià)MSS方法劃分斜坡單元的效果。如果滑坡的位置與其所在的斜坡單元存在一一對(duì)應(yīng)的關(guān)系,則認(rèn)為提取的斜坡單元是合理的。
基于MSS方法和水文法的斜坡單元?jiǎng)澐纸Y(jié)果,歷史滑坡與其所在的斜坡單元之間的空間位置關(guān)系如圖6所示。從圖6(a)可以看出,MSS方法劃分的斜坡單元內(nèi),大部分的滑坡與其所在的斜坡單元存在一一對(duì)應(yīng)關(guān)系,局部出現(xiàn)少量滑坡跨越兩個(gè)斜坡單元。對(duì)此,本文主要通過兩種方式進(jìn)行處理,一種是根據(jù)實(shí)際地形對(duì)斜坡單元進(jìn)行驗(yàn)證和調(diào)整;另一種方法是計(jì)算滑坡在跨越斜坡單元中的面積分布,選擇面積最大的斜坡單元作為滑坡所在斜坡單元。但是,在水文法劃分的斜坡單元內(nèi),發(fā)現(xiàn)存在多個(gè)滑坡分布在同一個(gè)斜坡單元的情況,如圖6(b)所示。圖6的結(jié)果表明,相比于水文分析法,采用MSS方法劃分的斜坡單元更合理。
圖6 歷史滑坡與其所在的斜坡單元之間的空間位置關(guān)系Fig. 6 Position relationship between the recorded landslides and the responding slope units
3.2.2 斜坡單元的定量評(píng)價(jià)
斜坡單元的大小和形狀特征可以用來定量評(píng)價(jià)MSS方法劃分斜坡單元的效果?;贛SS方法劃分斜坡單元的大小和形狀參數(shù)分布特征如圖7所示。其中,斜坡單元的大小用面積來表示。圖7(a)顯示了斜坡單元的面積值分布特征,74.92%的斜坡單元的面積介于10 000~60 000 m2。斜坡單元的平均值、標(biāo)準(zhǔn)差、最大值及最小值分別是41 579 m2、29 936 m2、6 254 m2和316 828 m2(見表1)。斜坡單元的形狀特征可以采用R指數(shù)來表示。已知圓、正方形和三角形的R值分別是4π、16和20.78。斜坡單元的形態(tài)越接近于長(zhǎng)條狀,R值越大;并且,當(dāng)R值大于28時(shí),斜坡單元的長(zhǎng)寬比約為5∶1。表1中顯示斜坡單元的形狀指數(shù)的平均值、標(biāo)準(zhǔn)差、最小值及最大值分別是19.61、6.21、13.98和154.94。從圖7(b)中可以看出,68.82%的斜坡單元的R值介于18~26之間,表示斜坡單元的形狀介于三角形和正方形之間,并且均勻性更強(qiáng)。
圖7 MSS方法劃分的斜坡單元的面積和形狀參數(shù)分布特征Fig. 7 Distribution characteristics of the area and shape indexes of slope units by the MSS method
本研究分別使用Slope–SVM、Variant Slope–SVM、Slope–LR和Variant Slope–LR模型,計(jì)算整個(gè)區(qū)域的易發(fā)性指數(shù)。然后在ArcGIS10.2 軟件中采用自然間斷點(diǎn)法將易發(fā)性指數(shù)劃分為極高、高、中等、低和極低5個(gè)等級(jí),不同評(píng)價(jià)模型的易發(fā)性分布如圖8所示。圖8(a)顯示出Slope–SVM模型中極低、低、中、高和極高易發(fā)性等級(jí)分別占比32.18%、20.46%、14.91%、13.62%和18.82%。圖8(c)顯示出Variant slope–SVM模型中極低、低、中、高和極高易發(fā)性等級(jí)分別占比41.85%、17.68%、12.75%、11.99%和15.73%。Slope–LR和Variant slope–LR模型的滑坡易發(fā)性分布如圖8(b)、(d)所示。上述模型的易發(fā)性分布顯示出研究區(qū)域的高易發(fā)性等級(jí)主要分布在區(qū)域的東部和中部,呈帶狀分布。相比于Slope–SVM/LR模型的預(yù)測(cè)結(jié)果,Variant Slope–SVM/LR模型中的極低和低易發(fā)性的比例增加,高和極高易發(fā)性比例降低。
圖8 不同預(yù)測(cè)模型的易發(fā)性分布Fig. 8 Landslide susceptibility distribution of different landslide susceptibility models
3.4.1 ROC精度評(píng)價(jià)
ROC曲線是目前用于評(píng)估機(jī)器學(xué)習(xí)模型易發(fā)性預(yù)測(cè)性能最常用的方法,主要采用訓(xùn)練集和測(cè)試集樣本中的預(yù)測(cè)概率和標(biāo)簽數(shù)據(jù),以1–特異性為橫坐標(biāo),敏感度為縱坐標(biāo)繪制而成。ROC曲線下部面積(AUC)可以作為滑坡易發(fā)性預(yù)測(cè)精度[32]。
不同易發(fā)性評(píng)價(jià)模型的ROC曲線如圖9所示。由圖9可知,Slope–SVM、Variant slope–SVM、Slope–LR和Variant slope–LR模型的預(yù)測(cè)精度分別為0.812、0.876、0.818和0.839。圖9結(jié)果表明無論是SVM模型還是LR模型,考慮斜坡單元內(nèi)部非均質(zhì)性的易發(fā)性結(jié)果的預(yù)測(cè)精度要高于基于斜坡單元的易發(fā)性結(jié)果。
圖9 不同易發(fā)性預(yù)測(cè)模型的ROC曲線分布Fig. 9 ROC curves of different landslide susceptibility models
3.4.2 頻率比精度
頻率比精度是評(píng)估模型預(yù)測(cè)精度的另外一種有效的方法,該方法分別計(jì)算每個(gè)易發(fā)性等級(jí)下的斜坡單元占比和滑坡斜坡單元占比,二者的比值為該易發(fā)性等級(jí)的頻率比[7]。不同易發(fā)性預(yù)測(cè)模型的頻率比精度分布如圖10所示。圖10顯示出各個(gè)易發(fā)性等級(jí)的頻率比值從極高到極低等級(jí)逐漸降低。Slope–SVM、Variant slope–SVM、Slope–LR和Variant slope–LR模型的頻率比精度分別為0.780、0.866、0.792和0.865。圖10的結(jié)果表明考慮斜坡單元內(nèi)部非均質(zhì)性的易發(fā)性結(jié)果的預(yù)測(cè)精度要高于基于斜坡單元的易發(fā)性結(jié)果。
圖10 不同易發(fā)性預(yù)測(cè)模型的頻率比精度分布Fig. 10 FR accuracy values of landslide susceptibility classes for different landslide susceptibility models
傳統(tǒng)的水文分析法是根據(jù)地貌特征把斜坡單元定義為山脊線和山谷線之間的區(qū)域。雖然該定義的應(yīng)用較廣,實(shí)際意義較強(qiáng),但是該方法仍存在很多缺陷。例如:水文方法劃分的斜坡單元比較適用于地形地貌相對(duì)單一的地區(qū),在地形地貌復(fù)雜的地區(qū),水文分析法劃分的斜坡單元往往包含多個(gè)斜坡或者是一個(gè)流域;該方法的參數(shù)設(shè)置主觀性強(qiáng),地域差別大;并且該方法效率低,不利于大區(qū)域尺度和高精度數(shù)據(jù)的斜坡單元的劃分,劃分斜坡單元的過程中出現(xiàn)大量不合理的長(zhǎng)條狀面,需要后期大量的人工調(diào)整。因此,水文分析法劃分的斜坡單元應(yīng)用性較弱。
相比于水文分析法,MSS方法將斜坡單元定義為一些內(nèi)部坡向非均質(zhì)性最小,外部坡向非均質(zhì)性最大的對(duì)象單元。該方法可以實(shí)現(xiàn)大區(qū)域尺度和高精度數(shù)據(jù)的斜坡單元的自動(dòng)劃分,極大地提高了斜坡單元?jiǎng)澐值男?。采用修正試錯(cuò)法可以更快更客觀地確定該方法中的參數(shù)組合。該方法的實(shí)用推廣性更強(qiáng),適用于比較復(fù)雜的地形地貌區(qū)域,也適用于各類地質(zhì)災(zāi)害的預(yù)測(cè)。因此,與傳統(tǒng)的水文分析法相比,本文提出的MSS方法在斜坡單元的定義、參數(shù)設(shè)置、效率及應(yīng)用推廣方面都有一定的優(yōu)勢(shì)。但是,MSS方法仍然存在一些不足,例如,MSS方法劃分的斜坡單元的邊界鋸齒狀比較多,不夠光滑;對(duì)于一些平坦地區(qū),由于沒有坡向?qū)е聞澐值男逼聠卧嬖谡`差。
通過與采用柵格單元進(jìn)行易發(fā)性預(yù)測(cè)的結(jié)果相比[10,20],發(fā)現(xiàn)采用斜坡單元的易發(fā)性結(jié)果實(shí)際意義和應(yīng)用性更強(qiáng)。選擇斜坡單元作為易發(fā)性評(píng)價(jià)的基本單元,可以避免采用柵格單元結(jié)果中極高易發(fā)性區(qū)域過度聚集的情況,也避免因?yàn)閿?shù)據(jù)精度差異和機(jī)器學(xué)習(xí)模型的不同導(dǎo)致的易發(fā)性圖的差異。水文分析法提取斜坡單元的易發(fā)性結(jié)果對(duì)比發(fā)現(xiàn),基于MSS方法提取斜坡單元的易發(fā)性結(jié)果更合理,避免了水文分析法斜坡單元面積過大導(dǎo)致評(píng)價(jià)結(jié)果過于零散的現(xiàn)象。此外,還可以準(zhǔn)確地確定具有極高易發(fā)性的斜坡單元的位置,為防災(zāi)減災(zāi)工作者提供更加精確的結(jié)果。同時(shí),采用斜坡單元的另外一個(gè)優(yōu)勢(shì)是可以充分地挖掘和分析斜坡單元內(nèi)部環(huán)境因子之間的相關(guān)性和非均質(zhì)性。Variant Slope–SVM/LR和Slope–SVM/LR模型的易發(fā)性結(jié)果的對(duì)比分析表明,考慮斜坡單元內(nèi)部環(huán)境因子的非均質(zhì)性可以提高易發(fā)性的預(yù)測(cè)精度。
本研究以江西省崇義縣為例,采用MSS方法劃分斜坡單元,考慮斜坡單元內(nèi)部環(huán)境因子的非均質(zhì)性,采用SVM和LR機(jī)器學(xué)習(xí)模型進(jìn)行了易發(fā)性預(yù)測(cè)。研究結(jié)果表明:
1)與傳統(tǒng)的水文分析法相比,MSS方法可以實(shí)現(xiàn)大區(qū)域內(nèi)斜坡單元地快速自動(dòng)劃分,并且修正試錯(cuò)法可以更好地確定MSS方法的最優(yōu)參數(shù)組合。當(dāng)尺度、形狀特征權(quán)重和緊致度權(quán)重參數(shù)取20、0.8和0.8時(shí),崇義縣斜坡單元的劃分效果最好。
2)Variant slope–SVM/LR模型的ROC和頻率比精度均顯著高于Slope–SVM/LR模型,表明斜坡單元內(nèi)部環(huán)境因子的非均質(zhì)性可以用平均值、變化值和標(biāo)準(zhǔn)差3個(gè)變量來表征,考慮斜坡單元內(nèi)部環(huán)境因子的非均質(zhì)性可以充分地挖掘滑坡與環(huán)境因子之間的關(guān)系,使易發(fā)性預(yù)測(cè)結(jié)果更準(zhǔn)確。
3)雖然MSS方法可以實(shí)現(xiàn)自動(dòng)提取斜坡單元,但在未來的研究工作中,提取的斜坡單元形態(tài)仍需進(jìn)一步的優(yōu)化。另外,在滑坡易發(fā)性的評(píng)價(jià)過程中,應(yīng)當(dāng)充分挖掘研究區(qū)域歷史滑坡的形態(tài)和空間分布特征。