宋小川,劉漢湖,張 春,周林博
(成都理工大學(xué) 地球科學(xué)學(xué)院,四川 成都 610051)
滑坡是常見地質(zhì)災(zāi)害之一,容易造成大量生命財(cái)產(chǎn)損失和生態(tài)環(huán)境破壞。我國滑坡地質(zhì)災(zāi)害頻發(fā),因此,需要對(duì)滑坡地質(zhì)災(zāi)害有全面的認(rèn)識(shí),為此進(jìn)行滑坡災(zāi)害易發(fā)性評(píng)價(jià)就顯得尤為重要。
國內(nèi)外許多學(xué)者在研究滑坡易發(fā)性中,先后提出了多種評(píng)價(jià)方法,滑坡易發(fā)性評(píng)價(jià)從最開始的定性分析(如:專家打分法、層次分析法[1-3]、加權(quán)線性組合法[4]等),如許沖等人利用層次分析法對(duì)汶川地震區(qū)的滑坡易發(fā)性評(píng)價(jià)[5],層次分析法作為一種多因素分析方法,有一定的主觀因素影響,基于專家知識(shí)逐一對(duì)比每兩個(gè)影響因子之間的關(guān)系,使易發(fā)性評(píng)級(jí)結(jié)果較為主觀,受人為因素的影響較大;再到被科學(xué)界認(rèn)為更客觀、更適合用于滑坡易發(fā)性評(píng)價(jià)的統(tǒng)計(jì)學(xué)方法,可以大限度減少專家的主觀性,應(yīng)用比較廣泛的統(tǒng)計(jì)預(yù)測(cè)模型有[6-9]邏輯回歸、信息量、確定性系數(shù)等。隨著機(jī)器學(xué)習(xí)與人工智能的不斷發(fā)展,機(jī)器學(xué)習(xí)模型[10-12](BP神經(jīng)網(wǎng)絡(luò)、隨機(jī)森林、支持向量機(jī)等)也得到極為廣泛的應(yīng)用。對(duì)比以上方法,定性分析方法受主觀因素影響較大,機(jī)器學(xué)習(xí)在精度上具有一定的優(yōu)勢(shì),但以此為基礎(chǔ)的評(píng)價(jià)模型過程復(fù)雜,而統(tǒng)計(jì)學(xué)方法原理容易理解、操作更易于實(shí)現(xiàn),在更新評(píng)價(jià)指標(biāo)時(shí)只需將指標(biāo)的統(tǒng)計(jì)系數(shù)疊加到原始評(píng)價(jià)結(jié)果中,不需再對(duì)整個(gè)研究區(qū)進(jìn)行重新評(píng)價(jià),具有較好的推廣和應(yīng)用價(jià)值。
綜上,選取了統(tǒng)計(jì)預(yù)測(cè)模型中應(yīng)用比較廣泛的信息量與確定性系數(shù)模型用于該區(qū)域的滑坡易發(fā)性評(píng)價(jià),希望能為滑坡易發(fā)性評(píng)價(jià)提供一定的理論與依據(jù)。
雷波縣位于四川省西南邊緣、金沙江下游北岸,屬?zèng)錾揭妥遄灾沃菟牐乩碜鴺?biāo)為東經(jīng)103°10′~103°52′,北緯27°49′~28°36′,如圖1所示,全縣幅員面積2 932 km2,海拔277.6~4 067 m,屬于金沙江高中山峽谷氣候,干濕季節(jié)分布明顯,年降雨量主要集中于夏、秋兩季,年氣溫差異較小,地方氣候特點(diǎn)比較突出,受諸多因素影響,區(qū)內(nèi)氣候變化明顯,縣域內(nèi)構(gòu)造帶也較為發(fā)育。以上的地質(zhì)地貌條件,孕育了雷波縣滑坡災(zāi)害發(fā)生的自然環(huán)境。
圖1 研究區(qū)地理位置圖
本次數(shù)據(jù)包括:空間分辨率為10 m的數(shù)字高程模型(DEM),1:100 000地質(zhì)圖(圖幅號(hào)為H48D011003、H48D011004、H48D012003、H48D012004、G48D001003、G48D001004),河流與路網(wǎng)數(shù)據(jù)來源于全國地理信息資源目錄服務(wù)系統(tǒng)(https://www.webmap.cn/),地理空間數(shù)據(jù)云(http://www.gscloud.cn/)下載的空間分辨率為30 m的Landsat8遙感影像,野外地質(zhì)災(zāi)害調(diào)查資料收集的滑坡點(diǎn)數(shù)據(jù)129處。
2.1.1 信息量模型
導(dǎo)致滑坡災(zāi)害發(fā)生的因素較多,信息量模型是通過計(jì)算滑坡發(fā)生的密度來表征各影響因子分級(jí)下滑坡發(fā)生的信息量大小,再通過疊加各因子分級(jí)下的信息量值,完成滑坡易發(fā)性分區(qū)[13-14],其原理公式如下:
(1)
式中,I(y,x1,x2,…,xn)為因子組合x1,x2,…,xn對(duì)滑坡災(zāi)害提供的信息量;P(y,x1,x2,…,xn)為因子組合x1,x2,…,xn條件下滑坡災(zāi)害發(fā)生的概率;P(y)為滑坡災(zāi)害發(fā)生概率。
在實(shí)際運(yùn)用過程中,一般采用以下模型計(jì)算:
(1)首先,計(jì)算單因子x對(duì)滑坡災(zāi)害(D)發(fā)生提供的信息量I(xi,D):
(2)
(2)計(jì)算單個(gè)評(píng)價(jià)單元中總的信息量值:
(3)
式中,Ni為某一因子分級(jí)xi中發(fā)生滑坡的個(gè)數(shù);Si為xi的柵格總數(shù);N為研究區(qū)內(nèi)滑坡總數(shù);S為研究區(qū)總柵格數(shù);I為評(píng)價(jià)單元總的信息量。
2.1.2 確定性系數(shù)
確定性系數(shù)(Certainty Factor,CF)是一個(gè)概率統(tǒng)計(jì)指標(biāo),此指標(biāo)通過已經(jīng)發(fā)生的滑坡災(zāi)害與確定影響災(zāi)害發(fā)生的若干因子之間的統(tǒng)計(jì)關(guān)系,來分析各影響因子敏感性[15]。其表達(dá)式如下:
(4)
式中,PPa為滑坡災(zāi)害在某一影響因子分級(jí)a中發(fā)生的概率,即是分級(jí)a中滑坡災(zāi)害數(shù)量(或面積)與分級(jí)單元數(shù)量(或面積)的比值;PPs為滑坡災(zāi)害在整個(gè)研究區(qū)發(fā)生的概率,是整個(gè)研究區(qū)滑坡災(zāi)害數(shù)量(或面積)與研究區(qū)單元數(shù)量(或面積)的比值。CF取值范圍在[-1,1],其值越大,表示發(fā)生滑坡災(zāi)害的概率越大。
2.1.3 精度驗(yàn)證
利用測(cè)試數(shù)據(jù)集,采用統(tǒng)計(jì)方法和受試者工作特征(Receiver Operating Characteristic,ROC)曲線對(duì)滑坡模型的性能進(jìn)行評(píng)價(jià)。使用的統(tǒng)計(jì)方法是精確率(precision)、召回率(recall)、準(zhǔn)確率(accuracy)和ROC曲線[16]。
(5)
(6)
(7)
式中, FP為誤分類滑坡的數(shù)量樣本;FN為誤分類的非滑坡樣本數(shù)量;TP為正確分類的滑坡樣本數(shù)量;TN為正確分類的非滑坡樣本數(shù)量。如表1所示。
表1 混淆矩陣
首先,需要選取規(guī)則的評(píng)價(jià)單元,所用數(shù)字高程模型分辨率為10 m,因此,將單元格劃分為10 m×10 m大小,通過ArcGIS重采樣功能將各個(gè)因子圖層轉(zhuǎn)化為10 m×10 m大小的柵格,同時(shí),所有因子圖層采用統(tǒng)一坐標(biāo)系(CGCS2000)。
評(píng)價(jià)因子的選取數(shù)量對(duì)于評(píng)價(jià)分析也尤為關(guān)鍵,在結(jié)合滑坡影響因素以及資料收集的前提下,主要考慮了地理環(huán)境因子、地質(zhì)環(huán)境因子、人類活動(dòng)因子三個(gè)方面。選取坡度、坡向、高程、歸一化植被指數(shù)、距河流距離為地理環(huán)境因子;選取距斷層距離、地層巖性為地質(zhì)環(huán)境因子;選取距道路距離為人類活動(dòng)因子。
將坡向按照方向進(jìn)行分級(jí)。將高程、坡度、歸一化植被指數(shù)按照自然間斷法進(jìn)行分級(jí)。自然間斷法是一種依據(jù)數(shù)值統(tǒng)計(jì)分布規(guī)律分級(jí)和分類的統(tǒng)計(jì)方法,它能使類與類之間的不同最大化。將距道路、河流距離以500 m為步長進(jìn)行分級(jí),距斷層距離以800 m為步長進(jìn)行分級(jí)。針對(duì)巖土體的整體性及復(fù)雜性,將巖組劃分為5類,分別為碎屑巖軟質(zhì)~半堅(jiān)硬,碳酸鹽巖硬質(zhì)巖組,玄武巖堅(jiān)硬巖組,砂、泥巖軟質(zhì)~半堅(jiān)硬,第四系松散碎石、粘土。
2.2.1 地理環(huán)境因子
(1)高程
滑坡災(zāi)害的發(fā)生受海拔高度的影響,不同的海拔范圍影響強(qiáng)度也不同。研究區(qū)最高4 067 m,最低277 m,高差較大,不同高程對(duì)該區(qū)域的滑坡災(zāi)害發(fā)生影響程度也不同,采用ArcGIS自然間斷法進(jìn)行分級(jí),如圖2(a)所示。
(2)坡度
不同坡度對(duì)滑坡災(zāi)害發(fā)生的影響也具有差異,通過DEM數(shù)據(jù),利用ArcGIS空間分析功能,采用自然間斷法分為5類,如圖2(b)所示。
(3)坡向
不同坡向的光照強(qiáng)度影響著植被覆蓋、斜坡體穩(wěn)定性等。研究區(qū)坡向?yàn)?1°~360°。根據(jù)其方向分為10類,如圖2(c)所示。
(4)歸一化植被指數(shù)
歸一化植被指數(shù)是植被覆蓋密度的評(píng)價(jià)指標(biāo),植被覆蓋好的區(qū)域不利于災(zāi)害的發(fā)生。采用自然間斷法將其分為5級(jí),如圖2(d)所示。
(5)距河流距離
距河流的遠(yuǎn)近影響著斜坡的穩(wěn)定性,距離越近其影響越大。研究區(qū)均屬長江上游金沙江水系,區(qū)內(nèi)金沙江由南西向北東向穿過,采用ArcGIS歐氏距離以500 m為間隔進(jìn)行分級(jí),如圖2(e)所示。
2.2.2 地質(zhì)環(huán)境因子
(1)距斷層距離
斷裂構(gòu)造嚴(yán)重影響著滑坡災(zāi)害的發(fā)生,研究區(qū)不同方向構(gòu)造帶較為發(fā)育。利用ArcGIS歐氏距離分析,以800 m為間隔進(jìn)行分級(jí),如圖2(f)所示。
(2)地層巖性
不同的地層巖性影響著斜坡巖層的穩(wěn)定性,巖性越脆弱,其發(fā)生滑坡災(zāi)害的概率就越大,根據(jù)研究區(qū)地質(zhì)資料,將巖性大致分為5類,如圖2(g)所示。
2.2.3 人類活動(dòng)因子
人類活動(dòng)也是滑坡災(zāi)害發(fā)生的重要因素,距離道路的遠(yuǎn)近差異也會(huì)受到不同程度的影響。利用ArcGIS歐氏距離分析,以500 m為間隔進(jìn)行分級(jí),如圖2(h)所示。
圖2 滑坡易發(fā)性評(píng)價(jià)因子分級(jí)
根據(jù)統(tǒng)計(jì)各影響因子的不同分級(jí),計(jì)算兩種評(píng)價(jià)模型各影響因子不同分級(jí)下的信息量值和CF值,兩種評(píng)價(jià)模型易發(fā)性分區(qū)結(jié)果如圖3所示。通過對(duì)各因子圖層進(jìn)行疊加分析,得出研究區(qū)信息量值的范圍為[-7,3],信息量值越大表明該區(qū)域發(fā)生滑坡災(zāi)害的可能性也越大;對(duì)疊加得到的確定性系數(shù)值進(jìn)行歸一化處理,利用ArcGIS對(duì)總信息量值、確定性系數(shù)值進(jìn)行重分類,采取自然間斷法將研究區(qū)分為低、較低、中、較高、高易發(fā)區(qū)。
圖3 滑坡易發(fā)性分區(qū)圖
如表2所示,滑坡災(zāi)害主要集中在高程較低的區(qū)域,當(dāng)高程大于1 800 m時(shí)滑坡比例僅占7%,而且信息量值與CF值均表現(xiàn)為負(fù),說明大于1 800 m時(shí)滑坡易發(fā)性較??;坡向因子,除了在北方向上滑坡比例不超過5%,其他方向分布上較均勻,在10%~17%范圍內(nèi),信息量值與CF值在東、南、西南、西方向上表現(xiàn)為正值;對(duì)于坡度因子,滑坡災(zāi)害點(diǎn)接近80%分布在36°以下,結(jié)合信息量值與CF值均表現(xiàn)為正值,可以看出坡度在36°以下更有利于滑坡災(zāi)害的發(fā)生;在植被覆蓋度方面,結(jié)合信息量值與CF值,呈現(xiàn)負(fù)相關(guān)關(guān)系,表明植被覆蓋越大越不利于滑坡災(zāi)害的發(fā)生;河流、斷層、道路對(duì)于滑坡災(zāi)害的影響,表現(xiàn)為在一定距離范圍內(nèi),距河流、斷層、道路距離越近,其滑坡比例越大,表明其發(fā)生滑坡災(zāi)害的概率越大;在地層巖性方面,地層碎屑巖軟質(zhì)滑坡比例占60.47%,砂、泥巖軟質(zhì)滑坡比例占11.63%,有利于滑坡的發(fā)生,第四系松散碎石、粘土信息量值(1.108 512)、CF值(0.67)較大,也表明對(duì)滑坡發(fā)生影響程度較大,因?yàn)檫@幾種地層巖性比較脆弱,容易發(fā)生地質(zhì)災(zāi)害,這也與實(shí)際情況相符。
表2 滑坡易發(fā)性評(píng)價(jià)結(jié)果統(tǒng)計(jì)
通過選取滑坡點(diǎn)30%作為驗(yàn)證樣本,并在已有滑坡點(diǎn)1 km內(nèi)建立緩沖區(qū),然后,在緩沖區(qū)外隨機(jī)選取出相同數(shù)量的非滑坡點(diǎn),將兩者組成之后作為正負(fù)類樣本,再利用ROC曲線分析兩種模型對(duì)滑坡易發(fā)性評(píng)價(jià)的預(yù)測(cè)率。
如表3所示,信息量模型精確率(0.88)較高,但召回率(0.72)較低,確定性系數(shù)模型精確率0.81,召回率0.84,確定性系數(shù)模型準(zhǔn)確預(yù)測(cè)的滑坡數(shù)量比例高于信息量模型。為了更好的評(píng)價(jià)模型的預(yù)測(cè)能力, 采用ROC曲線及曲線下面積(Area Under Curve,AUC)值對(duì)模型進(jìn)行精度分析。ROC曲線以敏感性和特異性為垂直軸和水平軸,AUC值的大小用來評(píng)價(jià)模型的預(yù)測(cè)能力,值越接近1則表示模型預(yù)測(cè)能力越好,反之越差。
表3 不同模型的預(yù)測(cè)精度對(duì)比
如圖4所示,信息量和確定性系數(shù)模型的AUC值分別是0.829 9、0.893 5,確定性系數(shù)模型AUC值大于信息量模型,說明確定性系數(shù)模型整體上預(yù)測(cè)效果更好。
圖4 不同模型預(yù)測(cè)結(jié)果的ROC曲線
在面積分布上,如圖5所示,兩種模型均表現(xiàn)為以低、較低、中易發(fā)區(qū)為主,但在較高、高易發(fā)區(qū)分布面積上有一定差異,信息量模型分布面積占比41.85%,確定性系數(shù)模型分布面積占比27.42%;在滑坡數(shù)量上,信息量模型有81%的滑坡點(diǎn)位于較高和高易發(fā)區(qū),而確定性系數(shù)模型有80%的滑坡點(diǎn)位于較高和高易發(fā)區(qū)。結(jié)合分區(qū)面積,前者較高、高易發(fā)區(qū)分布面積占比較大,而后者分布面積較小,分析可得出確定性系數(shù)模型在較高、高易發(fā)區(qū)的點(diǎn)密度相對(duì)較大,同時(shí),結(jié)合ROC曲線結(jié)果分析,表明確定性系數(shù)模型更加適合于該區(qū)域的滑坡易發(fā)性定量評(píng)估。
圖5 不同模型易發(fā)性評(píng)價(jià)結(jié)果統(tǒng)計(jì)
(1)以四川省雷波縣為研究對(duì)象,選取了高程、坡度、坡向、歸一化植被指數(shù)、距道路距離、距河流距離、距斷層距離、地層巖性作為滑坡易發(fā)性評(píng)價(jià)因子,采用了信息量模型、確定性系數(shù)模型進(jìn)行滑坡易發(fā)性評(píng)價(jià),得出了雷波縣滑坡易發(fā)性分區(qū)圖。
(2)兩種模型評(píng)價(jià)結(jié)果都顯示高、較高易發(fā)區(qū)集中分布在距離道路、河流、斷層較近和地層巖性脆弱的地區(qū)。信息量模型分區(qū)結(jié)果:低易發(fā)區(qū)10.34%、較低易發(fā)區(qū)30.2%、中易發(fā)區(qū)17.7%、較高易發(fā)區(qū)28.82%、高易發(fā)區(qū)13.03%;確定性系數(shù)模型分區(qū)結(jié)果:低易發(fā)區(qū)18.57%、較低易發(fā)區(qū)30.55%、中易發(fā)區(qū)23.46%、較高易發(fā)區(qū)16.49%、高易發(fā)區(qū)10.93%?;曼c(diǎn)數(shù)量上,信息量模型與確定性系數(shù)模型分別有81%、80%的滑坡點(diǎn)位于較高和高易發(fā)區(qū)?;乱装l(fā)性評(píng)價(jià)結(jié)果與野外災(zāi)害調(diào)查結(jié)果比較一致。
(3)通過分析ROC曲線結(jié)果信息量模型(AUC=0.829 9)、確定性系數(shù)模型(AUC=0.893 5),后者ROC精度更高,表明確定性系數(shù)模型在該區(qū)域滑坡易發(fā)性評(píng)價(jià)中評(píng)價(jià)結(jié)果與預(yù)測(cè)能力較好,更加符合該區(qū)域?qū)嶋H滑坡的分布情況,適合于該區(qū)域的滑坡易發(fā)性評(píng)價(jià)。結(jié)果表明,由ROC曲線與確定性系數(shù)相結(jié)合的滑坡易發(fā)性評(píng)價(jià)方法,具有一定的準(zhǔn)確性和可靠性,可以為滑坡災(zāi)害易發(fā)性評(píng)價(jià)提供依據(jù)。