張志沛,魏在豪
(西安科技大學(xué)地質(zhì)與環(huán)境學(xué)院,西安 710054)
滑坡作為中國最常見的地質(zhì)災(zāi)害之一,會造成大量的人員傷亡、財產(chǎn)損失以及生態(tài)環(huán)境的破壞。據(jù)不完全統(tǒng)計,21世紀初至今,中國因滑坡災(zāi)害而造成的人員傷亡數(shù)多達1 200人,可以預(yù)估的經(jīng)濟損失高達50億~100億美元。
灞橋區(qū)是西安市受滑坡災(zāi)害影響最為嚴重的區(qū)域之一。一直以來,滑坡災(zāi)害對當?shù)鼐用竦纳踩斐蓸O大威脅,并且嚴重制約著當?shù)亟?jīng)濟的發(fā)展。對該區(qū)域滑坡災(zāi)害易發(fā)性做出科學(xué)的評價,能夠為當?shù)赜嘘P(guān)部門采取防災(zāi)減災(zāi)、工程部署以及土地利用規(guī)劃提供科學(xué)依據(jù)。
中外許多學(xué)者對滑坡災(zāi)害易發(fā)性評價進行了研究,提出了多種評價方法,這些方法總體上可以歸納為三大類:知識驅(qū)動方法(又稱定性方法)、數(shù)據(jù)驅(qū)動方法以及確定性方法[1]。知識驅(qū)動方法主要根據(jù)歷史滑坡的屬性特征,借助專家先驗知識對滑坡各影響因子的貢獻率(即權(quán)重)做出判斷,然后將不同貢獻率的各因子進行加權(quán)疊加生成最終的滑坡災(zāi)害易發(fā)性區(qū)劃圖。數(shù)據(jù)驅(qū)動方法是以概率論與統(tǒng)計分析為基礎(chǔ)的一種定量方法。該方法通過對已發(fā)生的滑坡災(zāi)害在各評價因子中出現(xiàn)的概率來分析各因子的權(quán)重,進而判斷該事件在研究區(qū)內(nèi)分布的概率情況。常見的評價方法有二元或多元統(tǒng)計分析法[2]、邏輯回歸法[3]、頻率比法[4]、證據(jù)權(quán)法[5]、信息量法[6]、綜合貢獻率法[7]、支持向量機模型[8]、隨機森林模型[9]等。確定性方法主要根據(jù)斜坡的幾何特征、物理力學(xué)參數(shù)以及地下水文性質(zhì)等有關(guān)數(shù)據(jù),建立評價模型來分析斜坡的穩(wěn)定性[10],該方法要求具體的力學(xué)參數(shù),因此對區(qū)域尺度的滑坡災(zāi)害評價并不合適。
盡管上述各評價模型被用于滑坡災(zāi)害預(yù)測研究中,但也存在兩方面不足:一方面,在采用單一模型對滑坡災(zāi)害進行評價時,在確定各評價因子的權(quán)重時,多數(shù)考慮的是各評價因子一級指標權(quán)重或者各因子分級狀態(tài)下的二級指標權(quán)重,并未考慮各因子分級狀態(tài)下真實的綜合權(quán)重,因此在進行各因子疊加時,導(dǎo)致評價結(jié)果的不準確。阮沈勇等[11]利用信息量模型對滑坡進行預(yù)測時,在確定評價因子權(quán)重方面,僅考慮了各因子二級指標的相對權(quán)重,而未考慮其真實的綜合權(quán)重。另一方面,在采用多種模型進行評價時,往往只是孤立的將各模型分別用于滑坡易發(fā)性評價中,然后對各模型進行檢驗與對比,并未考慮各模型之間的獨立性,造成模型選取的隨意性。Wang等[12]分別采用確定性系數(shù)模型與熵指數(shù)模型對中國寶雞千陽縣滑坡災(zāi)害進行預(yù)測,并對兩種模型的性能進行了檢驗與對比,但未對模型間的獨立性進行檢驗。
為此,采用加權(quán)信息量模型評價,加權(quán)信息量模型是一種將熵指數(shù)模型與信息量模型相結(jié)合的耦合模型,該模型考慮將評價因子的一級指標權(quán)重與二級指標權(quán)重相乘得到其綜合權(quán)重,能更加客觀的反映各影響因子不同分級指標的真實權(quán)重,得出的評價結(jié)果也更加科學(xué)合理?;诖?,對模型間的相關(guān)性進行檢驗,其檢驗結(jié)果可以為評價模型選取提供一定的理論依據(jù)。
灞橋區(qū)位于西安市東部,地理位置為東經(jīng)108°59′~109°16′,北緯34°10′~34°27′。全區(qū)總面積為324 km2,南北長約30.8 km,東西寬約26.5 km。屬暖溫帶半濕潤大陸性季風(fēng)氣候,四季分明,冷、暖、干、濕變化明顯。年平均氣溫為11.2~13.6 ℃,極端最高氣溫為41.8 ℃,最低氣溫為-20.5 ℃。多年平均降水量為630.78 mm。境內(nèi)河流主要為渭河及其支流浐河、灞河。地勢上呈現(xiàn)由東南向西北逐漸降低趨勢,地貌類型主要為河谷階地、黃土臺塬、低山丘陵。區(qū)內(nèi)主要地層巖性為沉積巖與巖漿巖,沿東西、北東、北西向斷裂構(gòu)造較為發(fā)育,褶皺不甚發(fā)育。區(qū)內(nèi)滑坡災(zāi)害點共計95處,其中土質(zhì)滑坡為80處,巖質(zhì)滑坡15處。區(qū)內(nèi)較為典型的滑坡為席王街道辦事處東蔣村滑坡如圖1所示。研究區(qū)地理位置以及區(qū)內(nèi)滑坡分布如圖2所示。
圖1 東蔣村滑坡Fig.1 Dongjiang village landslide
圖2 研究區(qū)地理位置及滑坡點分布Fig.2 Geographical location and landslide points distribution of the study area
熵指數(shù)模型(index of entropy,IOE)是以概率論以及數(shù)理統(tǒng)計分析為基礎(chǔ)的一種分類預(yù)測模型。該模型可以通過各輸入變量的屬性值確定其在事件發(fā)生中所占的權(quán)重,每個輸入變量的權(quán)重用熵指數(shù)表示。該模型用在滑坡災(zāi)害易發(fā)性評價中,既可以表示區(qū)域環(huán)境的無序程度,也可以表示各評價因素與滑坡發(fā)生的密切程度。熵指數(shù)越大表示在滑坡發(fā)生中所占的權(quán)重越大,反之亦然。其計算表達式如式(1)所示:
(1)
(2)
(3)
Himax=log2s
(4)
(5)
(6)
Wi=IiPi
(7)
式中:i為評價因子;j為各因子分級;b為評價因子各分級內(nèi)滑坡數(shù)與總滑坡數(shù)的比值;a為對應(yīng)評價因子分級面積與區(qū)域總面積的比值;Pij為評價因子各分級的相對密度;(Pij)為各因子分級的概率密度;Hi為熵值、Himax為最大熵值;s為因子分級數(shù);Ii為評價因子信息率;Wi為評價因子權(quán)重,即熵指數(shù);Pi為滑坡失效概率。
信息量模型最先被用在地質(zhì)找礦等領(lǐng)域,后來被許多學(xué)者用來做滑坡災(zāi)害評價預(yù)測研究。信息量模型基本思想是:根據(jù)滑坡災(zāi)害發(fā)生區(qū)的現(xiàn)實情況與所提供的信息,將影響區(qū)域斜坡穩(wěn)定性的影響因素轉(zhuǎn)化為反映區(qū)域斜坡穩(wěn)定性的信息量值。其方法即是通過計算某些影響因素對研究區(qū)滑坡災(zāi)害發(fā)生所提供的信息量值(相對權(quán)重)大小來衡量評價影響因素與滑坡災(zāi)害發(fā)生的密切程度。信息量用條件概率計算,但實際滑坡樣本數(shù)據(jù)有限,因此一般用滑坡樣本數(shù)據(jù)統(tǒng)計頻率來近似代替條件概率。即:
(8)
式(8)中:I(XI,A)為評價因子指標XI提供斜坡失穩(wěn)的信息量值;S為研究區(qū)總面積;N為研究區(qū)已發(fā)生滑坡的總數(shù);SI為XI所占面積;NI為指標XI內(nèi)發(fā)生滑坡的個數(shù)。
一般來說,滑坡災(zāi)害的發(fā)生受多種影響因素的共同作用,對同一研究區(qū)內(nèi)各影響因子的信息量值進行求和,即可得到該研究區(qū)總的信息量值Ii;Ii為研究區(qū)滑坡災(zāi)害易發(fā)性指數(shù)。
(9)
式(9)中:p為研究區(qū)選取的評價因子總數(shù)。
所用數(shù)據(jù)主要包括滑坡編錄數(shù)據(jù)庫、灞橋區(qū)地質(zhì)災(zāi)害詳查報告、分辨率為30 m×30 m的高程數(shù)字模型影像圖(DEM)、比例尺為1∶50 000的地質(zhì)圖、降雨量數(shù)據(jù)、Landsat7 ETM遙感影像圖、路網(wǎng)圖和水系圖等。其中,滑坡編錄數(shù)據(jù)主要來源有:①陜西省國土資源部提供的歷史滑坡記錄;②陜西省氣象局提供的滑坡點數(shù)據(jù);③野外區(qū)域調(diào)查以及借助遙感影像解譯作為滑坡災(zāi)害點補充數(shù)據(jù);④DEM以及遙感影像圖主要通過地理空間數(shù)據(jù)云網(wǎng)站ASTER GDEM數(shù)據(jù)下載獲??;⑤地質(zhì)圖、路網(wǎng)圖以及水系圖通過91衛(wèi)圖下載獲?。虎藿涤炅繑?shù)據(jù)通過西安市氣象局降雨量站點獲取。
研究區(qū)共有95處滑坡災(zāi)害點,將這些滑坡點按70/30比例隨機分為兩部分,取其中一部分(67處)災(zāi)害點作為訓(xùn)練數(shù)據(jù)集,用于模型的建立;剩余部分(28處)災(zāi)害點作為驗證數(shù)據(jù)集,用來對評價模型進行驗證。
評價因子的選取是進行滑坡災(zāi)害易發(fā)性評價的必要步驟。大量相關(guān)文獻表明坡度、坡向、地層巖性因子被廣泛地用于滑坡災(zāi)害易發(fā)性評價中,而其他相關(guān)因子的選取取決于滑坡的類型、研究區(qū)地質(zhì)環(huán)境條件以及所采用的模型[13]。
評價因子的選取數(shù)量也是滑坡災(zāi)害易發(fā)性評價中的關(guān)鍵點。評價因子選取數(shù)量太少,會使得評價模型出現(xiàn)欠擬合,降低預(yù)測結(jié)果精度;評價因子選取數(shù)量太多,則會使模型變復(fù)雜,運行速率下降,得到的模型預(yù)測出現(xiàn)過擬合,同樣影響評價結(jié)果的準確性。
結(jié)合大量相關(guān)文獻、滑坡編錄數(shù)據(jù)庫中滑坡自身特征以及研究區(qū)地質(zhì)環(huán)境條件、滑坡形成條件,選取12類評價因子,分別為坡度、坡向、高程、曲率、地形起伏度、地層巖性、地貌類型、斷層距離、水系距離、降雨量、道路距離、歸一化植被指數(shù)(normalized difference vegetation index,NDVI)。
圖3 評價因子圖層Fig.3 Evaluation factors layer
采用ArcGIS軟件提取各評價因子圖層,各圖層如圖3所示。其中坡度、坡向、高程、曲率、地形起伏度通過ArcGIS軟件表面處理工具以及柵格計算器工具對DEM進行處理得到;地層巖性、地貌類型通過對地質(zhì)圖進行矢量化后轉(zhuǎn)為柵格,然后對柵格進行重分類獲得;斷層距離、水系距離、道路距離通過對各自底圖進行矢量化后,利用歐式距離工具得到;降雨量圖層通過克里金插值法或者反距離權(quán)重法對站點數(shù)據(jù)插值獲??;NDVI通過對遙感影像進行輻射定標、大氣校準等預(yù)處理,然后采用式(10)得到:
(10)
式(10)中:IR為近紅外波段;R為紅外波段。
參照前人研究以及綜合考慮研究區(qū)自身特征,將坡度、坡向、高程、降雨量、斷層距離、水系距離、道路距離因子按照相等間隔法進行分級;將曲率按凹型坡、凸型坡、直線型坡分為三類;地層巖性與地貌單元按不同類型進行分級,其中地層巖性分類編號如下:1(全新統(tǒng):以砂礫卵石為主)、2(全新統(tǒng):以黏性土及砂、砂礫石層為主)、3(全新統(tǒng):以礫卵石為主)、4(全新統(tǒng):以砂礫漂石及黏性土為主)、5(全新統(tǒng))、6(上更新統(tǒng))、7(中更新統(tǒng))、8(下更新統(tǒng))、9(新近系)、10(古近系)、11(太古系)、12(燕山期花崗巖);其余評價因子以自然間斷點法進行分級,得到各評價因子分級如表1所示。
在進行區(qū)域滑坡災(zāi)害易發(fā)性評價前,需要對整個研究區(qū)進行單元劃分,評價單元劃分的方式以及單元格的大小都會影響評價結(jié)果的精度??紤]到柵格單元劃分的簡單易疊加性優(yōu)點,采用柵格單元對整個研究區(qū)進行剖分。采用DEM試驗進行回歸分析而得到的經(jīng)驗公式[14]:
Gs=7.49+0.000 6S-2.0×10-9S2+
2.9×10-15C3
(11)
式(11)中:C為地形圖比例尺,將研究區(qū)劃分為30 m×30 m大小的柵格單元,共計390 277個。
采用熵指數(shù)模型公式求得的各評價因子一級指標相對權(quán)重Wi如表1所示。由表1可知,坡度、高程、降雨量、地貌類型是影響該區(qū)滑坡災(zāi)害發(fā)生的主要因素,熵指數(shù)分別為1.39、1.26、0.79、0.76。研究區(qū)滑坡災(zāi)害易發(fā)性指數(shù)LSI按式(12)計算:
LSIIOE=(坡度×1.39)+(坡向×0.11)+(高程×1.26)+(曲率×0.05)+(地形起伏度×0.51)+(地層巖性×0.70)+(地貌類型×0.76)+(斷層距離×0.02)+(水系距離×0.22)+(降雨量×0.79)+(NDVI×0.12)+
(道路距離×0.12)
(12)
IOE模型計算得到的研究區(qū)LSI取值為9.07~32.85。采用自然間斷點法將LSI分為五個滑坡災(zāi)害易發(fā)性等級,分別為極低、低、中、高、極高易發(fā)等級,生成最終的易發(fā)性等級區(qū)劃,如圖4所示。
圖4 基于IOE模型的滑坡易發(fā)性區(qū)劃Fig.4 Landslide susceptibility based on IOE model
采用信息量模型公式得到各評價因子分級狀態(tài)下的二級指標信息量值IVij如表1所示。由表1可知,坡度為30°~40°,高程為900~1 100 m,降雨量為700~745 mm的黃土臺塬區(qū),對應(yīng)分級內(nèi)的信息量值最大,表明此條件下最易誘發(fā)滑坡的發(fā)生。
對研究區(qū)同一評價單元的各評價因子分級的信息量值進行疊加,得到整個研究區(qū)總信息量值,即滑坡災(zāi)害易發(fā)性指數(shù)LSI,其取值為-6.36~8.25。同樣采用自然間斷點法將LSI分為五個滑坡易發(fā)性等級,分別為極低、低、中、高、極高易發(fā)等級,生成最終的易發(fā)性等級區(qū)劃圖,如圖5所示。
圖5 基于IV模型的滑坡易發(fā)性區(qū)劃Fig.5 Landslide susceptibility based on IV model
將IOE模型求得的評價因子一級指標相對權(quán)重與對應(yīng)評價因子各分級的二級指標相對權(quán)重(信息量)相乘,構(gòu)建加權(quán)信息量模型,求得的各評價因子分級狀態(tài)下加權(quán)信息量值如表1所示。研究區(qū)各評價單元的易發(fā)性指數(shù)用式(13)計算:
表1 不同模型下滑坡災(zāi)害點與影響因子間的空間關(guān)系Table 1 Spatial relationship between each landslide conditioning factor and landslide by different model
續(xù)表
(13)
式(13)中:F為評價因子數(shù)。
通過式(13)求得的LSI為-3.10~5.90。采用自然間斷點法對LSI進行等級劃分,分為極低、低、中、高、極高易發(fā)五個等級,生成最終的易發(fā)性等級區(qū)劃圖,如圖6所示。
圖6 基于WIV模型的滑坡易發(fā)性區(qū)劃Fig.6 Landslide susceptibility based on WIV model
圖7 成功率曲線Fig.7 The success rate curve
利用訓(xùn)練數(shù)據(jù)集以及驗證數(shù)據(jù)集對三種不同模型生成的滑坡災(zāi)害易發(fā)性區(qū)劃圖分別進行測試,各模型生成的易發(fā)性區(qū)劃圖的空間預(yù)測能力通過AUC大小進行衡量。AUC越高,代表模型的預(yù)測能力越好。通過將整個研究區(qū)各評價單元的易發(fā)性指數(shù)LSI按遞減順序排列,然后將其按10%的累積間隔分為10個等級,得到累積面積百分比,并將其作為x軸。將LSI對應(yīng)范圍的滑坡數(shù)量累積百分比作為y軸,得到滑坡災(zāi)害易發(fā)性區(qū)劃圖的成功曲線與預(yù)測率曲線。其中,通過比較訓(xùn)練數(shù)據(jù)集與易發(fā)性區(qū)劃圖得到的成功率曲線,如圖7所示。由圖7可知,IOE、信息量模型(IV)、加權(quán)信息量模型(WIV)三種模型的AUC分別為0.76、0.84、0.88,模型的訓(xùn)練精度分別76%、84%、88%;通過比較驗證數(shù)據(jù)集與易發(fā)性區(qū)劃圖得到的預(yù)測率曲線,如圖8所示。圖8可知,IOE、IV、WIV三種模型的AUC值分別為0.72、0.86、0.90,模型的預(yù)測能力分別72%、86%、90%。從AUC評價結(jié)果看出,三種模型成功率曲線與預(yù)測率曲線差異較大,其中WIV模型生成的易發(fā)性區(qū)劃圖的空間預(yù)測能力最好,表明該模型更適用此研究區(qū)滑坡災(zāi)害易發(fā)性評價研究。
圖8 預(yù)測率曲線Fig.8 The prediction rate curve
采用皮爾森相關(guān)分析法對三種不同的評價模型進行獨立性檢驗。首先提取不同模型下整個研究區(qū)評價單元的滑坡易發(fā)性指數(shù)LSI,然后將三組不同的LSI代入SPSS軟件進行相關(guān)性分析,得到各模型的相關(guān)性系數(shù)如表2所示。
表2 不同評價模型的相關(guān)性系數(shù)Table 2 Correlation coefficients of different evaluation models
從表2數(shù)據(jù)可知,IOE模型與IV模型、WIV模型間的相關(guān)性系數(shù)為0.3~0.5,呈低度相關(guān);IV模型與WIV模型間的相關(guān)性系數(shù)為5~0.8,呈顯著相關(guān)。
以灞橋區(qū)為研究區(qū),采用加權(quán)信息量模型開展區(qū)內(nèi)滑坡易發(fā)性評價研究,取得了以下的結(jié)論。
(1)通過IOE模型得到各評價因子的相對權(quán)重,其中坡度、高程、降雨量、地貌類型是滑坡發(fā)生的主要影響因素,其相對權(quán)重分別為1.39、1.26、0.79、0.76。
(2)IOE、IV、WIV三種模型的訓(xùn)練精度分別76%、84%、88%;預(yù)測能力分別72%、86%、90%。其中WIV模型生成的易發(fā)性區(qū)劃圖的空間預(yù)測能力最好,表明該模型更適用此研究區(qū)滑坡災(zāi)害易發(fā)性評價研究。
(3)采用皮爾森相關(guān)分析法對三種不同的評價模型進行獨立性檢驗。檢驗結(jié)果表明IOE模型與IV模型、WIV模型呈低度相關(guān);IV模型與WIV模型呈顯著相關(guān)。