張澤方
(貴州民族大學 建筑工程學院,貴州 貴陽 550025)
滑坡易發(fā)性評價指根據(jù)已經(jīng)發(fā)生的滑坡災害的特征,對可能發(fā)生滑坡災害的傾向性進行評價,確定成災概率的大小。早在20世紀70年代,國外學者就已經(jīng)開展滑坡易發(fā)性研究工作,Brabb等[1]主要考慮地質因素,制作了美國加州San Mateo地區(qū)的派生地圖,更加簡潔地表達了滑坡易發(fā)區(qū)信息。我國滑坡易發(fā)性研究起步較晚,1991年,狄君靖[2]對云南省地質災害控制因素進行了分析研究,并在此基礎上作了滑坡易發(fā)性分區(qū),為后續(xù)研究提供了數(shù)學模型參考。目前,國內外滑坡易發(fā)性評價模型主要包括概率統(tǒng)計模型、機器學習模型等,其中概率統(tǒng)計模型包括信息量模型[3]、確定性系數(shù)模型[4]、證據(jù)權模型[5]、二元邏輯回歸模型[6]等,機器學習模型包括神經(jīng)網(wǎng)絡模型[7]、隨機森林模型[8]、決策樹預測模型[9]、支持向量機模型[10]等。然而,對于單一模型,在環(huán)境因子的狀態(tài)分級與量化處理中存在主觀因素干擾的問題以及無法客觀確定不同環(huán)境因子權重的缺陷。因此,兩種甚至多種模型耦合的評價方法逐漸成為近年來探索的熱點。郭子正等[11]將WOE模型和BP神經(jīng)網(wǎng)絡模型結合用于三峽萬州區(qū)滑坡易發(fā)性評價,研究表明WOE-BP模型較兩種單一模型更為精確;張玘愷等[12]以九寨溝縣為研究區(qū),基于I、CF和LR模型,提出LR-I和LRCF耦合模型,顯著提高了評價精度;儀政等[13]通過信息量與多模型耦合的方法對三峽庫區(qū)秭歸縣侏羅系地層區(qū)進行滑坡易發(fā)性評價,結果表明耦合模型比單一信息量模型具有更高的預測精度;劉璐瑤等[14]將證據(jù)權與邏輯回歸模型結合用于浙江省永嘉縣滑坡易發(fā)性評價,此評價結果的合理性與精確度均優(yōu)于兩種單一模型。上述分析表明,滑坡易發(fā)性評價的模型豐富多樣,對不同區(qū)域而言不一定存在相同的最優(yōu)模型[15],耦合模型的精度總體上高于單一模型。因此,本文嘗試將最大熵模型(MaxEnt)與信息量模型(I)、確定性系數(shù)模型(CF)進行耦合,通過各模型對比研究,探討適用于望謨縣的滑坡易發(fā)性評價模型。
最大熵(MaxEnt)模型是由Phillips等[16]基于機器學習和數(shù)理統(tǒng)計方法開發(fā)的預測物種地理分布的生態(tài)位模型,當前已經(jīng)有學者在滑坡易發(fā)性評價中引入MaxEnt模型[17]。MaxEnt模型的特征函數(shù)f(a,b)可表示a,b的某種定性關系,當a,b符合特定條件時,特征函數(shù)賦值為1;不符合特定條件時,特征函數(shù)賦值為0[18]。給定一個約束條件,將訓練數(shù)據(jù)視為隨機變量(a,b)產(chǎn)生,令p(f)表示特征函數(shù)f(a,b)關于經(jīng)驗分布p(a,b)的期望,如下式:
若符合約束條件,則p(b|a)關于函數(shù)f的期望,與經(jīng)驗分布關于f(a,b)的期望相等:
再求解帶有約束條件的最優(yōu)化問題,根據(jù)歸一化指數(shù)exp(1-ω)[17],令Zω(a)表示exp(1-ω),得:
信息量模型是一種基于信息論的統(tǒng)計模型,它能將代表環(huán)境因素的數(shù)值轉化為反映滑坡易發(fā)性的信息量值,信息量值越大表示發(fā)生滑坡的可能性越大,信息量值越小表示發(fā)生滑坡的可能性越小,其計算公式如下:
I為單個柵格內的總信息量值,n為環(huán)境因子個數(shù),Ni為研究區(qū)某特定環(huán)境因子內滑坡災害分布面積;N為研究區(qū)內滑坡災害分布總面積;Si為研究區(qū)內某特定環(huán)境因子的面積;S為研究區(qū)總面積;N/S為研究區(qū)的滑坡災害分布密度,Ni/Si為滑坡災害在某圖層特定級別內的分布密度。
確定性系數(shù)模型是由Shortiffe等[19]提出的一種概率函數(shù)模型,目前已廣泛應用于滑坡災害易發(fā)性評價研究,CF值越大表示該環(huán)境下越易發(fā)生滑坡,反之則表示越不易發(fā)生滑坡,其計算公式如下:
式中CF為滑坡災害發(fā)生的確定性系數(shù);PPa為滑坡災害在環(huán)境因子分類a中發(fā)生的條件概率,可用環(huán)境因子分類a中的滑坡災害面積與分類面積的比值表示;PPs表示滑坡災害在整個研究區(qū)中發(fā)生的先驗概率,可用滑坡災害總面積與研究區(qū)總面積的比值表示,在研究區(qū)確定的情況下,PPs通常是一個定值。
信息量模型和確定性系數(shù)模型可以獲取到各環(huán)境因子的信息量值和確定性系數(shù)值,這些值雖然從不同角度反映了各環(huán)境因子對滑坡的影響程度,但是并未確定各環(huán)境因子的權重,而最大熵模型可以根據(jù)模型中各環(huán)境因子的貢獻率確定其權重,因此本文將最大熵模型和信息量模型、確定性系數(shù)模型耦合,從而對研究區(qū)進行更加準確的滑坡易發(fā)性評價。
研究區(qū)為望謨全縣,地理位置介于東經(jīng)105°49′~106°32′、北緯24°53′~25°38′之間,總面積約為3018km2,如圖1所示,研究區(qū)地形地貌、地質構造與滑坡災害點分布情況。望謨縣地處云貴高原向廣西丘陵過渡的斜坡地帶,平均海拔高度為868米,地勢北高南低,地貌形態(tài)以山地、丘陵為主,盆地較少。研究區(qū)內屬亞熱帶季風濕潤氣候,年均氣溫19.5℃,年均降雨量為1421.1mm;褶皺斷裂發(fā)育,新構造活動強烈,巖土體組合復雜多樣,東西部巖溶發(fā)育較為典型;地表水系發(fā)育,其中河流長度大于10km或流域面積大于20km2的河流共27條,屬山區(qū)雨源性河流,侵蝕作用較強烈。區(qū)內突發(fā)性地質災害類型有滑坡、崩塌、泥石流、地面塌陷等,其中滑坡最為突出,且造成的危害最大。
圖1 研究區(qū)地理位置及概況
研究數(shù)據(jù)包括滑坡數(shù)據(jù)和各環(huán)境因子數(shù)據(jù),其中滑坡數(shù)據(jù)、年平均降雨量數(shù)據(jù)來源于中國科學院資源環(huán)境科學與數(shù)據(jù)中心(https://www.resdc.cn);DEM數(shù)據(jù)和衛(wèi)星影像數(shù)據(jù)取自地理空間數(shù)據(jù)云(https://www.gscloud.cn),在DEM基礎上提取了高程、坡度和坡向,NDVI是通過ENVI5.3軟件對衛(wèi)星影像處理得到;地質數(shù)據(jù)取自國家地質資料數(shù)據(jù)中心(https://www.ngac.org.cn)1:250萬中國地質圖,包括巖性和斷層分布數(shù)據(jù),將巖性按照堅硬程度劃分為堅硬巖、較堅硬巖、較堅硬巖夾軟巖和軟巖,另外計算斷層的歐氏距離得到距斷層距離數(shù)據(jù);土地利用數(shù)據(jù)來源于GlobeLand30數(shù)據(jù)集(http://www.globallandcover.com);水系和道路分布數(shù)據(jù)取自全國地理信息資源目錄服務系統(tǒng)(https://www.webmap.cn),通過計算道路和水系的歐氏距離得到距道路距離和距水系道路數(shù)據(jù)。
望謨縣滑坡易發(fā)性評價技術路線如圖2所示。通過ArcGIS軟件的裁剪、投影和重采樣等功能模塊,將各環(huán)境因子的投影坐標統(tǒng)一為WGS_1984_UTM_48N,柵格大小設置為30m×30m;從滑坡數(shù)據(jù)庫中隨機選取2/3的樣本點作為訓練樣本,和環(huán)境因子共同參與各模型的訓練,剩余1/3的樣本點作為驗證樣本對各模型的精度進行檢驗。
圖2 技術路線
滑坡災害的發(fā)生受多種環(huán)境因素共同作用的影響,本文綜合地形地貌、基礎地質、水文氣象、工程活動等因素,選取高程、坡度、坡向、NDVI、地層巖性、距斷層距離、距水系距離、年平均降雨量、土地利用和距道路距離共10個環(huán)境因子作為評價指標,如圖3所示。
圖3 環(huán)境因子
對于離散型的環(huán)境因子,采用固有的自然分組進行分級,對于連續(xù)型的環(huán)境因子,采用等步長進行分級。在ArcGIS中使用多值提取至點工具將環(huán)境因子數(shù)值提取到滑坡訓練樣本上,再通過公式(4)和公式(5)求出各分級狀態(tài)下的信息量值和確定性系數(shù)值,如表1所示。
表1 各環(huán)境因子分級和結果值
為了保證各環(huán)境因子間的相互獨立性和評價結果的可靠性,運用GIS主成分分析功能,進行因子獨立性檢驗,各因子之間的相關系數(shù)矩陣見表2(X1~X10分別表示土地利用、高程、地層巖性、坡度、坡向、距斷層距離、距水系距離、距道路距離、NDVI、年平均降雨量)。根據(jù)金勇進[20]對相關性大小的劃分標準,當R小于0.3時,認為各因子之間不相關。如表2所示,各環(huán)境因子相關性均符合獨立性檢驗。
表2 環(huán)境因子間的相關系數(shù)矩陣
在GIS平臺分別將各環(huán)境因子的信息量值、CF值進行疊加,得到滑坡信息量值分布圖、滑坡CF值分布圖;將各環(huán)境因子圖層和滑坡訓練樣本導入到MaxEnt軟件中,得到基于MaxEnt模型的滑坡易發(fā)性概率分布圖;分別將各環(huán)境因子的信息量值、CF值和滑坡訓練樣本導入到MaxEnt軟件中,得到基于I-MaxEnt模型、CF-MaxEnt模型的滑坡易發(fā)性概率分布圖;然后將上述分布圖根據(jù)自然斷點法劃分為5個易發(fā)區(qū):高易發(fā)區(qū)、中高易發(fā)區(qū)、中易發(fā)區(qū)、中低易發(fā)區(qū)、低易發(fā)區(qū),最終得到各模型滑坡易發(fā)性區(qū)劃,如圖4所示。
圖4 各模型ROC曲線
頻率比即滑坡比與分級比的比值,用以輔助判斷分類級別內滑坡易發(fā)性程度。頻率比越大,易發(fā)性程度越高,反之則越低。將易發(fā)性區(qū)劃圖和滑坡驗證樣本進行疊加分析,具體結果如表3所示。I模型在高易發(fā)區(qū)、中高易發(fā)區(qū)中分級比共占15.86%,滑坡比共占52.39%,CF模型在高易發(fā)區(qū)、中高易發(fā)區(qū)中分級比共占16.05%,滑坡比共占51.39%,MaxEnt模型在高易發(fā)區(qū)、中高易發(fā)區(qū)中分級比共占22.93%,滑坡比共占46.84%,I-MaxEnt模型在高易發(fā)區(qū)、中高易發(fā)區(qū)中分級比共占19.43%,滑坡比共占73.59%,CF-MaxEnt模型在高易發(fā)區(qū)、中高易發(fā)區(qū)中分級比共占18.66%,滑坡比共占73.26%。5種模型的頻率比值從低易發(fā)區(qū)到高易發(fā)區(qū)均在增大,說明各模型的評價結果與實際相符;其中耦合模型在高易發(fā)區(qū)的頻率比顯著大于單一模型對應的頻率比,即耦合模型在高易發(fā)區(qū)中包含了更多的滑坡信息,因而能更加有效地評價望謨縣的滑坡易發(fā)性。
表3 各模型不同易發(fā)區(qū)比值
目前認可度較高的模型評價指標為受試者工作特征(ROC)曲線,其縱軸為真陽性率(靈敏度),即實際上是滑坡災害且模型判斷為滑坡災害的概率;其橫軸為假陽性率(特異度),即實際上非滑坡災害且模型判斷為非滑坡災害的概率。ROC曲線下面積為AUC值,AUC值介于0~1范圍,其越接近1,模型預測效果越好,在0.5~0.6、0.6~0.7、0.7~0.8、0.8~0.9、0.9~1.0時分別表示預測效果失敗、較差、一般、好、特別好。由圖5可知,MaxEnt、I、CF、IMaxEnt和CF-MaxEnt的AUC評價精度分別為0.750、0.766、0.762、0.859和0.861,其中I-MaxEnt和CF-MaxEnt耦合模型精度優(yōu)于單一的I、CF、MaxEnt模型精度,且預測效果達到“好”的水平,這表明MaxEnt與多模型耦合的方法適用于望謨縣的滑坡易發(fā)性評價研究。
本文以望謨縣為研究區(qū),選取了高程、坡度、坡向、NDVI、地層巖性、距斷層距離、距水系距離、年平均降雨量、土地利用和距道路距離共10個環(huán)境因子,分別采用信息量模型(I)、確定性系數(shù)模型(CF)、最大熵模型(MaxEnt)以及耦合模型建立相應的滑坡易發(fā)性區(qū)劃。
通過受試者工作特征(ROC)曲線檢驗各模型精度,MaxEnt、I、CF、I-MaxEnt和CF-MaxEnt的AUC評 價 精 度 分 別 為0.750、0.766、0.762、0.859和0.861,耦合模型的預測精度明顯優(yōu)于單一模型,其中確定性系數(shù)-最大熵耦合模型(CF-MaxEnt)預測效果相對較好。
本文考慮的環(huán)境因子未必全部表達望謨縣的環(huán)境特征,添加更多環(huán)境因子參與模型構建可能會提高評價的精度,另外,本文提出的易發(fā)性評價模型也許并非最佳,需要再增加其他評價模型進行對比分析,這些將在后續(xù)研究中做進一步探討。