趙 錚, 陳建華, 甘先霞, 謝華偉
(成都理工大學 地球物理學院,成都 610059)
滑坡是造成我國經(jīng)濟損失,人員傷亡最嚴重的地質(zhì)災害之一,因此有效開展滑坡危險性評價工作對于防災減災具有重要的意義[1]。
滑坡危險性是指滑坡在特定時間內(nèi)發(fā)生的概率,其危險性表現(xiàn)有特定空間位置和規(guī)模強度信息[2]?;挛kU性評價方法通常分為定性評價和定量評價。常見的定量評價方法有信息量法[3]、隨機森林[4]、神經(jīng)網(wǎng)絡[5]等。而定性方法是基于知識驅(qū)動,主要包括專家打分法、層次分析法[4]、加權線性組合法等,但上述方法受人為因素的影響較大。近年來,統(tǒng)計學習方法被認為更適合于大、中、小滑坡危險性評價中,而機器學習方法在滑坡危險性評價上也能有效地預測。如基于粒子群優(yōu)化的支持向量機模型被應用于延長縣滑坡危險性評價[6-7]、基于集成學習和徑向基神經(jīng)網(wǎng)絡耦合模型應用于三峽庫區(qū)滑坡易發(fā)性評價[8]、基于改進的卷積神經(jīng)網(wǎng)絡方法應用于滑坡危險性評價中[9]等。以往研究結(jié)果表明,采用支持向量機和信息量模型進行滑坡易發(fā)性評價效果較理想,應用相對普遍,因此,筆者選擇蘆山縣為研究區(qū),應用支持向量機與信息量模型進行對比研究,以期得到與實際情況更加接近的滑坡危險性區(qū)劃圖,為未來防災減災工作提供參考。
支持向量機(Support Vector Machine,SVM)是一種二分類監(jiān)督分類器,是建立在統(tǒng)計學原理基礎上發(fā)展起來的分類預測模型。支持向量機在解決小樣本、高維度、非線性問題是比其他機器學習方法更有效更合理[10],并且支持向量機通過引入不同核函數(shù),從而為非線性問題提供良好的解決方案。
線性支持向量機的基本原理是假設給定一個特征空間下的訓練數(shù)據(jù)集:數(shù)據(jù)集線性可分時,存在無窮多個分離超平面可將兩類數(shù)據(jù)正確分開。線性可分支持向量機就是尋求能使間隔最大化的分離超平面,該平面成為最優(yōu)超平面。求解最優(yōu)超平面可以等同為求解一個凸二次規(guī)劃問題(圖1)。
圖1 線性二分類
信息量法(Information Value Model,IVM)是由信息論創(chuàng)始人Shannon提出的[11],在20世紀80年代被引入滑坡災害預測中。信息量法認為,滑坡的發(fā)生與諸多因子有關。單因子信息量計算公式為[12]:
(1)
其中:I為評價因子xi對滑坡發(fā)生的信息量;Ni為第i個因子區(qū)域內(nèi)包含的滑坡點數(shù);Si為第i個因子所占面積;N為總滑坡個數(shù);S為研究區(qū)總面積。
而不同因子對滑坡發(fā)生有不同“貢獻”,這個“貢獻”用該因子權重衡量,亦即加權信息量模型。為了充分考慮不同因子對滑坡發(fā)生的影響程度,用層次分析法計算每個因子的權重。最終的信息量表達式為式(2)[11]。
(2)
其中:wi為每個因子的權重。
層次分析法是一種解決多目標復雜問題定性與定量相結(jié)合的決策分析方法[13]。通過判斷各目標之間的相對重要程度,合理地給出各個目標的權數(shù),最終得到每個目標的權重。
為了驗證模型的性能,實驗采用受試者工作特征曲線(Receiver Operating Characteristic Curve,ROC)和總體精度,對支持向量機模型及信息量模型進行對比分析。ROC曲線是衡量模型可用性的常用方法[14],通常用線下面積(Area under the Curve,AUC)來定量描述模型的精確度。對評價結(jié)果建立ROC曲線,橫軸是危險性面積累積百分比,縱軸是滑坡分布累積百分比。
蘆山縣隸屬于雅安市,位于四川盆地西緣,雅安市東北部,位于長江上游,四川盆地西緣,東鄰成都,西連甘孜??h域地質(zhì)環(huán)境復雜,降雨量充沛,最高海拔5 289 m,最低海拔557 m,相對高差大;縣域內(nèi)溝谷縱橫,地形切割強烈(圖2)。此外,受2013年蘆山地震影響,蘆山區(qū)域內(nèi)滑坡頻發(fā),給人民群眾生命財產(chǎn)安全造成極大損失。對蘆山區(qū)域進行滑坡危險性評價、分區(qū),能有效為蘆山區(qū)域防災減災提供輔助決策支持。
圖2 研究區(qū)概況
影響滑坡的影響因子有上百種之多,合理地選擇影響因子對于構(gòu)建滑坡評價模型至關重要。經(jīng)調(diào)查顯示2015年蘆山縣共有346個歷史滑坡點,最大滑坡面積為16 000 m2,最小滑坡面積為200 m2,滑坡多發(fā)生于路網(wǎng)、水系兩側(cè)。為了開展實驗,通過各種途徑獲取了基礎數(shù)據(jù)集(從雅安公共氣象服務中心獲取了蘆山縣2015年降水量數(shù)據(jù),由雅安市公安局提供了人口數(shù)據(jù)、從地理空間數(shù)據(jù)云獲取了30 m數(shù)字高程模型數(shù)據(jù)等)。
滑坡影響因子隱式或顯式地影響著滑坡發(fā)生的概率,如植被指數(shù)是反映滑坡的植被覆蓋程度,能體現(xiàn)出地質(zhì)體的穩(wěn)定性,而降雨量是與滑坡災害密切相關的影響因素[15]。曲率反映了斜坡的坡型,坡型一定程度上影響滑坡的發(fā)生。距斷層距離使得研究區(qū)內(nèi)的地質(zhì)體破碎,進而降低巖石體的力學強度,同時為滑坡災害的發(fā)生提供了大量的物質(zhì)來源。因此,通過對蘆山區(qū)域環(huán)境條件的分析,選擇了坡度、坡向、巖性、土地利用、植被覆蓋度、降雨量、高程、人口密度、距斷層距離、距路網(wǎng)距離、距水系距離、距震中距離共計12個滑坡影響因子。
滑坡評價因子數(shù)據(jù)的類型包括離散型、連續(xù)性、描述性數(shù)據(jù),其多類型數(shù)據(jù)不利于實驗的開展分析,因此需要對數(shù)據(jù)類型進行統(tǒng)一的分級處理。根據(jù)數(shù)據(jù)分布特征,描述范圍等相關內(nèi)容,將滑坡評價因子數(shù)據(jù)進行分級處理,分級類型如圖3所示。
圖3 滑坡影響因子分級圖
在實驗中采用SVM和IVM模型開展滑坡危險性評價,選擇12個評價因子作為屬性特征,選取706個滑坡點和非滑坡點作為滑坡樣本,采用分層隨機抽樣的方式將樣本集按照比例分為70%和30%。70%的樣本集用于模型的訓練,30%的樣本集用于模型的驗證。不同研究區(qū)地質(zhì)環(huán)境以及災害發(fā)育特征的差異及其復雜性,因子的相關性導致模型的復雜化和運行速率,不利于模型的構(gòu)建,因此對因子進行相關性檢驗防止避免數(shù)據(jù)導致模型的復雜化。實驗采用最常用的劃分規(guī)則柵格單元的方式按照30 m×30 m的劃分規(guī)則,將全區(qū)劃分為1 323 696個規(guī)則格網(wǎng)單元。對這些規(guī)則格網(wǎng)單元進行預測,采用ArcGIS對滑坡預測結(jié)果進行柵格制圖,運用自然斷點法進行危險性評價,將評價結(jié)果分為高危險、中危險、低危險區(qū)域。通過采用ROC曲線和總體進度對模型進行綜合評價。
研究采用SVM和IVM模型進行滑坡危險性評價實驗,通過模型來評價全區(qū)1 323 696個格網(wǎng)單元的滑坡危險性概率,并在GIS軟件中繪制滑坡危險性評價圖。從圖4(b)中可知,滑坡點主要分布在高危險區(qū)域,中、低危險區(qū)域滑坡點分布遠小于高危險區(qū)域。統(tǒng)計結(jié)果表明,高危險區(qū)域格網(wǎng)數(shù)為243 857,占全區(qū)18.5%,其內(nèi)分布滑坡點250個,占總滑坡點數(shù)目的70.8%;中危險區(qū)域格網(wǎng)數(shù)423 664,占總研究區(qū)32.2%,其內(nèi)滑坡點數(shù)目為93,占比為26.3%;低危險區(qū)域格網(wǎng)數(shù)目為648 166,占全區(qū)面積的49.3%,其內(nèi)分布的滑坡點數(shù)目為10個,占比為2.8%;其中高危險區(qū)域在路網(wǎng)、水系沿線分布較多。高危險區(qū)域主要分布在蘆山縣域中下部,而北部鮮有分布,這是由于蘆山人類活動主要聚集在中下部,對該范圍內(nèi)巖土結(jié)構(gòu)影響較大。從圖4(a)中可知,滑坡主要集中在路網(wǎng)、斷層、水系附近,呈帶狀和面狀分布,高危險性占整個區(qū)域的24%,中危險性區(qū)域占整個區(qū)域的35%,空間分布成面狀分布,低危險區(qū)域表示滑坡可能性較小,屬于較安全區(qū)域,占整個面積的41%。從圖4可知,IVM模型的滑坡危險性圖呈現(xiàn)大面積高危險性區(qū)域,并且覆蓋范圍廣,不符合人員居住。而SVM模型呈現(xiàn)少量高危險性區(qū)域,高中低危險性區(qū)域符合現(xiàn)實情況,從圖4可知,SVM的評價效果優(yōu)于IVM。
圖4 蘆山地區(qū)滑坡危險性評價分級圖
實驗采用AUC和總體精度綜合評價SVM、IVM的總體性能,其SVM的滑坡危險性區(qū)域評價預測精度和成功率曲線為86%和0.84,而IVM的AUC值為0.822(圖5)。從上述指標上看,SVM的模型性能優(yōu)于IVM。
圖5 ROC曲線
以蘆山區(qū)域為研究區(qū),選擇12個評價因子指標,對因子進行相關性分析,采用SVM和IVM對研究區(qū)域開展滑坡危險性評價。采用AUC曲線對模型的預測精度進行評價。其結(jié)論如下:
1)采用SVM的滑坡危險性評價結(jié)果高中低占比符合滑坡所在高危險區(qū)域最多,低危險性區(qū)域最少。
2)蘆山區(qū)域滑坡發(fā)生受路網(wǎng)、水系、人類、地震活動影響較大。
3)將蘆山區(qū)域評價結(jié)果劃分為低、中、高三個級別,高危險區(qū)域面積占比最小而其內(nèi)分布滑坡點最多,低危險區(qū)域面積最大而分布滑坡點數(shù)目較少,說明評價結(jié)果與實驗預期一致。
4)支持向量機模型的評價成果與研究區(qū)滑坡實際分布情況更加接近,能為滑坡災害防治和未來城市發(fā)展規(guī)劃提供借鑒。