汪 瑩
(1.貴州省地質(zhì)礦產(chǎn)勘查開發(fā)局111地質(zhì)大隊,貴州 貴陽 550008;2.貴州地質(zhì)工程勘察設(shè)計研究院有限公司,貴州 貴陽 550008)
滑坡易發(fā)性評價是通過對多個影響因子的綜合分析,評價發(fā)生滑坡地質(zhì)災(zāi)害的可能性大小(田欽 等,2020),是區(qū)域滑坡災(zāi)害風(fēng)險評估的有效手段。其評價結(jié)果可為國土資源空間規(guī)劃、土地利用、工程建設(shè)和防災(zāi)減災(zāi)等提供有效的技術(shù)支撐(劉月 等,2020)。
關(guān)于滑坡易發(fā)性評價的模型,眾多的研究學(xué)者先后提出了多種方法,從最初的定性評價模型發(fā)展到定量物理力學(xué)評價模型,再到目前應(yīng)用較為廣泛的概率統(tǒng)計模型(劉月 等,2020)。概率統(tǒng)計模型又根據(jù)具體的計算方法分為:信息量模型(彭珂 等,2018;王佳佳 等,2014;楊根云 等,2018;周超 等,2015)、確定性系數(shù)法(劉艷芳 等,2014)、邏輯回歸模型(張俊 等,2016)、頻率比法(李文彥 等,2020)等。雖然不同計算方法對滑坡易發(fā)性評價都能起到較好的效果,但在評價精度上也存在一定的差異。
為優(yōu)選最適宜山區(qū)區(qū)域滑坡易發(fā)性評價方法,本文以貴州省桐梓縣為研究區(qū),在采用概率統(tǒng)計模型中應(yīng)用較為廣泛的信息量模型、頻率比法、確定性系數(shù)法三種評價模型分別對本研究區(qū)進行滑坡災(zāi)害易發(fā)性評價的基礎(chǔ)上,引入“ROC曲線”對這三種方法的評價結(jié)果進行評價精度的對比研究,研究結(jié)果可為類似地區(qū)滑坡易發(fā)性評價提供借鑒。
圖1 研究區(qū)地理位置及區(qū)內(nèi)滑坡地質(zhì)災(zāi)害分布示意圖Fig.1 Schematic diagram of geographical location and landslide geological hazards distribution in the study area
該區(qū)位于上揚子地塊黔北隆起區(qū),地跨畢節(jié)弧形褶皺帶和鳳崗南北向隔槽式褶皺變形區(qū),區(qū)內(nèi)斷裂構(gòu)造以SN、NE走向為主,斷裂多呈壓扭性??h域地貌總體為東北高西南低,區(qū)內(nèi)寒武系、奧陶系、志留系、二疊系、三疊系、侏羅系地層出露完好,泥盆系與石碳系地層缺失。桐梓縣境內(nèi)晚近期構(gòu)造運動跡象較明顯,區(qū)內(nèi)大面積上升為主,多為侵蝕、剝蝕、山地,第四系沉積物零星分布,除桐梓河兩岸為第四系沉積物外,其余主要河谷多急劇深切,呈“V”型或箱狀廓道式峽谷。
由于區(qū)域地質(zhì)環(huán)境條件較為復(fù)雜,區(qū)內(nèi)地質(zhì)災(zāi)害發(fā)育。地質(zhì)災(zāi)害隱患呈現(xiàn)出點多面廣、群發(fā)性、密集性等特點。本研究選取區(qū)內(nèi)144處滑坡地質(zhì)災(zāi)害點為基礎(chǔ)數(shù)據(jù),開展區(qū)內(nèi)不同模型滑坡易發(fā)性評價的應(yīng)用與比較研究。
信息量模型(information value model)是由Yin et al.,(1988)提出的一種統(tǒng)計分析模型。通過對地質(zhì)災(zāi)害的各影響因素進行統(tǒng)計分析,計算其提供的信息量值,疊加各因素的信息量用于評估地質(zhì)災(zāi)害的易發(fā)性(鄭光明,2017)。
信息量模型的計算公式如下(儀政 等,2021):
式中:I為評價單元的總信息量;n為影響因子數(shù)量;I(xi,H)為單獨因子xi對滑坡災(zāi)害發(fā)生事件(H)所提供的信息量;Ni為單獨評價因子xi內(nèi)特定級別內(nèi)的滑坡數(shù)量;N為研究區(qū)滑坡總數(shù)量;Si為單獨評價因子xi的面積;S為整個研究區(qū)的總面積。
頻率比法(Frequency Ratio)是滑坡易發(fā)性評價的常用方法(Yalcin et al.,2011),該方法是基于統(tǒng)計分析對指標(biāo)因子進行區(qū)間分類。其原理為(李文彥 等,2020):
設(shè)滑坡面積為L,影響因子為F,按照一定的規(guī)則將F劃分為不同的區(qū)間,進而計算不同區(qū)間內(nèi)落入滑坡的面積。影響因子F的第j個區(qū)間的頻率比FjR:
式中:P(LFj)表示L中Fj的頻率,P(Fj)表示研究區(qū)中Fj的頻率,ALFj表示L中Fj的面積,AL表示L的總面積,AFj表示Fj的總面積,A表示研究區(qū)的總面積。
對于特定的空間位置,不同的影響因子F(i),該空間位置滑坡災(zāi)害L的易發(fā)性指數(shù)LSI:
LSI=∑F(i)jR(i=1,2,3…m;j=1,2,3…n)
確定性系數(shù)法(Certainty Factor)是一種概率函數(shù)的方法,該方法基于已知的地質(zhì)災(zāi)害隱患點,計算各影響因子不同區(qū)間的敏感性(Shortlife et al.,1987)。最終的確定性系數(shù)CF的值越大,表示滑坡災(zāi)害發(fā)生的確定性越高。其原理公式如下(劉月 等,2020):
式中:PPa表示特征a中單元存在的地質(zhì)災(zāi)害隱患點的柵格數(shù)與特征a的柵格數(shù)的比值;PPs表示為整個研究區(qū)滑坡地質(zhì)災(zāi)害隱患點柵格數(shù)與研究區(qū)總柵格數(shù)的比值。
ROC曲線(Receiver Operating Characteristic)又被稱為感受性曲線,具有簡單、直觀、可準(zhǔn)確地反映所用分析方法特異性與敏感性的關(guān)系的特點而廣泛應(yīng)用于模型精度的驗證(劉月 等,2020)。本次研究引入ROC曲線法對前述3種滑坡易發(fā)性評價方法的精度進行定量的分析比較。
表1 混淆矩陣Table 1 Confusion matrix
滑坡易發(fā)性主要考慮在一定區(qū)域內(nèi)由孕災(zāi)地質(zhì)條件控制的滑坡發(fā)生的可能性(楊強 等,2021)?;碌刭|(zhì)災(zāi)害的影響因素眾多,在建立評價模型時需要具體分析,找出區(qū)域內(nèi)影響滑坡易發(fā)性的主要地形地貌和地質(zhì)因素(鄭光明,2017)。
本文基于野外實地調(diào)查及收集的資料數(shù)據(jù),選取坡度、斜坡結(jié)構(gòu)、地形起伏度、工程地質(zhì)巖組、距斷層距離、距水系距離6個因子。其中,斜坡結(jié)構(gòu)、工程地質(zhì)巖組屬于離散型因子,其分類代表了具體的含義和對滑坡的影響程度,不再進行等級劃分;其余4個連續(xù)型指標(biāo)因子,需要對各因子進行等級劃分。
不同坡度條件會對斜坡的應(yīng)力分布、人類工程活動等造成差異,從而影響滑坡的發(fā)育(蔣德明 等,2016),以 15°的間距進行劃分(閆舉生 等,2019)。地形起伏度代表特定區(qū)域內(nèi)最高海拔與最低海拔之間的差值,可反映區(qū)域內(nèi)地形的起伏狀況,同時也一定程度地反映了地表的破碎程度(李郎平 等,2017)。選取以單元格為中心100 m為半徑的圓作為統(tǒng)計單元進行地形起伏度計算,計算結(jié)果以15 m為間隔進行劃分(鄭光明,2017)?;聻?zāi)害的發(fā)生與斷裂構(gòu)造有著密切的關(guān)系(高克昌 等,2006),斷層的影響距離較遠(yuǎn),以800 m的間距做緩沖分析(宋小川 等,2021)。河流會對斜坡的坡腳進行沖刷進而造成岸坡失穩(wěn)(田述軍 等,2019),以500 m的間距做緩沖分析(閆舉生 等,2019)。
本次研究收集整理了桐梓縣的區(qū)域地質(zhì)、區(qū)內(nèi)滑坡地質(zhì)災(zāi)害數(shù)據(jù)等資料。其中區(qū)域地質(zhì)資料主要來源于貴州省1∶5 W地質(zhì)圖。區(qū)內(nèi)滑坡地質(zhì)災(zāi)害數(shù)據(jù)主要來源于貴州省桐梓縣地質(zhì)災(zāi)害詳查及風(fēng)險評價的調(diào)查成果數(shù)據(jù)。主要利用GIS軟件對數(shù)據(jù)進行處理:(1)從1∶5W地質(zhì)圖提取區(qū)內(nèi)地層巖性、斷裂帶分布;(2)利用地形數(shù)據(jù)生成25×25 m分辨率的數(shù)字高程模型(digital elevation model,DEM),提取坡度、坡向、地形起伏度等因子。不同評價因子分級結(jié)果見圖2。
圖2 滑坡易發(fā)性評價各影響因子分級圖(a)坡度;(b)斜坡結(jié)構(gòu);(c)地形起伏度;(d)工程地質(zhì)巖組;(e)距水系距離;(f)距斷層距離Fig.2 Grading diagram of each influencing factor for landslide susceptibility evaluation(a)slope;(b) slope structure;(c) topographic relief;(d) engineering geological petrofabric;(e) distance from water system;(f) distance from fault
4.2.1 滑坡易發(fā)性評價結(jié)果
三種模型各影響因子不同分級下的信息量值,確定性系數(shù)(CF)值和頻率比(FR)值見表2。
表2 各模型計算結(jié)果統(tǒng)計表Table 2 Statistics of calculation results of each model
續(xù)表
通過GIS空間分析工具將各個影響因子進行疊加得到易發(fā)性評價結(jié)果,采用自然斷點法將研究區(qū)劃分為低、中、高和極高易發(fā)區(qū),三種模型的易發(fā)性分區(qū)結(jié)果如圖3所示,已發(fā)生的滑坡地質(zhì)災(zāi)害點主要分布于模型劃分的極高易發(fā)區(qū)和高易發(fā)區(qū),說明三種模型的易發(fā)性劃分結(jié)果是合理的,因此進一步驗證評價結(jié)果精度,以便找到更為適宜的模型。
圖3 不同模型的滑坡易發(fā)性分區(qū)圖(a)信息量模型;(b)確定性系數(shù)法;(c)頻率比法Fig.3 Zoning map of landslide susceptibility in different models(a)information value model;(b) certainty factor method;(c) frequency ratio method
4.2.2 易發(fā)性評價結(jié)果的驗證與對比分析
圖4 不同模型預(yù)測結(jié)果的ROC曲線Fig.4 ROC curves of prediction results of different models
表3 不同評價方法評價結(jié)果對比統(tǒng)計表Table 3 Statistics of evaluation results comparison of different evaluation methods
根據(jù)表3中統(tǒng)計結(jié)果,實際滑坡地質(zhì)災(zāi)害點都主要落在極高易發(fā)區(qū),災(zāi)害點落在各易發(fā)等級區(qū)的百分比都隨易發(fā)區(qū)等級的增高而增大。信息量模型和確定性系數(shù)法的低易發(fā)區(qū)占整個研究區(qū)面積的百分比最小,而頻率比法則是極高易發(fā)區(qū)占整個研究區(qū)面積的百分比最小。
結(jié)合ROC曲線結(jié)果、滑坡易發(fā)性分區(qū)與實際災(zāi)害的數(shù)量統(tǒng)計結(jié)果,表明信息量模型更加適合于該區(qū)域的滑坡易發(fā)性評價。
(2)通過對三種不同方法的ROC曲線分析:信息量模型(AUC=0.800),確定性系數(shù)法(AUC=0.784),頻率比法(AUC=0.787),結(jié)合三種模型滑坡易發(fā)性分區(qū)結(jié)果與實際的吻合度分析,表明信息量模型在該區(qū)域滑坡易發(fā)性評價中評價結(jié)果與預(yù)測能力較好,更適合于該區(qū)域的滑坡易發(fā)性評價。
(3)在檢驗滑坡易發(fā)性評價結(jié)果的合理性時,應(yīng)注意檢驗樣本點落在極高易發(fā)區(qū)的百分比是否為最大;低易發(fā)區(qū)占整個研究區(qū)面積的百分比是否為最小;檢驗樣本點落在各易發(fā)等級區(qū)的百分比與各等級區(qū)的面積占區(qū)域面積百分比的比值是否隨易發(fā)區(qū)等級的增高而增大。