李文娟,邵 海
(中國地質(zhì)環(huán)境監(jiān)測院,北京 100081)
在國內(nèi)外地質(zhì)災(zāi)害野外調(diào)查研究領(lǐng)域中,滑坡災(zāi)害這種地質(zhì)現(xiàn)象十分常見,它表示斜坡產(chǎn)生的沿剪切面或整體向下滑移的過程與結(jié)果[1]。若僅依靠群測群防等人工措施對區(qū)域滑坡群逐一治理,時間效率將非常低下[2]。為了有效獲取滑坡災(zāi)害發(fā)生的位置,對重點(diǎn)研究區(qū)域滑坡災(zāi)情的孕災(zāi)環(huán)境準(zhǔn)確評估將十分關(guān)鍵,由此引發(fā)的區(qū)域滑坡易發(fā)性問題在全球范圍內(nèi)也一直受到廣泛關(guān)注[3-4]。
在滑坡空間預(yù)測領(lǐng)域,許多國內(nèi)外學(xué)者利用較為成熟的計算機(jī)算法和滑坡野外調(diào)查經(jīng)驗進(jìn)行了相應(yīng)的融合研究[5-6]。GUZZETTI 等[7]從意大利某典型滑坡區(qū)域空間預(yù)測方法探究的目的出發(fā),利用多模型融合的方法,對相關(guān)算法的精確度指標(biāo)進(jìn)行了橫向研究;EECKHAUT等[8]則以法國香檳亞丁省滑坡群為研究對象,針對線性模型和非確定性模型的各自特點(diǎn),搭建了基于數(shù)理統(tǒng)計算法的穩(wěn)定性分區(qū)流程,完成了對區(qū)域滑坡易發(fā)性的空間類別劃分;NICHOL 等[9]則應(yīng)用高分辨率遙感影像的紋理特征,對滑坡空間穩(wěn)定或非穩(wěn)定區(qū)域進(jìn)行了詳細(xì)的分區(qū)描述。時至今日,3S 技術(shù)的不斷發(fā)展為區(qū)域滑坡易發(fā)性評價提供了更為多維與細(xì)致的技術(shù)方向,使得后來的學(xué)者可從多方位及定量的角度實現(xiàn)滑坡災(zāi)情的信息處理,同時也融合了計算機(jī)智能化運(yùn)算屬性,通過引入數(shù)據(jù)挖掘的概念,賦予滑坡空間數(shù)據(jù)分析的能力[10-12]。本文以前人的研究作為基礎(chǔ),構(gòu)建了融合遙感圖像處理技術(shù)和多維數(shù)據(jù)挖掘方法的穩(wěn)定性智能空間劃分過程,最后建模分析并完成了秭歸——巴東區(qū)內(nèi)滑坡易發(fā)性評估單元的分類預(yù)測。
為了對滑坡遙感數(shù)據(jù)進(jìn)行全面的分析,可通過面向?qū)ο蟮倪b感多尺度方法分利用單一或者多時相空間數(shù)據(jù)進(jìn)行有效提取[13-17]。方法參考圖1,在分割開始前,一般需要對影像進(jìn)行相應(yīng)的預(yù)處理。在同質(zhì)閾值預(yù)設(shè)干預(yù)下,首先確定所利用的對象因子,設(shè)置反復(fù)循環(huán)的流程,以此達(dá)到對其他對象因子的覆蓋;種子同時歸并最合適的鄰域,形成新的對象特征。這一過程以異質(zhì)性達(dá)到最小為標(biāo)準(zhǔn),直到研究數(shù)據(jù)里的所有分割對象均參與了合并過程,并找到合適的對象域。由于其執(zhí)行效率和處理成果的一致性均比較突出,這種圖像多尺度分割技術(shù)理論在滑坡遙感監(jiān)測及易發(fā)性應(yīng)用評估領(lǐng)域已經(jīng)取得了一定的研究成果。
圖1 圖像多尺度分割原理示意圖Fig.1 Multi-scale image segmentation concept
本次試驗區(qū)域隸屬于著名的長江三峽庫區(qū)的秭歸——巴東沿段,從地理位置上來看,研究區(qū)東邊為湖北省宜昌市,西邊為重慶市巫山縣。延伸總距離大致為55 km,涵蓋區(qū)域面積為446 km2左右,總體地層走勢為盆地地形,具體發(fā)育情況可見圖2。
圖2 三峽庫區(qū)秭歸——巴東段地形地貌影像(三維地貌疊加Landsat-8 影像)Fig.2 Topographic image of Zigui——Badong area in Three Gorges Reservior
本文研究結(jié)合eCognition 軟件已有的數(shù)據(jù)處理功能,分析并獲取了秭歸——巴東段影像的光譜及紋理特征,經(jīng)大氣校正、裁剪、配準(zhǔn)等預(yù)處理過程,同時利用研究區(qū)Landsat-8 影像中近紅外、紅、藍(lán)波段為原始遙感數(shù)據(jù),其分辨率為30 m。模型引入相關(guān)性、對比度、能量、熵這4 個紋理參數(shù)作為評估因子,對研究區(qū)的植被覆蓋情況和滑坡形態(tài)特征的盡可能完整覆蓋。經(jīng)過多次實驗,對分割結(jié)果反復(fù)優(yōu)化和更新,最終確定將分割尺度、形狀異質(zhì)性參數(shù)、顏色異質(zhì)性參數(shù)分別設(shè)置為35,0.6,0.3,再把光滑度參數(shù)與緊湊度參數(shù)均設(shè)置為0.5 時即可達(dá)到實驗的精準(zhǔn)性目的,研究區(qū)影像經(jīng)該算法運(yùn)算并分割后成為了新的2 279 個區(qū)域(圖3)。
圖3 秭歸——巴東段面向?qū)ο蠖喑叨确指罱Y(jié)果Fig.3 Multi-scale texture segmentation results of Zigui——Badong area
相關(guān)研究表明,區(qū)域滑坡空間預(yù)測方法除利用相關(guān)已有遙感數(shù)據(jù)源參與建模外,還需要考慮實際的環(huán)境地質(zhì)因子,進(jìn)行有針對性的綜合分析。通過查閱相關(guān)背景資料,研究區(qū)滑坡所在的地層巖性組合在很大程度上生成了空間孕災(zāi)的多種物理因素,詳情如表1所示[15];整理相關(guān)資料,研究區(qū)坡度分布見圖4,同時本次研究也考慮到坡度這一典型滑坡承載應(yīng)力的分布特征,統(tǒng)一作為評價因子統(tǒng)一進(jìn)行分級處理。
表1 秭歸——巴東工程巖組分類標(biāo)準(zhǔn)[18]Table 1 The classification standard of engineering rock group (Zigui-Badong)
圖4 研究區(qū)坡度分布圖Fig.4 Slope distribution map
本次研究的地質(zhì)數(shù)據(jù)均來自于三峽庫區(qū)地質(zhì)災(zāi)害防治工作指揮部,利用庫水位監(jiān)測指標(biāo)、地形圖、30 m數(shù)字高程模型(DEM)和地質(zhì)底圖作為多結(jié)構(gòu)的基礎(chǔ)數(shù)據(jù)來源,同時在ArcGIS 軟件中提取影響滑坡空間穩(wěn)定性發(fā)育的主要地質(zhì)環(huán)境因素,根據(jù)三峽庫區(qū)已有歷史滑坡災(zāi)害數(shù)據(jù)庫的各項指標(biāo),融合不同類型多結(jié)構(gòu)數(shù)據(jù)的分箱處理流程和操作規(guī)范,對與空間易發(fā)性相關(guān)聯(lián)度較高的地質(zhì)評價因子進(jìn)行專家分級處理,統(tǒng)一作為后續(xù)易發(fā)性挖掘規(guī)則的關(guān)聯(lián)規(guī)則前項因素,研究所形成的地質(zhì)評價因子結(jié)果見表2。
表2 地質(zhì)數(shù)據(jù)評級因子庫Table 2 Geological evaluation factors
對研究區(qū)已有滑坡信息進(jìn)行充分調(diào)查,可發(fā)現(xiàn)巖質(zhì)與土質(zhì)滑坡是區(qū)域內(nèi)主要的兩種類別。從滑坡解譯的已有研究方法上來看,前者的解譯標(biāo)志以是否出現(xiàn)明顯滑動面、孕災(zāi)的環(huán)境條件和庫水影響指標(biāo)為主;后者的解譯多依賴于對易滑巖層、庫水浸泡和坡體動力學(xué)特征等標(biāo)志的選擇。本文基于決策樹原理,將融合地質(zhì)因子分級指標(biāo)特征,搭建秭歸-巴東段滑坡空間預(yù)測智能決策樹模型,并依據(jù)具體的分類結(jié)果進(jìn)行區(qū)劃制圖,最后評價其精度。
在模型正式開始訓(xùn)練前,研究區(qū)域內(nèi)的影像數(shù)據(jù)已經(jīng)經(jīng)過面向?qū)ο蟮亩喑叨确指钐幚?,并形成? 279 個研究單元;為了驗證個體與總體的模型構(gòu)建精度,從研究區(qū)覆蓋均勻的角度出發(fā),分別以180 個滑坡樣本及550 個非滑坡樣本單元作為訓(xùn)練樣本集,其中用0 表示穩(wěn)定區(qū)域,1 表示不穩(wěn)定的滑坡區(qū)域;本文將采用決策樹算法進(jìn)行模型的構(gòu)建。
C5.0 決策樹屬典型分類算法,對數(shù)值型數(shù)據(jù)的分類化操作是主要核心操作,并將分類后的結(jié)果用于知識傳達(dá)。該算法以信息熵作為基本評估指標(biāo),分類結(jié)果和分類區(qū)間則以信息增益量(Information Gain)最大化達(dá)到結(jié)束狀態(tài),同時這一過程將采用先驗分類的方法對原始數(shù)據(jù)進(jìn)行預(yù)處理,以達(dá)到全局化最優(yōu)目的[13]。
決策樹其核心思想在于利用自上而下、分而治之的遞歸構(gòu)造函數(shù)形成中間結(jié)果分類。通過根目錄下子節(jié)點(diǎn)的多重分類和區(qū)間閾值設(shè)置,原始實驗數(shù)據(jù)集合將重復(fù)地被規(guī)劃為若干較小的子集合。本次研究以SPSS Clementine 軟件中的決策樹算法模型搭建流程為實現(xiàn)方式,對研究區(qū)實驗數(shù)據(jù)進(jìn)行有目的性分析和知識發(fā)現(xiàn),然后利用Boosting 方法細(xì)化原始數(shù)據(jù)集合及其子集合的分類精確度。該模型屬于近年來比較成熟的數(shù)據(jù)挖掘算法之一,本文采用的決策樹原理主要利用到信息增益函數(shù)指標(biāo),可表示如下:
式中:v——分枝數(shù)目;
Si——第i個分枝下記錄的數(shù)目。
利用決策樹算法模型的支持,在Clementine 軟件中進(jìn)行實現(xiàn)。對這兩類數(shù)據(jù)預(yù)測效果進(jìn)行匯總,模型精度評判詳情見表3,表4。
表3 訓(xùn)練集分類預(yù)測結(jié)果Table 3 Result of training set classification
表4 測試集分類預(yù)測結(jié)果Table 4 Result of testing set classification and prediction
從模型的總體評價結(jié)果中可看出:決策樹模型對研究區(qū)各對象訓(xùn)練單元的預(yù)測精度較好,總體正確率高達(dá)93.73%;Kappa 系數(shù)取值為-1 到1 之間,是一個用于一致性檢驗的指標(biāo),可用于衡量模型分類的效果,能夠直接反映正確分類的比例,文中則表明了C5.0 模型在滑坡穩(wěn)定性分區(qū)能力上的優(yōu)越性,這個數(shù)值在訓(xùn)練和測試樣本中分別達(dá)到了0.84 和0.51;通過分析論文中的滑坡易發(fā)性評估先驗分級因子,基于上述已通過測試的決策樹模型理論,對研究區(qū)分割后的每個對象加以應(yīng)用。同時考慮到數(shù)據(jù)的不同存儲結(jié)構(gòu)和應(yīng)用模式,分類模型呈現(xiàn)出兩種結(jié)果表達(dá):針對離散數(shù)據(jù),若結(jié)果為0,表示該單元為易發(fā)性較低的區(qū)域,1 則代表易發(fā)性程度較高的空間單元;針對數(shù)值型的連續(xù)數(shù)據(jù),采用小于1 的小數(shù)表示各要素和影響研究區(qū)滑坡空間孕育的定量程度,認(rèn)為該取值與滑坡空間易發(fā)性的概率呈正相關(guān)關(guān)系。綜上,通過融合離散與連續(xù)型數(shù)據(jù)的特征和分類模型特點(diǎn),實驗采取自然裂點(diǎn)的方式將結(jié)果劃分為四個等級(表5)。
表5 秭歸——巴東段滑坡易發(fā)性分區(qū)總體結(jié)果Table 5 Landslide susceptibility classification prediction(Zigui——Badong)
根據(jù)上述模型生成的秭歸——巴東段滑坡易發(fā)性空間預(yù)測圖(圖5)。從易發(fā)性分類預(yù)測結(jié)果中可以看到,秭歸——巴東段滑坡空間預(yù)測情況總體呈現(xiàn)較為明顯的分類特征,不易發(fā)區(qū)和高易發(fā)區(qū)被劃分的對象單元較多,共有2 141 處單元被模型規(guī)劃,占總體的93.94%。從結(jié)果和最終制圖預(yù)測的效果表明,基于遙感影像多尺度分割與地質(zhì)因子評價的滑坡易發(fā)性制圖具有較好的分類特性(圖5)。
圖5 滑坡易發(fā)性預(yù)測區(qū)劃圖Fig.5 Landslide susceptibility prediction mapping
從面向?qū)ο蟮倪b感影像多尺度分割和地質(zhì)因子專家分級的角度,本文構(gòu)建了基于遙感影像多尺度分割與地質(zhì)因子評價方法的易發(fā)性預(yù)測模型,對分割后秭歸-巴東段的2 279 個對象進(jìn)行了滑坡空間易發(fā)性的預(yù)測分析和精度評價。決策樹模型對研究區(qū)各對象訓(xùn)練單元的預(yù)測精度較好,平均正確率高達(dá)91.64%;Kappa 系數(shù)在訓(xùn)練和測試樣本中分別達(dá)到了0.84 和0.51,表明了C5.0 模型在滑坡穩(wěn)定性分區(qū)能力上的優(yōu)越性;最后運(yùn)用該分類模型結(jié)果建立秭歸——巴東段易發(fā)性規(guī)劃圖,預(yù)測結(jié)果表明應(yīng)著重關(guān)注長江干流及支流兩岸的滑坡孕育情況,且當(dāng)工程巖組為侏羅系、志留系地層及巴東組、二疊系地層巖性的順向坡內(nèi)較易出現(xiàn)高易發(fā)性斜坡單元。綜上,基于滑坡所處研究區(qū)的地質(zhì)因子分級知識,利用影像多尺度分割與C5.0 決策樹模型的滑坡空間易發(fā)性模型預(yù)測結(jié)果是十分可靠的。