趙 玉,陳麗霞*,付 圣
(1.中國(guó)地質(zhì)大學(xué)地球物理與空間信息學(xué)院,湖北 武漢 430074)
高陡斜坡上的巖土體突然脫離母巖并堆積到坡腳的崩塌現(xiàn)象,極易造成人員傷亡與財(cái)產(chǎn)損失,尤其是交通沿線的高陡邊坡問(wèn)題最為突出[1]。在防控崩塌時(shí),對(duì)崩塌源區(qū)的提前判識(shí)是首要任務(wù),其結(jié)果的準(zhǔn)確性直接影響落石的運(yùn)動(dòng)軌跡預(yù)測(cè)和風(fēng)險(xiǎn)的量化判定[2]。
識(shí)別崩塌源區(qū)的常用方法有野外地質(zhì)判斷、統(tǒng)計(jì)分析或智能模型分析等[3-8]。其中,邏輯回歸模型(LRM)是一種廣泛用于斜坡地質(zhì)災(zāi)害易發(fā)性分析或空間預(yù)測(cè)的統(tǒng)計(jì)分析方法[3-7]。該模型能揭示因變量和多個(gè)互不相關(guān)的自變量之間的多元回歸關(guān)系[5],LRM 的建模過(guò)程本身具有挑選變量的優(yōu)點(diǎn)[6]。隨著應(yīng)用需求的不斷提高,目前LRM 已從二元發(fā)展到多元,再到與其他模型聯(lián)合使用的階段[7]。
在預(yù)測(cè)模型的使用中,無(wú)論何種方式,都面臨輸入變量取值方式的問(wèn)題。對(duì)于崩塌,其分析因素包括地形地貌、地層巖性、地質(zhì)構(gòu)造、人類工程活動(dòng)等。這些數(shù)據(jù)以兩類方式存在:連續(xù)型數(shù)據(jù)(如坡度值)和分類型數(shù)據(jù)(如巖性類型)。連續(xù)變量的取值方式有變量的原值、變量的歸一化值和變量的標(biāo)準(zhǔn)化值。其中,變量的歸一化值是連續(xù)變量原值與評(píng)價(jià)單元內(nèi)的最大和最小值的差值之比獲得[8];變量的標(biāo)準(zhǔn)化值是將變量值標(biāo)準(zhǔn)化到-1 到+1 之間[9]。分類變量的取值類型有屬性,分級(jí)值、模型處理分級(jí)值、數(shù)學(xué)公式處理分級(jí)值和權(quán)重分級(jí)值,包括根據(jù)因子本身屬性的分級(jí)或者使用某種模型獲得的因子對(duì)災(zāi)害的權(quán)重或貢獻(xiàn)程度分級(jí)。因子屬性分級(jí)值(如坡度因子),以10°為間隔從小到大分為1 到9 的序號(hào)值[10-11],結(jié)合模型處理后的分級(jí)值,例如分級(jí)后的因子經(jīng)過(guò)信息量模型處理后獲得的信息量值[11];結(jié)合數(shù)學(xué)公式處理后的分級(jí)值,例如結(jié)合加權(quán)頻率比模型[12]進(jìn)行歸一化的分級(jí)值;權(quán)重分級(jí)值,如根據(jù)專家經(jīng)驗(yàn)或數(shù)學(xué)模型對(duì)不同因子賦權(quán)重,也可以對(duì)不同因子的不同級(jí)別賦權(quán)重,最終獲得分級(jí)值[13]??梢?jiàn),變量的取值方式多樣,但其對(duì)災(zāi)害評(píng)價(jià)結(jié)果是否有影響以及影響程度如何,需要進(jìn)行對(duì)比驗(yàn)證。
鑒于此,本文以湖北省利川龍駒壩G318 沿線崩塌為例,使用評(píng)價(jià)因子的3 種取值方式(原始值、信息量值和信息量排序值),采用LRM 評(píng)價(jià)崩塌源區(qū)識(shí)別的差異性,最終選用最優(yōu)取值方案實(shí)現(xiàn)崩塌源的識(shí)別。
在資料收集、遙感解譯和野外調(diào)查的基礎(chǔ)上,利用統(tǒng)計(jì)分析方法從地質(zhì)數(shù)據(jù)中提取崩塌的主要影響因子,深入研究崩塌的發(fā)育規(guī)律。因子包括坡度、坡向、曲率、粗糙度、巖性、斜坡結(jié)構(gòu)、節(jié)理密度、水系線密度、歸一化植被指數(shù)(NDVI)、土地利用類型。通過(guò)統(tǒng)計(jì)崩塌集中分布的坡度,初步篩選出崩塌源范圍。之后對(duì)崩塌形成內(nèi)在條件和外在誘因上進(jìn)行變量提取,采用3 種變量輸入方式(原始值、信息量值和信息量排序值),在ArcGIS 內(nèi)實(shí)施崩塌源區(qū)易發(fā)性評(píng)價(jià),用5 類易發(fā)性等級(jí)(極高、高、中、低和極低)表征崩塌源區(qū)發(fā)生災(zāi)害的可能性大小。最后分別從易發(fā)區(qū)分布空間特征、極高和高易發(fā)區(qū)的面積比例和評(píng)價(jià)精度三方面,判斷3 種結(jié)果的崩塌源識(shí)別能力,技術(shù)路線見(jiàn)圖1。
圖1 技術(shù)路線圖
3 種變量取值方案為:
方案(1)通過(guò)ArcGIS 提取各個(gè)因子的原始值。例如坡度因子以連續(xù)型坡度值賦給研究區(qū)的柵格單元;斜坡結(jié)構(gòu)因子則以分類型數(shù)據(jù)進(jìn)行賦值。連續(xù)型數(shù)據(jù)和分類型數(shù)據(jù)分別保持原值。
方案(2)通過(guò)信息量模型[10]獲取各個(gè)因子的信息量值。信息量值為分類型,各因子以離散形式輸入。
方案(3)是在(2)的基礎(chǔ)上,對(duì)各因子的各級(jí)別的信息量值由大到小進(jìn)行重要性由高到低的排序后獲取其排序值,排序值為分類型,各因子的各級(jí)別以離散的編號(hào)值輸入。
信息量模型最早由殷坤龍[10]提出并用于地質(zhì)災(zāi)害易發(fā)性預(yù)測(cè),其計(jì)算公式為:
式中,I為單元信息量值;Ii為因素xi對(duì)地質(zhì)災(zāi)害所提供的信息量;Si為因素xi所占單元總面積;Si0為因素xi單元中發(fā)生地質(zhì)災(zāi)害的面積之和;A0為研究區(qū)地質(zhì)災(zāi)害的單元面積之和;A為研究區(qū)總單元面積之和。
LRM 是目前廣泛用于地質(zhì)災(zāi)害易發(fā)性評(píng)價(jià)的數(shù)學(xué)統(tǒng)計(jì)模型[3,4,7],LRM 中表示崩塌的因變量Y是一個(gè)二分類變量,其取值Y=1 和Y=0,分別代表發(fā)生崩塌和未發(fā)生崩塌。影響Y取值的n個(gè)自變量因子分別為X1,X2,…,Xn,在n個(gè)自變量作用下崩塌發(fā)生的條件概率為P=P(Y=1|X1,X2,…,Xn),則LRM 可表示為:
式中,zi為中間變量參數(shù),無(wú)實(shí)際意義;a0為回歸常數(shù);ai為第i個(gè)變量的回歸系數(shù)(i=1,2,…,n);Xij為第i號(hào)單元中第j個(gè)變量的取值,存在崩塌取1,否則取0;Pi為第i號(hào)單元內(nèi)崩塌發(fā)生概率回歸值(i=1,2,…,n)。
采用ROC 曲線[14]對(duì)3 種方案的LRM 結(jié)果進(jìn)行檢驗(yàn)。曲線下的面積AUC 用來(lái)表示預(yù)測(cè)準(zhǔn)確性,AUC越高,預(yù)測(cè)精度值越高。
研究區(qū)位處重慶市萬(wàn)州區(qū)和湖北省利川市,包含磨刀溪中下游及其支流龍駒河(圖2a),坐標(biāo)范圍為108°30′E~108°45′E,30°30′N~30°40′N。地處四川盆地東緣,以江津至奉節(jié)沿齊岳山一線為界,平行展布北東向窄條狀中低山脈、地勢(shì)相對(duì)低凹的寬闊臺(tái)地狀山地和平緩丘陵(圖2b)。
圖2 研究區(qū)地理位置圖和地質(zhì)構(gòu)造圖
區(qū)內(nèi)地層除背斜核部出露中生代三疊系外,其余均為侏羅系,主要為侏羅系中統(tǒng)上沙溪廟組(J2s上部以泥巖為主,中部粉砂質(zhì)泥巖,下部厚層長(zhǎng)石砂巖)、下沙溪廟組(J2xs泥巖、泥巖夾長(zhǎng)石石英砂巖)和新田溝組(J2x頂部砂質(zhì)泥巖,中部夾鈣質(zhì)砂巖),侏羅系下統(tǒng)自流井組(J1~2z頁(yè)巖夾石英砂巖)、珍珠沖組(J1z中厚層石英砂巖、頁(yè)巖)、以及三疊系上統(tǒng)須家河組(T3xj厚層長(zhǎng)石石英砂巖夾頁(yè)巖或煤層)和三疊系中統(tǒng)巴東組(T2b中厚~厚層含粉砂質(zhì)灰?guī)r夾鈣質(zhì)頁(yè)巖)。
研究區(qū)崩塌共105 處,面積累計(jì)39.45×104 m2,體積累計(jì)321.89×104 m3。受地形地貌和巖土工程性質(zhì)的影響,崩塌在上沙溪廟組密集發(fā)育,在其他地層相對(duì)較弱(圖3a)。這種近水平地層內(nèi)軟硬巖互層的組合極易產(chǎn)生崩塌,嚴(yán)重威脅道路G318 和x553 的安全(圖3b,3c)。
圖3 崩塌分布圖及典型崩塌
基礎(chǔ)數(shù)據(jù):①Pleiades 影像數(shù)據(jù)(分辨率為0.5 m,影像時(shí)間:2 014.9.22)和高分一號(hào)數(shù)據(jù)(分辨率為1 m,影像時(shí)間:2015-03-30);②地質(zhì)圖(1∶10 000);③野外踏勘崩塌數(shù)據(jù)。
崩塌特征受高陡地形控制,為了鎖定崩塌源區(qū),利用最小坡度對(duì)區(qū)內(nèi)柵格進(jìn)行初步篩選。采用5°間隔將坡度分成16 類,通過(guò)統(tǒng)計(jì)各級(jí)內(nèi)崩塌的比例,確定出其分布的最小坡度值。崩塌位于10°~70°內(nèi);在坡度達(dá)到25°時(shí),崩塌數(shù)量陡增; 在40°時(shí)達(dá)到峰值(圖4)。因此,選取25°為最小坡度。
圖4 崩塌源區(qū)與坡度范圍對(duì)應(yīng)圖
通過(guò)對(duì)歷史崩塌的發(fā)育特點(diǎn)與規(guī)律分析,選擇10 個(gè)因子進(jìn)行評(píng)價(jià),各因子的取值情況見(jiàn)表1。
表1 崩塌源區(qū)評(píng)價(jià)變量分級(jí)表
1)地形地貌因子。坡度是控制崩塌重要因子,在較陡的斜坡帶,應(yīng)力集中,結(jié)構(gòu)面發(fā)育時(shí)易崩塌,且?guī)r石風(fēng)化強(qiáng)度大,其屬于連續(xù)型,通過(guò)等間距劃分(圖5a)。坡向控制不同坡面所受到的光照強(qiáng)度,其為連續(xù)型,通過(guò)等間距劃分(圖5b)。曲率反映斜坡坡面形態(tài),其在空間幾何上是斜坡表面上某個(gè)點(diǎn)的切線方向角所對(duì)弧長(zhǎng)的轉(zhuǎn)動(dòng)率(圖5c)。坡面形態(tài)反映斜坡的應(yīng)力狀態(tài)以及對(duì)地表水的匯聚能力,粗糙度反映坡體表面的起伏變化與侵蝕程度,定義為曲面面積與投影面積之比[16]。在GIS 中用自然間斷法分級(jí)(圖5d)。
圖5 崩塌源區(qū)評(píng)價(jià)因子圖
2)工程地質(zhì)因子。巖性分為三類:軟硬巖互層(J2s,J2xs)、軟巖夾硬巖(J1~2z,J2x)和硬巖含軟弱夾層(T3xj,T2b,J1z),屬于分類型(圖5e)。斜坡結(jié)構(gòu)反映結(jié)構(gòu)面與臨空面的空間關(guān)系,表征危巖體掉落概率大小。根據(jù)斜坡劃分標(biāo)準(zhǔn)[17]分為5 類:順向坡[0°~30°)、斜順坡[30°~60°)、橫向坡[60°~120°)、逆斜坡[120°~150°)及逆向坡[150°~180°],其屬于分類型(圖5f),節(jié)理是崩塌重要控制因素,通過(guò)野外結(jié)構(gòu)面測(cè)量獲得,其為連續(xù)型,通過(guò)自然間斷法分級(jí)(圖5g)。
3)其他誘發(fā)因子。沖溝密度體現(xiàn)臨空條件或反映水的侵蝕能力,屬于連續(xù)型(圖5h)。NDVI 反映地表植被的覆蓋狀況,良好的坡體穩(wěn)定性更好。通過(guò)近紅外和紅外波段計(jì)算得到,屬于連續(xù)型,通過(guò)等間距劃分(圖5i)。土地利用類型反映人類活動(dòng)對(duì)斜坡的擾動(dòng)情況。利用高分一號(hào)數(shù)據(jù)并采用波譜角分類(SAM)方法進(jìn)行地物識(shí)別,得到土地利用類型圖,其為分類型(圖5j)。
3 種變量取值方式在識(shí)別崩塌源極高易發(fā)區(qū)的能力上有差異。經(jīng)過(guò)與信息量模型耦合后(方案2 中信息量值和方案3 中的信息量排序值)的評(píng)價(jià),識(shí)別極高易發(fā)等級(jí)的崩塌源區(qū)的能力較原值的輸入方式強(qiáng)(表2)。在原值方案下,研究區(qū)只有30%面積被判定為極高易發(fā)區(qū);而在信息量值或者排序值的方案下,極高易發(fā)區(qū)的識(shí)別比例上升10%。
表2 不同變量取值方式下崩塌源易發(fā)區(qū)面積對(duì)比
圖6a、6b、6c 結(jié)果表明,變量輸入方式不會(huì)影響高易發(fā)區(qū)的分布情況,地質(zhì)條件才是決定崩塌的重要因素。無(wú)論是哪一種輸入方式,其崩塌源高易發(fā)區(qū)分布特征相同,即南北高,中部低。實(shí)質(zhì)上,受地質(zhì)構(gòu)造和巖性的控制,主要分布在趕場(chǎng)向斜的北翼和馬頭場(chǎng)向斜的南翼(圖3)的上沙溪廟組地層內(nèi)。
變量的3 種取值方式在崩塌源識(shí)別精度上有差異(圖6d)。通過(guò)比較ROC 曲線下AUC 值發(fā)現(xiàn),采用信息量排序值作為變量的輸入值得到的評(píng)價(jià)結(jié)果精度最高,達(dá)到0.855,其次是信息量值(0.832)和原值(0.821)的輸入方案。進(jìn)一步表明,在使用信息量模型與LRM 耦合評(píng)價(jià)崩塌源區(qū)易發(fā)性時(shí),信息量排序值結(jié)果最優(yōu)。從輸入變量的特點(diǎn)分析其原因是:信息量值比原值數(shù)據(jù)更多包含了因子變量的權(quán)重值,而排序值相當(dāng)于對(duì)信息量值大的因子賦予了二次權(quán)重,LRM 回歸系數(shù)相當(dāng)于三次權(quán)重,多權(quán)重的計(jì)算促使評(píng)價(jià)精度最優(yōu)。該研究結(jié)果與樊芷吟[10]所得結(jié)論一致,即將信息量模型與LRM 耦合時(shí),結(jié)果最優(yōu)。
圖6 研究區(qū)崩塌源區(qū)預(yù)測(cè)結(jié)果圖和評(píng)價(jià)精度曲線圖
針對(duì)變量存在多種輸入方式從而影響崩塌源區(qū)識(shí)別精度的問(wèn)題,以龍駒壩境內(nèi)崩塌為例,討論了變量的不同輸入方式對(duì)崩塌源區(qū)預(yù)測(cè)的影響,所得結(jié)論如下:
1)崩塌源的分布受地形和地質(zhì)條件控制,邏輯回歸模型中變量的取值方式不會(huì)改變其總體空間分布特點(diǎn),說(shuō)明在評(píng)價(jià)地質(zhì)災(zāi)害易發(fā)性工作中,災(zāi)害發(fā)育的地形、地質(zhì)條件比模型重要。
2)3 種變量取值方式在崩塌源識(shí)別精度上有差異,以信息量排序值為取值方式能得到最高評(píng)價(jià)精度,同時(shí),與信息量模型進(jìn)行耦合能優(yōu)化邏輯回歸模型的預(yù)測(cè)結(jié)果,這與前人研究結(jié)論一致。
3)邏輯回歸模型只是數(shù)學(xué)統(tǒng)計(jì)模型中的代表模型,變量取值方式對(duì)于其他預(yù)測(cè)模型是否有同樣的精度提升的效果還需進(jìn)一步研究。
4)案例研究區(qū)崩塌源總體處于坡度高于25°的斜坡帶,各方案結(jié)果均表明極高和高易發(fā)區(qū)分布于趕場(chǎng)向斜的北翼和馬頭場(chǎng)向斜的南翼的上沙溪廟組地層內(nèi)。