陳東岳
(湖南省地質(zhì)礦產(chǎn)勘查開發(fā)局四一七隊(duì) 湖南衡陽(yáng) 421001)
判別分析來(lái)自于英國(guó),是統(tǒng)計(jì)學(xué)家Pearson提出的。這一理論已經(jīng)獲得研究對(duì)象的實(shí)測(cè)數(shù)據(jù),同時(shí)還在分類情況下,建立了相應(yīng)的判別準(zhǔn)則。因?yàn)檫@一理論主要是從實(shí)測(cè)數(shù)據(jù)出發(fā),受人為因素影響小、判別方式十分豐富,人們可以結(jié)合不同的需求,構(gòu)建起不同模型,其已經(jīng)被廣泛的應(yīng)用在不同領(lǐng)域。
距離判別方式屬于判別分析當(dāng)中的一種新式,基本思想主要是結(jié)合訓(xùn)練樣本,計(jì)算出不同的重心。而判別準(zhǔn)則則是針對(duì)任意一個(gè)新的樣本,如果其和第i種重心距離最近,則認(rèn)為其是第i類,這種情況下,距離的值最小。本文所指的距離主要是存在統(tǒng)計(jì)意義的馬氏距離。主要判別分析流程是,對(duì)現(xiàn)有的觀測(cè)樣本進(jìn)行訓(xùn)練,提出不同的總體信息,同時(shí)構(gòu)造出判別準(zhǔn)則以及判別公式,使用判別準(zhǔn)則以及判別公式針對(duì)新樣本做出深入分析和研究,最終得到新的樣本所屬總體[1]。
我們將泥石流溝樣本總體設(shè)為G={Y1,Y2…Ym}T是m元總體,也就是說(shuō),在泥石流溝當(dāng)中,m為評(píng)價(jià)指標(biāo),其中的某一個(gè)樣本Y={y1,y2…ym}T。使用熵值法對(duì)泥石流溝中的各個(gè)指標(biāo)進(jìn)行確定,明確各個(gè)指標(biāo)當(dāng)中的權(quán)重W={w1,w2…wm},賦予每一個(gè)原始樣本權(quán)重,從而獲取新的加權(quán)樣本X=WY。通過(guò)計(jì)算得出總體G斜差方矩陣公式如下所示:
其中的樣本X和總體G兩者的馬氏距離公式為:
通過(guò)這一內(nèi)容,便能夠?qū)颖究傮w之間的馬氏距離進(jìn)行計(jì)算了。
如果判別準(zhǔn)則建立完成之后,要對(duì)其誤判概率進(jìn)行分析,我們常用的方式是將訓(xùn)練樣本作為基本基礎(chǔ)的誤判率判定方法,分別為回代估計(jì)法和較差確認(rèn)估計(jì)法。設(shè)兩個(gè)總體分別為總體G1和G2,G1中一共有n1個(gè)樣本,而G2當(dāng)中一共有n2個(gè)樣本。其中回帶估計(jì)法就是把全部訓(xùn)練樣本當(dāng)成新的樣本帶入到判別準(zhǔn)則當(dāng)中,此后使用n12代表將G1當(dāng)中的樣本誤判成G2中的個(gè)數(shù)。而n12則表示將總體G2中的樣本誤判成G1中的個(gè)屬于[2]。這種情況下,誤判率則為:
以某水電站為例,該水電站位于湖南省某山地和平原的過(guò)度地段,水電站區(qū)域內(nèi)有峽谷、高山、山間丘陵以及平壩等,因構(gòu)造活動(dòng)而受到較為明顯的影響,該地的物源十分豐富,制備覆蓋率不高,水土流失情況十分嚴(yán)重。在雨季,發(fā)生過(guò)嚴(yán)重程度不等的泥石流,該地泥石流的潛在風(fēng)險(xiǎn)較高。這種情況下,對(duì)該地泥石流危險(xiǎn)度進(jìn)行評(píng)價(jià)十分重要。
相關(guān)技術(shù)人員從該地選擇50條現(xiàn)場(chǎng)調(diào)查泥石流溝作為研究對(duì)象,這些研究對(duì)象當(dāng)中存在40條已經(jīng)應(yīng)用傳統(tǒng)方式確定了危險(xiǎn)度登記的泥石流溝作為訓(xùn)練樣本。而傳統(tǒng)方法主要是指灰色關(guān)聯(lián)度法,通過(guò)這種方式對(duì)泥石流危險(xiǎn)度進(jìn)行劃分,結(jié)合相關(guān)規(guī)范將其劃分為輕度危險(xiǎn)、中度危險(xiǎn)和重度危險(xiǎn)、極度危險(xiǎn)[3]。
借助綜合分析野外調(diào)查資料和衛(wèi)星航片解譯,結(jié)合研究地區(qū)的實(shí)際情況,從中提取出面積S1(km2)、主溝長(zhǎng)度 S2(km)、流域最大相對(duì)高差S3(km)、流域切割密度S4(km/km2)等作為評(píng)價(jià)指標(biāo)。在這些評(píng)價(jià)指標(biāo)當(dāng)中,沒(méi)有考慮降雨所帶來(lái)的影響,主要是因?yàn)樗芯康膮^(qū)域降雨情況大致相同。對(duì)本次研究中的影響較小,屬于可忽略的指標(biāo),因此沒(méi)有將其作為評(píng)價(jià)指標(biāo)。但是降雨量的多少,對(duì)于泥石流的發(fā)生屬于一種較為關(guān)鍵的因素。如果對(duì)其他區(qū)域進(jìn)行建模,可以結(jié)合區(qū)域降雨情況,將其作為其中的一項(xiàng)重要指標(biāo)。
表1 泥石流評(píng)價(jià)指標(biāo)
在泥石流危險(xiǎn)度分類當(dāng)中,不同指標(biāo)帶來(lái)的影響也不同,這種情況下,結(jié)合40條泥石流溝樣本數(shù)據(jù),通過(guò)熵值法方式,將各個(gè)指標(biāo)的權(quán)重進(jìn)行計(jì)算。然后采用指標(biāo)權(quán)重的確定方式進(jìn)行具體計(jì)算。通過(guò)權(quán)重能夠得出,5個(gè)評(píng)價(jià)指標(biāo)中,S1和S5兩者是最為重要的。
確定了評(píng)價(jià)指標(biāo)的權(quán)重之后,對(duì)這40個(gè)賦權(quán)之后的訓(xùn)練樣本進(jìn)行分析,可以使用距離判別方式構(gòu)建起相應(yīng)的函數(shù),能夠給出不同泥石流溝危險(xiǎn)度函數(shù)的具體表達(dá)方式。此外,還可以結(jié)合函數(shù),提供分別代表中度危險(xiǎn)、高度危險(xiǎn)以及極度危險(xiǎn)的判別函數(shù)。為了對(duì)已經(jīng)建立好的判別準(zhǔn)則進(jìn)行檢查,可以借助較差確認(rèn)估計(jì)法對(duì)判率進(jìn)行計(jì)算,結(jié)果發(fā)現(xiàn)判別結(jié)果和傳統(tǒng)分類結(jié)果完全相符,同時(shí)判別樣本的數(shù)是0,因此這一模型沒(méi)有誤差。
對(duì)于加權(quán)距離判別分析理論在泥石流危險(xiǎn)度評(píng)價(jià)技術(shù)而言,我國(guó)尚處于初步嘗試階段,存在一系列問(wèn)題還需要深入研究,如對(duì)危險(xiǎn)度帶來(lái)影響的因素,怎樣選取判別因素等。相關(guān)工作人員在日后工作中,需借助工程實(shí)例獲取具有代表性的樣本。
[1]陳鵬宇,喬景順,彭祖武,謝凱,余宏明.基于等級(jí)相關(guān)的泥石流危險(xiǎn)因子篩選與危險(xiǎn)度評(píng)價(jià)[J].巖土力學(xué),2013,34(05):1409~1415.
[2]陳鵬宇,余宏明,劉勇,李才,彭祖武.基于獨(dú)立信息數(shù)據(jù)波動(dòng)賦權(quán)的泥石流危險(xiǎn)度評(píng)價(jià)[J].巖土力學(xué),2013,34(02):449~454.
[3]趙鑫,程尊蘭,劉建康,劉大翔,時(shí)亮.云南東川地區(qū)單溝泥石流危險(xiǎn)度評(píng)價(jià)研究[J].災(zāi)害學(xué),2013,28(01):102~106.