【摘要】林分類型信息的提取是遙感影像分類中的熱點和難點,而大興安嶺地區(qū)又是我國重點林區(qū)和天然林主要分布區(qū)之一,植被類型豐富,種類繁多,為林分類型精確識別帶來了很大的難度。本文采用的數(shù)據(jù)為黑龍江省大興安嶺地區(qū)塔河縣塔河林業(yè)局盤古林場的SPOT-5影像和不同時相的RADARSAT-2全極化SAR影像組合而成的11個波段為變量,其數(shù)據(jù)為像元值,目視解譯選取的訓練樣本分為落葉松(Larixgmelinii)、樟子松(Pinussylvestrisvarmongolica)、白樺(Betulaplatyphylla)、非林地、水體,五類共計1250個象元值。旨在通過分析五類總體的統(tǒng)計學性質,為提高林分類型的分類精度提供新思路。
【關鍵詞】林分類型 判別分析 主成分分析 多維標度法
一、多元正態(tài)分布均值向量和協(xié)方差陣的檢驗
(一)單一總體協(xié)方差陣Σ未知時均值向量的檢驗
選取白樺為總體
則H0:μ=μ0 H1:μ≠μ0
其中μ0為選取的為小興安地區(qū)的白樺象元均值,目的考察不同地區(qū)同一樹種象元值是否
μ0=(.244156192,.692591546,.041963218,.064344538,.1375 43219,.885053115,.090804954,.055939596,.097414752,.21043111, 43.71188295)
假設H0成立,檢驗統(tǒng)計量為
■
利用Spss求得樣本離差陣S,并由matlab求解得:■0.1041*(250-11)/(250-1)*11)=0.01225
查表在0.01水平下F(11,239)=1.57>0.01225接受原假設μ=μ0均值檢驗說明不同地域之間的相同樹種對應的像元值平均偏差不大,也就是說同種樹種象元識別受地域影響不大。
(二)單一總體協(xié)方差檢驗
檢驗假設:H0:Σ=Ip H1:Σ≠Ip
統(tǒng)計量為:■
由一中的樣本離差陣S計算-2lnλ=1.18426;
0.05水平下χ2(66)=48.305>-2lnλ,
0.005水平下χ2(66)=40.158>-2lnλ,
在給定水平下均接受原假設,即說明選取的變量之間的相關程度不高,即波段之間相關性不強。
二、判別分析
對新樣本70個待定象元劃入五個總體進行判別分析:
(一)馬氏距離判別法
則待判定樣本到各組的馬氏距離是:■
判別規(guī)則為:若■,則X判別為第i類。
可以設■,則:■,計算得到W后,可得:
■
以X=(0.2444 0.6791 0.0395 0.0786 0.1146 0.9252 0.0643 0.0953 0.0848 0.3309 52.0485),分別計算得到五個馬氏距離,其中■=2.005最小,故該樣品用距離判定法得到的結果為第2類,即為落葉松。
(二)貝葉斯判別法和費希爾判別法
費希爾判別:
在分析中使用第一個4規(guī)范判別式函數(shù)。
1通過4的顯著性為0.000,表示四個判別函數(shù)可以顯著區(qū)分各類;2通過4與3通過4的顯著性為0.00,表示除去一,二函數(shù)能將各類顯著區(qū)分;4的顯著性大于0.05,表示除了前三個函數(shù)不能區(qū)分各類。
根據(jù)標準化系數(shù)和未標準化系數(shù)來分別判別計算每個個案的判別得分。利用計算得到的每類的重心在平面上的位置,可用于距離判別。下面計算各組先驗概率,在此選擇的是各組先驗概率相等,進而計算每組的分類函數(shù),用于貝葉斯判別分析。
得到最終分類結果。分類結果對66.2%的個案進行了正確分類。分類結果精度較低,原因在于總體間的差異性較小,從專業(yè)角度分析由于樹種對不同波段的反射特性基本差別不顯著,導致象元值之間的差異也不顯著,這點在組間差異檢驗中有所體現(xiàn)。但是就遙感分類來說,能達到期望精度要求。
三、主成分分析
(一)利用主成分分析降維去相關
本章選取了20個行業(yè)15個經濟指標做分析。自2011年起,統(tǒng)計口徑為年主營業(yè)務收入2000萬元及以上的工業(yè)企業(yè)。分別是:X1:流動資產合計,X2:應收帳款,X3:產成品,X4:資產合計,X5:負債合計,X6:主營業(yè)務收入,X7:主營業(yè)務成本,X8:主營業(yè)務稅金及附加,X9:銷售費用,X10:管理費用,X11:財務費用,X12:利息支出,X13:利潤總額,X14虧損企業(yè)虧損額,X15:應交增值稅,單位統(tǒng)一為億元。
數(shù)據(jù)采用15個經濟指標對行業(yè)的發(fā)展情況進行評判,采用主成分分析減少指標個數(shù)。雖然變量單位相同,但是數(shù)據(jù)大小差異大,先對數(shù)據(jù)進行標準化。在軟件計算時spss會自動標準化,所以輸入原始數(shù)據(jù)就可以了。通過計算初始變量的相關系數(shù)矩陣表,可以看到多個變量之間的相關系數(shù)較大,且對應的顯著性普遍偏小,說明變量之間存在顯著的相關性。特別是很多變量達到了0.8甚至0.9以上,說明其相關程度很大,因此進行主成分分析很有必要。
通過對原始數(shù)據(jù)進行主成分提取,可以得到主成分的特征值與各自貢獻率表。實際應用中常取累計方差貢獻率大于等于90%),確定主成分的個數(shù)??梢钥闯?,前4個主成分的累計貢獻率已經達到92.908%,因此,取前4個主成分即可滿足要求。則將維度由15降到了4。
(二)利用主成分分析進行綜合評價
由相關系數(shù)矩陣計算特征根為及特征根對應的特征向量,通過分析,我們以15個特征根為權計算綜合得分。進而得到各行業(yè)綜合得分及排名,由計算結果可以看出木材加工和木、竹、藤、棕、草制品業(yè)在這幾個經濟指標下,綜合排名在第一,而原始數(shù)據(jù)也反映該行業(yè)存在明顯優(yōu)勢。
四、多維標度法
為分析不同省份森林受災水平,用多維標度法對27個省份進行分析,將結果呈現(xiàn)在圖上。選用:森林火災次數(shù)(次),火場總面積(公頃),森林病蟲鼠害發(fā)生面積(萬公頃),森林病蟲鼠害防治率(%)這4個變量。利用標準化后的這四個變量計算出距離陣,用spss分析,可得到結果,即樣品間的距離陣,這里采用的是歐式距離,距離陣為歐式距離陣。輸出結果得到Young壓力指數(shù)為0.14486K壓力指數(shù)小于15%,RSQ為93.781%,所以認為該模型擬合的結果還是可以接受的。
通過繪制,得到在二維平面上直觀的反應27個省在森林災害4個指標體系中所處的位置。27(新疆)21(海南)距離最遠,從原始數(shù)據(jù)來看新疆海南森林災害較為嚴重,特別是鼠害面積上在27個省中顯得尤為突出。而海南在林火面積上位于第一,3(內蒙古)綜合林火面積與鼠害面積因而距離也遠。17(廣西)與其他省比鼠害防治率低,19(四川)鼠害不嚴重,防治較好,但林火嚴重。綜合分析第一維橫軸主要是林火災害水平,第二維縱軸主要是鼠害水平。得到的線性擬合圖是歐式距離模型線性擬合的散點圖,由散點圖可以看出,歐式距離(實際距離)與差異點(擬合距離)在y=x直線附近,這說明模型擬合的效果是比較理想的。
作者簡介:屈曉陽(1992-),女,滿族,遼寧鳳城人,遼寧大學碩士研究生在讀,應用統(tǒng)計。