方 耀,顏梅春
(1.河海大學(xué) 地球科學(xué)與工程學(xué)院,江蘇 南京 211100)
主成分等變換及組合分類在半濕潤(rùn)流域的應(yīng)用
方 耀1,顏梅春1
(1.河海大學(xué) 地球科學(xué)與工程學(xué)院,江蘇 南京 211100)
以東灣流域?yàn)檠芯繀^(qū),首先對(duì)TM影像進(jìn)行主成分分析(PCA),纓帽變換,色調(diào)、亮度、飽和度彩色變換(HIS),并求得歸一化植被指數(shù)、歸一化建筑指數(shù)、歸一化水體指數(shù)、歸一化裸土指數(shù)、歸一化陰影指數(shù)和第四波段灰度共生矩陣紋理特征,構(gòu)造了新的特征影像;然后對(duì)其分別進(jìn)行PCA、獨(dú)立主成分分析(ICA)、最小噪聲分離(MNF)3種變換;再對(duì)變換后的結(jié)果分別進(jìn)行最大似然法、神經(jīng)網(wǎng)絡(luò)以及支持向量機(jī)(SVM)分類,以研究不同變換、不同分類方法的差異。提出了一種新的降低特征相關(guān)性的方法,并確定了最有效的一種分類—變換組合。結(jié)果表明,新特征降維方法的分類精度達(dá)到了93.457%,而單一特征降維方法最高分類精度為91.955%,證明該方法能更有效地提取影像特征。
PCA;ICA;MNF;特征組合;監(jiān)督分類;東灣流域
遙感圖像分類是信息提取的主要手段。由于氣候和人為活動(dòng)的影響,半濕潤(rùn)流域的地表、地物復(fù)雜破碎,分類難度較大;同時(shí)遙感影像本身的空間分辨率以及“同物異譜”、“異物同譜”也會(huì)對(duì)分類結(jié)果造成不同程度的影響,降低分類精度。隨著遙感技術(shù)的發(fā)展,一些新型的分類算法被提出,如專家系統(tǒng)、SVM、神經(jīng)網(wǎng)絡(luò)(NNC)等。影像波段間數(shù)據(jù)有不同程度的相關(guān)性,各特征間也有類似情況。目前,降低特征相關(guān)的方法主要有PCA、MNF、ICA等。葛山運(yùn)[1]提出了一種基于MNF、PCA和ICA的高光譜數(shù)據(jù)特征提取方法,通過(guò)ICA分解類別高度混合的數(shù)據(jù)、PCA的壓縮數(shù)據(jù)和MNF的高度降噪等變換提高了類別高度混合數(shù)據(jù)的分類精度;但這些方法很難較好地適應(yīng)光譜相應(yīng)特性變化和高度混合的地類,將導(dǎo)致重要信息的丟失。李策[2]等通過(guò)對(duì)比研究認(rèn)為最大似然法(MLC)要優(yōu)于SVM分類;而梁亮[3]等通過(guò)基于ICA與SVM算法的高光譜遙感影像分類發(fā)現(xiàn):ICA變換下,SCM分類要優(yōu)于MLC分類。紀(jì)娜[4]等認(rèn)為基于MNF變換的SVM分類能夠提高分類的精度。因此,如何選擇降維方法來(lái)提取遙感圖像上特定區(qū)域的有效信息,選用何種分類方法以達(dá)到最優(yōu)的分類效果,都是亟待解決的問(wèn)題。
1.1 特征提取方法
PCA是一種去除波段間的多余信息,將多波段的圖像信息壓縮到比原波段更有效的少數(shù)幾個(gè)轉(zhuǎn)換波段的方法[5]。MNF變換以信噪比最大化為變換準(zhǔn)則[6-7],將數(shù)據(jù)分解為一系列彼此不相關(guān)的成分,可減少后續(xù)處理的計(jì)算量。MNF變換具有PCA的性質(zhì),是一種正交變換,變換后得到向量的各元素互不相關(guān),第一分量集中了大量的信息,隨著波段數(shù)量的增加,影像質(zhì)量逐漸下降,變換后波段按照信噪比從大到小排列,通常用于噪聲去除、特征提取、數(shù)據(jù)降維等。ICA變換是用于數(shù)據(jù)特征提取的線性變換技術(shù),是基于信號(hào)的高階統(tǒng)計(jì)特性的分析方法,經(jīng)ICA分解出的各信號(hào)分量相互獨(dú)立。
1.2 分類方法
基于遙感影像的信息自動(dòng)提取方法大致可分為監(jiān)督分類、非監(jiān)督分類、決策樹分類、面向?qū)ο筇卣魈崛 ⒒诳臻g分析方法的信息提取5類。其中監(jiān)督分類方法是一種常用的遙感影像信息提取方法,本文采用監(jiān)督分類中MLC、NNC、SVM進(jìn)行實(shí)驗(yàn)。
MLC是基于統(tǒng)計(jì)理論的參數(shù)分類器,現(xiàn)已成為應(yīng)用最為廣泛的分類器[8]。其建立在貝葉斯準(zhǔn)則基礎(chǔ)上,且分類錯(cuò)誤概率最小,是風(fēng)險(xiǎn)最小的決策分析。NNC是近年發(fā)展起來(lái)的一種具有人工智能的分類方法。它用計(jì)算機(jī)模擬人的結(jié)構(gòu),用許多小的處理單元模擬生物的神經(jīng)元,以算法實(shí)現(xiàn)人腦的識(shí)別、記憶、思考過(guò)程,進(jìn)而應(yīng)用于圖像分類[9]。反向傳播(BP)網(wǎng)絡(luò)作為人工神經(jīng)網(wǎng)絡(luò)技術(shù)在遙感圖像分類處理中的主要應(yīng)用,通常將要分類的地物對(duì)象的條件集合或特征組合作為BP網(wǎng)絡(luò)的輸入模式,并給出期望輸出模式(預(yù)測(cè)類型)。SVM在解決小樣本、非線性及高維模式識(shí)別中表現(xiàn)出許多特有的優(yōu)勢(shì),并能推廣應(yīng)用到函數(shù)擬合等其他機(jī)器學(xué)習(xí)問(wèn)題中,基本原理見文獻(xiàn)[10]。
2.1 研究區(qū)概況
本文以伊洛河流域上游的東灣流域?yàn)檠芯繀^(qū),伊洛河包括伊河、洛河兩條河流,伊河是洛河的第一大支流。伊河面積占洛河的1/3,遠(yuǎn)超過(guò)其他支流,自成一個(gè)流域和水系,因此常把伊河和洛河兩條河流合稱為伊洛河。東灣屬于伊河河源地區(qū),為半濕潤(rùn)區(qū),屬于大陸性氣候;地類高度混合,部分農(nóng)田位于山溝內(nèi)部,不易與植被區(qū)分,未種耕地與裸土極易混淆。選用有較高光譜分辨率和適宜空間分辨率的TM影像為數(shù)據(jù)源,成像時(shí)間為2011年8月。此外,采用2003年分辨率為30 m的DEM數(shù)據(jù)來(lái)消除地形地貌噪聲。
2.2 實(shí)驗(yàn)方法
對(duì)原始的TM遙感影像進(jìn)行幾何校正、去云及陰影處理、大氣校正等預(yù)處理,再進(jìn)行以下變換或波段運(yùn)算得到各特征:①PCA變換,取前3個(gè)主成分;②纓帽變換(TC),取前3個(gè)分量:明度、綠度、黃度;③HIS變換得到色調(diào)、亮度、飽和度;④第四波段灰度共生矩陣紋理特征,得到能量、對(duì)比度、熵、均勻性、均值、方差、非相似度、相關(guān)性等8個(gè)分量特征;⑤ 歸一化植被指數(shù)(NDVI)、歸一化建筑指數(shù)(NDBI)[11]、歸一化裸土指數(shù)(BI)[12]、 歸一化水體指數(shù)(NDWI)[13]、歸一化陰影指數(shù)(NDUI)[14],具體見表1。
表1 各波段來(lái)源
將上述22個(gè)波段進(jìn)行合成得到新的特征影像,再對(duì)新的特征圖像分別進(jìn)行PCA、ICA、MNF變換。由于各變換前10個(gè)波段的特征值累計(jì)百分比分別達(dá)到99.99%(PCA)、99.99%(ICA)、88.72%(MNF),故本次實(shí)驗(yàn)選用變換后的前10個(gè)波段作為實(shí)驗(yàn)數(shù)據(jù)。
PCA變換有對(duì)遙感圖像噪聲考慮不足的缺陷;MNF在變換的同時(shí)考慮了遙感數(shù)據(jù)質(zhì)量評(píng)估參數(shù)——信噪比,從而比PCA變換具有更好的降維去噪能力;ICA變換不僅能消除多變量數(shù)據(jù)間的二階相關(guān)信息,而且能消除數(shù)據(jù)間的高階相關(guān),比PCA變換更能消除數(shù)據(jù)間的相關(guān)性。本文提出的特征降維方法包括3個(gè)相互聯(lián)系的階段:第一階段,利用MNF變換對(duì)遙感圖像進(jìn)行處理,得到一系列按信噪比從大到小排列的彼此不相關(guān)的MNF成分,選擇前10個(gè)MNF分量作為下一階段處理的輸入數(shù)據(jù);第二階段,分別利用PCA變換和ICA變換對(duì)以上10個(gè)MNF分量進(jìn)行處理,得到10個(gè)PCA分量和10個(gè)ICA分量;第三階段,對(duì)得到的10個(gè)PCA分量和ICA分量進(jìn)行重新組合(PCA前5個(gè)分量和ICA后5個(gè)分量),進(jìn)而得到含有10個(gè)分量的新特征影像。對(duì)新的特征影像分別進(jìn)行MLC、NNC、SVM分類,并與PCA、ICA、MNF單獨(dú)分類結(jié)果進(jìn)行對(duì)比研究,具體流程見圖1。
圖1 實(shí)驗(yàn)流程圖
通過(guò)對(duì)影像的研究,將研究區(qū)分為水體、建筑、植被、耕地、裸土和其他6類。從預(yù)處理后的TM影像中選取以下分類樣本:水體、建筑、植被、耕地、裸土和其他,其訓(xùn)練樣本數(shù)分別為384、398、601、307、144和363;驗(yàn)證樣本數(shù)分別為424、254、272、218、65和265。分別用MLC、NNC、SVM方法對(duì)各變換得到的前10個(gè)波段進(jìn)行分類,并運(yùn)用形態(tài)學(xué)算子,以類別集群的方法,使用3×3的變換核對(duì)分類圖像進(jìn)行侵蝕操作,去除“椒鹽”。經(jīng)過(guò)類別集群處理后的圖像更為平滑,組合的總體精度和Kappa系數(shù)都有所提高,說(shuō)明類別集群算法可改善分類結(jié)果,使其更接近真實(shí)地物,最后得到分類結(jié)果見圖2。
圖2 分類影像圖(分類+變換)
2.3 結(jié)果與精度驗(yàn)證
運(yùn)用上述方法進(jìn)行分類后,利用混淆矩陣和分類精度指標(biāo)對(duì)其進(jìn)行評(píng)價(jià),得到特征降維與分類12種組合的總體精度與Kappa系數(shù)(表2)。其中,分類效果最好的SVM-MNF+PCA+ICA組合的混淆矩陣見表3。
表2 分類總體精度和Kappa系數(shù)
表3 MNF+PCA+ICA的SVM分類混淆矩陣
1)本文提出的方法總體精度和Kappa系數(shù)都要優(yōu)于PCA、ICA、MNF單獨(dú)分類的結(jié)果。無(wú)論是新方法、PCA變換、ICA變換還是MNF變換,從總體精度和Kappa系數(shù)角度考慮,SVM分類效果最好,其次是MLC,NNC分類效果最差。
2)3種單獨(dú)的特征降維方法比較:對(duì)于MLC,MNF變換的分類結(jié)果要優(yōu)于ICA變換和PCA變換;對(duì)于NNC,MNF變換的分類結(jié)果要優(yōu)于ICA變換,而二者都明顯優(yōu)于PCA變換;對(duì)于SVM,PCA變換的分類結(jié)果要優(yōu)于MNF變換, ICA變換的分類結(jié)果最差,但其分類總體精度也達(dá)到了91.274 8%,Kappa系數(shù)達(dá)到了0.895 7,說(shuō)明無(wú)論針對(duì)何種變換方法,SVM分類的結(jié)果都比較理想。
3)最優(yōu)的分類—變換組合是基于MNF+PCA+ICA變換的SVM分類,其總體精度達(dá)到93.457 9%,Kappa系數(shù)達(dá)到0.920 0;而效果最差的分類—變換組合是基于PCA變換的NNC分類,其總體精度為75.127 5% ,Kappa系數(shù)為0.700 8。
實(shí)驗(yàn)證明,新的特征降維方法能更有效地提取影像特征,對(duì)于提高影像分類的精度,使分類結(jié)果更接近真實(shí)地表,具有一定指導(dǎo)意義。
[1] 葛山運(yùn).基于MNF、PCA與ICA結(jié)合的高光譜數(shù)據(jù)特征提取方法[J].城市勘測(cè),2013(2):103-106
[2] 李策,何秉宇,王慧.沙漠化遙感分類方法對(duì)比分析:以新疆塔河下游為例[J].新疆環(huán)境保護(hù),2012,34(4):10-15
[3] 梁亮,楊敏華,李英芳.基于ICA與SVM算法的高光譜遙感影像分類[J].光譜學(xué)與光譜分析,2010,30(10):2 724-2 728
[4] 紀(jì)娜,李銳,李靜.MNF和SVM在遙感影像計(jì)算機(jī)分類中的應(yīng)用[J].水土保持通報(bào),2009,29(6):153-158
[5] ZHANG C Y, GUO S, GUAN Y N, et al. The Approaches of Cover Classification of the Wuda Coal Fire Area[J].Journal of Remote Sensing,2011,15(1):149-154
[6] Nielsen A A. Kernel Maximum Autocorrelation Factor and Minimum Noise Fraction Transformations[J]. IEEE Trans Image Process,2011,20(3):612-624
[7] 李海濤,顧海燕,張兵,等.基于MNF和SVM的高光譜遙感影像分類研究[J].遙感信息,2007,22(5):12-15,25
[8] CHEN C X, HU C M. Effect of Different Radiation Correction Methods of Landsat TM Data on Land-cover Remote Sensing Classification[J].Journal of Remote Sensing,2013,17(6):320-326
[9] 潘遠(yuǎn),楊景輝,武文波.粗糙集約簡(jiǎn)的神經(jīng)網(wǎng)絡(luò)遙感分類應(yīng)用[J].遙感信息,2012,27(4):86-90
[10] ZHANG F F, LI W Z, LU L Y, et al. Technologies of Extracting Land Utilization Information Based on SVM Method with Mutiwindow Texture[J].Journal of Remote Sensing,2012,16(1):67-72
[11] 陳志強(qiáng),陳健飛.基于NDBI指數(shù)法的城鎮(zhèn)用地影像識(shí)別分析與制圖[J].地球信息科學(xué),2006,8(2):137-140
[12] Rikimaru A. ITTO Workshop on Utilization of Remote Sensing in Site Assessment and Planning for Rehabilitations of Logged-over Forest [C]//Landsat TM Data Processing Guide for Forest Canopy Density Mapping and Monitoring Model, Bangkok,1996:1-8
[13] 徐涵秋.利用改進(jìn)的歸一化差異水體指數(shù)(MNDWI)提取水體信息的研究[J].遙感學(xué)報(bào),2005,9(5):589-595
[14] 周堅(jiān)華,周一凡,郭曉華,等.城鎮(zhèn)陰影區(qū)植物分布信息提取與亮度修復(fù)的方法[J].華東師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2011(6):1-9
P237
B
1672-4623(2017)01-0019-03
10.3969/j.issn.1672-4623.2017.01.006
方耀,碩士研究生,主要研究方向?yàn)檫b感與地理信息系統(tǒng)應(yīng)用。
2015-12-07。
項(xiàng)目來(lái)源:國(guó)家自然科學(xué)基金資助項(xiàng)目(41130639);中央高?;究蒲袠I(yè)務(wù)專項(xiàng)資助項(xiàng)目(2009B11714)。