梁文海,劉吉?jiǎng)P,陳 琦,陳顯棟,鐘仕全
(1.廣西林業(yè)勘測設(shè)計(jì)院,南寧 530000;2.安徽科技學(xué)院,安徽 鳳陽 233100;3.廣西壯族自治區(qū)氣象減災(zāi)研究所/國家衛(wèi)星氣象中心遙感應(yīng)用試驗(yàn)基地,南寧 530022)
近10年來,中國對(duì)地觀測衛(wèi)星產(chǎn)業(yè)迅速發(fā)展,先后發(fā)射了“資源衛(wèi)星”(ZY1-02C,CBERS-04,ZY3-02)與“高分辨率對(duì)地觀測系統(tǒng)衛(wèi)星”(GF-1,GF-2,GF-4),其中高分二號(hào)(以下簡稱“GF-2”)衛(wèi)星的發(fā)射,標(biāo)志著中國遙感衛(wèi)星進(jìn)入了亞米級(jí)的“高分時(shí)代”。GF-2衛(wèi)星觀測幅寬45km,星上搭載有2臺(tái)高分辨率0.8m全色、4m多光譜相機(jī)[1]。GF-2同時(shí)具有高分辨率、高輻射精度、高定位精度和快速姿態(tài)機(jī)動(dòng)能力等特點(diǎn),在土地利用動(dòng)態(tài)監(jiān)測、森林資源調(diào)查、城鄉(xiāng)規(guī)劃監(jiān)測評(píng)價(jià)、交通路網(wǎng)規(guī)劃及環(huán)境保護(hù)與監(jiān)測等領(lǐng)域具有廣泛的應(yīng)用潛力[2]。
吳小娟等[3]以深圳大鵬半島GF-2衛(wèi)星數(shù)據(jù)為例,利用面向?qū)ο蟮姆椒ㄌ崛『0毒€,表明GF-2對(duì)海岸線提取的精度高,效率快。劉肖姬等[4]以云南東川區(qū)為研究對(duì)象,利用GF-2衛(wèi)星數(shù)據(jù)地提取滑坡災(zāi)害信息,表明GF-2衛(wèi)星數(shù)據(jù)可以較好地提取滑坡災(zāi)害信息,基本滿足滑坡的災(zāi)害識(shí)別要求。梁樹能等[5]與路云閣等[6]利用GF-2衛(wèi)星數(shù)據(jù)開展遙感地質(zhì)調(diào)查與礦山監(jiān)測應(yīng)用評(píng)價(jià),結(jié)果表明,GF-2衛(wèi)星數(shù)據(jù)完全能夠滿足高精度小尺度的遙感地質(zhì)調(diào)查與礦山監(jiān)測的技術(shù)要求。王忠武等[2]以包頭市青山區(qū)等3個(gè)區(qū)作為典型試驗(yàn)區(qū),開展GF-2衛(wèi)星數(shù)據(jù)在新增建設(shè)用地監(jiān)測中的應(yīng)用分析。結(jié)果表明,基于GF-2衛(wèi)星數(shù)據(jù)的新增建設(shè)用地監(jiān)測圖斑屬性精度、面積精度,以及最小可監(jiān)測圖斑面積,都能滿足土地利用動(dòng)態(tài)遙感監(jiān)測業(yè)務(wù)相關(guān)規(guī)范要求。綜上可知,目前對(duì)GF-2衛(wèi)星數(shù)據(jù)的應(yīng)用主要集中在各行業(yè)示范應(yīng)用,如提取海岸線、地質(zhì)調(diào)查與礦山監(jiān)測、土地利用動(dòng)態(tài)遙感監(jiān)測等方面,可查詢的文獻(xiàn)少,研究層次較低。
林業(yè)資源遙感監(jiān)測是高分?jǐn)?shù)據(jù)應(yīng)用的重要領(lǐng)域之一[7-9],然而查閱文獻(xiàn)卻發(fā)現(xiàn),針對(duì)GF-2數(shù)據(jù)的林業(yè)遙感研究尚未見于報(bào)道。因此,本文以廣西橫縣平朗鄉(xiāng)為例,采用面向?qū)ο蟮姆诸惙椒?使用不同的分類器對(duì)GF-2影像進(jìn)行桉樹提取并進(jìn)行精度評(píng)價(jià)分析,旨在為廣大林業(yè)工作者利用GF-2數(shù)據(jù)進(jìn)行桉樹信息的提取提供參考,也期望能為國產(chǎn)高分?jǐn)?shù)據(jù)應(yīng)用于林業(yè)監(jiān)測提供有益的探索。
橫縣平朗鄉(xiāng)位于廣西東南部,北回歸線以南,地處22°08′~23°30′N,108°48′~109°37′E。鄉(xiāng)域地形四周高、中間低,形成寬谷平原和盆地,地貌以丘陵和平原為主。鄉(xiāng)內(nèi)水熱資源豐富,樹種繁多,林木生長迅速,是廣西桉樹產(chǎn)業(yè)的優(yōu)勢產(chǎn)區(qū)與特色產(chǎn)區(qū)[10]。
平朗鄉(xiāng)地處南亞熱帶南緣,水熱資源豐富,樹種繁多,為減少各種因素對(duì)數(shù)據(jù)處理的干擾,本研究選取云量較少、質(zhì)量較好的4景GF-2影像,研究數(shù)據(jù)來源于中國資源衛(wèi)星應(yīng)用中心(http://www.cresda.com/CN/),采集時(shí)間分別為2015年8月9日和10月22日(表1),級(jí)別L1A,空間分辨率全色1m,多光譜4 m。
非遙感數(shù)據(jù)有:橫縣森林資源現(xiàn)狀數(shù)據(jù);研究區(qū)1∶30萬DEM數(shù)據(jù);利用手持GPS儀實(shí)測的桉樹分布數(shù)據(jù)(圖1)。
表1 研究區(qū)影像信息表Tab.1 Images of study area
為了消除遙感數(shù)據(jù)的誤差,提高分類的精度,需要對(duì)數(shù)據(jù)進(jìn)行預(yù)處理。數(shù)據(jù)預(yù)處理包括影像正射校正,融合、鑲嵌和裁剪以及主成分分析。
1) 影像校正。以0.5m分辨率的航片作為基準(zhǔn)影像,先對(duì)全色影像正射校正,校正精度大于1個(gè)像元;然后再以全色為參考影像,對(duì)多光譜影像正射校正,精度大于0.5個(gè)像元。正射校正的模型為有理多項(xiàng)式系數(shù)模型。
2) 影像融合、鑲嵌和裁剪。對(duì)同景全色影像與多光譜影像融合處理,方法選擇主成分變換法(Principal Component,PC)。融合完成后,對(duì)融合影像作基于地理坐標(biāo)的無縫鑲嵌與勻色處理。鑲嵌完成后,按照平朗鄉(xiāng)鄉(xiāng)界裁剪獲得研究影像(圖1)。
圖1 研究區(qū)位置與樣本分布
3) 主成分分析(Principal Components Analysis,PCA)。因單個(gè)波段經(jīng)處理后都可得到8個(gè)波段的紋理向量,如對(duì)GF-2的每個(gè)波段都進(jìn)行紋理提取,將會(huì)生成32個(gè)向量。同時(shí)GF-2波段間相關(guān)性高,為減輕工作量,降低信息冗余,對(duì)裁剪后的影像進(jìn)行降維處理。本文對(duì)研究區(qū)影像進(jìn)行主成分分析變換,變換后各波段信息量分布如表2所示。主成分的第一個(gè)波段(PCA-1)包含了原影像約97.9%的信息,因此采用該波段的紋理信息代表原影像的全部紋理信息。
傳統(tǒng)的影像分類方法主要基于像元的方法,但隨著遙感影像分辨率的不斷提高,對(duì)地物細(xì)節(jié)內(nèi)容刻畫越趨豐富,基于像元的分類方法會(huì)產(chǎn)生大量“胡椒鹽”等噪聲問題,致使分類結(jié)果不甚理想[11]。面向?qū)ο蟮姆诸惙椒軌驈浹a(bǔ)傳統(tǒng)分類方法的不足,綜合考慮像元的光譜信息、對(duì)象內(nèi)部的結(jié)構(gòu)、紋理以及相鄰對(duì)象之間的關(guān)聯(lián)信息,對(duì)高分?jǐn)?shù)據(jù)的解譯效果要優(yōu)于基于像素的分析效果[12-13]。本文研究針對(duì)GF-2影像,采用面向?qū)ο蟮姆诸惙椒?表3),使用5種分類方法進(jìn)行桉樹提取,技術(shù)流程如圖2所示。
表2 主成分分析波段信息量分布Tab.2 The information distribution of principal component analysis
圖2 面向?qū)ο蟮蔫駱涮崛〖夹g(shù)流程圖
分類方法說明參考文獻(xiàn)貝葉斯(Bayes)貝葉斯分類算法是統(tǒng)計(jì)學(xué)的一種分類方法,它是一類利用概率統(tǒng)計(jì)知識(shí)進(jìn)行分類的算法。在許多場合,貝葉斯(Na?veBayes,NB)分類算法可以與決策樹和神經(jīng)網(wǎng)絡(luò)分類算法相媲美,該算法能運(yùn)用到大型數(shù)據(jù)庫中,而且方法簡單、分類準(zhǔn)確率高、速度快。[14]決策樹(DecisionTree,DST)決策樹是在已知各種情況發(fā)生概率的基礎(chǔ)上,通過構(gòu)成決策樹來求取凈現(xiàn)值的期望值大于等于零的概率,評(píng)價(jià)項(xiàng)目風(fēng)險(xiǎn),判斷其可行性的決策分析方法,是直觀運(yùn)用概率分析的一種圖解法。[15-16]K最近鄰(KNearestNeighbor,KNN)K最近鄰分類算法是數(shù)據(jù)挖掘分類技術(shù)中最簡單的方法之一。KNN算法的核心思想是如果一個(gè)樣本在特征空間中的K個(gè)最相鄰的樣本中的大多數(shù)屬于某一個(gè)類別,則該樣本也屬于這個(gè)類別,并具有這個(gè)類別上樣本的特性。[17]隨機(jī)森林(RandomTrees,RDT)隨機(jī)森林指的是利用多棵樹對(duì)樣本進(jìn)行訓(xùn)練并預(yù)測的一種分類器;其輸出的類別是由個(gè)別樹輸出的類別的眾數(shù)而定。[18-19]支持向量機(jī)(SupportVectorMachine,SVM)支持向量機(jī)是一種建立在統(tǒng)計(jì)學(xué)習(xí)理論(StatisticalLearningTheory,SLT)基礎(chǔ)上的機(jī)器學(xué)習(xí)方法。SVM可以自動(dòng)尋找那些對(duì)分類有較大區(qū)分能力的支持向量,由此構(gòu)造出分類器,可以將類于類之間的間隔最大化,因而有較好的推廣性和較高的分類精準(zhǔn)率。[20]
面向?qū)ο蠓诸惙椒ǖ幕玖鞒淌窍葘⒂跋穹指畛蔀橐粋€(gè)個(gè)對(duì)象,待對(duì)象分割完成后再采用各種分類方法對(duì)這些對(duì)象進(jìn)行分類。因此,影像分割質(zhì)量的好壞直接影響著影像解譯的結(jié)果,分割算法選擇多尺度分割(Multi-resolution Segmentation),如何選擇合適的尺度至關(guān)重要。由圖3可知:分割尺度為 60時(shí),圖斑分割不徹底,存在一個(gè)對(duì)象包含了多種地物的情況,難以有效分類;分割尺度為40時(shí),圖斑過于破碎,同一個(gè)地物被分割成幾個(gè)圖斑,不利于分類;分割尺度為50時(shí),圖斑分割合適,其分割線與地物分界線吻合度高,相對(duì)兼顧了研究區(qū)各種植被的局部細(xì)節(jié)以及空間幾何分布特征。本研究經(jīng)過多次試驗(yàn),最后確定分割尺度參數(shù)為50,光譜因子為0.9,形狀因子為0.1,緊湊度為0.5,光滑度為0.5,藍(lán)、綠、紅、近紅、PCA-1波段權(quán)重比分別是1∶1∶1∶1∶0。
圖3 多尺度分割影像Fig.3 Multi-scale segmentation images
根據(jù)桉樹提取的需要,將研究區(qū)地類分為建筑與裸地、農(nóng)地、其他闊葉樹、水域、松樹和桉樹等6類。通過野外調(diào)查,結(jié)合橫縣森林資源現(xiàn)狀數(shù)據(jù),選取均勻分布于研究區(qū)的各種地類樣本共120個(gè);其中建筑與裸地20個(gè),農(nóng)地20個(gè)、其他闊葉樹20個(gè)、水域10個(gè)、松樹25個(gè)、桉樹25個(gè)。選取研究區(qū)影像的光譜特征(包括藍(lán)、綠、紅、近紅、Brightness,max diff共6個(gè)光譜特征)及PCA-1波段的灰度共生矩陣的紋理特征(包括Homogeneity,Contrast,Dissimilarity,Entropy,Angular Second Moment,mean,standard Deviation,Correlation共8個(gè)紋理特征)共14個(gè)影像特征,分別采用貝葉斯(Bayes)、決策樹(DST)、K最近鄰(KNN)、隨機(jī)森林(RDT)、支持向量機(jī)(SVM)5種分類器對(duì)同一樣本行進(jìn)訓(xùn)練及分類。
使用同一套訓(xùn)練樣本,分別利用貝葉斯、決策樹、最近鄰法、支持向量機(jī)及隨機(jī)森林等5種分類器提取研究區(qū)桉樹信息,得到桉樹空間分布情況如圖4所示。通過對(duì)比可知,5種分類器提取的桉樹空間分布情況相對(duì)一致。平朗鄉(xiāng)的桉樹主要分布在該鄉(xiāng)的南部區(qū)域,是因?yàn)樵搮^(qū)域以丘陵為主,海拔均小于160m,且水熱資源豐富,利于桉樹生長。
圖4 5種分類器分類結(jié)果
根據(jù)實(shí)地調(diào)查數(shù)據(jù),結(jié)合橫縣森林資源現(xiàn)狀數(shù)據(jù)及Goolge Earth高分辨率影像數(shù)據(jù)選取驗(yàn)證樣本,保證樣本屬性的準(zhǔn)確性。根據(jù)分類規(guī)則,分類結(jié)果為桉樹和非桉樹兩大類,因此將驗(yàn)證的感興趣區(qū)設(shè)為兩類。共選取140個(gè)樣本點(diǎn)(其中桉樹70個(gè),非桉樹70個(gè))作為驗(yàn)證樣本,樣本均勻分布于研究區(qū),以該套驗(yàn)證樣本分別對(duì)5種不同分類方法分類的結(jié)果進(jìn)行精度評(píng)價(jià),構(gòu)建混淆矩陣,計(jì)算5種分類方法的總體精度與Kappa系數(shù),精度評(píng)價(jià)結(jié)果如表4所示。
表4 5種桉樹提取方法的精度評(píng)價(jià)Tab.4 Confusion matrix of Eucalyptus extraction using 5 object-oriented classification methods
由表4可知,利用面向?qū)ο蟮?種分類方法進(jìn)行桉樹分類,均存在一定程度的“錯(cuò)分”、“漏分”現(xiàn)象,錯(cuò)分為桉樹的主要是馬尾松的成熟林,因兩者的紋理較規(guī)則、粗糙,特征差異不明顯而造成;漏分的桉樹主要是桉樹的幼林,因其光譜特征與其他植被光譜特征相近而造成。因此,基于面向?qū)ο蟮姆诸惙椒m然較基于像元的方法能提高分類的精度,但也不能完全避免“同物異譜”與“同譜異物”等現(xiàn)象的存在。如何通過這些微小的差異,達(dá)到精確識(shí)別的精度還有待研究。
5種分類方法對(duì)桉樹信息提取的精度差異顯著,Bayes分類的精度最差,分類總精度僅為67.1%,Kappa系數(shù)也只有0.34;SVM分類精度最高,其分類總精度達(dá)86.4%,Kappa為0.73。5種分類方法對(duì)桉樹信息提取的精度排序依次為SVM>RDT>DST>KNN> Bayes,其中分類總精度超80%的方法有DST,RDT和SVM 3種。
1) 本文以廣西橫縣平朗鄉(xiāng)為研究區(qū),利用面向?qū)ο蟮姆椒?對(duì)該鄉(xiāng)的桉樹采用5種不同分類器進(jìn)行分類。結(jié)果表明,5種方法中,支持向量機(jī)(SVM)方法提取效果最好,是最適合桉樹提取的方法;隨機(jī)森林(RDT)方法次之;貝葉斯(Bayes)方法最差。
2) 面向?qū)ο蠓椒ㄊ窃诹謽I(yè)部門經(jīng)過長期實(shí)踐的基礎(chǔ)上提出的比較符合桉樹(變化)信息遙感監(jiān)測的方法,為確保較高的桉樹信息提取精度,在丘陵和平原地區(qū),可采取決策樹、隨機(jī)森林和支持向量機(jī)的面向?qū)ο蠓诸惙椒ā?duì)于地塊破碎,樹種繁多的山地,可采取支持向量機(jī)的方法,若地勢起伏較大,可先按照DEM數(shù)據(jù)分區(qū),然后在分區(qū)采用支持向量機(jī)方法提取桉樹信息。
3) 面向?qū)ο蟮姆椒m然提高了分類精度,但也不同程度的存在混合像元的問題,如何選擇適量的分類特征,結(jié)合輔助數(shù)據(jù)或智能算法,精確提取桉樹信息,有待進(jìn)一步研究。
[1] 高分二號(hào)[EB/OL].(2014-10-15)[2017-09-14].
http://www.cresda.com/CN/Satellite/3128.shtml.
[2] 王忠武,劉順喜,戴建旺,等.高分二號(hào)衛(wèi)星數(shù)據(jù)在新增建設(shè)用地監(jiān)測中的應(yīng)用分析[J].航天器工程,2015,24(6):134-139.
[3] 吳小娟,肖晨超,崔振營,等.“高分二號(hào)”衛(wèi)星數(shù)據(jù)面向?qū)ο蟮暮0毒€提取法[J].航天返回與遙感,2015,36(4):84-92.
[4] 劉肖姬,梁樹能,吳小娟,等.“高分二號(hào)”衛(wèi)星數(shù)據(jù)遙感滑坡災(zāi)害識(shí)別研究_以云南東川為例[J].航天返回與遙感,2015,36(4):93-100.
[5] 梁樹能,魏紅艷,甘甫平,等.“高分二號(hào)”衛(wèi)星數(shù)據(jù)在遙感地質(zhì)調(diào)查中的初步應(yīng)用評(píng)價(jià)[J].航天返回與遙感,2015,36(4):63-72.
[6] 路云閣,樊雙亮,李春霖.“高分二號(hào)”衛(wèi)星在西藏礦山遙感監(jiān)測中的應(yīng)用研究[J].航天返回與遙感,2015,36(4):73-83.
[7] 李春干,梁文海.面向?qū)ο筮b感圖像森林變化監(jiān)測的工程化應(yīng)用方法[J].林業(yè)資源管理,2015(6):137-143.
[8] 徐菲楠,祁元,王建華,等.面向?qū)ο蟮暮诤酉掠魏影读种脖桓采w信息分類[J].遙感技術(shù)與應(yīng)用,2015,30(5):996-1005.
[9] 郭亞鴿,于信芳,江東,等.面向?qū)ο蟮纳种脖粓D像識(shí)別分類方法[J].地球信息科學(xué)學(xué)報(bào),2012,14(4):514-522.
[10] 孫磊,馮立新.橫縣林地保護(hù)與規(guī)劃利用研究[J].農(nóng)業(yè)科學(xué),2014,42(4):1189-1191.
[11] 牟智慧,楊廣斌.基于TM影像面向?qū)ο蟮蔫駱湫畔⑻崛J].林業(yè)資源管理,2014(2):119-125.
[12] 朱俊杰,范湘濤,杜小平,等.面向?qū)ο蟮母叻直媛蔬b感圖像分析[M].北京:科學(xué)出版社,2014.
[13] 胡榮明,魏曼,楊成斌,等.以SPOT5遙感數(shù)據(jù)為例比較基于像素與面向?qū)ο蟮姆诸惙椒╗J].遙感技術(shù)與應(yīng)用,2012,27(3):366-371.
[14] 朱軍,胡文波.貝葉斯機(jī)器學(xué)習(xí)前沿進(jìn)展綜述[J].計(jì)算機(jī)研究與發(fā)展,2015,52(1):16-26.
[15] 祖笑峰,覃先林,尹凌宇,等.基于高分一號(hào)影像光譜指數(shù)識(shí)別火燒跡地的決策樹方法[J].林業(yè)資源管理,2015(4):73-78.
[16] 雷光斌,李愛農(nóng),譚劍波,等.基于多源多時(shí)相遙感影像的山地森林分類決策樹模型研究[J].遙感技術(shù)與應(yīng)用,2016,31(1):31-41.
[17] 薄樹奎,荊永菊.基于最近鄰的遙感影像單類信息提取[J].計(jì)算機(jī)科學(xué),2016,43(S1):217-218.
[18] 馬玥,姜琦剛,孟治國,等.基于隨機(jī)森林算法的農(nóng)耕區(qū)土地利用分類研究[J].農(nóng)業(yè)機(jī)械學(xué)報(bào),2016,47(1):297-303.
[19] 方匡南,吳見彬,朱建平,等.隨機(jī)森林方法研究綜述[J].統(tǒng)計(jì)與信息論壇,2011,26(3):32-38.
[20] 李夢穎,邢艷秋,劉美爽,等.基于支持向量機(jī)的Landsat-8影像森林類型識(shí)別研究[J].中南林業(yè)科技大學(xué)學(xué)報(bào),2017,37(4):52-58.