黃邵東,徐偉恒, *,熊 源,吳 超,代 飛, ,徐海峰,王雷光,寇衛(wèi)利
1. 西南林業(yè)大學(xué)大數(shù)據(jù)與智能工程學(xué)院,云南 昆明 650233 2. 西南林業(yè)大學(xué)大數(shù)據(jù)與智能工程研究院,云南 昆明 650233 3.西南林業(yè)大學(xué)林業(yè)生態(tài)大數(shù)據(jù)國(guó)家林業(yè)與草原局重點(diǎn)實(shí)驗(yàn)室,云南 昆明 650233
茶葉起源于中國(guó),中國(guó)是最早發(fā)現(xiàn)和種植茶葉的國(guó)家,中國(guó)茶文化源遠(yuǎn)流長(zhǎng)[1]。茶葉是包括中國(guó)、 斯里蘭卡,肯尼亞和印度在內(nèi)等諸多發(fā)展中國(guó)家重要的經(jīng)濟(jì)支柱[2]。21世紀(jì)初以來(lái),全球茶產(chǎn)業(yè)發(fā)展迅速,茶葉種植面積與產(chǎn)量都有了顯著的增長(zhǎng)。截止2018年,中國(guó)茶葉種植面積為2 985.80千公頃,產(chǎn)量達(dá)261.04萬(wàn)噸。而云南省作為我國(guó)重要的產(chǎn)茶大省,茶葉成為當(dāng)?shù)剞r(nóng)民的主要經(jīng)濟(jì)來(lái)源以及當(dāng)?shù)刎?cái)政稅收的重要來(lái)源。2018年云南省茶葉種植面積達(dá)46.66萬(wàn)公頃,茶葉產(chǎn)量達(dá)42.33萬(wàn)噸,同比2017年增長(zhǎng)7.6%。茶園快速擴(kuò)張,提高了茶葉產(chǎn)量,進(jìn)而推動(dòng)了當(dāng)?shù)氐慕?jīng)濟(jì)發(fā)展,但同時(shí)產(chǎn)生了森林資源減少、 生物多樣性及生態(tài)系統(tǒng)服務(wù)降低等一系列負(fù)面影響[3]。因此準(zhǔn)確識(shí)別茶園分布范圍,對(duì)有關(guān)部門(mén)制定相應(yīng)的土地政策,合理種植茶園、 茶園病害預(yù)防及茶葉估產(chǎn)、 保護(hù)生態(tài)環(huán)境等具有科學(xué)的指導(dǎo)意義。
傳統(tǒng)的應(yīng)用遙感影像對(duì)地物進(jìn)行提取大多是基于像元的方法,無(wú)法充分利用高空間分辨率影像豐富的地物信息(紋理、 空間信息),且會(huì)造成信息冗余,容易導(dǎo)致地物錯(cuò)分、 漏分,且出現(xiàn)“椒鹽現(xiàn)象”[4]。而面向?qū)ο蠓诸?lèi)方法則是基于地物類(lèi)內(nèi)一定同質(zhì)性進(jìn)行對(duì)象分割獲得基元,因此可以充分利用高空間分辨率影像豐富的光譜信息、 紋理信息、 上下文語(yǔ)義信息、 鄰域信息和空間信息等相關(guān)信息,彌補(bǔ)了傳統(tǒng)基于像元分類(lèi)容易造成的地物分類(lèi)破碎化的弊端[5]。以云南省重點(diǎn)山地茶園區(qū)域的一景GF-1 PMS影像為數(shù)據(jù)源,采用多尺度分割(multiresolution segmentation, MRS)方法對(duì)影像進(jìn)行分割,采用面向?qū)ο蟮谋O(jiān)督分類(lèi)方法[貝葉斯(Bayes)、 決策樹(shù)(decision tree,DT)、 隨機(jī)森林(random forest,RF)]實(shí)現(xiàn)茶園的提取,探索適合山區(qū)茶園提取最優(yōu)的分割參數(shù)和分類(lèi)特征組合的高精度、 精細(xì)化提取方法。
研究區(qū)位于云南省南部,是典型的山地茶園分布區(qū)域。世界紀(jì)錄認(rèn)證機(jī)構(gòu)(World Record Certification Agency,WRCA)認(rèn)證的“世界最大連片茶園”的大渡崗萬(wàn)畝茶園位于本文研究區(qū)內(nèi)。地理范圍(100°43′34″E—101°29′39″E, 22°02′30″N—22°45′11″N),面積約為4 412 km2, 如圖1所示。研究區(qū)內(nèi)地物類(lèi)型主要有森林、 茶園、 農(nóng)田、 不透水層以及水體等。
圖1 研究區(qū)示意圖Fig.1 Schematic diagram of study area
基于eCognition9.0軟件,采用MRS方法對(duì)影像進(jìn)行不同尺度分割,并利用ED3Modified對(duì)分割結(jié)果進(jìn)行評(píng)估,確定茶園提取的最優(yōu)分割尺度。在研究區(qū)分割對(duì)象上隨機(jī)選取了茶園、 農(nóng)田、 森林、 水體及不透水層5種地物類(lèi)型共600個(gè)分割對(duì)象用作訓(xùn)練樣本,并結(jié)合2018年12月份對(duì)普洱、 西雙版納地區(qū)茶園的實(shí)地調(diào)查及Google Earth影像數(shù)據(jù)對(duì)訓(xùn)練樣本進(jìn)行核對(duì)校正。通過(guò)優(yōu)化特征空間組合后,分別利用Bayes,DT及RF分類(lèi)方法對(duì)茶園進(jìn)行提取并對(duì)茶園提取結(jié)果進(jìn)行精度比較。
以一景GF-1 PMS遙感影像(拍攝日期: 2019年2月21日)為數(shù)據(jù)源,包括2m分辨率的全色波段,4個(gè)8 m分辨率的多光譜波段[藍(lán)(Blue)、 綠(Green)、 紅(Red)、 近紅外(NIR)]。利用ENVI5.3進(jìn)行影像預(yù)處理,采用NNDiffuse PAN Sharpening算法進(jìn)行全色與多光譜數(shù)據(jù)融合,最終獲得2 m分辨率的融合影像。
GF-1影像分割效果主要受輸入影像波段,形狀,緊致度及尺度4個(gè)因素影響[6]。若分割尺度不當(dāng),則會(huì)導(dǎo)致一些地物存在“欠分割”或“過(guò)分割”現(xiàn)象,難以保證分類(lèi)精度。為克服不當(dāng)尺度造成的上述弊端,采用MRS方法對(duì)影像進(jìn)行分割并進(jìn)行最優(yōu)分割尺度評(píng)估,借助ED3Modified方法及樣地疊加進(jìn)行目視解譯確定影像的最優(yōu)分割尺度[6]。該方法的原理是當(dāng)與一個(gè)參考多邊形的重疊面積超過(guò)參考多邊形或被分割對(duì)象面積的50%時(shí),被分割的對(duì)象才能被標(biāo)記為相對(duì)應(yīng)的參考多邊形的分割對(duì)象。ED3Modified值為0~1的歸一化指數(shù),計(jì)算見(jiàn)式(1)。ED3Modified值越低則表示影像分割質(zhì)量越高。在分割對(duì)象中隨機(jī)選取茶園、 森林、 農(nóng)田、 不透水層、 水體樣地各30個(gè)參考多邊形,采用ArcGIS10.5計(jì)算ED3Modified值,最佳分割尺度由ED3Modified的最低值決定。
ED3Modified=
(1)
式(1)中,ri為參考多邊形;I為參考多邊形的數(shù)量;S為面積;sj為對(duì)應(yīng)的參考多邊形的分割對(duì)象;Ji為相對(duì)應(yīng)的分割數(shù)。
選擇分割尺度范圍為100~300(分割步長(zhǎng)為25)對(duì)影像進(jìn)行分割。如圖2所示,ED3Modified值呈現(xiàn)為“中間低兩頭高”的趨勢(shì),說(shuō)明ED3Modified表現(xiàn)為先減少后增加的變化,即在分割尺度為225時(shí)ED3Modified最小(0.44),則與之對(duì)應(yīng)的尺度225為最優(yōu)分割尺度。
圖2 ED3Modified值隨分割尺度的變化Fig.2 The ED3Modified values vs the segmentation scale
不同分割尺度的分割效果如圖3所示。分割尺度過(guò)小,會(huì)導(dǎo)致過(guò)分割,如圖3(a—e)所示,大面積連片區(qū)域的地物分割過(guò)于細(xì)碎化(森林、 茶園); 分割尺度過(guò)大,導(dǎo)致欠分割,一些夾雜在大面積地物內(nèi)的其他零散地物就會(huì)被合并為大面積地物,造成地物分割對(duì)象混淆,如圖3(g—i)所示。在最佳分割尺度下,地物分割不僅對(duì)離散的不透水層、 水體以及連片的茶園、 森林都達(dá)到了較為良好分割效果,合并了同類(lèi)地物小區(qū)域,又與其他地物有明確的邊界,如圖3(f)所示。因此,針對(duì)本研究區(qū)域,當(dāng)分割尺度為225時(shí),不論是小面積的不透水層,水體,或者是大面積連片的森林、 茶園、 農(nóng)田都能較好的與參考圖斑重合,獲得良好的分割效果。
分類(lèi)過(guò)程采用分割對(duì)象的紋理、 光譜及空間特征,見(jiàn)表1。選取了GF-1影像的4個(gè)波段(Blue,Green,Red和NIR)的光譜反射率均值及標(biāo)準(zhǔn)差、 調(diào)整土壤亮度的植被指數(shù)(soil adjust vegetation index,SAVI)、 歸一化植被指數(shù)(normalized difference vegetation index,NDVI)、 燃燒面積指數(shù)(burned area index,BAI)及歸一化水體指數(shù)(normalized difference water index,NDWI),亮度指數(shù)(brightness)均值和對(duì)象內(nèi)部最大差值(Max.diff)等14個(gè)光譜特征; 基于灰度共生矩陣(gray level co-occurrence matrix, GLCM) 的角二矩陣(angular second moment)、 相異度(dissimilarity)、 相關(guān)性(correlation)、 熵(entropy)、 及同質(zhì)性(homogeneity)和對(duì)比度(contrast)等6個(gè)紋理特征; 緊致度(compactness)、 面積(area)及長(zhǎng)寬比(length/width)等3個(gè)空間特征。最終構(gòu)建了23維分類(lèi)特征。
圖3 不同尺度下的影像分割結(jié)果Fig.3 Image segmentation results at different scales
將表1中的23維特征組合為一個(gè)特征空間,基于eCognition9.0計(jì)算5類(lèi)樣本在此特征空間中的分離度,通過(guò)比較不同特征空間產(chǎn)生的分離度,找出在兩兩不同地類(lèi)樣本之間產(chǎn)生最大的平均最小距離的特征組合,各地物在此特征空間下具有最好的可分性,則此特征空間為最優(yōu)特征組合。如圖4所示,當(dāng)特征維度達(dá)到16維時(shí),地物可分離度已達(dá)到1.82,再增加特征對(duì)于地物樣本之間的可分離效果趨勢(shì)逐漸下降,也即增加特征已經(jīng)造成了分類(lèi)特征冗余,因此將最優(yōu)特征空間定為16維,分別為BAI,Homogeneity,Area,NIR_Mean,NIR_Std,Length/Width, Dissimilarity,Compactness,Red_Mean,Max.diff,Entropy, Blue_Mean,NDVI,Correlation,Brightness以及SAVI。
表1 面向?qū)ο蠓诸?lèi)的對(duì)象特征Table 1 The features of object-oriented classification
圖4 最優(yōu)特征空間維度評(píng)價(jià)Fig.4 Evaluation of the optimal feature spaces dimensions
基于特征優(yōu)化得到16維分類(lèi)特征,選用常用的三種監(jiān)督分類(lèi)方法(Bayes,DT,RF)進(jìn)行茶園提取并進(jìn)行精度對(duì)比。對(duì)比了(1)三種面向?qū)ο蟮谋O(jiān)督分類(lèi)[多分類(lèi)(森林、 茶園、 農(nóng)田、 不透水層及水體)]精度; (2)面向?qū)ο蟮腞F二分類(lèi)(茶園、 其他)與面向?qū)ο蟮腞F多分類(lèi)茶園提取精度; (3)面向?qū)ο驲F二分類(lèi)與基于像元的RF多分類(lèi)的茶園提取精度。
面向?qū)ο蟮腞F的多分類(lèi)[圖5(a)]以及RF二分類(lèi)的茶園提取結(jié)果[圖5(b)]。多分類(lèi)結(jié)果與茶園混淆的作物主要為農(nóng)田,而二分類(lèi)由于將森林、 不透水層、 農(nóng)田及水體歸為一類(lèi),增加了與茶園的類(lèi)間差異,因此,二分類(lèi)較多分類(lèi)對(duì)于農(nóng)田的過(guò)濾效果較明顯。
圖5 隨機(jī)森林(RF)茶園提取結(jié)果Fig.5 Extraction results of random forest tea plantations
選取研究區(qū)茶園分布較為典型的大渡崗茶園 (100°57′16.62″E, 22°21′3.12″N)進(jìn)行局部地區(qū)茶園提取效果展示及面積比較。圖6(a)為大渡崗影像真彩色合成圖(藍(lán)、 綠、 紅波段合成); 圖6(b)為面向?qū)ο蟮腞F多分類(lèi)結(jié)果; 圖6(c)為基于像元的RF多分類(lèi)結(jié)果。大渡崗連片茶園的官方統(tǒng)計(jì)面積為65 246畝,面向?qū)ο蠖喾诸?lèi)對(duì)于茶園的提取面積為59 851畝,與統(tǒng)計(jì)面積相對(duì)誤差為-8.27%; 基于像元多分類(lèi)對(duì)于茶園的提取面積為55 142畝,與統(tǒng)計(jì)面積相對(duì)誤差為-15.49%。
圖6 面向?qū)ο笈c基于像元的RF分類(lèi)結(jié)果對(duì)比Fig.6 Comparison of the object-oriented and pixel-based classifications
本研究采用ArcGIS10.5在GF-1號(hào)影像上生成3 000個(gè)隨機(jī)點(diǎn)結(jié)合Google Earth進(jìn)行地物類(lèi)型標(biāo)記,然后與野外實(shí)地調(diào)查的1 006個(gè)數(shù)據(jù)點(diǎn)相結(jié)合,利用ENVI5.3生成分類(lèi)混淆矩陣進(jìn)行精度驗(yàn)證,其中驗(yàn)證點(diǎn)個(gè)數(shù)分別為茶園(603)、 森林(2 728)、 農(nóng)田(372)、 不透水層(188)及水體(115)。
由表2可知,對(duì)于本研究區(qū)中5類(lèi)地物分類(lèi)中,面向?qū)ο蟮腂ayes,DT及RF分類(lèi)的總體精度(overall accuracy, OA)與Kappa系數(shù)分別為87.73%,0.70; 88.52%,0.72; 91.23%,0.78。對(duì)于茶園提取效果而言,DT與RF分類(lèi)效果優(yōu)于Bayes,以RF分類(lèi)效果更為顯著,生產(chǎn)者精度(producer accuracy, PA)與使用者精度(user accuracy, UA)分別達(dá)到了70.54%及87.13%。
由表3可知,基于像元的RF分類(lèi)的OA與Kappa系數(shù)分別為71.42%與0.58,而茶園的PA與UA只達(dá)到了55.43%和63.71%,由圖6大渡崗茶園提取結(jié)果可知,基于像元的RF的茶園提取結(jié)果[圖6(c)]相較于面向?qū)ο蠓诸?lèi)的茶園提取結(jié)果[圖6(b)]“椒鹽”現(xiàn)象比較嚴(yán)重,且茶園、 農(nóng)田以及森林混淆度較高,分類(lèi)結(jié)果較為破碎。而面向?qū)ο驲F二分類(lèi)的OA與Kappa系數(shù)較基于像元RF分類(lèi)的結(jié)果分別提高23.32%和0.27,較面向?qū)ο驲F多分類(lèi)OA與Kappa系數(shù)分別提高3.24%和0.07; 就茶園提取精度而言,面向?qū)ο驲F二分類(lèi)PA與UA比基于像元的RF多分類(lèi)分別提高了21.10%和29.03%,比面向?qū)ο蟮腞F多分類(lèi)分別提高了5.99%和5.61%。
表2 面向?qū)ο蟮谋O(jiān)督分類(lèi)結(jié)果精度對(duì)比Table 2 Comparison of the accuracies of object-oriented supervision classification
表3 基于像元和面向?qū)ο蟮腞F茶園提取精度對(duì)比Table 3 Comparison of the accuracies of pixel-wise RF and object-oriented RF for tea plantations extraction
僅利用單一時(shí)相多光譜GF1-PMS影像,基于像元的RF分類(lèi)方法,在山區(qū)茶園提取中精度(PA/UA: 55.43%/63.71%)不高。然而,結(jié)合紋理和空間特征,采用面向?qū)ο蠓椒梢蕴岣卟鑸@提取精度。在三種分類(lèi)器(RF,Bayes和DT)中,面向?qū)ο蟮腞F分類(lèi)精度(PA/UA: 70.54%/87.13%)較高。面向?qū)ο驲F二分類(lèi)方法的茶園提取精度(PA/UA: 76.53%/92.74%)高于面向?qū)ο驲F多分類(lèi)方法。本研究利用單一時(shí)相GF-1全色影像融合多光譜對(duì)于山區(qū)茶園提取獲得了較為滿(mǎn)意的精度,說(shuō)明高分影像對(duì)山區(qū)破碎茶園的監(jiān)測(cè)及制圖具有較好的應(yīng)用價(jià)值及潛力。
隨著傳感器數(shù)量的增加,遙感影像的空間分辨率、 光譜分辨率以及時(shí)間分辨率的提高,在充分利用光譜信息的同時(shí),空間信息及紋理信息對(duì)于地物分類(lèi)越來(lái)越重要[7]。山區(qū)地物類(lèi)型復(fù)雜多樣(橡膠、 香蕉、 甘蔗、 灌草等)與茶園具有相似的光譜特征,“異物同譜”現(xiàn)象增加了高精度提取茶園的難度,而采用面向?qū)ο蟮姆诸?lèi)方法,相比于基于像元的分類(lèi),在光譜特征基礎(chǔ)上增加了紋理特征與空間特征,提高了茶園的提取精度; 將森林、 水體、 農(nóng)田及不透水層四類(lèi)地物合并為一類(lèi),平均了四種地物的類(lèi)間差異,而增大了茶園同森林、 農(nóng)田的類(lèi)間差異,因此面向?qū)ο蟮腄T二分類(lèi)較多分類(lèi)進(jìn)一步提高了茶園的提取精度。但面向?qū)ο蠓诸?lèi)方法高精度提取茶園依賴(lài)于影像的高空間分辨率,而諸如高分、 WorldView及SPOT等系列影像獲取成本高。本文僅討論了單一時(shí)相條件下,融合紋理和空間特征的茶園提取方法。如何將多源、 多時(shí)相遙感影像融合,應(yīng)用于山區(qū)復(fù)雜地形條件下茶園提取和精細(xì)化制圖,有待進(jìn)一步研究。