董秀春,蔣 怡,黃 平,李宗南,劉 軻
(四川省農(nóng)業(yè)科學(xué)院遙感應(yīng)用研究所,成都610066)
休耕監(jiān)測(cè),是配合農(nóng)業(yè)農(nóng)村部休耕輪作試點(diǎn)開(kāi)展的重要工作,通過(guò)遙感快速監(jiān)測(cè)地塊是否休耕或種植有保護(hù)地力的綠肥作物,為有關(guān)部門(mén)的管理及農(nóng)戶(hù)休耕補(bǔ)貼發(fā)放提供客觀(guān)信息[1-3]。云南石漠化休耕區(qū)地塊破碎,種植結(jié)構(gòu)復(fù)雜,分辨率較粗的遙感影像難以滿(mǎn)足休耕地塊監(jiān)測(cè)精度需要,已進(jìn)行的休耕監(jiān)測(cè)采用了RapidEye、Planet等空間分辨率優(yōu)于5 m的遙感影像。隨著農(nóng)業(yè)監(jiān)測(cè)使用的遙感影像空間分辨率、時(shí)間分辨率提高,傳統(tǒng)分類(lèi)方法存在效率和精度的不足。機(jī)器學(xué)習(xí)利用先驗(yàn)知識(shí)使分類(lèi)器進(jìn)行自我學(xué)習(xí),可更深層次挖掘影像光譜、紋理等特征信息,根據(jù)其模型結(jié)構(gòu)可分為淺層學(xué)習(xí)和深度學(xué)習(xí)。常用的淺層機(jī)器學(xué)習(xí)分類(lèi)器包括決策樹(shù)、支持向量機(jī)、隨機(jī)森林、Softmax等[4-5];較深度學(xué)習(xí)方法,具有模型結(jié)構(gòu)較簡(jiǎn)單、訓(xùn)練樣本需求少、運(yùn)算速度快等特點(diǎn),在冬小麥[6-7]、大豆和玉米[8]、棉花[7]、水稻[9]等作物分類(lèi)提取研究中取得較高分類(lèi)精度。Softmax分類(lèi)器適合于多類(lèi)別的自動(dòng)分類(lèi)[10],其在高分辨率影像多種土地覆蓋分類(lèi)中有良好表現(xiàn)[10-11],因而擬使用Softmax分類(lèi)器進(jìn)行休耕區(qū)多種作物的遙感分類(lèi)。文章分析基于Softmax分類(lèi)器和RapidEye遙感影像提取研究區(qū)綠肥、水稻、玉米及煙草等4種作物空間分布信息的精度及誤差因素,為使用淺層機(jī)器學(xué)習(xí)方法快速準(zhǔn)確掌握休耕情況提供參考。
研 究 區(qū) 地 處 云 南 省 石 林 彝 族 自 治 縣 北 部,位 于 東 經(jīng) 103°10′~103°41′、 北 緯24°30′~25°03′之間,見(jiàn)圖1。該區(qū)域平均海拔約1 900 m,屬低緯高原山地季風(fēng)氣候,年平均氣溫16.3℃,年平均降雨量940 mm,年平均日照2 097 h。巖溶地貌明顯,巖溶面積位于昆明市第一,土地石漠化嚴(yán)重,面積占全縣巖溶面積的28.43%[12],是云南省首批被確定為耕地休耕制度試點(diǎn)縣之一。研究區(qū)內(nèi)夏季種植作物主要包括水稻、玉米、煙草等;休耕作物為光葉紫花苕,是云南休耕地區(qū)用于養(yǎng)地的綠肥作物。
圖1 研究區(qū)位置Fig.1 Location of the study area
使用2017年8月2日獲取的RapidEye衛(wèi)星影像。RapidEye影像幅寬77 km,空間分辨率為5 m,包括藍(lán)(440~510 nm)、綠(520~590 nm)、紅(630~685 nm)、紅邊(690~730 nm)、近紅外(760~850 nm)5個(gè)波段,其中紅邊波段是首顆商業(yè)衛(wèi)星提供的波段,可增加地物間的可分離度,提高農(nóng)作物識(shí)別精度[13]。
結(jié)合Google Earth高清影像,在研究區(qū)內(nèi)建立7個(gè)隨機(jī)分布的樣方,樣方大小為500 m×500 m。于2017年7月17—24日到實(shí)地開(kāi)展地面調(diào)查,確定樣方各地塊種植的作物和覆蓋類(lèi)型,樣方調(diào)查結(jié)果作為分類(lèi)的解譯標(biāo)志和精度驗(yàn)證數(shù)據(jù)。
將獲取的RapidEye影像在ENVI5.5中進(jìn)行大氣校正、正射校正、重投影、幾何精校正等預(yù)處理。計(jì)算影像的增強(qiáng)型植被指數(shù)(Enhanced Vegetation Index,EVI),通過(guò)波段組合,以增加影像波段屬性,提高地物可區(qū)分性[10]。
Softmax模型為L(zhǎng)ogistic回歸模型在多分類(lèi)問(wèn)題上的擴(kuò)展,屬于監(jiān)督學(xué)習(xí)算法,需要提供訓(xùn)練樣本和測(cè)試樣本以及相應(yīng)的分類(lèi)標(biāo)簽?;舅悸窞椋?4]:對(duì)于m個(gè)樣本,為訓(xùn)練集及其所對(duì)應(yīng)的標(biāo)簽為:{(x(1),y(1)),(x(2),y(2)),…,(x(m),y(m))},其中樣本x(i)定義為n+1維向量,y(i)∈{1,2,…,k},則樣本x(i)對(duì)應(yīng)類(lèi)別k的估計(jì)概率為:
式(2)中,1{y(i)=j}為示性函數(shù),當(dāng)大括號(hào)中為真時(shí),該函數(shù)結(jié)果為1,反之為0。
在ENVI5.5中使用Softmax分類(lèi)器對(duì)研究區(qū)4種典型作物進(jìn)行遙感識(shí)別與空間信息提取。選取RapidEye影像的第5,4,3波段,分別賦予紅、綠、藍(lán)3色進(jìn)行假彩色合成,突出各類(lèi)作物顯示效果,便于選取訓(xùn)練區(qū)。根據(jù)地面調(diào)查,在研究區(qū)選取各地物的感興趣區(qū),包括綠肥、水稻、玉米、煙草等4種典型作物以及林地、水體、建筑物等地物。通過(guò)訓(xùn)練樣本對(duì)Softmax分類(lèi)器進(jìn)行訓(xùn)練,使繪制的損失曲線(xiàn)收斂到最小,利用訓(xùn)練效果最優(yōu)的分類(lèi)器進(jìn)行分類(lèi),得到研究區(qū)的分類(lèi)結(jié)果。Softmax分類(lèi)技術(shù)流程見(jiàn)圖2。
圖2 Softmax分類(lèi)技術(shù)流程Fig.2 Process of Softmax classification
評(píng)價(jià)基于Softmax分類(lèi)器的4種典型作物分類(lèi)精度,并與基于極大似然法的分類(lèi)結(jié)果進(jìn)行比較。
使用RapidEye影像的多作物分類(lèi)結(jié)果見(jiàn)圖3,Softmax法的分類(lèi)結(jié)果較極大似然法減少了“椒鹽噪聲”現(xiàn)象。根據(jù)地面樣方數(shù)據(jù)驗(yàn)證,精度評(píng)價(jià)結(jié)果見(jiàn)表1。研究區(qū)內(nèi)Softmax分類(lèi)器對(duì)綠肥、水稻、玉米和煙草的分類(lèi)總精度為85.98%,Kappa系數(shù)為0.815 7;較極大似然分類(lèi)高4.59%和0.061 7,并減少了錯(cuò)分、漏分像元。
圖3 兩種方法分類(lèi)結(jié)果(部分區(qū)域)Fig.3 Results of two method(Part of the study area)
比較Softmax法4類(lèi)作物的分類(lèi)效果,綠肥、水稻、煙草的生產(chǎn)者精度和用戶(hù)精度均達(dá)到84%以上,玉米則低于75%。主要由于研究區(qū)內(nèi)綠肥、水稻、煙草種植較為集中;而玉米種植地塊的面積小且在空間上極為分散。根據(jù)表1兩種方法的混淆矩陣結(jié)果可見(jiàn),綠肥與煙草錯(cuò)分問(wèn)題較明顯。根據(jù)地面調(diào)查情況,認(rèn)為綠肥與煙草易混淆主要原因包括兩方面:一方面研究區(qū)休耕地塊的肥力及管理差異大導(dǎo)致不同地塊綠肥長(zhǎng)勢(shì)差異明顯,出現(xiàn)“同物異譜”;另一方面則是監(jiān)測(cè)期間的煙草處于采收季,部分采收后地塊植被情況與綠肥接近,出現(xiàn)“異物同譜”。
表1 兩種分類(lèi)方法的混淆矩陣Table 1 Confusion matrix of two classification methods
通過(guò)遙感手段快速準(zhǔn)確獲取休耕區(qū)內(nèi)地塊種植情況,監(jiān)測(cè)結(jié)果對(duì)地塊休耕現(xiàn)狀判別具有重要作用。研究利用2017年8月2號(hào)獲取的RapidEye影像,采用淺層機(jī)器學(xué)習(xí)Softmax分類(lèi)器在云南省石林縣部分休耕試點(diǎn)區(qū)開(kāi)展夏季綠肥作物、水稻、玉米及煙草等4種典型作物的遙感分類(lèi),得出如下結(jié)論:(1)基于Softmax方法的4種典型作物分類(lèi)的總體精度和Kappa系數(shù)分別為85.67%和0.811 6,極大似然為81.39%和0.754 0,Softmax方法分類(lèi)精度略高于極大似然;(2)綠肥、水稻、煙草的生產(chǎn)者精度和用戶(hù)精度遠(yuǎn)高于玉米,因研究區(qū)內(nèi)地塊作物種植集中程度影響分類(lèi)精度;(3)“同物異譜、異物同譜”現(xiàn)象導(dǎo)致綠肥與煙草錯(cuò)分問(wèn)題較明顯。
該文研究淺層機(jī)器學(xué)習(xí)分類(lèi)器在云南休耕地區(qū)夏季多作物遙感分類(lèi)效果,較常用的最大似然法,分類(lèi)精度有所提高。使用高精度作物空間分布信息進(jìn)一步與休耕地塊矢量數(shù)據(jù)結(jié)合,可去除非休耕監(jiān)測(cè)區(qū)臨近地物的影響,提高休耕地塊的判別精度,減少地塊休耕誤判以及外業(yè)核查工作量。隨著對(duì)農(nóng)業(yè)精準(zhǔn)監(jiān)測(cè)需求的增加,越來(lái)越多高時(shí)空分辨率的多光譜、高光譜遙感數(shù)據(jù)應(yīng)用于農(nóng)業(yè)監(jiān)測(cè),數(shù)據(jù)量大、質(zhì)量不統(tǒng)一等遙感大數(shù)據(jù)問(wèn)題需通過(guò)整合系統(tǒng)、復(fù)雜的算法加以解決。淺層機(jī)器學(xué)習(xí)分類(lèi)算法小樣本學(xué)習(xí)和過(guò)擬合等不足將影響其進(jìn)一步應(yīng)用。深度學(xué)習(xí)方法使用更大規(guī)模的訓(xùn)練數(shù)據(jù)、構(gòu)建更復(fù)雜的模型,能實(shí)現(xiàn)更多種類(lèi)地物的精確識(shí)別與分類(lèi),降低過(guò)擬合的程度。因此,未來(lái)將根據(jù)我國(guó)遙感大數(shù)據(jù)發(fā)展,開(kāi)展農(nóng)作物遙感訓(xùn)練數(shù)據(jù)集整理、深度學(xué)習(xí)模型研究等工作。