呂昱,范燕敏,武紅旗,彭田田,皇甫蓓炯,賀夢婕
(1.新疆農(nóng)業(yè)大學草業(yè)與環(huán)境科學學院,新疆 烏魯木齊 830052;2.奇臺縣農(nóng)業(yè)技術推廣中心,新疆 奇臺 831800)
農(nóng)作物識別作為農(nóng)情監(jiān)測的基礎,是農(nóng)業(yè)現(xiàn)代化的初始階段和重要環(huán)節(jié)[1]。高效提取作物種植信息,可給予農(nóng)業(yè)普查、估產(chǎn)與災害預警等工作空間決策支持,為政府相關部門制訂農(nóng)業(yè)政策與指導農(nóng)業(yè)生產(chǎn)提供重要依據(jù)[2,3],同時對農(nóng)業(yè)的精細化管理有著重要意義[4,5]。
遙感技術由于其探測范圍大、受海拔地形約束少、快速成像與多波段的特點,被廣泛用于現(xiàn)代作物監(jiān)測[6-8]。相對于傳統(tǒng)農(nóng)業(yè)調(diào)查手段,做到了省時省力并更加高效地了解作物種植信息[9]。
近年來,大量學者采用面向對象的方法進行地物識別取得了較好效果。劉金麗等[10]利用ESP2工具找出固定尺度范圍內(nèi)的最優(yōu)分割尺度范圍,最后執(zhí)行最佳同質性準則組合參數(shù)配合下的最優(yōu)分割尺度范圍內(nèi)各個尺度下的多尺度分割;陳杰等[11]使用尺度分層方法對耕地進行提取,取得了較高精度;雷鳴等[12]利用神經(jīng)網(wǎng)絡分類方法確定了基于對象分類的最優(yōu)特征組合,并采用基于對象的最近鄰(kNN)分類方法對遙感圖像進行分類。張峰等[13]使用面向農(nóng)用地實際應用方法對奇臺縣南部分類。但目前國內(nèi)外學者較少綜合利用土地利用現(xiàn)狀圖提取耕地作掩膜并使用面向對象的方法對縣域級作物進行識別。
奇臺縣是新疆維吾爾自治區(qū)重要糧食產(chǎn)區(qū),主要作物為小麥和玉米。該縣農(nóng)田分布包含前山丘陵、沖積扇上中下部、沙漠邊緣等地形部位,利用方式包括旱地與水澆地。因此,該縣具有較好代表性。故為了探索縣域農(nóng)作物信息的高精度提取方法,使用多尺度分割算法、面向對象的分類方法對奇臺縣農(nóng)作物種植信息進行提取。
奇臺縣位于新疆東北部,東西橫距150千米,南北縱距250千米,縣域總面積1.93萬平方千米。地理坐標為東經(jīng)89°13′至91°22′,北緯42°25′至45°29′。該縣地理環(huán)境獨特,地形地貌復雜多變,地勢南北高、中間低,呈馬鞍形狀,屬中溫帶大陸性半荒漠干旱性氣候,主要作物為小麥、玉米、向日葵和打瓜。
Landsat 8衛(wèi)星影像具有中等空間分辨率、單幅覆蓋面積大、獲取時間集中和不同波段合成對地物有強的效果等特性[14,15]。
本研究采用從美國地質調(diào)查局(USGS)下載的研究區(qū)2019年3—9月共7期Landsat 8影像作為基礎數(shù)據(jù),使用ENVI 5.3軟件進行輻射定標、大氣校正、云量檢查、校正、影像鑲嵌等處理,獲得2019年奇臺縣Landsat 8多時相遙感影像。
結合奇臺縣作物物候期,分析比對各個時期影像。3—5月,除種植小麥的地塊外,種植玉米、向日葵與打瓜的地塊植被覆蓋度較低,與裸地差異不大,故識別精度低;8月,遙感影像云量較大,無法識別;9月,部分玉米已收獲;對比6—7月影像并結合當?shù)匚锖蚺c實地調(diào)查得知,7月底正值奇臺縣小麥收獲、玉米處于抽雄期,便于識別。故選取2019年7月30日的Landsat 8遙感影像對奇臺縣作物進行分類。
以奇臺縣2016年土地利用現(xiàn)狀圖為底圖,依據(jù)2019年多時相遙感影像,利用目視解譯更新獲得2019年研究區(qū)耕地分布。
實地調(diào)查數(shù)據(jù)可為面向對象的多尺度遙感識別提供基本的參考依據(jù),并為機器學習提供樣本數(shù)據(jù)。依據(jù)樣本要客觀隨機并具有代表性的原則,根據(jù)奇臺縣耕地面積、作物分布情況以及研究區(qū)實際交通情況,本研究共布設735個樣點,其中玉米300個,小麥228個,向日葵139個,打瓜68個。隨機選取70%樣點用于機器學習構建訓練樣本,30%樣點用于對識別結果進行驗證。耕地與實地調(diào)查點分布如圖1所示。
在多尺度分割中,尺度的選擇對于分割而言尤為重要,太大使影像欠分割,同一對象包含多種地物信息;太小則使分割對象過于破碎,也不利于運算。ESP2(estimation of scale parameter 2)是一種尺度參數(shù)評估工具,能快速地給出最優(yōu)尺度的可選范圍。其結果圖顯示了局部方差和變化率隨尺度變化的情況,而ROC曲線的峰值指引了可能的最優(yōu)分割尺度[16]。本研究利用ESP2確定最佳分割尺度。
面向對象的分類突破了傳統(tǒng)的基于像素的分類方法,它不再以像元為最小單位,而是將影像分割成對象,綜合利用各對象之間的光譜及空間特征進行分類[17]。本研究基于ESP2確定的最佳分割尺度,使用德國eCognition 9.0軟件對奇臺縣耕地進行多尺度分割,然后利用Cart決策樹和隨機森林算法進行分類,并對分類結果進行精度評價。
圖1 耕地分布與實地調(diào)查點分布
Cart決策樹是由Breiman等[18]提出的一種決策樹構建算法,能夠高效、迅速地處理高維數(shù)據(jù),并篩選出重要的變量,生成可以理解的規(guī)則。
隨機森林是利用多棵決策樹對數(shù)據(jù)進行訓練、分類和預測的方法。隨機森林算法通過利用多個分類器進行投票分類,可以有效減少單個分類器的誤差,提升分類準確度。實踐證明,相比于人工神經(jīng)網(wǎng)絡(ANN)、回歸樹以及支持向量機(SVM)等算法,隨機森林算法具有更高的穩(wěn)定性和魯棒性,并且相應的分類準確率也處于領先水平。隨機森林算法不僅能夠進行大規(guī)模數(shù)據(jù)的高效處理,并且能夠適應高維數(shù)據(jù)應用場景,同時也可以在缺失數(shù)據(jù)的場景中依然保持較高的分類[19]。
通過ESP2結果(圖2)可知,90可能為最優(yōu)分割尺度。
為驗證其準確性,參考他人多尺度分割研究選用不同分割尺度40、90、140,并根據(jù)耕地大小、形狀與分布特點以及資料查詢和實驗對比,將形狀因子和緊密度分別設為0.1和0.5,對提取的耕地進行分割,結果見圖3??梢?,當分割尺度為40時,分割過于破碎,不利于計算;當分割尺度為140時,存在欠分割現(xiàn)象,對于不同作物相交的邊界沒有很好地分割出來;而當分割尺度為90時,更接近研究區(qū)耕地的真實輪廓,因此,確定90為奇臺縣耕地最優(yōu)分割尺度。
圖2 ESP2尺度分析結果
利用隨機森林分類器進行分類,需要先設置Cart樹的數(shù)量,并對分割后的研究區(qū)耕地進行Cart樹數(shù)量參數(shù)測試,結果見表1??梢园l(fā)現(xiàn),通過加大Cart樹數(shù)量,生產(chǎn)者精度、用戶精度、總體精度與Kappa系數(shù)均呈先升高后降低趨勢,在80~90時達到高值,因此,本研究選用90作為隨機森林分類器的Cart決策樹個數(shù)進行研究區(qū)作物分布的提取。
圖3 不同尺度分割效果對比
表1 不同Cart樹數(shù)量的分類精度評價
利用最優(yōu)分割尺度90對奇臺縣耕地進行分割,對分割后的結果分別使用Cart決策樹和隨機森林分類器進行分類,并對分類結果進行精度評價,結果如表2所示。可見,隨機森林分類器的分類精度高于Cart決策樹。這是因為隨機森林通過建立多個決策樹進行分類預測,即使個別決策樹因異常值影響導致預測不準確,但最終分類結果是參考多個決策樹得到的,降低了異常值帶來的影響。兩種方法提取的奇臺縣作物種植信息見圖4、圖5。
表2 Cart決策樹和隨機森林法的分類精度評價
實地調(diào)查220 個樣點,并建立混淆矩陣[20,21],對奇臺縣的主要農(nóng)作物提取精度進行驗證,結果(表3)表明,7月奇臺縣小麥正處于成熟收獲期,而玉米處于抽雄期,植被指數(shù)較高,兩者的識別精度高,用戶精度和生產(chǎn)者精度均達到1.0000;但此時期的向日葵處于現(xiàn)蕾期,打瓜處于坐果期,且兩種作物的葉子形態(tài)相似,識別較為困難,分別存在1個和2個樣點的誤判。對比實地調(diào)查結果,隨機森林分類法總體精度達到0.9864。
表3 基于隨機森林法的分類精度驗證結果
圖4 基于Cart決策樹分類法的作物種植信息提取結果
2019年《土地調(diào)查條例實施辦法》頒布,土地確權實施[22,23],有利于獲得更佳的土地利用數(shù)據(jù),可以使用土地利用現(xiàn)狀圖準確、高效地提取耕地,快速得到耕地掩膜,減少作物識別工作量,提高工作效率。
地物普遍存在尺度效應,在多尺度分割中,不同的分割尺度會影響對象斑塊的大小、對象之間的異質性。雷鳴等[12]使用500分割尺度通過面向對象的分類方法基于遙感影像檢測森林變化;呂道雙等[24]使用100分割尺度、面向對象方法提取建筑物。根據(jù)研究區(qū)的實際情況和作物種植結構進行多次分割試驗,再結合地物的特點選取分割尺度,得到最優(yōu)的參數(shù)進行多尺度分割,再進行后續(xù)分類,可以大大提高作物的分類精度[25]。
本研究利用ESP2確定最佳分割尺度,比較Cart分類樹和隨機森林法分類結果,并通過野外調(diào)查點進行精度驗證,得到了以下結論:
圖5 基于隨機森林分類法的作物種植信息提取結果
(1)使用面向對象的研究方法對作物進行分類效果較好,Cart決策樹法總體精度0.9253,隨機森林法總體精度0.9450,隨機森林分類器的分類效果更好。
(2)基于2019年7月30日Landsat 8遙感影像使用隨機森林分類器對奇臺縣主要作物:小麥、玉米、打瓜與向日葵進行提取,總體精度為0.9864。
可見,使用中分辨率遙感影像并利用面向對象的分類方法對縣域作物進行識別是可行的,且識別精度較高。