郭 燕,賀 佳,王利軍,段俊枝,武喜紅,王來(lái)剛,劉 婷,張紅利,鄭國(guó)清,程永政
(河南省農(nóng)業(yè)科學(xué)院 農(nóng)業(yè)經(jīng)濟(jì)與信息研究所, 河南 鄭州 450002)
農(nóng)作物空間信息的快速獲取是掌握農(nóng)作物種植結(jié)構(gòu)的基礎(chǔ),可為農(nóng)作物長(zhǎng)勢(shì)動(dòng)態(tài)監(jiān)測(cè)、估產(chǎn)提供必要的依據(jù),對(duì)掌握農(nóng)情信息、合理布局農(nóng)業(yè)生產(chǎn)結(jié)構(gòu)具有重要的意義。近年來(lái),衛(wèi)星遙感技術(shù)快速發(fā)展,其在農(nóng)業(yè)領(lǐng)域的應(yīng)用越來(lái)越廣泛。相對(duì)于傳統(tǒng)的農(nóng)作物信息獲取方式,遙感技術(shù)具有絕對(duì)的優(yōu)勢(shì),尤其是進(jìn)入21世紀(jì)以來(lái),遙感對(duì)地觀測(cè)能力大大提升,受到國(guó)內(nèi)外許多科學(xué)家和科研部門的關(guān)注,得到廣泛應(yīng)用[1-28]。農(nóng)作物種植空間分布識(shí)別方法主要有非監(jiān)督分類和監(jiān)督分類2種方法。非監(jiān)督分類方法在沒(méi)有先驗(yàn)知識(shí)的情況下,可以較好地對(duì)遙感影像進(jìn)行識(shí)別。而監(jiān)督分類方法則需要有較豐富的先驗(yàn)知識(shí),建立訓(xùn)練樣本進(jìn)行解譯,從20世紀(jì)70年代,經(jīng)歷了目視解譯—基于統(tǒng)計(jì)學(xué)原理—人工智能—深度學(xué)習(xí)(如人工神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)、專家系統(tǒng)等)的發(fā)展歷程。目前,人工智能方法以及3S技術(shù)集成識(shí)別農(nóng)作物種植面積的方法被更多的研究者使用[29-32]。這些方法主要是利用遙感影像或者航空衛(wèi)星數(shù)據(jù),結(jié)合地面樣方和野外調(diào)查的解譯標(biāo)志數(shù)據(jù),建立訓(xùn)練樣本集,對(duì)影像進(jìn)行分類,通過(guò)分類后處理對(duì)破碎圖斑融合歸并,最終獲得作物種植的空間分布信息,分類效果好,精度較高。姜淑芳等[33]采用人機(jī)交互處理技術(shù)從RapidEye遙感影像獲取了冬小麥空間分布信息,Kappa系數(shù)為0.80。Duro等[34]以SPOT-5影像為數(shù)據(jù)源,從基于像元和基于對(duì)象2個(gè)角度比較了決策樹(shù)、隨機(jī)森林和支持向量機(jī)3種學(xué)習(xí)算法在農(nóng)作物分類中的應(yīng)用,均達(dá)到了較好的分類精度。王志慧等[35]利用航空高光譜成像儀影像對(duì)黑河綠洲灌溉區(qū)的農(nóng)作物種植結(jié)構(gòu)空間分布進(jìn)行遙感解譯,總體分類精度為0.84,Kappa系數(shù)達(dá)到0.79。
但是,光學(xué)遙感衛(wèi)星受天氣影響較大,欲在目標(biāo)生育期獲取目標(biāo)區(qū)域特定時(shí)段的中高分辨率的遙感數(shù)據(jù)[RapidEye、Worldview、高分辨率的高分二號(hào)(GF-2)等]非常困難,這限制了其在農(nóng)作物種植面積高精度快速解譯和業(yè)務(wù)化運(yùn)行方面的應(yīng)用。而對(duì)于MODIS、NOAA等低分辨率的光學(xué)遙感衛(wèi)星,雖然比較容易獲取較好的系列數(shù)據(jù),但識(shí)別農(nóng)作物的精度較低,解譯結(jié)果的可靠性和準(zhǔn)確率難以保證,在農(nóng)業(yè)部門難以進(jìn)行推廣應(yīng)用。2013年,中國(guó)高分系列衛(wèi)星的成功發(fā)射為進(jìn)行農(nóng)作物面積的快速監(jiān)測(cè)提供了基礎(chǔ),尤其是高分辨率的GF-2數(shù)據(jù),為農(nóng)作物種植空間分布的精準(zhǔn)監(jiān)測(cè)提供了重要的數(shù)據(jù)保證。但由于GF-2衛(wèi)星的目標(biāo)用戶是國(guó)土資源部、住房和城鄉(xiāng)建設(shè)部、交通運(yùn)輸部和國(guó)家林業(yè)局等部門,在農(nóng)業(yè)方面尤其是農(nóng)作物面積提取等方面的研究比較缺乏。為此,以河南省北部的濮陽(yáng)縣為研究區(qū),利用GF-2 4 m分辨率數(shù)據(jù)對(duì)區(qū)域尺度下小麥種植空間分布進(jìn)行快速提取,并對(duì)數(shù)據(jù)和方法進(jìn)行較客觀和準(zhǔn)確的評(píng)價(jià),以期為農(nóng)情定量遙感監(jiān)測(cè)和農(nóng)業(yè)種植結(jié)構(gòu)調(diào)整提供依據(jù)。
研究區(qū)位于河南省北部的濮陽(yáng)縣 (114.52°~115.25°E、35.20°~35.50°N),屬暖溫帶大陸性季風(fēng)氣候,雨熱同期,年平均氣溫為13.4 ℃,年均降水量為626 mm。濮陽(yáng)縣是國(guó)家重要商品糧生產(chǎn)基地,建有優(yōu)質(zhì)小麥生產(chǎn)基地,小麥?zhǔn)钱?dāng)?shù)刂饕霓r(nóng)作物,以該縣為研究區(qū)進(jìn)行小麥的快速識(shí)別具有重要意義,具體地理位置見(jiàn)圖1。
圖1 研究區(qū)位置及解譯標(biāo)志
本研究選取2017年3月2日過(guò)境的GF-2 PMS2數(shù)據(jù),空間分辨率為4 m。所收集的遙感影像首先經(jīng)輻射定標(biāo)、大氣校正消除由于大氣散射等引起的輻射誤差,然后采用正射校正進(jìn)行影像的傾斜改正和投影差改正,最后以資源三號(hào)遙感影像為參考進(jìn)行配準(zhǔn),誤差控制在0.5個(gè)像元內(nèi)。
1.3.1 支持向量機(jī) 支持向量機(jī)方法兼具最小化經(jīng)驗(yàn)誤差與最大化幾何邊緣區(qū)的特點(diǎn),因而也被稱為最大邊緣區(qū)分類方法[36]。采用支持向量機(jī)方法進(jìn)行分類時(shí),核函數(shù)的選擇非常關(guān)鍵。目前,常用的核函數(shù)主要包括4種,分別為線性核函數(shù)、多項(xiàng)式核函數(shù)、徑向基核函數(shù)以及Sigmoid核函數(shù)。本研究選取的核函數(shù)為多項(xiàng)式核函數(shù),次數(shù)為3。
1.3.2 人工神經(jīng)網(wǎng)絡(luò) 人工神經(jīng)網(wǎng)絡(luò)算法從信息處理角度對(duì)人腦神經(jīng)網(wǎng)絡(luò)系統(tǒng)進(jìn)行簡(jiǎn)化、抽象,建立一種運(yùn)算模型。此方法具有自動(dòng)學(xué)習(xí)能力和容錯(cuò)特性,而且不需要對(duì)概率模型做出假設(shè),適用廣泛,便于解決空間模式識(shí)別的各種問(wèn)題,因此,在遙感影像分類處理中占有重要地位[30]。本研究選取后向傳輸神經(jīng)網(wǎng)絡(luò)算法,傳遞函數(shù)選取Log2Sigmoid。
1.3.3 最大似然 最大似然法來(lái)源于統(tǒng)計(jì)原理中的極大似然定理,20世紀(jì)末開(kāi)始在遙感影像解譯中使用。此方法來(lái)源于于統(tǒng)計(jì)學(xué),理論基礎(chǔ)嚴(yán)密,所建立的判別函數(shù)綜合考慮了各類別在遙感影像波段中的均值,方差以及協(xié)方差,可以較好地對(duì)參數(shù)進(jìn)行解釋,統(tǒng)計(jì)特性明顯,是一種易于操作的、比較先進(jìn)的分類方法[30]。
遙感解譯的精度評(píng)價(jià)是遙感監(jiān)測(cè)中重要的環(huán)節(jié),可以對(duì)對(duì)分類結(jié)果的可靠性進(jìn)行定量的評(píng)估。目前,常用的精度評(píng)價(jià)方法主要是誤差矩陣方法[32-34],通過(guò)誤差矩陣可以計(jì)算出總體精度、錯(cuò)分比率、漏分比率、Kappa系數(shù)等。Kappa分析是評(píng)價(jià)分類精度的多元統(tǒng)計(jì)方法[37],本研究采用總體精度與Kappa系數(shù)對(duì)小麥及其他地物的識(shí)別結(jié)果進(jìn)行評(píng)價(jià)。
首先對(duì)得到的遙感影像進(jìn)行目視判斷,結(jié)合實(shí)地調(diào)查地面樣方和解譯點(diǎn)的GPS位置信息,對(duì)不同地物類型進(jìn)行標(biāo)定。根據(jù)調(diào)查結(jié)果,主要的地物類型分為9種,分別為小麥、道路、大棚、光伏電站、居民地、林地、裸地、水體和其他,每種地物種類的解譯標(biāo)志點(diǎn)位置和個(gè)數(shù)分別見(jiàn)圖1(右)和表1。
表1 主要地物類型的解譯標(biāo)志個(gè)數(shù)
研究區(qū)GF-2的RGB(3,2,1)影像見(jiàn)圖2a,采用支持向量機(jī)、人工神經(jīng)網(wǎng)絡(luò)和最大似然3種分類方法對(duì)豫北濮陽(yáng)縣研究區(qū)內(nèi)小麥空間分布進(jìn)行識(shí)別,結(jié)果見(jiàn)圖2b、2c和2d。結(jié)果表明,3種分類方法對(duì)小麥的識(shí)別結(jié)果非常相似,用戶精度均在98%以上(表2),但是在道路、大棚和光伏電站的識(shí)別上存在錯(cuò)分現(xiàn)象,這可能是由于3種地物類型的樣本相對(duì)較少造成的。3種分類方法中,SVM和ANN方法的錯(cuò)分誤差和漏分誤差相對(duì)較高,這和分類的樣本數(shù)目有一定的關(guān)系,這2種分類方法需要的樣本數(shù)相對(duì)較少,可能存在過(guò)分的現(xiàn)象,而MLC方法則需要的樣本數(shù)相對(duì)較多,使得識(shí)別結(jié)果較好。
針對(duì)3種分類方法得到的分類結(jié)果,采用誤差矩陣對(duì)分類結(jié)果進(jìn)行精度評(píng)價(jià)。主要采用的評(píng)價(jià)指標(biāo)有4個(gè),分別為生產(chǎn)者精度、用戶精度、總體精度和Kappa系數(shù)。結(jié)果見(jiàn)表2。3種分類方法相比較,生產(chǎn)者精度均在96%以上,以SVM方法最高;用戶精度均在98%以上,以MLC方法最高;Kappa系數(shù)三者比較接近,均在0.8以上;總體精度均在82%以上,以MLC方法最高,達(dá)85.15%。這說(shuō)明,在不對(duì)結(jié)果進(jìn)行修正的情況下,采用GF-2遙感數(shù)據(jù)進(jìn)行快速識(shí)別小麥?zhǔn)强尚械摹?/p>
經(jīng)過(guò)實(shí)地調(diào)查,在研究區(qū),除了小麥,還有8種地物類型,3種分類方法的識(shí)別誤差統(tǒng)計(jì)結(jié)果見(jiàn)表3??傮w來(lái)看,對(duì)于3種方法,小麥和水體的錯(cuò)分和漏分誤差均較小,錯(cuò)分誤差均在2%以下,小麥的漏分誤差在3%左右,水體的漏分誤差在0.5%以下。居民地的錯(cuò)分誤差和漏分誤差均較大,這可能是由于進(jìn)行解譯的時(shí)候樣本數(shù)較少造成的。3種分類方法相比,MLC方法識(shí)別地物的誤差總體最小,尤其是在識(shí)別小麥、水體、光伏電站3種地物時(shí),識(shí)別精度非常高。
a:原始圖像; b:SVM法分類后圖像; c:ANN法分類后圖像; d:MLC法分類后圖像圖2 原始遙感影像和3種分類方法解譯結(jié)果影像
表2 小麥空間分布識(shí)別度對(duì)比
綜上,在進(jìn)行小麥識(shí)別時(shí),3種分類方法均是可靠的。3種分類方法中又總體以MLC方法的小麥識(shí)別誤差最小,錯(cuò)分誤差為0.50%,漏分誤差為2.90%。
表3 不同分類方法對(duì)地物類型識(shí)別的誤差 %
GF-2衛(wèi)星在國(guó)土資源調(diào)查、林業(yè)監(jiān)測(cè)等領(lǐng)域已經(jīng)獲得了較好的應(yīng)用效果[38-41],然而在農(nóng)業(yè)領(lǐng)域的應(yīng)用還較少。目前,此衛(wèi)星的多光譜分辨率(4 m)比國(guó)外RapidEye(5 m)的高,在農(nóng)業(yè)領(lǐng)域的應(yīng)用潛力巨大。因此,非常有必要探索其在農(nóng)業(yè)領(lǐng)域的應(yīng)用潛力。本研究采用GF-2高分辨率數(shù)據(jù)在河南省進(jìn)行小麥的快速識(shí)別和精度分析,3種分類方法對(duì)小麥在空間上的識(shí)別結(jié)果非常相似,用戶精度均在98%以上。綜合生產(chǎn)者精度、用戶精度、錯(cuò)分和漏分誤差等參數(shù),總體以MLC方法的識(shí)別精度最高。在研究區(qū)內(nèi),其他地物的識(shí)別情況,與小麥識(shí)別精度差別較大,例如居民地,這可能是由于進(jìn)行解譯的時(shí)候樣本數(shù)較少造成的。3種分類方法相比,總體以MLC方法識(shí)別地物的誤差最小,尤其是在識(shí)別小麥、水體、光伏電站3種地物時(shí),識(shí)別精度非常高。因此,在采用GF-2進(jìn)行小麥識(shí)別時(shí),建議采用MLC方法。