魏傳文,黃敬峰,楊玲波
(1. 中國氣象科學研究院災害天氣國家重點實驗室,北京100081;2. 浙江大學遙感與信息技術(shù)應用研究所,杭州310058)
油菜是重要油料作物之一,中國油菜種植面積和產(chǎn)量均占世界20%以上,及時有效地監(jiān)測油菜空間分布情況具有重要意義[1]。根據(jù)油菜品種屬性、區(qū)域氣候特征等因素,中國油菜可劃分為冬油菜和春油菜兩大產(chǎn)區(qū)。其中,冬油菜種植面積及產(chǎn)量占全國總面積和總產(chǎn)量的90%以上,是中國油菜種植的主要品種[2]。冬油菜主要分布于我國長江流域湖北、四川、江蘇、安徽、湖南等省份。由于冬季寒潮影響,該區(qū)域油菜易受凍害影響,據(jù)文獻記載,長江流域發(fā)生過多次不同程度的油菜凍害[3-6]。監(jiān)測油菜種植面積是油菜凍害等自然災害預防和受災評估的基礎(chǔ)。
遙感技術(shù)具有大范圍、近實時、高空間分辨率的特點,是油菜面積監(jiān)測的可靠技術(shù)手段。目前油菜面積估算主要集中于開花期[7-8],主要是因為開花期油菜與其它地物有顯著的光譜差異,易于區(qū)分。如Pan等[8]使用Hyperion高光譜衛(wèi)星數(shù)據(jù)估算了油菜開花期的種植面積。與光譜角匹配算法和植被指數(shù)(Normalized Difference Vegetation Index,NDVI)方法相比,基于多光譜特征擬合的方法能得到更精確的估算結(jié)果(RMSE<0.06)。除了使用開花期影像,為了區(qū)分與冬油麥易混淆的冬小麥,有研究利用其它生育期的影像數(shù)據(jù)提取油菜種植面積[9-11],如王凱等利用油菜特有的MODIS-NDVI時間序列變化特征,基于決策樹算法估算了湖北省多年的油菜種植面積。然而,其中一些閾值仍然采用了開花期的影像數(shù)據(jù)。由于油菜凍害常發(fā)生于冬季,開花期的油菜面積是遭受凍害之后的面積。因此,為了準確獲得油菜受凍害面積,冬前油菜面積估算是油菜凍害面積監(jiān)測的關(guān)鍵。文章利用高空間分辨率、高時間分辨率的環(huán)境與災害監(jiān)測預報小衛(wèi)星(HJ-1A/B)數(shù)據(jù),采用決策樹方法提取荊州市江陵縣2009—2015年(不包括2011—2012年生長季)的冬前油菜種植面積,為準確獲取油菜凍害面積奠定基礎(chǔ)。
研究區(qū)位于湖北省荊州市江陵縣,屬江漢平原油菜產(chǎn)區(qū)。湖北省是長江流域冬油菜的主產(chǎn)區(qū),油菜種植面積一直位于全國前列。通過查閱中國氣象數(shù)據(jù)網(wǎng)[12]中國農(nóng)業(yè)氣象災情旬值數(shù)據(jù)集,湖北省油菜有凍害記錄的年份為1993、1994、2004和2008年,有凍害記錄的站點10個,共15條記錄。江陵縣以兩熟制耕作制度為主,包括水稻—油菜、水稻—棉花兩種。研究區(qū)主要油菜品種為中早熟和中熟甘藍型油菜,種植方式包括育苗移栽和直接栽培。其中育苗移栽一般在9月5—10日進行育苗播種,并在10月中旬進行移栽;直接栽培一般在9月20日播種,翌年5月上中旬收獲。研究區(qū)地勢平坦,屬長江沖積平源和四湖濱湖平原并列地帶,海拔高程為25.3~40 m,屬亞熱帶季風性濕潤氣候,全年日照時數(shù)1 827~1 897 h,全年平均氣溫16~16.4℃,年均降雨量900~1 100 mm。研究區(qū)位置如圖1所示。
1.2.1 遙感數(shù)據(jù)及處理
該文選取HJ-1A/B衛(wèi)星影像為數(shù)據(jù)源。HJ-1A/B數(shù)據(jù)具有高空間分辨率(30 m)、重訪周期短(2 d)、數(shù)據(jù)免費等優(yōu)點,更適合于對作物種植比較分散的區(qū)域進行遙感監(jiān)測研究。HJ-1A/B CCD傳感器具有藍、綠、紅、近紅外4個波段,其中CCD傳感器又包含了CCD1和CCD2。該研究擬對2009—2015年江陵縣冬前油菜種植面積進行研究,但由于2011—2012年生長季影像數(shù)據(jù)質(zhì)量不高,不能支持面積估算研究,因此剔除該生長季,僅對其中的5個生長季進行分析。影像數(shù)據(jù)從中國資源衛(wèi)星應用中心下載,為經(jīng)過相對輻射校正和系統(tǒng)幾何校正的2級衛(wèi)星數(shù)據(jù)產(chǎn)品,剔除含云量較高的影像數(shù)據(jù),共獲得可用影像數(shù)據(jù)32景,其中2009—2010年生長季共7景,2010—2011年生長季共11景,2012—2013年生長季共5景,2013—2014年生長季共4景,2014—2015年生長季共5景。
圖1 油菜面積提取研究區(qū)Fig.1 Study area of oilseed rape planting extraction
對影像數(shù)據(jù)進一步校正處理。絕對輻射定標使用定標系數(shù)將DN值轉(zhuǎn)換為輻射亮度值。由于影像數(shù)據(jù)覆蓋范圍較大,在大氣校正之前,要對影像進行裁剪。采用MODTRAN模型的FLASSH模塊進行大氣校正。采用Landsat-8 OLI數(shù)據(jù)和二次多項式模型進行幾何校正。均勻選取控制點并采用最近鄰法進行重采樣,保證影像校正位置誤差小于0.5個像元。得到反射率后,計算NDVI指數(shù),用于油菜面積估算。
1.2.2 樣本選取
訓練樣本的選取是監(jiān)督分類重要步驟,它的選取質(zhì)量直接影響分類精度。該文采用研究區(qū)實地調(diào)查和參考高分辨率影像數(shù)據(jù)相結(jié)合的方式選取訓練樣本。根據(jù)江陵縣農(nóng)業(yè)生產(chǎn)狀況和實地考察結(jié)果,將地物分為油菜、小麥、居民點和水體等4個類別,其它地物如大麥、林地和蔬菜等由于種植面積較小,予以忽略。實地考察時間為2014年3月31日和2014年5月22—24日。采用差分GPS對主要地物進行定位,將矢量數(shù)據(jù)加載到Google Earth高分辨率衛(wèi)星影像上,觀察4類地物在影像上呈現(xiàn)的特征,選取訓練和驗證樣本用于油菜面積提取。為了衡量各地物訓練樣本之間的光譜可分離性,分別計算之間的J-M(Jeffries-Matusita)距離,值越大表明地物之間的可分離性越高[13]。訓練樣本的選取結(jié)果如表1所示。
1.2.3 估算方法
表1 2009—2015年(不包括2011—2012年)江陵縣地物訓練樣本像元數(shù)Table 1 Number of training samples for different land covers from 2009 to 2015(excluding 2011—2012)
冬前油菜面積提取采用決策樹算法(Decision Tree Classification,DTC)。決策樹算法采用地物屬性閾值分割原理對地物進行二叉樹或多叉樹劃分,閾值通過樣本訓練(自動決策樹)或人工經(jīng)驗獲取[14]。采用決策樹算法進行油菜面積提取的步驟是先將水體和居民點分離,再區(qū)分油菜和冬小麥。NDVI值具體到日期,表示為NDVIyyyy-mm-dd。為了對決策樹算法提取的冬前油菜面積進行定性驗證和對比,采用應用較廣的最大似然分類法提取開花期油菜面積。最大似然分類法(Maximum Likelihood Classification,MLC)假定各類分布函數(shù)為正態(tài)分布,并通過樣本數(shù)據(jù)獲取目標及其他類別數(shù)據(jù)的后驗概率,通過貝葉斯公式轉(zhuǎn)換為先驗概率,根據(jù)像元值將各個像元分類為最可能的地物類別。
1.2.4 評價方法
首先以油菜面積統(tǒng)計數(shù)據(jù)(來源于2011—2016年《湖北農(nóng)村統(tǒng)計年鑒》)為參照數(shù)據(jù)對油菜估算面積進行精度驗證,計算相對誤差。公式:
式(1)中,AR是統(tǒng)計面積,AC是影像估算面積。
其次,對提取的面積進行空間位置驗證。采用混淆矩陣評價遙感影像分類精度。評價指標主要有用戶精度(User Accuracy,UA)、生產(chǎn)者精度(Producer Accuracy,PA)、錯分誤差(Commission Errors,CE)和漏分誤差(Omission Errors,OE)。它們的計算公式:
式(2)~(5)中,Pi是每類被正確分類的像元數(shù),Phi是混淆矩陣每行的像元總數(shù),Pvi是混淆矩陣每列的像元總數(shù)。
江陵縣主要冬季作物為冬小麥及油菜,其光譜特征較為相似,易于混淆,需著重探討油菜及冬小麥的NDVI變化特征。考慮到2010—2011年生長季內(nèi)有充足的影像數(shù)據(jù),NDVI時間序列較為完整,該文以2010—2011年生長季為例說明油菜和冬小麥的NDVI特征變化。從圖2發(fā)現(xiàn),油菜的NDVI值呈現(xiàn)明顯的“M”型特征,從2010年10月NDVI值開始增加,到12月達到第一個極大值,隨后開始減小,并在2011年開花期(3月底)達到極小值。油菜角果期(4月)NDVI值又逐漸增大,而在角果期之后,NDVI值又逐漸降低。在2011年1—2月,由于油菜處于苗后期以及蕾苔初期,其NDVI值變化較小。
冬小麥的NDVI特征則較為單一,從2010年10月初開始至11月初其NDVI值先降低后逐漸增加,在2011年4月達到最高值,之后再次逐漸降低;水體的NDVI則一直處于低位,與其它地物區(qū)分顯著;居民點則由于存在一定的植被混合像元,在2010年10月至12月其NDVI值逐漸降低,而開春(3月初)后其NDVI值又逐漸增加,基本小于0.3。
圖2 江陵縣2009—2015年5個生長季(不包括2011—2012年)4類地物NDVI時序曲線Fig.2 NDVI time series curves of 4 types of ground objects in 5 growth seasons in Jiangling County from 2009 to 2015(excluding 2011—2012)
從圖2可知,研究區(qū)主要冬季作物冬小麥和油菜的生育期高度重疊,但是其NDVI時序曲線有一定差異。根據(jù)統(tǒng)計年鑒數(shù)據(jù)可知,油菜播種期一般為9月中下旬和10上旬,冬小麥的播種期一般為10月中下旬到11月上旬。油菜的播種期普遍要早于冬小麥,因此在生長早期油菜的NDVI值增長較冬小麥快,相同時期油菜NDVI值要高于冬小麥;其次,在冬季油菜基本停止生長,而冬小麥則繼續(xù)生長,在NDVI曲線上表現(xiàn)為油菜的NDVI值保持穩(wěn)定甚至下降,而冬小麥NDVI值繼續(xù)增加;最后,在油菜開花期受到油菜花的影響,油菜的綠度下降,NDVI值下降,而冬小麥正處在拔節(jié)期,其NDVI值快速增加;而過了開花期后,油菜的NDVI值開始增加隨后減小,而冬小麥NDVI則在拔節(jié)期后持續(xù)降低。因此,冬小麥NDVI峰值的出現(xiàn)要早于油菜峰值出現(xiàn)的時間。
根據(jù)江陵縣不同地物每個生長季NDVI的變化特征,構(gòu)建相應的決策樹。
(1)2009—2010年生長季:根據(jù)2009年10—11月油菜和冬小麥NDVI增大而其他地物NDVI變化較小的特征,設(shè)置NDVI2009-11-23-NDVI2009-10-24>0.04,剔除水體和居民地;同時設(shè)置 NDVI2009-10-24-NDVI2009-09-15>0,NDVI2009-09-15<0.50,NDVI2009-11-23>0.6,以此區(qū)分油菜和小麥。根據(jù)初步分類結(jié)果發(fā)現(xiàn)有一部分油菜的NDVI2009-10-24-NDVI2009-09-15<0,因此,再次設(shè)置NDVI2009-09-15<0.55,NDVI2009-11-23>0.60來提取該部分油菜。
(2)2010—2011年生長季:根據(jù)2010年11—12月油菜NDVI增長緩慢甚至不變的特征,通過設(shè)置NDVI2010-12-21-NDVI2010-11-12>-0.05,實現(xiàn)油菜提??;之后,根據(jù)2010年10—11月油菜NDVI緩慢增長以及10月底油菜NDVI較高的特征,設(shè)置NDVI2010-11-12-NDVI2010-10-04>-0.03 and NDVI2010-12-21>0.54,剔除上一步油菜提取結(jié)果中的其他地物;最后,考慮到部分油菜存在NDVI2010-11-12-NDVI2010-10-04<0的情況,設(shè)置NDVI2010-10-04的范圍為0.4~0.65 and NDVI2010-12-21>0.5,提取剩余部分油菜。
(3)2012—2013年生長季:首先根據(jù)冬季油菜NDVI增長緩慢且變化較小的特征,結(jié)合實際影像分析,設(shè)置NDVI2013-01-01-NDVI2012-11-26>-0.05,剔除居民點和水體,提取油菜和冬小麥混合像元。其次,根據(jù)油菜在早期生長較冬小麥快的特點,設(shè)置NDVI2012-11-26-NDVI2012-10-02>0.25,NDVI2012-11-26>0.58,從而剔除冬小麥,完成油菜識別。
(4)2013—2014年生長季:根據(jù)越冬前油菜生長較快而冬季油菜生長緩慢乃至停止 的 特 點, 設(shè) 置 NDVI2013-11-06-NDVI2013-10-12>0,NDVI2013-11-19-NDVI2013-11-06>0.15,NDVI2013-11-19>0.39,初步識別油菜;其次考慮到部分油菜NDVI存在波動的特點,設(shè)置NDVI2013-11-06-NDVI2013-10-12<0,NDVI2013-11-19>0.43,NDVI2013-10-12<0.45,剔除冬小麥像元,完成全部油菜提取。
(5)2014—2015年生長季:根據(jù)冬前油菜和冬小麥NDVI緩慢增大的特點,設(shè)置NDVI2014-12-19-NDVI2014-11-14>0,剔除水體及居民地,獲取油菜和冬小麥。同時,為了防止部分居民地存在綠地的影響,設(shè)置NDVI2014-12-19>0.40,進一步剔除混淆的居民地。之后根據(jù)油菜在冬季生長基本停止的特征,設(shè)置NDVI2014-11-14-NDVI2014-10-07>0,NDVI2014-12-19-NDVI2014-10-07>0.25,剔除冬小麥,提取油菜。
綜上研究根據(jù)決策樹算法獲取了2009—2015年5個生長季的油菜種植區(qū)域分布圖(圖3),結(jié)果可知江陵縣冬小麥主要集中在西部和南部,而東北部則分布較少。,通過人工構(gòu)建決策樹的方式可以獲取大部分的油菜和冬小麥,但是依然存在部分冬小麥和油菜及居民地的混淆情況,難以單純使用NDVI進行識別,需要結(jié)合機器學習、深度學習等新技術(shù)進一步完善提取算法。
圖3 2009—2015年(不包括2011—2012年)江陵縣決策樹算法油菜種植面積提取結(jié)果Fig.3 Classification results of winter oilseed rape based on decision tree method in Jiangling County from 2009 to 2015(excluding 2011—2012)
2.3.1 基于開花期油菜面積的定性評價
使用油菜開花期的遙感影像,基于最大似然分類方法獲取江陵縣油菜種植面積,并以此為基礎(chǔ)評價決策樹算法的分類識別精度[15-16]?;谧畲笏迫环诸惙椒ㄌ崛〉挠筒朔N植面積最終結(jié)果如圖4所示,從圖4可知,對于2009—2010年和2010—2011年油菜生長季,油菜的面積提取結(jié)果與決策樹提取較為接近,而其它時期,油菜面積提取結(jié)果差異較大。考慮到未獲得江陵縣2012—2013年和2013—2014年生長季油菜開花期的遙感影像,因此使用J-M距離方法計算各個時期影像地物的光譜可分離性,結(jié)果表明,2012—2013年生長季的地物識別最佳影像為2013-04-15的影像,而2013—2014年生長季地物識別最佳影像為2013-11-19的影像。此外,2014—2015年生長季油菜開花期的遙感影像存在少量云污染,可能對分類結(jié)果精度產(chǎn)生影響。
圖4 2009—2015年(不包括2011—2012年)江陵縣油菜種植面積最大似然提取結(jié)果Fig.4 Maximum likelihood classification results of oilseed rape planting area in Jiangling County from 2009 to 2015(excluding 2011—2012)
2.3.2 基于統(tǒng)計數(shù)據(jù)的油菜面積提取精度評價
參照2011—2016年《湖北農(nóng)村統(tǒng)計年鑒》油菜種植面積統(tǒng)計數(shù)據(jù),采用相對誤差計算方法對遙感監(jiān)測方法提取的油菜面積進行精度評價,結(jié)果如表2所示。從面積的相對誤差而言,2009—2010年和2010—2011年油菜生長季中,最大似然分類方法油菜面積提取的誤差要小于決策樹算法提取誤差。而由于2012—2013年、2013—2014年生長季油菜的開花期影像缺失,以及2014—2015年生長季開花期影像存在云污染,使得最大似然分類方法提取的油菜面積誤差要高于決策樹算法提取誤差??傮w而言,決策樹方法提取的油菜種植面積相對誤差都低于15%,表現(xiàn)較好。
表2 2009—2015年(不包括2011—2012年)江陵縣油菜種植面積估算結(jié)果Table 2 Accuracies validation of oilseed rape planting area estimation from 2019 to 2015(excluding 2011—2012)
續(xù)表2
2.3.3 基于空間位置的精度評價
根據(jù)獲取的樣方數(shù)據(jù),對兩種方法的油菜提取面積進行評估,結(jié)果如圖5所示,在2009—2010、2010—2011、2012—2013年油菜生長季中,最大似然分類方法提取的油菜面積在生產(chǎn)者精度和用戶精度兩方面都高于決策樹方法提取結(jié)果。在2013—2014年生長季油菜面積提取中,決策樹方法的生產(chǎn)者精度和用戶精度更高。在2014—2015年生長季,雖然遙感影像含云,但是最大似然方法的生產(chǎn)者精度和用戶精度更高??傊?,最大似然分類方法和決策樹方法在生長季油菜面積提取上都具有較好的精度,兩者在不同年份表現(xiàn)各有優(yōu)劣,影響其精度的具體原因有待進一步查證分析。
圖5 2009—2015年(不包括2011—2012年)江陵縣油菜種植面積估算結(jié)果的空間位置精度Fig.5 Accuracies validation of oilseed rape planting area estimation in Jiangling County from 2009 to 2015(excluding 2011—2012)
冬前油菜面積提取是油菜凍害面積監(jiān)測的關(guān)鍵。該文基于多時相HJ-1A/B NDVI時間序列特征,采用決策樹方法提取了江陵縣冬前油菜面積。冬前油菜面積的用戶精度達到80.40%~95.56%,生產(chǎn)者精度達到82.56%~91.43%,相對誤差低于15%。精度評價結(jié)果證明了該方法是可行的。影響油菜面積提取的主要因素是云污染以及其它地物(特別是小麥)與油菜的光譜相似性。為了降低云污染,增加可利用的影像數(shù)量,采用新的衛(wèi)星數(shù)據(jù)是解決途徑之一,例如靜止衛(wèi)星以及合成孔徑側(cè)視雷達數(shù)據(jù)具有較高的時間和空間分辨率,可以用于油菜面積估算研究。為了減小光譜相似性的影響,可以與其它光譜特征或非光譜特征(比如紋理特征)相結(jié)合進行油菜面積的估算研究。此外,人工智能等先進算法的應用為作物面積提取開辟了新的思路。后續(xù)研究將采用新數(shù)據(jù),基于更多特征以及新型分類算法,提高冬前油菜種植面積提取精度,為油菜凍害面積監(jiān)測提供更精準的支持。