路 穎,劉玉鋒,宋 婷,湯 鶴
(1.滁州學院 地理信息與旅游學院,安徽 滁州 239000;2.東北農(nóng)業(yè)大學 經(jīng)濟管理學院,哈爾濱 150030)
農(nóng)作物類型的識別是農(nóng)業(yè)遙感的基礎,如何實時、準確地獲取農(nóng)作物類型分布信息對糧食安全、社會經(jīng)濟、政策制定以及生態(tài)功能等都有重要的影響[1]。目前,國內(nèi)遙感影像分類方法包括目視解譯和計算機自動分類兩種,計算機自動分類又分成基于像元分類與基于面向?qū)ο蠓诸惖姆椒╗2]。
就目前已完成的研究發(fā)現(xiàn),目視解譯法分類效率與精度都較低,且基于像元分類方法在進行農(nóng)作物分類時會出現(xiàn)分類結(jié)果破碎、分類精度較低等問題。近年來,許多學者采用面向?qū)ο蟮姆诸惙椒▉磉M行地物識別,雖然此方法在中國起步較晚,但發(fā)展速度較快,已廣泛應用到各個領域。面向?qū)ο蠓椒ㄊ歉鶕?jù)影像特征對圖像進行分割,使同質(zhì)像元組成大小不同的對象,并以其為基本單元,即可考慮影像光譜特征,又可結(jié)合形狀、紋理、尺寸等空間特征,制定目標物提取的規(guī)則集,實現(xiàn)較高層次的目標地物提取,提取結(jié)果可避免斑點噪聲,提高分類精度[3-4]。宋茜等圍繞高分一號遙感數(shù)據(jù)基于面向?qū)ο蟮姆椒ㄟM行農(nóng)作物種植結(jié)構(gòu)的研究,總體精度較高[5]。鄭利娟等基于高分一號與高分六號衛(wèi)星,根據(jù)不同分辨率在影像中作物所表現(xiàn)的特征,利用面向?qū)ο蟮姆椒ㄟM行農(nóng)作物識別,效果顯著[6]。
高分辨遙感影像如GF1-PMS影像紋理特征較為豐富,但覆蓋周期較長,難以反映作物在不同時期內(nèi)的生長特征;時序中分影像覆蓋周期短,時序特征較為豐富,但分辨率較低。因此,可將中分遙感影像與高分遙感影像相結(jié)合,提取兩種影像所包含的特征進行耦合用來參與作物識別。Liu等曾研究通過高時間分辨率與高空間分辨率的結(jié)合對作物進行識別,較現(xiàn)有普遍的單一時相作物識別精度提高20%[7]。
本研究采用2018年10月至2019年9月共11景GF1-WFV(16 m)中分辨率影像與2019年3月GF1-PMS(2 m)高分辨率影像作為基礎數(shù)據(jù),在分析滁州市全椒縣內(nèi)水稻、小麥、玉米、油菜4種作物的空間分布特點的基礎上,利用中分影像基于對象分析作物的時序變化特征,構(gòu)建時序變化曲線;并結(jié)合高分影像的紋理、形狀等特征,將兩種影像包含的特征進行有機結(jié)合,構(gòu)建隨機森林分類模型進行面向?qū)ο蠓诸悾瑥亩@取研究區(qū)農(nóng)作物類型的分布情況。
本研究選擇安徽省滁州市全椒縣作為研究區(qū),位于31°51′~32°15′N,117°49′~118°25′E之間。研究區(qū)地處安徽省東部,屬于丘陵地區(qū),地勢呈東南-西北走向,最高點海拔393 m。屬于亞熱帶季風性氣候,年平均氣溫15.8~16.8 ℃;年平均日照時數(shù)達到1 756.4~1 984.4 h;近10 a降水量1 073.7~1 294.1 mm。全縣總面積1 568 km2, 農(nóng)作物總播種面積889.76 km2。全椒縣作物以水稻和小麥為主,其余為油料、豆類、棉花等作物。研究區(qū)如圖1所示。
圖1 研究區(qū)所在位置
1.2.1 影像數(shù)據(jù)
選擇2019年3月的GF1衛(wèi)星PMS相機的全色影像和2018年10月至2019年9月共計11個覆蓋周期的GF1-WFV 影像,數(shù)據(jù)的具體參數(shù)如表1所示。
表1 遙感數(shù)據(jù)參數(shù)
在ENVI5.3軟件中,對GF1-WFV、GF1-PMS 數(shù)據(jù)分別進行輻射定標、大氣校正、正射校正。根據(jù)中國資源衛(wèi)星應用中心發(fā)布的輻射定標系數(shù)進行輻射定標,采用ENVI中的Flassh模塊對影像進行大氣校正,并通過查看典型地物波譜曲線特征來判斷正確性。正射校正選擇15 m空間分辨率的Landsat-8/OLI衛(wèi)星影像經(jīng)Google Earth的系統(tǒng)校準形成的基礎影像作為控制底圖,基于RPC修正的有理函數(shù)模型,采用小面元微分糾正方法進行幾何配準,控制點采用均勻布設,以每景影像25個左右為宜。
1.2.2 野外采集數(shù)據(jù)
以手持GPS為采集設備,高分衛(wèi)星遙感影像作為底圖,隨機采集典型地物樣本,區(qū)域包括平原地區(qū)、丘陵地區(qū)以及低山地區(qū)。在全椒縣采集150個冬小麥點、120個水稻點、90個油菜點、75個玉米點、65個其他建筑用地、裸地、水域和林地,共采集樣本約500個,把它們隨機分為訓練樣本和用來檢測分類結(jié)果的檢驗樣本。
在采集滁州全椒縣地物樣本外業(yè)數(shù)據(jù)后,又通過查詢農(nóng)作物生長日志了解作物的生長、分布情況,制作出4種作物的物候周期表,為實驗區(qū)作物的精確分類提供支持,如表2所示。
表2 研究區(qū)作物生長狀況
1.2.3 其他數(shù)據(jù)
為了提高作物分類精度,本研究基于第二次全國土地調(diào)查的結(jié)果數(shù)據(jù),從中提取出全椒縣的耕地范圍,以實現(xiàn)在分類的過程中排除其他非耕地的地類干擾作用,如圖2所示。
圖2 全椒縣耕地矢量
本研究結(jié)合野外實地觀測數(shù)據(jù),計算各個農(nóng)作物的NDVI值時序曲線并分析其變化特點作為識別研究區(qū)作物的物候特征;通過可分性比較分析獲得最佳時相的中分影像,并分析其波段時差特征;基于高分影像進行多尺度分割獲得最優(yōu)分割尺度,分析其紋理特征,將中分與高分衛(wèi)星遙感影像數(shù)據(jù)中所包含的特征信息進行結(jié)合,運用面向?qū)ο蠓椒ㄌ崛∽魑锓植夹畔?。總體技術流程如圖3所示。
將高分影像數(shù)據(jù)載入eCognition后,采用多尺度分割算法。設定其波段權重、分割尺度參數(shù)、異質(zhì)性相關因子的值。在多尺度分割時有兩個原則:一是盡可能設置較大的光譜因子值;二是對于邊界不很光滑但聚集度較高的影像對象使用盡可能大的形狀因子[8]。
此次研究實驗中,在全椒縣研究區(qū)選取具有典型代表性的GF1-PMS局部圖,如圖4所示,對尺度因子、形狀因子、緊湊度經(jīng)過多次試值,最終得出不同尺度分割結(jié)果。研究表明,分割尺度以及形狀因子權重設置越大,獲取對象越完整,反之,得到的對象越“破碎”[9]。
圖3 技術流程
當分割尺度為30時,地物被分割得十分密集,使農(nóng)田和其它地物變得破碎且復雜,出現(xiàn)混合狀態(tài),如圖5所示;當分割尺度為150時,地物的形狀被分割得不夠完善,一些大的地物中包含著中小型地物,地物對象沒有被完全分割開,如圖6所示;當分割尺度為70時,對地物的形狀特征分割得相對適當,總體上能夠完整地體現(xiàn)地物的形態(tài),如圖7所示。因此,此次實驗區(qū)選擇如下數(shù)值作為多尺度分割參數(shù):尺度因子Scale為70,形狀因子Shape為0.4,緊湊度權重值為0.3。為了更精確地驗證多尺度分割的效果,按照上述試值數(shù)據(jù)采用面向?qū)ο蟮姆诸惙椒ㄟM行分類,可以看出分類效果較好,因此,采用此分割尺度數(shù)值進行分類可以達到預期的效果,如圖8所示。
圖6 尺度因子Scale 150
圖7 尺度因子Scale 70
圖8 多尺度分割結(jié)果檢驗
構(gòu)建NDVI值不僅能對植被光合作用的輻射吸收情況進行有效地呈現(xiàn),而且可以體現(xiàn)作物在不同時期的生長情況。利用樣本數(shù)據(jù)獲取不同作物歸一化植被指數(shù)均值并形成歸一化植被指數(shù)時序特征曲線,如圖9所示。如此能夠直觀地反映作物在整個生長期內(nèi)的 NDVI 變化過程。計算公式為
NDVI=(NIR-RED)/(NIR+RED).
(1)
圖9 典型地物 NDVI 時間序列曲線
根據(jù)式(1)分別提取11景影像的歸一化差值植被指數(shù)(NDVI)。冬小麥和油菜在10月中上旬開始播種出苗,在原先與之相對應的地塊呈現(xiàn)裸地狀態(tài);出苗后進入冬季,因而在2018年12月至2019年3月期間,NDVI值相對穩(wěn)定;開春之后,小麥、油菜返青,NDVI值上升;進入3月,油菜逐漸開花,光譜開始出現(xiàn)變化,在NDVI 值上表現(xiàn)卻稍微有所下降。
水稻生育周期較短,在4月中下旬開始播種插秧,6月份返青,NDVI值快速增高,7月中旬進入分藥、拔節(jié)時期,8月份NDVI值達到最高值,9月份水稻即將成熟,NDVI曲線逐漸下降,水稻一般在10月基本收割結(jié)束,NDVI降到一個較低值。
玉米在2019年5月至8月期間,經(jīng)歷播種、拔節(jié)、抽穗等生長過程,植被覆蓋度逐步增加,NDVI 值隨日期變化也逐漸增加;到9月份,隨著玉米成熟收獲,大部分的地塊呈現(xiàn)裸地的狀態(tài),NDVI值降至低點。
各類農(nóng)作物隨著日期的變化,其NDVI值也在不斷變化,這種變化很大程度上反映了作物在不同時相上光譜特征的差別。因此,可以說NDVI值的變化特征為作物識別提供了途徑和依據(jù)。
2.3.2 作物分類的最佳時相分析
多時相遙感影像景數(shù)過多會造成數(shù)據(jù)的冗余,導致處理過程復雜,故遙感影像時相、景數(shù)的選取直接影響作物識別的效率和精度[10]。J-M(Jeffries-Matusita)距離通常用于度量兩類別間特征子集的可分性,具有對數(shù)據(jù)的分布形式要求低、通用性好的特點,其取值在0~2之間,值越大,可分性越好[11]。本研究區(qū)內(nèi)水稻、油菜和玉米3類地物的GF1-WFV時相影像光譜特征區(qū)分難度較大,因此,僅選擇3種作物來計算J-M距離,各作物間J-M距離如表3所示。
J-M 距離計算公式為
Jij=2×(1-exp(-Bij)).
(2)
表3 典型地物特征J-M距離時間序列數(shù)據(jù)
經(jīng)過計算可知,典型地物特征J-M距離GF1-WFV影像數(shù)據(jù)的分離度大于1.8以上且數(shù)量較多的時相為2019-04-25、2019-05-23、2019-08-02,因此,研究區(qū)選用上述3種時相作為農(nóng)作物識別的基礎。
2.3.3 紋理特征分析
紋理是地物的物理形態(tài)所表達出的灰度空間相關特性,紋理特征的核心問題是紋理區(qū)域的一致性和相鄰區(qū)域邊界的準確性[12]。為分析關于作物的方向、相鄰間隔、變化幅度的綜合信息,計算待分類影像和樣本的灰度共生矩陣,然后根據(jù)灰度共生矩陣進行特征值的計算,形成特征矩陣[13-14]。在eCognition中選用熵(ENT)、相關性(COR)和不相似性(DIS)來描述研究區(qū)內(nèi)作物的紋理特征。
1)熵ENT:衡量圖像的無序性,紋理越不均勻,熵值越大,當影像特征為完全隨機性紋理時達到最大值。
2)相關性COR:用來衡量鄰域灰度線性依賴性,相關性越高則紋理一致性程度越高。
3)不相似DIS:用來度量相似性,局部對比度越高值越大。
通過反復實驗,對影像各個波段的3個紋理特征進行計算分析,得出各個波段的紋理特征值,通過對比其差值能夠更直觀地表示出各個作物在紋理特征之間的差異,如表4所示。
表4 各波段的紋理特征值
2.3.4 波段時差特征分析
波段時差特征是指不同時相影像相同波段間的差值[15]。由于小麥和水稻在5月至8月期間影像的波段差值相近,難以進行區(qū)分,因此,文中選用2019-05-23和2019-08-02兩種作物分類最佳時相上的小麥和水稻的波段時差,如圖10、圖11所示,兩個時相上的圓形標注和方形標注內(nèi)的農(nóng)作物分別是小麥和水稻。
依此計算兩個時相中的小麥和水稻紅、綠、藍、近紅外波段的輻射亮度均值與均值差值,最終得出2019-05-23和2019-08-02時相上小麥和水稻的波段時差特征,如圖12所示。4個波段上小麥和水稻在紅和近紅外兩個波段中的差異較為明顯,由此可以將波段時差特征作為區(qū)分小麥和水稻的特征之一。
圖10 2019-05-23與2019-08-02時相的小麥
圖11 2019-05-23與2019-08-02時相的水稻
圖12 不同時相中小麥、水稻波段時差
在GF-1 PMS影像的光譜信息和紋理信息與3種GF-1 WFV時相數(shù)據(jù)中,對基于對象的反射率的農(nóng)作物時間變化特征和波段時差特征相結(jié)合進行特征選擇。
利用隨機森林分類模型對作物的物候特征、紋理特征、波段時差特征進行組合分類,構(gòu)建特征集合,并按照順序?qū)μ卣骷现杏绊懶Ч钚〉奶卣饕来翁蕴?,以尋求?yōu)選特征子集。隨機森林作為機器學習的重要方法擁有廣泛的應用前景。其實質(zhì)就是利用多種分類器投票決定分類結(jié)果,對于一個輸入樣本,N棵樹會有N個分類結(jié)果[16]。
根據(jù)表5所示,將各種特征依次輸入隨機森林模型中,采取交叉驗證的方式,去除對分類貢獻最低的特征,重復執(zhí)行并取其中的平均值,計算每次分類結(jié)果的精度,最后選擇最高的分類精度所對應的優(yōu)選特征子集。
表5 特征集情景參數(shù)
針對研究區(qū)優(yōu)選特征子集提取農(nóng)作物種植結(jié)構(gòu),基于面向?qū)ο蟮姆椒▽Ω叻直媛蔬b感影像進行農(nóng)作物類型識別,并利用野外收集的訓練樣本驗證識別的結(jié)果。面向?qū)ο蠓诸惤Y(jié)果混淆矩陣如表6所示。分類識別的總體精度為88.38%,Kappa系數(shù)為0.841 5,達到較高的一致性。從用戶精度和制圖精度上來看,玉米分類精度最高,油菜次之,水稻的分類精度最低。分類結(jié)果如圖13所示。
表6 面向?qū)ο蠓诸惤Y(jié)果混淆矩陣
圖13 農(nóng)作物類型識別結(jié)果
由圖13可以看出,全椒縣研究區(qū)的水稻種植區(qū)域較大,分布在研究區(qū)各個范圍內(nèi),其中,大部分分布在東南部區(qū)域,此處灌溉條件好,地力等級較高;小麥大多分布在中部與西南部地區(qū),范圍較為集中;油菜的種植范圍較小且分散成塊狀;玉米主要分布在中北部地區(qū),與油菜分布相似,比較分散。農(nóng)作物識別的結(jié)果與野外實地調(diào)查的情況相符合。使用面向?qū)ο蟮姆椒ú粌H可以防止分類結(jié)果的“椒鹽效應”、識別不精確等問題,而且能夠提高作物識別的效率,減少錯分、漏分的現(xiàn)象。
經(jīng)過上述研究,得出以下結(jié)論,同時也存在諸多不足:
1)在進行農(nóng)作物類型識別工作之前,必須先進行野外樣本采集和調(diào)查,這是作物分類和檢驗識別精度最重要的一環(huán)。采集樣本時應盡量使樣本均勻分布在研究區(qū)內(nèi),以免影響分類的精度。
2)利用高分辨率衛(wèi)星遙感影像豐富的紋理特性進行最優(yōu)化多尺度分割,多時相中分辨率遙感影像制作NDVI時間變化曲線,能夠體現(xiàn)出農(nóng)作物在不同生長期的特征差異。將高分辨率衛(wèi)星遙感影像豐富的紋理信息與多時相中分辨率遙感影像農(nóng)作物不同生長期的特征相互耦合,構(gòu)建隨機森林模型組建分類規(guī)則進行面向?qū)ο蠓诸?,可以非常清晰地呈現(xiàn)出各個農(nóng)作物的生長趨勢,從而防止出現(xiàn)單時相數(shù)據(jù)由于農(nóng)作物在不同時期的生長狀況不一而導致的分類不精或漏分的現(xiàn)象,很大程度上提高了分類精度,分類的效果較為理想。
3)多尺度分割需要經(jīng)過多次試值才能達到較好效果,但難以確定最優(yōu)分割尺度值,存在著一定的主觀判斷。且由于各地區(qū)氣候地形等差異影響,此法在一定程度上普適性較低,未來還需要不斷調(diào)整改進以期推廣到全國的農(nóng)業(yè)種植區(qū),達到運用遙感技術來促進農(nóng)業(yè)發(fā)展的目的。