章若鴻
(福建農(nóng)林大學林學院,福建福州 350002)
準確、高效地對農(nóng)作物種類進行分類和提取是精準農(nóng)業(yè)的基礎(chǔ),它為農(nóng)作物水肥精準管理、生長狀況監(jiān)測和產(chǎn)量預(yù)估等農(nóng)業(yè)管理決策提供了有力的數(shù)據(jù)支撐[1],在推動農(nóng)業(yè)數(shù)字化、智能化、自動化管理上具有重要意義。
傳統(tǒng)農(nóng)作物提取方法主要是通過人工調(diào)查的方法,該方法只能應(yīng)用在小范圍種植區(qū)域內(nèi),其雖有較高精度,但存在效率低和成本高等不足,且該方法所統(tǒng)計結(jié)果與真實信息仍然具有一定的誤差,難以滿足現(xiàn)代社會對農(nóng)作物精準監(jiān)測和高效管理的要求。近些年,遙感技術(shù)已被廣泛應(yīng)用于農(nóng)作物空間分布信息提取、作物分類制圖中[3]。但傳統(tǒng)衛(wèi)星及機載遙感影像空間分辨率低,難以實現(xiàn)對小尺度上農(nóng)作物精細化提取。隨著輕量化、小型化的無人機遙感平臺普及,其在大面積農(nóng)作物信息提取方面起到了非常重要的作用。無人機具有靈活性強、重返周期短且能夠自動化進行影像采集作業(yè)的特點[4],為農(nóng)業(yè)動態(tài)化監(jiān)測提供了新的技術(shù)手段。
面向?qū)ο髨D像分析在遙感分類領(lǐng)域已經(jīng)被廣泛應(yīng)用。面向?qū)ο蠓椒ú煌趥鹘y(tǒng)基于像素的方法,其分類單元是經(jīng)分割后形成的性質(zhì)相對均一的對象,因而可以充分利用影像對象的光譜、紋理、幾何、指數(shù)等特征[5]。然而,特征維度的增加會使得特征之間存在冗余和噪聲等問題,影響提取精度?,F(xiàn)有研究表明[6],隨機森林(Random Forest,RF)在處理高維特征時具備更好的穩(wěn)健性與泛化能力,不易產(chǎn)生過擬合現(xiàn)象,無需降維也能在高維特征情況下保持很高的精度,且在識別精度與效率方面相比于其他機器學習方法(如支持向量機、K-最近鄰法等)均具有更大優(yōu)勢[7],因此被廣泛用于多重特征分類中。
鑒于此,該文以農(nóng)作物的無人機影像為數(shù)據(jù)源,利用多尺度分割算法對影像進行分割,提取分割后對象的4類特征,利用隨機森林模型進行分類并評價分類性能,以期為農(nóng)作物精細管理提供有力支撐。
研究區(qū)(119°13′ E,26°5′ N)位于福建省福州市倉山區(qū)北部(圖1)。該地位于亞熱帶季風氣候區(qū),年降雨量為900~2 100 mm,年平均氣溫為18℃~26℃。研究區(qū)中種植有土豆(Solanum tuberosum L.)、卷心菜(Brassica oleracea L.)和花椰菜(Brassica oleracea L.var.botrytis)、紫油麥菜(Lactuca sativa var longifoliaf.Lam)4 種作物。
圖1 研究區(qū)正射影像
采用大疆精靈4 無人機采集研究區(qū)可見光影像,航高設(shè)定為20 m,航向和旁向重疊度均設(shè)為75%,每張照片的尺寸為5 472 像素×3 078 像素。利用Pix4d mapper 軟件對所獲取的影像進行拼接,生成分辨率為0.033 m 的正射影像。
采用ESP2 工具進行影像最佳分割尺度的篩選,該工具所統(tǒng)計的局部方差(LV)及其變化率(ROC)變化趨勢如圖2 所示。當ROC 值出現(xiàn)峰值時,該點對應(yīng)的分割尺度即為相對較佳分割尺度;由此可得最佳分割尺度的備選數(shù)值分別為18、29、35、45、52、78、87、99、108。
圖2 ESP2 尺度變化趨勢
通過目視比較基于備選分割尺度的分割效果可知(圖3),當尺度參數(shù)設(shè)置較小時(18~45),作物內(nèi)部被過度分割,如卷心菜內(nèi)芯、花椰菜葉片、以及油麥菜與土壤交接邊緣都產(chǎn)生了較為細碎的分割圖斑;尺度設(shè)為較大時(78),作物葉片與周圍土壤混為一體,出現(xiàn)了過分割現(xiàn)象;相對而言,基于尺度52 分割后的影像其圖斑內(nèi)部地物較為均一且其邊緣識別較為準確,整體分割效果較為理想,因此該研究將最佳分割尺度設(shè)定為52。
圖3 不同分割尺度分割效果
由于消費級無人機所搭載的可見光傳感器光譜分辨率較低,僅依靠可見光光譜難以對不同地物進行有效區(qū)分。為了彌補可見光影像波段較少的局限性,該研究選取了4 類特征(共44 個),具體如表1。
表1 特征變量
隨機森林算法是以決策樹為基本單元,通過集成學習的思想將若干決策樹集成在一起,利用多棵樹對樣本進行訓練與預(yù)測,采用投票方式?jīng)Q定樣本的分類結(jié)果。決策樹數(shù)目和每棵決策樹所包含的特征數(shù)目是模型運行的2個重要參數(shù),為了確定其最佳值,通過遞歸特征消除法(RFE)和交叉驗證相結(jié)合的方式對特征數(shù)量參數(shù)進行調(diào)優(yōu),最終確定的最佳特征數(shù)量與決策樹數(shù)量分別為19 和224。
該文根據(jù)混淆矩陣計算出的總體精度(OA)、生產(chǎn)者精度(PA)、用戶精度(UA)、Kappa 系數(shù)(Kappa)這4 個指標進行分類精度評價。
由不同地物識別的精度評價結(jié)果(表2)可知,利用歸特征消除與隨機森林相結(jié)合的算法取得了很高的精度,總體精度達93.18%,Kappa 系數(shù)達0.91。其中卷心菜、油麥菜和花椰菜用戶精度與生產(chǎn)者精度均高于90%,而土豆由于其葉片顏色與紋理特征與部分作物產(chǎn)生耦合,造成精度較低,生產(chǎn)者精度僅為86.55%;非農(nóng)作物地物都取得了較高的精度,其中白色地膜生產(chǎn)者精度達到了99.41%。由此可見,選取的方法能滿足提取精度要求。
表2 不同地物識別的精度評價結(jié)果
基于隨機森林模型預(yù)測生成的農(nóng)作物提取結(jié)果如圖4 所示,從中可看出農(nóng)作物與非農(nóng)作物地物能夠被正確識別,各地物區(qū)分度較好,最終的分類結(jié)果邊界清晰且破碎化現(xiàn)象較少,比較符合研究區(qū)地物分布情況。從局部細節(jié)進行分析,植被指數(shù)特征在農(nóng)作物地物與非農(nóng)作物地物區(qū)分上起到了較大作用;在農(nóng)作物提取上,由于卷心菜和土豆邊緣葉片顏色與花椰菜相似,僅利用可見光影像在區(qū)分上存在一定困難,造成一定的錯分現(xiàn)象;而紫油麥菜,葉片顏色呈紫紅色,與其余3 種作物顏色差異較為明顯,故提取效果較佳;非農(nóng)作物地物中,稻稈覆蓋地和裸土地在光譜特征上雖然存在一定相似性,但是其紋理特征差異較大,因此在實際應(yīng)用效果上取得了較好的效果;反觀白色地膜與混凝土2 種地物,不僅光譜特征差異小,在幾何和紋理上也存在高度相似性,因此2 種地物均存在不同程度的混淆現(xiàn)象。
圖4 農(nóng)作物提取結(jié)果
無人機影像相比于傳統(tǒng)衛(wèi)星影像,在空間分辨率上具有極大優(yōu)勢,使得農(nóng)作物精細化提取得以實現(xiàn);利用遞歸消除法進行特征優(yōu)選的方法能夠有效實現(xiàn)高維度特征的降維,提升模型的運行效率與精度,其總體精度為93.18%,Kappa 系數(shù)為0.91,其中光譜特征、植被指數(shù)特征與紋理特征均對分類效果起到重要作用。該研究結(jié)果表明,利用消費級無人機遙感平臺進行農(nóng)作物提取的方法是可行的,有助于進一步促進消費級無人機在精準農(nóng)業(yè)領(lǐng)域的應(yīng)用。