摘" 要: 針對(duì)目前多種典型作物分類中特征冗余導(dǎo)致同科作物混淆、分類精度低的問(wèn)題,文中提出一種結(jié)合特征過(guò)濾法篩選特征和Stacking集成學(xué)習(xí)的作物精細(xì)分類方法。首先,結(jié)合敏感波段構(gòu)造新型植被指數(shù)并進(jìn)行閾值分割,實(shí)現(xiàn)作物區(qū)域提取;然后,提取不同作物的顏色和紋理特征,進(jìn)而計(jì)算單類作物特征系數(shù)和作物間特征差異系數(shù),實(shí)現(xiàn)各典型作物的分類特征過(guò)濾法優(yōu)選;最后,構(gòu)建融合多種機(jī)器學(xué)習(xí)算法的Stacking集成學(xué)習(xí)作物分類模型,其中第一層的基學(xué)習(xí)器選擇隨機(jī)森林、支持向量機(jī)、K?最近鄰算法,第二層的元學(xué)習(xí)器選擇邏輯回歸模型,實(shí)現(xiàn)多種典型作物精細(xì)分類。實(shí)驗(yàn)結(jié)果表明,所提方法對(duì)7種典型作物的總體分類精度和Kappa系數(shù)分別為85.2%和83.34%,相比于未進(jìn)行特征選擇的分類結(jié)果分別提升了2.18%和3.68%,具有較高的分類精度,為多種典型作物的精細(xì)分類提供了新方法。
關(guān)鍵詞: 作物分類; 特征選擇; Stacking集成學(xué)習(xí); 植被指數(shù); 閾值分割; 衍生特征
中圖分類號(hào): TN911.73?34; TP751" " " " " " " " " 文獻(xiàn)標(biāo)識(shí)碼: A" " " " " " " " " "文章編號(hào): 1004?373X(2025)07?0001?10
UAV image fine crop classification based on feature filtering method
and Stacking ensemble learning
LIU Zhaohui, YANG Fengbao, ZHANG Lin
(School of Information and Communication Engineering, North University of China, Taiyuan 030051, China)
Abstract: The feature redundancy in multiple typical crop classifications at present leads to confusion and low classification accuracy of crops of the same family, so this paper proposes a crop fine classification method that combines the feature filtering method for feature screen and Stacking ensemble learning. A new type of vegetation index is constructed by combining sensitive bands, and the threshold value is segmented, so as to realize crop region extraction. The color and texture features of different crops are extracted, and then the feature coefficients of a single type of crop and the coefficients of feature differences among crops are calculated, so as to realize the classification feature filtering method preference for each typical crop. Finally, a Stacking ensemble learning crop classification model that integrates multiple machine learning algorithms is constructed. Among them, the random forest (RF), support vector machine (SVM) and K?nearest neighbor (K?NN) algorithms are selected for the base learner in the first layer, and the logistic regression model is selected for the meta?learner in the second layer, so that the various typical crops are classified finely. The experimental results show that the overall classification accuracy and Kappa coefficient of the proposed method for the seven typical crops are 85.2% and 83.34%, respectively, which are 2.18% and 3.68% higher than the classification results without feature selection. To sum up, the proposed method has high classification accuracy, and can be used as a new method for the fine classification of multiple typical crops.
Keywords: crop classification; feature selection; Stacking ensemble learning; vegetation index; threshold segmentation; derivative feature
0" 引" 言
精準(zhǔn)農(nóng)業(yè)是實(shí)現(xiàn)農(nóng)業(yè)低耗、高效、環(huán)保和優(yōu)質(zhì)發(fā)展的根本途徑,是提高世界和我國(guó)糧食產(chǎn)量的最佳選擇[1?3]。精準(zhǔn)農(nóng)業(yè)管理的實(shí)現(xiàn)有賴于對(duì)多種作物的精細(xì)分類,通過(guò)對(duì)多種典型作物進(jìn)行精細(xì)分類,可以更好地了解作物的空間分布情況和生長(zhǎng)情況,為實(shí)現(xiàn)作物的準(zhǔn)確估產(chǎn)、精確施肥、定點(diǎn)噴藥提供有力的數(shù)據(jù)支撐[4]。傳統(tǒng)人工采集作物種類的方法費(fèi)時(shí)、耗力、破壞性大且空間覆蓋不全,影響了作物分類的快速化發(fā)展[5]。衛(wèi)星、航空遙感能夠大范圍、高頻次地獲取數(shù)據(jù),從而準(zhǔn)確、高效地識(shí)別和監(jiān)測(cè)不同類型的作物。但是由于重訪周期和數(shù)據(jù)質(zhì)量的限制,難以滿足精準(zhǔn)農(nóng)業(yè)對(duì)農(nóng)田高時(shí)空分辨率信息獲取的要求,限制了作物分類的精細(xì)化發(fā)展[6]。近年來(lái)以無(wú)人機(jī)為代表的低空遙感平臺(tái)發(fā)展迅猛,具有信息采集快捷、空間覆蓋廣、數(shù)據(jù)分辨率高(毫米級(jí)至厘米級(jí))等顯著優(yōu)勢(shì)[7?9],已經(jīng)廣泛應(yīng)用于多種作物的精細(xì)分類。
在農(nóng)作物精細(xì)分類中,機(jī)器學(xué)習(xí)、深度學(xué)習(xí)算法由于良好的非線性擬合能力而被廣泛應(yīng)用,例如文獻(xiàn)[10]采用基于卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network, CNN)和遷移學(xué)習(xí)實(shí)現(xiàn)了5種典型作物可見(jiàn)光影像分類,但是受限于大量的數(shù)據(jù)標(biāo)記,限制了深度學(xué)習(xí)作物精細(xì)分類算法在實(shí)際田間監(jiān)測(cè)中的應(yīng)用。機(jī)器學(xué)習(xí)是通過(guò)分析數(shù)據(jù)并提取模式和規(guī)律,自動(dòng)改進(jìn)和適應(yīng)的算法,具有對(duì)小數(shù)據(jù)集的有效性、計(jì)算資源需求低和較高的模型解釋性等優(yōu)點(diǎn),其中分類算法的選擇對(duì)作物分類的精度有很大的影響[11]。在作物分類中常見(jiàn)的機(jī)器學(xué)習(xí)算法有支持向量機(jī)[12](Support Vector Machine, SVM)、隨機(jī)森林[13](Random Forest, RF)、K?近鄰[14](K?Nearest Neighbors, K?NN)以及集成學(xué)習(xí)[15]等。文獻(xiàn)[16]分別利用SVM、RF、最大似然分類(Maximum Likelihood Classification, MLC)對(duì)玉米和大豆進(jìn)行分類,結(jié)果顯示RF的分類精度最高。文獻(xiàn)[17]分別采用RF、K?NN、人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network, ANN)對(duì)WorldView?2影像中的水稻、棉花、荷三種作物進(jìn)行分類,對(duì)比發(fā)現(xiàn)RF的分類精度最高。文獻(xiàn)[18]采用RF、分類回歸樹(shù)(Classification and Regression Tree, CART)、SVM構(gòu)建出一種異構(gòu)雙集成學(xué)習(xí)算法對(duì)大豆進(jìn)行分類,分類精度高于三個(gè)基分類器。機(jī)器學(xué)習(xí)作為一種特征學(xué)習(xí)的算法,特征子集的構(gòu)建對(duì)分類精度的提高有很大的作用[11]。文獻(xiàn)[19]通過(guò)ReliefF?Pearson特征降維方法對(duì)特征進(jìn)行優(yōu)選,再采用SVM、K?NN、ANN算法對(duì)四種作物進(jìn)行分類。文獻(xiàn)[20]使用ReliefF算法和序列前向選擇(Sequential Forward Selection, SFS)算法進(jìn)行特征優(yōu)選,并分別采用SVM、RF、BPNN對(duì)大豆區(qū)域進(jìn)行提取,通過(guò)特征選擇實(shí)現(xiàn)了提取精度的提升。上述研究雖然進(jìn)行了特征優(yōu)選及降維,但沒(méi)有對(duì)不同作物間不同特征進(jìn)行詳細(xì)的評(píng)估及選擇,對(duì)相似作物分類難度較大。文獻(xiàn)[21]通過(guò)計(jì)算三種不同作物的變異系數(shù)和差異系數(shù),對(duì)不同特征在不同作物間的分類效果進(jìn)行了表征,使用最大似然法實(shí)現(xiàn)了三種作物的分類,為易混淆作物間的特征選擇提供了新思路。
綜上所述,本文首先基于傳統(tǒng)數(shù)據(jù)統(tǒng)計(jì)的方法構(gòu)造出特征系數(shù),并與作物間差異系數(shù)聯(lián)合對(duì)不同特征在不同作物間的分類效果進(jìn)行評(píng)估以及優(yōu)選;其次,選取合適的基學(xué)習(xí)器組合作為第一層進(jìn)行基學(xué)習(xí)器的訓(xùn)練與預(yù)測(cè);最后,在此基礎(chǔ)上利用嶺回歸模型作為元學(xué)習(xí)器進(jìn)行第二層的模型訓(xùn)練,融合多種機(jī)器學(xué)習(xí)算法構(gòu)建基于Stacking集成學(xué)習(xí)的作物分類模型,實(shí)現(xiàn)對(duì)多種典型作物的精細(xì)分類。
1" 研究區(qū)域與數(shù)據(jù)
以本團(tuán)隊(duì)在山西省農(nóng)業(yè)大學(xué)玉米研究所試驗(yàn)場(chǎng)航攝獲取的無(wú)人機(jī)遙感影像進(jìn)行實(shí)驗(yàn)。采用大疆“精靈PHANTOM 4 RTK”無(wú)人機(jī),配備1英寸CMOS、有效像素2 000萬(wàn)的相機(jī),航攝地點(diǎn)為“中國(guó)雜糧之都”忻州雜糧科技展示園,采集時(shí)間為2023年8月29日。設(shè)定行高為80 m,航向、旁向重疊度均為80%,其中作物區(qū)域包含12 m×20 m地塊20個(gè),包含馬鈴薯、蕓豆、食用豆、藜麥、谷子、高粱、玉米7種作物,非作物區(qū)域主要為裸地以及綠色無(wú)紡布覆蓋區(qū)域。使用大疆Pix4D Mapper軟件進(jìn)行畸變校正及影像拼接,生成研究區(qū)域位置及可見(jiàn)光影像如圖1所示。使用ENVI 5.3對(duì)數(shù)據(jù)進(jìn)行標(biāo)注,并構(gòu)建為數(shù)據(jù)集。
2" 研究方法
本文方法的流程圖如圖2所示,主要由四個(gè)步驟組成,分別為數(shù)據(jù)采集與預(yù)處理、作物區(qū)域提取、特征提取與優(yōu)選以及模型構(gòu)建與分類。首先進(jìn)行數(shù)據(jù)集構(gòu)建;其次通過(guò)分析無(wú)紡布光譜信息構(gòu)建出衍生特征,結(jié)合植被指數(shù),使用閾值分割得到作物區(qū)域;然后提取紋理、顏色以及指數(shù)特征,計(jì)算特征系數(shù)與作物間差異系數(shù)對(duì)特征進(jìn)行優(yōu)選,實(shí)現(xiàn)特征子集的構(gòu)建;最后,構(gòu)建Stacking集成學(xué)習(xí)分類模型,實(shí)現(xiàn)多種典型作物的精細(xì)分類。
2.1" 作物區(qū)域提取
為了精確提取作物區(qū)域,首先對(duì)實(shí)驗(yàn)區(qū)域所含非作物進(jìn)行統(tǒng)計(jì),主要包含裸地、綠色無(wú)紡布?;谘芯繀^(qū)域的遙感影像,首先計(jì)算過(guò)綠指數(shù)(Excess Green Index, ExG)、過(guò)紅指數(shù)(Excess Red Index, ExR)、過(guò)綠減過(guò)紅指數(shù)(Excess Green Minus Excess Red Index, ExGR)、歸一化綠藍(lán)差值指數(shù)(Normalized Green?Blue Difference Index, NGBDI)、歸一化綠紅差值指數(shù) (Normalized Green?Red Difference Index, NGRDI)、紅綠比值指數(shù)(Red?Green Ratio Index, RGRI)、可見(jiàn)光大氣阻抗指數(shù)(Visible Atmospherically Resistant Index, VARI)、可見(jiàn)光波段差異植被指數(shù)(Visible?band Difference Vegetation Index, VDVI)8個(gè)顏色指數(shù)特征[22?24],計(jì)算方式如式(1)~式(8)所示:
[ExG=2G-R-B] (1)
[ExR=1.4R-G] (2)
[ExGR=ExG-ExR] (3)
[NGBDI=(G-B)/(G+B)] (4)
[NGRDI=(G-R)/(G+R)] (5)
[RGRI=R/G] (6)
[VARI=(G-R)/(G+R-B)] (7)
[VDVI=(2G-R-B)/(2G+R+B)] (8)
式中:[R]、[G]、[B]分別為原始RGB影像的紅色、綠色、藍(lán)色波段。
大津法(OTSU)[25]是一種計(jì)算圖像二值化分割閾值的算法,使用OTSU求得的閾值對(duì)圖像進(jìn)行二值化分割后,前景與背景的類間方差最大,因此又被稱為最大類間方差法。
本文首先對(duì)實(shí)驗(yàn)區(qū)域分別使用8種植被指數(shù)進(jìn)行OTSU閾值分割,VARI閾值分割結(jié)果如圖3所示。結(jié)果表明,現(xiàn)有植被指數(shù)只可以有效分割裸地部分,無(wú)法剔除綠色無(wú)紡布(一般是為防止土壤水分流失以及揚(yáng)塵所鋪,大多為綠色)。因此,本文對(duì)非植被區(qū)域的綠色無(wú)紡布進(jìn)行光譜分析,發(fā)現(xiàn)無(wú)紡布與作物間的差異敏感波段為H波段和V波段,對(duì)數(shù)據(jù)集中無(wú)紡布有陰影遮擋和無(wú)陰影遮擋區(qū)域進(jìn)行整體分析[26?29],并結(jié)合敏感波段構(gòu)造出區(qū)分無(wú)紡布和植被的植被指數(shù)(Non?wovens Vegetation Index, NWVI),計(jì)算公式如式(9)所示:
[NWVI=(H-S)V] (9)
式中:[H]、[S]、[V]分別為原始HSV影像的色相(Hue)、飽和度(Saturation)、明度(Value)波段。
在NWVI的基礎(chǔ)上進(jìn)行固定閾值分割,分割結(jié)果如圖4所示,將兩個(gè)分割結(jié)果進(jìn)行合并,依次進(jìn)行形態(tài)學(xué)開(kāi)運(yùn)算和閉運(yùn)算去除噪點(diǎn),最終得到作物區(qū)域。
2.2" 特征提取與優(yōu)選
圖5為研究區(qū)域內(nèi)典型作物部分樣本示意圖。從圖5中可以看出,在顏色及紋理上7種作物有較為明顯的差異,是目視解譯判斷作物類型的基礎(chǔ)。但是由于作物品種不同,存在同時(shí)期處于不同生育期的藜麥,對(duì)藜麥的精細(xì)分類產(chǎn)生了很大的影響。
首先,在精細(xì)分割出的作物區(qū)域基礎(chǔ)上,使用ENVI 5.3軟件提取不同作物[R]、[G]、[B]波段全方位灰度共生矩陣的均值(Mean)、方差(Variance)、同質(zhì)性(Homogeneity)、對(duì)比度(Contrast)、相異性(Dissimilarity)、信息熵(Entropy)、角二階矩(Angular Second Moment)和相關(guān)性(Correlation)等,共24個(gè)紋理特征[30];使用Python提取不同作物的[R]、[G]、[B]、[H]、[S]和[V] 等6個(gè)波段顏色特征以及ExG、ExR、ExGR、NGBDI、NGRDI、RGRI、VARI和VDVI等8個(gè)植被指數(shù)特征。
其次對(duì)提取出的38個(gè)特征進(jìn)行統(tǒng)計(jì),計(jì)算出不同作物不同特征的均值和方差,計(jì)算單一作物特征的方差和全部作物該特征的方差的比值作為該作物特征的特征系數(shù),結(jié)果如表1所示。再依據(jù)不同作物特征均值計(jì)算得到不同作物間差異系數(shù),部分結(jié)果如表2所示。具體計(jì)算方法見(jiàn)式(10)、式(11):
[F=V/VT×100%] (10)
[D=(M1-M2)/min{M1,M2}×100%] (11)
式中:[F]為特征系數(shù);[V]為該特征的方差;[VT]為該特征所有作物總體的方差;[D]為作物1與作物2之間的差異系數(shù);[M1]為作物1該特征的均值;[M2]為作物2該特征的均值。
特征系數(shù)反映了作物該特征的統(tǒng)計(jì)值相比于全部作物該特征的統(tǒng)計(jì)值的離散程度,特征系數(shù)越小,表明該特征對(duì)于從實(shí)驗(yàn)區(qū)中分類出該作物的重要性程度越高;差異系數(shù)反映了兩種作物之間該特征的差異程度,差異系數(shù)的值越大,則表明越容易通過(guò)該特征將這兩種作物分類。
本文依據(jù)各項(xiàng)特征的特征系數(shù)以及作物間差異系數(shù)對(duì)特征進(jìn)行優(yōu)選,生成更加完備的特征子集。具體方法如下。
第1步:對(duì)每類作物的特征系數(shù)進(jìn)行逆序排序,選出每類作物特征系數(shù)小于100%的特征,最終得到7個(gè)特征空間,對(duì)應(yīng)數(shù)據(jù)集中的7種作物。
第2步:取每?jī)深愖魑锾卣骺臻g的交集,得到[C27]=21個(gè)特征子集。
第3步:選擇作物間差異系數(shù)大于25%的特征,同樣得到21個(gè)特征子集。
第4步:將第2步和第3步得到的特征子集一一對(duì)應(yīng)取交集,得到每?jī)深愖魑镩g的優(yōu)秀分類特征。
第5步:由于各個(gè)植被指數(shù)間的相似性,在此基礎(chǔ)上對(duì)植被指數(shù)進(jìn)行篩選,選擇植被指數(shù)特征中每?jī)深愖魑镩g差異系數(shù)最大的特征,從特征子集中剔除其余植被指數(shù)特征。
第6步:對(duì)每?jī)深惖膬?yōu)秀分類特征求并集,得到最終的特征子集。
最終選出[R]_均值、[R]_方差、[R]_同質(zhì)性、[R]_對(duì)比度、[R]_相異性、[R]_角二階矩、[G]_均值、[G]_同質(zhì)性、[G]_對(duì)比度、[G]_相異性、[G]_角二階矩、[B]_均值、[B]_同質(zhì)性、[B]_角二階矩、[R]、[G]、[H]、[S]、[V]、RGRI這20個(gè)特征作為特征子集。
2.3" 作物分類模型構(gòu)建
集成學(xué)習(xí)分類模型是通過(guò)構(gòu)建并結(jié)合多個(gè)分類器來(lái)完成分類任務(wù),以獲得比單一分類器更加準(zhǔn)確、更加穩(wěn)健的預(yù)測(cè)結(jié)果[31]。集成學(xué)習(xí)的核心思想是將不同的基學(xué)習(xí)器融合生成預(yù)測(cè)結(jié)果,集成學(xué)習(xí)的關(guān)鍵在于如何選擇和組合這些學(xué)習(xí)器。基學(xué)習(xí)器可以是同類型也可以是不同類型,決策樹(shù)是最常用的基學(xué)習(xí)器之一,用于隨機(jī)森林和一些Boosting算法(如Gradient Boosting),此外,線性模型、SVM、K?NN、神經(jīng)網(wǎng)絡(luò)等均可以作為基學(xué)習(xí)器進(jìn)行組合以形成新的模型。
本文基于Stacking集成學(xué)習(xí)[32?33]構(gòu)建了多典型作物分類模型。選取RF、SVM、K?NN作為Stacking集成學(xué)習(xí)的第一層基學(xué)習(xí)器進(jìn)行組合。RF由眾多決策樹(shù)構(gòu)成,最終結(jié)果由決策樹(shù)投票產(chǎn)生,在一定程度上避免了過(guò)擬合,具有較好的泛化能力。SVM通過(guò)核函數(shù)將分類數(shù)據(jù)映射到更高維的空間中,從而使得在原始空間中線性不可分的數(shù)據(jù)變得線性可分,該方法對(duì)于小樣本分類問(wèn)題能夠取得較好的效果。K?NN算法直觀、易于理解和實(shí)現(xiàn),適用于多類別分類問(wèn)題。在此基礎(chǔ)上,利用邏輯回歸模型作為元學(xué)習(xí)器進(jìn)行第二層的模型訓(xùn)練,融合多種機(jī)器學(xué)習(xí)算法構(gòu)建基于Stacking集成學(xué)習(xí)的多典型作物分類模型。
將Stacking集成學(xué)習(xí)的模型訓(xùn)練與評(píng)估分為數(shù)據(jù)拆分、基學(xué)習(xí)器的訓(xùn)練與預(yù)測(cè)、元學(xué)習(xí)器訓(xùn)練、模型評(píng)估四部分。在本文中,將數(shù)據(jù)按7∶3的比例劃分為訓(xùn)練集和測(cè)試集。模型訓(xùn)練時(shí),對(duì)RF、SVM、K?NN三個(gè)基學(xué)習(xí)器分別使用十折交叉驗(yàn)證,即訓(xùn)練集取其中的九折作為Training Data,另外一折作為Testing Data,每一次交叉驗(yàn)證都基于Training Data生成的模型對(duì)Testing Data進(jìn)行預(yù)測(cè),訓(xùn)練10次后,每一次的Testing Data的預(yù)測(cè)結(jié)果合成下一層模型新的二次訓(xùn)練集。同時(shí),十折交叉驗(yàn)證時(shí),每次也對(duì)數(shù)據(jù)原來(lái)的整個(gè)測(cè)試集進(jìn)行預(yù)測(cè),最終將 10次的預(yù)測(cè)值取算數(shù)平均,作為新的二次測(cè)試集。基模型訓(xùn)練并生成二次訓(xùn)練集后,利用每個(gè)基學(xué)習(xí)器在訓(xùn)練集上得到的二次訓(xùn)練集并列合并和訓(xùn)練集的輸出變量共同作為二次集成數(shù)據(jù)集,以進(jìn)行元學(xué)習(xí)器的訓(xùn)練,本文選用邏輯回歸作為元學(xué)習(xí)器。元學(xué)習(xí)器訓(xùn)練完成后,將基學(xué)習(xí)器對(duì)原始測(cè)試集預(yù)測(cè)生成的二次測(cè)試集輸入到元學(xué)習(xí)器中,得到最終測(cè)試集預(yù)測(cè)結(jié)果,與輸出變量對(duì)比,在測(cè)試集上評(píng)估最終的整個(gè)Stacking模型的性能。
3" 結(jié)果與分析
本節(jié)首先介紹了本文用到的主要評(píng)價(jià)指標(biāo);其次對(duì)不同植被指數(shù)提取的作物區(qū)域進(jìn)行了精度評(píng)價(jià)與分析;最后,對(duì)Staking集成學(xué)習(xí)模型輸出的作物分類結(jié)果進(jìn)行總體精度評(píng)價(jià)以及不同作物的分類精度評(píng)價(jià)。
3.1" 實(shí)驗(yàn)結(jié)果評(píng)價(jià)指標(biāo)
對(duì)于作物區(qū)域提取結(jié)果與作物分類結(jié)果,本文選取總體精度(Overall Accuracy)、Kappa系數(shù)、生產(chǎn)者精度(Producer's Accuracy)與用戶精度(User's Accuracy)進(jìn)行客觀評(píng)價(jià)。OA表征分類的整體準(zhǔn)確率,即所有樣本中正確分類的比例;Kappa系數(shù)可以反映分類結(jié)果的可信度;PA表示該類別的地面真實(shí)值被正確分類的概率;UA表示分類結(jié)果中,分類為該類別的樣本被正確分類的概率。
3.2" 作物區(qū)域提取結(jié)果
對(duì)不同植被特征進(jìn)行OTSU閾值分割,對(duì)NWVI進(jìn)行固定閾值分割,將8個(gè)植被指數(shù)的分割結(jié)果分別與NWVI的分割結(jié)果取交集,得到8個(gè)作物區(qū)域提取結(jié)果,如圖6所示,其中地面真實(shí)值表示實(shí)驗(yàn)區(qū)真實(shí)作物區(qū)域。
不同植被指數(shù)作物區(qū)域提取結(jié)果的各項(xiàng)評(píng)估指標(biāo)如表3所示,直觀顯示了不同植被指數(shù)的OA、Kappa系數(shù)以及作物區(qū)域的PA和UA。
由表3的提取精度可以看出,植被指數(shù)VARI結(jié)合NWVI的總體精度以及Kappa系數(shù)最高,分別達(dá)到了96.54%和91.9%,且PA與UA也分別達(dá)到了96.06%和99.12%。
3.3" 作物分類結(jié)果
分別使用全部的38個(gè)特征和本文方法選擇出的20個(gè)特征訓(xùn)練Stacking集成學(xué)習(xí)模型,對(duì)測(cè)試集進(jìn)行分類,分類結(jié)果如圖7所示。通過(guò)混淆矩陣計(jì)算出未進(jìn)行特征選擇和進(jìn)行特征選擇后的總體分類精度分別為83.02%和85.2%,Kappa系數(shù)分別為79.66%和83.34%,其中,每個(gè)類別的UA與PA分別如表4所示。
對(duì)比圖7的分類結(jié)果與地面真實(shí)值,其中馬鈴薯、蕓豆、食用豆分類效果最優(yōu),且這三類作物的PA和UA均在80%以上;谷子、高粱、玉米同為禾本科,由圖5可以看出,三者間具有非常高的相似性,圖7的分類結(jié)果中谷子、高粱、玉米三種作物之間有一定程度的混淆,分類精度次之,三者的PA和UA均在70%以上;藜麥的分類精度最低,很大程度上被錯(cuò)分為谷子、高粱和玉米,這是由于數(shù)據(jù)集中存在多個(gè)生育期的藜麥,導(dǎo)致藜麥類別的特征方差較大,PA僅為52.65%。從表4的分類精度可以看出,所有作物的PA和UA均有提升,表明本文所提特征選擇方法具有一定的有效性。
4" 討" 論
在實(shí)驗(yàn)結(jié)果方面:
1) 本文構(gòu)造出植被指數(shù)(NWVI),結(jié)合現(xiàn)有植被指數(shù)通過(guò)閾值分割去除非植被區(qū)域,其中VARI指數(shù)與本文特征結(jié)合的分割精度最高,提取精度達(dá)到了96.54%,Kappa系數(shù)為91.90%,表明NWVI對(duì)分割出植被與綠色無(wú)紡布具有一定的有效性。但在谷子、高粱、玉米區(qū)域,這三種作物的穗與裸地還存在一定程度的混淆,需要通過(guò)構(gòu)造出具有更高辨識(shí)度的衍生特征或采用特征維度更高的設(shè)備(如多光譜以及高光譜等設(shè)備)提高提取精度。
2) 本文通過(guò)計(jì)算特征系數(shù)與差異系數(shù)對(duì)特征進(jìn)行優(yōu)選,并采用Stacking集成學(xué)習(xí)模型實(shí)現(xiàn)作物分類。結(jié)合圖7和表4發(fā)現(xiàn),在分類結(jié)果中,谷子和玉米之間混淆嚴(yán)重,且兩者與高粱也有一定程度上的混淆,谷子、玉米都一定程度上被錯(cuò)分為藜麥。如表5、表6所示,谷子和玉米只有藍(lán)色角二階矩兩個(gè)系數(shù)滿足條件為31.78%,紅色方差差異系數(shù)為40.1%,但特征系數(shù)大于100%,其余所選特征差異系數(shù)都很小;而谷子、玉米與高粱間兩個(gè)系數(shù)滿足條件的特征差異系數(shù)也比較小,但所選特征中特征系數(shù)大于100%的特征差異系數(shù)較大的較多,使得谷子和玉米兩者與高粱間混淆程度相對(duì)較輕;谷子、玉米與藜麥間符合條件的特征較少,且特征差異系數(shù)都較小,使得兩者部分被錯(cuò)分為藜麥,造成藜麥的PA相對(duì)較低。
但是,本文的特征選擇方法僅考慮了不同特征對(duì)作物分類的重要性,沒(méi)有深入考慮到特征之間的內(nèi)在因果關(guān)系,且在選擇過(guò)程中根據(jù)閾值對(duì)特征進(jìn)行選擇,選擇出一些僅對(duì)其中兩類作物間分類有效,其余作物都不符合條件的特征(如紅色均值,僅食用豆和蕓豆之間符合特征選擇條件),反而在一定程度上影響了其余作物的分類。在后續(xù)的研究中,將繼續(xù)完善特征選擇的方法,綜合考慮特征間存在的潛在因果關(guān)系,使得特征子集更加完備且互補(bǔ)。
3) 由圖7可以看出,在分類結(jié)果中存在大量的“椒鹽噪聲”,這是基于像素分類的缺陷,在后續(xù)的研究中將嘗試采用面向?qū)ο蟮姆椒p少“椒鹽噪聲”,提高分類精度。
總的來(lái)說(shuō),本文在作物分類任務(wù)中提出的特征選擇方法,以及構(gòu)建的Stacking分類模型具有較好的分類效果,但也存在一定的不足:首先,本文所提特征選擇方法是基于數(shù)據(jù)統(tǒng)計(jì)的特征選擇方法,沒(méi)有研究特征間潛在的關(guān)系,當(dāng)處理特征維度很高的數(shù)據(jù)時(shí),可能無(wú)法給出最優(yōu)的特征子集;其次,沒(méi)有考慮同種作物不同品種間所處生育期的差異,導(dǎo)致藜麥分類精度較低。
5" 結(jié)" 論
在多種典型作物分類任務(wù)中,本文構(gòu)造出NWVI并結(jié)合傳統(tǒng)植被指數(shù)實(shí)現(xiàn)作物區(qū)域的精確提取,提出一種基于特征系數(shù)和差異系數(shù)的特征過(guò)濾法進(jìn)行特征選擇,通過(guò)該方法結(jié)合Stacking集成學(xué)習(xí)算法對(duì)多種典型作物進(jìn)行分類,取得了良好的分類效果。主要結(jié)論如下:
1) 本文提出的植被指數(shù)(NWVI)能夠較好地分割植被與綠色無(wú)紡布,實(shí)現(xiàn)作物區(qū)域的精確提取。
2) 本文提出的特征選擇方法可以很好地表征出每個(gè)特征對(duì)于不同作物間分類的重要性,對(duì)特征空間的優(yōu)化及分類精度的提高具有重要的作用。
未來(lái),將結(jié)合特征間潛在的因果關(guān)系繼續(xù)優(yōu)化特征選擇方法,并嘗試使用多光譜以及高光譜等特征維度更高、更全面的數(shù)據(jù)實(shí)現(xiàn)多種作物的精細(xì)分類,并對(duì)作物多生育期的特征進(jìn)行分析,解決不同品種作物處于不同生育期導(dǎo)致的分類精度低的問(wèn)題。
注:本文通訊作者為楊風(fēng)暴。
參考文獻(xiàn)
[1] YAN Y L, RYU Y. Exploring Google street view with deep learning for crop type mapping [J]. ISPRS journal of photogrammetry and remote sensing, 2021, 171: 278?296.
[2] YANG S T, GU L J, LI X F, et al. Crop classification method based on optimal feature selection and hybrid CNN?RF networks for multi?temporal remote sensing imagery [J]. Remote sensing, 2020, 2(19): 3119.
[3] GAO M, YANG F B, WEI H, et al. Individual maize location and height estimation in field from UAV?borne LiDAR and RGB images [J]. Remote sensing, 2022, 14(10): 2292.
[4] BHOLSE K, MUSANDE V. Evaluation of CNN model by comparing with convolutional autoencoder and deep neural network for crop classification on hyperspectral imagery [J]. Geocarto international, 2022, 37(3): 813?827.
[5] BOUGUETTAYA A, ZARZOUR H, KECHIDA A, et al. Deep learning techniques to classify agricultural crops through UAV imagery: A review [J]. Neural computing amp; applications, 2022, 34(12): 9511?9536.
[6] FENG Q L, YANG J Y, LIU Y M, et al. Multi?temporal unmanned aerial vehicle remote sensing for vegetable mapping using an attention?based recurrent convolutional neural network [J]. Remote sensing, 2020, 12(10): 1668.
[7] JU C Y, SON H I. Multiple UAV systems for agricultural applications: Control, implementation, and evaluation [J]. Electronics, 2018, 7(9): 162.
[8] KATTENBORN T, EICHEL J, FASSNACHT F E. Convolutional neural networks enable efficient, accurate and fine?grained segmentation of plant species and communities from high?resolution UAV imagery [J]. Scientific reports, 2019, 9: 17656.
[9] FLOREANO D, WOOD R J. Science, technology and the future of small autonomous drones [J]. Nature, 2015, 521(7553): 460?466.
[10] CHEW R, RINEER J, BEACH R, et al. Deep neural networks and transfer learning for food crop identification in UAV images [J]. Drones, 2020, 4(1): 7.
[11] SHEYKHMOUSA M, MAHDIANPARI M, GHANBARI H, et al. Support vector machine versus random forest for remote sensing image classification: A meta?analysis and systematic review [J]. IEEE journal of selected topics in applied earth observations and remote sensing, 2020, 13: 6308?6325.
[12] 楊閆君,占玉林,田慶久,等.基于GF?1/WFVNDVI時(shí)間序列數(shù)據(jù)的作物分類[J].農(nóng)業(yè)工程學(xué)報(bào),2015,31(24):155?161.
[13] YOU N S, DONG J W, HUANG J X, et al. The 10?m crop type maps in northeast China during 2017—2019 [J]. Scientific data, 2021, 8(1): 41.
[14] 胡順石,楊斌,黃英,等.不同種植設(shè)施背景蔬菜作物無(wú)人機(jī)高光譜精細(xì)分類[J].遙感學(xué)報(bào),2024,28(1):280?292.
[15] ZHANG Y Z, LIU J J, SHEN W J. A review of ensemble learning algorithms used in remote sensing applications [J]. Applied sciences, 2022, 12(17): 8654.
[16] 王利民,劉佳,楊玲波,等.隨機(jī)森林方法在玉米?大豆精細(xì)識(shí)別中的應(yīng)用[J].作物學(xué)報(bào),2018,44(4):569?580.
[17] 張鵬,胡守庚.地塊尺度的復(fù)雜種植區(qū)作物遙感精細(xì)分類[J].農(nóng)業(yè)工程學(xué)報(bào),2019,35(20):125?134.
[18] WANG S, FENG W, QUAN Y H, et al. A heterogeneous double ensemble algorithm for soybean planting area extraction in Google earth engine [J]. Computers and electronics in agriculture, 2022, 197: 106955.
[19] 戴建國(guó),張國(guó)順,郭鵬,等.基于無(wú)人機(jī)遙感可見(jiàn)光影像的北疆主要農(nóng)作物分類方法[J].農(nóng)業(yè)工程學(xué)報(bào),2018,34(18):122?129.
[20] SHE B, HU J T, HUANG L S, et al. Mapping soybean planting areas in regions with complex planting structures using machine learning models and Chinese GF?6 WFV data [J]. Agriculture, 2024, 14(2): 231.
[21] 郭鵬,武法東,戴建國(guó),等.基于無(wú)人機(jī)可見(jiàn)光影像的農(nóng)田作物分類方法比較[J].農(nóng)業(yè)工程學(xué)報(bào),2017,33(13):112?119.
[22] 汪小欽,王苗苗,王紹強(qiáng),等.基于可見(jiàn)光波段無(wú)人機(jī)遙感的植被信息提取[J].農(nóng)業(yè)工程學(xué)報(bào),2015,31(5):152?157.
[23] 丁雷龍,李強(qiáng)子,杜鑫,等.基于無(wú)人機(jī)圖像顏色指數(shù)的植被識(shí)別[J].國(guó)土資源遙感,2016,28(1):78?86.
[24] XUE J R, SU B F. Significant remote sensing vegetation indices: A review of developments and applications [J]. Journal of sensors, 2017(1): 1353691.
[25] OTSU N. A threshold selection method from gray?level histograms [J]. IEEE transactions on systems, man, and cybernetics, 1979, 9(1): 62?66.
[26] 楊風(fēng)暴,吉琳娜,王肖霞.可能性理論及應(yīng)用[M].北京:科學(xué)出版社,2019.
[27] ZHAO D J, JI L N, YANG F B, et al. A possibility?based method for urban land cover classification using airborne lidar data [J]. Remote sensing, 2022, 14(23): 5941.
[28] 劉曉霞,楊風(fēng)暴,衛(wèi)紅,等.一種農(nóng)田作物無(wú)人機(jī)遙感影像陰影檢測(cè)算法[J].電子測(cè)量技術(shù),2022,45(2):135?139.
[29] 白慧,楊風(fēng)暴.基于高辨識(shí)復(fù)合衍生特征的LiDAR數(shù)據(jù)分類方法研究[J].激光與光電子學(xué)進(jìn)展,2021,58(5):280?288.
[30] 郭倩,魏嘉豪,張健,等.基于無(wú)人機(jī)多光譜影像和隨機(jī)森林的蔬菜識(shí)別[J].中國(guó)農(nóng)業(yè)科技導(dǎo)報(bào),2023,25(2):99?110.
[31] GANAIE M A, HU M H, MALIK A K, et al. Ensemble deep learning: A review [J]. Engineering applications of artificial intelligence, 2022, 115: 105151.
[32] DONG X B, YU Z W, CAO W M, et al. A survey on ensemble learning [J]. Frontiers of computer science, 2020, 14(2): 241?258.
[33] MOHAMMED A, KORA R. A comprehensive review on ensemble deep learning: Opportunities and challenges [J]. Journal of King Saud University: Computer and information sciences, 2023, 35(2): 757?774.
作者簡(jiǎn)介:劉朝輝(2001—),男,山西運(yùn)城人,碩士研究生,研究方向?yàn)檫b感圖像處理。
楊風(fēng)暴(1968—),男,山西臨汾人,博士研究生,教授,博士生導(dǎo)師,研究方向?yàn)橥ㄐ畔到y(tǒng)與信息融合、信息探測(cè)與處理、光電信息技術(shù)與系統(tǒng)。
張" 琳(2000—),女,山西太原人,碩士研究生,研究方向?yàn)檫b感圖像處理。
收稿日期:2024?07?25" " " " " "修回日期:2024?08?14
基金項(xiàng)目:國(guó)家自然科學(xué)基金面上項(xiàng)目(61972363);中央引導(dǎo)地方科技發(fā)展資金項(xiàng)目(YDZJSX2021C008)