張春蘭,楊貴軍,李賀麗,湯伏全,劉暢,張麗妍
?
基于隨機(jī)森林算法的冬小麥葉面積指數(shù)遙感反演研究
張春蘭1,2,3,4,楊貴軍2,3,4,李賀麗2,3,4,湯伏全1,劉暢1,2,3,4,張麗妍2,3,4
(1西安科技大學(xué)測(cè)繪科學(xué)與技術(shù)學(xué)院,西安 710054;2國(guó)家農(nóng)業(yè)信息化工程技術(shù)研究中心,北京 100097;3農(nóng)業(yè)部農(nóng)業(yè)信息技術(shù)重點(diǎn)實(shí)驗(yàn)室, 北京 100097;4北京市農(nóng)業(yè)物聯(lián)網(wǎng)工程技術(shù)研究中心,北京 100097)
【目的】通過(guò)利用隨機(jī)森林算法(random forest,RF)反演冬小麥葉面積指數(shù)(leaf area index, LAI),及時(shí)、準(zhǔn)確地監(jiān)測(cè)冬小麥長(zhǎng)勢(shì)狀況,為作物田間管理和產(chǎn)量估測(cè)等提供科學(xué)依據(jù)?!痉椒ā勘狙芯恳罁?jù)冬小麥拔節(jié)期、挑旗期、開花期及灌漿期地面觀測(cè)數(shù)據(jù),將相關(guān)系數(shù)分析(correlation coefficient,)和袋外數(shù)據(jù)(out-of-bag data,OOB)重要性分析與隨機(jī)森林算法(random forest,RF)相結(jié)合,在優(yōu)選光譜指數(shù)和確定最佳自變量個(gè)數(shù)的基礎(chǔ)上,構(gòu)建了兩種冬小麥LAI反演模型||-RF和OOB-RF,并利用獨(dú)立數(shù)據(jù)集對(duì)兩種模型進(jìn)行驗(yàn)證;然后,將所建LAI反演模型用于無(wú)人機(jī)高光譜影像,進(jìn)一步檢驗(yàn)所建模型對(duì)無(wú)人機(jī)低空遙感平臺(tái)的適用性和可靠性。【結(jié)果】||-RF和OOB-RF反演模型分別采用相關(guān)性前5強(qiáng)、重要性前2強(qiáng)的光譜指數(shù)作為輸入因子時(shí)精度最優(yōu),驗(yàn)證決定系數(shù)(2)分別為0.805、0.899,均方根誤差()分別為0.431、0.307,表明這兩個(gè)模型均能對(duì)作物L(fēng)AI進(jìn)行精確反演,其中OOB-RF模型的反演效果更好。利用無(wú)人機(jī)高光譜影像數(shù)據(jù)結(jié)合OOB-RF估算模型反演得到冬小麥LAI與地面實(shí)測(cè)值的擬合方程的決定系數(shù)2為0.761,為0.320,數(shù)值范圍(1.02—6.41)與地面實(shí)測(cè)(1.29—6.81)亦比較吻合?!窘Y(jié)論】本文基于地面數(shù)據(jù)構(gòu)建的OOB-RF模型不僅具有較高的反演精度,而且適用性強(qiáng),可用于無(wú)人機(jī)高光譜遙感平臺(tái)提取高精度的冬小麥LAI信息。
無(wú)人機(jī);高光譜;葉面積指數(shù);隨機(jī)森林;冬小麥
【研究意義】葉面積指數(shù)(leaf area index,LAI)可綜合表述為單位土地面積上作物葉片的葉面積總和[1-2],是地表植被生態(tài)系統(tǒng)中重要的理化參數(shù)之一,不僅與作物蒸騰作用、光合作用、呼吸作用、地表凈初級(jí)生產(chǎn)力等密切相關(guān),且常被用作評(píng)價(jià)作物長(zhǎng)勢(shì)、指導(dǎo)田間管理及預(yù)測(cè)產(chǎn)量的重要依據(jù)[3-5]。因此,及時(shí)、準(zhǔn)確監(jiān)測(cè)作物L(fēng)AI具有重要的研究意義?!厩叭搜芯窟M(jìn)展】近年來(lái),遙感技術(shù)的快速發(fā)展使快速、無(wú)損地獲取大面積作物L(fēng)AI成為可能,對(duì)于其模型方法國(guó)內(nèi)外已有大量探索。宋開山等[6]基于植被指數(shù)建立大豆LAI估算模型時(shí),發(fā)現(xiàn)歸一化差值植被指數(shù)(normalized difference vegetation index,NDVI)在LAI大于3.5時(shí),出現(xiàn)了飽和現(xiàn)象。GITELSON等[7]則通過(guò)對(duì)植被指數(shù)NDVI進(jìn)行改進(jìn),提出了寬動(dòng)態(tài)植被指數(shù)(wide dynamic range vegetation index,WDRVI),可以解決飽和性問(wèn)題。李鑫川等[8]提出分段選擇敏感植被指數(shù)OSAVI(LAI≤3)+TGDVI(LAI>3),在解決飽和性問(wèn)題的同時(shí)能夠提高LAI預(yù)測(cè)精度。LIANG等[9]認(rèn)為優(yōu)化土壤調(diào)節(jié)植被指數(shù)(OSAVI)能夠降低土壤背景影響,進(jìn)而提高LAI估算精度。Liu等[10]指出利用增強(qiáng)型植被指數(shù)(EVI)反演LAI具有較高的估算精度。隨著作物L(fēng)AI遙感反演研究的深入,一些研究者嘗試?yán)脵C(jī)器學(xué)習(xí)算法提高LAI估算精度。如利用神經(jīng)網(wǎng)絡(luò)法、支持向量機(jī)法可提高冬小麥LAI反演精度[11-13]。【本研究切入點(diǎn)】盡管這些機(jī)器學(xué)習(xí)算法能夠提高反演精度,但是在反演時(shí)需要大量的訓(xùn)練樣本,且極易出現(xiàn)過(guò)擬合問(wèn)題。隨機(jī)森林算法是一種基于統(tǒng)計(jì)學(xué)的機(jī)器學(xué)習(xí)算法,能高效處理大數(shù)據(jù)集,具有極強(qiáng)的擬合能力且不會(huì)產(chǎn)生過(guò)擬合現(xiàn)象,具有很好的抗噪性能[14],適合解決作物L(fēng)AI的反演問(wèn)題。但是,大多研究者利用隨機(jī)森林算法進(jìn)行作物參數(shù)反演時(shí),直接將各種植被指數(shù)作為輸入因子,缺乏對(duì)輸入因子的預(yù)先優(yōu)選[14-15]。鑒于不同植被指數(shù)在抗飽和能力、降低或消除土壤背景影響等方面各有特點(diǎn),有必要對(duì)RF模型的輸入因子進(jìn)行優(yōu)選,以提高RF模型的估算精度。【擬解決的關(guān)鍵問(wèn)題】本研究基于冬小麥4個(gè)關(guān)鍵生育期(拔節(jié)期、挑旗期、開花期及灌漿期)的地面高光譜和LAI實(shí)測(cè)數(shù)據(jù),將相關(guān)系數(shù)分析(correlation coefficient,)和袋外數(shù)據(jù)(out-of-bag data,OOB)重要性分析與隨機(jī)森林算法(random forest,RF)相結(jié)合,構(gòu)建了||-RF和OOB-RF兩種LAI估算模型,并進(jìn)行了驗(yàn)證和對(duì)比分析,然后將所建LAI反演模型用于低空無(wú)人機(jī)獲取的高光譜影像,進(jìn)一步檢驗(yàn)所建模型的適用性和可靠性。
本研究于北京市昌平區(qū)小湯山國(guó)家精準(zhǔn)農(nóng)業(yè)示范基地(116.44°E,40.18°N)開展冬小麥試驗(yàn),2014年10月上旬播種,2015年6月下旬收獲。研究區(qū)屬北溫帶半濕潤(rùn)大陸性季風(fēng)氣候,平均海拔約為36 m,年平均氣溫13.3—14.1℃。通過(guò)考慮作物品種、施氮水平、水分供給水平等因素,共設(shè)置16種不同處理,其中,作物品種為中麥175、京9843;氮素處理為N1:0,N2:91.065 kg N·hm-2,N3:182.13 kg N·hm-2,N4:273.195 kg N·hm-2;水分處理為雨養(yǎng)、正常水和兩倍正常水。每種處理重復(fù)3次,共48個(gè)小區(qū),每個(gè)小區(qū)的種植面積為48 m2。其他田間管理按照當(dāng)?shù)卣K竭M(jìn)行。
本研究于2015年冬小麥拔節(jié)期(4月13日)、挑旗期(4月26日)、開花期(5月14日)及灌漿期(5月25日)4個(gè)關(guān)鍵生育期分別采集了作物冠層高光譜反射率數(shù)據(jù)和LAI數(shù)據(jù)。其中,地面觀測(cè)的非成像高光譜數(shù)據(jù)和LAI數(shù)據(jù)用于冬小麥LAI估算模型的建立與驗(yàn)證,其中總樣本量70%用于建模(n=128),剩余30%用于驗(yàn)證(n=64);無(wú)人機(jī)遙感獲取的成像高光譜數(shù)據(jù)用于進(jìn)一步分析檢驗(yàn)所建模型對(duì)于無(wú)人機(jī)低空遙感平臺(tái)的適用性和可靠性。
1.2.1 冬小麥LAI測(cè)定 在每個(gè)試驗(yàn)小區(qū)選取具有代表性的20個(gè)冬小麥植株作為樣本,立刻裝入密封袋帶回基地實(shí)驗(yàn)室,將樣本莖葉分離后,利用美國(guó)生產(chǎn)的CI-203型激光葉面積儀測(cè)定樣本葉片葉面積,然后結(jié)合田間群體密度調(diào)查數(shù)據(jù)得到冬小麥冠層葉面積指數(shù)。4個(gè)生育期共獲取192個(gè)冬小麥葉面積指數(shù)樣本數(shù)據(jù)(表1)。
1.2.2 冬小麥冠層高光譜數(shù)據(jù)獲取 冬小麥地面非成像冠層反射光譜采用美國(guó)ASD Field SpecFR Pro 2500光譜輻射儀測(cè)定,光譜范圍350—2 500 nm,采樣間隔為1 nm。測(cè)量時(shí)天氣晴朗,北京時(shí)間為10:00—14:00。觀測(cè)時(shí)探頭始終垂直向下且距離地面約1.0 m,探頭視場(chǎng)角25°。在每個(gè)試驗(yàn)小區(qū)選定的具有代表性的冬小麥樣方采集10條記錄,取平均值作為該小區(qū)的冠層光譜反射率,每次測(cè)量前后均立刻進(jìn)行標(biāo)準(zhǔn)白板校正。
于2015年4月28日(挑旗期)開展了無(wú)人機(jī)成像高光譜數(shù)據(jù)觀測(cè)。飛行平臺(tái)為RICOPTE(Riegl,Hom,Austria)八旋翼無(wú)人機(jī),搭載德國(guó)公司生產(chǎn)的UHD185成像光譜儀獲取高光譜影像。UHD185成像光譜儀的光譜范圍為450—950 nm,光譜采樣間隔4 nm,光譜分辨率8 nm,包含125個(gè)通道,具有可見-近紅外波段全畫幅高光譜成像的優(yōu)點(diǎn)。50 m航高下,焦距17 mm的UHD185可同時(shí)獲取50×50像素的高光譜影像和1 000×1 000像素的全色影像,即21 cm空間分辨率的高光譜像元和1 cm空間分辨率的灰度像元。無(wú)人機(jī)高光譜影像處理過(guò)程如圖1。
圖1 無(wú)人機(jī)高光譜影像處理過(guò)程
光譜指數(shù)是由不同波段的反射率以一定代數(shù)形式組合而成的一種參數(shù)[9],它可削弱環(huán)境背景對(duì)冠層光譜的干擾,比單波段具有更好的靈敏性?;谥夭蓸拥牡孛娣浅上窆庾V數(shù)據(jù),根據(jù)前人研究結(jié)果,選取文獻(xiàn)中常用的14個(gè)LAI光譜估算指數(shù)進(jìn)行分析(表2)。
表2 本文采用的光譜指數(shù)
R是光譜反射率。i,j是一定波段范圍內(nèi)任意兩個(gè)波段。重采樣ASD數(shù)據(jù)沒有與原始ASD高光譜數(shù)據(jù)對(duì)應(yīng)的波段時(shí),采用最鄰近的波段代替。依據(jù)參考文獻(xiàn)[28],WDRVI中a取0.1
R is spectral reflectance. i and j are arbitrary bands in a certain wavelength range. The resample ASD data is replaced by the nearest neighbor band when there is no band corresponding to the original ASD hyperspectral data. According to [28], the a in WDRVI is 0.1
1.4.1 相關(guān)系數(shù)分析 相關(guān)系數(shù)是描述兩個(gè)具備相關(guān)性的數(shù)據(jù)之間密切程度的指標(biāo)。本研究中,可以衡量光譜指數(shù)與冬小麥LAI之間的相關(guān)密切程度,絕對(duì)值越接近于1,光譜指數(shù)與LAI之間的關(guān)系越密切,反之亦然。
1.4.2 袋外數(shù)據(jù)集重要性分析 隨機(jī)森林算法RF是由Breiman[33]于2001年提出,是一個(gè)樹型分類器的集合。它通過(guò)利用Bootstrap方法,從原始樣本集S中進(jìn)行k次有放回的簡(jiǎn)單隨機(jī)抽樣,形成訓(xùn)練樣本集。在使用Bootstrap對(duì)S進(jìn)行抽樣時(shí),每個(gè)樣本未被抽取的概率p為(1-1/n)n。當(dāng)n足夠大時(shí),p=0.368,表明原始樣本集S中大約37%的樣本不會(huì)出現(xiàn)在訓(xùn)練樣本集中,這些未被抽中的樣本稱為袋外數(shù)據(jù)(out of bag,OOB)。利用這部分樣本進(jìn)行模型性能的估計(jì)稱為OOB估計(jì),其原理是隨輸入因子的改變會(huì)產(chǎn)生估算誤差,RF算法可以給出每個(gè)變量的OOB變量的誤差,根據(jù)估算誤差計(jì)算此輸入因子的重要性,重要性值越大,表明光譜指數(shù)對(duì)LAI估算越重要。
1.4.3 建模方法 對(duì)表2中的14個(gè)光譜指數(shù)利用隨機(jī)森林算法進(jìn)行LAI回歸分析,將14個(gè)光譜指數(shù)按照相關(guān)性、OOB重要性從大到小進(jìn)行排序;其次,根據(jù)相關(guān)性和OOB重要性分析結(jié)果,第一次僅用排序第一的光譜指數(shù)建模,第二次用排序位于前兩個(gè)的光譜指數(shù)建模,第n次用排序位于前n個(gè)的光譜指數(shù)建模(1≤n≤14);然后,依據(jù)調(diào)整后的決定系數(shù)確定冬小麥LAI估算模型的最佳自變量個(gè)數(shù),進(jìn)而構(gòu)建兩種冬小麥LAI估算模型||-RF和OOB-RF。本研究基于MATLAB程序代碼進(jìn)行隨機(jī)森林回歸擬合,其中決策樹的數(shù)量和分割節(jié)點(diǎn)的個(gè)數(shù)是非常重要的2個(gè)參數(shù),本文構(gòu)建了500棵決策樹,分割變量為3。隨后,利用地面獨(dú)立數(shù)據(jù)集對(duì)兩種模型進(jìn)行驗(yàn)證;最后,將所建LAI反演模型應(yīng)用于低空無(wú)人機(jī)獲取的高光譜影像,開展冬小麥LAI遙感反演和效用檢驗(yàn)。
1.5.1 決定系數(shù) 決定系數(shù)(coefficient of determination,2)被用來(lái)表示模擬值與實(shí)測(cè)值的擬合效果,2越接近于1,表明模型擬合精度越高,其計(jì)算公式為:
式中,總離差平方和=,殘差平方和=,y表示測(cè)量值,表示測(cè)量值的平均值,表示預(yù)測(cè)值,表示樣本個(gè)數(shù)。
1.5.2 調(diào)整2在多元回歸中,若模型增加一個(gè)自變量,即使這個(gè)自變量在統(tǒng)計(jì)上不顯著,2也會(huì)變大。這是因?yàn)樵黾幼宰兞繒r(shí),會(huì)使殘差平方和減少,從而使2變大。因此,在多元回歸中,為避免增加自變量而高估2,通常用調(diào)整2(Adj.2)來(lái)評(píng)價(jià)擬合效果,因?yàn)檎{(diào)整2同時(shí)考慮了樣本量(n)和回歸中自變量的個(gè)數(shù)(k)的影響,使得調(diào)整2的值不會(huì)由于回歸中自變量個(gè)數(shù)的增加而越來(lái)越接近于1。其計(jì)算公式為:
式中,為自變量的個(gè)數(shù)。
1.5.3均方根誤差 均方根誤差(root mean square error,)反映了模擬值與實(shí)測(cè)值的偏離程度,其值越小,表示估算模型的擬合精度越高。其計(jì)算公式為:
為了將基于地面ASD構(gòu)建的優(yōu)選模型應(yīng)用于無(wú)人機(jī)高光譜影像上,本研究對(duì)ASD光譜數(shù)據(jù)和無(wú)人機(jī)搭載的UHD 185數(shù)據(jù)進(jìn)行了光譜響應(yīng)差異分析。對(duì)地面ASD光譜數(shù)據(jù)進(jìn)行重采樣,對(duì)UHD185光譜數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)白板定標(biāo),使二者的采樣間隔和光譜分辨率保持一致。由圖2可以看出,兩者呈現(xiàn)高度正相關(guān),2均在0.99以上;由圖3可知,基于兩種光譜計(jì)算的兩種植被指數(shù)的相關(guān)性2均在0.94以上。綜合上述分析,定標(biāo)后的UHD185和重采樣的ASD在462—830 nm范圍的光譜反射率比較一致,偏差小于1%。
圖2 隨機(jī)3個(gè)小區(qū)的ASD與UHD185在462—830 nm范圍內(nèi)的光譜反射率相關(guān)性分析
圖3 基于ASD與UHD185計(jì)算的NDSI和RSI的相關(guān)性
利用不同試驗(yàn)處理下冬小麥拔節(jié)期、挑旗期、開花期和灌漿期等多個(gè)生育期的光譜指數(shù)與LAI數(shù)據(jù)進(jìn)行相關(guān)性分析,樣本量n=128(表3)。結(jié)果表明,本文分析選用的文獻(xiàn)中用于估算LAI的光譜指數(shù)均與LAI具有較強(qiáng)的相關(guān)性,||均在0.65以上,并且均達(dá)到極顯著水平(<0.01),其中RVI與LAI的相關(guān)系數(shù)最高,=0.886,相關(guān)性最小的是MTVII,相關(guān)性為0.666。同時(shí),本文分析了450—950 nm波段范圍內(nèi)任意兩個(gè)波段組合得到的歸一化差值光譜指數(shù)NDSI和比值型光譜指數(shù)RSI與LAI的相關(guān)性(圖4)。結(jié)果表明,494 nm與718 nm組合的NDSI(R494,R718)、490 nm與610 nm組合的RSI(R490,R610)與LAI的相關(guān)性比較強(qiáng),相關(guān)系數(shù)分別為0.854,0.893。
表3 光譜指數(shù)與冬小麥LAI相關(guān)性分析及排序(n=128)
**表示0.01水平下顯著相關(guān)
** represent significant at 0.01 level of probability
本文利用冬小麥拔節(jié)期、挑旗期、開花期和灌漿期數(shù)據(jù),對(duì)光譜指數(shù)和LAI進(jìn)行OOB重要性分析,重要性越大說(shuō)明光譜指數(shù)在RF建模中發(fā)揮的作用越大。由表4可知,重要性大于10的光譜指數(shù)有10個(gè),小于10的光譜指數(shù)有4個(gè),其中重要性最大的是NDSI(R494,R718),其值為58.683,重要性最小的是MTVII,其值為2.993。與表3結(jié)果相比,GRVI、RVI和NDVI的排序發(fā)生了較大變化,GRVI從第四變成了第九,RVI從第二變成了第五,NDVI從第九變成了第四,這是由于相關(guān)系數(shù)主要從每個(gè)光譜指數(shù)與冬小麥LAI之間是否相關(guān)以及相關(guān)程度大小的角度考慮,而袋外數(shù)據(jù)重要性分析則側(cè)重輸入每個(gè)光譜指數(shù)自變量對(duì)冬小麥LAI因變量所造成的估算誤差,根據(jù)估算誤差計(jì)算此光譜指數(shù)的重要性。
a:LAI與NDSI(Ri,Rj)的決定系數(shù);b:LAI與RSI(Ri,Rj)的決定系數(shù)
表4 光譜指數(shù)與冬小麥LAI的OOB重要性分析及排序(n=128)
在上述分析的基礎(chǔ)上,按照||、OOB大小排序依次增加光譜指數(shù)的個(gè)數(shù)作為輸入因子進(jìn)行RF回歸建模分析,其調(diào)整2見圖5。結(jié)果表明,||-RF和OOB-RF估算模型的調(diào)整2的總體變化趨勢(shì)均為先增加后減少?;趞|-RF建模,輸入因子為RSI(R490,R610)、RVI、NDSI(R494,R718)、GRVI、WDRVI 5個(gè)光譜指數(shù)時(shí),建模的調(diào)整2最高(圖5-a)?;贠OB-RF建模,輸入因子為RSI(R490,R610)、NDSI(R494,R718)2個(gè)光譜指數(shù)時(shí),建模的調(diào)整2最高(圖5-b)。這表明||-RF模型和OOB-RF模型分別以相關(guān)性||前5強(qiáng)、OOB重要性前2強(qiáng)的光譜指數(shù)作為自變量時(shí)所建模型效果最佳,其建模結(jié)果如圖6所示。
利用不同試驗(yàn)處理下冬小麥拔節(jié)期、挑旗期、開花期和灌漿期等多個(gè)生育期的光譜指數(shù)與LAI數(shù)據(jù)(n=64),分別對(duì)所建||-RF和OOB-RF估算模型進(jìn)行驗(yàn)證,結(jié)果如圖7所示??傮w上來(lái)看,兩種模型的估算精度2均達(dá)到0.8以上,相比較而言,OOB-RF模型的估算精度更高,且OOB-RF模型僅需要兩個(gè)自變量輸入,比||-RF模型的輸入自變量個(gè)數(shù)(即5個(gè))要少,更適于應(yīng)用。
為了對(duì)OOB-RF模型進(jìn)一步評(píng)價(jià),本文還采用支持向量機(jī)(support vector machine,SVM)與之對(duì)比分析,發(fā)現(xiàn)||-SVM模型以相關(guān)性從大到小排序前7的光譜指數(shù)作為自變量建模時(shí)效果最佳,OOB-SVM模型采用重要性從大到小排序前6的光譜指數(shù)作為自變量建模時(shí)效果最佳,并且二者的驗(yàn)證精度分別為2=0.746、=0.744(圖8-a)和2=0.821、=0.585(圖8-b)。綜合上述分析,OOB-RF模型的估算精度更高,且需要的自變量最少。
a:|r|-RF模型 |r|-RF model;b:OOB-RF模型 OOB-RF model
a:|r|-RF模型 |r|-RF model;b:OOB-RF模型 OOB-RF model
a:|r|-RF模型 |r|-RF model;b:OOB-RF模型 OOB-RF model
在上述研究的基礎(chǔ)上,本文進(jìn)而利用OOB-RF模型和挑旗期無(wú)人機(jī)高光譜影像開展了冬小麥LAI遙感監(jiān)測(cè)(圖9)。同時(shí)利用地面同步采集的實(shí)測(cè)數(shù)據(jù)進(jìn)行了精度檢驗(yàn),每個(gè)小區(qū)LAI地面實(shí)測(cè)值與無(wú)人機(jī)高光譜遙感估算值的擬合關(guān)系如圖10。無(wú)人機(jī)遙感監(jiān)測(cè)的冬小麥LAI值(1.02—6.41)與地面實(shí)測(cè)值(1.29—6.81)比較一致,決定系數(shù)2為0.761為0.320,精度較高,表明利用OOB-RF模型可用于低空無(wú)人機(jī)高光譜遙感影像提取冬小麥LAI信息。
傳統(tǒng)的統(tǒng)計(jì)分析方法大多基于單一植被指數(shù)構(gòu)建作物L(fēng)AI估算模型,但單一植被指數(shù)所包含的信息易存在飽和現(xiàn)象[6],而選用過(guò)多的植被指數(shù)則有可能產(chǎn)生過(guò)擬合現(xiàn)象[34]。隨機(jī)森林算法是一種統(tǒng)計(jì)學(xué)習(xí)方法,對(duì)數(shù)據(jù)集的適應(yīng)能力強(qiáng),相對(duì)其他算法有著很大的優(yōu)勢(shì),它具有很好的抗噪性能和極強(qiáng)的擬合能力但不會(huì)產(chǎn)生過(guò)擬合現(xiàn)象[33]。但是,大多研究者利用隨機(jī)森林算法進(jìn)行作物參數(shù)反演時(shí),直接將各種植被指數(shù)作為輸入因子,缺乏對(duì)輸入因子進(jìn)行預(yù)先優(yōu)選[14-15]。鑒于不同植被指數(shù)在抗飽和能力、降低或消除土壤背景影響等方面各有特點(diǎn),因此,將相關(guān)系數(shù)分析和袋外數(shù)據(jù)重要性分析與隨機(jī)森林算法相結(jié)合,優(yōu)選模型輸入光譜指數(shù)并確定最佳自變量個(gè)數(shù)顯得尤為重要。本文||-RF模型以相關(guān)性從大到小排序前5強(qiáng)的光譜指數(shù)作為自變量建模時(shí)效果最佳,OOB-RF模型采用重要性從大到小排序前2強(qiáng)的光譜指數(shù)作為自變量建模時(shí)效果最佳,并且OOB-RF模型精度高于||-RF模型。通過(guò)與支持向量機(jī)(SVM)對(duì)比分析,發(fā)現(xiàn)OOB-RF模型的估算精度更高,且需要的自變量較少,這得益于RF算法引入了兩個(gè)隨機(jī)性(一個(gè)隨機(jī)性是指每棵樹的每個(gè)節(jié)點(diǎn)是隨機(jī)產(chǎn)生的,另一個(gè)隨機(jī)性是指每個(gè)節(jié)點(diǎn)的分割變量是由隨機(jī)選取的少數(shù)變量產(chǎn)生的),使其具有較強(qiáng)的容噪能力,也不易產(chǎn)生過(guò)度擬合現(xiàn)象;而SVR算法的核心問(wèn)題是確定核函數(shù)和相關(guān)參數(shù),由于存在核函數(shù)和懲罰因子等參數(shù)選擇的問(wèn)題,其應(yīng)用受到了一定限制[12, 35]。本研究構(gòu)建的LAI估算模型精度高于傳統(tǒng)回歸模型法[8-10]的精度,原因可能在于隨機(jī)森林算法是基于統(tǒng)計(jì)學(xué)的機(jī)器學(xué)習(xí)算法,具有容噪能力強(qiáng)、處理大數(shù)據(jù)集效率高、不易過(guò)度擬合、對(duì)結(jié)果具有可解釋性等優(yōu)點(diǎn),適合解決LAI反演問(wèn)題。對(duì)于BP神經(jīng)網(wǎng)絡(luò)方法而言,該方法較傳統(tǒng)回歸模型法在進(jìn)行冬小麥LAI反演時(shí),雖然模型的反演精度有了大幅提高,但還存在一些不足。比如反演時(shí)需要大樣本訓(xùn)練集(一般認(rèn)為樣本數(shù)n>50即為大樣本訓(xùn)練集),且極易出現(xiàn)過(guò)度擬合問(wèn)題;另外,計(jì)算量很大,導(dǎo)致其應(yīng)用能力受限[11, 36]。本文構(gòu)建的LAI估算模型精度較高,這是由于不同植被指數(shù)各有特點(diǎn),預(yù)先進(jìn)行RF模型輸入因子的優(yōu)選,有助于提高RF模型的估算精度,這與岳繼博等[37]的研究結(jié)果一致。
a:|r|-SVM模型 |r|-SVM model;b:OOB-SVM模型 OOB-SVM model
圖9 基于無(wú)人機(jī)影像的冬小麥挑旗期LAI分布圖
圖10 基于無(wú)人機(jī)影像的冬小麥LAI預(yù)測(cè)值與實(shí)測(cè)值關(guān)系
本文進(jìn)一步將所構(gòu)建的OOB-RF模型應(yīng)用于無(wú)人機(jī)遙感平臺(tái)。與地面驗(yàn)證結(jié)果(圖7-b)相比,無(wú)人機(jī)平臺(tái)估算精度(圖10)稍有降低,原因可能有以下幾個(gè)方面。首先,OOB-RF模型是基于地面ASD光譜數(shù)據(jù)建立的,盡管本文和前人[38-39]研究均表明無(wú)人機(jī)搭載UHD185與地面ASD所測(cè)的光譜反射率比較一致,且已有文獻(xiàn)把基于地面ASD構(gòu)建的模型應(yīng)用于無(wú)人機(jī)影像上[40],但二者之間差異還可能會(huì)對(duì)無(wú)人機(jī)平臺(tái)驗(yàn)證精度產(chǎn)生影響;其次,地面ASD觀測(cè)范圍較?。? m×1 m代表性樣方內(nèi)),且與LAI采樣數(shù)據(jù)匹配性較強(qiáng),而無(wú)人機(jī)遙感監(jiān)測(cè)的LAI值是整個(gè)試驗(yàn)小區(qū)的均值,鑒于同一小區(qū)作物不那么絕對(duì)均勻一致,也會(huì)影響無(wú)人機(jī)遙感平臺(tái)的驗(yàn)證精度;另外,無(wú)人機(jī)飛行試驗(yàn)(4月28日)與地面測(cè)量(4月26日)存在時(shí)間差,也會(huì)對(duì)模型驗(yàn)證精度產(chǎn)生影響。不過(guò),整體來(lái)講,基于無(wú)人機(jī)遙感平臺(tái)估算的冬小麥LAI精度較高,這表明本文所構(gòu)建的OOB-RF模型精度和適用性較強(qiáng),可基于低空無(wú)人機(jī)高光譜影像提取高精度的冬小麥LAI信息。
本研究基于不同試驗(yàn)處理(品種、氮肥、水分供給等)、不同生育期(拔節(jié)期、挑旗期、開花期、灌漿期等)的冬小麥冠層光譜和LAI數(shù)據(jù),將隨機(jī)森林算法與相關(guān)性分析、袋外數(shù)據(jù)重要性分析相結(jié)合,構(gòu)建了冬小麥LAI遙感估算模型。結(jié)果表明,||-RF、OOB-RF模型分別采用按照相關(guān)性和重要性優(yōu)選的5個(gè)和2個(gè)光譜指數(shù)作為自變量時(shí)模型效果最佳。利用獨(dú)立數(shù)據(jù)集對(duì)兩種LAI估算模型進(jìn)行了驗(yàn)證,||-RF、OOB-RF模型驗(yàn)證決定系數(shù)(2)分別為0.805、0.899,均方根誤差()分別為0.431、0.307,表明OOB-RF模型的估算精度更高一些;與文獻(xiàn)已有模型方法相比,亦具有較好的精度。在此基礎(chǔ)上,本文進(jìn)而基于無(wú)人機(jī)高光譜影像數(shù)據(jù),利用OOB-RF模型提取了試驗(yàn)區(qū)冬小麥挑旗期的LAI,估算值與地面實(shí)測(cè)值比較一致,二者擬合方程的決定系數(shù)2為0.761,為0.320,估算值范圍(1.02—6.41)與地面實(shí)際情況(1.29—6.81)亦比較相符,表明本文所建的OOB-RF冬小麥LAI估算模型的精度和適用性較強(qiáng),可用于低空無(wú)人機(jī)高光譜遙感平臺(tái)獲取高精度的作物L(fēng)AI信息。
[1] 賀佳, 劉冰鋒, 李軍. 不同生育時(shí)期冬小麥葉面積指數(shù)高光譜遙感監(jiān)測(cè)模型. 農(nóng)業(yè)工程學(xué)報(bào), 2014, 30(24): 141-150.
He J, Liu B F, Li J. Monitoring model of leaf area index of winter wheat based on hyperspectral reflectance at different growth stages., 2014, 30(24): 141-150. (in Chinese)
[2] Jin X L, Yang G J, Xu X G, Yang H, Feng H K, Li Z H, Shen J X, Lan Y B, Zhao C C. Combined multi-temporal optical and radar parameters for estimating LAI and biomass in winter wheat using HJ and RADARSAR-2 data., 2015, 7(10): 13251-13272.
[3] Vina A, Gitelson A A, Nguyrobertson A L, Peng Y. Comparison of different vegetation indices for the remote assessment of green leaf area index of crops., 2011, 115(12): 468-3478.
[4] 趙春江. 精準(zhǔn)農(nóng)業(yè)研究與實(shí)踐. 北京: 科學(xué)出版社, 2009.
ZHAO C J.. Beijing: Science Press, 2009. (in Chinese)
[5] 王紀(jì)華, 趙春江, 黃文江. 農(nóng)業(yè)定量遙感基礎(chǔ)與應(yīng)用. 北京: 科學(xué)出版社, 2008.
WANG J H, ZHAO C J, HUANG W J.. Beijing: Science Press, 2008. (in Chinese )
[6] 宋開山, 張柏, 王宗明, 張淵智, 劉煥軍. 基于人工神經(jīng)網(wǎng)絡(luò)的大豆葉面積高光譜反演研究. 中國(guó)農(nóng)業(yè)科學(xué), 2006, 39(6): 1138-1145.
SONG K S, ZHANG B, WANG Z M, ZHANG Y Z, LIU H J. Soybean LAI estimation with in-situ collected hyperspectral data based on BP-neural networks., 2006, 39(6): 1138-1145. (in Chinese)
[7] GITELSON A A. Wide dynamic range vegetation index for remote quantification of biophysical characteristics of vegetation., 2004, 161(2): 165-173.
[8] 李鑫川, 徐新剛, 鮑艷松, 黃文江, 羅菊花, 董瑩瑩, 宋曉宇, 王紀(jì)華. 基于分段方式選擇敏感植被指數(shù)的冬小麥葉面積指數(shù)遙感反演. 中國(guó)農(nóng)業(yè)科學(xué), 2012, 45(17): 3486-3496.
LI X C, XU X G, BAO Y S, HUANG W J, LUO J H, DONG Y Y, SONG X Y, WANG J H. Retrieving LAI of winter wheat based on sensitive vegetation index by the segmentation method., 2012, 45(17): 3486-3496. (in Chinese )
[9] LIANG L, DI L P, ZHANG L P, DENG M X, QIN Z H, ZHAO S H, LIN H. Estimation of crop LAI using hyperspectral vegetation indices and a hybrid inversion method., 2015, 165: 123-134.
[10] LIU J G, PATTEY E, JEGO G. Assessment of vegetation indices for regional crop green LAI estimation from Landsat images over multiple growing seasons., 2012, 123(3): 347-358.
[11] 夏天, 吳文斌, 周清波, 周勇.冬小麥葉面積指數(shù)高光譜遙感反演方法對(duì)比. 農(nóng)業(yè)工程學(xué)報(bào), 2013, 29(3): 139-147.
XIA T, WU W B, ZHOU Q B, ZHOU Y. Comparison of two inversion methods for winter wheat leaf area index based on hyperspectral remote sensing., 2013, 29(3): 139-147. (in Chinese)
[12] 謝巧云, 黃文江, 梁棟, 彭代亮, 黃林生, 宋曉宇, 張東彥, 楊貴軍. 最小二乘支持向量機(jī)方法對(duì)冬小麥葉面積指數(shù)反演的普適性研究.光譜學(xué)與光譜分析, 2014, 34(2): 489-493.
XIE Q Y, HUANG W J, LIANG D, PENG D L, HUANG L S, SONG X Y, ZHANG D Y, YANG G J. Research on universality of least squares support vector machine method for estimating leaf area index of winter wheat., 2014, 34(2): 489-493. (in Chinese)
[13] 梁棟, 管青松, 黃文江, 黃林生, 楊貴軍. 基于支持向量機(jī)回歸的冬小麥葉面積指數(shù)遙感反演. 農(nóng)業(yè)工程學(xué)報(bào), 2013, 29(7): 117-123.
LIANG D, GUAN Q S, HUANG W J, HUANG L S, YANG G J. Remote sensing inversion of leaf area index based on support vector machine regression in winter wheat., 2013, 29(7): 117-123. (in Chinese)
[14] 韓兆迎, 朱西存, 房賢一, 王卓遠(yuǎn), 王凌, 趙庚星, 姜遠(yuǎn)茂. 基于SVM與RF的蘋果樹冠LAI高光譜估測(cè). 光譜學(xué)與光譜分析, 2016, 36(3): 800-805.
HAN Z Y, ZHU X C, FANG X Y, WANG Z Y, WANG L, ZHAO G X, JIANG Y M. Hyperspectral estimation of apple tree canopy LAI based on SVM and RF regression., 2016, 36(3): 800-805. (in Chinese)
[15] 李粉玲, 王力, 劉京, 常慶瑞.基于高分一號(hào)衛(wèi)星數(shù)據(jù)的冬小麥葉片SPAD值遙感估算. 農(nóng)業(yè)機(jī)械學(xué)報(bào), 2015, 46(9): 273-281.
LI F L, WANG L, LIU J, CHANG Q R. Remote sensing estimation of SPAD value for wheat leaf based on GF-1 data., 2015, 46(9): 273-281. (in Chinese)
[16] PENUELAS J, ISLA R, FILELLA I, ARAUS J L. Visible and near-infrared reflectance assessment of salinity effects on barley., 1997, 37(1): 198-202.
[17] HATFIELD J L, KANEMASU E T, ASRAR G, JACKSON R D, PINTER P J, REGINATO R J, IDSO S B. Leaf area estimates from spectral measurements over various planting dates of wheat., 1985, 6(1): 167-175.
[18] SHIBAYAMA M T, AKIYAMA T. Seasonal visible, near-infrared and mid-infrared spectra of rice canopies in relation to LAI and above-ground dry phytomass., 1989, 27(2): 119-127.
[19] RONDEAUX G, STEVEN M, BARET F. Optimization of soil- adjusted vegetation indices., 1996, 55(2): 95-107.
[20] BARET F, GUVOT G. Potentials and limits of vegetation indices for LAI and APAR assessment., 1991, 35(2): 161-173.
[21] GITELSON A A, KAUFMAN Y, MERZLYAK M N. Use of green channel in remote of sensing global vegetation from EOS-MODIS., 1996, 58(3): 289-298.
[22] QI J, CHEHBOUNI A, HUETE A R, KERR Y H, SOROOSHIAN S. A modified soil adjusted vegetation index., 1994, 48(2): 119-126.
[23] GITELSON A A, MERZLYAK M N. Spectral reflectance changes associated with autumn senescence ofL. andL. leaves. Spectral features and relation to chlorophyll estimation., 1994, 143(3): 286-292.
[24] HABOUDANE D, MILLER J R, PATTEY E, ZARCOTEJADA P J, STRACHAN L B. Hyperspectral vegetation indices and novel algorithms for predicting green LAI of crop canopies: Modeling and validation in the context of precision agriculture., 2004, 90(3): 337-352.
[25] BROGE N H, LEBLANC E. Comparing prediction power and stability of broadband and hyperspectral vegetation indices for estimation of green leaf area index and canopy chlorophyll density., 2001, 76(2): 156-172.
[26] HUETE A R, JUSTICE C, LIU H. Development of vegetation and soil indices for MODIS-EOS., 1994, 49(3): 224-234.
[27] LI F, MISTELE B, HU Y, CHEN X, SCHMIDHALTER U. Comparing hyperspectral index optimization algorithms to estimate aerial N uptake using multi-temporal winter wheat datasets from contrasting climatic and geographic zones in China and Germany., 2013, 180(8): 44-57.
[28] TANAKA S, KAWAMURA K, MAKI M, MURAMOTO Y, YOSHIDA K, AKIYAMA T. Spectral index for quantifying leaf area index of winter wheat by field hyperspectral measurements: A case study in Gifu prefecture, Central Japan., 2015, 7(5): 5329-5346.
[29] 任哲, 陳懷亮, 王連喜, 李穎, 李琪.利用交叉驗(yàn)證的小麥LAI反演模型研究. 國(guó)土資源遙感, 2015, 27(4): 34-40.
REN Z, CHEN H L, WANG L X, LI Y, LI Q. Research on inversion model of wheat LAI using cross-validation., 2015, 27(4): 34-40. (in Chinese)
[30] LELONG C, BURGER P, JUBELIN G, ROUX B, LABBE S, BARET F. Assessment of unmanned aerial vehicles imagery for quantitative monitoring of wheat crop in small plots., 2008, 8(5): 3557-3585.
[31] POTITHEP S, NAGAI S, NASAHARA K, SUZUKI R. Two separate periods of the LAI-VIs relationships using in situ measurements in a deciduous broadleaf forest., 2013, 169(5): 148-155.
[32] INOUE Y, GUERIF M, BARET F, SKIDMORE A K, GITELSON A A, SCHLERF M, DARVISHZADEH R, OLIOSO A. Simple and robust methods for remote sensing of canopy chlorophyll content: A comparative analysis of hyperspectral data for different types of vegetation., 2016, 39(3): 2609-2623.
[33] BREIMAN L. Random forests., 2001, 45(1): 5-32.
[34] 楊福芹, 馮海寬, 李振海, 高林, 楊貴軍, 戴華陽(yáng). 基于赤池信息量準(zhǔn)則的冬小麥葉面積指數(shù)高光譜估測(cè). 農(nóng)業(yè)工程學(xué)報(bào), 2016, 32(3): 163-168.
YANG F Q, FENG H K, LI Z H, GAO L, YANG G J, DAI H Y. Hyperspectral estimation of leaf area index for winter wheat based on Akaike’s information criterion., 2016, 32(3): 163-168. (in Chinese)
[35] 王麗愛, 馬昌, 周旭東, 訾妍, 朱新開, 郭文善.基于隨機(jī)森林回歸算法的小麥葉片SPAD值遙感估算. 農(nóng)業(yè)機(jī)械學(xué)報(bào), 2015, 46(1): 259-265.
WANG L A, MA C, ZHOU X D, ZI Y, ZHU X K, GUO W S. Estimation of wheat leaf SPAD value using RF algorithmic model and remote sensing data., 2015, 46(1): 259-265. (in Chinese)
[36] GONG P, WANG D X, LIANG S. Inverting a canopy reflectance model using a neural network., 1999, 20(1): 111-122.
[37] 岳繼博, 楊貴軍, 馮海寬. 基于隨機(jī)森林算法的冬小麥生物量遙感估算模型對(duì)比. 農(nóng)業(yè)工程學(xué)報(bào), 2016, 32(18): 175-182.
YUE J B, YANG G J, FENG H K. Comparative of remote sensing estimation models of winter wheat biomass based on random forest algorithm., 2016, 32(18): 175-182. (in Chinese)
[38] AASEN H, BURKART A, BOLTEN A. Generating 3D hyperspectral information with lightweight UAV snapshot cameras for vegetation monitoring: From camera calibration to quality assurance., 2015, 108(5): 245-259.
[39] YUE J B, YANG G J, LI C C, LI Z H, WANG Y J, FENG H K, XU B. Estimation of winter wheat above-ground biomass using unmanned aerial vehicle-based snapshot hyperspectral sensor and crop height improved models., 2017, 9(7): 708-727.
[40] 秦占飛, 常慶瑞, 謝寶妮, 申健. 基于無(wú)人機(jī)高光譜影像的引黃灌區(qū)水稻葉片全氮含量估測(cè). 農(nóng)業(yè)工程學(xué)報(bào), 2016, 32(23): 77-85.
QIN Z F, CHANG Q R, XIE B N, SHEN J. Rice leaf nitrogen content estimation based on hysperspectral imagery of UAV in Yellow River diversion irrigation district., 2016, 32(23): 77-85. (in Chinese)
(責(zé)任編輯 楊鑫浩)
Remote Sensing Inversion of Leaf Area Index of Winter Wheat Based on Random Forest Algorithm
Zhang ChunLan1,2,3,4, Yang GuiJun2,3,4, Li HeLi2,3,4, Tang FuQuan1, Liu Chang1,2,3,4, Zhang LiYan2,3,4
(1College of Geomatics, Xi'an University of Science and Technology, Xi'an 710054;2National Engineering Research Center for Information Technology in Agriculture, Beijing 100097;3Key Laboratory of Agri-informatics, Ministry of Agriculture, Beijing 100097;4Beijing Engineering Research Center of Agricultural Internet of Things, Beijing 100097)
【Objective】The objective of this study is to quickly and precisely monitor the growth of winter wheat by inversion of leaf area index (LAI) using random forest algorithm. Thus it could provide a guideline in crop management and mitigation, high and stable yield, agricultural insurance claims, etc.【Method】In this study, field data of canopy reflectance and LAI of winter wheat of four critical growth stages (i.e., jointing period, flag leaf period, flowering period and filling period), were collected under different treatments. The correlation coefficient () analysis and the importance analysis of out-of-bag data (OOB) were combined with the random forest algorithm (RF) to determine the more suitable spectral indices and the optimal number of variables for inputs, and then two LAI inversion models (|| -RF, OOB-RF) were constructed and validated with independent data-sets. Further, the proposed LAI inversion model was applied to the (unmanned aerial vehicle) UAV remote sensing platform to evaluate its performance and reliability for monitoring LAI of winter wheat.【Result】The results showed that the best accuracy of ||-RF and OOB-RF inversion models was achieved when the top five spectral indices in the correlation and the top two spectral indices in the importance were used as input variables, respectively. The coefficients of determination (2) of ||-RF and OOB-RF models during LAI validation were 0.805 and 0.899, and theroot mean square errors () were 0.431 and 0.307, respectively, which indicated that both ||-RF and OOB-RF models could well estimate LAI of winter wheat, while the accuracy of the latter was much higher. The retrieved LAI from the UAV hyperspectral images using the OOB-RF model was in well agreement with the ground measured values, with2=0.761,=0.320, and the range of estimated values (i.e., 1.02-6.41) also consistent with that actually measured (i.e., 1.29-6.81).【Conclusion】The OOB-RF model constructed in this study not only has high retrieval accuracy, but also can be used to extract high-precision winter wheat LAI information from UAV hyperspectral remote sensing platform.
unmanned aerial vehicle (UAV); hyperspectral; leaf area index (LAI); random forest algorithm; winter wheat
2017-07-20;
2017-11-24
國(guó)家重點(diǎn)研發(fā)計(jì)劃(2016YFD0200600,2016YFD0200603)、國(guó)家自然科學(xué)基金(41671411,41471351)
張春蘭,E-mail:1964362790@qq.com。
李賀麗,E-mail:lhl237666@126.com