岳云開(kāi),陳建福,趙亮,焦鑫偉,許明志,付虹雨,廖澳,崔國(guó)賢,佘瑋
(湖南農(nóng)業(yè)大學(xué)苧麻研究所,湖南 長(zhǎng)沙 410128)
苧麻(Boehmeria niveaL.)為蕁麻科(Urticaceae)苧麻屬(Boehmeria) 的多年生草本纖維植物[1],在我國(guó)紡織業(yè)中占有重要地位[2]。 苧麻中含有豐富的營(yíng)養(yǎng)成分,是優(yōu)質(zhì)的植物蛋白飼料來(lái)源[3];葉和根中富含綠原酸和多酚等活性成分,具有止血、安胎、抗病毒等藥用功效[4];葉中還含有豐富的葉綠素,是一種天然可食用色素,民間常將其用于食品調(diào)色[5]。 因此,苧麻不斷地被開(kāi)發(fā)和利用。
葉綠素是植物葉片中的主要光合色素,其含量可以直接反映植物的光合作用強(qiáng)弱和健康狀況,是評(píng)價(jià)植物生長(zhǎng)狀況的重要指標(biāo),與作物的產(chǎn)量及品質(zhì)密切相關(guān)[6,7]。 因此,及時(shí)準(zhǔn)確監(jiān)測(cè)葉綠素含量對(duì)于苧麻生產(chǎn)管理十分重要。 傳統(tǒng)的葉綠素監(jiān)測(cè)方法具有破壞性大、操作繁瑣、效率低、費(fèi)時(shí)費(fèi)力等缺陷,不能及時(shí)反饋?zhàn)魑锏纳L(zhǎng)狀況。近年來(lái),無(wú)人機(jī)遙感技術(shù)快速發(fā)展,并在作物生長(zhǎng)監(jiān)測(cè)、營(yíng)養(yǎng)狀況診斷等方面廣泛應(yīng)用[8],也為作物葉綠素監(jiān)測(cè)提供了新的方法。 如陳浩等[9]利用無(wú)人機(jī)多光譜遙感對(duì)不同施肥處理下的夏玉米冠層葉綠素進(jìn)行估測(cè),然后基于線性回歸和逐步回歸,建立了夏玉米冠層葉綠素含量遙感監(jiān)測(cè)模型;周敏姑等[10]利用無(wú)人機(jī)多光譜遙感5 個(gè)波段光譜反射率反演冬小麥SPAD 值,經(jīng)對(duì)比分析發(fā)現(xiàn)基于逐步回歸法構(gòu)建的模型效果最優(yōu),決定系數(shù)為0.77;Narmilan 等[11]利用無(wú)人機(jī)多光譜,并基于MLR、RF、DT、SVR、XGB、KNN 和ANN 等機(jī)器學(xué)習(xí)算法,預(yù)測(cè)甘蔗冠層葉綠素含量,結(jié)果表明所有模型反演效果均較好,其中隨機(jī)森林(RF)回歸模型的決定系數(shù)高達(dá)0.99。 可見(jiàn),利用無(wú)人機(jī)遙感反演作物葉綠素含量是可行的。
本研究以四個(gè)生長(zhǎng)時(shí)期的苧麻為研究對(duì)象,利用無(wú)人機(jī)多光譜圖像構(gòu)建多種植被指數(shù),通過(guò)對(duì)葉綠素含量和植被指數(shù)的相關(guān)性分析,采用傳統(tǒng)回歸和隨機(jī)森林回歸方法建立了苧麻葉綠素含量的遙感估算模型,經(jīng)分析評(píng)價(jià)后確定最佳反演模型以實(shí)現(xiàn)苧麻葉片葉綠素含量的動(dòng)態(tài)監(jiān)測(cè)。
試驗(yàn)區(qū)位于湖南省長(zhǎng)沙市芙蓉區(qū)湖南農(nóng)業(yè)大學(xué)耘園教學(xué)基地(28°11′01.981″N,113°04′10.159″E)。該區(qū)域?qū)俚湫偷膩啛釒Ъ撅L(fēng)性濕潤(rùn)氣候,降水充沛,光熱條件良好,是苧麻的主產(chǎn)區(qū)之一。 試驗(yàn)區(qū)地勢(shì)平坦,無(wú)遮擋物,為無(wú)人機(jī)作業(yè)提供了良好的條件。 試驗(yàn)區(qū)共種植27 個(gè)苧麻品種,每個(gè)品種一個(gè)小區(qū),重復(fù)3 次,共81 個(gè)小區(qū);小區(qū)面積2.0 m×1.8 m,2 行×4 蔸,蔸間距為0.4 m,行間距為0.6 m,排水溝寬0.5 m。 苧麻材料于2017 年12月育苗移栽,2018 年6 月破桿。 試驗(yàn)區(qū)土壤肥沃且成分均一,灌溉排水便捷,田間水肥管理一致。
1.2.1 無(wú)人機(jī)遙感影像獲取 利用大疆精靈Phantom 4 多光譜版無(wú)人機(jī)搭載多光譜遙感設(shè)備獲取苧麻冠層影像。 該無(wú)人機(jī)采用厘米級(jí)定位系統(tǒng),并將飛控、相機(jī)與RTK 的時(shí)鐘系統(tǒng)進(jìn)行微秒級(jí)同步;無(wú)人機(jī)搭載一臺(tái)多光譜傳感器,該傳感器集成了1 個(gè)可見(jiàn)光相機(jī)及5 個(gè)多光譜相機(jī)(藍(lán)光、綠光、紅光、紅邊和近紅外),所有相機(jī)均擁有200萬(wàn)像素解析力,拍攝照片的最大分辨率為1 600×1 300。
于2022 年3—5 月苧麻每個(gè)生育期采集一次數(shù)據(jù)。 為保證無(wú)人機(jī)影像的穩(wěn)定性和可靠性,每次飛行選擇在晴朗無(wú)風(fēng)天氣的10—12 時(shí)進(jìn)行。 無(wú)人機(jī)遙感系統(tǒng)在距離地面20 m 的高度搭配-90°云臺(tái)俯仰角進(jìn)行拍攝,飛行速度為2 m/s,航向及旁向重疊度均為75%。 各時(shí)期飛行任務(wù)的拍攝參數(shù)、航線規(guī)劃一致,在飛行任務(wù)執(zhí)行前設(shè)置完成。 將采集的影像導(dǎo)入大疆智圖軟件進(jìn)行拼接,經(jīng)輻射校正后獲取試驗(yàn)區(qū)域的反射率影像,再通過(guò)無(wú)人機(jī)一體化圖像分析系統(tǒng)PhenoAI air 軟件進(jìn)行植被指數(shù)及反射率的提取。
1.2.2 葉綠素含量測(cè)定 參照張憲政[12]的方法進(jìn)行。 取苧麻植株頂部倒數(shù)第6 ~7 葉,去除葉脈后剪碎、混勻,稱(chēng)取0.1 g 裝入10 mL 離心管中,重復(fù)3 次,分別加入提取液(95.5%丙酮+無(wú)水乙醇,體積比為1∶1)10 mL,充分搖勻后用黑色塑料袋遮蓋并避光保存48 h,直至葉片完全變白,然后用紫外分光光度計(jì)在663、652、645 nm 波長(zhǎng)下測(cè)定吸光度,并按下列公式計(jì)算葉綠素a、葉綠素b 含量及葉綠素總含量。
葉綠素a 含量(mg/L)=(12.7D663-2.69D645)V/(1000W) ;
葉綠素b 含量(mg/L)=(22.9D645-4.68D663)V/(1000W) ;
葉綠素總含量(mg/L)=D652V/(34.5W) 。式中D663、D652、D645分別為相應(yīng)波長(zhǎng)下的光密度值,V 為提取液體積,W 為葉片鮮重。 整個(gè)生育期苧麻葉片葉綠素含量的箱線圖如圖1 所示。
圖1 各生育時(shí)期苧麻葉片葉綠素總含量的箱線圖
依據(jù)已有的多光譜植被指數(shù),結(jié)合葉綠素吸收光譜的特性,并通過(guò)與實(shí)測(cè)葉綠素含量進(jìn)行相關(guān)性分析,選擇相關(guān)系數(shù)較高的7 種植被指數(shù)進(jìn)行建模,分別為歸一化植被指數(shù)(NDVI)、綠色歸一化植被指數(shù)(GNDVI)、歸一化差異紅色邊緣植被指數(shù)(NDRE)、改進(jìn)簡(jiǎn)單比值植被指數(shù)(MSR)、比值植被指數(shù)(RVI)、寬范圍動(dòng)態(tài)植被指數(shù)(WDRVI)、土壤調(diào)節(jié)植被指數(shù)(OSAVI),如表1所示。
表1 植被指數(shù)及計(jì)算公式
本研究基于7 種植被指數(shù)分別使用一元線性回歸、多元線性回歸和隨機(jī)森林回歸構(gòu)建不同生育時(shí)期苧麻葉綠素含量反演模型。 一元線性回歸模型的構(gòu)建使用SPSS 軟件,其方程為y =ax+b,式中,y 代表葉綠素含量,x 代表植被指數(shù)。 多元線性回歸模型的構(gòu)建也使用SPSS 軟件,其方程為y =a1x1+a2x2+...+anxn+b,式中x1、x2...xn代表不同植被指數(shù)。 隨機(jī)森林回歸模型的構(gòu)建使用Matlab軟件,首先從全部自變量集合里有放回地隨機(jī)抽取m 個(gè)樣本數(shù)據(jù)集,在所有特征變量中選擇K 個(gè)特征變量,然后選擇最佳分割特征變量作為節(jié)點(diǎn)構(gòu)建CART 樹(shù),并重復(fù)T 次,即組建了T 棵決策樹(shù),最終每個(gè)決策樹(shù)結(jié)果的平均作為隨機(jī)森林回歸模型的結(jié)果。
隨機(jī)選取70%樣本作為建模集,用于構(gòu)建葉綠素含量反演模型,30%樣本作為驗(yàn)證集,用于模型評(píng)價(jià)。 為評(píng)估不同模型的估算精度,本研究以決定系數(shù)(R2)、均方根誤差(RMSE)作為評(píng)價(jià)指標(biāo)。 通常R2越接近于1、RMSE 越小,說(shuō)明模型估算能力越好。
式中:yi為葉綠素含量實(shí)測(cè)值,為葉綠素含量預(yù)測(cè)值,為葉綠素含量平均值,n 為樣本數(shù)。
對(duì)不同生育期獲取的植被指數(shù)與葉綠素含量進(jìn)行相關(guān)性分析,結(jié)果(表2)顯示,全生育期內(nèi),葉綠素與7 種植被指數(shù)之間的相關(guān)性均達(dá)到顯著或極顯著水平,苗期、封行期、旺長(zhǎng)期、成熟期葉綠素與植被指數(shù)的相關(guān)性范圍分別為0.723~0.798、0.629 ~0.761、0.391 ~0.818、0.731 ~0.794。 其中,NDVI 在苗期、封行期、成熟期與葉綠素含量具有最高相關(guān)系數(shù),分別達(dá)到0.798、0.761、0.794;NDRE與葉綠素在旺長(zhǎng)期最相關(guān)(相關(guān)系數(shù)為0.818)。因此,所選植被指數(shù)可用于葉綠素含量反演模型的構(gòu)建。
表2 植被指數(shù)與葉綠素含量的相關(guān)系數(shù)
根據(jù)葉綠素含量與植被指數(shù)相關(guān)性分析的結(jié)果,以上述7 種植被指數(shù)作為自變量、葉綠素含量作為因變量,分別建立不同生育時(shí)期的一元線性回歸模型和多元線性回歸模型,結(jié)果如表3 所示。所有線性回歸模型的顯著性均達(dá)到0.01 極顯著水平,說(shuō)明各模型的擬合性均較好。 不同生育時(shí)期、不同建模方法的反演效果存在差異,總體上多元線性回歸模型的效果好于一元線性回歸模型,且以封行期的反演效果最佳,建模集和驗(yàn)證集的R2分別為0.667 和0.752。 各時(shí)期基于多元線性回歸模型的實(shí)測(cè)值與預(yù)測(cè)值間擬合關(guān)系如圖2所示。
表3 葉綠素含量與植被指數(shù)線性回歸模型
圖2 基于多元線性回歸的葉綠素估算模型預(yù)測(cè)值和實(shí)測(cè)值的關(guān)系
根據(jù)葉綠素含量與植被指數(shù)相關(guān)性分析的結(jié)果,選擇NDVI、GNDVI、RVI、OSAVI、NDRE、MSR、WDRVI 這7 種植被指數(shù),采用隨機(jī)森林算法,分別建立苗期、封行期、旺長(zhǎng)期、成熟期的葉綠素含量反演模型,并利用驗(yàn)證集數(shù)據(jù)對(duì)模型精度進(jìn)行驗(yàn)證,由表4 可以看出,不同生育時(shí)期隨機(jī)森林模型反演效果也存在差異,苗期和封行期決定系數(shù)較小,反演效果較差;旺長(zhǎng)期的建模效果最好,建模集R2為0.969,RMSE 為0.031;成熟期的反演效果最好,驗(yàn)證集R2為0.892,RMSE 為0.116,且建模效果也較好,建模集R2為0.949,RMSE 為0.045。 基于隨機(jī)森林模型的苧麻葉綠素含量預(yù)測(cè)值與實(shí)測(cè)值間的關(guān)系如圖3 所示。
表4 葉綠素含量與植被指數(shù)隨機(jī)森林模型的評(píng)價(jià)結(jié)果
圖3 基于隨機(jī)森林模型的葉綠素預(yù)測(cè)值與實(shí)測(cè)值的關(guān)系
綜上所述,與傳統(tǒng)的線性回歸模型相比,基于隨機(jī)森林算法構(gòu)建的模型預(yù)測(cè)效果在各生育時(shí)期均有大幅提升,總體以成熟期的反演效果最好,建模集和驗(yàn)證集的R2分別為0.949 和0.892,因此最終選用成熟期的隨機(jī)森林模型用于苧麻葉綠素含量反演。
本研究基于無(wú)人機(jī)獲取的苧麻苗期、封行期、旺長(zhǎng)期和成熟期多光譜遙感影像,結(jié)合實(shí)測(cè)葉綠素含量,選取7 種植被指數(shù),分別利用一元線性回歸、多元線性回歸和隨機(jī)森林算法建立了苧麻葉片葉綠素含量反演模型,研究利用多光譜遙感估測(cè)苧麻葉綠素含量的可行性。 相關(guān)性分析結(jié)果表明7 種植被指數(shù)均與各時(shí)期葉綠素含量顯著或極顯著相關(guān),與陳鵬[14]、Cao[18]等的研究結(jié)果一致,可用于后續(xù)模型構(gòu)建。 經(jīng)對(duì)比分析,多元線性回歸模型的反演效果明顯好于一元線性回歸,而基于隨機(jī)森林機(jī)器學(xué)習(xí)構(gòu)建模型的葉綠素預(yù)測(cè)效果最好,以成熟期的反演效果最佳,建模集和驗(yàn)證集的R2分別為0.949 和0.892,RMSE 分別為0.045 和0.116。 這主要是因?yàn)殡S機(jī)森林模型有很好的抗噪聲能力且不容易過(guò)度擬合,使得模型精度較高[20-22]。
無(wú)人機(jī)多光譜遙感技術(shù)為監(jiān)測(cè)苧麻葉綠素含量提供了一種實(shí)用、高效、低成本、無(wú)損的方法,通過(guò)結(jié)合機(jī)器學(xué)習(xí)技術(shù),能夠較精準(zhǔn)反演苧麻葉綠素含量,可以作為苧麻生長(zhǎng)過(guò)程中葉片葉綠素含量監(jiān)測(cè)的有效手段。
雖然本研究建立的隨機(jī)森林模型對(duì)苧麻葉綠素含量反演效果較好,但目前對(duì)葉綠素的跨期預(yù)測(cè)模型還沒(méi)有深入研究,且模型的普適性也需要進(jìn)一步驗(yàn)證,在下一步研究中將對(duì)模型進(jìn)行優(yōu)化,嘗試機(jī)器學(xué)習(xí)與深度學(xué)習(xí)的對(duì)比研究,以探索出普適性強(qiáng)、預(yù)測(cè)精度更高的苧麻葉綠素含量反演模型。