苗春麗,李仲賢,趙志成,伏帥,高金龍,劉潔,馮琦勝,梁天剛*
(1. 蘭州大學(xué)草地農(nóng)業(yè)科技學(xué)院,草地農(nóng)業(yè)生態(tài)系統(tǒng)國(guó)家重點(diǎn)實(shí)驗(yàn)室,蘭州大學(xué)農(nóng)業(yè)農(nóng)村部牧草創(chuàng)新重點(diǎn)實(shí)驗(yàn)室,蘭州大學(xué)草地農(nóng)業(yè)教育工程研究中心,甘肅 蘭州 730020;2. 蘭州大學(xué)網(wǎng)絡(luò)安全與信息化辦公室,甘肅 蘭州 730000;3. 寧夏彭陽(yáng)縣畜牧技術(shù)推廣服務(wù)中心,寧夏 彭陽(yáng) 756500)
苜蓿(Medicago sativa)因具有產(chǎn)量高、營(yíng)養(yǎng)豐富、適口性好、易于家畜消化等特點(diǎn)[1],成為世界上廣泛種植的優(yōu)良牧草,素有“牧草之王”的美稱(chēng)[2]。隨著畜牧業(yè)的大力發(fā)展以及農(nóng)業(yè)結(jié)構(gòu)的調(diào)整,苜蓿作為優(yōu)質(zhì)牧草,在我國(guó)北方地區(qū)大面積集約化種植,極大地促進(jìn)了苜蓿產(chǎn)業(yè)的發(fā)展[3]。近年來(lái),我國(guó)栽培苜蓿規(guī)?;a(chǎn)優(yōu)勢(shì)明顯,但與發(fā)達(dá)國(guó)家相比,仍然存在生產(chǎn)管理較粗放,在大部分生產(chǎn)區(qū)域尚未實(shí)現(xiàn)水、肥、藥的一體化精準(zhǔn)管控,苜蓿生產(chǎn)過(guò)程缺乏數(shù)字化、智能化的管理系統(tǒng),苜蓿生產(chǎn)及管理效率低下,生產(chǎn)成本逐年增加等問(wèn)題,嚴(yán)重制約著苜蓿產(chǎn)業(yè)綜合競(jìng)爭(zhēng)力的提升和高質(zhì)量發(fā)展。
智慧農(nóng)業(yè)是以信息和知識(shí)為核心要素,通過(guò)互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、大數(shù)據(jù)、人工智能(artificial intelligence, AI)和智能裝備等現(xiàn)代信息技術(shù)與農(nóng)業(yè)跨界融合,實(shí)現(xiàn)農(nóng)業(yè)生產(chǎn)全過(guò)程的信息感知、定量決策、智能控制、精準(zhǔn)投入、個(gè)性化服務(wù)的全新農(nóng)業(yè)生產(chǎn)方式,是農(nóng)業(yè)信息化發(fā)展從數(shù)字化到網(wǎng)絡(luò)化再到智能化的高級(jí)階段。智慧農(nóng)業(yè)整合生物技術(shù)、信息技術(shù)、智能裝備三大生產(chǎn)力要素[4]。美國(guó)、英國(guó)、澳大利亞、法國(guó)、德國(guó)、日本等國(guó)家圍繞智慧農(nóng)業(yè)進(jìn)行了廣泛的布局,分別出臺(tái)了“人工智能研發(fā)戰(zhàn)略計(jì)劃”“產(chǎn)業(yè)戰(zhàn)略白皮書(shū)”“農(nóng)業(yè)4.0 手冊(cè)”“農(nóng)業(yè)創(chuàng)新2025”“數(shù)字農(nóng)業(yè)”“社會(huì)5.0”等政策,預(yù)計(jì)2015-2025 年全球智慧農(nóng)業(yè)市值將達(dá)到683 億美元[5]。我國(guó) “十四五”規(guī)劃提出要發(fā)展智慧農(nóng)業(yè),目標(biāo)是用電腦強(qiáng)化人腦、用機(jī)器替代人力、用自主替代進(jìn)口,實(shí)現(xiàn)生產(chǎn)智能化、作業(yè)精準(zhǔn)化、管理數(shù)字化和服務(wù)網(wǎng)絡(luò)化[6]。智慧農(nóng)業(yè)的迅速發(fā)展為栽培苜蓿精細(xì)化管理提供了新契機(jī)。因此,迫切需要加快轉(zhuǎn)變苜蓿產(chǎn)業(yè)發(fā)展方式,從粗放發(fā)展模式向精細(xì)管理發(fā)展模式轉(zhuǎn)變。利用地面物聯(lián)網(wǎng)等方法構(gòu)建栽培苜蓿觀測(cè)技術(shù)體系,建立栽培苜蓿生產(chǎn)大數(shù)據(jù)分析與決策管理平臺(tái),有利于推進(jìn)栽培苜蓿資源環(huán)境數(shù)字化,加強(qiáng)栽培苜蓿生產(chǎn)過(guò)程監(jiān)控、災(zāi)害動(dòng)態(tài)監(jiān)測(cè)和智能作業(yè),服務(wù)宏觀管理決策,指導(dǎo)栽培苜蓿生產(chǎn),推動(dòng)生產(chǎn)管理的數(shù)字化、網(wǎng)絡(luò)化和智能化發(fā)展。
智慧農(nóng)業(yè)包括智能農(nóng)業(yè)裝備、智能傳感器系統(tǒng)、智能無(wú)人機(jī)、智能機(jī)器人、軟件等主要技術(shù)。在智能感知系統(tǒng)研發(fā)及應(yīng)用方面,吳文斌等[7]構(gòu)建了天空地一體化的果園感知系統(tǒng),開(kāi)發(fā)了天空地遙感大數(shù)據(jù)驅(qū)動(dòng)的果園生產(chǎn)診斷與作業(yè)決策系統(tǒng),優(yōu)化果園資源要素配置,提高果園生產(chǎn)率、土地產(chǎn)出率和勞動(dòng)生產(chǎn)率,打造出了新型的果業(yè)生產(chǎn)發(fā)展模式;李巖等[8]針對(duì)農(nóng)作物的長(zhǎng)勢(shì)與農(nóng)業(yè)災(zāi)害監(jiān)測(cè)需求,集成北斗導(dǎo)航定位、遙感、通信等技術(shù),建成以北斗導(dǎo)航數(shù)據(jù)與軍民高分?jǐn)?shù)據(jù)融合應(yīng)用為主體,研發(fā)面向農(nóng)機(jī)監(jiān)控管理、作物長(zhǎng)勢(shì)監(jiān)測(cè)、農(nóng)業(yè)植保管理的具有區(qū)域特色的農(nóng)業(yè)監(jiān)測(cè)應(yīng)用系統(tǒng),為農(nóng)作物長(zhǎng)勢(shì)監(jiān)測(cè)、氣象災(zāi)害監(jiān)測(cè)、病蟲(chóng)害監(jiān)控、無(wú)人機(jī)施藥管理、農(nóng)機(jī)態(tài)勢(shì)監(jiān)測(cè)和農(nóng)作物節(jié)水灌溉提供了技術(shù)手段;柳平增等[9]針對(duì)精準(zhǔn)變量播種、施肥、施藥及自動(dòng)灌溉等作物生產(chǎn)關(guān)鍵環(huán)節(jié)的管理,研究設(shè)計(jì)了精準(zhǔn)農(nóng)業(yè)信息感知系統(tǒng)。然而,已有的田間系統(tǒng)大多數(shù)主要側(cè)重于智能傳感系統(tǒng)的設(shè)計(jì),并且使用的樣本來(lái)自單一地區(qū),其適用性有限且并沒(méi)有在后臺(tái)應(yīng)用蓋度與產(chǎn)量相關(guān)算法模型,不能實(shí)時(shí)分析和計(jì)算作物的蓋度和產(chǎn)量。
國(guó)內(nèi)外在農(nóng)作物蓋度和產(chǎn)量衛(wèi)星遙感方面開(kāi)展了大量研究工作,如張加楠等[10]、伏帥等[11]、周濤等[12]采用不同算法分析了玉米(Zea mays)、天然草地和植被的覆蓋度;Li 等[13]使用了無(wú)人機(jī)RGB 高分辨率遙感影像和Otsu閾值法從裸土中提取馬鈴薯(Solanum tuberosum)植物對(duì)象,開(kāi)發(fā)了半自動(dòng)化圖像分析軟件來(lái)估計(jì)作物出苗情況。研究結(jié)果表明,該方法是一種有前途的高通量表型方法,可用于評(píng)估馬鈴薯在出苗階段的發(fā)育情況。鄧璐希[14]使用無(wú)人機(jī)影像技術(shù)和支持向量機(jī)(support vector machine, SVM)的分類(lèi)模型,來(lái)識(shí)別無(wú)人機(jī)影像中的不同顏色的開(kāi)花覆蓋度,并發(fā)現(xiàn)不同顏色的開(kāi)花覆蓋度與傳粉者數(shù)量呈指數(shù)關(guān)系。王成波[15]使用無(wú)人機(jī)遙感技術(shù)獲取玉米可見(jiàn)光影像,選取不同的植被指數(shù)進(jìn)行可見(jiàn)光圖像閾值分割,較好地提取了夏季玉米在四葉期、拔節(jié)期、抽穗期和花粒期的植被覆蓋度。以上研究均利用無(wú)人機(jī)影像數(shù)據(jù)采用機(jī)器學(xué)習(xí)或閾值法對(duì)農(nóng)作物覆蓋度進(jìn)行計(jì)算,雖然取得了不錯(cuò)的識(shí)別效果,但是普遍存在精度偏低、樣本量較少、研究區(qū)跨度較小、模型普適性低等問(wèn)題。針對(duì)以上研究的不足,本研究將利用四省區(qū)的無(wú)人機(jī)影像數(shù)據(jù)集和U-Net 算法為栽培苜蓿智能感知系統(tǒng)建立一個(gè)精度和普適性更高的栽培苜蓿蓋度估算模型。
近年來(lái),隨著無(wú)人機(jī)和近地表傳感器技術(shù)的不斷發(fā)展,越來(lái)越多的農(nóng)業(yè)應(yīng)用場(chǎng)景開(kāi)始采用機(jī)器學(xué)習(xí)等方法來(lái)實(shí)現(xiàn)栽培農(nóng)作物的生長(zhǎng)動(dòng)態(tài)監(jiān)測(cè)和產(chǎn)量估算。然而,在苜蓿等作物方面,對(duì)于在蓋度及產(chǎn)量等關(guān)鍵生物物理指標(biāo)算法構(gòu)建及應(yīng)用方面的探索研究還相對(duì)不足。許多學(xué)者針對(duì)小麥(Triticum aestivum)[16-17]、水稻(Oryza sativa)[18]、玉米[19]、棉花(Gossypiumspp.)[20]、馬鈴薯[21]、大豆(Glycine max)[22]等大宗農(nóng)作物開(kāi)展了長(zhǎng)勢(shì)監(jiān)測(cè)和產(chǎn)量估算研究,費(fèi)時(shí)費(fèi)力且效果不穩(wěn)定。已有的研究成果表明,使用機(jī)器學(xué)習(xí)算法可以顯著提高栽培苜蓿生長(zhǎng)狀態(tài)的監(jiān)測(cè)精度和可靠性。例如,競(jìng)霞等[23]利用高光譜遙感數(shù)據(jù),以及貝葉斯嶺回歸(bayesian ridge regression,BRR)、支持向量回歸(support vector regression, SVR)和偏最小二乘(partial least squares regression, PLSR)等方法對(duì)廣東省鐘落潭試驗(yàn)基地水稻進(jìn)行估產(chǎn)分析,結(jié)果表明,當(dāng)輸入?yún)?shù)組合為全波段光譜協(xié)同作物群體長(zhǎng)勢(shì)參數(shù)、作物養(yǎng)分吸收量時(shí),BRR 模型對(duì)產(chǎn)量的估算精度達(dá)到最高,R2為0.94。尹瀚民等[24]利用Landsat 影像與雙循環(huán)神經(jīng)網(wǎng)絡(luò)模型對(duì)哈薩克斯坦北部地區(qū)的春小麥進(jìn)行了估產(chǎn)分析,春小麥產(chǎn)量與植被凈初級(jí)生產(chǎn)力(net primary productivity, NPP)相關(guān)性分析結(jié)果顯示,北哈薩克斯坦州、阿克莫拉州和庫(kù)斯塔納州決定系數(shù)(R2)在0.50 以上,面積占比分別為44%、94%和77%。余新華等[25]利用一種基于多光譜衛(wèi)星遙感數(shù)據(jù)和作物生長(zhǎng)模型估算農(nóng)作物產(chǎn)量的模型框架(soil-crop yield model, SCYM)來(lái)估測(cè)安徽省冬小麥的產(chǎn)量,研究結(jié)果顯示,2012-2018 年實(shí)測(cè)單產(chǎn)平均值為6058.00 kg·hm-2,SCYM 估算單產(chǎn)平均值為5984.95 kg·hm-2, 且估算產(chǎn)量與實(shí)測(cè)產(chǎn)量的年際時(shí)間序列的相關(guān)性為0.822,均方根誤差(root mean square error,RMSE)為189.96 kg·hm-2,SCYM 估產(chǎn)框架對(duì)安徽省冬小麥產(chǎn)量估算具有一定的可行性,在產(chǎn)量預(yù)測(cè)方面效果良好。盡管已有研究在栽培苜蓿產(chǎn)量估測(cè)方面取得了較高的模型精度,但是仍存在一些問(wèn)題需予以解決。其中,利用遙感衛(wèi)星數(shù)據(jù)的時(shí)間分辨率較低,受到云的干擾影響,導(dǎo)致產(chǎn)量模型誤差增大;此外,遙感影像數(shù)據(jù)的采集和處理需要大量人力物力,增大了成本。同時(shí),由于影像過(guò)境時(shí)間和野外實(shí)測(cè)時(shí)間存在一定的誤差,實(shí)測(cè)產(chǎn)量與影像監(jiān)測(cè)產(chǎn)量不能夠?qū)崟r(shí)匹配,限制了監(jiān)測(cè)的準(zhǔn)確性。另外,現(xiàn)有模型中的變量多為遙感數(shù)據(jù)等,基于植物生物物理指標(biāo)變量的模型研究不足,模型變量較為復(fù)雜,不利于栽培苜蓿智能感知系統(tǒng)的快速監(jiān)測(cè)。因此,針對(duì)上述問(wèn)題,本研究將利用機(jī)器學(xué)習(xí)等算法為栽培苜蓿智能感知系統(tǒng)建立一個(gè)更為高效、準(zhǔn)確和穩(wěn)定的苜蓿生長(zhǎng)狀況的動(dòng)態(tài)監(jiān)測(cè)和產(chǎn)量估算模型。
基于以上因素的考慮,本研究將利用四省區(qū)2018-2021 年地面大量觀測(cè)數(shù)據(jù)和無(wú)人機(jī)圖像及視頻資料,采用傳統(tǒng)統(tǒng)計(jì)方法和機(jī)器學(xué)習(xí)算法,構(gòu)建用于智能感知系統(tǒng)的統(tǒng)一、標(biāo)準(zhǔn)化的苜蓿蓋度和產(chǎn)量動(dòng)態(tài)反演算法,以期為多點(diǎn)位高時(shí)頻的網(wǎng)絡(luò)化、自動(dòng)化和智能化數(shù)據(jù)實(shí)時(shí)采集與動(dòng)態(tài)分析提供技術(shù)支撐,為栽培苜蓿草地的田間科學(xué)管理提供智能化的信息服務(wù)。
本研究組裝的栽培苜蓿智能感知系統(tǒng)包括多種地基傳感器,可實(shí)現(xiàn)苜蓿生長(zhǎng)環(huán)境和關(guān)鍵生物物理信息的快速感知、采集、傳輸、存儲(chǔ)和可視化,可以解決傳統(tǒng)栽培苜蓿遙感監(jiān)測(cè)和地面調(diào)查中數(shù)據(jù)時(shí)空不連續(xù)的難點(diǎn)問(wèn)題,可顯著提高信息獲取的保障率和時(shí)效性,實(shí)現(xiàn)對(duì)栽培苜蓿生產(chǎn)信息全天時(shí)、大范圍、多點(diǎn)位的動(dòng)態(tài)監(jiān)測(cè)與管理。從技術(shù)體系看,栽培苜蓿智能感知系統(tǒng)主要由地面?zhèn)鞲芯W(wǎng)智能感知和決策支持系統(tǒng)兩大子系統(tǒng)構(gòu)成:1)地面?zhèn)鞲芯W(wǎng)智能感知系統(tǒng)。通過(guò)物聯(lián)網(wǎng)和傳感器技術(shù)建立無(wú)人值守的固定點(diǎn)位的栽培苜蓿智能感知系統(tǒng),可自動(dòng)、連續(xù)和高效獲取苜蓿植物關(guān)鍵生物物理和生長(zhǎng)環(huán)境信息。其中,生長(zhǎng)環(huán)境信息主要包括氣象和土壤參數(shù),其中氣象因子包括空氣溫濕度、風(fēng)速、風(fēng)向、降水量等指標(biāo),土壤因子包括分層溫濕度等指標(biāo)。同時(shí),還可以獲取栽培苜蓿返青、開(kāi)花、刈割等關(guān)鍵時(shí)期的長(zhǎng)勢(shì)和產(chǎn)量等信息。地面?zhèn)鞲芯W(wǎng)感知系統(tǒng)的構(gòu)建,可以為苜蓿生產(chǎn)大數(shù)據(jù)研究與應(yīng)用提供基礎(chǔ)數(shù)據(jù)支撐。2)栽培苜蓿草地管理決策支持系統(tǒng)。結(jié)合手機(jī)、平板電腦、無(wú)人機(jī)等終端平臺(tái),利用人工智能等技術(shù)深度挖掘智能感知系統(tǒng)獲取的數(shù)據(jù),還可以綜合分析栽培苜蓿草地產(chǎn)量、品質(zhì)、病蟲(chóng)害和干旱等方面的信息,為苜蓿產(chǎn)業(yè)高質(zhì)量發(fā)展決策提供信息服務(wù)。
從功能看,基于物聯(lián)網(wǎng)的栽培苜蓿智能感知系統(tǒng)主要包括 3 個(gè)方面的信息服務(wù)內(nèi)容:1)氣象災(zāi)害評(píng)價(jià)。以氣象災(zāi)害應(yīng)急管理為目標(biāo),利用土壤溫濕度傳感器和多種氣象觀測(cè)傳感器,分析旱澇災(zāi)害、低溫凍害等氣象災(zāi)害發(fā)生的時(shí)間、頻率和強(qiáng)度,建立災(zāi)情動(dòng)態(tài)監(jiān)測(cè)及其對(duì)栽培苜蓿生長(zhǎng)和刈割影響評(píng)估技術(shù),進(jìn)行實(shí)時(shí)監(jiān)測(cè)與快速預(yù)警,提升栽培苜蓿產(chǎn)業(yè)對(duì)災(zāi)害的應(yīng)急管理能力;2)水肥管理。利用地面土壤、氣象傳感器和圖像、視頻監(jiān)測(cè)數(shù)據(jù),綜合分析栽培苜蓿生長(zhǎng)發(fā)育特征,構(gòu)建栽培苜蓿水肥診斷模型,研究水肥一體化調(diào)控方法,為栽培苜蓿水肥科學(xué)管理提供科技支撐;3)生長(zhǎng)狀況及產(chǎn)量評(píng)估。利用苜蓿植物超聲波傳感器和圖像、視頻監(jiān)測(cè)數(shù)據(jù),構(gòu)建栽培苜蓿蓋度及產(chǎn)量反演模型,實(shí)時(shí)動(dòng)態(tài)提供診斷分析;基于栽培苜蓿生長(zhǎng)發(fā)育及其周邊微環(huán)境變化等因素之間的關(guān)系特點(diǎn),構(gòu)建栽培苜蓿生長(zhǎng)模擬模型,動(dòng)態(tài)監(jiān)測(cè)栽培苜蓿生長(zhǎng)過(guò)程,為栽培苜蓿適時(shí)刈割等管理提供信息服務(wù)。生產(chǎn)過(guò)程的智能監(jiān)測(cè)與分析是栽培苜蓿生產(chǎn)智能管理的核心。隨著傳感器技術(shù)的發(fā)展和成本的不斷降低,利用精度更高功能更加完備的傳感器(如高清照相機(jī)、定制化的多光譜儀等),可以進(jìn)一步提升栽培苜蓿智能感知系統(tǒng)的功能,對(duì)栽培苜蓿病蟲(chóng)害等生物災(zāi)害,以及對(duì)牧草品質(zhì)進(jìn)行診斷和評(píng)估。
1.1.1 地面?zhèn)鞲芯W(wǎng)智能感知系統(tǒng) 栽培苜蓿草地智能感知系統(tǒng)中的地面?zhèn)鞲芯W(wǎng)智能感知系統(tǒng)是一種單片集成的多傳感器系統(tǒng)(圖1)。該系統(tǒng)包括土壤溫濕度傳感器、多項(xiàng)氣象指標(biāo)觀測(cè)傳感器、植物超聲波傳感器、高清攝像頭以及在一片芯片上為每個(gè)傳感器設(shè)計(jì)的外圍電路(圖1)。目前該設(shè)備已經(jīng)在監(jiān)測(cè)點(diǎn)寧夏自治區(qū)彭陽(yáng)縣白楊莊村(106.799848° E, 35.997256° N)應(yīng)用。
圖1 地面?zhèn)鞲芯W(wǎng)智能感知系統(tǒng)Fig.1 Ground sensor network intelligent perception system
超聲波傳感器采用DYP-A16-V1.0,其盲區(qū)距離為508 cm,平面物體量程達(dá)50~1500 cm,測(cè)量精度達(dá)±(1+S0.3%)。其擁有防塵防水、遠(yuǎn)距離測(cè)距穩(wěn)定、低功耗供電、精確度高、帶有溫度補(bǔ)償功能、適應(yīng)戶(hù)外等惡劣環(huán)境、抗干擾強(qiáng)、兼容多種輸出方式等優(yōu)點(diǎn)。主要監(jiān)測(cè)栽培苜蓿的草層高度;高清攝像頭傳感器運(yùn)用GoPro 10(https: //gopro.com/zh/cn/shop/cameras)運(yùn)動(dòng)相機(jī),采用GP2 處理器,具有2300 萬(wàn)高分辨率像素,傳輸影像達(dá)60 FPS·S-1,具有可同時(shí)保證5.3 k 分辨率和360° 6 k 視頻功能。此外,GoPro 運(yùn)動(dòng)相機(jī)的質(zhì)地輕盈,能更加迅速地捕捉影像。同時(shí)具有圖像穩(wěn)定功能,可確保視頻畫(huà)面穩(wěn)定清晰。該設(shè)備主要應(yīng)用于栽培苜蓿影像的獲取,以及苜蓿草地蓋度、產(chǎn)量等信息的智能分析。
土壤傳感器(VMS-3005-TR-6EC6W6S-N01),主要進(jìn)行不同分層土壤溫濕度的監(jiān)測(cè);氣象傳感器采用聚英全自動(dòng)氣象指標(biāo)采集系統(tǒng),包括LORA 氣象采集網(wǎng)關(guān)、無(wú)線(xiàn)路由器、氣象監(jiān)控主機(jī)箱及各類(lèi)傳感器,可自動(dòng)觀測(cè)風(fēng)速、風(fēng)向、雨量、太陽(yáng)輻照度、空氣溫度、空氣濕度、PM 2.5 等指標(biāo)。
1.1.2 栽培苜蓿草地智能感知與決策系統(tǒng)(web端) 栽培苜蓿草地智能感知與決策系統(tǒng)包含設(shè)備管理、知識(shí)庫(kù)、智能分析、系統(tǒng)管理等4 個(gè)模塊,旨在將地面?zhèn)鞲芯W(wǎng)傳回的數(shù)據(jù)進(jìn)行實(shí)時(shí)分析。對(duì)監(jiān)測(cè)點(diǎn)栽培苜蓿草地的降水量、土壤溫濕度、空氣溫濕度、風(fēng)向、風(fēng)速、紫外線(xiàn)等指標(biāo)進(jìn)行實(shí)時(shí)數(shù)據(jù)傳回,其中拍攝的苜蓿植物實(shí)時(shí)照片和視頻,能夠?qū)υ耘嘬俎5拈L(zhǎng)勢(shì)、蓋度、產(chǎn)量、病蟲(chóng)害等通過(guò)后臺(tái)算法進(jìn)行實(shí)時(shí)計(jì)算和分析。
為了構(gòu)建我國(guó)北方地區(qū)栽培苜蓿蓋度和產(chǎn)量智能感知算法,本研究采用了2018-2021 年蘭州大學(xué)草地農(nóng)業(yè)科技學(xué)院草地遙感與信息管理研究團(tuán)隊(duì)在新疆、內(nèi)蒙古、甘肅、寧夏等省區(qū)開(kāi)展完成的栽培苜蓿野外觀測(cè)數(shù)據(jù)庫(kù)(https://herbs.aiplants.cn/)。該數(shù)據(jù)庫(kù)包含在栽培苜蓿生長(zhǎng)季開(kāi)展的9 次外業(yè)調(diào)查數(shù)據(jù)記錄,總計(jì)有555 個(gè)樣方和185 個(gè)樣地?cái)?shù)據(jù)(圖2,底圖無(wú)修改)。在外業(yè)調(diào)查時(shí),樣地選在大于10 m×10 m 的苜蓿地塊,每個(gè)樣地內(nèi)包括均勻設(shè)置的3 個(gè)0.5 m×0.5 m 的樣方,采樣點(diǎn)記錄的內(nèi)容包括經(jīng)度、緯度、高程、苜蓿植物蓋度、高度、鮮重、干重等指標(biāo),及無(wú)人機(jī)拍攝的照片編號(hào)、文字注記等信息。經(jīng)度、緯度、高程數(shù)據(jù)由手持GPS(集思寶)獲取,精度為2~3 m。每個(gè)樣方隨機(jī)測(cè)量10 次栽培苜蓿的自然高度并取平均值作為該樣方實(shí)測(cè)植物高度。在每個(gè)樣方內(nèi),苜蓿留茬高度為5 cm,剪下樣方內(nèi)所有地上部分去除雜質(zhì)后裝入樣品袋,稱(chēng)取地上生物量鮮重值。樣品帶回實(shí)驗(yàn)室后經(jīng)64 ℃烘箱烘干至恒重后記錄樣方生物量干重。統(tǒng)計(jì)每個(gè)樣地3 個(gè)樣方生物量平均值作為該樣地生物量實(shí)測(cè)值。
圖2 2018-2021 年栽培苜蓿觀測(cè)樣地空間分布Fig.2 Spatial distribution of cultivated alfalfa observation plots from 2018 to 2021
苜蓿植物蓋度數(shù)據(jù)是利用“中國(guó)草業(yè)與生態(tài)大數(shù)據(jù)服務(wù)系統(tǒng)”(http: //ecograss.lzu.edu.cn/)中蓋度識(shí)別模塊和大疆精靈4PRO 無(wú)人機(jī)(http: //www.dji.com)拍攝的可見(jiàn)光照片(分辨率為4864×3648)計(jì)算得到的。該無(wú)人機(jī)搭載的高清數(shù)碼相機(jī)可獲取紅、綠、藍(lán)波段范圍的可見(jiàn)光光譜信息,并以0~255 的數(shù)值形式儲(chǔ)存在JEPG格式的圖像文件中,每張照片的位置信息儲(chǔ)存在照片的屬性文件中。在使用無(wú)人機(jī)進(jìn)行拍照時(shí),利用飛控系統(tǒng)在樣方正上方保持懸停20 m 狀態(tài),使相機(jī)鏡頭垂直向下拍攝照片,每個(gè)樣地拍攝5~9 張無(wú)人機(jī)照片。樣地內(nèi)所有樣方的苜蓿蓋度平均值作為該樣地的苜蓿草地蓋度。
主要包括以下2 個(gè)方面的內(nèi)容: 1)基于深度學(xué)習(xí)(deep learning, DL)方法和無(wú)人機(jī)照片的栽培苜蓿蓋度建模與分析,計(jì)算野外實(shí)測(cè)樣地的苜蓿蓋度,為估產(chǎn)模型構(gòu)建提供基礎(chǔ)數(shù)據(jù);2)以樣點(diǎn)經(jīng)度(X)、緯度(Y)、高程(h)等環(huán)境因子和苜蓿草高(H)、蓋度(C)、草高×蓋度(H×C)等草地植物生物物理指標(biāo)為自變量,構(gòu)建栽培苜蓿產(chǎn)量多元線(xiàn)性回歸(multiple linear regression, MLR)和隨機(jī)森林(random forest, RF)機(jī)器學(xué)習(xí)模型。在以上模型研究的基礎(chǔ)上,評(píng)價(jià)各類(lèi)模型的精度和實(shí)用性,篩選出適合栽培苜蓿草地智能感知系統(tǒng)實(shí)時(shí)動(dòng)態(tài)監(jiān)測(cè)分析的最優(yōu)模型。
1.3.1 蓋度估測(cè)模型 圖像處理是深度學(xué)習(xí)最早嘗試的領(lǐng)域,U-Net 網(wǎng)絡(luò)則是其應(yīng)用較為廣泛的一種。該網(wǎng)絡(luò)是2015 年由Ronneberger 等[26]基于FCN 提出的一種新型的語(yǔ)義分割網(wǎng)絡(luò)結(jié)構(gòu),最早應(yīng)用于醫(yī)學(xué)圖像分割,能夠在少量樣本的情況下達(dá)到相對(duì)精確的分割結(jié)果。它是一種典型的編碼解碼結(jié)構(gòu)(encoder-decoder)。編碼過(guò)程主要進(jìn)行下采樣,實(shí)現(xiàn)特征提取,解碼過(guò)程主要是進(jìn)行上采樣,還原像素尺寸,同時(shí)精準(zhǔn)定位分割位置。
因此本研究使用深度學(xué)習(xí)框架Pytorch 構(gòu)建栽培苜蓿植物蓋度反演模型。試驗(yàn)的操作系統(tǒng)為Windows 10,GPU 配置為NVIDIA Quadro P5000,顯存為16 GB。根據(jù)無(wú)人機(jī)拍攝圖像的顏色、形狀和梯度等特征,利用UNet 算法進(jìn)行裸地和苜蓿的二分類(lèi),共計(jì)使用了1124 張無(wú)人機(jī)拍攝的樣地照片(分辨率為4864×3648),批處理大小為16,圖像尺寸為1080×1080,損失函數(shù)是二分類(lèi)交叉熵函數(shù)。生成的標(biāo)簽作為監(jiān)督信號(hào),計(jì)算迭代次數(shù)100次,學(xué)習(xí)率為2e-4,并按照9∶1 劃分驗(yàn)證集和訓(xùn)練集,其中驗(yàn)證集的圖像與訓(xùn)練集獨(dú)立,不參與訓(xùn)練。
準(zhǔn)確率(accuracy,ACC)表示所有的預(yù)測(cè)樣本中,預(yù)測(cè)正確的比例。TP(true positive)表示實(shí)際為正樣本被預(yù)測(cè)為正樣本的數(shù)量;FN(false negative)表示實(shí)際為正樣本卻被預(yù)測(cè)為負(fù)樣本的數(shù)量;FP(false positive)表示實(shí)際為負(fù)樣本卻被預(yù)測(cè)為正樣本的數(shù)量;TN(true negative)表示實(shí)際為負(fù)樣本預(yù)測(cè)也為負(fù)樣本的數(shù)量??梢缘贸觯═P+FN)是全部實(shí)際的正樣本數(shù),而(TP+FP)是所有預(yù)測(cè)為正樣本的數(shù)量。
式中:TP 表示實(shí)際為苜蓿樣本被預(yù)測(cè)為苜蓿樣本的數(shù)量;FN表示實(shí)際為苜蓿樣本卻被預(yù)測(cè)為裸地樣本的數(shù)量;FP表示實(shí)際為裸地樣本卻被預(yù)測(cè)為苜蓿樣本的數(shù)量;TN表示實(shí)際為裸地樣本預(yù)測(cè)也為裸地樣本的數(shù)量??梢缘贸觯═P+FN)是全部實(shí)際的苜蓿樣本數(shù),而(TP+FP)是所有預(yù)測(cè)為苜蓿樣本的數(shù)量。
1.3.2 栽培苜蓿產(chǎn)量統(tǒng)計(jì)模型 多元線(xiàn)性回歸模型可以表述兩個(gè)或兩個(gè)以上解釋變量的統(tǒng)計(jì)依賴(lài)關(guān)系(公式1)。該類(lèi)模型具有兩個(gè)或兩個(gè)以上的解釋變量和明確的參數(shù)化表達(dá)式,模型自變量參數(shù)可用最小二乘方法進(jìn)行估算。線(xiàn)性回歸方程比較簡(jiǎn)單,模型參數(shù)易于估計(jì)。在遙感監(jiān)測(cè)中,基于多元線(xiàn)性回歸模型的農(nóng)作物產(chǎn)量估測(cè)模型已得到廣泛應(yīng)用[27]。因此,本研究利用MATLAB 2021a 軟件,分別構(gòu)建與栽培苜蓿產(chǎn)量顯著相關(guān)的不同因素及其組合的多元線(xiàn)性回歸模型。
式中:y為栽培苜蓿產(chǎn)量;x1,x2, …,xi為與栽培苜蓿產(chǎn)量有顯著相關(guān)性的因子,在本研究中包括3 個(gè)環(huán)境因子(X、Y、h)和3 個(gè)苜蓿植物生物物理指標(biāo)(H、C、H×C);β1,β2, …,βi+1為模型估測(cè)參數(shù);ui為殘差項(xiàng)。
1.3.3 栽培苜蓿產(chǎn)量機(jī)器學(xué)習(xí)模型 相較于多元線(xiàn)性回歸模型,基于機(jī)器學(xué)習(xí)的非參數(shù)非線(xiàn)性模型具有更高的估測(cè)能力[28-29]。 本研究采用的多因素機(jī)器學(xué)習(xí)模型為RF。利用R Studio 軟件,分別構(gòu)建與栽培苜蓿產(chǎn)量顯著相關(guān)的不同因素及其組合的RF 機(jī)器學(xué)習(xí)模型。
隨機(jī)森林[30]與傳統(tǒng)算法相比在處理非線(xiàn)性和多變量問(wèn)題方面具有優(yōu)越的性能,在糾正錯(cuò)誤和缺失數(shù)據(jù)方面有更強(qiáng)的能力,可以規(guī)避過(guò)擬合和多重共線(xiàn)性問(wèn)題。RF 算法包括ntree(回歸樹(shù)數(shù)量)、mtry(每個(gè)節(jié)點(diǎn)上測(cè)試的預(yù)測(cè)器的數(shù)量)和nodesize(樹(shù)的終端節(jié)點(diǎn)的大?。? 個(gè)主要變量。ntree 是基于樣本數(shù)所建立的決策樹(shù)數(shù)量,ntree越大,模擬結(jié)果就越穩(wěn)定,但會(huì)導(dǎo)致計(jì)算量增加,本研究設(shè)置ntree 為1000;mtry 是隨機(jī)特征的數(shù)量,其默認(rèn)值是輸入變量的平方根,從2~20 進(jìn)行試驗(yàn),間隔為 1,本研究采用默認(rèn)值設(shè)置。RF 算法是通過(guò) R 軟件中自帶的“randomForest”數(shù)據(jù)包實(shí)現(xiàn)[31]。
以上兩種算法均使用十折交叉驗(yàn)證方法[32]對(duì)苜蓿蓋度反演模型、產(chǎn)草量多元線(xiàn)性回歸模型和RF 模型進(jìn)行精度評(píng)價(jià)。將所有自變量及其對(duì)應(yīng)的因變量以等樣本數(shù)的方式分為10 組,進(jìn)行交叉驗(yàn)證。每次選取總體樣本數(shù)的1/10 作為測(cè)試數(shù)據(jù)集用來(lái)驗(yàn)證模型的估測(cè)能力,剩下的樣本數(shù)據(jù)作為訓(xùn)練集來(lái)構(gòu)建反演模型。每次構(gòu)建模型后利用測(cè)試集數(shù)據(jù)計(jì)算預(yù)測(cè)值與實(shí)測(cè)值之間的決定系數(shù)(R2)和均方根誤差(root mean square error, RMSE),重復(fù)選取測(cè)試集和訓(xùn)練集數(shù)據(jù)10 次,直到所有的樣本都在訓(xùn)練集和測(cè)試集中出現(xiàn),模型的估測(cè)能力用10 次測(cè)試數(shù)據(jù)計(jì)算出來(lái)的R2和RMSE 的平均值表示,R2值越大,RMSE 越小,代表模型的精度越好。
R2和 RMSE 的計(jì)算公式如下:
式中:n為本研究樣本量;y為栽培苜蓿實(shí)測(cè)產(chǎn)量;yi為栽培苜蓿預(yù)測(cè)產(chǎn)量;xi為與栽培苜蓿產(chǎn)量有顯著相關(guān)性的因子,在本研究中包括3 個(gè)環(huán)境因子(X、Y、h)和3 個(gè)苜蓿植物生物物理指標(biāo)(H、C、H×C)。
新疆、甘肅、內(nèi)蒙古和寧夏是我國(guó)北方栽培苜蓿的主產(chǎn)區(qū),本研究使用的185 個(gè)調(diào)查樣點(diǎn)基本覆蓋了這4 個(gè)省區(qū)的主要栽培苜蓿草地,調(diào)查時(shí)間跨度大,野外實(shí)測(cè)時(shí)間為5-9 月,涉及苜蓿生育期的不同時(shí)段,由于不同區(qū)域的灌溉苜蓿和旱作苜蓿刈割的時(shí)間差異較大,受刈割及氣象等因素的影響,栽培苜蓿的生物量和蓋度時(shí)空變化也有較大波動(dòng)(表1)。統(tǒng)計(jì)分析表明,我國(guó)北方4 省區(qū)栽培苜蓿草地地上生物量和蓋度差異較大。與旱作苜蓿相比,灌溉苜蓿在蓋度及產(chǎn)量上都表現(xiàn)出一定優(yōu)勢(shì)??傮w而言,我國(guó)新疆、內(nèi)蒙古、甘肅河西等地區(qū)的栽培苜蓿以灌溉為主,地塊集中連片、地勢(shì)平坦,苜蓿草地盛草期為5 月,平均產(chǎn)量和蓋度分別達(dá)5362.81 kg·hm-2和96.29%,產(chǎn)量標(biāo)準(zhǔn)差為1934.90 kg·hm-2,樣點(diǎn)離散程度較大;以旱作生產(chǎn)方式為主的甘肅隴東、寧夏南部地區(qū)的栽培苜蓿草地大多種植在山區(qū)水平梯田、一年刈割2 次,其盛草期為8 月,平均產(chǎn)量和蓋度分別達(dá)3987.57 kg·hm-2和91.55%,產(chǎn)量標(biāo)準(zhǔn)差為1436.25 kg·hm-2,誤差相對(duì)較小。
表1 2018-2021 年栽培苜蓿關(guān)鍵生物物理指標(biāo)外業(yè)觀測(cè)數(shù)據(jù)統(tǒng)計(jì)分析Table 1 Statistical analysis of field observation data of key biophysical indicators of cultivated alfalfa from 2018 to 2021
表2 為栽培苜蓿草地蓋度反演模型參數(shù),其中栽培苜蓿蓋度反演模型為U-Net 模型,樣本數(shù)量為1124。其中,R2為0.99,RMSE 為1.44%??傮w而言,模型精度較高,誤差較小,預(yù)測(cè)效果較好。該模型算法可用于栽培苜蓿智能感知系統(tǒng),對(duì)草層蓋度高精度、智能化估測(cè)具有實(shí)用意義。
表2 栽培苜蓿草地蓋度反演模型參數(shù)Table 2 Parameters of inversion model for cultivated alfalfa grassland coverage
圖3 表示不同時(shí)期與地域的部分無(wú)人機(jī)影像及標(biāo)簽,基于U-net 深度學(xué)習(xí)算法的栽培苜蓿蓋度識(shí)別結(jié)果較好。對(duì)于不同長(zhǎng)勢(shì)不同品種的苜蓿均具有較好的識(shí)別結(jié)果。
圖3 部分影像及標(biāo)簽Fig.3 Some images and labels
表3 是基于苜蓿植物生物物理指標(biāo)及其環(huán)境因子的多元線(xiàn)性回歸估測(cè)模型的十折交叉驗(yàn)證結(jié)果,其中環(huán)境因子(X、Y、h)、植物生物物理指標(biāo)(H、C、H×C)對(duì)生物量的動(dòng)態(tài)變化響應(yīng)較好,測(cè)試集R2為0.63,RMSE 為1218.15 kg·hm-2。
表3 基于環(huán)境因子和植物生物物理指標(biāo)的多元線(xiàn)性回歸估測(cè)模型十折交叉驗(yàn)證Table 3 10-fold cross-validation of MLR estimation model based on environmental factors and vegetation biophysical indicators
在基于RF 方法構(gòu)建的3 類(lèi)模型中,利用經(jīng)度、緯度和海拔等環(huán)境因子構(gòu)建的栽培苜蓿產(chǎn)量估測(cè)模型精度最差,其測(cè)試集R2為0.37,RMSE 為1623.17 kg·hm-2(表4);而植物生物物理指標(biāo)對(duì)栽培苜蓿產(chǎn)量的動(dòng)態(tài)變化響應(yīng)較好,測(cè)試集R2為0.65,RMSE 為1216.24 kg·hm-2;基于環(huán)境因子(X、Y、h)、植物生物物理指標(biāo)(H、C、H×C)構(gòu)建的栽培苜蓿產(chǎn)量估測(cè)模型精度最高,其測(cè)試集R2為0.69,RMSE 為1151.24 kg·hm-2。與多元線(xiàn)性回歸估測(cè)模型相比,基于3 個(gè)生物物理指標(biāo)和3 個(gè)環(huán)境因子指標(biāo)構(gòu)建的RF 模型精度最高,誤差最小。
表4 基于環(huán)境因子和植物生物物理指標(biāo)的RF 估測(cè)模型十折交叉驗(yàn)證Table 4 10-fold cross-validation of RF estimation model based on enviromental factors and vegetation biophysical indicators
圖4 是不同因素構(gòu)建的栽培苜蓿生物量RF 估測(cè)模型的實(shí)測(cè)值與預(yù)測(cè)值統(tǒng)計(jì)分析結(jié)果,環(huán)境因子對(duì)栽培苜蓿產(chǎn)量估測(cè)的影響較弱(圖4a),僅能反映生長(zhǎng)季內(nèi)栽培苜蓿產(chǎn)量30%的變化情況,實(shí)測(cè)值和預(yù)測(cè)值分布離散,擬合效果較差。而基于植物生物物理指標(biāo)和環(huán)境因子、植物生物物理指標(biāo)構(gòu)建的兩種模型對(duì)栽培苜蓿產(chǎn)量的估測(cè)效果較好,均能反映生長(zhǎng)季栽培苜蓿產(chǎn)量60%以上的變化情況,植物生物物理指標(biāo)在栽培苜蓿生物量的估測(cè)中效果較好(圖4b),圖4c 是基于環(huán)境因子、植物生物物理指標(biāo)構(gòu)建的栽培苜蓿生物量估測(cè)最優(yōu)模型,其R2為0.63,RMSE 為646.35 kg·hm-2,說(shuō)明基于環(huán)境因子、植物生物物理指標(biāo)構(gòu)建的模型在估測(cè)栽培苜蓿產(chǎn)量時(shí)結(jié)果最好,誤差較小。
圖4 基于不同因素組合的RF 苜蓿產(chǎn)量估測(cè)模型模擬Fig.4 Simulation of the optimal alfalfa yield estimation model based on different factors
現(xiàn)今,針對(duì)農(nóng)作物智能感知系統(tǒng),許多學(xué)者已經(jīng)在不同方面展開(kāi)研究和探索。其中,陳健等[33]開(kāi)發(fā)了蘋(píng)果(Malus pumila)精準(zhǔn)管理專(zhuān)家系統(tǒng), 實(shí)現(xiàn)了對(duì)果園環(huán)境的實(shí)時(shí)監(jiān)控,并且可以對(duì)蘋(píng)果的病蟲(chóng)害和開(kāi)花期進(jìn)行預(yù)測(cè), 但是沒(méi)有蓋度及生物量監(jiān)測(cè)與決策等功能;王旭東[34]基于WSN 的農(nóng)田智能灌溉系統(tǒng)的實(shí)時(shí)監(jiān)測(cè)、感知和采集網(wǎng)絡(luò)覆蓋區(qū)域內(nèi)環(huán)境和監(jiān)測(cè)對(duì)象的信息,再發(fā)送到信息采集站或灌溉系統(tǒng)監(jiān)控服務(wù)中心,根據(jù)土壤墑情合理計(jì)算灌水定額,突破了地域限制,實(shí)現(xiàn)了農(nóng)業(yè)智能化監(jiān)測(cè)和灌溉管理,但是該系統(tǒng)功能較為單一,只能動(dòng)態(tài)監(jiān)測(cè)農(nóng)田的需水情況。鄭立華等[35]利用CLARE 專(zhuān)家系統(tǒng)外殼開(kāi)發(fā)了棉花生產(chǎn)管理專(zhuān)家系統(tǒng),但該系統(tǒng)沒(méi)有結(jié)合互聯(lián)網(wǎng)技術(shù), 可擴(kuò)展性不強(qiáng),余國(guó)雄等[36]基于物聯(lián)網(wǎng)的荔枝(Litchi chinensis)園信息獲取與智能灌溉專(zhuān)家決策系統(tǒng)具有較強(qiáng)的實(shí)時(shí)性和較高的準(zhǔn)確率,但是,該系統(tǒng)也存在一些缺點(diǎn),例如人工管理方式比較粗獷,目的性不強(qiáng),特別是采用漫灌等傳統(tǒng)的灌溉方式,導(dǎo)致嚴(yán)重的水資源浪費(fèi)。對(duì)于以上研究的不足之處,本研究提出了一種針對(duì)栽培苜蓿的智能感知系統(tǒng)。該系統(tǒng)的地面物聯(lián)網(wǎng)具有實(shí)時(shí)連續(xù)觀測(cè),信息快速傳輸?shù)葍?yōu)點(diǎn),但其覆蓋范圍較小,多應(yīng)用于固定點(diǎn)位尺度的動(dòng)態(tài)監(jiān)測(cè)和診斷分析。該系統(tǒng)的信息服務(wù)內(nèi)容主要包括氣象災(zāi)害評(píng)價(jià)、水肥管理和生長(zhǎng)狀況及產(chǎn)量評(píng)估。該系統(tǒng)通過(guò)采用精度更高、功能更完備的傳感器(如高清照相機(jī)和定制化的多光譜儀等),可以進(jìn)一步提升系統(tǒng)的功能,對(duì)栽培苜蓿病蟲(chóng)害等生物災(zāi)害以及牧草品質(zhì)進(jìn)行診斷和評(píng)估。針對(duì)以往研究的局限性,該系統(tǒng)的功能更加全面,并且已經(jīng)應(yīng)用于實(shí)際生產(chǎn)中。另外,本研究已開(kāi)發(fā)出相應(yīng)的栽培苜蓿蓋度及產(chǎn)量估測(cè)模型,具有較高的精度并且已經(jīng)應(yīng)用在后臺(tái)中。
作物的生長(zhǎng)狀況表現(xiàn)在其生物量、葉面積、覆蓋度等特征參數(shù),通過(guò)觀測(cè)這些參數(shù)的變化情況,可以監(jiān)測(cè)作物的生長(zhǎng)情況,以便作出及時(shí)的田間管理決策[37]。而計(jì)算機(jī)視覺(jué)相關(guān)技術(shù)及設(shè)備的出現(xiàn),恰恰可以解決這些問(wèn)題。計(jì)算機(jī)視覺(jué)是借助攝影機(jī)和電腦代替人眼對(duì)目標(biāo)進(jìn)行識(shí)別、跟蹤和測(cè)量等,自20 世紀(jì) 50 年代出現(xiàn)至今,已廣泛應(yīng)用于各個(gè)領(lǐng)域,在農(nóng)業(yè)氣象觀測(cè)方面特別是種子質(zhì)量檢測(cè)、農(nóng)產(chǎn)品分級(jí)與加工、植物生長(zhǎng)監(jiān)測(cè)、農(nóng)作物病蟲(chóng)草害監(jiān)測(cè)與防治中的應(yīng)用也比比皆是[38],均取得了不錯(cuò)的研究成果。深度學(xué)習(xí)因?yàn)槠漕?lèi)似人腦的分層結(jié)構(gòu)模型,對(duì)輸入數(shù)據(jù)從底層信號(hào)到高層語(yǔ)義的特征提取建立起來(lái)的映射關(guān)系而受到關(guān)注,在圖像分類(lèi)、圖像識(shí)別、圖像分割等領(lǐng)域都取得了很好的性能。吳趙麗等[39]基于無(wú)人機(jī)遙感影像和基于中值濾波與數(shù)學(xué)形態(tài)學(xué)相結(jié)合的邊緣檢測(cè)法提取芨芨草(Achnatherum splendens)圖像,將其與非芨芨草圖像分割,估算結(jié)果準(zhǔn)確度高達(dá)97.3%。趙曉宇等[40]利用可見(jiàn)光波段差異植被指數(shù)結(jié)合Otsu 來(lái)區(qū)分植被與非植被。利用無(wú)人機(jī)可見(jiàn)光影像在紅綠藍(lán)3 個(gè)波段進(jìn)行計(jì)算,所需的時(shí)間較長(zhǎng)。針對(duì)以上研究中的不足并考慮到由于栽培苜蓿的覆蓋度計(jì)算結(jié)果將用于栽培苜蓿的生物量的計(jì)算中,其結(jié)果的準(zhǔn)確性將直接影響到栽培苜蓿生物量模型的構(gòu)建及結(jié)果,對(duì)其精度的要求較高。所以本研究所提到的基于深度學(xué)習(xí)算法的栽培苜蓿覆蓋度模型精度較高,尤其在研究區(qū)跨度較廣、觀測(cè)時(shí)間較長(zhǎng)、地形因素差異大等多種復(fù)雜因素的影響下,該模型依然表現(xiàn)出其穩(wěn)定性與精確性。但是,由于深度學(xué)習(xí)計(jì)算過(guò)程復(fù)雜度高,數(shù)據(jù)量大,在計(jì)算過(guò)程中會(huì)表現(xiàn)出延時(shí)性,未來(lái)研究還需要優(yōu)化系統(tǒng),簡(jiǎn)化深度學(xué)習(xí)模型。
本研究基于不同因素構(gòu)建的多元線(xiàn)性回歸模型,發(fā)現(xiàn)不同因素的組合對(duì)苜蓿產(chǎn)量估算的準(zhǔn)確性有顯著影響。在3 種不同的模型組合中,基于環(huán)境因子(X、Y、h)、植物生物物理指標(biāo)(H、C、H×C)的最優(yōu)模型對(duì)苜蓿產(chǎn)量的估算效果最好?;诓煌蛩氐腞F 機(jī)器學(xué)習(xí)模型對(duì)苜蓿產(chǎn)量的估計(jì)結(jié)果與多元線(xiàn)性回歸模型相似。然而,這兩個(gè)模型在估計(jì)精度方面表現(xiàn)出顯著不同的水平。本研究中利用苜蓿植物生物物理指標(biāo)的最佳機(jī)器學(xué)習(xí)模型與最優(yōu)多元線(xiàn)性回歸模型相比,R2提高了0.03,RMSE 降低了55.34 kg·hm-2。在基于不同因子組合的不同機(jī)器學(xué)習(xí)模型中,隨著輸入變量的減少,因子的權(quán)重有減小的趨勢(shì)。與最優(yōu)多元線(xiàn)性模型相比,基于環(huán)境因子和植物生物物理指標(biāo)的最優(yōu)機(jī)器學(xué)習(xí)模型R2提高了0.08,RMSE 降低了123.07 kg·hm-2。這說(shuō)明除了考慮影響苜蓿產(chǎn)量的多種因素外,模型的形式對(duì)產(chǎn)量估計(jì)也有重要影響。黎銳等[41]利用支持向量機(jī)機(jī)器學(xué)習(xí)算法結(jié)合Landsat 多時(shí)相遙感數(shù)據(jù)構(gòu)建了冬小麥產(chǎn)量估算模型,并與多元回歸模型相比較,發(fā)現(xiàn)支持向量機(jī)算法優(yōu)于多元回歸模型。本研究與其相似:與多元線(xiàn)性模型相比,機(jī)器學(xué)習(xí)算法更適合復(fù)雜的計(jì)算,可以有效地進(jìn)行變量選擇和組合,提高模型預(yù)測(cè)苜蓿產(chǎn)量的準(zhǔn)確性。RF 模型可以組合不同特征的變量,有效解決了“過(guò)擬合”多重共線(xiàn)性問(wèn)題[28,42]。許多研究者利用RF 模型估算作物生物量,結(jié)果顯示了良好的模擬效果[43]。然而,RF 模型有其局限性,特別是在構(gòu)建回歸決策樹(shù)方面。它通常低估了訓(xùn)練集以外的高生物量值[44]。此外,由于RF 模型是數(shù)據(jù)驅(qū)動(dòng)的,它通常需要大量的樣本數(shù)據(jù),如果數(shù)據(jù)集很小,可能會(huì)影響模型的準(zhǔn)確性[45]。崔孟然[46]采用偏最小二乘算法和RF 算法,估算了馬鈴薯的產(chǎn)量,結(jié)果表明,在塊莖膨大期,RF 算法構(gòu)建的建模集實(shí)測(cè)值和預(yù)測(cè)值的線(xiàn)性擬合決定系數(shù)R2達(dá)到0.88,表明RF 機(jī)器學(xué)習(xí)模型具有更高的預(yù)測(cè)精度。但是該研究的變量包括高光譜數(shù)據(jù)和地面測(cè)量數(shù)據(jù),其中高光譜數(shù)據(jù)是通過(guò)高光譜成像儀獲取的,包括了馬鈴薯生長(zhǎng)期間的遙感指數(shù)及光譜反射率等,該研究模型變量較為復(fù)雜,數(shù)據(jù)獲取需要大量的人力物力;楊北萍等[47]使用HJ-1A/B 和Landsat8 衛(wèi)星遙感數(shù)據(jù)和隨機(jī)森林回歸算法(random forest regression,RFR)進(jìn)行水稻產(chǎn)量遙感估算,表明RFR 模型的水稻產(chǎn)量估算精度明顯優(yōu)于多元逐步回歸模型,RFR 模型的R2和平均相對(duì)誤差(mean relative error,MRE)分別為0.730 和0.090,多元逐步回歸模型的R2和MRE 分別為0.530 和0.120,該研究使用的變量包括了多時(shí)相遙感圖像數(shù)據(jù)和氣象數(shù)據(jù),未考慮作物生物物理指標(biāo),另外該研究中使用的樣本來(lái)自單一地區(qū),其適用性有限。針對(duì)以上研究,本研究以4 省4 年野外實(shí)測(cè)數(shù)據(jù)建立機(jī)器學(xué)習(xí)模型,在保證模型精度的同時(shí)也提高了模型的普適性與穩(wěn)定性。另外,模型變量為植物生物物理指標(biāo)和環(huán)境因子,其都具備數(shù)據(jù)獲取簡(jiǎn)單,能夠直接被栽培苜蓿智能感知系統(tǒng)用于模型構(gòu)建與實(shí)時(shí)分析,節(jié)省了大量的人力物力,并且能夠做到栽培苜蓿的連續(xù)時(shí)序性動(dòng)態(tài)監(jiān)測(cè)。
數(shù)據(jù)、算法和算力是人工智能的三要素。其中,算法是實(shí)現(xiàn)智能系統(tǒng)相關(guān)功能的關(guān)鍵,數(shù)據(jù)是構(gòu)建模型的重要基礎(chǔ)。在本研究中,由于團(tuán)隊(duì)設(shè)計(jì)開(kāi)發(fā)的栽培苜蓿智能感知系統(tǒng)的軟硬件尚處在測(cè)試期,缺乏基于這種系統(tǒng)多點(diǎn)位高時(shí)頻的栽培苜蓿草地觀測(cè)數(shù)據(jù),因此在苜蓿生物物理指標(biāo)反演模型構(gòu)建時(shí)使用了2018-2021 年研究團(tuán)隊(duì)在新疆、甘肅、內(nèi)蒙古和寧夏開(kāi)展的栽培苜蓿草地外業(yè)調(diào)查數(shù)據(jù)和無(wú)人機(jī)拍攝的圖像數(shù)據(jù)。另外,栽培苜蓿生物量還受氣候、土壤和人為等多種因素的影響。其中,氣候因素包括光照、氣溫和降水等;土壤因素則包括土壤營(yíng)養(yǎng)元素、土壤結(jié)構(gòu)以及肥力等;人為影響因素主要體現(xiàn)在灌溉、施肥、噴藥等一系列田間管理措施。為了提高反演精度,未來(lái)可以考慮氣候、土壤等變量參與模型的構(gòu)建,進(jìn)一步優(yōu)化栽培苜蓿草地關(guān)鍵生物物理指標(biāo)的反演效果。
本研究以新疆、內(nèi)蒙古、甘肅及寧夏4 省區(qū)栽培苜蓿為對(duì)象,利用無(wú)人機(jī)影像數(shù)據(jù)和多元線(xiàn)性回歸、深度學(xué)習(xí)算法和機(jī)器學(xué)習(xí)算法,結(jié)合我國(guó)北方4 省區(qū)的野外實(shí)測(cè)數(shù)據(jù),構(gòu)建了栽培苜蓿蓋度與產(chǎn)量的最優(yōu)估測(cè)模型,對(duì)比分析了反演模型的精度與實(shí)用性,為栽培苜蓿智能感知系統(tǒng)的數(shù)據(jù)在線(xiàn)實(shí)時(shí)分析提供了算法支持。主要得出以下結(jié)論:1)總體而言,我國(guó)新疆、甘肅河西等地區(qū)的栽培苜蓿以灌溉為主,地塊集中連片、地勢(shì)平坦,一年刈割3~4次,苜蓿草地在盛草期的平均產(chǎn)量和蓋度達(dá)5362.81 kg·hm-2、96.29%;以旱作生產(chǎn)方式為主的甘肅隴東、寧夏南部等地區(qū)的栽培苜蓿草地大多種植在山區(qū)水平梯田,一年刈割2~3 次,其盛草期的平均產(chǎn)量和蓋度達(dá)3987.57 kg·hm-2、91.55%;2)利用深度學(xué)習(xí)算法所構(gòu)建的蓋度模型R2達(dá)0.99,RMSE 為1.44%,模型準(zhǔn)確度為92%,對(duì)栽培苜蓿草地蓋度估測(cè)效果良好,對(duì)自動(dòng)化在線(xiàn)實(shí)時(shí)分析具有重要作用;3)在3 類(lèi)多元線(xiàn)性回歸模型中,基于環(huán)境因子(X、Y、h)、植物生物物理指標(biāo)(H、C、H×C)構(gòu)建的栽培苜蓿產(chǎn)量估測(cè)模型效果最佳,其測(cè)試集的R2達(dá)0.63,RMSE 為1218.15 kg·hm-2;4)與多元線(xiàn)性回歸模型相比,利用RF 機(jī)器學(xué)習(xí)方法構(gòu)建的栽培苜蓿產(chǎn)量的估測(cè)結(jié)果更好,其中,基于環(huán)境因子(X、Y、h)、植物生物物理指標(biāo)(H、C、H×C)構(gòu)建的RF 模型精度最高,其測(cè)試集的R2達(dá)0.69,RMSE 為1151.24 kg·hm-2,訓(xùn)練集的R2為 0.94,RMSE 為536.09 kg·hm-2。
算法是實(shí)現(xiàn)智能系統(tǒng)相關(guān)功能的關(guān)鍵,本研究基于U-net 深度學(xué)習(xí)算法構(gòu)建的蓋度模型與基于RF 機(jī)器學(xué)習(xí)方法構(gòu)建的栽培苜蓿產(chǎn)量估測(cè)模型的估測(cè)效果良好,可以為栽培苜蓿智能感知系統(tǒng)提供算法依據(jù),為栽培苜蓿蓋度及產(chǎn)量的實(shí)時(shí)、連續(xù)和智能監(jiān)測(cè)提供重要支撐。