摘 要:針對現(xiàn)有農(nóng)作物長勢監(jiān)測技術(shù)成本高、依賴特定傳感器硬件等問題,本文在現(xiàn)有農(nóng)業(yè)物聯(lián)網(wǎng)技術(shù)的基礎(chǔ)上,利用植物生長影響無線通信信號強(qiáng)度的特性,提出了一種利用物聯(lián)網(wǎng)接收信號強(qiáng)度指示(RSSI)結(jié)合環(huán)境數(shù)據(jù)估計(jì)甘蔗長勢的方法。基于ZigBee無線網(wǎng)絡(luò)搭建物聯(lián)網(wǎng)平臺,將物聯(lián)網(wǎng)平臺部署于大田中監(jiān)測甘蔗生長周期,獲取RSSI、株高等實(shí)驗(yàn)數(shù)據(jù),再利用機(jī)器學(xué)習(xí)方法構(gòu)建株高估計(jì)模型及比較驗(yàn)證。結(jié)果顯示:基于隨機(jī)森林的回歸模型的評價指標(biāo)優(yōu)于其他機(jī)器學(xué)習(xí)模型,決定系數(shù)(R2)為0.92,均方根誤差(RMSE)為20.97 cm,該方法可滿足農(nóng)業(yè)株高監(jiān)測的需要,為農(nóng)作物長勢監(jiān)測提供了一種低成本方案。
關(guān)鍵詞:甘蔗;長勢估計(jì);物聯(lián)網(wǎng);ZigBee;信號接收強(qiáng)度指示;CC2530
中圖分類號:TP202;S24 文獻(xiàn)標(biāo)識碼:A 文章編號:2095-1302(2024)04-0-04
DOI:10.16667/j.issn.2095-1302.2024.04.026
0 引 言
甘蔗是全球第一大糖料作物和第二大生物能源作物。廣西是國內(nèi)甘蔗生產(chǎn)主產(chǎn)區(qū),蔗糖業(yè)也是廣西重要的支柱產(chǎn)業(yè),其蔗糖產(chǎn)量自1992年至今已30多年位居全國第一[1]。然而,當(dāng)前廣西在甘蔗種植產(chǎn)業(yè)領(lǐng)域仍存在機(jī)械化利用率低,智能化管理欠缺等問題。因此,在甘蔗大田搭建物聯(lián)網(wǎng)系統(tǒng),實(shí)時監(jiān)測田間環(huán)境數(shù)據(jù)及氣象數(shù)據(jù),建立準(zhǔn)確的甘蔗長勢估計(jì)模型,對甘蔗生產(chǎn)和保障蔗糖供應(yīng)具有重要的意義。
以往測量農(nóng)作物的長勢主要是以實(shí)地測量為主,但這種長勢獲取方法往往費(fèi)時費(fèi)力。隨著近年來信息化水平的提高,一些新技術(shù)也運(yùn)用到農(nóng)作物長勢監(jiān)測領(lǐng)域。Chang等人[2]提出了一種基于無人機(jī)低空遙感監(jiān)測高粱作物高度的方法,使用無人機(jī)搭載專業(yè)RGB相機(jī),拍攝高粱作物的低空圖像,通過算法將圖像生成3D點(diǎn)云,從3D點(diǎn)云數(shù)據(jù)生成數(shù)字地形模型(DTM)和數(shù)字地表模型(DSM),然后利用DSM數(shù)據(jù)減去DTM數(shù)據(jù)得到作物高度。Kim等人[3]研究基于深度像機(jī),通過立體匹配將獲取的立體圖像轉(zhuǎn)換為視差圖,以確定相機(jī)和作物之間的距離深度,再通過像素的坐標(biāo)變換來計(jì)算作物高度。Banerjee等人[4]開發(fā)了一種集成于樹莓派平臺的激光雷達(dá)傳感器,將傳感器布置于農(nóng)作物正上方,通過雷達(dá)掃描的方式測量作物株高。Alighaleh等人[5]開發(fā)了一套測量農(nóng)作物高度的激光傳感器陣列,將激光傳感器陣列部署在可移動的支架上,通過移動掃描的方式測量小麥和水稻的株高。
以上農(nóng)作物長勢監(jiān)測研究已經(jīng)取得了一些階段性的成果,但是這些技術(shù)也存在造價昂貴或需要特定傳感器硬件支持等問題。近年來,隨著無線傳感器網(wǎng)絡(luò)技術(shù)研究的深入,對無線傳感器網(wǎng)絡(luò)信號傳播衰減規(guī)律的研究也成為一個新的研究方向。Luomala等人[6]研究了空氣溫度與濕度對無線信號強(qiáng)度的影響。張?jiān)起┑热薣7]設(shè)計(jì)了基于LoRa技術(shù)的農(nóng)業(yè)物聯(lián)網(wǎng)系統(tǒng),該系統(tǒng)通過對不同天氣、距離狀態(tài)下的接收信號強(qiáng)度指標(biāo)(Received Signal Strength Indication, RSSI)進(jìn)行分析,確認(rèn)了利用RSSI值預(yù)測甘蔗長勢的可行性。Bauer等人[8]研究了以葉面積指數(shù)(LAI)為代表的作物長勢與無線收發(fā)器信號傳播衰減之間的關(guān)系,證明LAI和接收信號強(qiáng)度指標(biāo)(RSSI)時間序列之間存在顯著相關(guān)性,綜合氣象因素構(gòu)建了一個估計(jì)LAI的多元線性模型。本文基于ZigBee無線傳輸技術(shù)搭建大田物聯(lián)網(wǎng)系統(tǒng),通過該系統(tǒng)采集各末端節(jié)點(diǎn)的接收信號強(qiáng)度指示(RSSI)數(shù)據(jù),并結(jié)合環(huán)境數(shù)據(jù)構(gòu)建甘蔗長勢估計(jì)模型,提供了一種新的甘蔗株高監(jiān)測方法。
1 材料與方法
1.1 研究區(qū)域概況
本研究試驗(yàn)地點(diǎn)位于廣西大學(xué)扶綏農(nóng)科新城甘蔗試驗(yàn)田(22°3035.9 N,107°4638.7 E),該地區(qū)屬亞熱帶季風(fēng)型氣候,夏季高溫多雨,光熱充足,春季溫暖濕潤、秋季干燥少雨,冬季短促氣溫較低,適宜種植甘蔗[9]。一般甘蔗生長分為5個時期,萌芽期(3~4月)、幼苗期(4~5月)、分蘗期(5~6月)、伸長期(6~10月)、成熟期(10~12月),本研究主要針對甘蔗的伸長期和成熟期。
1.2 甘蔗物聯(lián)網(wǎng)環(huán)境監(jiān)測系統(tǒng)總體架構(gòu)
本文設(shè)計(jì)的農(nóng)業(yè)物聯(lián)網(wǎng)系統(tǒng)架構(gòu)主要包括信息感知層、網(wǎng)絡(luò)層和應(yīng)用層,其主要功能模塊包括田間環(huán)境監(jiān)測模塊、云服務(wù)存儲模塊及上位機(jī)數(shù)據(jù)監(jiān)測模塊等,農(nóng)業(yè)物聯(lián)網(wǎng)系統(tǒng)總體架構(gòu)如圖1所示。末端節(jié)點(diǎn)裝有收集環(huán)境信息的傳感器,將收集的環(huán)境數(shù)據(jù)以ZigBee數(shù)據(jù)包的方式發(fā)送至協(xié)調(diào)器節(jié)點(diǎn);協(xié)調(diào)器節(jié)點(diǎn)接收數(shù)據(jù)后記錄本次通信的信號強(qiáng)度指示(RSSI)值,通過4G-LTE網(wǎng)關(guān)模塊發(fā)送至上位機(jī);上位機(jī)部署在阿里云服務(wù)器中,采用TCP/IP協(xié)議同網(wǎng)關(guān)連接,將接收的數(shù)據(jù)存儲到數(shù)據(jù)庫,通過網(wǎng)頁提供數(shù)據(jù)查詢及可視化展示。
系統(tǒng)的硬件部分由微處理器模塊、網(wǎng)關(guān)模塊、電源模塊組成,其中,微處理器模塊選用TI(德州儀器)出品的CC2530芯片作為主控芯片,其內(nèi)置ZigBee協(xié)議無線射頻模組,I/O接口充足、運(yùn)算能力強(qiáng)、功耗水平低,符合農(nóng)業(yè)物聯(lián)網(wǎng)的實(shí)際要求;網(wǎng)關(guān)模塊選用WH-LTE-7S4的4G-LTE透傳模塊,該模塊支持多種寬幅電壓輸入方式,待機(jī)功耗低,能滿足試驗(yàn)要求。此外,田間環(huán)境監(jiān)測模塊還設(shè)置了一個天圻氣象站,采集甘蔗生長環(huán)境的溫濕度、風(fēng)速、風(fēng)向、雨量、太陽輻射強(qiáng)度等信息。
1.3 數(shù)據(jù)獲取與處理
本試驗(yàn)于2021年6月21日至12月15日將農(nóng)業(yè)物聯(lián)網(wǎng)系統(tǒng)部署于廣西大學(xué)扶綏農(nóng)科新城甘蔗試驗(yàn)田中,系統(tǒng)共設(shè)置了6個ZigBee節(jié)點(diǎn),包括1個協(xié)調(diào)器點(diǎn)、5個末端節(jié)點(diǎn)。節(jié)點(diǎn)布置位置如圖2所示。水平于甘蔗種植方向布置的是1、2號末端節(jié)點(diǎn),分別與協(xié)調(diào)器節(jié)點(diǎn)間隔5 m、10 m處;垂直于甘蔗種植方向布置的是3、4、5號末端節(jié)點(diǎn),分別與協(xié)調(diào)器節(jié)點(diǎn)間隔5 m、10 m、15 m。
系統(tǒng)設(shè)置各ZigBee末端節(jié)點(diǎn)每隔60 min以3 dBm的發(fā)射功率向協(xié)調(diào)器節(jié)點(diǎn)發(fā)送環(huán)境數(shù)據(jù)。協(xié)調(diào)器節(jié)點(diǎn)接收后記錄每次通信的RSSI數(shù)據(jù)。試驗(yàn)期內(nèi),共獲取RSSI數(shù)據(jù)29 951條。
本研究以株高作為模型因變量,株高真值采集的方法:在2個相鄰末端節(jié)點(diǎn)間選取5株具有代表性的甘蔗,利用株高尺測量甘蔗植株基底部至最高可見肥厚帶的高度,將采集的株高數(shù)據(jù)取平均值作為該區(qū)域的株高真值。在試驗(yàn)周期內(nèi),測量時間為7天一次,共測得株高真值數(shù)據(jù)115份。為匹配農(nóng)業(yè)物聯(lián)網(wǎng)系統(tǒng)的60 min采集周期,本文假設(shè)甘蔗株高在每個測量周期內(nèi)呈均勻線性變化,使用線性插值法得到以小時為周期的株高真值20 150份。
為提高建模精度,建立的模型需要考慮環(huán)境變量對接收信號強(qiáng)度(RSSI)的影響。系統(tǒng)設(shè)置了一個氣象環(huán)境監(jiān)測站,提供每小時的空氣溫度、相對濕度、土壤溫度、雨量、太陽輻射強(qiáng)度、大氣壓力和風(fēng)向等氣象數(shù)據(jù)。除這些氣象因素外,節(jié)點(diǎn)間的距離也對RSSI的大小產(chǎn)生影響。因此,本次試驗(yàn)還引入了末端節(jié)點(diǎn)與協(xié)調(diào)器節(jié)點(diǎn)的水平距離D1和垂直距離D2用于建立模型。這樣可以更全面地考慮環(huán)境因素和節(jié)點(diǎn)距離對RSSI的影響,從而提高建模的精度。
將采集的20 150份數(shù)據(jù)樣本剔除有空值、異常值的數(shù)據(jù)后,剩余15 541份樣本。按照7∶3的方法隨機(jī)抽樣,最后得到訓(xùn)練樣本10 878份、測試樣本4 663份。用多種機(jī)器學(xué)習(xí)模型建模方法進(jìn)行比較驗(yàn)證,得到最優(yōu)的株高估計(jì)模型。模型建立的總體路線如圖3所示。
1.4 模型預(yù)測精度評價指標(biāo)
本研究選擇決定系數(shù)(R2)、均方根誤差(RMSE)作為評判模型擬合和預(yù)測準(zhǔn)確度的評價指標(biāo)。其公式為:
(1)
(2)
式中:n為樣本數(shù);yiobs為株高實(shí)際值;yipre為株高模型估計(jì)值;yavg為實(shí)測株高樣本均值。上述值的單位均為厘米(cm)。R2越大RMSE值越小,表示模型預(yù)測的效果越好。
2 結(jié)果與討論
2.1 RSSI與株高相關(guān)性分析
5個末端節(jié)點(diǎn)RSSI周平均值與周平均株高的時間序列如圖4所示??煽闯觯?、2號節(jié)點(diǎn)的信號衰減相較于3、4、5號更快,推測原因是由于節(jié)點(diǎn)布置的方向不同,在節(jié)點(diǎn)信號傳播路徑內(nèi),水平于甘蔗種植方向布置的節(jié)點(diǎn)相較于垂直布置的節(jié)點(diǎn)經(jīng)過的甘蔗葉片數(shù)量更多,所以受到信號干擾的強(qiáng)度更大。單獨(dú)對比1號與3號節(jié)點(diǎn)、2號與4號節(jié)點(diǎn)數(shù)據(jù)也能發(fā)現(xiàn)相同規(guī)律,距離協(xié)調(diào)器節(jié)點(diǎn)距離相同的2個節(jié)點(diǎn),垂直于種植方向布置的節(jié)點(diǎn)信號值始終高于水平布置的節(jié)點(diǎn)。橫向?qū)Ρ裙?jié)點(diǎn)的RSSI與甘蔗平均株高可看出,在甘蔗伸長期內(nèi),甘蔗株高快速增高,同時各節(jié)點(diǎn)的RSSI值快速下降;在甘蔗成熟期后,甘蔗的株高上升變緩,而各節(jié)點(diǎn)RSSI卻小幅上升。主要原因是甘蔗進(jìn)入成熟期后,葉片干枯掉落,對信號的遮擋減少,從而導(dǎo)致RSSI值上升。由此可見,甘蔗的葉子、莖干等生物組織可以對無線信號產(chǎn)生一定的衰減作用。當(dāng)植物生長茂密時,物聯(lián)網(wǎng)節(jié)點(diǎn)的無線信號在傳播路徑內(nèi)可能會受生物組織吸收、散射或反射的影響,導(dǎo)致信號強(qiáng)度下降。
2.2 基于隨機(jī)森林的株高估計(jì)模型的建立
隨機(jī)森林(Random Forests, RF)是由Breiman于2001年
提出的一種集成算法[10],通過生成多棵決策樹,再通過某種集成策略進(jìn)行組合,輸出最終結(jié)果。根據(jù)決策類型的不同可以分為分類和回歸兩種模型,其中分類型RF是根據(jù)不同決策樹的分類結(jié)果進(jìn)行投票表決以決定最終分類,回歸型RF的決策結(jié)果是根據(jù)不同決策樹的決策結(jié)果取平均值進(jìn)行決策。其訓(xùn)練方式是從訓(xùn)練樣本進(jìn)行bootstrap抽樣,即隨機(jī)且有放回的抽樣。再根據(jù)每個不同的抽樣結(jié)果各生成一棵決策樹,通過重復(fù)以上步驟m次生成m棵決策樹組成隨機(jī)森林。隨機(jī)森林的實(shí)質(zhì)是一種加強(qiáng)版的決策樹,將多個決策樹組合在一起,能夠減少隨機(jī)誤差帶來的影響,使得隨機(jī)森林算法具有很強(qiáng)的抗噪能力,在多個領(lǐng)域都有廣泛應(yīng)用。
在隨機(jī)森林建模的過程中需要設(shè)置的關(guān)鍵參數(shù)有決策樹數(shù)量、每棵樹的最大深度。理論上,決策樹的數(shù)量越大,模型的預(yù)測精度越高;每棵樹的最大深度越深,模型的預(yù)測誤差越小。但是決策樹的數(shù)量越大,深度越深占用的內(nèi)存與訓(xùn)練和預(yù)測時間也會相應(yīng)增加。為了尋求最優(yōu)參數(shù),在建模時逐一嘗試n_estimators與max_depth參數(shù),計(jì)算模型測試集與訓(xùn)練集的決定系數(shù)R2與均方根誤差RMSE,結(jié)果如圖5所示。從圖中可以看出,當(dāng)決策樹數(shù)量達(dá)到100、決策樹最大深度達(dá)到25后,模型的R2與RMSE趨于穩(wěn)定。因此,將n_estimators設(shè)置為100,max_depth
設(shè)置為25。
基于隨機(jī)森林回歸模型的預(yù)測結(jié)果如圖6所示。訓(xùn)練集的均方根誤差RMSE為7.85,決定系數(shù)R2為0.988 9;測試集的均方根誤差RMSE為20.97,決定系數(shù)R2為0.921 6。
2.3 幾種回歸模型預(yù)測結(jié)果比較
為了評估隨機(jī)森林回歸模型的精度,基于決定系數(shù)(R2)、均方根誤差(RMSE)指標(biāo),與其他幾種常見的機(jī)器學(xué)習(xí)算法進(jìn)行對比,結(jié)果見表1所列。從結(jié)果中可以看出,隨機(jī)森林回歸模型取得了最高的預(yù)測精度,模型的各項(xiàng)指標(biāo)均優(yōu)于其他幾種回歸模型。綜上所述,隨機(jī)森林算法構(gòu)建的甘蔗株高估計(jì)模型有更好的預(yù)測能力和泛化能力。
2.4 討論
本文研究了甘蔗大田環(huán)境中ZigBee無線信道通信的接收強(qiáng)度指示(RSSI)與甘蔗株高的回歸模型。對于甘蔗而言,在伸長期內(nèi)甘蔗的株高會不斷增高,甘蔗的枝葉也變得更為茂盛,由植株引起的通信信號散射與反射更強(qiáng)烈,從而導(dǎo)致信號強(qiáng)度(RSSI)下降;在甘蔗進(jìn)入成熟期后,葉子會隨著甘蔗果肉的成熟自然枯萎變黃掉落,使得信號強(qiáng)度(RSSI)上升。在大田復(fù)雜環(huán)境中,引起RSSI變化的因素不僅有株高變化,空氣溫濕度、風(fēng)速風(fēng)向都能使得信號值有不同程度的衰減。因?yàn)椴煌蛩貙?dǎo)致RSSI波動難以量化,所以本文采用機(jī)器學(xué)習(xí)的方式聯(lián)合多個影響因素共同建立株高估計(jì)模型,建立的模型具有較強(qiáng)的適應(yīng)性和準(zhǔn)確度。
3 結(jié) 語
(1)文中設(shè)計(jì)了1套基于ZigBee技術(shù)的物聯(lián)網(wǎng)環(huán)境信息采集系統(tǒng),實(shí)現(xiàn)了對蔗田溫濕度、風(fēng)速、雨量、光照強(qiáng)度等環(huán)境信息的實(shí)時監(jiān)測與上傳,可實(shí)時獲取各節(jié)點(diǎn)的RSSI值。
(2)將物聯(lián)網(wǎng)節(jié)點(diǎn)部署于試驗(yàn)地內(nèi),采集了2021年
6月至12月甘蔗伸長期與成熟期的環(huán)境信息,試驗(yàn)周期內(nèi)共采集有效實(shí)驗(yàn)數(shù)據(jù)15 541條。
(3)本文構(gòu)建的隨機(jī)森林株高估計(jì)模型的R2最高為0.92,RMSE為20.97 cm,相較于其他機(jī)器學(xué)習(xí)算法,更能滿足農(nóng)業(yè)株高監(jiān)測的需要,為農(nóng)業(yè)生產(chǎn)指導(dǎo)提供決策依據(jù)。
注:本文通訊作者為李修華。
參考文獻(xiàn)
[1]莫般. 廣西甘蔗“雙高”建設(shè)探討[J]. 南方農(nóng)業(yè),2017,11(27):69-70.
[2] CHANG A,JUNG J,MAEDA M M,et al. Crop height monitoring with digital imagery from unmanned aerial system(UAS)[J]. Computers and electronics in agriculture,2017,141:232-237.
[3] KIM W,LEE D,KIM Y,et al. Stereo-vision-based crop height estimation for agricultural robots [J]. Computers and electronics in agriculture,2021,181:105937.
[4] BANERJEE B P,SPANGENBERG G,KANT S. CBM:An IoT enabled LiDAR sensor for In-Field crop height and biomass measurements [J]. Biosensors,2022,12(1):16.
[5] ALIGHALEH P,GUNDOSHMIAN M T,ALIGHALEH S,et al. Feasibility and reliability of agricultural crop height measurement using the laser sensor array [J]. Information processing in agriculture,2023.
[6] LUOMALA J,HAKALA I. Effects of temperature and humidity on radio signal strength in outdoor wireless sensor networks [C]// 2015. Polish Information Processing Society (PIPS),2015.
[7]李修華,張?jiān)起钔?,? LoRa物聯(lián)網(wǎng)設(shè)計(jì)及其甘蔗生物量預(yù)測可行性研究[J]. 農(nóng)業(yè)機(jī)械學(xué)報,2019,63(s1):228-232.
[8] BAUER J,ASCHENBRUCK N. Towards a low-cost rssi-based crop monitoring [J]. ACM transactions on internet of things,2020,1(4):1-26.
[9]馮振家. 影響武鳴縣甘蔗生產(chǎn)的氣象條件分析[J]. 氣象研究與應(yīng)用,2011,32(3):49-52.
[10] BREIMAN L. Random forests [J]. Machine learning,2001,45(1):5-32.
收稿日期:2023-04-13 修回日期:2023-05-17
基金項(xiàng)目:廣西重大科技專項(xiàng):廣西數(shù)字蔗田技術(shù)平臺的構(gòu)建與應(yīng)用示范(桂科AA22117004);廣西重大科技創(chuàng)新基地建設(shè)項(xiàng)目:廣西甘蔗生物學(xué)重點(diǎn)實(shí)驗(yàn)室(桂科2018-266-Z01);國家自然科學(xué)基金:低空航拍圖像融合田間環(huán)境及氣象信息立體構(gòu)建甘蔗長勢、品質(zhì)及產(chǎn)量預(yù)測模型(31760342)