張皓婷 李明 薛海峰 圖拉 李敏 閆鳳 祝鵬
摘要 本試驗以番茄為材料,在施用不同量的有機肥下,對基于機器學習的番茄果實識別和產量估算進行了深入研究和綜合評價。通過重復訓練、驗證、分析,得出基于Faster R-CNN網絡模型在番茄果實識別模型的準確率為90.89%,準確率較高;結合運用圖像識別測算得的產量與番茄不同施肥量處理實際測產誤差較大,實際運用效果相對較差;4種不同施肥量設置對番茄的結果數、識別數和產量的影響都高于對照處理,實際生產施用有機肥4 500 kg/hm2效果最好?;贔aster R-CNN網絡模型的番茄數據集的測試結果效果較好,識別準確率較高,可作為其他指標測定的基礎。
關鍵詞 機器學習;Faster R-CNN;番茄識別;產量估算
中圖分類號 TP181;S641.2? ?文獻標識碼 A
文章編號 1007-7731(2023)10-0136-04
番茄是我國設施栽培的主要蔬菜作物之一[1]。為能夠四季供應新鮮番茄,番茄以設施保護栽培為主以達到周年供給的目的。目前,活性有機肥被大面積使用,可提高土壤供肥能力,促進有機質分解和團粒結構[2]形成,可明顯提高番茄產量。番茄產量測定是番茄生產中衡量經濟效益的關鍵指標[3],設施番茄人工測量番茄生長的各項生理指標中存在測量精度、準確度不高和實用性差等問題。機器學習[4](Machine Learning,ML)是人工智能的核心,使計算機模擬人類的學習活動,不斷學習已有知識、獲取新知識,逐步實現設施生產系統(tǒng)的改進與完善;利用現代最新信息技術和手段,通過對數據深度挖掘、融合、分析和人工智能決策,可促進基于機器學習與設施番茄的生產進行智能又精確的識別與估算方面研究;進而有效促進番茄生產,提高品質產量和減少資源浪費。利用深度學習技術進行番茄產量的預測和估算,通過設計番茄果實特有的顏色、紋理、形狀以及空間方向特征屬性[5],從背景枝葉中分離出番茄果實,然后再采用基于區(qū)域和計數的方法對產量進行估計[6],用基于Faster R-CNN網絡模型的訓練模型識別出的番茄果數的計數方法來預測番茄的數量。本試驗設計基于Faster R-CNN網絡模型對番茄果實的識別,并提出了基于果實識別方法將不同施肥量與產量的關系構建相關系數,在盡可能提高準確率的同時有效提高測量效率,以期實現機器學習對作物的識別與產量的預測,為豐富和優(yōu)化設施番茄栽培生產提供一定的參考。
1 材料與方法
1.1 試驗材料
品種:草莓番茄。材料:拍攝設備(vivo手機)、溫度傳感器、濕度傳感器、光照傳感器、CO2傳感器。試驗平臺:本文所有試驗均在Win10系統(tǒng)計算機64位操作系統(tǒng)Ubuntu16.04下完成。
1.2 試驗方法
試驗采用隨機區(qū)組,番茄幼苗5月6日定植,種植密度為27 700株/hm2,每個處理小區(qū)面積20 m2,重復3次;設置4種不同施肥量處理,依次為施用有機肥1 500、3 000、4 500、6 000 kg/hm2,各處理依次標記為A1、A2、A3和A4,將未施肥處理設置為對照(CK),共計5個處理,并在每種處理中加入等量腐殖酸水溶肥(300 L/hm2),其余田間管理措施一致。各項數據在番茄生長期間測定,每個處理隨機測量10株,并計算平均值。測量番茄的小花數、花序數、單株結果數、單果重、單株產量,在番茄苗期、結果前期、結果中期和結果后期分別進行圖像采集。
圖像采集及數據集制作方法:先在田間光線良好條件下采集圖片,然后將拍攝的原始圖像進行處理、縮小、標注,將數據整理成為數據集;該數據集為番茄目標檢測數據集,其中共有600張訓練樣本圖像和400張測試樣本圖像,自制的VOC格式的數據集中只包含1種帶標簽的待測目標,使用 Faster-RCNN 模型進行訓練,以得出測定數據和相應結果。
2 結果與分析
2.1 Faster R-CNN模型對番茄果實識別檢測結果
本文運行的faster R-CNN網絡模型學習率(lr=0.001)設為0.001,Batch size為64,dropout參數設為0.5。通過Faster R-CNN網絡模型對數據集的運行訓練、測試和驗證,得出數據。
Faster R-CNN網絡模型的結構主要是由2個網絡組成,損失函數分為4個部分,4個損失相加得出最后的損失,即訓練結果得出損失率0.233 929 117;訓練過程不斷地反向傳播和更新參數,經過對數據集在Faster R-CNN網絡模型上多次訓練的分類回歸,發(fā)現不同施肥量處理番茄識別檢測訓練的損失曲線高度一致,且總損失率幾乎相同;由數據可知,同一模型訓練多次的回歸損失函數值是近似相同的,且目前訓練的損失率相對較小。Faster R-CNN網絡模型中進行的函數運行、檢測、計算得出mAP值。
Faster R-CNN網絡模型訓練完成后測試集的mAP值為0.908 9;以采集的4種不同施肥量(A1、A2、A3和A4。)處理及對照(CK)處理的番茄果實圖像作為驗證,經過變次運行得到的mAP值為0.908 68~0.908 95,即可得出測試集的檢測準確率為90.89%。綜上得出,Faster R-CNN網絡模型在訓練樣本時,損失函數的下降速度快且變化幅度小,測試準確率曲線先下降再上下震蕩然后趨于平緩,Faster R-CNN網絡模型檢測番茄果實的損失率及準確率曲線波動幅度小,且Faster R-CNN網絡模型測試準確率較高;Faster R-CNN網絡模型在不同施肥量處理的番茄果實檢測方面,準確率為90.89%,檢測效果較好。
2.2 不同施肥量處理結果數間的數據比較
經過Faster R-CNN網絡模型運行番茄果實圖像和識別檢測,對4種不同施肥量處理(A1、A2、A3、A4)和對照(CK)處理進行識別數的比較。
4種不同施肥量處理和對照處理間的Faster R-CNN網絡模型識別結果數:A3的識別結果數最多,A4次之,其次為A2和A1,CK最少。為驗證結果的其可靠性,與實際測量的數據相比,識別結果數與實際單次測量結果數基本吻合。對實際測量的不同處理間的數據進行比較,單次測定的番茄結果數依然是A3的識別結果數和實際測量結果數最多,A4次之,其次為A2、A1,CK最少,由此可以得出在實際生產中施用有機肥4 500 kg/hm2的效果最好、識別數和實際結果數最多,施用有機肥6 000 kg/hm2的效果次之,不施肥料的效果最差。Faster R-CNN網絡模型識別效果較好。
2.3 不同施肥量處理識別結果數與實際結果數驗證
2021年6月11日至8月10日,對不同施肥量處下的番茄采集圖像數據,并對設施番茄產量檢測識別和預測進行驗證。為排除偶然誤差,先利用2021年6月11日至8月10日期間的一部分數據進行訓練、驗證和測試3次參數辨識,后利用Faster R-CNN網絡模型對2021年6月11日至8月10日期間的相應數據在不同施肥量處理的番茄識別數和實際生產測量數據進行預測比較,對單株測定值取平均,結果如圖1所示。
由圖1可看出,4種不同施肥量處理的番茄結果數均高于對照處理,經過3次測定和模型運算,A3的識別結果數和實際結果數最多,其次是A4、A2、A1,CK最少。
2.4 番茄產量估算
使用Faster R-CNN網絡模型對番茄果實圖像樣本進行訓練,獲取訓練過程準確率數據并對數據集做訓練和預測。通過訓練過程檢測識別出的番茄果實數預測結果數量,再依據模型識別出的數量、矩形標注框的大小和相應矩形內的果實,進而估算產量。即Faster R-CNN網絡模型檢測出圖像中每個番茄果實的真實邊界框體積和正切圓體積構建的系數約0.523。采用單株產量=每穗果數(Faster R-CNN網絡模型的單張圖片識別數)×每株穗數×單果重或實際測量值做驗證。
通過在網絡模型中的多次訓練、測試和驗證,得出番茄的結果數據,將檢測出的番茄果實數與構建系數相乘,得出預測產量,并與實際生產測得的產量數據進行比較。
依據Faster R-CNN網絡模型檢測出的番茄結果數據計算得出預測產量1、2,與實際生產測得的產量數據進行比較。由圖2可以看出,預測1和預測2與實際測量相比,分別低于實際測量33.30%和25.00%。由于目前是初次使用這種方式對產量進行預測和估算,在圖片拍攝距離、角度、方向上還尚未標準化,標記部分重疊及果實之間相互遮擋均可能對估測值有較大的影響。雖然使用基于Faster R-CNN網絡模型果實識別方法與產量構建的估測系數能預測番茄產量,但實際測量值更接近按單株產量計算得出的產量,故未對不同施肥量處理的預測進行比較。基于Faster R-CNN網絡模型果實識別方法與產量構建的估測系數預測不同施肥量處理的番茄產量在后續(xù)試驗中有待進一步提高。
3 討論
孫素云等[7]收集了蘋果樹葉病害圖像,對原始樣本先進行直方圖均衡化、濾波,再利用閾值分割算法分割圖像獲得病害區(qū)域,繼而獲取該區(qū)域的顏色和紋理特征,最后用SVM建立模型獲得分類的準確率為92.68%。本試驗運用的Faster R-CNN網絡模型在不同施肥量處理的番茄果實檢測方面,準確率為90.89%,有待繼續(xù)改進;與實際測量值對比也需進一步提高。鄧賡[8]基于機器視覺提出了一種串—粒融合的兩階段葡萄產量預測框架,先利用目標檢測器進行葡萄串定位,在經改進的網絡模型進行葡萄計數,并將這2個階段互相融合起來,實現葡萄產量預測,提高了產量預測的準確性。張立彬等[9]利用改進的退火粒子群算法構建了一種機理模型和參數辨識相結合的溫室番茄產量預測模型,該優(yōu)化模型預測的總產量與實際測量總產量的相對誤差為2.20%,總產量的預測精度高達97.80%。本試驗結果表明,基于機器學習中Faster R-CNN網絡的番茄識別2次預測方式和實際測量值相比,預測值顯著低于實際測量的產量值,分別比實際測量低33.30%和25.00%。學者們認為利用機器學習技術在產量預測方面,機器學習結合遙感技術和粒子群算法進行的預測更接近實際產量,也存在環(huán)境不穩(wěn)定影響產生一定的誤差。本試驗中,由于標記部分重疊和果實之間相互遮擋,以及在圖片拍攝方面也可能存在距離、角度、方向上不標準,這些因素均可能對估測值造成一定的影響,所以基于Faster R-CNN網絡模型果實識別方法與產量構建的估測系數預測番茄產量在后續(xù)試驗Faster R-CNN網絡模型中有待進一步的優(yōu)化。
4 結論
本次試驗利用機器學習下的Faster R-CNN網絡模型對番茄種植過程中4種不同施肥量處理A1、A2、A3、A4和對照(CK)處理圖像數據樣本進行番茄果實目標檢測,準確率為90.89%;識別結果數與實際測量結果數比較得出,A3的識別結果數和實際測量結果數最多,A4次之,其次為A2和A1,未施用有機肥CK最少;預測結果數與實際測量的結果數基本吻合。在基于模型構建的果實識別與產量的相關系數的預測方法中,第一次預測、第二次預測和實際測量值相比,預測值顯著低于實際測量的產量值。
機器學習算法在識別中表現精度較高,最近幾年,由于人工智能的不斷發(fā)展與完善,采用機器學習的方法進行作物的識別和產量的預測有了新的進展,機器學習的預測精度也在不斷提升。利用機器學習下的Faster R-CNN網絡模型進行目標檢測可為農業(yè)領域其他方面提供指標測定基礎。目前基于模型構建的果實識別與產量的相關系數的預測方法中,在圖片拍攝方面可能存在距離、角度、方向上的不標準,以及標記部分重疊和果實之間相互遮擋均可能對估測值造成一定的影響,所以在后續(xù)的試驗中還需進一步的研究和優(yōu)化。
參考文獻
[1] 陳杏禹.蔬菜栽培[M].北京:高等教育出版社, 2015.
[2] 楊志臣,呂貽忠,張鳳榮,等. 秸稈還田和腐熟有機肥對水稻土培肥效果對比分析[J].農業(yè)工程學報,2008(3):214-218.
[3] 王振華,陳瀟潔,呂德生,等.水肥耦合對加氣滴灌加工番茄產量及品質的影響[J].農業(yè)工程學報,2020,36(19):66-75.
[4] 陳凱,朱鈺.機器學習及其相關算法綜述[J].統(tǒng)計與信息論壇,2007(5):105-112.
[5] 張燕,田國英,楊英茹,等.基于SVM的設施番茄早疫病在線識別方法研究[J].農業(yè)機械學報,2021,52(S1):125-133,206.
[6] 鄭太雄,江明哲,馮明馳.基于視覺的采摘機器人目標識別與定位方法研究綜述[J].儀器儀表學報,2021,42(9):28-51.
[7] 孫素云.基于圖像處理和支持向量機的蘋果樹葉部病害的分類研究[D]. 西安:西安科技大學,2017.
[8] 鄧賡.基于機器視覺的葡萄產量預估模型關鍵技術研究[D]. 成都:四川大學,2022.
[9] 張立彬,應建陽,陳教料.基于IPSO-SA算法的溫室番茄產量預測方法[J].浙江工業(yè)大學學報,2019,47(5):527-533.
(責編:何 艷)