梁鑫婕,李衛(wèi)東,孟凡謙,張海嘯,李志偉,秦丹陽
(1.河南工業(yè)大學信息科學與工程學院,河南 鄭州 450001;2.中國海洋大學海洋技術學院,山東 青島 266000)
土壤水分的測量對于維持作物的正常生長以及提高作物的經濟效益具有重大意義,以往傳統(tǒng)的對于土壤水分進行預測的方法是根據經驗公式進行計算,其參數是固定的,不具備實時性的特點,無法滿足對土壤水分含量的動態(tài)預測,隨著科技快速發(fā)展和我國對農業(yè)的結構化調整,對土壤水分預測的動態(tài)實時性要求體現出來。因此,通過實現對土壤水分的動態(tài)預測進一步實現對作物的科學供水,對實現精準農業(yè)具有重要意義[1-10]。
本研究使用爬蟲程序從中國天氣網獲取2018年10月1日—2019年7月10日的歷史氣象數據,通過土壤墑情檢測儀獲取2018年10月1日—2019年7月10日期間的相關土壤數據,將土壤數據及氣象數據合并作為本研究所使用的實驗數據。由于以往研究者對于相關實驗的研究表明,受氣象因素影響的主要為土壤的地表表面含水量,因此,課題組不再研究地表以下的土壤含水量,僅研究地表含水量,將兩部分數據結合整理后總數據量為6 796條,部分數據如表1所示。
對原始數據進行預處理,為本研究中用到的神經網絡預測模型構建訓練數據集,對于數據中存在的部分缺失值進行補零替換,使用MinMaxScaler函數對補零后的數據進行歸一化處理,特性范圍為0~1。從總數據中分離出300條作為本實驗的測試集,對于獲得的全體數據進行歸一化處理,有效保留了數據的周期和范圍信息。數據預處理后的部分數據如表2所示。
表2 預處理結果數據示例表
BP神經網絡是一種按照誤差逆向傳播算法訓練的多層前饋神經網絡,基本BP算法包含前向傳播和誤差的反向傳播這兩個過程。計算誤差按輸入到輸出的方向進行前向傳播,調整權值和閾值則是反向傳播。BP神經網絡結構圖如圖1所示。
圖1 BP神經網絡結構圖
將收集的處理后的訓練數據動態(tài)地傳入BP神經網絡模型中,不斷優(yōu)化權重文件參數,根據上一時段的傳感器實測土壤含水量數據輸入預測程序,就可實現基于BP網絡模型的土壤含水量動態(tài)預測。
循環(huán)神經網絡(recurrent neural network)的基本架構包含輸入層、輸出層和隱含層。循環(huán)神經網絡(RNN)是傳統(tǒng)前饋神經網絡的一個變種,引入了環(huán)狀結構,在神經元和自身之間建立連接,使得前一時序的信息可存儲并影響下一步網絡輸出。RNN挖掘數據中的時序信息以及語義信息的深度表達能力被充分利用,并在語音識別、語言模型、機器翻譯以及時序分析等方面實現了突破。本研究將此模型用于在時間上動態(tài)地預測土壤含水量。循環(huán)神經網絡會記憶之前的信息,并利用之前的信息影響后面結點的輸出。RNN網絡結構圖如圖2所示。
圖2 RNN網絡結構圖
本研究中土壤含水量預測模型使用均方根誤差(RMSE)、預測準確率以及可決系數R2評估模型優(yōu)劣。均方根誤差公式如下:
式中,n表示測量次數,di為一組測量值與真值的偏差。
傳統(tǒng)的土壤含水量預測模型是根據以往的測量數據進行公式推導,主要使用經驗預測公式計算,參數固定。如圖3所示,是選取部分真實值和預測值進行對比所得到的傳統(tǒng)土壤水分預測結果示例圖。由圖3可以看出傳統(tǒng)的對于土壤水分的預測方法與實際值存在一定的偏差。
圖3 傳統(tǒng)土壤水分預測結果示例圖
課題組使用BP神經網絡構建不同小時尺度的土壤含水量預測模型,分別建立1 h和4 h預測模型用于檢驗不同模型之間的差異。對訓練組數據進行訓練得到權重文件,預測未來1 h和4 h土壤含水量,部分預測數據與實際值如表3所示。
表3 BP神經網絡預測數據表
由上表可以看出隨時間尺度的增加,BP神經網絡預測模型的預測精度有所降低,圖4為模型擬合過程。圖4(a)為1 h模型的擬合過程,圖4(b)為4 h模型的擬合過程。
圖4 BP模型訓練圖
本研究使用RNN建立不同的小時尺度土壤含水量預測模型,分別建立1 h、2 h、3 h、4 h預測模型,對不同模型的結果進行詳細分析,部分測試結果數據如表4所示。
表4 RNN預測結果示例表
各模型訓練過程圖如圖5所示,圖中(a)、(b)、(c)、(d)分別為1 h、2 h、3 h、4 h預測模型的訓練過程。各模型預測評估結果如表5所示,由表5可以看出使用傳統(tǒng)公式法對土壤含水量進行預測的準確率僅為54.3%,均方根誤差為5.548,可決系數僅為0.023,表明數據離散程度較高。而且傳統(tǒng)土壤水分含量預測公式為逐日遞推公式,公式魯棒性差,預測出來的數據結果不具備可靠性。
圖5 RNN模型訓練圖
表5 預測結果評估表
相較傳統(tǒng)預測公式方法,BP神經網絡預測模型可根據學習過程中動態(tài)輸入的影響因子預測土壤的含水量,對后1 h土壤含水量情況進行精確預測,結果離散程度大幅降低,模型帶來的優(yōu)化效果顯著,可決系數由原來的0.023提升至0.926。但是此模型在增加預測的時間間隔后數據準確率有明顯下降,由原來的96.5%下降至95.9%,均方根誤差由原來的0.328升高至0.891,可決系數由0.926降至0.499,降低0.427。
相較于BP神經網絡模型,RNN土壤含水量預測模型的離散程度更低,RMSE降低至0.306,真實數據與預測數據的誤差較小,可決系數升高至0.941,易得RNN模型對于土壤含水量的動態(tài)預測具有更好的效果。且RNN對于不同時間尺度的預測都保持較高的準確率,均在96%以上。本研究可以得出隨著預測時間尺度的增加,BP神經網絡和RNN模型預測數據的離散程度及相似程度均有所下降,RNN動態(tài)預測模型對比BP神經網絡算法有更大的優(yōu)勢,RMSE上升幅度僅為0.235,R2降低0.067,RNN模型預測得到的數據具有更高的可信度。
在當代中國科技日益創(chuàng)新和農業(yè)快速發(fā)展、國家大力推進供給側結構改革的大形勢下,精準農業(yè)成為我國發(fā)展的目標,把科學技術應用到農業(yè)發(fā)展上來,正是國家政策的要求。農業(yè)生產過程中對于水資源科學管理的要求日益增長,面對世界上淡水資源緊缺的問題,研究如何節(jié)約用水,把每一滴水用到該用的地方去對于保護水資源有重大意義。如今,隨著深度學習神經網絡的快速發(fā)展,課題組根據實際數據對提出的兩種土壤水分動態(tài)預測模型進行研究,結果表明RNN動態(tài)預測模型具有較高的準確率。