韓坤林,王釗英,楊會民,陳毅飛,蔣永新,張佳喜
(1.新疆農業(yè)大學機電工程學院,烏魯木齊 830052;2.新疆農業(yè)科學院,烏魯木齊 8300091;3.新疆農業(yè)科學院農業(yè)機械化研究所,烏魯木齊 830091)
【研究意義】高效利用水肥資源和建立合理的灌溉策略具有重要意義[1-3]。番茄果實生長狀況在一定程度上反映了水肥盈缺情況,果實大小反映著其內部營養(yǎng)成分,也是和產量獲取的重要因素,對果實直徑進行預測有研究意義[4-6]。生長環(huán)境對果實發(fā)育大小有重要影響,良好光照條件和合適溫度更有利于果實生長[7]。在對作物水肥決策時,果實大小是重要指標,而目前對果實大小的實時監(jiān)測較為困難,對于數量多的作物,其中少數作物生長狀態(tài)不能代表大多數作物,而通過環(huán)境信息和土壤信息進行預測的作物生長指標,可反映大多數作物的生長狀態(tài)。果實生長實時生長狀態(tài)一定程度上反映了水肥的盈缺情況,可根據果實實際生長情況與預測情況的差值對水肥進行調節(jié)[8]。【前人研究進展】程智慧等[9]根據7個環(huán)境因子對番茄果實生長發(fā)育產生的影響,采用逐步回歸分析法建立了3個品種番茄果實增量與顯著環(huán)境變量的回歸模型,并提出了3個番茄品質分別適合生長的環(huán)境因子范圍,以及果實增量達到最大時的環(huán)境因子組合。李慧霞等[10]對番茄生長補光和增施二氧化碳,該方法對番茄的各個生長指標的影響,補光和增施二氧化碳對番茄果實橫縱徑等有較大影響。胡笑濤等[11]研究了果實直徑在不同天氣以及不同土壤含水率的變化規(guī)律,結果表明,果實直徑變化與太陽輻射強度有緊密聯(lián)系,而與土壤含水率的關系不太密切。Heuvelink[12]把番茄果實生長與日平均溫度結合在一起,果實生長還與光照強度有很大關系[13-14]?!颈狙芯壳腥朦c】目前基于溫室環(huán)境信息和番茄自身生理生態(tài)信息結合的預測果實生長的研究較少,且手段單一繁雜,實用性低,不能真正實時結合環(huán)境因子以及作物自身信息進行預測。作物實際生長變化情況與實時空氣溫度、土壤含水率、空氣濕度等因素關系密切,需要不斷采集實時環(huán)境信息進行判斷作物對灌溉量和施肥量的需求。【擬解決的關鍵問題】以番茄果實橫徑為研究對象,將果實生長期內空氣溫度、空氣濕度、果實橫徑以及土壤含水率作為研究數據,采用主成分分析法對數據進行分析,對提取的主成分和輸出變量進行BP神經網絡訓練,建立PCA-BPNN模型。
番茄種植試驗于2019年11月4日~2020年2月27日在新疆農業(yè)科學院農業(yè)機械化研究所連棟溫室內溫室進行,共種植56株生長期相同的盆栽番茄,抽取8株生長狀態(tài)相似的果實膨大期番茄樣本,其中5株進行訓練,3株作為測試。番茄品種為天粉1號,所用花盆容量為10 L,底直徑0.35 m,高0.3 m,栽培方式采用基質栽培,用草炭、蛭石和珍珠巖按3∶3∶1的比例混合而成作為基質,有機質58.62%、速效氮638.39 mg/kg、速效磷371.3 mg/kg、速效鉀6 640 mg/kg作為初始基質含肥量。
利用物理生理生態(tài)數據采集系統(tǒng),每隔30 min連續(xù)自動采集環(huán)境數據與番茄生理數據,在溫室中主要考慮空氣溫度、空氣濕度、葉片溫度、果實直徑變化、淺層土壤含水率和深層土壤含水率對番茄的影響建立預測模型,定期對傳感器的安裝檢查調整,儀器精度能準確測得各數據,所得數據是真實有效的。表1
表1 植物生理生態(tài)數據采集系統(tǒng)性能指標Table 1 The Performance index of Plant physiological an ecological data collection system
選取番茄結果期數據的果實直徑變化量作為預測指標。在安裝果實大小傳感器時,選取需要測量果實橫徑的番茄,將夾爪分開,使傳感器能夠將番茄果實保持在所需的位置,然后檢查傳感器是否牢固地壓住果實,輕輕用力壓緊夾爪,使其不易滑落,將傳感器的電纜固定在閥桿上,防止傳感器偶爾移動,并定期檢查傳感器的位置。圖1
圖1 果實直徑傳感器安裝示意Fig.1 Schematic Diagram of Fruit Diameter Sensor Installation
在番茄的生長期內共采集了72 800條數據,此處選取了18 000條數據進行主成分分析和模型建立,并以3株番茄分別選取的連續(xù)30 h左右的360條數據進行模型驗證。圖2
圖2 番茄試驗布置Fig.2 Arrangement of tomato experiment
1.2.1 主成分
研究多維數據時只需要考慮少數的幾個主成分,更容易獲取主要的信息,提高數據分析效率[15-17]。使用MATLAB軟件對數據進行主成分分析。
(1)確定輸入輸出
確定輸入為5個變量,輸出為1個變量,每個變量3 000條數據。輸入變量依次為空氣溫度T、相對濕度RH、淺層土壤含水率V1、深層土壤含水率V2、葉片溫度LT,輸出變量為番茄果實橫徑D。
(2)數據標準化
對數據進行標準化,假設原數據構成n×p維矩陣X:
(1)
將X矩陣標準化為Z矩陣,其中
(2)
(3)求解相關系數矩陣特征值與特征向量
得到標準化矩陣Z,求ZT的相關系數矩陣R。
(3)
求解計算相關系數矩陣R的特征值λi和特征向量ai,其中λi值越大,方差貢獻率就越大,所反映的主成分信息就越多[19]。MATLAB中求特征值與特征向量函數為eig。
(4)確定貢獻率及建立主成分表達式
根據特征值λi確定主成分個數,第m個主成分貢獻率為
(4)
累計貢獻率如果已經能夠反映大部分信息,可以將前m個因子作為主成分[20-21]。把前m個的主成分特征值λi所對應的特征向量ai為主成分表達式中的回歸系數,主成分表達式由此可建立。
Fm=a1mZ1+a2kZ2+…+apkZp.
(5)
1.2.2 建立BPNN模型
(1) 數據預處理
對數據進行歸一化,可以消除量綱互相之間的影響,可以提高求解精度以及訓練速度[22]。研究中需要把輸入、輸出數據進行歸一化在[0,1]區(qū)間,在MATLAB中歸一化函數為mapminmax,歸一化公式如式(6)[23]
(6)
(2) 確定BP神經網絡拓撲結構
在輸入輸出數據都確定之后,可根據輸入輸出數據的節(jié)點個數和要求的訓練精度確定隱含層層數與隱含層神經元個數[24-25],在此處確定輸入節(jié)點個數為3個,輸出節(jié)點個數為1個,隱含層數為3,隱含層節(jié)點個數分別為12、6、6。
(3)訓練BP神經網絡及數據反歸一化
確定神經網絡拓撲結構后,進行訓練神經網絡[26-29],中間傳輸層函數確定為“tansig”,隱含層至輸出層傳遞函數為“purelin”,訓練網絡函數為“trainbr”,建立網絡函數為newff,再結合數據對其進行仿真,仿真函數為sim。訓練網絡輸出的結果需要進行反歸一化,才能得到實際的果實變化預測量。
1.2.3 模型驗證
把3株番茄的數據作為測試數據進行主成分分析后,提取前3個主成分并對其歸一化再代入模型中,將輸出結果歸一化后也代入模型中,把仿真結果進行反歸一化后可得到預測結果,其中決定系數R2和均方根誤差RMSE可以很好地反映預測精度。公式如(7)[15]和(8)[30]:
(7)
(8)
研究表明,前3個主成分的累積貢獻率已經達到了93.47%,整體的大部分信息已經能夠由前3個主成分反映,取m=3。提取前3個主成分向量進行載荷分析。對第1個主成分影響最大的是空氣溫度、相對濕度和葉片溫度,1主成分F1基本包含了這3個指標的信息;對第2個主成分來說,影響最大的就是深層和淺層的土壤含水率;對第3個主成分影響最大的也是深層和淺層的土壤含水率;這3個主成分基本能反映這5個因素的指標信息。表2,表3
表2 初始因子載荷矩陣Table 2 Initial component matrix
在得到主成分表達式之后,確定BP神經網絡的輸入變量為F1、F2、F3,輸出變量為果實直徑變量,進行網絡訓練。
F1=0.584x1-0.530 1x2+0.261 1x3+0.060 4x4+0.553 3x5.
(9)
F2=0.126 8x1+0.071 3x2+0.626 2x3+0.745 8x4-0.174 7x5.
(10)
F3=0.146 1x1-0.139 2x2+0.694 1x3-0.649 5x4-0.235 9x5.
(11)
研究表明,基于PCA-BPNN模型訓練的第1株番茄的決定系數R2值為0.964,RMSE值為0.238,第2株番茄的決定系數R2值為0.960,RMSE值為0.051,第3株番茄的決定系數R2值為0.951,RMSE值為0.047,模型有較好的預測效果。圖3,表4
表3 主成分提取Table 3 Principal component extraction and analysis
圖3 樣本1、2和3短期果實直徑預測量和實測量比較Fig.3 Comparison between the predicted and measured values of samples 1,2and 3
影響果實大小變化的主要因素有氣溫、土壤含水率以及植物自然生長發(fā)育等方面,研究選取了番茄果實膨大期時的果實橫徑變化數據,結合空氣溫度、相對濕度、土壤含水率,葉片溫度等因素建立了以果實直徑變化為因變量的PCA-BPNN模型,該模型參考了前人研究成果以及進行了網絡的多次訓練[24],確定了最終的主要參數,并結合主成分分析法和神經網絡,提高了模型的精度,能夠進行有效的預測。
員玉良等[16]以向日葵和番茄為對象,對其莖稈變化進行了研究,預測值與實測值相關分析的決定系數為0.649~0.782。陳毅飛[31]等采用多層感知機訓練方法,研究了番茄莖稈動態(tài)預測方法,預測值與實測值的回歸系數為0.901,具有較好的效果。程智慧[9]等通過空氣溫度和空氣濕度等多種因子的變化建立了與果實增量的關系,不同環(huán)境因素對番茄果實生長的影響。對果實生長變化具有一定的局限性,該模型的建立依賴于固定水肥條件下所測得的參數以及新疆獨特的地理氣候條件,而番茄生長發(fā)育情況與氣候、地域和水肥也有很大關系,可以在原有的水肥配方上設置不同的水肥處理水平,最后根據長勢最好的一組番茄數據進行模型建立,可以使番茄處于一個更好水肥環(huán)境。更準確地預測番茄所需的水肥量,還需要將果實生長變化、多種環(huán)境因子、作物自身其他生長發(fā)育情況以及農藝等因素綜合考慮。
表4 樣本1、2和3的預測值與實測值樣本對比Table 4 Comparison between the predicted and measured values of samples 1,2 and 3
將環(huán)境因子數據和植物本體數據與主成分分析法和BPNN算法融合一起,建立了一種能在短時間預測果實直徑變化的模型,并用3株番茄數據對該模型進行了測試和對模型性能進行了分析。建立的預測模型取得了良好的預測結果,誤差最大值為0.075 mm,該模型在秋季番茄果實膨大期內能夠較好預測番茄果實生長趨勢,可用于新疆連棟溫室內番茄果實橫徑變化量的預測。