李 揚, 腰彩紅, 蘭 璞, 田 濤, 孫海波, 王建春
(天津市農業(yè)科學院,天津 300112)
草莓是天津市冬春季節(jié)設施農業(yè)高價值作物之一,普遍采用設施栽培,易出現(xiàn)濕度大、光照不足和通風不良等問題,為草莓病害的發(fā)生提供了有利條件。白粉病是由專性寄生菌引發(fā)的,是近年來危害草莓產(chǎn)量及品質的主要病害之一,發(fā)生頻率高,損失嚴重。只要條件合適,病原菌20 h即可侵入葉片表皮,4 d后可形成白色菌絲,7 d后成熟可形成新的分生孢子,進而在幾天內迅速感染整個溫室。統(tǒng)計表明草莓感染白粉病后一般減產(chǎn)20%~50%,嚴重影響草莓的產(chǎn)量和品質[1]。因此對草莓白粉病的發(fā)生進行預測,并盡早采取措施予以治療,將有效減少白粉病對作物的影響,降低農民損失。
目前白粉病預測技術使用的方法主要包括基于孢子捕捉技術預測和基于環(huán)境氣候預測2種[2]?;阪咦硬蹲郊夹g的預測是通過在載體上涂抹黏性物質來黏附空氣中的孢子,并定期帶回實驗室通過顯微鏡對孢子數(shù)量進行檢測,再結合環(huán)境、作物抗病性等因素進行病害的預警。李磊福等以累積濕度和孢子量為變量構建了溫室甜瓜白粉病流行預測模型,對溫室瓜菜白粉病發(fā)病進行了預測,取得了較好的效果[3]。高士剛等使用了一體化智能孢子捕捉儀證實黃瓜霜霉病和黃瓜白粉病病情指數(shù)與連續(xù)7 d孢子捕捉總量具有強正相關性[4]。Cao等通過對空氣中小麥白粉病菌分生孢子動態(tài)監(jiān)測,建立了基于氣象因子和孢子濃度的小麥白粉病預測模型[5]。Carisse等利用孢子量、作物抗病性和氣象信息對草莓白粉病的發(fā)生風險進行預測,構建了基于采樣當天的孢子量、平均相對濕度、適宜溫度下的平均小時數(shù)等參數(shù)的決策樹模型,并驗證了模型的有效性[6]。這些研究都證實了使用孢子量進行白粉病預測的效果。近年來孢子捕捉技術的發(fā)展,特別是圖像處理技術的發(fā)展促進了使用孢子捕捉技術進行作物病害監(jiān)測預警的研究和技術的迭代更新,進一步提高了病害監(jiān)測預警的質量和水平,但由于孢子捕捉儀的專業(yè)性強,實際生產(chǎn)中還是存在難以推廣的問題。因此,現(xiàn)階段基于環(huán)境氣候預測仍是作物病害預測使用的主要方法,即通過歷史氣象數(shù)據(jù)模擬病害傳播路徑,并結合病害發(fā)生時序等實際情況構建預測模型,對病害進行預警。尚志云等利用1990—2010年河北省冬小麥白粉病和國家氣候中心大氣環(huán)流特征量指數(shù)資料,建立了冬小麥白粉病預測模型,年前和春季病害發(fā)生程度預測模型的準確率分別為81.0%和90.5%[7]。吳燕君等通過監(jiān)測2007—2019年設施黃瓜白粉病的田間流行動態(tài),建立了基于逐步回歸分析法的春黃瓜、秋黃瓜白粉病發(fā)生預測模型,經(jīng)擬合率檢驗,各模型均達75分以上的準確度[8]。魏少偉等使用2020年9—11月在北京4個溫室的空氣溫度、相對濕度、光照強度構建了貝葉斯網(wǎng)絡模型,對日光溫室黃瓜白粉病進行了預測,準確度達到了87%以上,具有良好的普適性[9]。
目前基于環(huán)境氣候的白粉病預測大多采用回歸分析等方法,這些方法需要大量歷史年份數(shù)據(jù),且不考慮各個變量之間的內在聯(lián)系,導致模型適應性不強。近年來,人工神經(jīng)網(wǎng)絡算法由于其強大的非線性逼近能力和自適應能力,逐漸被引入到病害預測、環(huán)境預測等領域[10],在水稻[11]、黃瓜[12]、臍橙[13]等作物和水產(chǎn)領域[14]已經(jīng)取得了較好的效果。但鮮有針對設施草莓白粉病預測的研究,本研究主要以日光溫室草莓種植期間的環(huán)境和病害發(fā)生情況作為樣本,采用長短時記憶網(wǎng)絡(long-short term memory,簡稱LSTM)對其發(fā)病情況進行預測,為病害防治奠定基礎。
草莓品種選擇紅顏和章姬,二者均是天津越冬草莓主栽品種,適合日光溫室促成栽培。其中紅顏對白粉病抵抗能力弱,章姬較耐白粉病。試驗于2020年9月至2021年4月在天津市鼎牛農業(yè)園區(qū)1號溫室和2號溫室中進行,溫室由聚乙烯薄膜覆蓋,溫室面積約667 m2,草莓于9月初定植,并建立生產(chǎn)檔案,對灌溉、施肥等栽培管理措施進行記錄。
室內環(huán)境數(shù)據(jù)測量使用建大仁科溫濕度及光照度三合一傳感器、土壤溫濕度二合一傳感器。監(jiān)測數(shù)據(jù)采集使用自主研發(fā)的數(shù)據(jù)采集設備完成,并上傳至服務器,數(shù)據(jù)采集頻率為15 min/次。室內傳感器按照5×5的位置布放,即將棚室劃分為25塊區(qū)域,橫向按照1~5劃分,縱向按照A~E劃分,傳感器布放在相應區(qū)域中心。溫室劃分情況如圖 1所示,布放現(xiàn)場及采集設備如圖 2所示。
調查根據(jù)選定的25個采樣點,每個采樣點對角線五點采樣,每點隨機選定3株,每株調查全部葉片,發(fā)病前每隔2 d觀察1次,待發(fā)現(xiàn)白粉病后每隔7 d觀察1次,統(tǒng)計發(fā)病情況,共調查18次,并根據(jù)GB/T 17980.119—2004[15]對病害程度進行分級。分級標準如表1所示,病情指數(shù)計算公式如下:
表1 病害程度分級標準
根據(jù)發(fā)病調查獲取了自第一次發(fā)現(xiàn)病害前7 d至種植期結束的全部環(huán)境數(shù)據(jù),包括空氣溫度、空氣相對濕度、光照度、土壤溫度、土壤相對濕度5組。期間由于園區(qū)停電,傳感器故障等原因丟失部分數(shù)據(jù),按照同一時段其他傳感器均值或鄰近日期同一位置數(shù)據(jù)測算,最終獲取213 000條環(huán)境數(shù)據(jù)。
為了分析環(huán)境因子在調查期間對于白粉病發(fā)生的影響,結合已有數(shù)據(jù),設計了可能影響白粉病發(fā)生的因素共計25項,具體如表2所示。
LTSM是一種特殊的神經(jīng)網(wǎng)絡(RNN)模型,是為了解決RNN模型梯度爆炸和梯度消失問題而提出的,適合處理和預測時間序列中間間隔和延遲相對較長的問題。使用記憶單元代替神經(jīng)網(wǎng)絡中的神經(jīng)元,LSTM記憶單元示意圖如圖3所示。
表2 預測指標
對比試驗中,首先將“1.4”節(jié)中獲取的環(huán)境數(shù)據(jù)按照“1.5”節(jié)中列出的25個指標項, 通過計算得到觀察期間每天的指標值共計400組指標記錄,按照80%和20%的比例分為訓練集和測試集。再根據(jù)觀測日期,將該日期前的nd的指標值作為輸入值,預測是否發(fā)病。開展3組試驗,對比預測效果。試驗1使用檢查日前4 d的數(shù)據(jù),預測檢查日是否發(fā)??;試驗2使用檢查日前7 d至4 d的氣象數(shù)據(jù),預測檢查日是否發(fā)??;試驗3使用檢查日前7 d的數(shù)據(jù),預測檢查日是否發(fā)病(圖4)。
本研究中LSTM網(wǎng)絡使用PyCharm環(huán)境Python 3.9版本開發(fā),用MySql數(shù)據(jù)庫及Excel進行數(shù)據(jù)整理分析。
混淆矩陣是用來評價模型時使用的主要工具,其定義如表3所示。
表3 混淆矩陣定義
在混淆矩陣基礎上,國際上廣泛采用的評價指標包括精確度(precision)、召回率(recall)和F1指數(shù),相應公式如下:
precision=TP/(TP+FP);
recall=TP/(TP+FN);
F1=2×precision×recall/(precision+recall)。
精確度體現(xiàn)的是模型預測結果的正確程度,召回率體現(xiàn)的是是否所有結果都被正確地預測出來了,F(xiàn)1指數(shù)是準確度和召回率的綜合體現(xiàn)。本研究采用以上3項指標評價模型效果。
對比分析發(fā)現(xiàn),同一溫室內不同區(qū)域由于小氣候仍然存在較大差異,導致發(fā)病程度不一。通過匯總調查的病情指數(shù),繪制溫室劃分的25個區(qū)域的平均病情指數(shù)熱力圖(圖5)。從圖5可以看出,2、3、4區(qū)域感染白粉病病情指數(shù)要高于1、5區(qū)域,這主要是由于區(qū)域1更靠近出口溫度偏低,區(qū)域5更靠近側墻,人員流動小。2、3、4區(qū)域中3C區(qū)域感染白粉病病情指數(shù)最高,主要是由于此區(qū)域為溫室中心,空氣流動及環(huán)境情況都更適宜白粉病發(fā)展。其中標紅色框的區(qū)域發(fā)病病情指數(shù)也要高于周邊,主要是由于處于風口位置,空氣流動更大,更利于孢子的擴散。因此這些區(qū)域是未來監(jiān)測白粉病發(fā)生的重點區(qū)域。
根據(jù)“1.7”試驗方法使用LSTM模型評估檢查日是否發(fā)病,測試集數(shù)據(jù)共計80條,試驗效果如表4所示。
從表4可以看出,試驗1中有大量預測發(fā)病但實際未發(fā)病情況,精確度僅為67%,雖然召回率達到了100%,整體F1指數(shù)僅為0.8,大量誤判在使用中極易造成人工的浪費。試驗3結果最好,精確度、召回率均達到了94%,F(xiàn)1指數(shù)達到0.94。試驗2精確度達到了93%,召回率達到了94%,F(xiàn)1指數(shù)為0.93,結果與試驗3結果相比僅多了1次誤判,沒有明顯差別,但可以比試驗3使用更少的數(shù)據(jù),達到了幾乎相當?shù)念A測結果,在實際應用中將更有價值,即按照試驗2的模式,可以提前4 d預測草莓白粉病的發(fā)生,便于農戶提前做好預防。測試數(shù)據(jù)病情指數(shù)預測結果如圖6所示。
表4 試驗結果
本試驗選擇天津本地越冬茬高價值作物草莓開展研究,針對其易發(fā)病害白粉病進行觀測,總結了日光溫室內白粉病發(fā)病的高風險區(qū)域,作為病情監(jiān)測重點區(qū)域,用于在模型預測發(fā)病時指導人工重點觀測。使用LSTM方法構建了草莓白粉病預測模型,選取了25項環(huán)境相關指標,使用發(fā)病前7 d至發(fā)病前4 d、發(fā)病前4 d和發(fā)病前7 d的環(huán)境數(shù)據(jù)作為輸入訓練模型,并比較預測效果。證實了使用發(fā)病前7 d至發(fā)病前4 d的環(huán)境數(shù)據(jù)可以準確地預測出草莓白粉病發(fā)病,精度達到了93%,與以發(fā)病前 7 d 的環(huán)境數(shù)據(jù)作為輸入的模型相比,預測準確度相當,但使用輸入數(shù)據(jù)更少,可以提前3 d預判出白粉病發(fā)病,取得了較好的試驗效果,可以在實際生產(chǎn)中用于白粉病發(fā)病預測。