劉又夫 肖德琴 劉亞蘭 鐘伯平 周志艷
(1.華南農(nóng)業(yè)大學(xué)廣東省農(nóng)業(yè)航空應(yīng)用工程技術(shù)研究中心,廣州510642;2.國家精準(zhǔn)農(nóng)業(yè)航空施藥技術(shù)國際聯(lián)合研究中心,廣州510642;3.華南農(nóng)業(yè)大學(xué)數(shù)學(xué)與信息學(xué)院,廣州510642;4.華南農(nóng)業(yè)大學(xué)資源環(huán)境學(xué)院,廣州510642)
水稻是主要糧食作物之一,約占糧食總產(chǎn)量的30%[1]。稻飛虱是水稻生產(chǎn)中危害最為嚴(yán)重的害蟲之一,每年都會造成水稻產(chǎn)量的巨大損失[2]。因此,稻飛虱早期監(jiān)測研究對精準(zhǔn)用藥和早期防治具有重要意義。
目前,對蟲害的檢測方法主要有光譜檢測法、圖像識別法和電子鼻檢測法等。光譜檢測法通過檢測水稻冠層的光譜特征來判斷是否存在病蟲害[3]。圖像識別法通過獲取受害作物的圖像,結(jié)合圖像處理、分類識別、深度學(xué)習(xí)等方法[4]進行病蟲害識別。電子鼻檢測法通過檢測受害水稻的氣體揮發(fā)物進行判別[5]。
上述蟲害檢測方法中,冠層溫度特征是作物蟲害識別的重要指標(biāo)之一[6]。水稻與自身周圍的病蟲害存在著復(fù)雜的相互作用[7],在受到病蟲害侵害時,水稻會出現(xiàn)一系列生理變化[8-10]。其中,氣孔導(dǎo)度變化會引起其冠層蒸騰作用強度的改變,從而改變水稻的冠層表面溫度[11]。
紅外熱成像技術(shù)具有非接觸、遠程以及無損[12-14]等優(yōu)點,因此可用于監(jiān)測水稻生長過程中的冠層溫度變化情況[15]。目前,基于紅外熱成像技術(shù)的農(nóng)業(yè)應(yīng)用研究主要以旱地作物為主[16-18],通常僅討論了同時刻下健康組與脅迫組的溫度特征變化,鮮有與氣象因子相結(jié)合進行分析。此外,作物冠層的溫度特征會受氣象因子的影響,僅用單一溫度對作物狀態(tài)進行評估,需要在同一時刻下設(shè)置健康作物作為參照,并進行差異性分析[19-22],該方式在實際生產(chǎn)中的可操作性不強。
為尋求水稻被褐飛虱侵害后冠層溫度特征的有效評估方法,本文以褐飛虱易感水稻品種“TN1”為研究對象,運用熱紅外成像技術(shù)獲取健康水稻與受侵害水稻的冠層溫度特征,使用機器學(xué)習(xí)分類器,對褐飛虱誘導(dǎo)的水稻冠層熱圖像溫度特征變異評估方法進行研究,以期為稻飛虱蟲害的機器監(jiān)測技術(shù)提供參考。
試驗地點為廣東省廣州市華南農(nóng)業(yè)大學(xué)岑村校內(nèi)農(nóng)場。水稻品種為“TN1”(稻飛虱易感品種)。稻種經(jīng)過選種催芽后,將露白的種子種在12 個混有有機肥的土壤盆栽中進行培育,待水稻長到苗期進行試驗。選擇長勢接近的8 盆稻苗用作試驗,分成2 個處理,每個處理4 次重復(fù),即:4 盆作為褐飛虱侵害脅迫組,4 盆作為健康對照組。
褐飛虱來自廣東省農(nóng)業(yè)科學(xué)院植物保護研究所,蟲源放置在種植好的TN1 水稻上進行培養(yǎng)擴繁,取3 齡左右的褐飛虱用于試驗,脅迫組平均每株水稻接種褐飛虱5 ~6 頭。
脅迫組的水稻與對照組的水稻分開放置,并分別用網(wǎng)罩罩住,以防褐飛虱逃逸及交叉影響。試驗期間,脅迫組與對照組采用相同的水肥管理方式,以保證脅迫組與對照組水稻的含水狀態(tài)一致。
熱圖像采集儀器與溫濕度、水溫采集試驗儀器如圖1 所示。熱像儀和溫濕度傳感器的儀器參數(shù)如表1 所示。
圖1 試驗儀器設(shè)備Fig.1 Test equipments
T400 型熱像儀為美國FILR 公司生產(chǎn),擁有可視化界面、自動定時拍攝功能。COGO SMTDOG280型溫濕度傳感器為北京安嵌科貿(mào)有限公司生產(chǎn),擁有GPRS 數(shù)據(jù)上傳模塊與過熱過冷報警模塊。
表1 儀器參數(shù)Tab.1 Instruments parameter values
采用T400 型熱像儀采集水稻冠層的熱紅外正射圖像,同時使用COGO SMTDOG280 型溫濕度傳感器實時進行環(huán)境溫度、相對濕度以及水稻灌溉水層水溫的采集。熱像儀中被測對象發(fā)射率的設(shè)置參照文獻[23]提供的參考值,即水稻冠層的發(fā)射率調(diào)整為0.98[23]。
數(shù)據(jù)采集時段為每天09:30—15:00[24],持續(xù)采集10 d。熱紅外圖像的采樣間隔為5 min,溫濕度傳感器的采樣間隔為30 s,每次采集的對象為空氣溫度、相對濕度與水稻灌溉水層水溫。數(shù)據(jù)采集方案示意圖如圖2 所示。
圖2 數(shù)據(jù)采集方案示意圖Fig.2 Data acquisition diagram
數(shù)據(jù)統(tǒng)計分析處理的軟件主要包括Excel 軟件、ResearchIR 熱紅外圖像處理軟件與Python 3.0。Excel 用于記錄數(shù)據(jù);ResearchIR 用于提取熱紅外圖像的CSV 文件;Python 3.0 用于批量處理圖像并自動提取冠層統(tǒng)計學(xué)指標(biāo)。由于種植密度高,基本看不到水稻冠層間隙中的水和土壤,因此采取框取主要區(qū)域的方式進行特征提取。水稻冠層熱圖像預(yù)處理的具體流程如圖3 所示。
1.5.1 統(tǒng)計學(xué)特征
圖3 熱圖像預(yù)處理流程Fig.3 Thermal image preprocessing
褐飛虱侵害水稻時,主要通過刺吸式口器吸食汁液[25],造成植株水分部分流失。因此水稻冠層水分脅迫是褐飛虱危害后的特征之一[26],可通過對水稻熱紅外圖像進行統(tǒng)計學(xué)分析,進行水分脅迫情況評估。
熱紅外技術(shù)的本質(zhì)是把目標(biāo)對象射出的熱輻射場轉(zhuǎn)變?yōu)榛叶葦?shù)字矩陣,并添加偽彩處理。作物冠層的灰度數(shù)字矩陣的統(tǒng)計學(xué)特征可用于判斷水分脅迫程度[27-28]。本文通過提取水稻冠層溫度極差(Canopy temperature range,CTR)、眾 數(shù) 頻 率(Maximum frequency of canopy temperature,CTM)和變異系數(shù)(Canopy temperature coefficient of variation,CTCV)來對褐飛虱的侵害作出評估。相應(yīng)的統(tǒng)計學(xué)特征公式為
式中 ECTCV——CTCV 冠層特征數(shù)
N——水稻冠層熱紅外圖像像素點總數(shù)量
Ti——水稻冠層熱紅外圖像第i 個像素溫度
Tleaf——水稻冠層熱紅外圖像平均溫度
ECTR——CTR 冠層特征數(shù)
Tmax——水稻冠層熱紅外圖像最大溫度
Tmin——水稻冠層熱紅外圖像最小溫度
ECTM——CTM 冠層特征數(shù)
Tfmax——水稻冠層熱紅外圖像溫度眾數(shù)
在提取CTR 指數(shù)時,為了防止極偏差數(shù)據(jù)的產(chǎn)生,在將數(shù)組排列完順序后,取排于數(shù)組的第2.5%和第97.5%位置的數(shù)據(jù)作極差。
在提取ECTM時,將像素點對應(yīng)的溫度保留一位小數(shù)進行統(tǒng)計。
由于統(tǒng)計學(xué)特征量綱不統(tǒng)一,為了方便相互之間進行比較,對所有提取結(jié)果進行歸一化。歸一化表達式為
式中 β0——歸一化后的統(tǒng)計學(xué)特征值
C0——原統(tǒng)計學(xué)特征值
Cmax——統(tǒng)計學(xué)特征值數(shù)據(jù)集的最大值
C
min——統(tǒng)計學(xué)特征值數(shù)據(jù)集的最小值
1.5.2 脅迫條件下的統(tǒng)計學(xué)特征變化特點
在葉片發(fā)生水分脅迫后,其冠層脅迫特征會隨之變化[29]。為探究該問題的數(shù)學(xué)機理,假設(shè)一個理想的葉片脅迫模型如圖4 所示,葉子表面溫度場由有限個離散點的溫度代替,其中綠色點代表無脅迫溫度,黃色點代表輕度脅迫溫度,紅色點代表重度脅迫溫度。
圖4 理想的脅迫過程Fig.4 Ideal stress process
在理想的極端條件下,葉片未受到脅迫時,可假設(shè)每個離散點的溫度相等,如圖4 最左邊的全綠色葉片。隨著脅迫的加重,黃色點變多,紅色點也開始出現(xiàn)。脅迫再加重后,黃色點與紅色點逐漸變多,綠色點僅剩下幾個。根據(jù)上述的變化過程,對應(yīng)的統(tǒng)計學(xué)特征預(yù)測變化趨勢如表2 所示。
表2 統(tǒng)計學(xué)特征變化趨勢Tab.2 Trend of statistical characteristics
CTCV 隨著溫度場的離散程度增大而變大,溫度場初始值無離散,因此為CTCV 的初始值(0)。CTR 隨著溫度場的極端值之差變大而變大,溫度場初始值無極端值,或極端值之差為0℃,因此CTR 的初始值也為0℃。CTM 隨著溫度場的離散程度變大而變小,溫度場初始值的眾數(shù)與溫度場離散點的數(shù)量一致,因此初始值為1。
1.6.1 累計差值法
累計差值法是將同一時刻下的兩組數(shù)據(jù)作差,再取絕對值作累加。本文采用累計差值法篩選出差異性最大的統(tǒng)計學(xué)特征。累計差值法表達式為
式中 A——所有數(shù)據(jù)統(tǒng)計學(xué)特征值的累計差值
n——數(shù)據(jù)統(tǒng)計學(xué)特征值的總組數(shù)
βi1——第i 組健康水稻的統(tǒng)計學(xué)特征值
βi2——第i 組被侵害水稻的統(tǒng)計學(xué)特征值
1.6.2 機器學(xué)習(xí)分類器
機器學(xué)習(xí)是一種通過數(shù)據(jù)集的訓(xùn)練能自動擬合出模型的算法,其本質(zhì)是一種對真實模型的逼近。在機器學(xué)習(xí)的監(jiān)督學(xué)習(xí)中,數(shù)據(jù)的分類是重要的任務(wù)之一。分類器通過已有的數(shù)據(jù)集進行訓(xùn)練,其所得到的參數(shù)模型可用于判斷預(yù)測所輸入的數(shù)據(jù)類別,且該類別必須是離散的形式。本文采用邏輯回歸(Logistic regression,LR)算法與支持向量機(Support vector machine,SVM)算法擬合褐飛虱的危害評估分類模型。
LR 算法是基于概率思想的算法,其結(jié)果是以概率的形式進行判斷分類。由于普通感知機模型的變量值范圍為正負無窮大,無法給予某種概率的表達,因此LR 算法引入了連續(xù)可分的sigmoid 函數(shù),將模型映射成0 到1 的范圍。邏輯回歸的損失函數(shù)是由最大似然估計所推導(dǎo)得出,邏輯回歸損失函數(shù)J(θ)的表達式為
式中 θ——求解出的一組參數(shù)
m——樣本的個數(shù)
yi——樣本i 的真實標(biāo)簽
yθ(xi)——樣本i 基于參數(shù)θ 所計算出的邏輯回歸返回值
xi——樣本i 的特征向量
為防止過擬合現(xiàn)象,通過在損失函數(shù)后方添加L2 范數(shù)來達到優(yōu)化模型泛化能力的效果。添加了L2 范數(shù)的邏輯回歸損失函數(shù)JL2(θ)表達式為
式中 J(θ)——邏輯回歸的原始損失函數(shù)
C——控制正則化程度的超參數(shù)
k——方程中的特征總數(shù)
θj——第j 個參數(shù)向量
其中,C 為主要的調(diào)參對象,j 為大于等于1 的正整數(shù),因為在參數(shù)向量中,第一個參數(shù)θ0是截距,通常不參與正則化。
SVM 算法的特點主要體現(xiàn)在核函數(shù)以及松弛系數(shù)或懲罰系數(shù)的使用。SVM 算法的核心思想是在樣本空間中尋找出一個可將數(shù)據(jù)集分離的超平面,同時還要找出滿足離超平面距離最近的若干個樣本點達到最大化的條件。當(dāng)該超平面找出后,即可根據(jù)該超平面對輸入到樣本空間的特征向量進行分類。SVM 的損失函數(shù)表達式為
式中 w——超平面方向參數(shù)向量
b——超平面截距
?——懲罰系數(shù)
δi——樣本i 的松弛系數(shù),用于衡量容納錯誤樣本的程度
Φ(xi)——核函數(shù),用于將樣本集xi映射于更高緯的空間
式(8)為SVM 的損失函數(shù)基本型及其SVM 損失函數(shù)的約束條件。懲罰系數(shù)? 與核函數(shù)Φ(xi)為主要的調(diào)參對象。
2.1.1 健康水稻冠層熱圖像統(tǒng)計學(xué)特征趨勢
為驗證由1.5.2 節(jié)提出的冠層熱圖像統(tǒng)計學(xué)特征與脅迫程度的變化關(guān)系,先分析健康水稻冠層溫度統(tǒng)計學(xué)特征的日變化量,在晴朗無云的條件下采集數(shù)據(jù),時間段為07:30—18:00。3 種統(tǒng)計學(xué)特征數(shù)的變化趨勢如圖5 所示。
圖5 統(tǒng)計學(xué)特征日變化趨勢Fig.5 Statistical eigenvalues trend of daily variation
由圖5 可知,從上午到中午期間,脅迫會隨著高溫高光強而加重,水稻為調(diào)節(jié)自身的溫度,水分供給足夠的情況下,在中午時氣孔開度會達到最大[30],蒸騰作用最強,3 種特征數(shù)在此期間都發(fā)生了變化,其中CTR 與CTCV 都呈上升趨勢,CTM 呈下降趨勢,與前面的假設(shè)符合。隨后在中午到傍晚期間,隨著溫度與光強的減弱,環(huán)境因素造成的脅迫下降,CTR 與CTCV 都隨之下降,CTM 上升,與1.5.2 節(jié)提出的假設(shè)符合。同時也可知,由于環(huán)境溫濕度等條件的變化,上述特征也相應(yīng)發(fā)生變化。
2.1.2 統(tǒng)計學(xué)特征的累計差值對比
試驗過程中共采集了242 組水稻溫度冠層特征值數(shù)據(jù),每組數(shù)據(jù)表示的是脅迫組與對照組3 種冠層特征值均值的組合。將采集的數(shù)據(jù)集使用累計差值法進行分析。某條冠層特征值數(shù)據(jù)的差值越大,代表該時刻下,健康水稻熱圖像與受褐飛虱脅迫水稻熱圖像的冠層統(tǒng)計特征值差異性越大。將某個冠層特征值每條數(shù)據(jù)的差值進行累加,得到的差值累計值越大,表示該冠層特征值更容易判斷出是否有褐飛虱侵害的狀態(tài),從而更有利于評估模型的擬合。
數(shù)據(jù)集的累計差值,CTR 與CTM 分別為25.44、27.23,均低于30,而CTCV 為30.78,說明CTCV 更能反映健康水稻與受侵害水稻的差異性,因此,在后續(xù)研究中,重點針對該統(tǒng)計學(xué)特征進行分析討論。
水稻冠層溫度會因周圍的氣象因子變化而變化,因此冠層的統(tǒng)計學(xué)特征數(shù)也會隨之變化,在沒有健康水稻作為參照的條件下,很難單純使用冠層統(tǒng)計學(xué)特征數(shù)判斷褐飛虱的侵害狀態(tài),因此進行褐飛虱侵害的評估時應(yīng)將氣象因子也作為特征考慮在內(nèi)。
水的比熱容較大,環(huán)境溫度變化時,水溫的變化較緩慢,因此,引入水稻灌溉水層水溫作為參考因子。水溫雖然不會影響水稻冠層溫度,但水溫與氣象因子具有一定的關(guān)系,有助于模型的擬合。本文采集水稻冠層熱圖像對應(yīng)時刻的環(huán)境空氣溫度、相對濕度以及水稻灌溉水層水溫,與CTCV 進行相關(guān)分析[31]。結(jié)果如表3 所示。
由表3 可知,CTCV 與空氣溫度和水稻灌溉水層水溫呈正相關(guān)關(guān)系,與相對濕度呈負相關(guān)關(guān)系。三者與CTCV 的皮爾遜系數(shù)均高于0.2,其中水溫的皮爾遜系數(shù)為0.41,在三者中密切程度最高。從表3 可看出,使用傳統(tǒng)的線性擬合法建立模型較困難。
表3 相關(guān)分析結(jié)果Tab.3 Correlation analysis between CTCV and meteorological factors
由上述分析可知,非線性評估模型的擬合應(yīng)使用CTCV、空氣溫度、相對濕度以及灌溉水層水溫作為特征值進行訓(xùn)練。CTCV 雖然是累計差值中最高的一個特征,但CTR 與CTM 的信息未必全部無效。因此除了單獨使用CTCV 進行建模時,也嘗試將3種統(tǒng)計學(xué)特征一起參與建模進行對比。
采集的數(shù)據(jù)集正負樣本各242 條,按照7:3 的比例設(shè)置訓(xùn)練集與測試集,其中正負樣本訓(xùn)練數(shù)據(jù)條數(shù)各為169,測試數(shù)據(jù)條數(shù)各為73,健康水稻標(biāo)簽為1,受褐飛虱侵害的水稻標(biāo)簽為0。分別采用LR算法與SVM 算法進行分類,結(jié)果如表4 所示。
LR 算法所訓(xùn)練的參數(shù)設(shè)定為:L2 正則化,最大迭代次數(shù)為1 000。SVM 算法所訓(xùn)練的參數(shù)設(shè)定為:L1 懲罰項,最大迭代次數(shù)為1 000。
表4 中,LR 與SVM 算法經(jīng)過5 折交叉驗證法調(diào)參后達到了最優(yōu)值。其中單獨CTCV 加氣象因子的LR 算法最優(yōu)正則化系數(shù)為766,SVM 算法的最優(yōu)核函數(shù)采用線性內(nèi)核,懲罰系數(shù)為51。其中CTCV、CTR、CTM 加氣象因子的LR 算法最優(yōu)正則化系數(shù)為684,SVM 算法的最優(yōu)核函數(shù)采用線性內(nèi)核,懲罰系數(shù)為49。
表4 中,精準(zhǔn)率、召回率與F1 綜合指標(biāo)均為測試集的結(jié)果。在單獨使用CTCV 與氣象因子的組合作為輸入特征對模型訓(xùn)練擬合時,LR 與SVM 算法的精準(zhǔn)率分別為86.61%、84.62%,召回率分別為86.54%、84.62%,F(xiàn)1 綜合指標(biāo)分別為86.37% 與84.62%。而在將所有冠層統(tǒng)計學(xué)特征與氣象因子組合作為輸入擬合模型時,LR 與SVM 算法的精準(zhǔn)率 為 87.15%、86.74%,召 回 率 為 86.54%、86.90%,F(xiàn)1 綜合指標(biāo)為86.55%、86.53%。
相比單獨使用CTCV 與氣象因子的組合,將全部冠層統(tǒng)計學(xué)特征用作模型擬合時,SVM 算法的效果有所提升。而2 種組合中LR 算法的精準(zhǔn)率與F1綜合指標(biāo)均優(yōu)于對應(yīng)的SVM 算法。
表4 蟲害評估模型的擬合結(jié)果Tab.4 Fitting results of estimate models
(1)通過采集從清晨至傍晚的水稻冠層熱圖像及環(huán)境氣象數(shù)據(jù),證明了氣象因子對冠層熱圖像統(tǒng)計學(xué)特征的影響。采用累計差值法篩選出健康水稻與受侵害水稻間差異性最大的統(tǒng)計學(xué)特征。在提取的3 個統(tǒng)計學(xué)特征中,CTCV 的累計差值為30.78,是最大的特征值,因此CTCV 更能反映健康水稻與受侵害水稻的差異性。
(2)空氣溫度、水稻灌溉水層水溫與CTCV 呈正相關(guān)關(guān)系,相對濕度與CTCV 呈負相關(guān)關(guān)系。
(3)基于環(huán)境氣象因子與冠層熱圖像溫度特征融合的方法,包括:CTCV 與氣象因子組合、3 個冠層熱圖像統(tǒng)計學(xué)特征與氣象因子組合,采用LR 算法與SVM 算法進行水稻分類及評估,結(jié)果表明,LR 算法整體效果優(yōu)于SVM 算法。在同時使用3 個水稻冠層熱圖像統(tǒng)計學(xué)特征時,SVM 算法的效果有所提升,LR 算法的準(zhǔn)確率也有提升。總體而言,將所有冠層統(tǒng)計學(xué)特征作為輸入向量的LR 算法效果較優(yōu),其精準(zhǔn)率為87.15%,召回率為86.54%,F(xiàn)1 綜合指標(biāo)為86.55%。
(4)本研究所述的分類及評估方法仍有較大提升空間。從輸入特征向量的角度,今后可考慮增加光照強度、風(fēng)速等氣象因子,使輸入?yún)⒘扛?此外,分類輸出只考慮了健康和脅迫2 個類別,缺乏對受侵害程度的評估。