王 馳,張真煒,劉 洋,郭冰玉,陳 灝
(石河子大學(xué)信息科學(xué)與技術(shù)學(xué)院,新疆 石河子 832000)
棉花黃萎病危害棉花生產(chǎn),其使得棉花容易減產(chǎn)甚至絕收[1]。目前,棉花黃萎病病害監(jiān)測主要依靠人工觀察棉花葉片,基于經(jīng)驗監(jiān)測棉花是否出現(xiàn)黃萎病病變。傳統(tǒng)的監(jiān)測手段過度依賴人的主觀性,監(jiān)測效率低,費時費力。因此,為棉花黃萎病病害的發(fā)現(xiàn)提供一種更為準確、實時的診斷措施具有重大意義。近年來,通過圖像處理和機器學(xué)習(xí)監(jiān)測植物病蟲害已經(jīng)成為新的發(fā)展趨勢。本文采用基于機器學(xué)習(xí)分類方法,對比分析傳統(tǒng)機器學(xué)習(xí)和深度學(xué)習(xí)效果,提出基于機器學(xué)習(xí)的圖像(RGB圖像和熱紅外圖像)融合判斷監(jiān)測棉花黃萎病的方案,為植物病蟲害監(jiān)測領(lǐng)域提供寶貴的案例。
新疆是中國最大的產(chǎn)棉區(qū)。2020年新疆棉花的種植面積約占全國棉花種植總面積的78%,產(chǎn)量約占全國總產(chǎn)量的87%[2]。同時,在新疆地區(qū),國家針對性實施棉花目標價格補貼政策,這保障了棉農(nóng)的收益,調(diào)動了棉農(nóng)的種植積極性,使得新疆棉花種植面積不斷擴大。
棉花黃萎病是棉花生產(chǎn)的重大阻力,是棉花生育期間的“癌癥”[3]。在棉花的整個生育期內(nèi)都有可能被感染棉花黃萎病,七月中旬達到第一次發(fā)病高峰,八月底九月初到達一年之中的發(fā)病最高峰[4]。依據(jù)歷年棉花生產(chǎn)經(jīng)驗,黃萎病對棉花的質(zhì)量和產(chǎn)量都造成極其嚴重的影響,一般導(dǎo)致棉花減產(chǎn)20%左右,而病變嚴重的棉田減產(chǎn)可達70%,甚至絕收[5]。
劉海洋等[6]研究表明,棉花黃萎病作為目前危害棉花生產(chǎn)最主要的病害,近年來,在新疆的發(fā)作呈現(xiàn)加重趨勢,到目前為止其已經(jīng)造成了巨大損失,必須要引起足夠的重視[7]。及時地發(fā)現(xiàn)感染黃萎病的植株,可以盡早進行治療,防止病菌傳播和蔓延,防止棉花產(chǎn)量大規(guī)模減少[8]。
中國棉花黃萎病分類識別工作主要依靠人工完成,而人工分類局限性大、缺陷明顯,這對于棉花的最終產(chǎn)量有重大影響。利用計算機監(jiān)測棉花黃萎病,可以克服傳統(tǒng)人工分類方法過度依賴主觀性、易疲勞、費時費力等缺點,從而更好避免了棉花黃萎病的危害。
近年來,機器學(xué)習(xí)發(fā)展迅猛,應(yīng)用方面廣泛并取得突破性進展。許多傳統(tǒng)業(yè)務(wù)因和深度學(xué)習(xí)的結(jié)合進一步發(fā)展,不僅節(jié)省了人力物力,也提高了作業(yè)效率?,F(xiàn)如今,通過機器學(xué)習(xí)算法將原本煩瑣的任務(wù)交由計算機處理已成為時代的趨勢。
因此,借助機器學(xué)習(xí)等新技術(shù),研究一種切實可行、操作方便、探測準確的棉花黃萎病病發(fā)狀況監(jiān)測技術(shù),這對于提高新疆乃至全國棉花生產(chǎn)地區(qū)的棉花產(chǎn)量,具有重要意義。
TELLAECHE等[9]根據(jù)作物與雜草顏色不同的特點,實現(xiàn)了識別雜草,并在一定程度上消除了植物葉片重疊、不同相機的焦距、風(fēng)速不同等環(huán)節(jié)造成的影響,從而使圖像方法獲得較高的實用性;KⅠM等[10]在研究患灰霉病的紫薇葉片的數(shù)字紅外熱成像時,經(jīng)驗證得出結(jié)論,數(shù)字化紅外熱像儀可以用來評估灰霉病對葉片溫度變化的影響,從而做到對灰霉病的有效檢測;JAFARⅠ等[11]在利用熱視覺檢測玫瑰白粉病和灰霉病前期癥狀的研究中發(fā)現(xiàn)利用熱成像技術(shù)可以對玫瑰白粉病和灰霉病進行癥狀前檢測;CAMARGO等[12]構(gòu)建了一個機器視覺系統(tǒng),利用彩色數(shù)字圖像對作物病害視覺特征進行識別,從圖像中提取一系列的病害特征,將這些特征輸入到一個SVM分類器中,從而實現(xiàn)作物病害的識別。
鄧繼忠等[13]利用采集的小麥病害顯微圖像為研究對象,采用圖像分析、圖像識別技術(shù)對小麥的三類病害進行識別;陳斌等[14]在利用紅外熱成像技術(shù)監(jiān)測植物病害的研究中證實紅外熱成像技術(shù)在檢測病害方面所具備的良好可行性;錢小燕等[15]為了增強融合效果,提高融合速度,提出了一種快速有效的紅外與可見光圖像融合算法,此算法獲得的生成融合圖像更加清晰、自然,速度更快、更簡單;何永強等[16]結(jié)合紅外圖像和微光圖像各自的特點,利用小波圖像融合的方法把紅外圖像和微光圖像進行融合,從大量的融合圖像中提取不同物體的紋理特征,提出了一種基于圖像融合的夜視圖像彩色化方法。
總之,農(nóng)作物病蟲害識別方法的研究多在實驗室環(huán)境中進行,實驗室中的環(huán)境單一、噪聲干擾較少,往往能夠取得較好的效果,而在實際的大田環(huán)境中,存在各種各樣的干擾。目前,沒有相關(guān)學(xué)者對棉花的熱成像特征進行病害監(jiān)測,但是,已有相關(guān)學(xué)者在農(nóng)作物病蟲害領(lǐng)域使用熱成像技術(shù)進行研究[17],也已有學(xué)者利用機器視覺對棉花的病蟲害領(lǐng)域進行研究[18]。在實際應(yīng)用中,存在著許多圖像融合算法,但并不都適用于紅外與可見圖像融合,因此需要根據(jù)項目實際選擇適合的圖像融合算法以滿足項目的需求。
棉花黃萎病的分類識別過程包括圖像數(shù)據(jù)的輸入、對圖像數(shù)據(jù)的預(yù)處理、對圖像數(shù)據(jù)進行的提取、分類處理和輸出結(jié)果。具體流程如下。
第一,在生長期間將部分棉花接種黃萎病,運用Pro高性能機載熱紅外成像儀(Workswell公司,捷克)拍攝熱圖像圖片。設(shè)定鏡頭距離地面高度大于130 cm,用以確保圖像可以完整捕捉棉株單株。
第二,設(shè)立對照組和真菌接種組,通過對40株接種棉花黃萎病菌和40株未接種棉花黃萎病菌的棉花觀察,做圖像數(shù)據(jù)采集,從而建立棉花黃萎病樣本庫,并提取感興趣區(qū),生成感興趣區(qū)的RGB圖像、紅外圖像和融合圖像。完成機器分類前的人工處理,建立了樣本庫與測試庫,便于之后的學(xué)習(xí)、測試。
第三,按照算法分析并計算棉花黃萎病的特征參數(shù),得到從卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)輸出的分類器結(jié)果,按照結(jié)果,計算機進行自動分類,并輸出棉花黃萎病分類結(jié)果。
一般情況下,中紅外區(qū)是2.5~25 μm的紅外波段[19]。植被溫度與大氣溫度接近。雖然大氣溫度每天都有變化,但不同部位會有所不同。也就是說,健康區(qū)域和不健康區(qū)域會有明顯差異[20]。因此可以利用中紅外熱成像技術(shù)獲取植株基于熱圖像特征的差異,從而形成對健康植株和不健康植株區(qū)分的分類依據(jù)。
在正式的采集前,先設(shè)立對照組和真菌接種組。接種一段時間后,使用Pro高性能機載熱紅外成像儀拍攝2組植株(對照組和真菌接種組)的熱圖像圖片。
紅外圖像具有全天候工作、抗干擾能力強的優(yōu)點,但是紅外圖像存在對比度低、清晰度低、可視性差、細節(jié)信息匱乏、對溫差敏感等缺點,使圖像中的目標和場景難以識別、分析。因此,本文引入圖像融合。
圖像融合是將兩幅或多幅圖像利用特定的算法綜合成一幅新的圖像的方法。在進行融合之前要事先經(jīng)過去噪、配準等處理過程,然后在利用特定的算法對圖像進行融合。
圖像融合的一般過程為特征提取、后期優(yōu)化和融合3個步驟。特征提取是通過數(shù)學(xué)模型,從源圖像中提取圖像特征的過程,一般包括圖像分割、特征表示和特征選擇3步。后期優(yōu)化是利用中心像素與鄰域內(nèi)像素的關(guān)系,對特征的優(yōu)化。最后,圖像融合是采用加權(quán)平均等規(guī)則完成圖像的合并。
3.4.1 卷積神經(jīng)網(wǎng)絡(luò)
卷積神經(jīng)網(wǎng)絡(luò)是一類深度神經(jīng)網(wǎng)絡(luò),其中包含卷積計算,是深度學(xué)習(xí)的代表算法之一[21-22]。CNN是為解決圖像識別問題而專門設(shè)計的一種神經(jīng)網(wǎng)絡(luò)。在圖像處理的相關(guān)領(lǐng)域,CNN有十分出色的表現(xiàn)[23]。實質(zhì)上,CNN是一種由輸入到輸出的映射。CNN不需要任何確定的數(shù)學(xué)公式,而是通過大量的從輸入到輸出的映射關(guān)系的學(xué)習(xí),從而獲得了從輸入到輸出的映射能力[24]。CNN應(yīng)用廣泛,其應(yīng)用領(lǐng)域涉及圖像和視頻的識別、圖像分類、圖像分割、醫(yī)學(xué)圖像分析、自然語言處理和推薦系統(tǒng)等[25]。
CNN一般由輸入層、隱含層和輸出層構(gòu)成,其中隱含層一般包含卷積層、池化層和全連接層[26]。CNN的分類處理過程可概括如下:首先進行圖像數(shù)據(jù)獲取,并對圖像數(shù)據(jù)進行簡單的處理,如去噪等工作[27]。之后送入隱含層進行卷積、池化的運算。卷積層的功能是提取圖像特征,池化層的功能是對池化層的特征進行選擇和過濾。在反復(fù)地進行了卷積和池化的工作后,全連接層會將提取的特征進行線性組合而后輸出結(jié)果。
3.4.2 優(yōu)化改進
由于采用熱紅外成像技術(shù)獲取圖像數(shù)據(jù),本文對卷積神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)結(jié)構(gòu)提出了一種新的設(shè)計方案,包含卷積核數(shù)量的更變、卷積層數(shù)、卷積核的尺寸、激活函數(shù)等內(nèi)容的優(yōu)化,并采用多輸入多輸出模型。
網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計完成之后,為了進一步提高卷積神經(jīng)網(wǎng)絡(luò)的準確性,降低損失度。建議采用多種改進方法:①增加迭代次數(shù)。一個擁有大量數(shù)據(jù)的卷積神經(jīng)網(wǎng)絡(luò)需要經(jīng)過多次的迭代才能取得良好的訓(xùn)練成效,獲得理想的訓(xùn)練成果,增加迭代次數(shù),是直接提高穩(wěn)定性和準確率的有效手段。②調(diào)整學(xué)習(xí)率。學(xué)習(xí)率決定了神經(jīng)網(wǎng)絡(luò)能否成功收斂到局部最小值。過高的學(xué)習(xí)率會使得神經(jīng)網(wǎng)絡(luò)跳過全局最小值,從而導(dǎo)致無法收斂。過低的學(xué)習(xí)率會增加花費的時間,最優(yōu)的學(xué)習(xí)率能夠獲得高效而理想的局部最小值。③增加卷積神經(jīng)網(wǎng)絡(luò)的深度。通過增加神經(jīng)網(wǎng)絡(luò)的深度可以增加可學(xué)習(xí)參數(shù)的個數(shù),從而使得神經(jīng)網(wǎng)絡(luò)的擬合能力提高,對于提高準確率有一定的幫助。但同時注意,過高的深度一定程度上會導(dǎo)致過擬合。④數(shù)據(jù)增強。在不實質(zhì)性增加數(shù)據(jù)的前提下,對已有的數(shù)據(jù)集進行改變,諸如翻轉(zhuǎn)、旋轉(zhuǎn)等,從而獲得增加數(shù)據(jù)的效果。在進行數(shù)據(jù)增強后,使得增強后的數(shù)據(jù)集代表更為全面的數(shù)據(jù)集合,卷積神經(jīng)網(wǎng)絡(luò)因而可以從原始數(shù)據(jù)集提取更多的特征信息,從而防止過擬合現(xiàn)象。
本文介紹了一種基于卷積神經(jīng)網(wǎng)絡(luò)的棉花黃萎病監(jiān)測方法,建立了CNN模型,在已有的比較成熟的算法上進行測試,建立適合棉花黃萎病監(jiān)測的算法模型,最終獲得能夠成功辨識棉花是否感染黃萎病的成果。相較于傳統(tǒng)的人工監(jiān)測方法,該方法具有作業(yè)時間連續(xù)、效率高、準確率高的特點,克服了傳統(tǒng)人工監(jiān)測方法費時費力、主觀性強的缺點。對于監(jiān)測棉花黃萎病,有著不可多得的優(yōu)勢。但該方法也有局限性,對于有著輕微感染情況的棉花植株,難以完全準確地作出監(jiān)測判斷。在后續(xù)研究中,可以通過對算法的進一步優(yōu)化來解決。