楊 濤,雷 進,朱皓睿,胡欽云,龍 波
(成都農(nóng)業(yè)科技職業(yè)學院機電信息學院,成都611130)
“中國麥冬之鄉(xiāng)”三臺縣有500多年麥冬種植栽培歷史,“涪城麥冬”成為全國麥冬知名品牌,其產(chǎn)量占全國60%以上,出口量占全國80%以上,縣內(nèi)產(chǎn)值超15億元[1]。然而,麥冬生產(chǎn)全程機械化程度不高,主要依靠人力。尤其是在麥冬病害防治方面,過度依賴農(nóng)民種植經(jīng)驗、缺乏理論依據(jù)和科學指導,時常因錯過最佳病害防治時期或防治措施不當帶來巨大經(jīng)濟損失[2,3]。農(nóng)作物病害防治一直是學者們研究的熱點問題之一,孫云云等[4]運用卷積神經(jīng)網(wǎng)絡(luò)方法對小樣本茶樹病害圖像識別展開了研究,基本實現(xiàn)了小樣本情況下有效區(qū)分3種易混病害;蔣豐千等[5]提出一種基于卷積神經(jīng)網(wǎng)絡(luò)的生姜病害識別系統(tǒng),并利用Qt開發(fā)了人機交互界面,顯示了生姜所對應的4種病害及其患病概率;郭小清等[6]提出了一種適用于移動平臺的多尺度識別模型,使得系統(tǒng)內(nèi)存需求降低了95.4%;張善文等[7]提出了一種基于IDCNNs的蘋果葉部病害識別方法,能直接從病害圖像中提取分類特征并運用Softmax分類器成功分辨3種蘋果葉部病害;胡維煒等[8]利用中值濾波結(jié)合K-means聚類方法分割出小麥白粉病、條銹病以及葉銹病,再提取了顏色和紋理特征參數(shù),設(shè)計了一種基于Variance算法初選與序列浮動前向選擇搜索算法(SFFS)相結(jié)合的特征選擇方法,選出優(yōu)良的特征子集,實現(xiàn)小麥葉部3種病害的識別;王震等[9]提出了一種小型多旋翼無人機水稻白穗病害識別系統(tǒng),以無人機平臺作為圖像處理和識別的基礎(chǔ),提取Haar-like特征,運用Adaboost算法進行白穗訓練識別,其識別率可達93.62%;蘆兵等[10]基于高光譜與圖像融合特征建立了生菜3種病害的SVR預測模型,其識別率達92.23%,但其價格昂貴。研究提出了一種融合顏色、形態(tài)、紋理等特征的提取方法識別麥冬葉部黑斑病、炭疽病與葉枯病3種病害,以適應生產(chǎn)應用。
2019年7月在成都市青白江地區(qū)某麥冬種植基地自然光照條件下采集了3種病害(黑斑病、炭疽病、葉枯?。﹫D像各60張,其中,30張作為訓練樣本;另30張為測試樣本。為減小計算量、提高系統(tǒng)的運算速度將原始圖像統(tǒng)一裁剪為400×300像素大小,同時刪除無關(guān)的冗余信息。然后,使用直方圖均衡化技術(shù)對裁剪后的病害圖像進行增強處理,使得圖像的細節(jié)信息更清晰,提高圖像的質(zhì)量與可辨識度,便于人和計算機對圖像做進一步分析處理。此外,在圖像采集與傳輸過程中不可避免地存在一些噪聲[11]。因而,繼續(xù)使用中值濾波技術(shù)對增強后的病害圖像進一步去噪,以達到較好的平滑效果(圖1)。
為進一步提取病斑特征信息,分別使用雙峰法、最大類間方差法(Otsu)以及K-means聚類算法,分別對3種麥冬葉部病害圖像進行病斑分割,其效果見表1。由表1可知,K-means聚類分割算法能直接對彩色病害圖像進行處理,去掉大部分背景,再對其進行數(shù)學形態(tài)學處理能得到較為完整的病斑圖像。同時,避免了過分割和分割不徹底現(xiàn)象。
圖1 麥冬葉部病害圖像
表1 病斑分割效果
病害圖像特征提取是數(shù)字圖像處理的關(guān)鍵步驟之一,關(guān)系到分類器的效率與識別率[12]。因此,應提取病斑區(qū)分明顯、魯棒性較好的特征。常見的病斑特征提取方法以特征屬性的不同分為顏色特征、形態(tài)特征以及紋理特征提取。
顏色是描述病斑最直接的視覺特征并且對圖像本身的方向、尺寸、視角的依賴性較小,具有較強的魯棒性[13-15]。顏色矩是以數(shù)學方法為基礎(chǔ),通過計算矩特征進一步來描述圖像中的顏色分布情況,并且這些顏色特征信息主要集中在低階矩[11]。也就是說,只需要計算病斑圖像一階矩、二階矩、三階矩就可以描述病斑圖像的顏色信息,計算見公式(1)。
圖2 樣本顏色特征對比
式中,μi、σi、ζi分別為圖像的一階矩、二階矩、三階矩;Pij為第i個像素的第j個顏色分量;N為像素個數(shù)。
分別計算了病斑圖像在RGB與HSV顏色空間各顏色分量的一階矩、二階矩、三階矩(圖2)。由圖2可知,在RGB顏色空間的二階矩沒有明顯的差異,而其他特征參數(shù)均存在一定區(qū)分度,故可作為區(qū)別不同的病害的顏色特征。
病斑形狀特征與尺寸測量結(jié)合起來也是區(qū)分不同病斑的重要依據(jù)[12]?;诓“邎D像提取了以下幾何特征:①提取的是病斑大小A,在二值圖像中表現(xiàn)為灰度值為1的像素個數(shù),該特征受尺寸、扭曲、縮放、拍攝條件等影響較大。②運用Canny算子提取病斑圖像邊緣后再統(tǒng)計邊界像素數(shù)目,即病斑周長L。③圓形度也稱似圓度,表示的是圖像中某一目標圖像的形狀和圓形的相似程度,定義為區(qū)域面積A的4π倍與其周長L的平方之比,即④矩形度是描述目標在其最小外接矩形區(qū)域內(nèi)的充滿程度,矩形的矩形度為1,圓的矩形度為,正三角形的矩形度為0.5,而其他不規(guī)則形狀的矩形度在0~1。也就是說,能利用矩形度的值來區(qū)分矩形、圓與不規(guī)則形狀。⑤最小外接矩形的長寬比,該值不受圖像尺寸、方向的影響,是較為理想的幾何形狀特征?;诖耍謩e計算病斑圖像的5個幾何特征(面積A、周長L、圓形度C、矩形度Ro、長寬比Ra)并將結(jié)果繪制成圖3,其中,面積A、周長L2個特征因受圖像采集環(huán)境影響較大,而似圓度、矩形度以及最小外接矩形長寬比卻存在一定的差異,可作為區(qū)分不同病斑的形狀特征。
圖3 樣本病斑圖像形狀特征
病斑圖像紋理特征指的是病斑表面具有緩慢變化或周期性變化的表面結(jié)構(gòu)組織排列屬性,反映病斑的粗糙度、顆粒度等信息,不同的病斑往往呈現(xiàn)出不同的紋理[13]。常見的紋理特征描述方法主要有灰度差分統(tǒng)計法、自相關(guān)函數(shù)法、灰度共生矩陣法以及頻譜分析法[14]?;诨叶裙采仃嚪謩e計算距離d=2時,0°、45°、90°、135°4個方向上的能量、對比度、相關(guān)性以及熵的值(圖4)。由圖4可知,只有0°方向上對比度、相關(guān)性與熵病斑差異較明顯,能夠作為區(qū)分不同病斑的紋理特征。
圖4 樣本病斑圖像紋理特征值
在提取病害特征時,盡量多地提取認為可能有助于提高系統(tǒng)識別率的特征參數(shù)。事實上,其中存在一些具有相關(guān)性的冗余信息,會帶來龐大的計算量,影響到分類器的性能[15,16]?;诖?,結(jié)合方差比較法和主成分分析法(Principal Component Analysis,PCA)來進行特征選擇與優(yōu)化。首先,剔除方差較大的受外界影響較大的面積A、周長L2個離群特征參數(shù);其次,剔除了RGB顏色分量的二階矩等病害表征能力較差的特征參數(shù),僅僅保留了RGB各顏色分量的一階矩和三階矩、HSV各顏色分量的顏色矩、圓形度C、矩形度Ro、長寬比Ra以及0°方向上的對比度、相關(guān)性與熵,共21個特征參數(shù)融合成病害圖像特征向量。然后,運用PCA降維技術(shù)將特征向量降到了10維。
支持向量機(Support Vector Machine,SVM)是求解模式識別和函數(shù)估計問題的有效工具,尤其是運用核函數(shù)在低維空間中計算,較好地解決了高維空間中計算繁瑣、難度大的“維數(shù)災難”問題,特別是在小樣本的分類識別任務中表現(xiàn)良好[17,18]?;诖嗽O(shè)計了3個SVM分類器,試驗時,把待測樣本x→分別輸入到這3個分類器進行分類識別,得到3個分類結(jié)果分別記作若樣本屬于該類,則返回值為1;否則,返回值為-1。即
表2 識別結(jié)果
研究融合病斑圖像多個顏色、形狀、紋理特征信息,運用K-means聚類分割算法、PCA、SVM等技術(shù)成功識別出麥冬葉部3種病害。與卷積神經(jīng)網(wǎng)絡(luò)方法相比,該方法具有成本低、算法簡單、高效率等優(yōu)點,基本滿足使用要求,能為麥冬病害預防提供理論依據(jù),促進麥冬產(chǎn)業(yè)向著信息化發(fā)展。