李亞文 趙杰 陳月星
摘 要:針對蘋果葉部常見病害實現(xiàn)綠色、無損檢測,提出了一種基于SVM和小波基特征提取的蘋果葉部病害識別算法。該算法通過對蘋果葉片圖像進行小波變換,提取出小波系數(shù)后,進一步執(zhí)行小波包變換,再提取出具有代表性的小波基特征,根據(jù)每個區(qū)域的特征參數(shù),得到一組小波基特征向量,然后通過SVM進行模型訓練,使用SVM分類器對不同病害進行分類識別。試驗結果表明,基于小波基特征提取的蘋果葉部病害識別算法,識別常見五種蘋果葉部病害準確率較高,可靠性較好,滿足實際生產(chǎn)中對蘋果葉部病害無損檢測的需求,為綠色、智慧果業(yè)提供技術支持。
關鍵詞:小波基特征;SVM訓練;特征提取;召回率
中圖分類號:TP391.41? ? 文獻標識碼:A? ? ?文章編號:1674-0033(2024)02-0026-09
引用格式:李亞文,趙杰,陳月星.基于小波基特征提取的蘋果葉部病害檢測算法設計[J].商洛學院學報,2024,38(2):26-34.
A Design of Apple Leaf Disease Detection Algorithm
Based on Wavelet Feature Extraction
LI Ya-wen1, ZHAO Jie1, CHEN Yue-xing2
(1.College of Electronic Information and Electrical Engineering of Shangluo University / Shangluo Artificial Intelligence Research Center? 726000, Shaanxi; 2.College of Biopharmaceutical and Food Engineering, Shangluo University, Shangluo? 726000, Shaanxi)
Abstract: For the green and non-destructive detection of common apple leaf diseases, an apple leaf disease recognition algorithm is proposed based on SVM and wavelet feature extraction. The algorithm performs wavelet transform on the apple leaf image. After extracting the wavelet coefficients, the wavelet packet transform is further performed to extract the representative wavelet basis features. According to the characteristic parameters of each region, a set of wavelet basis feature vectors is obtained. Then, the model is trained by SVM, and the SVM classifier is used to classify and identify different diseases. The experimental results show that the apple leaf disease recognition algorithm based on wavelet feature extraction has high accuracy and good reliability in identifying five common apple leaf diseases, which meets the needs of non-destructive detection of apple leaf diseases in actual production and provides technical support for green and intelligent fruit industry.
Key words: wavelet base characteristics; SVM training; feature extraction; recall rate
蘋果葉部病害的鑒別主要是通過技術人員到現(xiàn)場,根據(jù)病株的發(fā)病部位、時期、病斑形狀和顏色等診斷,存在主觀性強、誤差大的缺點[1]。隨著機器學習和計算機視覺技術的發(fā)展,基于圖像處理和特征提取的自動化算法被廣泛應用于農(nóng)業(yè)研究領域,以實現(xiàn)對蘋果病害的自動識別和分類。早期病害圖像分類以傳統(tǒng)機器學習為主,經(jīng)過圖像預處理、圖像分割和特征提取后,再通過特定的機器學習算法訓練其對特定特征向量的分類能力,從而達到識別病害圖像的目的[2]。近幾年,一些研究者利用深度學習的相關算法提高了蘋果葉部病害識別的精度,江鵬等[3]提出了利用深度學習中的卷積神經(jīng)網(wǎng)絡(CNN)和SSD檢測器,通過對蘋果葉片圖像進行卷積和檢測,提高了病害檢測的準確率和魯棒性,可以有效地識別蘋果葉片病害的類型和位置。李鑫然等[4]建立了一種改進Faster R-CNN算法的蘋果葉片病害檢測模型,在RPN網(wǎng)絡中引入空洞卷積和級聯(lián)ROI池化層,提高蘋果葉片病害檢測的速度和準確率。潘仁勇等[5]通過利用DTS和ResNet結構,在卷積層之間添加殘差連接,加快信息傳遞和提高特征提取能力。趙嘉威等[6]提出了一種基于改進的YOLOv4算法的蘋果葉片病害檢測方法,針對網(wǎng)絡結構、數(shù)據(jù)增強和損失函數(shù)的改進,實現(xiàn)對蘋果葉片病害特征的精準分類和定位。Erveen Kahkashan等[7]提出了一種基于多維注意力機制的CNN模型,在基于多維注意力機制的CNN模型中卷積和池化的基礎上,加入了注意力機制,從而更加有效地提取蘋果葉片病害的特征參數(shù)。本文提出了一種基于SVM和小波基特征提取的蘋果葉部病害識別算法,通過提取蘋果葉部的小波基特征參數(shù)并進行SVM分類訓練,實現(xiàn)對蘋果常見的五種病害的快速、高效的檢測識別。
1? 小波基特征
小波特征提取[8]是一種信號處理技術,通過對信號進行小波變換來獲取有用的特征信息。其原理是利用小波分析對信號進行多尺度、多分辨率的分解,將信號分解為不同頻率的子帶,進而從中提取出與應用相關的特征。特征提取是指從數(shù)據(jù)中提取有用特征的降維或函數(shù)映射的過程。特征提取、選擇和構造是篩選數(shù)據(jù)或實例等簡約的有效方法,其目標是減少數(shù)據(jù)量、關注相關數(shù)據(jù)、提高數(shù)據(jù)質量。
小波特征提取主要包括5個參數(shù):均值、標準差、方差、水平高頻能量和垂直高頻能量。
1)均值:表示子帶信號中各個采樣點的平均值,是描述信號整體趨勢的一個指標。對于第j層小波包系數(shù),其均值為:
Meanj=[][N][i=1][ωj,i](1)
式(1)中,ωj,i表示第j層第i個小波包系數(shù),N表示第j層小波包系數(shù)的個數(shù)。
2)標準差:表示子帶信號中各個采樣點與均值之間的離散程度,是描述信號波動性的一個指標。對于第j層小波包系數(shù),其標準差為:
SDj=(2)
3)方差:表示子帶信號中各個采樣點與均值之間的離散程度的平方,是描述信號波動性的另一個指標。對于第j層小波包系數(shù),其方差為:
Varj=[N][][i=1][(ωj,i-Meanj)2](3)
4)水平高頻能量:表示子帶信號中水平方向上的高頻分量的能量大小,是描述信號在水平方向上的細節(jié)特征的一個指標。對于第j層小波包系數(shù),其水平高頻能量為:
EH,j=[N][][i=1][ω](4)
式(4)中,ω表示第j層第i個小波包系數(shù),N表示第j層小波包系數(shù)的個數(shù)。
5)垂直高頻能量:表示子帶信號中垂直方向上的高頻分量的能量大小,是描述信號在垂直方向上的細節(jié)特征的一個指標。對于第j層小波包系數(shù),其垂直高頻能量為:
EV,j=[N][][i=1][ω](5)
6)對角線高頻能量:表示子帶信號中對角線方向上的高頻分量的能量大小,是描述信號在對角線方向上的細節(jié)特征的一個指標。對于第j層小波包系數(shù),其對角線高頻能量為:
ED,j=[N][][i=1][ω](6)
式(6)中,ωj,i表示第j層第i個小波包系數(shù),N表示第j層小波包系數(shù)的個數(shù)。
這些參數(shù)可以用于信號處理、特征提取和模式識別等領域,對于理解和分析信號的特征具有重要的意義。
2? 支持向量機
SVM是一種基于統(tǒng)計學習和凸優(yōu)化的方法,可用于模式識別和回歸估計[9],它屬于機器學習、模式識別和人工神經(jīng)網(wǎng)絡等多個學科,SVM是基于統(tǒng)計學習理論建立的模型,因此它需要大量的訓練數(shù)據(jù)來保證分類器的準確性和魯棒性。
設置訓練樣本為xi,i=1,2,…,n,相對應的期望輸出為yi={+1,-1},+1和-1分別表示不相同的兩個類型。假定分類面的方程為:
wx+b=0(7)
yi(xi+b)-1≥0(8)
可以計算出分類間隔為:
-=(9)
訓練目標是最大化分類間隔,使‖w2‖最小化。然后,將最優(yōu)分類問題變換成以下約束條件下優(yōu)化問題,就可以得到式(10)的最小值[10-11]。
Φ(w)=‖w2‖(10)
yi(xiw+b)-1≥0(11)
使用拉格朗日乘子的方法,可以進行相應的轉換。
[l][][i=1][aiyi(xiw+b)+][l][][i=1][ai][L=‖w‖2-](12)
[*][ai]{[xiw+b]yi-1}=0(13)
對于大多數(shù)的樣本,[*][ai]取0,而對取值不是0的[*][ai],yi(xiw+b)-1≥0等號成立,這些樣本稱為支持向量(Support Vector)。
3? 算法實現(xiàn)
3.1 算法實現(xiàn)技術方案
本算法以蘋果葉部5種病害為研究對象,建立采集蘋果葉部病害數(shù)據(jù)集,對圖像經(jīng)過前期預處理,針對預處理后的5種蘋果葉部病害圖像數(shù)據(jù)集,使用小波包變換進行圖像特征提取,并通過特征選擇算法篩選出最能表征這5種葉部病害的特征向量,然后利用訓練集的特征向量和對應的病害標簽訓練SVM分類器,并將其應用于測試集中的葉片圖像分類,算法實現(xiàn)的具體技術路線如圖1所示。
3.2 數(shù)據(jù)采集和環(huán)境搭建
本研究使用的蘋果葉部病害圖像數(shù)據(jù)集來源于飛槳數(shù)據(jù)集(https://aistudio.baidu.com/aistudio/datasetdetail/11591/0),選取其中1 000張圖片作為測試集,其中包括:花葉病216張圖像(如圖2)、銹病190張圖像(如圖3)、灰斑病192張圖像(如圖4)、斑點落葉病210張圖像(如圖5)、褐斑病192張圖像(如圖6)等,以5種蘋果病害葉部作為訓練樣本,訓練集用來訓練模型,驗證集用來調(diào)整模型的超參數(shù)(如學習率、正則化強度等),測試集用來評估模型的泛化能力。
算法模型訓練試驗環(huán)境設置如表1所示,試驗中深度學習框架是由Pytorch平臺搭建。
表1? 算法模型訓練試驗環(huán)境
3.3 小波基特征提取
試驗中定義了一個函數(shù)(extract_features)來從圖像中提取特征[12-13]。該函數(shù)通過執(zhí)行小波分解(具體使用db2小波,分解級別為2)來提取紋理特征中的統(tǒng)計特征,然后將得到的所有系數(shù)串聯(lián)成一個特征向量。
運用小波基特征提取方法時,使用Python編程語言的學習庫(scikit-learn庫)。調(diào)用 extract_features函數(shù)對圖像進行紋理特征提取,使用選定的小波基函數(shù)db2對信號進行小波變換,得到小波系數(shù),從小波系數(shù)中提取小波包特征使用小波包分解方法,計算每個小波包子帶的能量、熵、標準差等特征,將其作為特征向量,并將結果存儲在feature變量中。先提取數(shù)據(jù)集1 000張圖像的小波系數(shù),再計算小波包特征的均值、標準差、方差、水平高頻能量、垂直高頻能量和對角線高頻能量,表2中展示20張樣本測試的小波特征數(shù)據(jù)值。
4? 試驗測試與結果分析
4.1 參數(shù)指標
準確率(precision)、召回率(recall)和F1值是用于評估二分類問題模型性能的常用指標[14],與SVM模型的訓練和評估密切相關。準確率是指模型正確分類的樣本數(shù)與總樣本數(shù)之比。準確率高表示模型的分類精度高,但無法反映模型的分類能力在正例和負例兩個類別上的表現(xiàn)。TP表示真正例(分類器將正例正確分類為正例的樣本數(shù)),TN表示真負例(分類器將負例正確分類為負例的樣本數(shù)),F(xiàn)P表示假正例(分類器將負例錯誤分類為正例的樣本數(shù)),F(xiàn)N表示假負例(分類器將正例錯誤分類為負例的樣本數(shù))。
準確率代表分類器正確分類的正例占所有分類為正例的樣本數(shù)的比例:
Precision=(14)
召回率是指模型能夠正確識別正例樣本的能力,即模型對于所有真實正例中識別出的正例樣本的比例[15]。召回率高說明模型能夠覆蓋較多的正例樣本,但無法保證對負例樣本的分類效果。召回率代表真實正例中被分類器正確分類的比例:
Recall=(15)
F1值綜合考慮了準確率和召回率,是一個綜合評價指標[16]。在SVM中,F(xiàn)1值由精度和召回率的調(diào)和平均數(shù)得到。F1值越高說明模型的分類效果越好,在正例和負例兩個類別上的表現(xiàn)都較好。
F1值將準確率和召回率進行平均,是綜合評價分類器性能的指標:
F1-score=(16)
精確率代表分類器正確分類的比例:
Accuracy=(17)
4.2 試驗測試的結果與分析
通過小波基特征提取訓練樣本后,送入SVM中進行分類訓練,SVM的核心思想是尋找一個最優(yōu)的決策邊界或者超平面,將數(shù)據(jù)點分為兩個不同的類別,并具有優(yōu)秀的泛化性能,使用測試集來評估訓練好的模型,計算出分類精度,試驗中計算了測試集樣本精度的核心指標參數(shù)準確率、召回率和F1值等,測試樣本精度如表3所示。
歸納分析蘋果葉部病害中:花葉病、銹病、灰斑病、斑點落葉病和褐斑病樣本測試的核心指標參數(shù):準確率(precision)、召回率(recall)和F1值,檢測結果如表4所示。
表4? 蘋果葉部病害檢測結果
分析表4可知,銹病的準確率、召回率和F1值均較高,說明模型對蘋果銹病的檢測效果較好;蘋果褐斑病的準確率、召回率和F1值也較高,但相比于銹病還是稍微有所退步;蘋果花葉病的準確率、召回率和F1值較低,說明模型對蘋果花葉病的識別效果較差,需要進一步優(yōu)化算法或增加樣本量;蘋果灰斑病和蘋果斑點落葉病的準確率、召回率和F1值都處于中等水平,但相對來說還是比蘋果花葉病的檢測效果好。
試驗結果顯示,該算法在蘋果葉部病害識別方面取得了較好的效果,分類報告則提供了更詳細的信息,包括每個類別的準確率(precision)、召回率(recall)和F1值,準確率反映了模型分類正確的比例;召回率反映了模型對真實樣本的分類能力;F1值綜合了準確率和召回率兩個指標,可作為評價模型綜合性能的重要指標。
5? 結語
本文設計了一種基于小波基特征提取的蘋果葉部病害識別算法,該算法基于采集到的蘋果葉部圖像,通過小波變換得到小波基特征,然后使用SVM分類器對不同病害進行分類識別。使用小波變換對每個區(qū)域進行特征提取,得到一組小波基特征向量。利用支持向量機(SVM)對特征向量進行分類訓練。本研究表明,該算法利用小波變換對圖像進行特征提取,具有更好的非線性逼近能力和更高的分類準確率。該算法在識別不同病害方面具有較高的準確率和魯棒性,為智慧農(nóng)業(yè)的推廣提供了一種快速、準確、可靠的綠色無損病害檢測方法,同時也為蘋果葉部病害分類等相關領域的研究提供了新的思路和方法。
參考文獻:
[1]? 王遠志,施子珍,張艷紅.改進的Faster R-CNN用于蘋果葉部病害檢測[J].安慶師范大學學報(自然科學版),2022,28(2):26-30.
[2]? 黨榮輝,寧紀鋒.基于MATLAB的陜西蘋果葉片病害識別研究[J].農(nóng)村科學實驗,2017(2):116-118.
[3]? 江鵬,陳躍翰.基于SSD蘋果葉片病害檢測方法[J].電子技術與軟件工程,2019(10):56.
[4]? 李鑫然,李書琴,劉斌.基于改進Faster R_CNN的蘋果葉片病害檢測模型[J].計算機工程,2021,47(11):298-304.
[5]? 潘仁勇,張欣,陳孝玉龍,等.基于DTS-ResNet的蘋果葉片病害識別方法[J].國外電子測量技術,2022,41(9):142-148.
[6]? 趙嘉威,田光兆,邱暢,等.基于改進YOLOv4算法的蘋果葉片病害檢測方法[J].江蘇農(nóng)業(yè)科學,2023,51(9):193-199.
[7]? PERVEEN K, KUMAR S, KANSAL S, et al. Multidimensional attention-based CNN model for identifying apple leaf disease[J].Journal of Food Quality,2023,2023:1-12.
[8]? YAN Q, YANG B H, WANG W Y, et al. Apple leaf diseases recognition based on an improved convolutional neural network[J].Sensors,2020,20(12):256-274.
[9]? 張穎,馬承澤,楊平,等.基于小波變換和改進PCA的人臉特征提取算法[J].吉林大學學報(理學版),2021,59(6):1499-1503.
[10] 王曉柱,鈕賽賽,張凱,等.基于小波變換與特征提取的紅外弱小目標圖像融合[J].西北工業(yè)大學學報,2020,38(4):723-732.
[11] 王云露.基于深度遷移學習的蘋果病害識別方法研究[D].泰安:山東農(nóng)業(yè)大學,2022:9-11.
[12] 楊春艷,陳英,劉飛,等.蘋果葉部病害的傅里葉變換紅外光譜鑒別研究[J].河南農(nóng)業(yè)科學,2017,46(6):156-160.
[13] 晁曉菲.基于深度學習的常見蘋果葉片病害識別與病斑分割方法研究[D].楊凌:西北農(nóng)林科技大學,2021:13-15.
[14] 金海彬,呂志賢,侯木舟,等.基于特征融合與SVM的內(nèi)鏡圖像分類算法研究[J].中北大學學報(自然科學版),2023,44(1):86-96.
[15] 于雪瑩,高繼勇,王首程,等.基于生成對抗網(wǎng)絡和混合注意力機制殘差網(wǎng)絡的蘋果病害識別[J].中國農(nóng)機化學報,2022,43(6):166-174.
[16] 姜紅花,楊祥海,丁睿柔,等.基于改進ResNet18的蘋果葉部病害多分類算法研究[J].農(nóng)業(yè)機械學報,2023,54(4):295-303.