黃太遠(yuǎn) 李旺 邱亞西 余小波
摘? ?要:針對茶葉常見葉部病斑圖像的形狀特點,將機(jī)器學(xué)習(xí)應(yīng)用于茶葉病害識別當(dāng)中。以茶葉3種常見病害作為研究對象,運(yùn)用支持向量機(jī)方法進(jìn)行分類識別研究,對有病害的茶葉圖像進(jìn)行處理和特征提取,利用徑向基核函數(shù)進(jìn)行分類來提高茶葉病害識別率。運(yùn)用分類識別方法對茶葉病害進(jìn)行研究,使茶葉在發(fā)病初期就能得到更好的預(yù)防以及后期能保證茶葉的質(zhì)量和產(chǎn)量,提高當(dāng)?shù)夭枞~的銷量,促進(jìn)經(jīng)濟(jì)發(fā)展。
關(guān)鍵詞:形狀特征;SVM多分類;茶葉病害;識別
文章編號: 1005-2690(2020)06-0007-02? ? ? ?中圖分類號: TP391.41;S435.711? ? ? ?文獻(xiàn)標(biāo)志碼: B
目前,銅仁市在栽茶和茶葉的病害處理方面還很薄弱,小部分做得較好一些的只有私人茶園,且采摘量只占全年總產(chǎn)量的40%左右[1],大多數(shù)茶葉在樹上老化或被蟲子、病菌感染發(fā)生了病變,茶葉的利用率低。而茶葉作為銅仁茶農(nóng)的主要經(jīng)濟(jì)來源,以茶葉病害為研究對象,對茶葉葉部病斑進(jìn)行圖像預(yù)處理,然后提取其病斑部分的形狀特征,對提取的特征數(shù)據(jù)利用支持向量機(jī)分類方法訓(xùn)練得出分類模型,對茶葉的常見病害進(jìn)行分類識別,以提高識別率,可促進(jìn)計算機(jī)智能識別在農(nóng)業(yè)中的應(yīng)用。
1? ?支持向量
支持向量機(jī)[2-4](Support Vector Machine,SVM)是一種將數(shù)據(jù)進(jìn)行分類后的算法,而SVM通常用于二元分類學(xué)習(xí),對于多元的主要是將其分為多個二元來解決數(shù)據(jù)分類。
數(shù)據(jù)的分類主要有線性可分、非線性可分兩類。為了能讓兩類正確分離且它們距離最大的分類平面成為最佳超平面,其方程為:
式中,ω表示分離超平面的法向量,b表示截距,位于分離超平面之上的樣本為正樣本,之下的為負(fù)樣本。
本文利用徑向基核函數(shù)[5-7](Radial Basis Function Kernel)將提取出來的數(shù)據(jù)進(jìn)行分類識別,RBF函數(shù)具有很強(qiáng)的靈活性,與其他的核函數(shù)相比參數(shù)較少。因此,大多數(shù)情況下,通過計算機(jī)計算時會比其他核函數(shù)的效率更高、運(yùn)算速度更快、性能更好。下面就是徑向基RBF核函數(shù)形式:
2? ?茶葉病害圖像特征提取
茶葉病害圖像包含了豐富的特征信息,如圖1所示。例如,形狀特征和紋理特征[8-10],按照形狀分類的現(xiàn)有技術(shù),本文利用茶葉病害部位的輪廓、凸凸和最小包圍盒得到形狀描述[11-12],利用這些形狀的相關(guān)數(shù)據(jù)計算出面積、矩形度、周長凹凸比、面積凹凸比、茶葉病害部位的伸長度和茶葉病害部位的圓度6種相對形態(tài)參數(shù)來提取所需的數(shù)據(jù)。
本文先提取茶葉病害部位的外部輪廓,通過采用輪廓跟蹤法對茶葉病害圖像進(jìn)行輪廓提取,具體算法步驟如下。
(1)對圖像預(yù)處理后的茶葉病害二值化圖像采用自頂向下、從左到右的順序進(jìn)行掃描,得到第一個像素點為1的點,此時將其作為起始點。
(2)通過步驟(1)得到起始點后,反方向查找此時該像素點在其8個方向上的領(lǐng)域點,若查找到該像素值為1的點且領(lǐng)域上包含0像素點,若該像素點在之前沒有被查找過,則將這個像素點作為當(dāng)前點,并記下對應(yīng)的鏈碼值。
(3)重復(fù)步驟(2),直到回到起始點。
(4)根據(jù)步驟(2)和(3)所記錄的鏈碼值,得到茶葉病害部位的形狀輪廓。
根據(jù)以上步驟提取茶葉病斑的數(shù)據(jù)見表1和表2。
3? ?試驗過程及結(jié)果分析
試驗環(huán)境是MATLAB2017b,利用SVM進(jìn)行分類。在試驗過程中用到libsvm工具包進(jìn)行測試和分類,先建立分類模型,然后利用得到的這個模型進(jìn)行分類。本次試驗總共選取了102個特征數(shù)據(jù)樣本,然后隨機(jī)抽取部分特征數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),再用剩下的特征數(shù)據(jù)作為測試數(shù)據(jù)。分析過程如下。試驗結(jié)果如圖2所示。
利用訓(xùn)練數(shù)據(jù)建立模型:
Model=svmtrain(trains_label,Trains_matrix,cmd)
其中svmtrain是模型訓(xùn)練函數(shù),trains_label為訓(xùn)練樣本類別,Trains_matrix為歸一化后的訓(xùn)練樣本的特征值,cmd為返回的模型值。
利用建立好的模型放在訓(xùn)練數(shù)據(jù)上的分類效果:
[predicts_label_1,accuracys_1,acc]=svmpredict(trains_label,Trains_matrix,Model)
result_1=[trains_label,predicts_label_1]
其中svmpredict是對測試集進(jìn)行預(yù)測,accuracy_1是分類的預(yù)測準(zhǔn)確度,通過有監(jiān)督的測試集值和預(yù)測值求百分比。
圖2a是在102個特征數(shù)據(jù)中選取40個進(jìn)行分類訓(xùn)練及創(chuàng)建模型,再將62個特征數(shù)據(jù)作為測試樣本進(jìn)行茶葉病害分類識別,得出的結(jié)果為87.10%。圖2b是在原本的基礎(chǔ)上選取50個進(jìn)行分類訓(xùn)練及創(chuàng)建模型,再將52個特征數(shù)據(jù)作為測試樣本進(jìn)行茶葉病害分類識別,得出的結(jié)果為90.38%。圖2c是在圖2b的基礎(chǔ)上增加了10個特征數(shù)據(jù)(即選取60個進(jìn)行分類訓(xùn)練及創(chuàng)建模型),再將42個特征數(shù)據(jù)作為測試樣本進(jìn)行茶葉病害分類識別,得出的結(jié)果為90.48%。圖2d同圖2c一樣,選取70個特征數(shù)據(jù)進(jìn)行分類訓(xùn)練及創(chuàng)建模型,再將32個特征數(shù)據(jù)作為測試樣本進(jìn)行茶葉病害分類識別,最后得出的結(jié)果為93.75%。
綜上所述,樣本數(shù)量一定的時候所選取的訓(xùn)練樣本越多,識別率就越高。當(dāng)訓(xùn)練數(shù)據(jù)和測試的比例達(dá)到一定值時,識別率將會在某一范圍波動,就像本試驗的數(shù)據(jù)結(jié)果,當(dāng)訓(xùn)練樣本達(dá)到一定的時候,識別精度就會在90.43%上波動。所以通過SVM分類器識別,具有識別率高、范圍廣等特點,可以有效地解決人工在監(jiān)控茶葉的過程中保證了茶葉的質(zhì)量和控制疾病的感染。
4? ?結(jié)語
由于茶農(nóng)對茶葉病害識別存在:主要依靠經(jīng)驗(主觀、局限、模糊),憑感覺對茶葉病害進(jìn)行診斷,往往在茶葉的感染程度較嚴(yán)重時肉眼才能識別,很難做到“對癥下藥”和及時防治,而且可能造成農(nóng)藥超標(biāo),影響茶葉的質(zhì)量。現(xiàn)提供一種基于人工智能(圖像處理和SVM分類)對茶葉常見病害進(jìn)行識別方法研究,以提高識別率。選取適合于茶葉病害的分類識別方法,促進(jìn)計算機(jī)智能識別技術(shù)在農(nóng)業(yè)中的應(yīng)用。
參考文獻(xiàn):
[ 1 ] 徐代剛.銅仁市茶產(chǎn)業(yè)發(fā)展分析[J].中國茶葉,2018,40(1):29-33.
[ 2 ] 劉衍琦,詹福宇,蔣獻(xiàn)文,等.MATLAB計算機(jī)視覺與深度學(xué)習(xí)實戰(zhàn)[M].北京:電子工業(yè)出版社,2017.
[ 3 ] 卓金武.MATLAB在數(shù)學(xué)建模中的應(yīng)用[M].北京:北京航空航天大學(xué)出版社,2014.
[ 4 ] Duan Li,Ruizheng Shi,Ni Yao,et al.Real-Time Patient-Specific ECG Arrhythmia Detection by Quantum Genetic Algorithm of Least Squares Twin SVM[J/OL].Journal of?Beijing Institute of Technology:1-10[2019-12-22].
[ 5 ] M. Dirbaz,T. Allahviranloo. Fuzzy multiquadric radial basis functions for solving fuzzy partial differential equations[J].Computational and Applied Mathematics,2019,38(4).
[ 6 ] 魏鋒濤,盧鳳儀.融合核函數(shù)在改進(jìn)徑向基代理模型中的應(yīng)用[J].計算機(jī)工程與應(yīng)用,2019,55(7):58-65.
[ 7 ] 陳瑤.基于徑向基網(wǎng)絡(luò)和支持向量機(jī)算法的板形缺陷識別的研究[D].天津:河北工業(yè)大學(xué),2015.
[ 8 ] Jiao Yin,Jinli Cao,Siuly Siuly,et al.An Integrated MCI?Detection Framework Based on Spectral-temporal Analysis[J].International Journal of Automation and Computing,2019,16(6):786-799.
[ 9 ] 歐利松.基于SVM的人臉識別系統(tǒng)設(shè)計與改進(jìn)[J].網(wǎng)絡(luò)安全技術(shù)與應(yīng)用,2019(12):58-60.
[ 10 ] 周凱紅,喬新新,李福敏.基于支持向量機(jī)的彩色圖像分割研究[J].現(xiàn)代電子技術(shù),2019,42(18):103-106,111.
[ 11 ] 郭志強(qiáng),胡永武,劉鵬,等.基于特征融合的室外天氣圖像分類[J/OL].計算機(jī)應(yīng)用:1-10[2019-12-22].
[ 12 ] 王艷玲,張宏立,劉慶飛,等.基于遷移學(xué)習(xí)的番茄葉片病害圖像分類[J].中國農(nóng)業(yè)大學(xué)學(xué)報,2019,24(6):124-130.