李妍++朱景福++羅文博++王孟博++高寒++于成江
摘要:為了更好地防治玉米病害,使用BP神經(jīng)網(wǎng)絡(luò)、L-M算法優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)和FCM聚類算法對(duì)玉米的3種葉片病斑圖像進(jìn)行識(shí)別研究。利用圖像處理技術(shù)對(duì)采集的圖像進(jìn)行預(yù)處理和閾值分割,提取3個(gè)顏色特征、9個(gè)紋理特征和7個(gè)形狀特征,通過LLE算法降維獲得6維的內(nèi)在低維流形特征,使用3種算法對(duì)提取的特征參數(shù)進(jìn)行識(shí)別。結(jié)果表明,從識(shí)別率和網(wǎng)絡(luò)訓(xùn)練速度2個(gè)方面來看,L-M算法優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)識(shí)別率高達(dá)98.67%,且訓(xùn)練速度快,更適合作為玉米葉片病斑圖像的識(shí)別算法。
關(guān)鍵詞:玉米葉片病斑;圖像處理技術(shù);LM算法;優(yōu)化;神經(jīng)網(wǎng)絡(luò);特征;識(shí)別
中圖分類號(hào): TP391.4文獻(xiàn)標(biāo)志碼: A
文章編號(hào):1002-1302(2017)09-0184-03
玉米是我國(guó)的主要糧食作物之一,在眾多影響玉米生產(chǎn)的因素中,病斑對(duì)玉米產(chǎn)量的影響日趨嚴(yán)重。玉米在我國(guó)種植范圍廣且種植面積大,防治玉米病害一直是困擾廣大農(nóng)民的一項(xiàng)重要工作。玉米葉片病斑的種類多樣,本研究針對(duì)其中比較典型的矮花葉病、灰斑病和大斑病進(jìn)行研究。隨著科技的進(jìn)步和人工智能技術(shù)的發(fā)展,國(guó)內(nèi)外專家和學(xué)者在農(nóng)作物的病斑自動(dòng)識(shí)別和診斷方面做了大量的工作[1]。其中,Guyer等提取了17個(gè)形狀特征對(duì)作物進(jìn)行分類,建立了機(jī)器智能視覺系統(tǒng)[2]。Zhang等使用形狀分析和顏色分析2種方法對(duì)小麥地的小麥葉片和雜草進(jìn)行識(shí)別[3]。Wang等在葉片重疊和雜質(zhì)干擾的條件下使用自動(dòng)標(biāo)記的分水嶺算法對(duì)葉片圖像進(jìn)行分割,然后對(duì)分割好的圖像進(jìn)行模式識(shí)別[4]。目前的識(shí)別方法大多數(shù)都是提取顏色或形狀等特征,特征單一、數(shù)據(jù)量少且識(shí)別結(jié)果不理想。
本研究提出了一種把顏色特征、形狀特征、紋理特征和內(nèi)在低維流行特征相結(jié)合,識(shí)別多種玉米葉片病斑特征的分類方法。首先對(duì)3種玉米葉片病斑圖像進(jìn)行采集及預(yù)處理,然后提取顏色、形狀、紋理和內(nèi)在低維流行等特征,最后使用BP神經(jīng)網(wǎng)絡(luò)、L-M算法優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)和FCM聚類算法對(duì)特征參數(shù)進(jìn)行識(shí)別分類,取得了很好的識(shí)別結(jié)果。
1特征提取
1.1玉米病斑圖像采集及預(yù)處理
在黑龍江八一農(nóng)墾大學(xué)的試驗(yàn)田使用SONY DSC-W350D型號(hào)的相機(jī)在田間拍攝玉米病斑葉片的圖像,相機(jī)分辨率設(shè)置為640×480,共采集300幅玉米矮花葉病、大斑病和灰斑病的病斑葉片圖像。拍攝完成后,將圖像傳入實(shí)驗(yàn)室的電腦,采用.jpg格式進(jìn)行保存。為了減少計(jì)算量,在保證病斑完整和不影響后期識(shí)別效果的情況下,將圖像統(tǒng)一裁剪為131×86像素。由于拍攝時(shí)圖像受到了光照、灰塵等噪聲干擾,本研究首先對(duì)圖像銳化和中值濾波,消除噪聲的影響,然后進(jìn)行閾值分割。
由于背景、葉片和病斑占據(jù)不同的灰度級(jí),根據(jù)灰度級(jí)的差異采用3次分割,分別選擇病斑區(qū)域、葉片區(qū)域和背景區(qū)域,計(jì)算其顏色均值,根據(jù)顏色與病斑、背景、葉片的距離來確定圖像類別,如果是病斑類,就保留下來,其他就歸0。分割圖像如圖1所示。
1.2可視特征提取
特征提取是圖像識(shí)別的重要環(huán)節(jié),提取的特征參數(shù)會(huì)嚴(yán)重影響后期的識(shí)別效果。根據(jù)這3種玉米葉片病斑的特點(diǎn),本研究分別提取3個(gè)顏色特征、7個(gè)形狀特征、9個(gè)紋理特征以及6維內(nèi)在低維流行特征。
1.2.1顏色特征
顏色特征是一種描述圖像對(duì)應(yīng)的景物表面性質(zhì)的全局特征,它不受圖像旋轉(zhuǎn)、平移變化和圖像尺度變化的影響,不同顏色模型的識(shí)別效果不同。本研究選用HSV顏色模型,將RGB顏色空間轉(zhuǎn)化成HSV空間消除拍攝時(shí)亮度的影響,轉(zhuǎn)換公式為
將HSV模型的3個(gè)分量完成非均勻量化,首先把H分量分成8份,S、V分量分別分成3份,然后使得3個(gè)分量擬合成Lb=9H+3S+V的一維特征值,計(jì)算L(其中0≤b≤71),顏色直方圖的每個(gè)bin[5]表示L值,再計(jì)算L內(nèi)的像素?cái)?shù)量生成72 bin直方圖并提取均值、方差、能量特征參數(shù)。
1.2.2形狀特征
在計(jì)算機(jī)視覺中,形狀特征是由景物與區(qū)域特點(diǎn)構(gòu)成的影像特征,屬于影像的中間層特征。在圖像像素?cái)?shù)目一定的前提下,無論圖像旋轉(zhuǎn)、平移還是改變圖像的尺寸,提取的圖像形狀特征參數(shù)都是不變的。本研究采用Hu矩[6]來提取圖像中目標(biāo)區(qū)域的形狀特征參數(shù),定義Hu不變矩是關(guān)于圖像區(qū)域的7個(gè)面積歸一化中心矩的函數(shù),7個(gè)面積歸一化中心矩為{η11,η02,η20,η12,η21,η03,η30},輸入二值化圖像,用零階中心矩對(duì)其余各階中心矩進(jìn)行歸一化,得到圖像的歸一化中心矩,再利用二階和三階歸一化中心矩計(jì)算出圖像的7個(gè)不變矩。
1.2.3紋理特征
1973年,Haralick等提出在估計(jì)圖像的二階組合條件概率密度函數(shù)基礎(chǔ)上建立灰度共生矩陣的方法[7]?;叶裙采仃囀敲枋?對(duì)具有灰度值i和j出現(xiàn)概率的像素,它們?cè)讦确较蛏舷喔鬱像素距離,標(biāo)記該元素為p(i,j|d,θ),圖像的灰度級(jí)決定它的階數(shù)[5,8]。本研究采取共生矩陣的計(jì)算方法來計(jì)算玉米葉片病斑圖像的能量、信息熵、慣性矩、相關(guān)性和局部穩(wěn)定性等參數(shù)來表示圖像的紋理特征。
1.3內(nèi)在低維特征
圖像的維數(shù)過高導(dǎo)致計(jì)算時(shí)處理速度太慢,因此需要對(duì)圖像進(jìn)行降維。本試驗(yàn)選擇非線性降維中LLE算法[9]提取圖像的內(nèi)在低維流行特征,LLE算法是由Rowels等提出的一種非線性數(shù)據(jù)能在降維后保持原有的數(shù)據(jù)拓?fù)浣Y(jié)構(gòu)不變的降維技術(shù),該算法可以挖掘出任意高維數(shù)據(jù)集的低維結(jié)構(gòu)[10]。算法運(yùn)算步驟:(1)計(jì)算出樣本近鄰點(diǎn)個(gè)數(shù)k;(2)計(jì)算出樣本點(diǎn)的局部重建權(quán)值矩陣W,定義重構(gòu)誤差和局部協(xié)方差矩陣C,通過最小化得到:
(3)樣本點(diǎn)從高維空間映射到低維空間中,滿足如下映射條件:
輸出值由樣本點(diǎn)的局部重建權(quán)值矩陣和它的近鄰點(diǎn)個(gè)數(shù)決定。根據(jù)多次試驗(yàn)發(fā)現(xiàn),樣本的近鄰點(diǎn)個(gè)數(shù)為5且降到6維時(shí),效果最佳。
2識(shí)別算法
2.1BP神經(jīng)網(wǎng)絡(luò)
BP神經(jīng)網(wǎng)絡(luò)是一種通過理論輸出值和實(shí)際輸出值的誤差來調(diào)整網(wǎng)絡(luò)權(quán)值的多層前饋神經(jīng)網(wǎng)絡(luò),名字源于使用向后傳播學(xué)習(xí)算法的網(wǎng)絡(luò)權(quán)值調(diào)整規(guī)則[11]。其機(jī)理是在神經(jīng)網(wǎng)絡(luò)中,由于各層之間的連接權(quán)重可以借助誤差反傳算法進(jìn)行計(jì)算,因此權(quán)重是神經(jīng)網(wǎng)絡(luò)中最主要的參數(shù)。當(dāng)一個(gè)神經(jīng)網(wǎng)絡(luò)模型獲取到輸入和輸出變量之間的映射關(guān)系后,就能根據(jù)輸入變量預(yù)測(cè)輸出的結(jié)果[12-13]。BP神經(jīng)網(wǎng)絡(luò)的計(jì)算過程為利用歷史數(shù)據(jù)集(xi,yi)m,其中xi表示輸入變量集,可由若干個(gè)不同屬性數(shù)據(jù)構(gòu)成,yi作為相對(duì)應(yīng)的輸出值,m表示訓(xùn)練樣本的個(gè)數(shù)。將歷史數(shù)據(jù)xi與yi放入神經(jīng)網(wǎng)絡(luò)模型中進(jìn)行學(xué)習(xí),可在輸入和輸出之間建立映射關(guān)系,其中xi表示輸入變量集,可由若干個(gè)不同屬性數(shù)據(jù)構(gòu)成,yi作為相對(duì)應(yīng)的輸出值,m表示訓(xùn)練樣本的個(gè)數(shù)。
2.2L-M算法
L-M算法是梯度下降法與牛頓法的一種折中算法,結(jié)合了牛頓法的局部收斂性和梯度法的全局特性,有效地解決了神經(jīng)網(wǎng)絡(luò)的收斂問題[14]。L-M優(yōu)化算法不僅僅沿著負(fù)梯度方向迭代,同時(shí)能夠使誤差在惡化的方向搜索。L-M算法能夠在最速梯度下降法和牛頓法之間自動(dòng)地調(diào)整網(wǎng)絡(luò)權(quán)值,有效地收斂網(wǎng)絡(luò)并提高網(wǎng)絡(luò)的收斂速度。其權(quán)值調(diào)整公式為:
式中:e表示誤差向量;J表示雅可比矩陣;_表示一個(gè)標(biāo)量。在L-M算法的網(wǎng)絡(luò)權(quán)值的調(diào)整中,隨著_的增加,L-M算法接近于最速下降法,學(xué)習(xí)速率較小,而_為0時(shí),L-M算法就變成了高斯-牛頓法之間的平滑調(diào)和。
2.3FCM聚類
FCM算法[15]是一種目前被廣泛應(yīng)用的聚類算法。FCM算法的思想是將整個(gè)權(quán)重的均方差最小化,同一簇內(nèi)的對(duì)象最為相似,不同的簇與簇相似度最小,F(xiàn)CM聚類算法的每個(gè)簇內(nèi)的特征向量是一個(gè)0~1之間的模糊值。FCM算法的基本處理過程為:
(a)初始化隸屬度矩陣U,范圍為0~1之間的任意數(shù);(b)計(jì)算聚類中心ci= ∑ umikxk∑ umik (i=1,2,…,c)的值,其中uik是元素i相對(duì)于類k的隸屬度;(c)計(jì)算價(jià)值函數(shù)Jm=∑mk=1∑ci=umik‖xk-ci‖2 的值,當(dāng)它小于某個(gè)確定的閾值或它相對(duì)上次價(jià)值函數(shù)值的改變量小于某個(gè)閾值,則算法停止;(d)按照公式 u(t+1)ik=‖xk-c(t)ii‖-2/(m-1)∑cj=1‖xk-c(t)j‖-2/(m-1)計(jì)算新的矩陣U,返回步驟(b)。
3試驗(yàn)與分析
3.13種算法對(duì)病斑分類識(shí)別
本研究提取了玉米病斑圖像的3個(gè)顏色特征、7個(gè)形狀特征、9個(gè)紋理特征以及6維內(nèi)在低維流行特征,選擇其中2個(gè)或多個(gè)特征自由組合構(gòu)成特征向量,使用BP神經(jīng)網(wǎng)絡(luò)、L-M算法優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)以及FCM聚類3種算法對(duì)特征向量進(jìn)行識(shí)別。從每種病斑的100幅圖像中隨機(jī)抽取75幅圖像作為訓(xùn)練樣本,其余25幅圖像作為測(cè)試樣本。訓(xùn)練集共225幅圖像,測(cè)試集共75幅圖像。訓(xùn)練集和測(cè)試集圖像如圖2、圖3所示。
通過Matlab神經(jīng)網(wǎng)絡(luò)工具箱建立3層BP神經(jīng)網(wǎng)絡(luò)模型,BP神經(jīng)網(wǎng)絡(luò)和L-M優(yōu)化算法的BP神經(jīng)網(wǎng)絡(luò)算法以自由組合構(gòu)成的特征向量作為網(wǎng)絡(luò)的輸入, 輸出的神經(jīng)元個(gè)數(shù)為1個(gè)(輸出為1表示矮花葉病,輸出為2表示大斑病,輸出為3表示灰斑?。?,訓(xùn)練次數(shù)設(shè)定為5 000次;FCM聚類算法對(duì)特征向量進(jìn)行聚類分析,隨機(jī)初始化劃分矩陣,然后開始迭代,加權(quán)指數(shù)設(shè)置為2,聚合中心數(shù)目,即類別數(shù)設(shè)置為3,經(jīng)過k輪迭代終止,收斂到一個(gè)極小值。
3.2識(shí)別結(jié)果與分析
采用上述算法對(duì)玉米葉片病斑圖像進(jìn)行識(shí)別分類,得到的正識(shí)率如表1所示。由表1可知,L-M算法優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)和BP神經(jīng)網(wǎng)絡(luò)算法的識(shí)別率明顯高于FCM聚類算法。2種神經(jīng)網(wǎng)絡(luò)算法對(duì)形狀、紋理和內(nèi)在低維流行特征組合構(gòu)成的特征向量識(shí)別率為98.67%,對(duì)顏色、形狀和內(nèi)在低維流行特征組合構(gòu)成的特征向量識(shí)別率為98.67%,對(duì)顏色、形狀、紋理和內(nèi)在低維流行特征組合構(gòu)成的特征向量識(shí)別率為98.67%。
雖然2種神經(jīng)網(wǎng)絡(luò)算法的最好識(shí)別率相同,但是這2種算法的訓(xùn)練性能卻有很大的差異。BP神經(jīng)網(wǎng)絡(luò)沿局部改善的方向逐漸調(diào)整網(wǎng)絡(luò)權(quán)值,使算法的權(quán)值收斂到局部極小點(diǎn),導(dǎo)致網(wǎng)絡(luò)訓(xùn)練失?。挥捎趦?yōu)化的目標(biāo)函數(shù)較復(fù)雜,權(quán)值誤差改變小,使訓(xùn)練過程幾乎停頓,導(dǎo)致BP神經(jīng)網(wǎng)絡(luò)算法收斂速度慢。L-M算法優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)在201步訓(xùn)練后達(dá)到目標(biāo),收斂速度快;而BP神經(jīng)網(wǎng)絡(luò)在5 000步訓(xùn)練后也沒有達(dá)到目標(biāo)。BP神經(jīng)網(wǎng)絡(luò)與L-M算法優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)相比,BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練收斂速度慢,很難達(dá)到設(shè)定的目標(biāo),易陷入局部極小值,無法得到最優(yōu)解。L-M算法優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練性能如圖4所示。
4結(jié)論
本試驗(yàn)以玉米葉片病斑圖像為研究對(duì)象,提取了病斑的顏色、形狀、紋理和內(nèi)在低維流行特征,采用BP神經(jīng)網(wǎng)絡(luò)、L-M算法優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)和FCM聚類算法對(duì)提取的特征向量進(jìn)行識(shí)別,其中BP神經(jīng)網(wǎng)絡(luò)和L-M算法優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)正確識(shí)別率均高達(dá)98.67%,但從識(shí)別效果和網(wǎng)絡(luò)訓(xùn)練性能2個(gè)方面來看,L-M算法優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)不僅識(shí)別精度高,而且能夠根據(jù)當(dāng)前誤差動(dòng)態(tài)地調(diào)整學(xué)習(xí)速率,以加快其誤差收斂速度,并避免出現(xiàn)大幅度振蕩現(xiàn)象。L-M算法優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)算法更適合作為識(shí)別算法應(yīng)用于此類識(shí)別中,有利于后期進(jìn)一步研究推廣,具有一定的實(shí)用性。
參考文獻(xiàn):
[1]管澤鑫. 基于圖像的水稻病害識(shí)別方法研究[J]. 中國(guó)水稻科學(xué),2010,24(5):497-502.
[2]Guyer D E, Miles G E, Gaultney L D, et al. Application of machine vision to shape analysis in leaf and plant identification[J]. Transactions of the ASAE,1993,36(1):163-171.
[3]Zhang N, Chaisattapagon C. Effective criteria for weed identification in wheat fields using machine vision[J]. Transactions of the ASAE,1995,38(3):965-974.[4]Wang X F, Huang D S, Du J X, et al. Classification of plant leaf images with complicated background[J]. Applied Mathematics & Computation,2008,205(2):916-926.
[5]Bradski G R, Kaehler A. Learning OpenCV computer vision with the OpenCV library[M]. California:OReilly Media,2008.
[6]岡薩雷斯. 數(shù)字圖像處理[M]. 2版. 阮秋琦,阮宇智,譯. 北京:電子工業(yè)出版社,2003.
[7]Haralick R,Shanmugan K,Dinstein I.Textural features for image classification[C]. System Man & Cybernetics IEEE Transactions on,1973,3:610-621.
[8]方如明,蔡健榮. 計(jì)算機(jī)圖像處理技術(shù)及其在農(nóng)業(yè)工程中的應(yīng)用[M]. 北京:清華大學(xué)出版社,1999.
[9]杜春. 基于改進(jìn)局部切空間排列的流形學(xué)習(xí)算法[J]. 電子與信息學(xué)報(bào),2014,36(2):277-284.
[10]Rowels S T, Saul L K. Nonlinear dimensionality reduction by local linear embedding[J]. Science,2000,290(5500):2319-2323.
[11]田華,石圣羽. 基于不變矩特征及BP神經(jīng)網(wǎng)絡(luò)的圖像模式識(shí)別[J]. 河北大學(xué)學(xué)報(bào)(自然科學(xué)版),2008,28(2):214-217.
[12]張雨濃,勞穩(wěn)超,丁瑋翔,等. 基于ARIMA與WASDN加權(quán)組合的時(shí)間序列預(yù)測(cè)[J]. 計(jì)算機(jī)應(yīng)用研究,2015(9):2630-2633.
[13]Chen Y, Yi Z C. The BP artificial neural network model on expressway construction phase risk[J]. Systems Engineering Procedia,2012(4):409-415.
[14]Lera G, Pinzolas M. Neighborhood based Levenberg-Marquardt algorithm for neural network training[J]. IEEE Transactions on Neural Networks,2002,13(5):1200-1203.
[15]鈕永莉,陳水利. 模糊C均值算法的改進(jìn)[J]. 模糊系統(tǒng)與數(shù)學(xué),2004,18(9):304-308.