李亞文,劉愛軍,陳 垚
(商洛學院電子信息工程與電氣工程學院/商洛市智慧農(nóng)業(yè)與技術(shù)應(yīng)用研究中心,陜西 商洛 726000)
大多數(shù)患病植物的癥狀均會在植物的葉片上表現(xiàn)出來,導(dǎo)致植物的內(nèi)在以及外部均發(fā)生改變[1],例如,植物病害葉片的顏色發(fā)黃或變?yōu)辄S褐色,葉子的紋理結(jié)構(gòu)和形狀發(fā)生變化[1,2]。所以,通過提取圖像的形狀、顏色及紋理等特征,就可以檢測出植物病害的情況。1996 年 Ahmad 等[3]通過彩色圖像信息的變化得出玉米葉片在缺氮和缺水情況下色彩特征微變,把它作為決定是否施用氮肥和灌溉的一個標準。2005 年程鵬飛[4]利用灰度共生矩陣來展現(xiàn)病害紋理特征,把葉片的能量、慣性矩、熵、均勻性等作為其統(tǒng)計特征。2007 年鄭世茶等[5]提出了基于形態(tài)特征棉花病害葉片的識別,提取的特征參數(shù)包括孔洞個數(shù)和面積、葉片面積、細化長度、腐蝕次數(shù),把它們的比值作為植物病害識別的依據(jù),最終得到不同的識別率。王玉德等[6]將紋理特征和顏色特征有效組合在一起,進行圖像分割研究。本研究以檢測植物葉部病害為研究目標,以黃瓜葉部炭疽病圖像為研究對象,利用K-means 聚類算法進行圖像閾值分割,并利用灰度共生矩陣提取紋理特征參數(shù),分析植物葉部病害情況。
紋理特征是一種全局特征,它描述了圖像或圖像區(qū)域所對應(yīng)景物的表面性質(zhì),常具有旋轉(zhuǎn)不變性,并且對噪聲有較強抵抗能力的特點[7]。基于統(tǒng)計方法中的灰度共生矩陣,獲取相關(guān)紋理特征參數(shù),是一種高效的方法,其主要參數(shù)包括4 個:能量均值、熵均值、對比度均值和相關(guān)均值。通過提取預(yù)處理的植物葉部病害圖像的紋理特征,將提取的病害圖像紋理特征作為檢測算法的訓(xùn)練樣本,通過多次的樣本訓(xùn)練,將訓(xùn)練后的檢測算法用于檢測剩余未用于訓(xùn)練的樣本,得出植物病害的檢測結(jié)果。
K-means 算法是一種基于區(qū)分的經(jīng)典聚類算法[8]。K-means 算法的基本思想是:以空間中k個點為中心進行聚類,對最近的對象進行分類。通過重復(fù)的方法,每個組的中心值都被更新了一次,直到得到最好的結(jié)果[9]。
K-means 算法接受k參數(shù),隨后將先輸入的n個數(shù)據(jù)劃為k個類,以便所獲得的聚類滿足,同一聚類中的數(shù)據(jù)相似度越高,不同聚類中的對象相似度就會越小。聚類相似度是依據(jù)各聚類中數(shù)據(jù)的均值所獲得一個“中心對象”(引力中心)來進行計算的。
用表達式表示,假設(shè)簇劃分為(C1,C2,…,Ck),則目標是最小化平方誤差E,
其中,μi是Ci的均值向量,也稱為質(zhì)心,表達式為
K-means 算法分為3 個步驟:
①為即將聚類的點找到聚類中心;②計算每個點到聚類中心的距離,將每個點聚類到離該點最近的聚類中去;③計算每個聚類中所有點的坐標平均值,并將這個值作為新的聚類中心。
反復(fù)執(zhí)行②、③,直到聚類中心不再進行大規(guī)模移動或者聚類的次數(shù)達到要求為止。
灰度共生矩陣法(GLCM,Gray-level co-occurrence matrix)是通過計算經(jīng)過灰度化的灰度圖像中的像素點灰度,得到一個灰度共生矩陣,然后通過計算該矩陣,便能得到一部分特征值[10]?;叶裙采仃嚨亩x是像素對的聯(lián)合概率分布,這個矩陣是一個對稱矩陣。它能反映圖像的灰度在相鄰的方向、間隔上的變化幅度等綜合信息,并可以反映相同灰度級的像素之間位置分布特征,這是計算圖像紋理特征的基礎(chǔ)。
在圖像中任意取一點(x,y)及偏離它的一點(x+a,y+b)(其中,a、b為整數(shù)),人為定義構(gòu)成點對。設(shè)該點對的灰度值為(f1,f2),再令點(x,y)在整幅圖像上移動,則會得到不同的(f1,f2)值。設(shè)圖像的最大灰度級為L,則f1與f2的組合共有L×L種。對于整幅圖像,統(tǒng)計出每一種(f1,f2)值出現(xiàn)的次數(shù),然后排列成一個方陣,再用(f1,f2)出現(xiàn)的總次數(shù)將其歸一化為出現(xiàn)的概率P(f1,f2),由此產(chǎn)生的矩陣為灰度共生矩陣。θ方向上的間隔為d的灰度共生矩陣實際上是θ方向間隔為d的灰度變化量的聯(lián)合概率分布。
灰度共生矩陣理論的研究人員用灰度共生矩陣提出了14 種特征值,但因為共生矩陣的計算量非常大[11],因此為了簡便,本研究采用4 個有代表性且常用的紋理特征。
能量是共生矩陣內(nèi)元素的平方和,表明目標圖像灰度的分布是否均勻、程度如何以及紋理粗細程度。
對比度表示矩陣內(nèi)的值如何分布,表明目標圖像的清晰程度和紋理的深淺程度。
3)相關(guān)度:
相關(guān)度表示灰度共生矩陣內(nèi)的元素相似程度。
熵表示目標圖像的紋理隨機性?;叶裙采仃嚨乃刑卣鲾?shù)據(jù)取得最大值,說明圖像紋理分布均勻;如果取得最小值,說明圖像紋理分布不均勻。求出該灰度共生矩陣各個方向的特征值后,再對這些特征值進行均值和方差的計算,這樣處理可以消除方向分量對紋理特征的影響。
基于GLCM 算法提取植物病害圖像紋理特征主要包括4 個步驟:①獲取目標圖像與預(yù)處理;②利用K-means 進行病害圖像的閾值分割,數(shù)據(jù)訓(xùn)練;③通過GLCM 算法提取圖像病害紋理特征;④分析紋理特征參數(shù),判斷植物病害情況。
采樣目標樣本后進行圖像的預(yù)處理,包括去噪、分割和灰度化等,再分別進行基于GLCM 的紋理特征提取,最后進行紋理特征檢測,并進行總結(jié)分析。如圖1 是基于紋理特征的植物病害檢測流程。
圖1 基于紋理特征的植物病害檢測流程
1)目標圖像獲取與去噪。試驗以黃瓜葉部病害炭疽病為例,仿真試驗環(huán)境在MATLAB2017b 中進行。通過前期采集篩選得到9 張較合格的黃瓜葉部圖片。圖2 為9 張待檢測的黃瓜葉部樣本圖像,圖3為去噪后的9 張黃瓜炭疽病樣本。
圖2 黃瓜葉部樣本圖像
圖3 去噪后黃瓜炭疽病樣本
2)圖像分割?;贙-means 聚類植物葉部病害檢測與實現(xiàn)的原理如圖4 所示。首先需獲取植物葉部正常圖像和病害圖像,對其進行圖中無關(guān)信息預(yù)處理;再運用K-means 聚類分割算法對處理后的植物葉部病害圖像進行病斑分割,得到只含有病斑的圖像信息;轉(zhuǎn)換顏色空間,分別提取植物葉部正常圖像和分割后的植物葉部病害圖像顏色特征的顏色矩低階矩陣;最后對獲取的大量病害圖片進行訓(xùn)練,以得到病害的檢測效率。由于受植物圖像數(shù)據(jù)庫的影響,本研究決定將葉部病害圖像的低階矩各參數(shù)和正常葉部圖像的低階矩陣各參數(shù)值域進行對比,從而實現(xiàn)檢測的目的。
圖4 算法檢測與實現(xiàn)原理
基于K-means 的分割方法是從x個數(shù)據(jù)中選擇出y個數(shù)據(jù)對象作為初始的聚類中心;沒有選擇的剩余數(shù)據(jù)就會根據(jù)各自與這些確定的初始聚類中心相似的程度,將自己分配到最相似的類別中,然后計算每個聚類中數(shù)據(jù)的平均值,以上過程會重復(fù)數(shù)次,直到聚類效果達到最佳。一般使用均方差作為標準測度。目標圖像經(jīng)過分割就可以將無病害區(qū)域和病害區(qū)域區(qū)分開來。圖5 為分割后黃瓜炭疽病葉片無病害區(qū)域圖像,圖6 為分割后黃瓜炭疽病葉片病害區(qū)域圖像;圖7為灰度化后的黃瓜炭疽病葉片無病害區(qū)域,圖8為灰度化后的黃瓜炭疽病葉片病害區(qū)域。
圖5 分割后黃瓜炭疽病葉片無病害區(qū)域
圖6 分割后黃瓜炭疽病葉片病害區(qū)域
圖7 灰度化后的黃瓜炭疽病葉片無病害區(qū)域
圖8 灰度化后的黃瓜炭疽病葉片病害區(qū)域
表1 為分割后的9 張植物葉部無病害區(qū)域圖像的紋理特征。表2 為分割后的9 張植物葉部病害區(qū)域圖像的紋理特征。
表1 植物葉部無病害區(qū)域紋理特征
表2 植物葉部病害區(qū)域紋理特征
1)根據(jù)提取的紋理特征中能量均值數(shù)據(jù),統(tǒng)計了無病害區(qū)域能量均值和病害區(qū)域能量均值的范圍(表3)。由表3 可知,無病害區(qū)域圖像的能量均值范圍為0.370 013~0.574 460,病害區(qū)域圖像的能量均值范圍為0.421 948~0.601 150。相比之下病害區(qū)域能量更大,而能量大、圖像紋理變化比較穩(wěn)定,說明病害區(qū)域的面積比無病害區(qū)域的面積小,符合狀態(tài)。
表3 無病害區(qū)域與病害區(qū)域能量均值范圍
2)根據(jù)提取的紋理特征中熵均值數(shù)據(jù),統(tǒng)計了無病害區(qū)域熵均值和病害區(qū)域熵均值的范圍(表4)。由表4 可知,無病害區(qū)域圖像熵均值范圍為1.081 558~1.694 984,病害區(qū)域圖像熵均值范圍為0.750 277~1.349 141。相比之下病害區(qū)域熵更小,而熵越小、圖像越簡單,說明病害區(qū)域因為面積小,復(fù)雜程度低,符合狀態(tài)。
表4 無病害區(qū)域與病害區(qū)域熵均值范圍
3)根據(jù)提取的紋理特征中對比度均值數(shù)據(jù),統(tǒng)計了無病害區(qū)域?qū)Ρ榷染岛筒『^(qū)域?qū)Ρ榷染档姆秶ū?)。由表5 可知,無病害區(qū)域圖像的對比度均值為1.068 083~2.251 364,病害區(qū)域圖像的對比度均值為0.829 632~1.403 083。相比之下病害區(qū)域的對比度更小,說明病害區(qū)域的溝紋淺,更模糊,符合狀態(tài)。
表5 無病害區(qū)域與病害區(qū)域?qū)Ρ榷染捣秶?/p>
4)根據(jù)提取的紋理特征中相關(guān)均值數(shù)據(jù),統(tǒng)計了無病害區(qū)域相關(guān)均值和病害區(qū)域相關(guān)均值的范圍(表6)。由表6 可知,無病害區(qū)域的相關(guān)均值為0.020 952~0.029 294,病害區(qū)域的相關(guān)均值為0.017 890~0.024 268。相比之下病害區(qū)域的相關(guān)更小,說明病害區(qū)域因為病害病斑的影響,矩陣元素值不均勻,符合狀態(tài)。
表6 無病害區(qū)域與病害區(qū)域相關(guān)均值范圍
本研究分析了基于紋理特征的黃瓜葉部病害檢測算法。以黃瓜炭疽病為例,選取了9 張黃瓜葉片圖像,進行預(yù)處理和圖像閾值分割,再基于GLCM 算法提取圖像病害紋理特征,包括能量均值、熵均值、對比度均值和相關(guān)均值等4 種參數(shù);并根據(jù)參數(shù)訓(xùn)練的無病區(qū)域和病害區(qū)域范圍,判斷黃瓜葉部是否有炭疽病。結(jié)果表明,該4 組參數(shù)能準確地分析黃瓜葉部病害情況且算法效率高,魯棒性較好,為農(nóng)業(yè)植物保護和植物病蟲害研究提供了技術(shù)支持。