張晴晴,張云龍,齊國紅,李 瑤
(鄭州大學西亞斯國際學院,河南鄭州 451150)
中國作為農(nóng)業(yè)大國,農(nóng)作物是人民賴以生存的物質(zhì)源泉,農(nóng)作物的產(chǎn)量和質(zhì)量直接影響農(nóng)民的經(jīng)濟收入和我國農(nóng)產(chǎn)品的輸出[1]。近年來,工業(yè)技術(shù)的飛速發(fā)展導致嚴重的空氣污染,造成自然災害嚴重化,進而導致農(nóng)作物病害種類和程度大大加重。農(nóng)作物病害直接威脅著作物的健康,過量的農(nóng)藥噴灑又會造成作物的品質(zhì)無法保證。及早發(fā)現(xiàn)病害并做好防治是提高作物產(chǎn)量和質(zhì)量的關(guān)鍵[2]。利用機器視覺對農(nóng)作物病害進行自動檢測和識別已成為農(nóng)業(yè)信息化和智能化的必然趨勢。而高精度的病害圖像分割是準確識別的關(guān)鍵步驟,因此對一種效果好且實時性高的分割算法進行研究具有重要意義。
隨著科學技術(shù)的不斷發(fā)展,分割算法不斷涌現(xiàn),許多其他學科理論被應用到圖像分割領域,形成了一些基于特定理論的圖像分割算法[3]。早在2008年,毛罕平等[4]將模糊C均值聚類用于作物病害圖像的分割,并取得了一定的分割效果。Hu等[5]、Deshpande等[6]應用K均值聚類算法分別對香蕉和石榴病害圖像進行分割,并實現(xiàn)了其自動分級的功能。賴玉霞等[7]提出了一種基于遺傳算法的K均值聚類,在自適應交叉和變異概率的遺傳算法中引入K均值,克服了K均值算法對初始中心的敏感性。關(guān)海鷗等[8]利用模糊集和遺傳算法相結(jié)合建立植物病斑區(qū)域分割模型,并根據(jù)不同植物病斑區(qū)域的特點實現(xiàn)植物快速分類。Zhang S等[9]采用全局局部奇異值分解算法實現(xiàn)了黃瓜病害葉片圖像的分割。張武等[10]、Sigh等[11]利用支持向量機(SVM)算法以及改進的SVM實現(xiàn)復雜背景下小麥和豆類不同病害類型的分割。張星龍等[12]利用光源不變圖特性采用聚類算法實現(xiàn)陰影下的葉片病斑圖像分割,達到很高的準確率。王海青等[13]在傳統(tǒng)的BP神經(jīng)網(wǎng)絡基礎上提出了參數(shù)自適應脈沖耦合神經(jīng)網(wǎng)絡,實現(xiàn)了黃瓜目標分割。Chuang等[14]提出了一種基于空間領域的模糊C均值聚類算法實現(xiàn)了圖像分割。由于自然環(huán)境的差異性,葉片結(jié)構(gòu)和形狀復雜多樣,病斑形狀的不確定性以及差異性導致一些經(jīng)典的圖像分割方法不具有通用性,至今未找到一種分割算法能夠適用于各類圖像,并且沒有一個較完善的統(tǒng)一的評價準則來判定分割結(jié)果的好壞,所以仍需要不斷探究新的分割方法和評價準則[15-17]。由于FCM算法實現(xiàn)過程中目標函數(shù)的迭代容易進入局部極小值化,并且函數(shù)的收斂速度較慢,對噪聲的敏感度較低[18]?;趥鹘y(tǒng)的模糊C均值聚類算法的研究基礎上,筆者提出了模糊熵的概念,將隸屬度、非隸屬度和猶豫度(不確定度)3方面信息綜合起來表示模糊集,形成了直覺模糊C均值聚類算法[19]。
1.1傳統(tǒng)的FCM算法原理早在1973年,Bezdek等[20]就提出了模糊C均值聚類算法,它引入了隸屬度的概念來優(yōu)化目標函數(shù),把樣本間的關(guān)系定量表示,從而準確客觀地聚類,使得類內(nèi)差別盡可能小,類間差別盡可能大,實現(xiàn)自動對樣本數(shù)據(jù)進行分類的目的。
首先定義FCM算法中聚類的類別是C,其中包含N個L維向量數(shù)據(jù)xk,元素的隸屬度為uij,它代表的含義是數(shù)據(jù)元素xj屬于第i類的概率,可以通過式(1)的最小值求取[21]。
(1)
其中,根據(jù)經(jīng)驗一般令m=2,uij需要滿足:
(2)
(3)
由上式的約束條件通過對各變量求偏導可得式1目標函數(shù)取最小值式對應的隸屬度變量uij和聚類中心vi。
(4)
(5)
根據(jù)算法原理,F(xiàn)CM算法實現(xiàn)步驟如下:
①設置目標函數(shù)的3個參數(shù):精度e,模糊指數(shù)m(通常取2)和最大迭代次數(shù);
②將隸屬度變量uij進行初始化設置;
③更新隸屬度變量uij和聚類中心ui;
④判斷目標函數(shù)J(t)-j(t+1) ⑤把隸屬度變量取最大值多對應的類作為最終的樣本聚類結(jié)果。 1.2直覺模糊C均值聚類原理盡管FCM算法優(yōu)于傳統(tǒng)的C均值聚類算法,定義了隸屬度在[0,1]范圍內(nèi)連續(xù)取值,能夠?qū)㈩愰g樣本數(shù)據(jù)進行良好地分類,但是FCM算法實現(xiàn)過程中目標函數(shù)的迭代容易進入局部極小值化,并且函數(shù)的收斂速度較慢,對噪聲的敏感度較低。因此提出了基于直覺模糊集聚類(IFCM)算法,同時引入隸屬度、非隸屬度和猶豫度(不確定度)三方面信息的來表示模糊集,從而引入了直覺模糊熵(IFE)的概念,IFE用來表示模糊集的模糊度[22]。 定義,若一個實函數(shù)fIFE(x)為x的直覺模糊熵,則需要滿足以下幾個條件: ①若是普通模糊集,則fIFE(A)=0; ②若uA(xi)=γA(xi)=0,?xi,則fIFE(A)=n; ③若每個元素的隸屬度和非隸屬度都減少,則不確定度增加,即: 如果A≤B,uA(xi)≤uB(xi),γA(xi)≤γB(xi),?x∈X, 則uA(xi)+γA(xi)≤uB(xi)+γB(xi), 所以πA(xi)≥πB(xi),fIFE(A)≥fIFE(B) 其中,uA(xi)、γA(xi)、πA(xi)分別代表集合X={x1,x1,…,xn}的隸屬度、非隸屬度和不確定度,則: uA(xi)+γA(xi)+πA(xi)=1 (6) 若πA(xi)不確定度為0時,直覺模糊集就變成普通的模糊集。 我們定義表示模糊集的直覺度的直覺模糊熵fIFE(A)為: (7) 很據(jù)Yager直覺模糊集互補公式(參考文獻),非隸屬度可以表示為: γA(xi)=[1-uA(xi)α]1/α,x∈X (8) 不確定度公式可表示為: πA(xi)=1-uA(xi)α-[1-uA(xi)a]1/a,x∈X (9) 模糊集A可表示為: =[uA(xi),(1-uA(xi)a)1/a,1-uA(xi)a-[1-uA(xi)a]1/a|x∈X] (10) 式中,a的取值范圍為0≤a≤1。 同F(xiàn)CM算法的實現(xiàn)相類似,IFCM的算法可以按如下步驟實現(xiàn): ①先定義評價準則函數(shù),對相關(guān)參數(shù)和隸屬度變量進行初始化,并確定好初始聚類中心的個數(shù)C; ②依據(jù)式(4)定義不確定度參數(shù)πA(xi)、隸屬度參數(shù)uA(xi)、非隸屬度參數(shù)rA(xi),并建立模糊隸屬度矩陣; ③利用模糊隸屬度矩陣計算各樣本點到聚類中心的距離,對樣本進行分類; ④重復計算每個類的聚類中心到樣本的距離,每次都用直覺模糊隸屬度矩陣代替原來的隸屬度矩陣,并將樣本重新劃分到各個類中; ⑤重復第2、3、4步驟,直到評價準則函數(shù)達到最小值,計算停止; ⑥將多次迭代后的聚類中心值映射到原圖像對應的灰度圖像中,從而將原圖像中各像素點的灰度值進行分類。 圖像分割就是按照一定的算法和準則把1幅圖像劃分成2個或多個具有相似性的區(qū)域,并能夠用輪廓線區(qū)分各個區(qū)域,各個區(qū)域界定的實質(zhì)是根據(jù)圖像的像素值大小來劃分的。分割的最終目的就是把對研究者有用的目標信息從復雜的背景中分離出來,為更好的做進一步的分析和處理。 應用于圖像分割,模糊隸屬度的函數(shù)式衡量1幅灰度圖像中某一像素點xj屬于一個灰度值中心grayi的程度。因此,需要計算出圖像中像素點對某灰度值中心的最大隸屬度,便可將該像素點劃分到該灰度級的區(qū)域中。對于灰度圖像模糊隸屬度的公式可表示為式(11): (11) 圖像分割的好壞主要取決于圖像像素各中心灰度值的選取,結(jié)合公式(2)和(8)可推得: (12) 式中,xj代表灰度圖像中某一像素點的灰度值。 使用IFCM進行圖像分割的流程圖如圖1所示。 圖1 IFCM圖像分割流程圖Fig.1 Flow chart of IFCM image segmentation 為驗證直覺模糊C均值聚類算法用于病害圖像分割的有效性,實驗選取了黃瓜病害葉片圖片作為研究對象,圖片存儲格式統(tǒng)一設定為.png,分辨率大小為160×160。計算機性能采用主頻為2.2 GHz的CPU,內(nèi)存大小為4 G,仿真運行環(huán)境使用MATLAB 7.10。 3.1IFCM算法分割結(jié)果 實驗選取三種不同種類的黃瓜病害葉片(紅粉病、灰霉病和褐斑病)圖像各50張,利用文中改進的FCM算法進行病斑分割。由于直覺模糊C均值聚類算法中不確定度πA(xi)直接受參數(shù)α取值的影響較大參數(shù),經(jīng)多次試驗發(fā)現(xiàn)當α取值為0.85時分割效果最好,因此圖1是設置α=0.85得到的試驗結(jié)果。 圖1a~c是經(jīng)過預處理的3種不同病種的黃瓜病害葉片,利用改進的IFCM分割算法通過設置不同的參數(shù)得到最好的病斑二值分割圖像如圖1d~f所示,最后經(jīng)過與原彩色圖像取與運算得到彩色病斑分割圖像結(jié)果如圖1g~i所示,試驗過程中參數(shù)的設置直接影響到分割效果的好壞。 3.2IFCM算法和其他算法的結(jié)果對比為更好地說明該文算法的有效性,采用最大類間方差(Otsu)分割算法、K均值聚類分割算法、傳統(tǒng)FCM分割算法和該文改進的IFCM分割算法的結(jié)果進行了對比。通過4種分割算法分別對3種病害類別(紅粉病、灰霉病和褐斑病)各50張進行試驗測試,算法的執(zhí)行時間和分割的準確度都采用平均值,具體對比結(jié)果見表1和2。 注:a.紅粉病彩色圖像;b.灰霉病彩色圖像;c.褐斑病彩色圖像;d.紅粉病二值病斑圖像;e.灰霉病二值病斑圖像;f.褐斑病二值病斑圖像;g.紅粉病彩色分割結(jié)果;h.灰霉病彩色分割結(jié)果;i.褐斑病彩色分割結(jié)果Note:a.Color image of Cephalothecium roseum;b.Color image of Botrytis cinerea;c. Color image of tan disease;d.Binary disease spot image of Cephalothecium roseum;e.Binary disease spot image of Botrytis cinerea;f.Binary disease spot image of tan disease;g.Color segmentation result of Cephalothecium roseum;h.Color segmentation result of Botrytis cinerea;i.Color segmentation result of tan disease圖2 不同種類黃瓜病害葉片圖像的分割結(jié)果Fig.2 Segmentation results of different diseased leaf images of cucumbers 從表1和2可以看出,利用該文算法對作物進行病斑分割準確率較其他算法都高一些,平均分割準確率高達94.5%,算法執(zhí)行時間也較短,有很好的時效性。 表14種不同算法平均時間比較 Table1Comparisonoftheaveragetimeoffourdifferentalgorithmmethods ms 表24種不同算法的分割準確率比較 Table2Comparisonofsegmentationaccuracyoffourdifferentalgorithmmethods % 該研究在模糊C均值聚類(FCM)算法的基礎上,引入了直覺模糊熵對FCM算法進行了改進,即IFCM算法,該算法既體現(xiàn)出原FCM算法運行時間短、實現(xiàn)簡單等優(yōu)點,又克服了FCM算法分割時計算目標函數(shù)容易陷入局部極小值,而且聚類數(shù)目需要提前設定初值的缺點。IFCM算法通過引入不確定度這一參數(shù),確保在分割過程中既濾除了噪聲的干擾又保留了圖像的細節(jié)特征,達到了很好的分割效果使得圖像分割。因此,IFCM算法可以改善圖像的噪聲影響,對于噪聲干擾較為嚴重的圖像選用IFCM算法分割效果較傳統(tǒng)的FCM算法效果好。但是,對于IFCM算法,引入的不確定度參數(shù)依靠經(jīng)驗值的判斷,參數(shù)的自動最有選取是下一步研究的重點。2 基于直覺模糊聚類的圖像分割
3 結(jié)果與分析
4 結(jié)論