陳勇翔 高遵海
(武漢輕工大學(xué)數(shù)學(xué)與計(jì)算機(jī)學(xué)院,湖北 武漢 430023)
大米是人類最重要的食物之一,然而水稻病害會(huì)造成不同程度的減產(chǎn),不同的水稻病害主要有葉黑粉病、褐斑病和葉枯病。目前在水稻葉部病害的圖像識(shí)別方法上一般進(jìn)行預(yù)處理后就直接分割圖像,造成了一定程度上的圖像失真。本文以水稻葉黑粉病、褐斑病和葉枯病為研究對(duì)象,依據(jù)水稻葉部病害和健康部分在Lab模型中a*b上的差異表現(xiàn),設(shè)計(jì)此模式下12種不同顏色分量組合特征,便于水稻葉部病害的圖像特征提取和k均值聚類,以此提高水稻葉部病害識(shí)別準(zhǔn)確率。
國(guó)際水稻研究所(IRRI,International Rice Research Institute)提供了專門(mén)用于水稻疾病圖片的圖像數(shù)據(jù)庫(kù)[1]。數(shù)據(jù)集來(lái)源UCI機(jī)器學(xué)習(xí)庫(kù)中的水稻葉片疾病數(shù)據(jù)集[2-3],該數(shù)據(jù)集圖片采用尼康D80和佳能450D數(shù)碼相機(jī)進(jìn)行拍攝采集,拍攝保證在自然條件下足夠的亮度和清晰度便于對(duì)圖片的處理,并且拍攝得3類病害圖片均設(shè)定和裁剪成740×290的尺寸。對(duì)采集的圖片用中值濾波[4]方式進(jìn)行去噪預(yù)處理,其原因是能夠比較完整保留圖像邊緣信息。
根據(jù)圖像分割后病害顏色的差異,對(duì)L、a、b顏色分量進(jìn)行組合,構(gòu)造如表1所示的12個(gè)備選顏色參數(shù)。
表1 12個(gè)備選顏色參數(shù)
病斑分割圖像為L(zhǎng)ab顏色空間,直接提取L,a,b的一階,二階以及三階矩陣共12個(gè)顏色矩陣參數(shù)。
在水稻葉部病害分割時(shí)將預(yù)處理的RGB圖片通過(guò)XYZ作為中間層進(jìn)行Lab圖片轉(zhuǎn)換,選用Lab色彩模型[5]可以盡量保留寬闊的色域,使得色彩過(guò)渡均勻,避免由于直接分割對(duì)病害區(qū)域造成不同程度的失真。Lab中L表示亮度,a和b為2個(gè)顏色通道,水稻葉部病害和健康部分主要通過(guò)Lab模型中a×b上的差異表現(xiàn),并以此為依據(jù)進(jìn)行k均值聚類方法[6]對(duì)病害斑點(diǎn)區(qū)域進(jìn)行合理分割。
針對(duì)3類水稻病害進(jìn)行聚類,聚類中心點(diǎn)個(gè)數(shù)分別設(shè)置為變量i(i=2,3,…,9)。其目標(biāo)收斂函數(shù)為平方誤差,具體的公式如下:
假設(shè)有M個(gè)數(shù)據(jù)源,C個(gè)聚類中心,x(i)由n個(gè)數(shù)據(jù)點(diǎn)組成的數(shù)據(jù)集,每個(gè)數(shù)據(jù)點(diǎn)x(i)是由d=12個(gè)表征數(shù)據(jù)組成的向量,μc為聚類中心。將每個(gè)類中的數(shù)據(jù)x(i)與每個(gè)聚類中心做差的平方和,J最小,意味著分割的效果最好。
水稻葉部病害圖像共計(jì)120張,葉黑粉病樣本和褐斑病樣本以及葉枯病樣本數(shù)量均為40張。經(jīng)計(jì)算和驗(yàn)證,采用基于Lab空間的k均值聚類方法,葉黑粉病和褐斑病以及葉枯病聚類中心點(diǎn)個(gè)數(shù)均為3。樣本中k=3黑粉病和褐斑病以及葉枯病葉部分割的效果如圖1~圖3所示。
圖1 葉黑粉病及k均值圖像分割效果
圖2 褐斑病及k均值圖像分割效果
圖3 葉枯病原圖和k均值圖像分割效果
從圖1~圖3中可以直觀看出,采用基于色彩模型Lab空間的k均值聚類方法能夠?qū)⒉『Π唿c(diǎn)進(jìn)行清晰和有效的分割,便于后續(xù)對(duì)不同類別病斑區(qū)域準(zhǔn)確識(shí)別。