侯兆靜 馮 全 張 濤
(甘肅農(nóng)業(yè)大學(xué)機(jī)電工程學(xué)院 甘肅 蘭州 730070)
在農(nóng)業(yè)領(lǐng)域,利用圖像處理和機(jī)器視覺(jué)對(duì)作物的生長(zhǎng)狀態(tài)、病蟲(chóng)害進(jìn)行監(jiān)測(cè)、識(shí)別,已經(jīng)越來(lái)越流行。要完成這些任務(wù),通常要在圖像中準(zhǔn)確分割出作物的葉片區(qū)域,以便在葉片區(qū)域進(jìn)行后續(xù)其他處理,如測(cè)量葉片面積、檢測(cè)是否有病斑等。圖像分割是圖像識(shí)別過(guò)程中關(guān)鍵的一步,決定了后續(xù)識(shí)別是否成功。對(duì)于大田作物葉片的分割,面臨來(lái)自葉片類(lèi)內(nèi)劇烈變化和復(fù)雜背景兩個(gè)方面的挑戰(zhàn)。類(lèi)內(nèi)影響主要有:(1) 由于光照在一天內(nèi)變化劇烈,從早到晚,圖像中同一葉片的顏色、灰度值等變化劇烈[1];(2) 監(jiān)控圖像中,既有正常葉片,也有非正常葉片(如葉片上有各種病斑);(3) 有些葉片處于陰影區(qū),有些則處于光照區(qū),也會(huì)出現(xiàn)一張葉片的不同區(qū)域處于陰影和光照區(qū)。復(fù)雜背景則包括雜草、泥土、作物果實(shí)、莖稈、藤、套袋、塑料膜等。對(duì)于作物葉片分割,研究者已經(jīng)提出了許多方法,主要包括閾值、區(qū)域、邊緣檢測(cè)、聚類(lèi)、水平集、分形、神經(jīng)網(wǎng)絡(luò)等[2-12]。這些方法中,大多處理對(duì)象限于單葉片圖像,對(duì)圖像采集時(shí)間、角度、距離、背景等有嚴(yán)格要求。此外大部分算法在實(shí)際分割過(guò)程中需要人工參與,不能自動(dòng)完成分割任務(wù)。雖然文獻(xiàn)[12]實(shí)現(xiàn)了分割的全程自動(dòng)化,但是只能處理特定類(lèi)型葉片圖像(純綠色且表面較為光滑、無(wú)病斑)。
本文試圖解決現(xiàn)有葉片分割算法存在的問(wèn)題,提出一種能適應(yīng)多種情形,分割過(guò)程完全自動(dòng)化的葉片分割方法,為此引入了機(jī)器視覺(jué)中的目標(biāo)檢測(cè)技術(shù)。目標(biāo)檢測(cè)技術(shù)以一幅圖像為輸入,輸出通常為若干方框,即邊界盒,邊界盒內(nèi)包含識(shí)別出的目標(biāo)。根據(jù)直觀觀察,一個(gè)好的目標(biāo)檢測(cè)算法輸出的邊界盒可以將目標(biāo)緊湊地框出,從而為分割提供很好的初始值。在對(duì)葉片分割之前,我們首先用多張各種類(lèi)型葉片圖像樣本訓(xùn)練葉片檢測(cè)器;在實(shí)際分割時(shí),用訓(xùn)練好的葉片檢測(cè)器在一幅圖像中檢測(cè)出葉片的大體位置和范圍,在這些范圍內(nèi)對(duì)分割特征采樣,由采樣點(diǎn)作為種子構(gòu)造出葉片特征的混合高斯模型,采用馬爾科夫隨機(jī)場(chǎng)中能量最小化的方法對(duì)整幅圖像的葉片區(qū)域進(jìn)行分割,圖1給出了本方法流程圖。我們以葡萄葉片作為分割對(duì)象,實(shí)驗(yàn)表明,本方法能較好解決復(fù)雜背景和多種病斑葉片的自動(dòng)分割問(wèn)題。
圖1 本分割方法的流程圖
文獻(xiàn)[14]采用滑動(dòng)窗口檢測(cè)方式,通過(guò)構(gòu)建尺度金字塔在各個(gè)尺度搜索,在一個(gè)窗口上用HOG特征和SVM分類(lèi)器判斷是否有葡萄葉片。這種方法對(duì)于視角較正的葉片檢測(cè)效果較高。但沒(méi)有解決多視角問(wèn)題、葉片姿態(tài)不正,以及葉片因病斑導(dǎo)致的表面變化很大時(shí)的檢測(cè)問(wèn)題。葡萄葉片基本呈心形,觀察葉片圖像,不同視角下葉片形狀變化較大,但其各子區(qū)域相對(duì)于中心位置通常不會(huì)出現(xiàn)明顯偏移(形變小)。故本文采用了多個(gè)子線性分類(lèi)器對(duì)不同視角、不同外觀的葡萄葉片分類(lèi),不同視角的葉片可以看成不同子類(lèi),外觀相差很大的葉片也可看成不同子類(lèi)。檢測(cè)過(guò)程采用滑動(dòng)窗口和多尺度模式[14]。
1.1.1 基本分類(lèi)器的優(yōu)化問(wèn)題
假設(shè)有已經(jīng)標(biāo)識(shí)的n個(gè)訓(xùn)練圖像樣本I={(I1,l1),…,(Ii,li),…,(In,ln)},其中l(wèi)i∈{-1,1}。我們的目標(biāo)是從這些樣本訓(xùn)練出一組KC個(gè)子分類(lèi)器,將正負(fù)葉片樣本區(qū)分開(kāi)來(lái),其中每個(gè)分類(lèi)器在訓(xùn)練集的不同子集上訓(xùn)練。這要求將正樣本聚成KC個(gè)子類(lèi),為每個(gè)子類(lèi)訓(xùn)練一個(gè)子分類(lèi)器。如何將正的訓(xùn)練樣本分配到每個(gè)子集的問(wèn)題由隱變量x來(lái)建模,則分類(lèi)問(wèn)題可以表示為如下latent SVM的優(yōu)化問(wèn)題:
(1)
li·si,xi≥1 -εi,εi≥0
(2)
(3)
si,j=ωj·φj(Ii)+bj
(4)
式中:‖a‖表示對(duì)a取L2范數(shù),ε為松弛變量,si,j為第i個(gè)樣本在第j個(gè)子分類(lèi)器的得分,ωj為第j個(gè)子類(lèi)的決策面,φj表示圖像特征,本文采用HOG特征,bj為第j個(gè)子分類(lèi)器的偏置。由于這個(gè)優(yōu)化問(wèn)題是半凸的,分類(lèi)器參數(shù)ωj和隱變量xi可以用文獻(xiàn)[15]中求解latent SVM的迭代法獲得。
1.1.2 歸一化后優(yōu)化問(wèn)題
觀察上述優(yōu)化問(wèn)題發(fā)現(xiàn),上述KC個(gè)子分類(lèi)器只在式(3)才有真正的耦合,即在分配正負(fù)樣本給不同子集時(shí)。故實(shí)際上各個(gè)子分類(lèi)器的學(xué)習(xí)還是獨(dú)立的。由于不同子集數(shù)據(jù)分布不同,每個(gè)子分類(lèi)器的輸出得分并不在一個(gè)基準(zhǔn)上,這可能造成有些實(shí)際分類(lèi)效果好的分類(lèi)器輸出得分不一定高,有些差分類(lèi)器卻輸出較高得分,這可以通過(guò)對(duì)每個(gè)子分類(lèi)器的輸出得分進(jìn)行歸一化來(lái)解決。我們采用文獻(xiàn)[16]的方法,將第j個(gè)子分類(lèi)器對(duì)第i個(gè)樣本的得分si,j通過(guò)sigmoid函數(shù)轉(zhuǎn)換成可以彼此比較的得分分布:
(5)
(6)
式中:Aj和Bj是從下列l(wèi)ogistic損失函數(shù)Lj中學(xué)到的參數(shù):
(7)
式中:ti=|Wi,j∩Wi|/|Wi,j∪Wi|,ti∈[0,1],Wi為第i個(gè)樣本的人工標(biāo)出的邊界盒,Wi,j為第j個(gè)子分類(lèi)器對(duì)第i個(gè)樣本預(yù)測(cè)的邊界盒。
故經(jīng)過(guò)校準(zhǔn),最終的KC個(gè)子分類(lèi)器的參數(shù)優(yōu)化問(wèn)題變?yōu)閷?duì)式(1)、式(2)、式(4)、式(5)、式(6)和式(7)的優(yōu)化,仍然可以采用文獻(xiàn)[15]的迭代法解決。
1.1.3 子集的初始化
多個(gè)線性子分類(lèi)器擬合非線性分類(lèi)器成功的關(guān)鍵之一是要生成對(duì)應(yīng)的多個(gè)初始子集,這可以采用人工方法完成,即一開(kāi)始由人工根據(jù)子集數(shù)量KC,將視覺(jué)上比較接近的樣本放入同一個(gè)子集合中。但這種方法在樣本較多時(shí)比較費(fèi)時(shí)費(fèi)力,我們采用了無(wú)監(jiān)督的聚類(lèi)方法自動(dòng)完成:計(jì)算所有正樣本的特征,用K-means聚類(lèi)算法將所有正樣本劃分成KC個(gè)子集。子集初始化時(shí)采用HOG特征,與實(shí)際葉片檢測(cè)時(shí)所用特征一致。
本文中,葡萄葉片的檢測(cè)特征采用HOG特征。HOG的核心思想是假定所檢測(cè)的物體外形能夠被光強(qiáng)梯度或邊緣方向的分布所描述[17]。通過(guò)將整幅圖像分割成小的連接區(qū)域(稱為cells),每個(gè)cell生成一個(gè)方向梯度直方圖或者cell中像素的邊緣方向,這些直方圖的組合可作為待檢測(cè)目標(biāo)的描述子。通過(guò)Gammar校正,HOG特征具有很好的照射/陰影不變性。HOG特征在目標(biāo)檢測(cè)中得到了廣泛的應(yīng)用,如經(jīng)典的DPM方法就采用了HOG特征。
上述多子類(lèi)分類(lèi)器訓(xùn)練完成后,我們采用多尺度窗口掃描方式在一幅圖像檢測(cè)葡萄葉片。每個(gè)檢測(cè)結(jié)果定義為返回的一個(gè)邊界盒和相應(yīng)的得分。檢測(cè)的基本過(guò)程如下:(1) 在每個(gè)尺度上的每個(gè)掃描窗口中,首先逐個(gè)用每個(gè)子分類(lèi)器計(jì)算窗口的得分,得分越高,是葉片的可能性越高。(2) 保留得分高于某個(gè)閾值的檢測(cè)結(jié)果,其余丟棄。(3) 對(duì)每個(gè)子分類(lèi)器產(chǎn)生的多個(gè)重疊窗口用非極大值抑制,只保留得分最高的窗口。(4) 對(duì)于每個(gè)子分類(lèi)器的檢測(cè)得分,用從訓(xùn)練樣本中學(xué)習(xí)得到Aj和Bj和式(5)進(jìn)行校準(zhǔn)。(5) 對(duì)于多個(gè)子分類(lèi)器的重疊窗口,仍然采用非極大值抑制,保留最高得分窗口。(6) 輸出得分高于一定閾值的窗口作為葉片目標(biāo)的邊界盒。
上述基于HOG特征的葉片檢測(cè)利用了葉片的外觀和形狀邊緣信息,形狀信息是先驗(yàn)知識(shí),研究表明:構(gòu)造自頂而下分割框架是提高分割精度的有效策略[18-19]。近年來(lái),用基于馬爾科夫隨機(jī)場(chǎng)(MRF)的能量方程對(duì)像素以及相鄰關(guān)系建模,再用圖割最小化能量方程,被證明是一種高效的底層分割方法[20-21],它只需要像素的底層信息。但這類(lèi)方法通常需要人機(jī)交互來(lái)獲得目標(biāo)和背景種子。本文的分割策略是將這兩種方法結(jié)合起來(lái),用形狀先驗(yàn)知識(shí)檢測(cè)葉片大體區(qū)域,再用圖割法分割葉片,將先驗(yàn)知識(shí)和底層信息有效的結(jié)合起來(lái)。
設(shè)圖像由RGB顏色空間的像素組成,我們采用高斯混合模型(GMM)對(duì)一幅圖像中葉片目標(biāo)和背景分布建模。高斯分布被廣泛用于圖像處理領(lǐng)域?qū)μ卣鞣植歼M(jìn)行建模,對(duì)于多維特征變量v,它具有如下形式:
(8)
式中:參數(shù)μ和Σ分別為均值和協(xié)方差矩陣,本文采用彩色圖像,則v=[R,G,B]。
而GMM模型認(rèn)為數(shù)據(jù)由若干個(gè)高斯分布組合生成,即:
(9)
記圖像I={v1,…,vi,…,vN},N為I中的像素?cái)?shù)量,以及圖像的二元標(biāo)簽S={s1,…,si,…,sN},si∈{0,1},其中0表示背景,1表示前景。本文將葉片分割視為MRF中二元標(biāo)記問(wèn)題,分割就變成了對(duì)圖像的每個(gè)像素分配最優(yōu)0-1標(biāo)簽的過(guò)程。
首先建立能量方程:
(10)
式中:第一項(xiàng)為數(shù)據(jù)項(xiàng),表示單個(gè)像素的能量;第二項(xiàng)為平滑項(xiàng),與相鄰像素有關(guān),N表示像素鄰域;λ為常數(shù),用于調(diào)整平滑項(xiàng)的權(quán)重。數(shù)據(jù)項(xiàng)能量按下式計(jì)算:
(11)
式中:si∈{0,1},lmax為Θ{0,1}中使vi概率最大的那個(gè)高斯核。數(shù)據(jù)項(xiàng)取像素特征概率的負(fù)對(duì)數(shù),概率越小則對(duì)能量懲罰越大。
根據(jù)MRF的性質(zhì),相鄰的像素應(yīng)盡量賦予相同的標(biāo)簽,能量平滑項(xiàng)就是用來(lái)懲罰相鄰像素標(biāo)簽的非連續(xù)性;本文采用文獻(xiàn)[21]的方法:
(12)
式中:β=(2<(vi-vj)2>)-1,表示在一幅圖像關(guān)于a求期望值;[b]表示當(dāng)條件b為真時(shí)取1,否則取0;‖c‖表示對(duì)c取L2范數(shù)。
采用第1節(jié)的方法在一幅圖像中檢測(cè)葉片時(shí),邊界盒能提供葉片的較為精確位置信息,特別是在邊界盒的中間區(qū)域是葉片的概率極高,但是邊界盒中也有部分背景像素,尤其是在邊界盒的四周。初始階段,我們?nèi)∷羞吔绾兄虚g區(qū)域的并集A中像素特征的概率分布地代表整個(gè)葉片的分布。對(duì)A中像素,對(duì)其特征v用GMM建模。一般情況下,可以用期望值最大算法(EM)計(jì)算GMM參數(shù),這種方法雖然精確,但計(jì)算速度較慢。本文采用精度略低但速度更快的K-means聚類(lèi)方法估計(jì)GMM參數(shù),而且這種方法能同時(shí)得到初始的像素標(biāo)簽(算法1之步驟1、2)。
由于自然狀態(tài)下,葉片是比較稠密的,監(jiān)控?cái)z像頭拍攝的圖像通常包含多張葉片,而葉片檢測(cè)算法并不能將所有葉片框出來(lái),背景中有葉片成分,此外圖像中也遠(yuǎn)處常有細(xì)碎葉片。在對(duì)背景建模時(shí),這些葉片信息混雜在背景中,使得Θ0出現(xiàn)“失真”,可能導(dǎo)致分割結(jié)果出現(xiàn)一些錯(cuò)誤。為了讓初始的Θ0比較“純”,在算法1之步驟3中,我們將Θ0中與Θ1中幾個(gè)主要成分進(jìn)行比較,刪除背景中與葉片最相似的幾個(gè)成分。這里我們采用了一種簡(jiǎn)單方法:直接比較兩者高斯核均值的距離。在刪除Θ0中幾個(gè)高斯成分后,將初始背景中貼有這幾個(gè)被刪除成分標(biāo)簽的像素踢出背景,對(duì)所剩背景像素重新用K-means算法進(jìn)行聚類(lèi),并更新Θ0(步驟4)。
算法1之步驟5-步驟10迭代地求解能量方程式(10),直至能量E收斂。每次迭代后,用新分割后的目標(biāo)和背景區(qū)域更新Θ1與Θ0。步驟8的作用有兩個(gè):(1) 限制圖像中一些細(xì)碎葉片被分割出來(lái),這些葉片由于太小,很難對(duì)其進(jìn)行測(cè)量和識(shí)別;但它們的RGB特征與前景中大葉片相同(相似),分割時(shí)可能會(huì)被分割出來(lái)。本文設(shè)定閾值T,只有面積超過(guò)T的連通區(qū)域才會(huì)被標(biāo)為前景,否則置為背景。(2) 如果葉片上有病斑等與正常葉片相差較大,但又沒(méi)有處于邊界盒中間區(qū)域,則可能被貼上背景標(biāo)簽,對(duì)這些處于目標(biāo)包圍的背景,本文進(jìn)行孔洞填補(bǔ)
算法1:
輸入:一幅葉片圖像I和由檢測(cè)算法檢出的邊界盒
1: 取出區(qū)域A的所有像素Df,對(duì)其特征v用K-means聚類(lèi),并賦予Df中每個(gè)像素以聚類(lèi)標(biāo)簽,聚類(lèi)數(shù)量為Kf;并分別對(duì)貼有相同標(biāo)簽的像素計(jì)算單高斯模型參數(shù),組合成前景的GMM模型Θ1。
2: 取出A之外的所有像素Db,對(duì)其特征v用K-means聚類(lèi),并賦予Db中每個(gè)像素以聚類(lèi)標(biāo)簽,聚類(lèi)數(shù)量為Kb;并分別對(duì)貼有相同標(biāo)簽的像素計(jì)算單高斯模型參數(shù),組合成背景的GMM模型Θ0。
3: 對(duì)Θ1中高斯核按μ排序,計(jì)算Θ1和Θ0中各高斯核μ的距離,刪除Θ0與Θ1中距離最近的2個(gè)高斯核,同時(shí)丟棄Db中貼有對(duì)應(yīng)標(biāo)簽的像素。
4: 用剩余的背景像素重新計(jì)算背景GMM參數(shù)。
5: repeat。
6: 按照式(10)、式(11)和式(12)計(jì)算I中每個(gè)像素點(diǎn)的能量,用Graph cut求得S*和對(duì)應(yīng)的能量E。
7: 計(jì)算本次E與上次迭代的E之差值ΔE,如果ΔE收斂,則結(jié)束循環(huán),否則繼續(xù)。
8: 將S*視為二值圖,刪除面積小于閾值T的區(qū)域,并填補(bǔ)孔洞。
9: 由S*中標(biāo)簽為1和0的對(duì)應(yīng)像素分別按照1和2步的方式更新Θ0和Θ1。
10: 返回5。
針對(duì)葉片的檢測(cè)采用檢測(cè)率DR和誤檢率FPR作為評(píng)價(jià)準(zhǔn)則[22],其中DR和FPR分別定義為:
式中:TP1表示人工標(biāo)定到的同時(shí)檢測(cè)器也檢測(cè)到的葉片數(shù)量;FN1表示人工標(biāo)定了,但檢測(cè)算法未能檢測(cè)的葉片數(shù)量;FP1表示人工未標(biāo)注,但檢測(cè)器檢測(cè)為葉片的數(shù)量。
對(duì)于是否檢測(cè)到目標(biāo),采用了PASCAL協(xié)議[23],當(dāng)檢測(cè)器給出的邊界盒與人工標(biāo)定的邊界盒之間的重疊率IOU(Intersection Over Union)>0.5時(shí),認(rèn)為準(zhǔn)確檢測(cè)到了的目標(biāo)。
對(duì)于用本分割算法自動(dòng)分割出了目標(biāo)和背景的圖像,將其與人工分割葉片基準(zhǔn)圖進(jìn)行比較,計(jì)算出兩者的總體精度(ACC,百分比)以及馬修斯相關(guān)系數(shù)(MCC)作為評(píng)價(jià)算法分割精度的標(biāo)準(zhǔn)。其中ACC的定義如下:
式中:L為圖像中用本文算法分割得出的葉片目標(biāo)區(qū)域,L0為人工分割的葉片基準(zhǔn)區(qū)域。
而MCC按下式計(jì)算:
式中:TP2為真陽(yáng)性,表示基準(zhǔn)葉片像素同本研究所分割葉片像素重合的數(shù)量;FP2為假陽(yáng)性,表示基準(zhǔn)葉片未標(biāo)注的像素,但本研究所分割葉片卻標(biāo)注為葉片的像素的數(shù)量;FN2為假陰性,表示基準(zhǔn)葉片所標(biāo)注的像素,但本研究所分割葉片未標(biāo)注的像素?cái)?shù)量;TN2為真陰性,表示基準(zhǔn)葉片未標(biāo)注的像素和本研究所分割葉片未標(biāo)注的像素重合數(shù)量。MCC的值在[-1,1]之間,其值越大表示分割的越精確。
本研究以 2014年至2016年期間多次于甘肅農(nóng)業(yè)大學(xué)葡萄園(東經(jīng)103.69°,北緯36.08°)采集的不同光照條件下的葡萄葉片圖像為樣本。拍攝樣本所用相機(jī)為Canon EOS1200D,拍攝模式均為自動(dòng)對(duì)焦模式,拍攝時(shí)間分為早上(8:00-10:00)、中午(11:00-15:00)和下午(17:00-18:00)。拍攝時(shí)采用如下方法:在無(wú)風(fēng)的環(huán)境條件下, 利用三腳架固定好相機(jī),對(duì)所拍攝葉片進(jìn)行標(biāo)定,以確保同一葉片在不同天氣不同時(shí)間段的取樣,方便比較算法對(duì)同一葉片不同光照條件的分割效果。圖像樣本共600幅,其中晴天條件下450幅,多云/陰天150幅。為了減少分割時(shí)間,試驗(yàn)中所有圖像分辨率均調(diào)整到400×300??紤]到不同天氣,不同時(shí)間有不同的光照強(qiáng)度和光照角度,會(huì)影響到拍攝到的樣本葉片的顏色狀態(tài),比如在晴天下分別有光線從葉片背部入射的情況,以及葉片上有陰影的情況,在拍攝時(shí),盡可能采集這些圖像。
本文在Matlab2016a編程平臺(tái)中實(shí)現(xiàn)了上述目標(biāo)檢測(cè)算法和分割算法。對(duì)檢測(cè)分類(lèi)器進(jìn)行訓(xùn)練時(shí),子分類(lèi)器的數(shù)量KC設(shè)為6。邊界盒的中間區(qū)域A選擇如下:若設(shè)某個(gè)邊界盒的尺寸是a×b,本文取自邊界盒中心算起,(a/2)×(b/2)區(qū)域?yàn)檫吔绾械闹虚g區(qū)域;A占整個(gè)盒子面積的1/4。需要說(shuō)明的是本文采用的是多尺度檢測(cè),在不同尺度上邊界盒的尺寸并不相同,最大尺寸接近圖像大小,最小邊界盒只有圖像尺寸的5%。對(duì)于RGB空間中背景和葉片的GMM模型,Kb和Kf過(guò)大分割效果不好,文獻(xiàn)[20]建議取5。通過(guò)試驗(yàn)發(fā)現(xiàn),對(duì)于葉片圖像,可能顏色比較單一(主要是綠色),這兩個(gè)值選3、4時(shí),分割精度基本接近,總體分割效果較好,當(dāng)這兩個(gè)值大一些時(shí)效果反而下降,故在實(shí)驗(yàn)統(tǒng)計(jì)時(shí),設(shè)為4。式(10)的系數(shù)λ用于調(diào)節(jié)平滑項(xiàng)與數(shù)據(jù)項(xiàng)的權(quán)重,λ大則給予不連續(xù)標(biāo)簽懲罰大,反之則小,實(shí)驗(yàn)中發(fā)現(xiàn)該值在20~80之間分割結(jié)果總體比較一致,實(shí)驗(yàn)統(tǒng)計(jì)時(shí),設(shè)為50。算法1中T根據(jù)圖像大小而定,實(shí)驗(yàn)中設(shè)為一幅圖像總像素的1%。算法1的收斂標(biāo)準(zhǔn)判斷依據(jù)是ΔE/E小于1%。
對(duì)樣本圖像中的葉片人工進(jìn)行標(biāo)定,用邊界盒共標(biāo)出4 000余葉片,隨機(jī)選擇其中的2 000個(gè)進(jìn)行多個(gè)子分類(lèi)器訓(xùn)練。為了準(zhǔn)確評(píng)價(jià)算法性能,測(cè)試樣本圖像按下面方法進(jìn)行分類(lèi):(1) 少葉片正常圖像,圖像中正面完整葉片數(shù)量不多于3張,且無(wú)顯著病斑;(2) 多葉片正常圖像,圖像中正面完整葉片數(shù)量超過(guò)3張,且無(wú)顯著病斑;(3) 病斑葉片圖像,不區(qū)分圖像中葉片數(shù)量。表1統(tǒng)計(jì)了不同情形下葉片的檢測(cè)率和誤檢率,3種情形下的檢測(cè)率分別為92.50%,88.62%和83.30%,誤檢率分別為5.50%,7.38%和12.06%。實(shí)驗(yàn)結(jié)果表明,一幅圖像中葉片數(shù)量少時(shí),檢測(cè)率和誤檢率兩方面都是最優(yōu)的;對(duì)于多葉片圖像,由于葉片重疊比較明顯、遮擋的情形較多,葉片的檢測(cè)率較少葉片略低,誤檢率也有所較高。對(duì)于病斑葉片,由于葉片的殘損、外觀變化劇烈,誤檢率較高,但統(tǒng)計(jì)的檢測(cè)率在83.33%左右,對(duì)于基本完整的病斑葉片還是可以準(zhǔn)確檢測(cè)。
實(shí)驗(yàn)表明,對(duì)于后期分割,一幅圖像中葉片不需要完全檢測(cè)出,因?yàn)椴煌~片的相似性,使得它們的特征可以共享已知的前景分布模型。但應(yīng)選擇最可靠的葉片區(qū)域?qū)η熬敖?,盡量避免背景像素混入,以提高分割精度。本文通過(guò)提高檢測(cè)器得分閾值來(lái)篩選一幅圖像中最可靠的葉片區(qū)域,只有歸一化得分超過(guò)0.9以上的邊界盒才會(huì)被認(rèn)為是葉片。
表1 葉片檢測(cè)準(zhǔn)確性
實(shí)驗(yàn)發(fā)現(xiàn),對(duì)于本分割算法,一幅圖像中葉片是否完全檢測(cè)出對(duì)分割結(jié)果影響不大。如圖1(a),原圖中視覺(jué)上完整的正面葉片有3個(gè),但圖1(b)本檢測(cè)算法只檢測(cè)出兩個(gè),圖1(c)顯示本分割算法能將三個(gè)葉片完整分割出來(lái)。
圖1 一個(gè)檢測(cè)與分割示例
對(duì)于分割,圖像畫(huà)面的復(fù)雜程度很大程度決定了分割效果的好壞,本文首先根據(jù)圖像中葉片的多少與背景的復(fù)雜程度將葡萄葉片圖像分成了兩類(lèi):A類(lèi)圖像中只有1張主要葉片,可以有少許其他小葉片或其他葉片的部分區(qū)域,背景不是很復(fù)雜;B類(lèi)圖像中有2張以上的大葉片,背景復(fù)雜,主要是細(xì)碎葉片較多。A類(lèi)圖像中又分為正常葉片和有病斑葉片兩種。對(duì)于A類(lèi)圖像,更容易考察光照條件的變化和葉片形態(tài)變化對(duì)本算法分割效果魯棒性的影響,因?yàn)檫@類(lèi)圖像背景較簡(jiǎn)單,可以在很大程度上排除因背景因素對(duì)數(shù)據(jù)統(tǒng)計(jì)的干擾。對(duì)于B類(lèi)圖像,其分割效果綜合取決于光照、葉片表面形態(tài)和背景,本文不再對(duì)比不同拍攝條件,只按照葉片有無(wú)病斑進(jìn)行實(shí)驗(yàn)對(duì)比。按照以下幾種情形對(duì)A、B類(lèi)圖像分別進(jìn)行了分割實(shí)驗(yàn),并對(duì)分割效果進(jìn)行統(tǒng)計(jì):(1) A1:無(wú)病斑,晴天早上(8:00-10:00,下同);(2) A2:無(wú)病斑,晴天中午(11:00-15:00,下同);(3) A3:無(wú)病斑,晴天下午(17:00-18:00,下同);(4) A4:無(wú)病斑,多云/陰天早上;(5) A5:無(wú)病斑,多云/陰天中午;(6) A6:病斑葉片,晴天早上;(7) A7:病斑葉片,晴天中午;(8) B1:無(wú)病斑,多葉片復(fù)雜背景;(9) B2:有病斑,多葉片復(fù)雜背景。
本文得到的分割結(jié)果如表2所示??梢钥闯觯?1) A1-A7的ACC在90.82%~95.53%之間,根據(jù)ACC的定義可知,這表明本算法分割出的葉片區(qū)域與人工摳出的葉片區(qū)域的重疊率較高,因此本算法有較高的分割精度。MCC綜合反映出各種錯(cuò)誤,其值比ACC低,主要原因是即便是單葉片圖像,其中仍然存在不完整和細(xì)小葉片,人工摳圖時(shí),只摳出了圖中最大的葉片,其他則作為背景;但對(duì)于圖像中主葉片和不完整葉片,本算法均能分割出來(lái),這使得ACC很高,但不完整葉片被認(rèn)為是錯(cuò)誤分割,從而降低了MCC。圖2給出了某葉片在情形A1-A5的分割實(shí)例,圖3給出了4張病葉的分割實(shí)例。(2) A1-A7的平均ACC是93.02%,方差為3.24×10-4,可見(jiàn)7種情形它們之間的離散度較小,說(shuō)明本算法在照明變化和葉子表面形態(tài)變化時(shí)分割效果差異不大,因此對(duì)這兩種情形具有較好的適應(yīng)性。(3) B1和B2的分割效果比A1-A7有一定的差距,說(shuō)明復(fù)雜的背景對(duì)于分割精度的影響超過(guò)了光照和葉面自身形態(tài)的變化。但實(shí)驗(yàn)還表明,如果背景主要由土壤等組成,則圖像分割效果好于背景由細(xì)小葉片和部分遮擋葉片組成的圖像。圖4給出了某同一場(chǎng)景B1~B2類(lèi)圖像的分割實(shí)例。
表2 樣本圖像的ACC與MCC統(tǒng)計(jì)表
圖2 某單葉片在不同光照下的分割效果實(shí)例
圖3 幾個(gè)單病葉分割實(shí)例
圖4 幾個(gè)多葉片圖像分割實(shí)例
為了驗(yàn)證本分割算法的魯棒性,我們?cè)贏1類(lèi)圖像中加入零均值高斯噪聲,實(shí)驗(yàn)表明:當(dāng)噪聲方差σ=3時(shí),分割精度幾乎不變,當(dāng)σ=5,7時(shí),ACC分別為94.07%,90.68%,比表2有所下降,但仍保持了較高的精度,因此本算法具有較好的魯棒性。
葉片分割是基于機(jī)器視覺(jué)的農(nóng)作物生長(zhǎng)狀態(tài)自動(dòng)分析的基礎(chǔ),由于自然條件下光照變化、葉片自身表觀變化、攝像機(jī)視角、復(fù)雜背景等因素,給從監(jiān)控?cái)z像機(jī)采集的圖像中的葉片分割帶來(lái)了極大困難。本文提出了一種通用的、全自動(dòng)的葉片分割框架。首先用形狀和信息檢測(cè)圖像中的葉片,利用得到邊界盒中心區(qū)域的像素建立葉片的初始GMM模型,邊界盒以外區(qū)域的像素被用來(lái)建立背景的初始GMM模型。采用圖割算法和迭代策略相結(jié)合的方式分割葉片,分割結(jié)果逐步由粗到精。實(shí)驗(yàn)表明,本文的方法能在多種復(fù)雜條件下獲得較好的分割效果,具有較高的魯棒性。
[1] 趙玉琴,馮全,李妙祺,等.自然條件下葡萄葉片圖像顏色一致性恢復(fù)效果的對(duì)比研究[J].中國(guó)農(nóng)業(yè)大學(xué)學(xué)報(bào),2016,21(6):92-99.
[2] 陳佳娟.基于圖像處理和人工智能的植物病害自動(dòng)診斷技術(shù)的研究[D].長(zhǎng)春:吉林大學(xué),2001.
[3] 田有文,李成華.基于統(tǒng)計(jì)模式識(shí)別的植物病害彩色圖像分割方法[J].沈陽(yáng)農(nóng)業(yè)大學(xué)學(xué)報(bào),2003,34(4):301-304.
[4] 姜淑華.農(nóng)作物病害圖像識(shí)別及其危害程度自動(dòng)分級(jí)方法研究[D].沈陽(yáng):沈陽(yáng)農(nóng)業(yè)大學(xué),2007.
[5] 毛罕平,張艷誠(chéng),胡波.基于模糊C均值聚類(lèi)的作物病害葉片圖像分割方法研究[J].農(nóng)業(yè)工程學(xué)報(bào),2008,24(9):136-140.
[6] 董金勇,王建侖,李道亮.田間棗樹(shù)葉片復(fù)雜目標(biāo)圖像綜合分割方法[J].農(nóng)業(yè)機(jī)械學(xué)報(bào),2011,42(1):165-170.
[7] 孫俊,武小紅,張曉東.基于MFICSC算法的生菜圖像目標(biāo)聚類(lèi)分割[J].農(nóng)業(yè)工程學(xué)報(bào),2012,28(13):149-153.
[8] 程玉柱,陳勇,張浩.基于MMC與CV模型的苗期玉米圖像分割算法[J].農(nóng)業(yè)機(jī)械學(xué)報(bào),2013,44(11):266-270.
[9] 施文,鄒銳標(biāo),王訪.基于多重分形的油菜病蟲(chóng)害葉片圖像分割[J].湖南農(nóng)業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版),2014,40(5):556-560.
[10] 李曉斌,王玉順,付麗紅.用K-means圖像法和主成分分析法監(jiān)測(cè)生菜生長(zhǎng)勢(shì)[J].農(nóng)業(yè)工程學(xué)報(bào),2016,32(12):179-186.
[11] 張連寬,Paul Weckler,肖德琴.作物葉面圖像自動(dòng)分割方法 [J].江蘇大學(xué)學(xué)報(bào)(自然科學(xué)版),2016,37(6):663-669.
[12] 鄭緒.基于m-PCNN葉片圖像處理的應(yīng)用研究[D].蘭州:蘭州大學(xué),2016.
[13] 馬媛,馮全,楊梅,等.基于HOG的釀酒葡萄葉檢測(cè)[J].計(jì)算機(jī)工程與應(yīng)用,2016,52(15):158-161.
[14] Felzenszwalb P,Girshick R,McAllester D,et al.Object detection with discriminatively trained part based models[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2010,32(9):1627-1645.
[15] Platt C.Probabilistic outputs for support vector machines and comparisons to regularized likelihood methods[C]//In Advances in Large Margin Classifiers 2000,MIT Press,2000:61-74.
[16] Dalal N,Triggs D.Histograms of oriented gradients for human detection[C]//Conference on Computer Vision and Pattern Recognition (CVPR2005),San Diego,California,USA,2005:1886-1893.
[17] Borenstein E.Combining top-down and bottom-up segmentation[C]//Computer Vision and Pattern Recognition,2004 (CVPR 2004),Washington,DC,USA.2004:46-53.
[18] Kumar M P,Torr P H S,Zisserman A.OBJ CUT[C]//IEEE Computer Society Conference on Computer Vision and Pattern Recognition.IEEE Computer Society,2005:18-25.
[19] Boykov Y,Funka-Lea G.Graph Cuts and Efficient N-D Image Segmentation[J].International Journal of Computer Vision,2006,70(2):109-131.
[20] Rother C,Kolmogorov V,Blake A.Grabcut:Interactive foreground extraction using iterated graph cuts[J].ACM Transactions on Graphics,2004,23(3):309-314.
[21] Hosang J,Benenson R,Dollar P,et al.What Makes for Effective Detection Proposals?[J].IEEE Transactions on Pattern Analysis & Machine Intelligence,2016,38(4):814-830.
[22] Everingham M,Gool L V,Williams C K I,et al.The Pascal,Visual Object Classes (VOC) Challenge[J].International Journal of Computer Vision,2010,88(2):303-338.
[23] Matthews W.Comparison of the predicted and observed secondary structure of T4 phage lysozyme[J].Biochimica et Biophysica Acta (BBA)-Protein Structure.1975,405(2):442-451.