張春艷
(沈陽理工大學(xué)信息科學(xué)與工程學(xué)院,遼寧 沈陽 110159)
通過對番茄葉片圖像進(jìn)行顏色特征的提取,將提取到的數(shù)據(jù)輸入SVM算法,通過訓(xùn)練求得可以對產(chǎn)生病害的番茄葉片圖像進(jìn)行識別的模型。
直方圖作為一種特征描述,具有簡單有效的特點,用其來統(tǒng)計特性非常方便,因此,其被廣泛應(yīng)用于計算機視覺。在圖像處理領(lǐng)域,對于圖像直方圖的特征提取十分方便,其對圖像無任何要求;關(guān)于圖像的多模態(tài)的體現(xiàn),直方圖也有非常良好的表現(xiàn),并且對于圖像的任意指定區(qū)域的統(tǒng)計特征也能很好的表示;直方圖還對旋轉(zhuǎn)不敏感,具有旋轉(zhuǎn)不變性。因此衍生出各種各樣的直方圖,如顏色直方圖、亮度直方圖、局部二值模式直方圖、HOG等。對于圖像處理領(lǐng)域,顏色直方圖應(yīng)用最為廣泛,但是傳統(tǒng)的顏色直方圖容易受光照變化影響,并且對于圖像內(nèi)部的具體像素點的分布情況不敏感,對于像素位置不敏感。
求圖像的顏色矩特征是通過對線性代數(shù)的中矩的理解,同樣將圖像中的顏色分布抽象提取,用其矩表示出來。分為平均值A(chǔ)verage、方差Variance和偏斜度Skewness,并將其分別起名為顏色一階矩、二階矩以及顏色三階矩,通過這些其矩來對圖像的空間信息進(jìn)行表示。使用顏色矩的概念來表示圖像與顏色直方圖是有差異的,顏色直方圖需要顏色量化的操作,而顏色矩不需要顏色量化。關(guān)于圖像的像素點,通??梢苑譃?個顏色通道進(jìn)行表述,而對于顏色矩每個通道可以抽象出3個分量來進(jìn)行描述,因此一共可以得到9個分量的信息。因為顏色矩得到的特征維數(shù)相對少一些,所以使用顏色矩時一般還需要提取一些圖像其他的特征,幫助更好地對圖像進(jìn)行分析處理。3個低階矩的數(shù)學(xué)模型計算公式進(jìn)行如下:
(1)
(2)
(3)
其中,pij在以上公式中的下標(biāo)j代表的是第j個像素點,i代表的是像素點的第i個分量,N代表的是總的像素數(shù)是N。
圖像的顏色變化可以通過取其抽象出的顏色矩進(jìn)行表示,如上所述,可以得到一個9維的顏色直方圖量化后的向量,以下公式是將顏色分量分別用Y,U,V來表示:
Fcolor=[μY,σY,sY,μU,σU,sU,μV,σV,sV]
(4)
顏色特征與局部特征對應(yīng),可以很好地將圖像的整體特征描述出來。而顏色特征的本質(zhì)其實是圖像本身像素點所表現(xiàn)出來的特征,但其只是一種整體上的或者說是一種表面上的特征,而對于空間以及更加細(xì)致具體的特征無法顯示,因此對于圖像的局部特征并不能以這個來體現(xiàn)。鑒于此,當(dāng)只將顏色信息作為一種查詢圖像的標(biāo)準(zhǔn)時,當(dāng)數(shù)據(jù)量小時,可能得到所期望的結(jié)果,但是對于數(shù)據(jù)量很大的時候,常會將許多不需要的圖像也檢索出來??偟膩碚f,利用顏色直方圖的原理簡單并且容易理解分析,因此應(yīng)用很多,雖然其不能很好地表示出圖像的空間信息以及圖像的局部特性,但對于圖像本身的變化如平移和旋轉(zhuǎn)等不敏感,抗這些因素的干擾性較強。
SVM[4,5]的原理是通過核函數(shù)將特征空間找到,找到之后將特征空間進(jìn)行分析得到軟間隔分離超平面,再用正則化因子對其進(jìn)行優(yōu)化得到樣本的二分類操作。使用核函數(shù)來將點積運算表示出來并且得到最優(yōu)的分類面:
(5)
式中,ai代表Lagrange乘子,ai≥0;xi,yi代表兩類中的支持向量SV;b*代表根據(jù)訓(xùn)練樣本確定的閾值;K(x,xi)代表核函數(shù)。
將圖像在邊界方向上的形狀特征進(jìn)行提取出來,在此基礎(chǔ)上再進(jìn)行顏色直方圖的分提取和分析。該方法簡單有效,在增加了準(zhǔn)確性的基礎(chǔ)上保留了對圖像自身的旋轉(zhuǎn)平移不敏感的特點,另外其對于圖像的縮放也不敏感。為了將圖像檢索的準(zhǔn)確性進(jìn)行提高,還將反饋機制結(jié)合起來,可以動態(tài)地調(diào)整權(quán)值系數(shù),并將相應(yīng)的算法進(jìn)行抽象出來,通過訓(xùn)練可以將不同數(shù)據(jù)庫的最佳權(quán)值系數(shù)求出來進(jìn)行圖像分析與識別研究。通過實驗發(fā)現(xiàn),此方法具有很好的識別效果,準(zhǔn)確性也很高。通過將其與邊緣檢測結(jié)合分析,將邊緣的信息進(jìn)行提取抽象,將小領(lǐng)域內(nèi)的信息抽象并唯一地確定位置,再將求得的各個小領(lǐng)域內(nèi)的信息點聯(lián)合起來,進(jìn)行總體的抽象與分析,將各個點進(jìn)行連線,取得連線中點的信息,求得一個能體現(xiàn)圖像特征的邊緣信息的特征模型,這個過程通常稱為擬合過程。在這個過程中,連線之間會產(chǎn)生一定的角度,從而引發(fā)一些多余的噪聲,因此分析時需要注意排除噪聲的干擾,提高準(zhǔn)確性。
邊緣方向直方圖是對圖像輪廓特征的一種描述方法,通過Canny邊緣檢測算子對病變番茄圖像的輪廓特征進(jìn)行提取,并計算出每個邊緣像素點的方向,對每個方向上的邊緣點數(shù)目進(jìn)行統(tǒng)計進(jìn)而形成邊緣方向直方圖。
圖1 邊界方向直方圖
目前基于圖像分類使用較為廣泛的模式識別算法包括歐式距離法、BP神經(jīng)網(wǎng)絡(luò)、支持向量機。針對本實驗樣本數(shù)量有限的特點,最終選擇SVM對病害番茄圖像進(jìn)行識別。
SVM(Support Vector Machine)是通過某種事先選擇的映射(核函數(shù))將輸入向量映射到一個高維特征空間,然后在這個空間中尋找最優(yōu)分類超平面。
根據(jù)SVM軟件包提取符合條件的向量集;對數(shù)據(jù)進(jìn)行篩選;考慮選用適當(dāng)?shù)暮撕瘮?shù),主要包括上述的4種核函數(shù);應(yīng)用交叉驗證方法獲取最優(yōu)參數(shù)C和g,并使用這2個參數(shù)處理全部訓(xùn)練集來得到SVM模型;用模型對樣本圖像進(jìn)行測試,完成識別。
本實驗針對樣本顏色特征、邊緣方向特征、混合特征進(jìn)行識別。將顏色特征與邊界方向直方圖參數(shù)特征合成為一個向量。每種特征的識別準(zhǔn)確率如表1。
表1 識別準(zhǔn)確率匯總
本研究對病害番茄圖像的顏色特征和邊緣特征進(jìn)行提取,通過SVM對特征進(jìn)行分類完成對病害番茄圖像的識別,在單一顏色特征識別的基礎(chǔ)上對顏色特征與邊界方向特征進(jìn)行混合識別,并且識別的準(zhǔn)確率好于基于單一特征的識別。