丁 嬌,張?zhí)祜w,龍海燕,張 磊
(安徽信息工程學(xué)院 電氣與電子工程學(xué)院,安徽 蕪湖 241000)
植物在人類生產(chǎn)和生活中都充當(dāng)著必不可少的角色,是人類所依賴的生存基礎(chǔ)條件.傳統(tǒng)的葉片識(shí)別通過人工采集植物葉片,然后觀測和測量植物的各種特征參數(shù),從而判斷葉片類別[1-5].該種方法不僅大量耗費(fèi)人力物力和時(shí)間,且識(shí)別效率低.隨著科學(xué)的不斷進(jìn)步,一些葉片智能識(shí)別系統(tǒng)應(yīng)用而生[6-7],這些系統(tǒng)結(jié)合了數(shù)據(jù)庫技術(shù)以及模式識(shí)別技術(shù),提高了葉片識(shí)別的準(zhǔn)確率和識(shí)別時(shí)間.
傳統(tǒng)的葉片識(shí)別系統(tǒng)在對從圖像庫中取出的葉片圖像進(jìn)行預(yù)處理后,大都是在直角坐標(biāo)系下提取葉片的特征參數(shù)[8-9],例如顏色矩特征提取、基于灰度共生矩陣的紋理特征提取等,它們利用的是圖像像素點(diǎn)的底層特征.雖然計(jì)算簡單,不具有易變性,但特征維數(shù)高,計(jì)算量大,而本文使用的特征參數(shù)是在極坐標(biāo)下提取的,可縮短葉片特征提取的時(shí)間.
本文提出一種基于WLLE和極坐標(biāo)特征提取的植物葉片識(shí)別方法,該方法首先對從圖像庫中選取的植物葉片圖像進(jìn)行預(yù)處理操作,然后將其從直角坐標(biāo)變換到極坐標(biāo),提取高維極坐標(biāo)特征參數(shù),再利用降維算法WLLE對葉片高維極坐標(biāo)特征進(jìn)行維數(shù)約減,最后利用最近鄰分類器實(shí)現(xiàn)葉片種類的識(shí)別.
首先從中科院合肥智能所建立的植物葉片數(shù)據(jù)庫(http://www.intelengine.cn/data)[10]中選取實(shí)驗(yàn)所需要的葉片圖像,該圖像庫中收納了220種,共計(jì)16 846幅葉片圖像.實(shí)驗(yàn)選取20幅金銀花圖像作為正類訓(xùn)練樣本,再分別選取杜英、絡(luò)石、含笑、夏枯草各20幅,共80幅圖像作為負(fù)類訓(xùn)練樣本.同時(shí),從這5種植物葉片剩余的圖像中各選取10幅,共50幅圖像,作為實(shí)驗(yàn)的測試樣本集.為了便于后期的分類實(shí)驗(yàn),首先對從原圖像庫中選取的葉片圖像進(jìn)行大小處理,統(tǒng)一將實(shí)驗(yàn)圖像調(diào)整為128*128[9]大小.
在對圖像進(jìn)行極坐標(biāo)特征提取之前,需要對圖像進(jìn)行預(yù)處理操作,主要分為三步:1)彩色圖像灰度化,目的是為了刪去原始圖像中的彩色信息;2)去噪:對圖像進(jìn)行濾波,去除噪聲干擾[11-12];3)圖像二值化:突出圖像中葉片有效區(qū)域,便于后期的葉片特征提取[13].
為了將圖像從直角坐標(biāo)(x,y)變換到極坐標(biāo)(r,θ),首先要計(jì)算得到二值化圖像的質(zhì)心[14],計(jì)算公式為:
(1)
現(xiàn)選取二值圖像的質(zhì)心為直角坐標(biāo)系的原點(diǎn),則原直角坐標(biāo)系下目標(biāo)點(diǎn)(x,y)變換到極坐標(biāo)下的坐標(biāo)即為:
(2)
其中:r:直角坐標(biāo)系中目標(biāo)點(diǎn)(x,y)到質(zhì)心的距離;θ:目標(biāo)點(diǎn)與質(zhì)心構(gòu)成的向量(x,y)與向量(1,0)間夾角,且θ∈(0,2π).
將二值化圖像從直角坐標(biāo)轉(zhuǎn)換到極坐標(biāo)后,便可提取葉片圖像的極坐標(biāo)特征,所提取的特征參數(shù)包括:高度變化率、跨度比、圓飽和度和曲面面積比率,它們的計(jì)算公式分別為[14]:
其中,Hmax:變換到極坐標(biāo)下目標(biāo)圖像中的波峰;
Hmin:變換到極坐標(biāo)下目標(biāo)圖像中的波谷;
S:波峰與波谷之間圍成的面積;
SSum:目標(biāo)圖像整個(gè)矩形區(qū)域面積;
F(i):離散狀態(tài)下,i角度在圖像曲線中對應(yīng)的高度值.
同時(shí),這些極坐標(biāo)特征經(jīng)過證明,均具有旋轉(zhuǎn)、縮放不變性[15].
局部線性嵌入(LLE)[16]是一種最常用、最典型的流形學(xué)習(xí)算法,具有計(jì)算復(fù)雜度低、易于實(shí)現(xiàn)等優(yōu)點(diǎn),但是對高維樣本降維的過程中極易受噪聲的影響.為了改善這一缺陷,在LLE算法的代價(jià)函數(shù)中添加樣本的重要性值,從而形成加權(quán)局部線性嵌入算法(WLLE).一般情況下,樣本外點(diǎn)和樣本噪聲的重要性值均較小,因此,利用WLLE算法對高維樣本進(jìn)行降維的同時(shí),能夠有效抑制樣本中噪聲點(diǎn)和樣本外點(diǎn)的干擾,降維效果較LLE算法好.
假設(shè)采樣數(shù)據(jù)集X={x1,x2,…,xn}?RD,利用WLLE算法進(jìn)行數(shù)據(jù)集X降維的具體過程[17]如下:
(a)對于數(shù)據(jù)集X中任一樣本點(diǎn)xi,計(jì)算其與剩余所有樣本點(diǎn)的歐式距離,并對歐式距離進(jìn)行排序,找出與xi歐式距離較近的K個(gè)樣本點(diǎn),形成K鄰域.K是預(yù)先給定的數(shù)值;
(b)對于數(shù)據(jù)集中每個(gè)樣本點(diǎn),利用其K鄰域中各近鄰點(diǎn)的線性組合來進(jìn)行表示,并計(jì)算任一樣本點(diǎn)xi與其近鄰點(diǎn)xj的加權(quán)局部重構(gòu)權(quán)值Wij.所計(jì)算的Wij應(yīng)使式(3)的重構(gòu)誤差函數(shù)最?。?/p>
(3)
且Wij滿足約束條件
(4)
(c) 根據(jù)式(5)計(jì)算樣本點(diǎn)xi的重要性值Dii,
(5)
其中,
(6)
(d)計(jì)算原始數(shù)據(jù)集X的潛在低維流形Y,使得加權(quán)誤差函數(shù)
(7)
最小,且低維流形Y應(yīng)滿足約束條件
(8)
(e)對對稱矩陣M進(jìn)行非稀疏對角化
M=D(I-W)T(I-W).
(9)
其中,D=[D11,D22,…,Dnn],得到該矩陣較小的(d+1)個(gè)特征值及其對應(yīng)的特征向量.由于第1個(gè)特征值幾乎為0,因此低維流形Y即為第2~(d+1)個(gè)特征值對應(yīng)的特征向量,d表示降維后空間的維數(shù).
本文通過四個(gè)實(shí)驗(yàn)來證明所提出方法的有效性,利用WLLE算法分別對從極坐標(biāo)下提取的葉片特征、在直角坐標(biāo)下提取的灰度統(tǒng)計(jì)特征和紋理邊緣特征(面積凹凸度、矩形度、周長凹凸度、橫縱軸比)進(jìn)行降維,最后在低維空間利用最近鄰分類器識(shí)別待測植物葉片圖像.同時(shí),本文還利用最近鄰分類器直接對提取的多維極坐標(biāo)特征進(jìn)行分類,從而證明WLLE算法的有效聚類能力.
WLLE算法能夠有效實(shí)現(xiàn)高維數(shù)據(jù)集的降維,同時(shí)也能夠有效抑制樣本中的噪聲和樣本外點(diǎn),但是該算法包含了兩個(gè)可調(diào)參數(shù):近鄰參數(shù)K和嵌入維數(shù)d,在算法運(yùn)行的過程中,需要確定這兩個(gè)參數(shù)的取值.通常選取的K值要比d值大,以此來提高算法的穩(wěn)定性.根據(jù)實(shí)驗(yàn)所選取的訓(xùn)練樣本的數(shù)目,同時(shí)便于低維空間中最近鄰分類器識(shí)別待測樣本,實(shí)驗(yàn)中K的取值確定為9,d的取值選為2.而算法中的β取經(jīng)驗(yàn)值100[17].
實(shí)驗(yàn)對從圖像庫中選取的正類、負(fù)類樣本圖像進(jìn)行預(yù)處理后,將其全部從直角坐標(biāo)系變換到極坐標(biāo)系,在極坐標(biāo)下每幅葉片圖像提取的葉片特征參數(shù)構(gòu)成一個(gè)4維的向量.利用WLLE分別對極坐標(biāo)下提取的葉片特征、直角坐標(biāo)下提取的灰度統(tǒng)計(jì)特征、紋理邊緣特征進(jìn)行降維,在低維空間利用最近鄰分類器判別待測葉片圖像的類別,每個(gè)實(shí)驗(yàn)重復(fù)10次,每次實(shí)驗(yàn)訓(xùn)練樣本和測試樣本在選定的植物葉片庫中隨機(jī)抽取,最終的分類結(jié)果取10次實(shí)驗(yàn)中最佳的分類率和平均分類率.表1所示為實(shí)驗(yàn)分類結(jié)果.
隨機(jī)選取30幅葉片圖像,將其在直角坐標(biāo)下面積凹凸度、橫縱軸比、矩形度、周長凹凸度4種特征提取時(shí)間與極坐標(biāo)下曲面面積比率、高度變化率、跨度比、飽和度4種極坐標(biāo)特征提取時(shí)間進(jìn)行對比,對比結(jié)果如表2所示.由表2可知,極坐標(biāo)特征提取時(shí)間較直角坐標(biāo)特征短,因此,本文提取葉片極坐標(biāo)特征可縮短葉片圖像的分類時(shí)間.
表1 葉片圖像分類結(jié)果
表2 葉片特征提取時(shí)間對比
本文將維數(shù)約簡算法WLLE與極坐標(biāo)進(jìn)行結(jié)合,提出一種新的植物葉片識(shí)別方法.首先將葉片圖像從直角坐標(biāo)系轉(zhuǎn)換到極坐標(biāo)系,在極坐標(biāo)系下提取實(shí)驗(yàn)樣本的特征參數(shù);然后利用WLLE算法對葉片極坐標(biāo)特征參數(shù)進(jìn)行降維,實(shí)現(xiàn)葉片特征的有效聚類;最后利用最近鄰分類器實(shí)現(xiàn)待測葉片圖像的類別預(yù)測.由文中所給出的實(shí)驗(yàn)結(jié)果可知,本文所提方法不僅可以提高葉片圖像的分類準(zhǔn)確率,還能夠有效縮短葉片的識(shí)別時(shí)間.