摘要:植物葉片的特征提取對植物圖像識別的研究有重要意義。根據(jù)葉片特征進行圖像分割,特征提取,分類識別,將圖像處理與植物分類學結(jié)合起來,對農(nóng)業(yè)技術(shù)發(fā)展有重要意義。本文就形狀特征提取作探討。
關(guān)鍵詞:邊緣檢測;特征提取;Hu不變矩
中圖分類號:TP391.41 文獻標識碼:A 文章編號:1007-9599 (2012) 22-0000-02
1 引言
自然界中植物種類繁多,地球上現(xiàn)存的已知的約50多萬種植物。植物對人類生活有極其重要的作用,為了能更好的運用植物與識別植物,對植物的分類與識別成為了重要的研究領(lǐng)域。結(jié)合圖像處理技術(shù)進行植物圖像的識別將是行之有效的方法,那么特征提取將是成功進行圖像識別的重要基礎(chǔ)。
植物葉片的數(shù)碼照片主要是通過數(shù)碼相機和掃描儀獲取,拍照時把葉子平鋪在白紙上,盡量保持葉片的完整形狀,可以減少雜亂背景的干擾。在進行特征提取前還要做一定的預(yù)處理工作。
2 圖像的預(yù)處理
圖像的預(yù)處理工作有很多,如圖像灰度化,閾值分割等,預(yù)處理的好壞直接影響到圖像特征提取的精度和準確度。
2.1 圖像灰度化
灰度化目前可以采用的方法很多如分量法、最大值法、平均值法和加權(quán)平均法。
加權(quán)平均法根據(jù)重要性及其它指標,將三個分量以不同的權(quán)值進行加權(quán)平均。由于人眼對綠色的敏感最高,對藍色敏感最低,因此,對RGB三分量進行加權(quán)平均能得到較合理的灰度圖像。以黃楊葉片為例,處理結(jié)果如圖1(b)所示
2.2 圖像二值化
所謂二值化就是將圖像上的像素點的灰度值設(shè)置為0或255,可以使整個圖像呈現(xiàn)出明顯的黑白效果,能凸顯出感興趣的目標的輪廓。二值化為進一步提取葉片的輪廓和形狀特征奠定了基礎(chǔ)。由于拍攝植物葉片時盡量去除了背景的干擾,直方圖呈明顯的二峰特征。比較常用的方法有雙峰法,迭代法和最大類間方差法。
雙峰法假定目標和背景具有不同的灰度級,目標和背景分別形成高峰,最低谷處就是圖像的閾值所在。實驗證明前景和背景對比強烈時,分割效果好。
迭代法是雙峰法的改進,基于逼近的思想,此方法可以完成閾值的自動選取。
Otsu方法是大津在1979年提出的,是一種自適應(yīng)的閾值確定的方法,也叫最大類間方差法。它是按圖像的灰度特性,將圖像分成背景和目標兩部分。背景和目標之間的類間方差越大,說明構(gòu)成圖像的兩部分的差別越大,當部分目標錯分為背景或部分背景錯分為目標都會導致兩部分差別變小。因此,使類間方差最大的分割意味著錯分概率最小。
其處理結(jié)果如圖1(c)所示。二值化是植物葉片預(yù)處理中最為關(guān)鍵的步驟,其結(jié)果的好壞決定了邊緣檢測和輪廓提取結(jié)果的好壞,從而決定了葉子輪廓定位能否成功。
實驗證明Otsu方法可以得到較好的二值化圖像。大津法選取出來的閾值非常理想,對各種情況的表現(xiàn)都較為良好。
2.3 邊緣檢測與輪廓提取
邊緣檢測是圖像處理中的重要內(nèi)容,是圖像處理和計算機視覺中,尤其是特征提取中的一個研究領(lǐng)域。所謂邊緣就是指周圍像素灰度有階躍變化或屋頂變化的那些像素的集合。常見的邊緣點有3種。分別是階梯形邊緣、屋頂型邊緣和線性邊緣。
在植物圖像識別中邊緣檢測也是很重要的。葉片的邊緣輪廓包含了它的形狀特征,如果我們能夠成功地得到圖像的輪廓,那么圖像分析就會大大簡化,圖像識別就會容易很多。
邊緣檢測的方法主要有以下幾種:
利用光柵掃描,如果像素值由1變?yōu)?就將當前像素Ps的坐標(i,j)記錄下來。從像素(i,j+1)開始逆時針方向計算8-鄰接像素,這種方法可以將葉片的邊緣輪廓找出。
檢測梯度的最大值和檢測二階導數(shù)的零交叉點也是常常用的檢測方法。
一些經(jīng)典的邊緣檢測算子有:Roberts算子,Sobel算子,Canny算子等。
Canny算子或者是改進的Canny是比較常用的邊緣檢測方法。Canny研究了設(shè)計一個用于邊緣檢測最優(yōu)預(yù)平滑濾波器中的問題,后來他說明這個濾波器能夠很好地被一階高斯導數(shù)核優(yōu)化。另外還引入了非最大抑制概念,它是把邊緣定義為在梯度方向具有最大梯度值的點。實驗表明在葉片邊緣檢測中,Canny算子可以得到較好的效果,如圖1(d)所示。
3 形狀特征提取
形狀特征是植物葉片比較典型的特征,是植物分類學中比較重要的分析指標。形狀特征主要包括矩形度、寬長比、圓形度、球狀性、偏心率等。
矩形度是指葉片面積與其最小外接矩形的面積比。寬長比是指葉片的最小外接矩形的寬與長的比值。圓形度是葉片內(nèi)切圓半徑與外切圓半徑的比值,可以用來描述葉片邊界的復雜程度。球狀度指葉片面積與其最小外接圓形周長的比值。偏心率指葉片長軸與短軸的比值。
通過實驗得到植物葉片的五項幾何特征數(shù)值分別為0.5798、0.5071、0.4983、0.2159、1.9231。
除了以上提到的幾何特征外,圖像的矩特征也常常引入到葉片的特征識別當中。其對旋轉(zhuǎn)、鏡像和尺度變換不敏感,可以作為重要的特征指標。
通過實驗可得出的葉片7個Hu不變矩如表1所示。
以上我們通過Matlab實驗提取了植物葉片的特征值,它們分別是5個形狀特征和7個不變矩,為進一步進行植物葉片圖像的分類和識別奠定了基礎(chǔ)。
參考文獻:
[1]杜吉祥.植物物種機器識別技術(shù)的研究.中國科學技術(shù)大學博士學位論文,2005.
[2]王曉峰,黃德雙,杜吉祥,張國軍.葉片圖像特征提取與識別技術(shù)的研究,2006.
[3]張德豐.數(shù)字圖像處理(MATLAB版),2009.
[4]胡學龍.數(shù)字圖像處理(第2版),2011.