程 洪 史智興 馮 娟 李亞南 尹輝娟
(河北農(nóng)業(yè)大學信息科學與技術學院1,保定 071001)(中國農(nóng)業(yè)大學信息與電氣工程學院2,北京 100083)
基于玉米胚部特征參數(shù)優(yōu)化的玉米品種識別研究
程 洪1,2史智興1馮 娟1李亞南1尹輝娟1
(河北農(nóng)業(yè)大學信息科學與技術學院1,保定 071001)(中國農(nóng)業(yè)大學信息與電氣工程學院2,北京 100083)
為了提高玉米品種自動識別的可靠性,本文對表征品種的胚部特征參數(shù)進行了優(yōu)化研究。采用區(qū)域生長法從玉米種子圖像中分割出胚部區(qū)域,提取該區(qū)域的8個形狀、6個顏色和6個紋理特征參數(shù);定義了這些特征的類間和類內(nèi)差異度計算公式,以便量化特征參數(shù)的有效性;結(jié)合改進的K-均值聚類算法,獲得胚部形態(tài)的最優(yōu)特征參數(shù)集。通過5個玉米品種各180粒的識別結(jié)果得知:玉米胚部特征參數(shù)在品種識別中作用顯著,單純基于胚部的優(yōu)化特征參數(shù)集就可使其平均識別率達88%。本研究成果可為玉米品種自動識別開辟一條新思路。
胚部特征 參數(shù)優(yōu)化 自動識別 K-均值聚類
利用機器視覺進行農(nóng)作物種子品種自動識別可以實現(xiàn)快速、無損檢測,易應用于種子流通和種植現(xiàn)場,對于保護農(nóng)民利益、保障糧食安全意義重大。國內(nèi)外學者在基于數(shù)字圖像處理的玉米品種自動識別方面進行了大量研究[1-14],多數(shù)是以玉米種子整體作為研究對象?;谟衩追N子整體形態(tài)特征的玉米品種自動識別存在以下問題:由于玉米棒上頂部、中部、底部的玉米種子形狀差異較大,影響了玉米品種自動識別的魯棒性。
由于玉米種子胚部受部位影響較小且同一品種的玉米種子胚部特性趨于一致。前期針對玉米種子胚部的研究,重點解決了胚部區(qū)域的分割問題,但未深入研究胚部特征對于識別有效性的問題。本試驗提取胚部區(qū)域形狀、顏色、紋理特征參數(shù),對它們的品種識別有效性進行分析,并確定了用于識別的最優(yōu)特征參數(shù)集。
以先玉335、農(nóng)大4967、遼單565、金秋963與京科25共5個品種的玉米種子為研究對象,各隨機選取樣本180粒。設計了專用的圖像采集裝置如圖1所示,其中載種臺面為磨砂玻璃,載種盒內(nèi)鋪有黑橡膠板;拍攝照明可以采用反射光、也可采用透射光,使用反射光時種子放置在載種盒上,使用透射光時將種子放在載種臺面;升架用來調(diào)節(jié)拍攝設備與種子間的距離;遮光布用來阻擋環(huán)境光的干擾。本研究中拍攝設備采用佳能600D數(shù)碼照相機,照明采用反射光(白熾燈)照射,將玉米種子胚部所在面朝上放置在載物盒上,獲得其RGB圖像,圖像格式為.jpg。
圖1 圖像采集裝置
玉米品種自動識別研究流程如圖2。獲取圖像后,采用Ostu法將載物盒背板部分置0以去除背景;采用區(qū)域生長法分割出玉米種子胚部;分別提取胚部基于RGB與HSI 模型的顏色特征、刻畫其形狀的特征與基于統(tǒng)計的紋理特征;分析胚部形態(tài)特征參數(shù)的均值與標準差,定義特征差異度用以分析特征的有效性;K-均值聚類算法結(jié)合特征類間類內(nèi)差異度,得到最優(yōu)特征參數(shù)集,對玉米種子品種進行識別。
圖2 研究流程圖
在R、G、B色彩辨別方面,玉米粒胚部區(qū)域與非胚部區(qū)域之間的B值差異最大,G值次之,而R值的差異則最小。采用基于玉米種子RGB圖像的區(qū)域生長法[7]分割出玉米種子胚部。分割效果如圖3所示。
圖3 各品種的胚部區(qū)域
由圖3可以看出,5個品種的玉米種子胚部顏色非常接近,因此本研究中除采用人眼最為敏感的RGB顏色模型外,加入了更符合人眼對色彩的感知機理HSI顏色模型,由紅(R)、綠(G)、藍(B)、色度(H)、飽和度(S)、亮度(I)6個量來刻畫胚部的顏色。對每粒種胚均提取以上6個顏色特征值。這6個特征值分別是每粒種胚所有像素點的R、G、B、H、S、I的平均值。因為本研究采集的圖像是RGB圖像,采用公式(1)~(4)實現(xiàn)RGB到HSI的彩色坐標變換。
(1)
(2)
(3)
(4)
由圖3可見,5個玉米品種的種胚大小不一、形狀各異,本文提取面積(S1)、周長(S2)、圓形度(S3)、橢圓短長軸比(S4)、矩形度(S5)、離心率(S6)、外接矩形長寬比(S7)、外接多邊形面積比(S8)8個參數(shù),來刻畫胚部的形狀特征。S1即胚部區(qū)域像素的個數(shù);S2即胚部區(qū)域的邊緣像素個數(shù);S5即胚部區(qū)域的面積/包圍該連通域的最小矩形面積;S3 = 4×pi×S1/(S2)2;S4是與胚部區(qū)域具有相同標準二階中心矩的橢圓的短軸與長軸的比值;S6是具有相同標準二階中心矩的橢圓的離心率。
紋理是相鄰像素的灰度或彩色的空間相關性的視覺表現(xiàn)[15]。紋理分析方法大致分為結(jié)構(gòu)分析方法與統(tǒng)計分析方法2類。統(tǒng)計分析方法并不刻意去精確描述紋理的結(jié)構(gòu)。從統(tǒng)計學的角度來看,紋理圖像是一些復雜的模式,可以通過獲得的統(tǒng)計特征集來描述這些模式。考慮到研究對象形狀的不規(guī)則性,本研究采用基于區(qū)域亮度直方圖的統(tǒng)計方法來描述玉米種子胚部的紋理特征[16]。
由于種子胚部圖像中,背景占了比較大的比例,在計算紋理特征時要消除背景的影響,所以要在亮度直方圖中去除灰度值為0的像素,紋理特征的計算公式分別為:
(5)
(6)
平滑度RS=1-1/(1+σ2);
(7)
三階矩μ3=∑(zi-m)3p(zi);
(8)
(9)
(10)
式中:zi為亮度的隨機變量;p(zi)為一個區(qū)域中灰度級的直方圖;L為灰度級數(shù)。
由于種胚顏色、形狀、紋理特征數(shù)據(jù)量綱有差異,為了方便分析將提取的數(shù)據(jù)按照公式(11)標準化,公式如下:
(11)
式中:l為某一個特征;ailx為第i個品種的第x個樣本的l特征標準化后的值;bilx為第i個品種的第x個樣本的l特征標準化前的值;bilmax與bilmin分別是第i個品種的180個樣本中的l特征的最大值與最小值。
(12)
式中:Dl為l特征類間類內(nèi)差異度,Dl≥1 ;k為品種個數(shù);n為品種樣本數(shù);averil為第i個品種n個樣本的l特征均值。
由式(12)可以看出,Dl越大品種間的l特征差異度越大,品種內(nèi)l特征差異越小,l特征可用于識別玉米品種的可能性越大;Dl越接近1,品種間的l特征差異度越小,品種內(nèi)l特征差異越大,l特征可用于識別玉米品種的可能性越小。利用上述公式計算每個特征的類間類內(nèi)差異度,并按差異度排序,結(jié)果如表1所示:順序為形狀特征、顏色特征(除飽和度)、紋理特征。形狀參數(shù)的差異值均在1.7以上,顏色特征中S分量差異值最大,為1.85,H分量的差異值最小,紋理特征的差異值均在1.35以下。
圖4給出了5個玉米品種樣本的面積(S1)、外接矩形長寬比(S7)、色度(H)3個特征參數(shù)值的分布情況。這3個特征參數(shù)的特征類間類內(nèi)差異值分別為3.06、2.10、1.05,具有一定的代表性。為了方便觀察,每個品種隨機取60個樣本。
從圖4中S1值分布圖可見,玉米被明顯的分為2大類:京科25、先玉335為一類,其余3個品種為一類。前一類中京科25胚部面積略大,后一類中金秋963略大。從整體看S7值由大到小可分為:農(nóng)大4967、先玉335、金秋963、京科25、遼單565,其中第1種的值基本處于0.7以上,最后2種的值基本處于0.7以下。對于H值,不僅每個品種樣本間的差異較大,而且不同品種沒有明顯差異,用于識別分類已沒有顯著意義。由此可知,特征參數(shù)值的直觀分布圖所反映出的特征參數(shù)有效性與式(12)計算得到的量化值有很好的對應關系。本研究中特征類間類內(nèi)差異度值在2以上的均可用來識別玉米品種。
表1 各特征的類間類內(nèi)差異度
圖4 特征參數(shù)值分布圖
本研究提取了玉米種胚眾多的形態(tài)特征,如果把所有的特征都作為最終的分類特征送往分類器,不同品種間差異小的特征會影響分類的正確率。因此為達到用于玉米品種識別的胚部信息最優(yōu),要從初步選定的特征參數(shù)中,篩選能實現(xiàn)正確分類率最大化的最優(yōu)特征參數(shù)集(能達到識別率高且包含特征數(shù)目最少)。
篩選方法:先以差異值大于2的特征組成特征參數(shù)集,K-均值聚類算法進行識別,計算平均識別率;根據(jù)特征類內(nèi)類間差異值將其他特征逐個加入到特征參數(shù)集,識別,分別計算平均識別率,對識別率進行比較;使5個玉米品種的平均識別率最高特征集為得到的最優(yōu)特征參數(shù)集。
傳統(tǒng)的K-means算法對初始聚類中心的選取比較敏感,因此選取的隨機性直接影響聚類結(jié)果的準確性和穩(wěn)定性。本研究基于密度聚類方法的思想,采用了基于密度的初始中心的優(yōu)化方法[17-19]。
有關密度的幾個基本定義如下:
定義1 不同玉米種胚x,y之間的距離公式
(13)
式中:d(x,y)為x,y間距離;xi、yi分別是x、y的第i個特征值。
對于具有900個樣本,可得相似度矩陣S:
定義2 玉米種胚間的平均距離公式
(14)
定義3 種胚x的鄰域:對于任意種胚x,以x為中心,以dA為半徑的圓形區(qū)域。
δx={y|0 (15) 式中:δx為種胚x的鄰域。 定義4 種胚x的分布密度 p(x)=Number(δx) (16) 式中:p(x)為種胚x的分布密度,定義為除x外的x鄰域內(nèi)種胚的數(shù)目。 1)以相似矩陣為基礎,在所有種胚中,選擇密度最大的點作為第1個初始中心點,然后刪去該點及其鄰域內(nèi)的所有對象。 2)按1)中方法確定第2個初始中心點,循環(huán)執(zhí)行直到初始中心點集C中有5個點: 3)以C為初始聚類中心,令k=1 采用上述篩選方法得到包含S1、S2、S3、S4、S5、S6、S7、S8與顏色特征中的S分量9個參數(shù)的最優(yōu)特征集。 采用改進的K-均值聚類算法基于胚部特征進行品種識別的結(jié)果如表2所示。采用文中提取的所有特征(共20個)進行分類識別,平均識別率為78.44%,采用最優(yōu)特征集進行識別,平均識別率為88%。 表2 玉米品種識別結(jié)果 5.1 本研究通過特征類間類內(nèi)差異度與改進的K-means算法結(jié)合,得到可用于玉米品種識別的9個胚部特征參數(shù),其有效性由大到小依次為:面積、外接多邊形面積比、周長、離心率、外接矩形長寬比、橢圓短長軸比、飽和度、矩形度、圓形度。 5.2 通過5個玉米品種的識別試驗結(jié)果表明,利用胚部特征對5個玉米品種的平均識別率可達88%,說明胚部特征對玉米品種的自動識別起著十分重要的作用,可以作為研究玉米品種自動識別的新思路。 5.3 本研究定義的特征類間類內(nèi)差異度計算公式,不僅可以用于分析玉米種子胚部特征,也可用于其他分析對象特征有效性的場合。 此外根據(jù)胚部褶皺情況,尋找新的有效特征參數(shù)來描述胚部紋理特性,有進一步研究價值。 [1]Liu J,Paulsen M R. Corn whiteness measurement and classification using machine vision[J]. Transactions of the ASAE,2000,43(3):757-763 [2]Yang W, Winter P, Sokhansanj S,et al. Discrimination of hard-to-pop popcorn kernels by machine vision and neural networks[J]. Biosystems Engineering, 2005, 91(1): 1-8 [3]Hausmann Nel J, Abdaie Tabare E, Cooper Mark, et al. Method and System for Digital Image Analysis of Maize[P].International: WO2009023110(A1), 2009-2-19 [4]Jiang Jingtao, Wang Yanyao, Yang Ranbing. Variety identification of corn seed based on Bregman Split method [J]. Transactions of the Chinese Society of Agricultural Engineering,2012,28(Supp.2):248-252 [5]宋鵬,吳科斌,張俊雄,等. 玉米單倍體籽粒特征提取及識別[J].農(nóng)業(yè)機械學報,2012,43(3):168-172 [6]劉雙喜,王盼,張春慶,等. 基于優(yōu)化DBSCAN算法的玉米種子純度識別[J].農(nóng)業(yè)機械學報,2012,43(4):188-192 [7]史智興,程洪,李江濤,等. 圖像處理識別玉米品種的特征參數(shù)研究[J].農(nóng)業(yè)工程學報, 2008,24(6):193-195 [8]郝建平,楊錦忠,杜天慶,等.基于圖像處理的玉米品種的種子形態(tài)分析及其分類研究[J].中國農(nóng)業(yè)科學,2008,41(4):994-1002 [9]張海艷,董樹亭,高榮岐,等.玉米籽粒品質(zhì)性狀及其相互關系分析[J].中國糧油學報,2005(6):19-24 [10]程洪,史智興,么煒,等. 基于支持向量機的玉米品種識別[J].農(nóng)業(yè)機械學報,2009,40(3):180-183 [11]鄭小東,王杰. 機器視覺在玉米籽粒品質(zhì)檢測中的應用研究[J].中國糧油學報,2013(4):124-128 [12]權龍哲,祝榮欣,雷溥,等. 基于K-L變換與LS-SVM的玉米品種識別方法[J].農(nóng)業(yè)機械學報,2010,41(4):168-172 [13]萬鵬,孫鐘雷,宗力. 基于計算機視覺的玉米粒形檢測方法[J].中國糧油學報,2011(5):107-110 [14]韓仲志,楊錦忠,李言照. 玉米品種圖像識別中的影響因素研究[J].中國糧油學報,2012(10):98-103 [15]張海艷,董樹亭,高榮岐,等.玉米籽粒品質(zhì)性狀及其相互關系分析[J].中國糧油學報,2005(6):19-24 [16]岡薩雷斯,著.數(shù)字圖像處理:MATLAB版[M]. 阮秋琦,譯.北京:電子工業(yè)出版社,2006 [17]汪中,劉貴全,陳恩紅.一種優(yōu)化初始中心點的K-means算法[J].模式識別與人工智能,2009,22(2):299-304 [18]周煒奔,石躍祥. 基于密度的K-means聚類中心選取的優(yōu)化算法[J].計算機應用研究,2012,29(5):1726-1728 [19]李偉雄. 基于密度的聚類算法研究[D].長沙:湖南大學,2010. Corn Embryo Parameters Optimization and Varieties Identification Research Cheng Hong1,2Shi Zhixing1Feng Juan1Li Yanan1Yin Huijuan1 In the paper, a method for automatic identification corn varieties has been proposed. The method was K-means clustering algorithm combined degree of difference of characteristic based on corn kernel embryo morphology. It extracted the embryo region adopting region growing algorithm; extract characteristics of embryo region: eight shape features, six color features and six texture features. In order to select the most effective features of the embryo for identification of corn varieties, difference degrees of inter-class and intra-class of different feature for measure the effectiveness of features have been defined. K-means clustering algorithm with the characteristic difference degree has been used to find the optimal portray embryo morphology feature subset to recognize corn varieties. Five corn varieties were selected as the research object, 180 kernels respectively. The average recognition rate was 88% after researched by K-means algorithm with the feature subset. characteristics of embryo, parameters optimization, automatic recognition, K-means cluster algorithm TP391.41 A 1003-0174(2014)06-0022-05 “十二五”農(nóng)村領域國家科技計劃(2011BAD16B08-3),河北農(nóng)業(yè)大學理工基金 (LG20110601),保定市科學研究與發(fā)展計劃(13ZN010) 2013-07-08 程洪,女,1981年出生,講師,數(shù)字圖像處理4.2 改進K-means算法的運行步驟
5 結(jié)論
(College of Information Science and Technology, Agricultural University of Hebei1, Baoding 071001)(College of Information and Electrical Engineering, China Agriculture University2, Beijing 100083)