程榮花 馬飛 梁亞紅
摘要:水果分類在超市導(dǎo)購中有較為重要的應(yīng)用價值,應(yīng)用自動化識別技術(shù)能夠?qū)崿F(xiàn)大量水果的高效分類。主成分分析可以從多元事物中解析出主要影響因素,從而利用一個或幾個較好的綜合指標來概括信息。本研究采用基于主成分分析的識別分類技術(shù)對10種外形相似的水果進行預(yù)處理、訓(xùn)練和識別,得到了較好的識別效果,各種水果的平均識別率達到93%以上,基本能夠滿足實際應(yīng)用。
關(guān)鍵詞:水果;分類;主成分分析; 外形相似;自動化識別
中圖分類號:S126 文獻標識號:A 文章編號:1001-4942(2015)08-0116-03
Abstract Fruit classification is important for supermarket shopping guiding, which can be achieved efficiently by automatic recognition technology. The principal component analysis can separate out the main influencing factors from multiple things,and then use one or several better comprehensive indexes to summarize information. In this paper, 10 kinds of shape similar fruits were pretreated, trained and recognized by recognition and classification technologies based on the principal component analysis, and better recognition effects were obtained. The average recognition rate of various kinds of fruits were more than 93%, which indicated that this method could meet the actual application.
Key words Fruit; Classification; Principal component analysis; Shape similarity;Automatic recognition
水果的智能識別是當前農(nóng)產(chǎn)品市場及超市急需采用的一項技術(shù),主要應(yīng)用在水果品質(zhì)檢測和分級方面,不僅有利于大規(guī)模、高效率地采購水果,還可以對水果進行準確地分類,提高其管理效率。水果識別技術(shù)的本質(zhì)是圖像識別,圖像的預(yù)處理、特征提取和最終的判別分類方法的研究是水果識別技術(shù)的關(guān)鍵。
近年來越來越多的研究人員開始關(guān)注農(nóng)產(chǎn)品分類識別的研究[1~5]。聶繼云等[6]利用圖像的顏色、紋理及維度特征對蘋果分類進行了研究,但由于受多方面因素的限制,未能充分利用圖像領(lǐng)域發(fā)展的先進技術(shù),存在很多不足之處。張保華等[7]采用高光譜成像技術(shù)和分段主成分分析方法對蘋果輕微損傷進行檢測,損傷果的識別率達96%,這為應(yīng)用主成分分析技術(shù)和多光譜成像技術(shù)檢測水果損傷的研究提供了參考。薛建新等[8]采用高光譜成像技術(shù)對壺瓶棗的自然損傷(縮果病、裂紋、蟲害、黑斑病以及鳥啄傷)進行識別研究,通過采集自然損傷及完好棗的高光譜圖像,并提取相應(yīng)的感興趣區(qū)域,應(yīng)用偏最小二乘回歸,運用主成分分析對單波段圖像進行數(shù)據(jù)壓縮,識別出壺瓶棗樣本的邊緣與自然損傷特征區(qū)域,預(yù)測精度和穩(wěn)定性得到顯著提高,這為自然損傷壺瓶棗的無損檢測提供了理論參考。
但在水果形狀識別方面的研究仍較少,而隨著人們生活水平的提高和對水果蔬菜需求量的增加,為了降低大型超市中人工導(dǎo)購的成本,進行水果識別的需求日益強烈。本文即將圖像識別技術(shù)應(yīng)用到智能化蔬菜識別中,通過攝像機獲取待識別的水果樣本圖像,然后利用圖像識別技術(shù)進行歸一化,然后對樣本進行主成分分析(PCA),最后利用歐氏距離進行歸類,輸出識別結(jié)果。
1 技術(shù)方案與關(guān)鍵技術(shù)
1.1 總體方案
首先利用攝像頭等設(shè)備獲取水果樣本圖像,然后對樣本圖像進行預(yù)處理,主要包括水果樣本的定位和歸一化等過程,選取其中一部分樣本進行訓(xùn)練,得到子空間映射矩陣,最后將待測樣本投影到子空間映射矩陣,計算距離得到識別結(jié)果,即得到每一個待測樣本所屬的類別??傮w方案如圖1所示。
其中的水果定位模塊,主要涉及到拍攝的水果圖像包含空白背景,需進一步縮小范圍,突出水果實際區(qū)域;歸一化過程主要是將獲取的水果圖像樣本進行尺寸度量的一致性轉(zhuǎn)換,方便后續(xù)PCA處理。
1.2 圖像預(yù)處理——定位與歸一化
主要是對因距離不等造成所拍攝水果樣本大小不一致等問題的處理,包括對水果樣本進行定位,以減少背景干擾信息。具體實現(xiàn)效果見圖2。圖中最左邊一列為水果的原始圖像,大小不盡相同;第二列為定位后的效果圖,存在大小不一的情況,為后續(xù)PCA處理帶來不便,需進行歸一化處理;第三列為歸一化后的效果,本研究選取像素[200,200]作為歸一化的尺寸。
1.3 基于PCA的水果樣本訓(xùn)練與識別
PCA法是利用一個或幾個較好的綜合指標來概括信息,而且希望各綜合指標能互相獨立地代表某一方面的性質(zhì),主要應(yīng)用在大數(shù)據(jù)分析(如農(nóng)業(yè)分析[9,10])、生物實驗中的因子分析和模式識別[11~13]等領(lǐng)域,近年被越來越多地應(yīng)用于樣本的分類識別。利用PCA法進行樣本識別需假設(shè)所有樣本都處于一個低維線性空間,并且具有正態(tài)分布特性。其實現(xiàn)思路:將原始圖像經(jīng)PCA變換后得到一組新的正交基,即投影向量矩陣,對投影向量矩陣做一定的取舍,選取特征值較大的特征向量構(gòu)成低維的樣本空間?;赑CA的樣本訓(xùn)練和識別實現(xiàn)過程算法描述如下:endprint
[step1]:計算 PCA變換的生成矩陣Q。本實驗選取10種不同的水果,每種水果選20幅圖像作為訓(xùn)練集Train、15幅作為測試集Test,將訓(xùn)練集和測試集樣本均轉(zhuǎn)換為列向量的形式,轉(zhuǎn)換后都為像素40 000×1的形式;得到的訓(xùn)練集樣本矩陣X為40 000×20,計算訓(xùn)練集均值u和協(xié)方差矩陣C=(X-u)T(X-u);
[step2]:利用函數(shù)eig(C)求特征值和特征向量,選擇特征值大于1的特征向量構(gòu)建成為一個特征子空間P;
[step3]:把訓(xùn)練圖像和測試圖像投影到特征子空間P中,每一幅圖像對應(yīng)于子空間中的一個點,子空間中的一個點也對應(yīng)于一幅圖像。這樣每幅水果樣本圖像都可以獲得一組坐標系數(shù),可以標明該圖像在子空間中的位置,從而將水果圖像的識別問題轉(zhuǎn)化為依據(jù)子空間的訓(xùn)練樣本點進行分類的問題;
[step4]: 分別計算訓(xùn)練集各樣本和待測水果樣本圖像在子空間中的坐標,計算待測樣本坐標與各訓(xùn)練集樣本坐標間的距離,距離哪一類最近就確定為哪一類水果。
2 實驗驗證分析
常見的水果識別方法是通過提取顏色、紋理、形狀等特征實現(xiàn)的,但這些特征在提取和訓(xùn)練過程中的權(quán)重系數(shù)不易確定,往往導(dǎo)致識別效果不是太好。而PCA方法則是對樣本圖像中的主要成分進行統(tǒng)一考慮,沒有特別突出或者丟失某些關(guān)鍵性信息,是無監(jiān)督的識別方法,適用條件和場合更為寬松,應(yīng)用范圍更為廣泛。
本實驗基于此法對10種形狀相似水果進行識別,識別率基本都達到93%以上(見圖3),能夠滿足實際需求。實驗也發(fā)現(xiàn),有些水果的識別率未達到100%,主要是因為這些水果在形狀和顏色方面太過相似,導(dǎo)致不能很好地區(qū)分。
3 結(jié)論
主成分分析是一種掌握事物主要矛盾的統(tǒng)計分析方法,它可以從多元事物中解析出主要影響因素,揭示事物本質(zhì),簡化復(fù)雜問題,是近年來模式識別和分類領(lǐng)域的研究熱點,在多個領(lǐng)域取得了較好的識別分類效果。本研究將PCA技術(shù)應(yīng)用于形狀相似水果的識別中,取得了良好的識別分類效果,為大規(guī)模、高效率采購水果提供了技術(shù)支持。
參 考 文 獻:
[1] 張艷琦,朱虹,徐成華,等. 農(nóng)產(chǎn)品分類的國內(nèi)外發(fā)展現(xiàn)狀研究[J]. 中國標準化,2014(7):70-75.
[2] 李寒.基于機器視覺的目標檢測在精細農(nóng)業(yè)中的關(guān)鍵技術(shù)研究[D].北京:中國農(nóng)業(yè)大學(xué),2014.
[3] 公麗艷,孟憲軍,劉乃僑,等.基于主成分與聚類分析的蘋果加工品質(zhì)評價[J].農(nóng)業(yè)工程學(xué)報,2014,30(13):276-285.
[4] 黃文倩,陳立平,李江波,等.基于高光譜成像的蘋果輕微損傷檢測有效波長選取[J].農(nóng)業(yè)工程學(xué)報,2013,29(1):272-277.
[5] 李粉紅,劉新平.主成分分析綜合評價模型的改進及應(yīng)用[J].統(tǒng)計與決策,2010(2):162-163.
[6] 聶繼云,李志霞,李海飛,等. 蘋果理化品質(zhì)評價指標研究[J]. 中國農(nóng)業(yè)科學(xué),2012,45(14):2895-2903.
[7] 張保華,黃文倩,李江波,等.用高光譜成像和PCA檢測蘋果的損傷和早期腐爛[J].紅外與激光工程, 2013,42(S2): 279-283.
[8] 薛建新,張淑娟,張晶晶.壺瓶棗自然損傷的高光譜成像檢測[J/OL].農(nóng)業(yè)機械學(xué)報,http://www.cnki.net/kcms/detail/11.1964.s.20150320.0858.001.html.
[9] 張桂鳳.基于PCA方法的阜新農(nóng)業(yè)可持續(xù)發(fā)展綜合評價[J].遼寧工程技術(shù)大學(xué)學(xué)報, 2012, 14(4): 349-351.
[10]龐小寧,王柳.基于主成分分析法的循環(huán)經(jīng)濟綜合評價的指標體系構(gòu)建[J].統(tǒng)計與決策, 2012(14): 56-58.
[11]徐斌, 馬盡文. PCA 聯(lián)合子空間理論的規(guī)范化與擴展 [J].信號處理,2013,29(12):1638-1643.
[12]崔茜.基于Gabor小波和主成分分析的人臉識別算法研究[D].長春:東北師范大學(xué),2014.
[13]梁志貞,李勇,夏士雄,等. Lp 范數(shù)約束下的最大化L1 范數(shù)主成分分析 [J]. 模式識別與人工智能,2013,26(2): 211-218.endprint