王 亮
(安徽機電職業(yè)技術(shù)學院,安徽 蕪湖 241000)
贛南是我國臍橙的主要產(chǎn)銷地,其臍橙味道鮮美,已銷往全國各地,包括港澳臺等地區(qū)。但其工業(yè)水平相對落后,其臍橙分級檢測基本上采用人工檢測的方式[1],雖然其識別率很高,但其需要消耗大量的人力,且勞動強度大、檢測效率低下。
近來年,隨著人工智能技術(shù)及機器視覺技術(shù)的發(fā)展,農(nóng)產(chǎn)品及水果的檢測分級也逐漸采用智能方式,李聰、高海燕等[2]為了解決傳統(tǒng)蘋果分級優(yōu)化方法的單一特征問題,建立基于最小二乘支持向量機的蘋果自動分級模型,加快了蘋果自動分級速度;施健、何建國等人利用單片機高性能、低成本的特點,實現(xiàn)了鮮棗大小的快速分級,但其檢測率收到一定的限制;為了實現(xiàn)棉田中不同類型雜草對棉花識別的影響,文獻[3]提出基于主成分分析和支持向量機的雜草識別方法,通過試驗結(jié)果證明該方法具有識別率高、訓練時間短等優(yōu)點;許月明[4]等對檳榔分級研究,提取形狀、顏色、紋理特征,綜合性較強,但識別率效果欠佳;也有研究采用多個特征向量進行分級,識別率較高,由于考慮的特征量較多導致系統(tǒng)的實時性降低[5-7]。通過考慮臍橙的形狀特征,擬通過提取臍橙的大小、表面缺陷等特征,建立極限學習機的綜合分級模型,實現(xiàn)臍橙的準確分級。
試驗所用的臍橙樣本均由江西中新云農(nóng)科技有限公司提供,產(chǎn)地江西贛州。受限于實驗室的平臺條件,將使用Cannon PowerShot SD1200相機為圖像采集設備,將采集到的圖像存入計算進行圖像處理,其圖像采集處理系統(tǒng)見圖1。圖像采集在封閉箱中進行,光照條件是熒光燈,背景是藍黑色,為了提高圖像處理的速度,圖像采用640×480像素,存儲格式bmp。
臍橙檢測分級系統(tǒng)采用北京達盛科技有限公司的EL_DM6437達芬奇圖像處理設備,其主芯片為TI的TMS320DM6437(DSP),其主頻為600MHz,其處理速度快、外設豐富,同時含有DSP子系統(tǒng)與視頻處理子系統(tǒng)(VPSS)。其中,VPSS前端包括CCD控制器、預覽器以及圖像縮放裝置等;VPSS后端包括0SD模塊及視頻編碼器。
臍橙的整個分級系統(tǒng)由圖像預處理、特征參數(shù)提取以及極限學習機分類的構(gòu)建和測試三個部分組成,其處理流程如圖2所示。
進行圖像處理過程中,圖像的顏色模型至關(guān)重要。根據(jù)自然界的顏色分類,所有的研究均可分解為紅(Red)、綠(Green)及藍色(Blue),即RGB模型,基于RGB模型得到試驗過程中采集到的臍橙RGB分量圖如圖3所示。
由圖3可知,相比較G分量與B分量,B分量的顏色與背景顏色的差異相對較大,其表面缺陷的差異更加明顯,便于后續(xù)的圖像預處理[8]。因此,選用R分量圖作為后續(xù)工作的輸入圖。
圖像處理過程中,噪聲無處不在,特別對于機器視覺系統(tǒng),其輸送帶運動過程中產(chǎn)生的噪聲對臍橙的檢測產(chǎn)生較大的影響。因此,需要對噪聲進行抑制甚至消除。綜合比較去噪算法,選用中值濾波對圖像進行去噪處理。
大小是臍橙分級的重要特征之一,通常定義臍橙果實赤道部位的橫經(jīng)為其大小。根據(jù)R分量的圖像參數(shù),采用劃線法對圖像進行閾值分割來提取臍橙的大小特征參數(shù),得到各像素點的灰度值如圖4所示。
由于臍橙的邊界接近于橢圓形,可使用最小二乘法對邊界點進行線性回歸,建立擬合的橢圓,分別用橢圓的長軸與短軸來描述臍橙的橫徑與縱徑,得到的實驗結(jié)果如圖5所示。其橫徑對應的回歸模型為y=0.288x+16.75;其縱軸對應的回歸模型為y=0.982x+1.228,其相關(guān)系數(shù)為0.9802,最大相對誤差為4.1%。
在臍橙分級檢測中,表面缺陷對其影響最大,常見的缺陷包括腐爛(呈現(xiàn)出灰綠色),病斑、潰瘍、裂果(呈現(xiàn)出黑灰色)。
臍橙正常表面和缺陷部分的顏色直方圖有明顯的不同,考慮計算正常表面與缺陷部分顏色分量(RGB)的平均值,找到能區(qū)分正常與缺陷的參數(shù),再遍歷臍橙圖像的所有像素點[9],大于該參數(shù)為正常像素點,否則為缺陷像素點,且將該像素點變成紅色。本研究選擇R/B=2和G/B=1.6作為分割正常與缺陷的閾值,結(jié)果如圖6所示。
臍橙果面顏色為橙色,為了將亮度信息和圖像攜帶的信息區(qū)分開,結(jié)合RGB顏色模型和HIS顏色模型來提取臍橙的顏色特征,從RGB轉(zhuǎn)換到HIS模型的轉(zhuǎn)換公式為:
(1)
(2)
(R+G+B)/3
(3)
選取110個臍橙樣本,其正確率達到95%左右,驗證所選取算法的精確性。
極限學習機(extreme learning machine,ELM)是Hang等[10]于2006年提出的一種適用于單隱層前饋神經(jīng)網(wǎng)絡的新型學習算法模型,該算法在訓練前只需設置合適的隱層節(jié)點數(shù),隨機給輸入節(jié)點和隱層節(jié)電的權(quán)值與閾值賦值,在訓練過程中無需調(diào)整便可獲得唯一的最優(yōu)解,優(yōu)點是學習速度快、泛化性能好。
給定任意N個樣本(xi,yi),其中xi=[xi1,xi2,…,xin]T∈Rn是樣本輸入值,yi=[yi1,yi2,…,yin]T∈Rn是期望輸出值,激活函數(shù)g(x)是無限可微的,單隱層神經(jīng)網(wǎng)絡模型如圖7所示。
學習機模型可表示為:
(4)
式中j,1,2,…,N,wi=[wi1,wi2,win]T是輸入層節(jié)點與第i個隱含層節(jié)點的連接權(quán)值向量;βi=[βi1,βi2,…βin]是第i個隱含節(jié)點與網(wǎng)絡輸出層節(jié)點的連接權(quán)值向量;yi=[yi1,yi2,…,yim]是網(wǎng)絡的輸出值。對于任意的w和b,誤差函數(shù)E可表示為:
(5)
將其寫成矩陣形式,Hβ=Y,其中
H=(w1,w2,…,wL;b1,b2,…,bL;x1,x2,…,xL)=
由此可知,ELM在計算過程中不需要調(diào)整過多參數(shù),訓練速度較其他算法更快。
為了提高ELM的識別準確率,要選取較好的激活函數(shù),常用的有Sigmoidal、Sine和Hardlim幾種[11],通過分析不同神經(jīng)元個數(shù)對準確率的影響,最終選擇Sigmoidal函數(shù)作為ELM的激活函數(shù)。當隱含神經(jīng)元個數(shù)與訓練樣本個數(shù)相等時,ELM可以以零誤差逼近所有訓練樣本。當神經(jīng)元個數(shù)逐漸增多時,測試樣本識別準確率逐漸降低,需要綜合考慮進行選擇,本研究選用30作為隱含神經(jīng)元的個數(shù)。
臍橙的級別在出廠時已由專業(yè)人員通過評定確定了等級,分別為特級、一級、二級、三級、級外。其中特級果是臍橙橫徑在7.5到8.5厘米之間,果形為橢圓,著色率大于90%,表面光潔;一級果的著色率大于80%,表面附著物面積不超過10%;二級果的橫徑在7到9厘米之間,著色率80%以上,表面附著物面積不超過15%;三級果的橫徑在6.5至9.5之間,附著物面積不超過20%;級外的特征是特大特小尺寸,著色率差。其分級流程圖如圖8所示。
實驗共采集了326幅圖像,其中特級30幅,一級48幅,二級110幅,三級95幅,級外33幅,以Sigmoidal函數(shù)為激活函數(shù),隱含神經(jīng)元個數(shù)為30進行識別分析。識別結(jié)果如表1所示。可見,激活函數(shù)為Sigmoidal,隱含神經(jīng)元個數(shù)為30的極限學習機能夠準確對臍橙進行分級,誤差小于4%。
表1 識別結(jié)果
研究通過對臍橙圖像進行預處理,選擇HIS顏色模型,R分量灰度圖,對圖像去噪,分別提取臍橙的大小特征、缺陷特征和顏色特征。構(gòu)建極限學習機,選取Sigmoidal為激活函數(shù),隱含神經(jīng)元個數(shù)為30,試驗測得該模型的正確分級率較高。結(jié)果表明利用機器視覺技術(shù)將不同等級的臍橙識別出來是可行的,為臍橙的分級檢測提供了參考,也為其他球類農(nóng)產(chǎn)品的檢測提供了實際參考價值。