王春普 文懷興 王俊杰
(陜西科技大學(xué)機(jī)電工程學(xué)院,陜西 西安 710021)
大棗的營養(yǎng)價(jià)值高[1],但由于皮薄且脆,容易損傷[2],特別是在采收、運(yùn)輸和貯存過程中,由于自然和人為的因素容易造成表面缺陷[3]。根據(jù)相關(guān)標(biāo)準(zhǔn)[4]描述,大棗表面缺陷主要有銹斑、黑斑、畸形果,爛漿果,裂果,機(jī)械傷等。表面破損的大棗容易受到外界空氣的氧化發(fā)生變質(zhì),在清洗過程中也容易受到污染,影響大棗產(chǎn)品附加值,同時(shí)也一定程度上阻礙了大棗的商品流通化[5]。
人工檢測(cè)不僅對(duì)工人要求高,工作量大,且受個(gè)人主觀因素影響,造成分選偏差,很難保證檢測(cè)精度的一致性[6]。機(jī)器視覺系統(tǒng)通過工業(yè)相機(jī)獲取大棗的圖像,具有快速、準(zhǔn)確、可靠、無損等優(yōu)點(diǎn),極大地提高檢測(cè)效率和機(jī)械自動(dòng)化程度。張萌等[7]提出了一種亮度快速校正的算法,對(duì)蟲害棗、霉?fàn)€棗有很好的檢測(cè)效果,但未對(duì)黑斑、爛漿果、裂果等進(jìn)行檢測(cè)。
支持向量機(jī)在解決小樣本、非線性和高維模式識(shí)別中表現(xiàn)出許多特有的優(yōu)勢(shì),并能推廣應(yīng)用到函數(shù)擬合等其他機(jī)器學(xué)習(xí)問題中。為此,本試驗(yàn)擬以中國靈武長(zhǎng)棗為試驗(yàn)對(duì)象,通過支持向量機(jī)的方法對(duì)大棗表面的爛漿、機(jī)械傷、斑痕、病蟲、裂紋5種缺陷進(jìn)行檢測(cè),以期為大棗的分級(jí)提供理論依據(jù)與技術(shù)支持。
該檢測(cè)分級(jí)設(shè)備主要由上料箱、輸送鏈、圖像采集裝置、氣吹分級(jí)機(jī)構(gòu)、電機(jī)以及落料箱等組成,保證接通電源、開啟啟動(dòng)按鈕后可以實(shí)現(xiàn)靈武長(zhǎng)棗的自動(dòng)上料、單個(gè)傳送、自動(dòng)獲取大棗表面圖像、檢測(cè)等級(jí)、氣吹落料5個(gè)主要功能。
檢測(cè)分級(jí)設(shè)備三維模型如圖1所示,具體工作過程為:?jiǎn)?dòng)分級(jí)機(jī)電機(jī),輥軸傳送鏈在電機(jī)的帶動(dòng)下隨著主動(dòng)軸運(yùn)動(dòng),大棗從上料斗處上料,上料部分的鏈輪為傾斜向上,未平穩(wěn)定位的大棗從傳送帶上滑落重新定位,保證大棗能夠單排輸送;傳送鏈上的輥輪采用凹槽型設(shè)計(jì),可以讓未落入輥輪輸送鏈的大棗隨著輥輪滾動(dòng),與輥輪邊緣不斷摩擦,進(jìn)入輥輪輸送鏈中,保證大棗快速平穩(wěn)定位。當(dāng)大棗經(jīng)過觸發(fā)開關(guān)時(shí),攝像機(jī)采集圖像,圖像采集區(qū)處輥輪下方依然安裝柔性搓動(dòng)板,輥輪與柔性搓動(dòng)板不斷摩擦,帶動(dòng)大棗轉(zhuǎn)動(dòng)。柔性搓動(dòng)板的長(zhǎng)度至少能讓大棗繞自身旋轉(zhuǎn)一圈,保證相機(jī)能采集到大棗全方位圖像,拍攝到的同一大棗3幅圖片依次被傳送到圖像處理系統(tǒng),完成對(duì)大棗圖像的采集;大棗檢測(cè)分級(jí)系統(tǒng)對(duì)棗進(jìn)行分析判定,得出棗的等級(jí),隨之將分級(jí)結(jié)果信息傳送給氣動(dòng)分級(jí)系統(tǒng),氣動(dòng)分級(jí)系統(tǒng)控制電磁閥的開關(guān),當(dāng)大棗被傳送帶傳送到對(duì)應(yīng)的噴氣嘴時(shí),電磁閥打開,噴氣嘴噴出氣流,將大棗吹入對(duì)應(yīng)的落料箱中,完成大棗整個(gè)分級(jí)過程。其中工業(yè)相機(jī)型號(hào)為MV-GED500M-T,具有感應(yīng)器面積小,焦距短等特點(diǎn)。LED光源具有壽命高、響應(yīng)速度快、穩(wěn)定性好、波長(zhǎng)可以根據(jù)用途選擇等優(yōu)點(diǎn),故選擇環(huán)形LED燈作為光源。
1.上料箱 2.輸送鏈 3.圖像采集裝置 4.氣吹分級(jí)機(jī)構(gòu) 5.機(jī)架 6.落料箱 7.電機(jī)圖1 大棗分級(jí)機(jī)三維模型Figure 1 Three-dimensional model of jujube classifier
通過對(duì)大棗表面信息的訓(xùn)練,根據(jù)大棗表面是否存在缺陷,通過支持向量機(jī)的判別方法,將棗分為“good”和“bad”兩類。超平面H是從n維空間到n-1維空間的1個(gè)映射子空間,假設(shè)訓(xùn)練樣本數(shù)據(jù)T={(xi,yi),i=1,……,n,x∈Rd,y∈(+1,-1)}可以被超平面ωTx+b=0準(zhǔn)確分開,且距離超平面最近的向量與超平面之間的距離最大,則稱該訓(xùn)練樣本數(shù)據(jù)被超平面分開[8]。對(duì)于超平面H:ωTx+b=0,假設(shè)x為超平面上任意一點(diǎn),那么x點(diǎn)到超平面H之間的距離為x點(diǎn)到超平面H的法向量長(zhǎng)度,距離為:
(1)
假設(shè)線性可分的訓(xùn)練集T={(xi,yi),i=1,……,n,x∈Rd,y∈(+1,-1)}。
分類面方程為:
ωTx+b=0,
(2)
yi(ωTxi+b)≥1。
(3)
其中兩個(gè)分類超平面為:ωTx+b=1,ωTx+b=-1。
兩個(gè)分類超平面之間距離可表示為2/‖w‖,幾何間隔與誤分次數(shù)存在一定的關(guān)系,幾何間隔越大,誤分次數(shù)越少。使兩個(gè)分類超平面距離最大,即在式(3)的基礎(chǔ)上,求函數(shù)(4)的最小值。
(4)
對(duì)于線性可分問題,可以非常準(zhǔn)確地選擇出分化訓(xùn)練集的超平面;對(duì)于一般分類問題,由于包含線性不可分問題,上述方法是行不通的,可能是由于此分類超平面不存在。故需要在式(3)中添加松弛變量ξi≥0,i=1,……,n,使約束條件[式(3)]變?yōu)椋?/p>
yi(ωTxi+b)≥1-ξi,
(5)
當(dāng)ξi足夠大,訓(xùn)練點(diǎn)(xi,yi)總有滿足上述約束條件,但需避免ξi取值過大。在目標(biāo)函數(shù)里加入含有∑iξi的項(xiàng),使其成為最優(yōu)化問題。
(6)
式中:
C——懲罰因子,C值始終大于0。
懲罰因子越大,意味著目標(biāo)分類函數(shù)準(zhǔn)確性越小,同時(shí)也意味著對(duì)此類離群樣本點(diǎn)越重視[9]。
構(gòu)造分化超平面(ω*x)+b*=0,則支持向量機(jī)的判決函數(shù):
f(x)=sign[g(x)]=
(7)
其中大部分系數(shù)αi=0,只有少部分αi不為0,不為0的數(shù)確定了支持向量機(jī),多種分類情況時(shí)可以通過二交叉樹方法解決。引入核函數(shù),其作用為輸入2個(gè)低維度向量,可得到經(jīng)過某個(gè)變換后在高維空間中向量的內(nèi)積值。其中K(xi,x)=xi·x,則式(7)變形為:
(8)
在支持向量機(jī)判別中,將f(x)大于某個(gè)臨界值的分為一類,小于某個(gè)臨界值的分為一類。
圖像特征反映了目標(biāo)特征的差異性,具有明顯的實(shí)用價(jià)值。由于缺陷大棗的判別主要根據(jù)大棗的表面性質(zhì),與大棗的顏色息息相關(guān),且圖像或圖像區(qū)域的方向、大小對(duì)顏色的影響較小,故本課題選用大棗的顏色特征作為圖像特征。統(tǒng)計(jì)物體描述采用基本數(shù)值表示,稱為特征。HSI顏色空間比RGB顏色空間更能顯示人類的視覺特征,方便計(jì)算,為計(jì)算機(jī)圖像處理中常用的模型,故試驗(yàn)中將RGB顏色模型轉(zhuǎn)換為HSI顏色模型,由式(11)~(14)可以看出I分量為R、G、B三分量和的均值,S分量只與RGB中最小分量有關(guān),故I,S分量在缺陷處變化不明顯,不適合作為特征值。H分量在缺陷處變化較為明顯,故選用H分量作為特征值。
(9)
(10)
式中:
σH——大棗色調(diào)的均值;
N——大棗像素的總數(shù);
Hi——大棗第i個(gè)像素的色調(diào)。
RGB顏色模型轉(zhuǎn)換為HIS顏色模型的關(guān)系為:
(11)
(12)
(13)
(14)
核函數(shù)的選擇對(duì)于支持向量機(jī)的判別檢測(cè)性能非常重要,常甜甜[10]對(duì)核函數(shù)的選擇做了深入的研究。通過不同的試驗(yàn),確定了采用徑向基核函數(shù)得出的試驗(yàn)結(jié)果準(zhǔn)確率較高。徑向基核函數(shù)具有以下優(yōu)點(diǎn):① 參數(shù)少,只有核參數(shù)和懲罰因子,模型復(fù)雜性較低,穩(wěn)定性較好,結(jié)果不會(huì)有太大偏差;② 能隱藏節(jié)點(diǎn)數(shù),避免了神經(jīng)網(wǎng)絡(luò)方法求解不出局部極小點(diǎn)問題。故選用徑向基核函數(shù)作為支持向量機(jī)模型的核。
核函數(shù)c和正則常數(shù)γ影響著核函數(shù)及分類器的分類準(zhǔn)確性。目前無統(tǒng)一的方法求核函數(shù)和正則常數(shù),一般是通過多次試驗(yàn)選擇合適的值。本試驗(yàn)采用二因素三水平正交試驗(yàn)(表1)比較核函數(shù)和正則常數(shù)對(duì)檢測(cè)分級(jí)效果的影響,選擇最佳核函數(shù)和正則常數(shù)。
從表2中可以看出核函數(shù)的極差較大,表明核函數(shù)的影響較大,正則常數(shù)次之。核函數(shù)要求指標(biāo)適中,取3個(gè)水平中間所對(duì)應(yīng)的值,即0.2。正則常數(shù)要求指標(biāo)越大越好,取3個(gè)水平中最大值,即88.233,對(duì)應(yīng)的正則常數(shù)為0.005。
表1 因素水平表Table 1 The factor design level table
表2 核函數(shù)及正則常數(shù)正交表Table 2 The kernel function and regular constant orthogonal Tablele
由圖4可知,開始時(shí)準(zhǔn)確率隨著c的增大而增大;當(dāng)γ>0.2時(shí),隨著c的增大,準(zhǔn)確率逐漸降低;當(dāng)γ<0.05,c<0.5時(shí)檢測(cè)結(jié)果較為滿意;當(dāng)c=0.2,γ=0.005時(shí),正確率最高,為94.6%。
本文提出了基于支持向量機(jī)的大棗表面缺陷檢測(cè)方法,選用HSI顏色模型中色調(diào)(H)分量的均值和方差作為特征參數(shù),通過正交試驗(yàn)得出最佳的核函數(shù)和正則常數(shù),建立基于支持向量機(jī)的大棗表面缺陷檢測(cè)模型。通過試驗(yàn)驗(yàn)證,對(duì)測(cè)試樣本缺陷的識(shí)別率達(dá)到94.6%,相比趙杰文等[11]的準(zhǔn)確率(89.4%),平均水平已滿足在線檢測(cè)的準(zhǔn)確性、效率性要求,說明機(jī)器視覺在線檢測(cè)的準(zhǔn)確率和效率完全不低于人工檢測(cè),并驗(yàn)證了支持向量機(jī)分類是一種優(yōu)秀的分類方法應(yīng)予以推廣。該研究成果可以用于大棗的在線檢測(cè)分級(jí),同時(shí)也可以為其他水果的檢測(cè)分級(jí)提供一定的參考。由于實(shí)驗(yàn)室中光照不夠均勻,鮮棗表面光滑使得采集到的圖像容易形成亮斑,若蟲棗的缺陷在大棗左右兩端將無法被相機(jī)拍到,導(dǎo)致分級(jí)效果較差,后續(xù)可以采用改變大棗圖像采集時(shí)的拍照方式,確保整個(gè)大棗表面均能被拍到,從而提高蟲棗識(shí)別率;此外褶皺棗易識(shí)別為裂棗,需通過改變特征提取和識(shí)別的方式改進(jìn)。
圖2 正常大棗Figure 2 The normal jujube
圖3 缺陷大棗Figure 3 The defect jujube
圖4 SVM參數(shù)選擇3D效果圖Figure 4 The SVM parameters select 3D renderings