李學(xué)軍 程 紅
(1. 四川大學(xué)錦城學(xué)院,四川 成都 611731;2. 成都理工大學(xué)管理科學(xué)學(xué)院,四川 成都 610059)
目前,蘋果分級(jí)主要以人工分揀為主,其工作量大/效率低且速度慢[1]。近年來,隨著機(jī)械視覺技術(shù)的發(fā)展,基于機(jī)械視覺技術(shù)的農(nóng)產(chǎn)品自動(dòng)分級(jí)方法已迅速發(fā)展為一種取代人眼的快速、無損、高效的檢測(cè)技術(shù)[2]。趙利平等[3]提出了一種結(jié)合小波算法和模糊算法的蘋果分級(jí)方法,該算法在蘋果分級(jí)的3個(gè)層次中的分類準(zhǔn)確率均>97%。王陽陽等[4]提出了一種蘋果分級(jí)算法,該算法將同構(gòu)濾波與改進(jìn)的k均值相結(jié)合,可以減少傳統(tǒng)圖像分割的影響,且該方法對(duì)蘋果尺寸、質(zhì)量、色澤、形狀和缺陷的識(shí)別準(zhǔn)確率>97%。王立揚(yáng)等[5]提出了一種改進(jìn)的LeNet-5t自動(dòng)分級(jí)方法,將卷積層添加至第4層以加深網(wǎng)絡(luò)深度,使用Leakerel激勵(lì)函數(shù),并添加一個(gè)dropout層以防止過度擬合。結(jié)果表明,該算法具有良好的檢測(cè)效果,準(zhǔn)確率達(dá)97.37%。樊澤澤等[6]提出了一種基于顏色和果徑的水果檢測(cè)和分級(jí)算法,對(duì)卷積神經(jīng)網(wǎng)絡(luò)提取的多尺度特征圖進(jìn)行回歸預(yù)測(cè),并根據(jù)顏色分量進(jìn)一步校正檢測(cè)幀的位置。結(jié)果表明,該方法的準(zhǔn)確率為96.6%。上述研究多是基于單一特征分類,分類過程復(fù)雜且效率低。
文章擬提出一種基于判別樹和粒子群優(yōu)化(PSO)支持向量機(jī)(SVM)的蘋果分級(jí)檢測(cè)特征融合方法,引入核主成分分析(KPCA)降低高維特征的維數(shù),采用判別樹法根據(jù)水果的果徑、缺陷區(qū)域和顏色進(jìn)行分類,采用改進(jìn)的支持向量機(jī)根據(jù)果形、紋理和成熟度進(jìn)行分級(jí),結(jié)合各單一特征對(duì)蘋果進(jìn)行綜合評(píng)估,旨在為蘋果分級(jí)檢測(cè)技術(shù)的發(fā)展提供依據(jù)。
機(jī)器視覺是集動(dòng)力學(xué)、光學(xué)設(shè)備、電磁感應(yīng)、數(shù)字視頻和圖像處理技術(shù)的系統(tǒng)學(xué)科[7]。為了解決人工分類精度差的問題,國內(nèi)外制造商開始使用機(jī)器視覺對(duì)蘋果質(zhì)量進(jìn)行分級(jí)[8]。如圖1所示,在傳送帶的驅(qū)動(dòng)下,蘋果和傳送帶沿相同方向運(yùn)行,穿過暗箱3時(shí),3個(gè)內(nèi)部視覺傳感器分別從頂部和側(cè)面拍攝蘋果照片,從而可以一次收集每個(gè)蘋果90%以上的表面信息。圖像采集完成后,將3個(gè)不同角度的采集圖像發(fā)送至計(jì)算機(jī),由圖像采集卡進(jìn)行處理,并通過軟件編程完成圖像的預(yù)處理。再根據(jù)標(biāo)準(zhǔn)提取蘋果的特征參數(shù),并根據(jù)果徑、缺陷面積、顏色、果形、紋理和成熟度對(duì)蘋果進(jìn)行分級(jí)[9]。

1. 視覺傳感器 2. 光源 3. 暗箱 4. 輸送結(jié)構(gòu)圖1 系統(tǒng)結(jié)構(gòu)Figure 1 System structure
蘋果在線分級(jí)檢測(cè)是實(shí)現(xiàn)蘋果商業(yè)化的重要途徑,不僅要滿足分類精度要求,還要滿足速度要求[10]。蘋果分級(jí)過程中,各特征間無關(guān)性且單一特征無法確定蘋果的等級(jí),因此引入決策融合概念。采用基于決策樹分類模型和改進(jìn)的支持向量機(jī)分類模型結(jié)合的決策融合方法實(shí)現(xiàn)蘋果的分級(jí)。

圖2 蘋果分級(jí)流程Figure 2 Apple grading process
(1) 果徑R:按式(1)計(jì)算[11]。
(1)
式中:
Np——蘋果區(qū)域內(nèi)像素?cái)?shù);
Pe——像素當(dāng)量;
Cp——圖像壓縮率。
(2) 缺陷面積S:按式(2)計(jì)算[12]。
(2)
式中:
Nq——蘋果缺陷區(qū)域中的像素?cái)?shù)。
(3) 色澤Q:蘋果紅色區(qū)域中的像素?cái)?shù)與像素總數(shù)之比[13]。
(4) 果形:使用凸度Dc表示水果形狀的規(guī)則度,并按式(3)計(jì)算[14]。
(3)
式中:
So、Sc——目標(biāo)和目標(biāo)最小凸殼的像素?cái)?shù)。
(5) 果面紋理:紋理可以表示蘋果表面的光滑性。通過灰度共生矩陣對(duì)紋理特征進(jìn)行分析,采用對(duì)比度、能量、熵和逆差距描述紋理特征[15]。
(6) 成熟度:蘋果的成熟度特征主要包括R分量平均值和方差、G分量均值與方差、平均灰度5個(gè)參數(shù)值[16]。
判別樹可以清楚地顯示條件、決策與下一步的邏輯關(guān)系[17]。使用以下步驟創(chuàng)建決策表:
(1) 確定判斷的必要條件,只能是發(fā)生(Y)或不發(fā)生(N)兩種值[18]。
(2) 根據(jù)情況確定適當(dāng)?shù)膭?dòng)作。
(3) 排除所有組合。
(4) 以各種組合確定相應(yīng)的動(dòng)作,為條件項(xiàng)和動(dòng)作項(xiàng)創(chuàng)建決策規(guī)則,并指導(dǎo)決策。
(5) 檢查決策表中的決策規(guī)則是否冗余[19]。
根據(jù)果實(shí)直徑、缺陷面積和色澤特征,以評(píng)分指標(biāo)建立判別樹模型,對(duì)樣本進(jìn)行判斷,得出候選等級(jí),其層次結(jié)構(gòu)如圖3所示。

圖3 判別樹分級(jí)流程Figure 3 Apple grading process
為了滿足分類的實(shí)時(shí)要求,有必要對(duì)高維特征進(jìn)行降維處理。由于特征集是非線性的,因此引入核主成分分析以降低高維特征的維數(shù)[20]。為了避免在降維訓(xùn)練中盲目選擇參數(shù),使用“粒子群優(yōu)化”來優(yōu)化徑向基函數(shù)的參數(shù)[21]。
(1) 核主成分分析:設(shè)輸入樣本矩陣X={x1,x2,…,xN},對(duì)X進(jìn)行非線性變換φ(·)映射向特征F空間。設(shè)j=1,2,…,N,協(xié)方差矩陣為[22]:
(4)
解方程λv=Cv的特征值λ和特征向量v,設(shè)i=1,2,…,N,存在系數(shù)α={α1,α2,…,αN}。特征向量v為:
(5)
KPCA利用核函數(shù)實(shí)現(xiàn)非線性變換,定義核函數(shù)K(xi,x)=[φ(xi),φ(x)],則
Nλα=Kα。
(6)
設(shè)特征值λ1≥λ2≥…≥λp>0(p≤N),則對(duì)應(yīng)的向量為α1,α2,…,αp,能得到特征空間F主軸方向,v1,v2,…,vp。 設(shè)m=1,2,…,p,任一向量x在特征空間F中第m個(gè)非線性主元tm為
(7)
核函數(shù)選擇徑向基核函數(shù):
K(xi,x)=exp(-‖x-xi‖2/g),
(8)
式中:
g——選定的參數(shù)。
(2) 粒子群優(yōu)化的支持向量機(jī):使用“粒子”作為進(jìn)化過程中優(yōu)化問題的解決方案[23]。新粒子的位置由飛行速度v1確定,v1根據(jù)群進(jìn)化過程的個(gè)體最優(yōu)pbestid和全局最優(yōu)gbest計(jì)算:
(9)
(10)
式中:
i=1,2,…,l;
d=1,2,…,o;
l——粒子數(shù);
o——維數(shù);
r1、r2——[0,1]的隨機(jī)數(shù);

c1、c2——自學(xué)習(xí)和社會(huì)學(xué)習(xí)系數(shù)。
支持向量機(jī)是建立一個(gè)分類超平面,作為非線性、小樣本、高維實(shí)際問題的決策面,具有良好解析能力。
假設(shè)訓(xùn)練樣本xi∈Rn,i=1,2,…,L,標(biāo)簽向量yi=±1和核函數(shù)K,ai為每個(gè)樣本的Lagrange乘數(shù)。對(duì)于特定的分類問題,關(guān)鍵是計(jì)算ai,構(gòu)造和求解優(yōu)化問題如式(11)所示[24]。
(11)
式中:
ζ——懲罰因子。
由式(11)可得最佳解a*=(a1,a2,…,aL)T,偏項(xiàng)b*為
(12)
則 SVM 的分類函數(shù)P(x)為:
(13)
式中:
sgn(·)——符號(hào)函數(shù)(徑向基函數(shù)作為核函數(shù))。
因?yàn)橹С窒蛄繖C(jī)只適用于兩類,所以使用一對(duì)一的識(shí)別策略。對(duì)于3類的問題,需要?jiǎng)?chuàng)建3個(gè)分類函數(shù)。在對(duì)樣本進(jìn)行分類時(shí),其結(jié)果是通過投票產(chǎn)生的。
由于對(duì)支持向量機(jī)的參數(shù)ζ和核參數(shù)g影響較大。為了避免盲目選擇參數(shù),引入全局遍歷能力較好的粒子群優(yōu)化算法(PSO-SVM),其分級(jí)流程如圖4所示。

圖4 PSO優(yōu)化SVM分類流程Figure 4 Virtual machine allocation process
將判別樹分級(jí)結(jié)果與粒子群優(yōu)化的支持向量機(jī)分類結(jié)果進(jìn)行決策融合,可以避免單個(gè)分類器的局限性,并為不同的分級(jí)方法進(jìn)行優(yōu)勢(shì)互補(bǔ)。使用C-SVC分類類型和RBF核函數(shù),網(wǎng)格方法參數(shù)的搜索范圍為[1e-1,1e2]??紤]到PSO算法的隨機(jī)性,將5次運(yùn)算后的最優(yōu)值作為最終結(jié)果。對(duì)于蘋果樣本,決策融合策略是:將判別樹分類模型的分類結(jié)果與粒子群優(yōu)化支持向量機(jī)分類模型進(jìn)行比較,最終樣本分別對(duì)應(yīng)于兩個(gè)結(jié)果的較低級(jí)別。例如,對(duì)于特定樣本,如果判別樹分類模型的分類級(jí)別為一級(jí),而粒子群優(yōu)化支持向量機(jī)分類模型的分類級(jí)別為二級(jí),則蘋果樣本的級(jí)別為二級(jí)。
利用基于機(jī)器視覺的蘋果在線檢測(cè)分級(jí)系統(tǒng)采集蘋果圖像,對(duì)背景區(qū)域進(jìn)行裁剪以減少背景區(qū)域在圖像框架中的比例。經(jīng)排序和分類后,每個(gè)級(jí)別選擇1 000個(gè)蘋果樣本,訓(xùn)練樣本500個(gè),待識(shí)別樣本500個(gè)。
為了驗(yàn)證融合決策的有效性,將文中分級(jí)方法與判別樹分級(jí)方法、SVM、KPCA-SVM分級(jí)方法和KPCA-PSO-SVM分級(jí)方法進(jìn)行比較。每次隨機(jī)在蘋果圖片中抽取1 000張?zhí)O果圖片,進(jìn)行7次測(cè)試識(shí)別,其結(jié)果見表1。
由表1可知,判別樹的分類精度高于單個(gè)SVM分類器的識(shí)別結(jié)果。與單個(gè)SVM分類器相比,使用KPCA降維功能進(jìn)行SVM分類不僅可以提高識(shí)別精度,還可以提高分類率。與單一分類器相比,決策融合明顯提高了蘋果識(shí)別的準(zhǔn)確性。試驗(yàn)方法的分類速度與KPCA+PSO-SVM相同,但其準(zhǔn)確率提高了0.61%。因此,試驗(yàn)分類方法不僅提高了識(shí)別能力,還滿足了實(shí)時(shí)性要求。

表1 分級(jí)方法對(duì)比Table 1 Detection result
為了驗(yàn)證試驗(yàn)檢測(cè)方法的準(zhǔn)確性,選擇500個(gè)有缺陷的蘋果和1 000個(gè)完好的蘋果(一級(jí)蘋果和二級(jí)蘋果各500個(gè)),并通過試驗(yàn)采集所需的蘋果圖像進(jìn)行測(cè)試,結(jié)果見表2。由表2可知,采用試驗(yàn)分類方法分別檢出一等品497個(gè),二等品507個(gè),三等品496個(gè);6個(gè)一等品被錯(cuò)誤地分類為二等品,3個(gè)二等品被錯(cuò)誤地分類為一等品,7個(gè)二等品被錯(cuò)誤地分類為三等品,11個(gè)三等品被錯(cuò)誤地分類為二等品;平均分類準(zhǔn)確率為98.20%。

表2 等級(jí)分類結(jié)果Table 2 Detection result
若按缺陷果和完好果進(jìn)行劃分,其識(shí)別結(jié)果準(zhǔn)確率如表3所示。由表3可知,缺陷和完整蘋果的識(shí)別率分別為97.80%,98.40%,說明文中所提出的決策融合方法具有實(shí)用性,分類準(zhǔn)確率可以達(dá)到98%以上,平均分類率為4個(gè)/s,不僅提高了識(shí)別精度,還滿足了實(shí)時(shí)性要求。

表3 識(shí)別結(jié)果Table 3 Detection result
研究了一種判別樹和改進(jìn)支持向量機(jī)決策融合的蘋果分級(jí)方法。結(jié)果表明,該方法的分類準(zhǔn)確率>98%,該融合方法具有實(shí)際應(yīng)用價(jià)值。但該方法沒有對(duì)蘋果缺陷進(jìn)行細(xì)分,后續(xù)將不斷改進(jìn)和完善基于決策融合的蘋果分級(jí)檢測(cè)技術(shù)。