何洋洋 蔣正帥 商丘工學(xué)院
采摘機(jī)器人的視覺(jué)系統(tǒng)是重要環(huán)節(jié),能否對(duì)果實(shí)快速準(zhǔn)確的定位是機(jī)器人視覺(jué)系統(tǒng)中的關(guān)鍵技術(shù),直接影響到機(jī)器人的工作效率和可靠性。在采摘機(jī)器人的相關(guān)研究中,識(shí)別準(zhǔn)確率嚴(yán)重制約著機(jī)器人在自然條件下的工作效率,M.Z.Abdullah用線性判別分析識(shí)別楊桃正確率為95.3%,油椰子分類識(shí)別率為90%,該方法要求所用數(shù)據(jù)集是正態(tài)分布的,而事實(shí)上特征空間中的數(shù)據(jù)并不一定符合條件。本文以成熟番茄果實(shí)為研究對(duì)象,為消除光照影響,根據(jù)光照無(wú)關(guān)原理對(duì)自然環(huán)境中拍攝的番茄圖像進(jìn)行關(guān)照無(wú)關(guān)化處理,獲得光照無(wú)關(guān)圖,通過(guò)不通核函數(shù)識(shí)別圖片信息,并采用交叉驗(yàn)證和網(wǎng)格搜索的方法進(jìn)行支持向量機(jī)最優(yōu)模型參數(shù)優(yōu)化。
試驗(yàn)所用圖像為自然條件下拍攝的彩色番茄果實(shí)圖像。為減少噪聲干擾,采用矢量中值濾波進(jìn)行圖像增強(qiáng)。由于番茄生長(zhǎng)于自然環(huán)境中,光源的方向、拍攝距離和光照強(qiáng)度等均會(huì)對(duì)番茄果實(shí)圖像產(chǎn)生影響,環(huán)境的光照會(huì)改變圖像的真實(shí)信息,進(jìn)而影響視覺(jué)系統(tǒng)的識(shí)別準(zhǔn)確性。為消除光照強(qiáng)度的影響,本文采用圖像單個(gè)像素的顏色恒常性算法,對(duì)中值濾波后的番茄圖像進(jìn)行光照無(wú)關(guān)處理,獲得番茄光照無(wú)關(guān)圖。
本文采用最大類間方差(OSTU)法對(duì)圖像進(jìn)行成熟番茄和背景的分割,基于灰度直方圖的自動(dòng)閾值分割方法,通過(guò)選取圖像的任意灰度級(jí)t為初始分割閾值計(jì)算目標(biāo)與背景之間的方差,遍歷所有灰度級(jí)計(jì)算方差值,使方差最大的灰度級(jí)就是最佳分割閾值。
在番茄圖片中,成熟番茄果實(shí)、枝葉都有特定的形狀,并且差異大,因此番茄的形狀特征明顯,根據(jù)識(shí)別理論進(jìn)行分類識(shí)別。物體的幾何形狀具有RST(旋轉(zhuǎn)、比例、平移)不變性的特點(diǎn),即物體的幾何特征不會(huì)因在圖像中的位置、大小和圖像的旋轉(zhuǎn)角度的改變而變化。因此,根據(jù)上述特性,本文結(jié)合番茄圖像的特點(diǎn),采用圓方差、離散度和伸長(zhǎng)度作為形狀特征。
支持向量機(jī)(SVM)通過(guò)結(jié)構(gòu)風(fēng)險(xiǎn)最小化準(zhǔn)則(SRM)和核函數(shù)的方法,將待解決的模式識(shí)別轉(zhuǎn)化為二次規(guī)劃尋優(yōu)問(wèn)題。對(duì)于線性可分的訓(xùn)練樣本集(xi,yi),可被分類面沒(méi)有錯(cuò)誤地分開(kāi)。類別間的間隔距離越大,推廣能力越強(qiáng),使分類間隔距離最大的分類面為最優(yōu)分類面。對(duì)于線性不可分問(wèn)題,需要引入松弛項(xiàng)和錯(cuò)誤懲罰參數(shù)C。應(yīng)用二次規(guī)劃方法可以求出最優(yōu)分類函數(shù)為:
其中,a*為拉格朗日乘子,b為分類閾值,K(*)為核函數(shù)。
在白天不同時(shí)間、光照條件下,順光逆光不同角度拍攝番茄圖片,實(shí)驗(yàn)拍攝訓(xùn)練照片240張,提取了853個(gè)訓(xùn)練樣本,測(cè)試圖片110張,提取了477個(gè)測(cè)試樣本。首先提取目標(biāo),然后計(jì)算顏色特征、形狀特征和紋理特征。識(shí)別的準(zhǔn)確率是模型識(shí)別效果好壞的重要指標(biāo),本文定義識(shí)別準(zhǔn)確率為:,其中i為正確識(shí)別的番茄數(shù)量,N為區(qū)域內(nèi)番茄的數(shù)目。
懲罰參數(shù)C和模型參數(shù)r是RBF核函數(shù)的兩個(gè)重要參數(shù),對(duì)于給定的問(wèn)題,需要對(duì)C和r進(jìn)行參數(shù)優(yōu)化,本文采用交叉驗(yàn)證(CV)和網(wǎng)格搜索的方法獲取最優(yōu)模型參數(shù),以實(shí)現(xiàn)分類器對(duì)番茄較高的識(shí)別準(zhǔn)確率。在交叉驗(yàn)證中,現(xiàn)將訓(xùn)練集分為n個(gè)子集,然后將n-1個(gè)子集用來(lái)訓(xùn)練,剩下的一個(gè)用于測(cè)試。所有訓(xùn)練集中的每個(gè)子集都進(jìn)行一次測(cè)試,數(shù)據(jù)的正確分類百分比就是交叉驗(yàn)證精度,交叉驗(yàn)證可以避免過(guò)度擬合問(wèn)題。在網(wǎng)格搜索中,參數(shù)C和r取不同值進(jìn)行實(shí)驗(yàn),當(dāng)識(shí)別準(zhǔn)確率達(dá)到最高時(shí),獲取最優(yōu)參數(shù)值。
本文采用RBF核函數(shù),對(duì)樣本數(shù)據(jù)進(jìn)行交叉驗(yàn)證和網(wǎng)格搜索如圖1所示,交叉驗(yàn)證分類的子集數(shù)目n取不同值時(shí),獲得的C和r也有差異,最終影響測(cè)試的準(zhǔn)確率。由圖1知,番茄圖象樣本訓(xùn)練得到模型的最優(yōu)參數(shù)中,當(dāng)子集數(shù)量分別是2個(gè)和10個(gè)時(shí),最優(yōu)參數(shù)C=1,r=16,最高識(shí)別準(zhǔn)確率是96.7575%;當(dāng)子集數(shù)量分別為5個(gè)和7個(gè)時(shí),最優(yōu)參數(shù)C=4,r=16,而最高識(shí)別率是96.8872%。實(shí)驗(yàn)證明,支持向量機(jī)可通過(guò)交叉驗(yàn)證和網(wǎng)格搜索的方法進(jìn)行參數(shù)尋優(yōu),并且使用優(yōu)化參數(shù)的支持向量機(jī)對(duì)番茄的識(shí)別正確率很高。
圖1 不同N值交叉驗(yàn)證-網(wǎng)格搜索曲線
本文采用的基于光照無(wú)關(guān)圖與支持向量機(jī)識(shí)別方法,實(shí)現(xiàn)了支持向量機(jī)的分類識(shí)別。采用交叉驗(yàn)證與網(wǎng)格搜索的方法對(duì)使用徑向基核函數(shù)的支持向量機(jī)進(jìn)行參數(shù)優(yōu)化,較好的解決了徑向基核函數(shù)參數(shù)選擇的難題,對(duì)于未被識(shí)別的番茄,主要原因是番茄與枝葉等其他物體之間的相互遮擋,對(duì)這種情況的番茄識(shí)別需要更多研究。