陳 宇,黃仲洋,江露,鐘秋波
(東北林業(yè)大學(xué)信息與計(jì)算機(jī)工程學(xué)院,黑龍江哈爾濱150040;2.寧波工程學(xué)院,浙江寧波315000)
進(jìn)入21世紀(jì),機(jī)器人研究取得了重大進(jìn)展。全自主仿人機(jī)器人是仿人機(jī)器人研究中非常熱門(mén)的一個(gè)領(lǐng)域,許多大學(xué)或研究機(jī)構(gòu)都對(duì)其投入了巨大的精力。嵌入式視覺(jué)系統(tǒng)是全自主仿人機(jī)器人系統(tǒng)的基礎(chǔ),它對(duì)機(jī)器人的總體性能起著決定性作用,機(jī)器人對(duì)目標(biāo)的識(shí)別是建立在視覺(jué)系統(tǒng)基礎(chǔ)上的[1-2]。
果實(shí)顏色是果實(shí)非常直觀的重要特征,不同果實(shí)的顏色差別很大,這樣就能有效提取果實(shí)特征,從而對(duì)果實(shí)進(jìn)行識(shí)別。過(guò)去工作主要依靠人工完成,耗時(shí)耗力并且效率低下,借助計(jì)算機(jī)提高了工作效率,并將此技術(shù)和類(lèi)人機(jī)器人結(jié)合,大大提高了分析的準(zhǔn)確性。
類(lèi)人機(jī)器人自帶的攝像頭作為視覺(jué),通過(guò)攝像頭獲取彩色圖像。傳統(tǒng)的彩色圖像分析是基于RGB色度空間的,但是RGB空間是顏色顯示空間,并不適合人的視覺(jué)特性,而HSV色度空間能很好地體現(xiàn)出人眼辨別顏色的特點(diǎn),在HSV空間,圖像特征明顯,易于處理[3]。因此該研究采用HSV色度空間對(duì)圖像進(jìn)行顏色提取。
將顏色作為果實(shí)特征后,結(jié)合高斯混合模型算法,對(duì)顏色進(jìn)行辨識(shí),從而達(dá)到對(duì)果實(shí)的辨識(shí)。高斯混合模型算法滿(mǎn)足收斂條件并且提高了識(shí)別的效率,試驗(yàn)結(jié)果表明,該算法是有效的,與BP神經(jīng)網(wǎng)絡(luò)、SVM支持向量機(jī)、決策樹(shù)的識(shí)別算法相比,基于高斯混合模型的果實(shí)識(shí)別算法獲得了較高的識(shí)別率,取得了很好的試驗(yàn)效果。
1.1 顏色空間的選擇 要處理彩色圖像,首先要選取合適的顏色空間。顏色空間指的是某個(gè)三維顏色空間中的一個(gè)可見(jiàn)光子集。它包含某個(gè)顏色域的所有顏色。顏色空間的用途是在某個(gè)顏色域內(nèi)方便地指定顏色。一般,圖像常采用RGB三元色彩色空間表示,但RGB三色空間中兩點(diǎn)間的歐氏距離與顏色距離不呈線(xiàn)性比例,換句話(huà)說(shuō),就是顏色受亮度的影響很大,RGB顏色空間不具有進(jìn)行彩色圖像處理所要求的獨(dú)立性和均勻性指標(biāo)。所謂獨(dú)立性是指顏色空間的3個(gè)分量互不影響,對(duì)于其中某個(gè)分量的處理不導(dǎo)致其他分量相對(duì)于人眼感覺(jué)發(fā)生變化。而均勻性是指對(duì)顏色空間中的每一個(gè)分量來(lái)說(shuō),相同的處理改變量在不同的取值處應(yīng)引起相同的視覺(jué)變化。然而絕對(duì)滿(mǎn)足獨(dú)立性和均勻性的顏色空間是不存在的[4],只能根據(jù)實(shí)際情況,找到一種能在較大范圍內(nèi)符合上述兩個(gè)條件的顏色空間。為更好地進(jìn)行顏色辨識(shí),通過(guò)試驗(yàn),該研究采用了HSV顏色空間。
1.2 HSV色度空間變換原理 攝像頭獲取的圖像一般為RGB圖像,因此先要將顏色空間從RGB轉(zhuǎn)換到HSV。如圖1,HSV 色彩空間是一個(gè)六棱錐體,0≤H≤360,0≤S≤1,0≤V≤1,對(duì)于 R、G、B∈[0,1],RGB 空間到 HSV 空間的映射過(guò)程如下:
果實(shí)識(shí)別算法有BP、貝葉斯、決策樹(shù)等,但高斯混合模型試驗(yàn)得到了較好的效果,識(shí)別率較高。
圖1 HSV色彩空間
高斯混合模型是一種常用的描述混合密度函數(shù)分布的模型,矢量特征在概率空間的分布狀況通過(guò)若干個(gè)高斯概率密度函數(shù)的加權(quán)和進(jìn)行描述。即每個(gè)高斯混合模型是由K個(gè)Gaussian分布構(gòu)成,1個(gè) Guassian是“Gomponent”,形成多個(gè)分類(lèi)器,對(duì)Gomponent進(jìn)行線(xiàn)性加和形成混合高斯模型的概率密度函數(shù)[5]:
式中,xi是 d 維矢量;θ=(μ1,μK,Σ1,Σk),為高斯混合分布參數(shù);αk是加權(quán)的系數(shù),代表選中每個(gè)Component的概率,需要滿(mǎn)足限制條件是 Component的高斯概率密度分布,如下:
式中,μk是均值;Σk是協(xié)方差矩陣。
GMM模型的各個(gè)分量是通過(guò)均值和方差表示的,GMM的分類(lèi)過(guò)程是以均值為中心的橢圓體分布,方差決定它的幾何性質(zhì)。使用高斯混合模型對(duì)流型樣本分類(lèi),首先對(duì)未知參數(shù) K、αk、μk、Σk的值進(jìn)行初始化,才能構(gòu)造 GMM 模型,對(duì)概率密度函數(shù)建模。果實(shí)樣本分為5類(lèi):香蕉、西瓜、番茄、葡萄、蘋(píng)果。因此參數(shù)K=5,對(duì)于剩余3個(gè)參數(shù)的估計(jì)有多種方法,使用的比較頻繁的是EM算法。
EM算法也稱(chēng)作期望最大算法,是對(duì)參數(shù)的最大似然估計(jì),此算法主要應(yīng)用在如下方面:①對(duì)不完整數(shù)據(jù)的估計(jì);②假設(shè)缺失的數(shù)據(jù)存在,降低似然函數(shù)復(fù)雜度[6]。
EM算法的執(zhí)行過(guò)程[7]如下。
首先,計(jì)算期望(Expectation),估計(jì)隱含變量。觀測(cè)數(shù)據(jù)確定,對(duì)完整似然函數(shù)的期望計(jì)算。
式中,θk-1是當(dāng)前的參數(shù)估計(jì)值;θ是更新后的參數(shù)值。
然后,計(jì)算極大值,估計(jì)其他參數(shù)。求解θ,使 Q(θ,θk-1)得到極大值,即:
在高斯混合模型中,樣本數(shù)據(jù)由不完整數(shù)據(jù)構(gòu)成,則加入隱含變量 Z={z1,z2,…,zN},zi=(zi1,zi2,…,zik)獨(dú)立分布于K類(lèi),隱含變量的概率分別為α1,…,αk,滿(mǎn)足如下:
算法執(zhí)行過(guò)程中對(duì)數(shù)似然函數(shù)定義為:
式中,p(k|xi,θt-1)是K類(lèi)分布的后驗(yàn)概率:
使用梯度法求解條件極值,可得如下關(guān)系式:
即:
其中:
對(duì) Q(θ,θt-1),求其關(guān)于 μk、Σk的導(dǎo)數(shù),讓其為 0,可得均值重估公式:
方差重估公式:
迭代終止的條件就是迭代重估公式,直到滿(mǎn)足預(yù)先設(shè)定的條件。EM算法涉及的理論比較簡(jiǎn)單和單一,其主要優(yōu)點(diǎn)是簡(jiǎn)單和穩(wěn)定,每次迭代都能保證觀察數(shù)據(jù)對(duì)數(shù)似然是增大的。但EM算法也有其缺點(diǎn),主要是收斂速度慢,尤其當(dāng)輸入的數(shù)據(jù)維數(shù)過(guò)高或者規(guī)模過(guò)大時(shí),將嚴(yán)重影響收斂速度。EM算法能找到局部最大點(diǎn),但對(duì)于找全局最大點(diǎn)比較困難[8]。EM算法的初始化有嚴(yán)格的要求,對(duì)于不同的初始值,能夠使得結(jié)果有較大差異[9]。目前最有效的方法是將Kmeans算法與EM算法相結(jié)合,使用Kmeans算法來(lái)計(jì)算群聚中心點(diǎn),當(dāng)作EM參數(shù)中均值的初始輸入值。
Kmeans聚類(lèi)是聚類(lèi)算法中常用的算法[10]。該算法輸入?yún)?shù)K,將輸入特征矩陣劃分為K個(gè)聚類(lèi),相同聚類(lèi)對(duì)象的相似度較高,反之較小。主要思想是:選取K個(gè)中心點(diǎn)聚類(lèi),對(duì)最靠近中心點(diǎn)的對(duì)象歸類(lèi),通過(guò)迭代的方法,逐次更新各聚類(lèi)中心的值,直至得到最好的聚類(lèi)結(jié)果[11]。得到各個(gè)聚類(lèi)的中心點(diǎn)之后,將其作為EM算法初始值。該算法使用的很廣泛,尤其是和EM算法相結(jié)合,先對(duì)初始數(shù)據(jù)進(jìn)行粗略分類(lèi),再將得到的數(shù)據(jù)作為參數(shù)估計(jì)初始化的數(shù)據(jù)。將這兩種算法結(jié)合能提高EM算法收斂的速度和分類(lèi)的正確率。
由于季節(jié)等試驗(yàn)條件的原因,該試驗(yàn)均為類(lèi)人機(jī)器人對(duì)不同果實(shí)圖片的識(shí)別,見(jiàn)圖2。
圖2 類(lèi)人機(jī)器人果實(shí)辨識(shí)試驗(yàn)
圖3顯示了類(lèi)人機(jī)器人識(shí)別的果實(shí)圖像樣本及HSV顏色直方圖。
該試驗(yàn)每類(lèi)果實(shí)收集樣本30個(gè),共150個(gè),其中隨機(jī)選取每類(lèi)中20個(gè)作為訓(xùn)練樣本,其余樣本作為測(cè)試樣本。該試驗(yàn)總共測(cè)試數(shù)據(jù)為50組,果實(shí)識(shí)別效果如表1所示。
表1 試驗(yàn)結(jié)果
該試驗(yàn)設(shè)計(jì)了一個(gè)具有視覺(jué)的能夠識(shí)別果實(shí)的類(lèi)人機(jī)器人系統(tǒng),通過(guò)采集圖像,獲取目標(biāo)信息,采用HSV顏色空間,結(jié)合高斯混合模型算法,通過(guò)訓(xùn)練得到每類(lèi)果實(shí)所對(duì)應(yīng)的分類(lèi)器模型參數(shù),構(gòu)造分類(lèi)器,實(shí)現(xiàn)了類(lèi)人機(jī)器人對(duì)果實(shí)準(zhǔn)確高效的識(shí)別。
圖3 果實(shí)樣本圖片及HSV顏色直方圖
[1]張勇.足球機(jī)器人識(shí)別算法和決策仿真[D].長(zhǎng)沙:湖南大學(xué),2002.
[2]陳鳳東,洪炳,朱瑩.基于HIS顏色空間的多機(jī)器人識(shí)別研究[J].哈爾濱工業(yè)大學(xué)學(xué)報(bào),2004,36(7):928-930.
[3]張全海,施鵬飛.基于HSV空間彩色圖像的邊緣提取方法[J].計(jì)算機(jī)仿真,2000,17(6):25-27.
[4]ZHARALIC R M,SHAPRO L G.Computer and robot vision[M].New-York:Addisiona-Wesely,1992:105-120.
[5]岳佳,王士同.高斯混合模型聚類(lèi)中EM算法及初始化的研究[J].微計(jì)算機(jī)信息,2006,11(3):244-246.
[6]王鑫.基于高斯混合模型的聚類(lèi)算法及其在圖像分割中的應(yīng)用[D].太原:中北大學(xué),2013.
[7]龐強(qiáng),鄒濤,叢秋梅,等.基于高斯混合模型與主元分析的多模型切換方法[J].化工學(xué)報(bào),2013(8):2938-3946.
[8]曹紅麗.混合高斯模型的混合EM算法研究及聚類(lèi)應(yīng)用[D].烏魯木齊:新疆大學(xué),2010.
[9]焦賓,呂霞付,陳勇,等.一種改進(jìn)的自適應(yīng)高斯混合模型實(shí)時(shí)運(yùn)動(dòng)目標(biāo)檢測(cè)算法[J].計(jì)算機(jī)應(yīng)用研究,2013(11):3518-3520.
[10]JAMSHIDIAN M,JENNRICH R I.Conjugate gradient acceleration of the EM algorithm[J].Journal of the American Statistical Association,1993,88:221-228.
[11]CAO J,WU Z,WU J J,et al.Towards information-theoretic K-means clustering for image indexing[J].Signal Processing,2013,93(7):2026-2037.