吳開(kāi)興,范亭亭,李麗宏,張 琳
(1.河北工程大學(xué) 信息與電氣工程學(xué)院,河北 邯鄲 056038;2.河北工程大學(xué) 煤礦綜合信息化河北省工程實(shí)驗(yàn)室,河北 邯鄲 056038)
現(xiàn)在國(guó)內(nèi)外關(guān)于回收塑料瓶分類研究主要是顏色和化學(xué)成分方面[1],而且數(shù)量較少,因此現(xiàn)在塑料瓶分類人工多于智能機(jī)械化。在智能處理回收塑料瓶的過(guò)程中,圖像處理技術(shù)是其核心[2],本文就針對(duì)回收塑料瓶顏色分類中的圖像處理部分的算法進(jìn)行研究。
顏色分類時(shí),首先要選定合適的顏色模型,在結(jié)合了已有的塑料瓶顏色分類算法[3-5]和其它研究方向顏色分類[6]的顏色模型,選用了適合用于計(jì)算機(jī)對(duì)物體的顏色做定量分析和檢測(cè)的HSI顏色模型。在處理圖像數(shù)據(jù)時(shí),因其維數(shù)度過(guò)高,需要進(jìn)行降維處理,因此使用快速主成分分析(fast principal component analysis,F(xiàn)PCA),相比較PCA能降低計(jì)算復(fù)雜度,使處理速度加快。借鑒于前人的工作經(jīng)驗(yàn),選用支持向量機(jī)(support vector machine,SVM)作為分類器。雖然SVM的分類方法已經(jīng)較為成熟,在圖像分類上也可以有效運(yùn)用[7,8],但其參數(shù)選取的不確定性,給分類造成了困難,因此采用粒子群算法(particle swarm optimization,PSO)來(lái)優(yōu)化支持向量機(jī)參數(shù)[9],因粒子群算法易陷入局部極值中,引入慣性權(quán)重和收斂因子,以獲得最優(yōu)參數(shù),提高分類結(jié)果的穩(wěn)定性,最終實(shí)現(xiàn)提高識(shí)別率的目的。因此,文中提出一種基于FPCA和PSOSVM的回收塑料瓶顏色分類算法,以達(dá)到進(jìn)一步提高分類識(shí)別率的目的。
文中處理的圖像均為彩色圖像,直接處理彩色圖像得到樣本矩陣,此時(shí)將樣本用于計(jì)算,因其維數(shù)較高,最終造成計(jì)算量大且復(fù)雜度高的結(jié)果。所以,為減少計(jì)算量同時(shí)降低計(jì)算的復(fù)雜度,本文用FPCA法進(jìn)行降維處理,獲取少量且有效的特征向量用于分類識(shí)別。
主成分分析(PCA)的最終目的是為了獲得樣本協(xié)方差矩陣的本征值和本征向量。設(shè)樣本X是n×d(n個(gè)d維樣本特征向量)的矩陣,則對(duì)應(yīng)的散布矩陣(協(xié)方差矩陣)S是d×d的方陣,因此所處理的樣本維數(shù)較大時(shí)會(huì)增加計(jì)算復(fù)雜度。而本文所用的FPCA法降維處理的過(guò)程如下。
(1)
在式(1)兩邊同時(shí)左乘ZT,則有
(2)
通過(guò)上述原理步驟得到協(xié)方差矩陣S,之后計(jì)算協(xié)方差矩陣的P個(gè)特征值λ1,λ2,…,λp,并按照大小進(jìn)行排序。
根據(jù)式(3)計(jì)算第i個(gè)主成分分量的貢獻(xiàn)率
(3)
通過(guò)貢獻(xiàn)率計(jì)算樣本的累計(jì)貢獻(xiàn)率,當(dāng)累計(jì)貢獻(xiàn)率達(dá)到85%以上,就可以使用前n個(gè)主成分作為輸入變量,以避免“維數(shù)災(zāi)難”引起的數(shù)據(jù)冗余。
支持向量機(jī)因其高泛化性被廣泛使用,文中也將采用徑向基核函數(shù)的SVM作為分類器,其性能依賴于懲罰因子C和核函數(shù)參數(shù)σ[10],選取合適的參數(shù),其訓(xùn)練速度和訓(xùn)練精度均可提高。以下面SVM原理進(jìn)行分類器模型構(gòu)建。
假設(shè)(xi,yi),i=1,…,N是一組訓(xùn)練樣本,其中xi∈Rd,d是輸入空間的維數(shù),yi∈{-1,1}。支持向量機(jī)的目的是將訓(xùn)練樣本按照類別完全分開(kāi),最終使相同的樣本處于所定義的超平面的同一側(cè)。其約束條件為
yi(w·xi+b)>0,i=1,…,N
(4)
(5)
約束條件為
yi(w·xi+b)≥1,i=1,…,N
(6)
利用Lagrange優(yōu)化方法可以將最優(yōu)分離超平面問(wèn)題轉(zhuǎn)化為其對(duì)偶問(wèn)題,即約束條件為
在此條件下求解下列函數(shù)的最大值
(7)
其中,α=(α1,…,αN)是Lagrange乘子,由上述方法得到的最優(yōu)分類函數(shù)為
f(x)=sgn{(w·x)+b}
(8)
當(dāng)數(shù)據(jù)線性不可分時(shí),支持向量機(jī)引入一個(gè)松弛項(xiàng)ξi≥0和懲罰因子C,此時(shí)的目標(biāo)函數(shù)變?yōu)?/p>
(9)
其約束條件為
yi[(w·xi)+b]-1+ξi≥0,i=1,…,N
(10)
令K(xi,xj)=φ(xi)·φ(xj)。
最終得到的分類函數(shù)為
(11)
K(x,y)為徑向基核函數(shù)。
根據(jù)式(4)~式(11)構(gòu)建本文所需的基本的徑向基核函數(shù)的SVM模型。在此基礎(chǔ)上進(jìn)行參數(shù)的優(yōu)化和分類識(shí)別。
文中為得到適合的懲罰因子C和核函數(shù)參數(shù)σ,采用粒子群算法進(jìn)行參數(shù)優(yōu)化。粒子群算法是一種采用“速度-位移”模式理論,并且時(shí)刻關(guān)注個(gè)體的蹤跡進(jìn)行迭代遞推的算法,而且其具有較快的收斂速度[11]。
設(shè)群體數(shù)目為M,其個(gè)體i在p維空間的位置表示為xi=(xi1,xi2,xi3,…,xip),其中i=1,2,3,…,M,速度表示為vi=(vi1,vi2,vi3,…,vip)。其中粒子的速度和位置會(huì)根據(jù)式(12)和式(13)不斷的更新
vip=vip+c1rand1()(pbestip-xip)+
c2rand2()(gbestp-xip)
(12)
xip=xip+vip
(13)
vip=ωvip+c1rand1()(pbestip-xip)+
c2rand2()(gbestp-xip)
(14)
(15)
經(jīng)由上述的計(jì)算過(guò)程,通過(guò)反復(fù)的迭代運(yùn)算,最終獲得最優(yōu)且適合的懲罰因子C和核函數(shù)參數(shù)σ。將結(jié)果用于SVM分類識(shí)別,以達(dá)到提高分類穩(wěn)定性和準(zhǔn)確率的目的。
對(duì)所使用的算法進(jìn)行分析后,將算法進(jìn)行結(jié)合對(duì)回收塑料瓶進(jìn)行分類處理,整體的處理流程如圖1所示的分類流程。
圖1 FPCA和PSOSVM分類流程
整個(gè)處理流程的步驟介紹如下:
步驟1 獲取回收塑料的圖像,將圖像轉(zhuǎn)換到HSI模型下,對(duì)圖像進(jìn)行去噪、分割等預(yù)處理,并獲得圖像的H和S分量。
步驟2 對(duì)圖像的H和S分量,使用FPCA進(jìn)行降維處理,獲得特征值,之后對(duì)數(shù)據(jù)進(jìn)行歸一化處理,將歸一化獲得的數(shù)據(jù)分為訓(xùn)練樣本和測(cè)試樣本。
步驟3 用訓(xùn)練樣本作為數(shù)據(jù)進(jìn)行PSO參數(shù)優(yōu)化,用優(yōu)化后的懲罰因子和徑向基核函數(shù)參數(shù)進(jìn)行SVM模型訓(xùn)練。
步驟4 對(duì)訓(xùn)練后的結(jié)果進(jìn)行計(jì)算適應(yīng)度是否達(dá)到最優(yōu),如果沒(méi)有,則重復(fù)進(jìn)行步驟3;如果達(dá)到最優(yōu),則進(jìn)行下一步。
步驟5 使用測(cè)試樣本,進(jìn)行分類識(shí)別的測(cè)試,獲得整體的識(shí)別率。
實(shí)驗(yàn)中對(duì)常見(jiàn)的藍(lán)色、綠色、白色(文中提到的均為無(wú)色透明)塑料瓶進(jìn)行了分類算法的研究。鑒于HSI顏色模型適合用于計(jì)算機(jī)對(duì)物體的顏色做定量分析和檢測(cè),而實(shí)驗(yàn)最終的目的是將塑料瓶按顏色進(jìn)行分類,因此在HSI顏色模型的基礎(chǔ)上對(duì)預(yù)處理后的圖像進(jìn)一步處理。
實(shí)驗(yàn)使用的是320*240的彩色圖像,維數(shù)較高,因此在HSI模型下采用FPCA進(jìn)行降維處理,得到其前6個(gè)主成分分量,如圖2所示其累計(jì)貢獻(xiàn)率可以達(dá)到85%以上,完全可以作為特征值使用。由圖3可以顯示出3個(gè)顏色的塑料瓶其特征量有較明顯的區(qū)別,因此聯(lián)合H和S分量獲得有效特征值進(jìn)行分類識(shí)別。
圖2 主成分累計(jì)貢獻(xiàn)率
圖3 HSI模型與快速PCA提取特征
實(shí)驗(yàn)數(shù)據(jù)為3種顏色,每種30個(gè)樣本,對(duì)其進(jìn)行上述的處理獲得特征值后,數(shù)據(jù)分為訓(xùn)練集和測(cè)試集,使用SVM分類器進(jìn)行分類識(shí)別。文中使用PSO對(duì)SVM的懲罰因子C和核函數(shù)參數(shù)σ進(jìn)行參數(shù)尋優(yōu),圖4可以看出初始時(shí)識(shí)別率并不是最優(yōu),隨著迭代次數(shù)的增加,識(shí)別率有所提高,當(dāng)?shù)螖?shù)達(dá)到55左右時(shí),整體的識(shí)別率達(dá)到93.4%,并且在之后隨著迭代次數(shù)的增加趨于穩(wěn)定。
圖4 迭代次數(shù)與識(shí)別率關(guān)系
實(shí)驗(yàn)使用測(cè)試集對(duì)文中所提算法進(jìn)行測(cè)試,最終用PSO進(jìn)行參數(shù)尋優(yōu)和未進(jìn)行參數(shù)尋優(yōu)的實(shí)驗(yàn)結(jié)果見(jiàn)表1,結(jié)果顯示文中所用算法整體的識(shí)別率有較顯著提高。
表1 實(shí)驗(yàn)對(duì)比結(jié)果
文中提出了FPCA和PSOSVM算法用于回收塑料瓶顏色分類識(shí)別研究,其分類的識(shí)別率相對(duì)于未使用PSO進(jìn)行參數(shù)尋優(yōu)提高了5.8%左右,可以達(dá)到93.4%,比以前的研究也有所提高,因此,達(dá)到了提高分類識(shí)別率的目的,對(duì)于回收塑料瓶的分類研究具有一定的推動(dòng)作用??焖僦鞒煞址治龇ㄓ行У慕档土藰颖镜木S數(shù),減少了輸入量,去除了原始數(shù)據(jù)的相關(guān)性,為分類識(shí)別提供了有效的特征值,降低了計(jì)算的復(fù)雜度。采用PSO優(yōu)化SVM的參數(shù),降低了參數(shù)選擇的隨機(jī)性,使實(shí)驗(yàn)結(jié)果更為穩(wěn)定,下一步的實(shí)驗(yàn)可以用數(shù)據(jù)進(jìn)一步驗(yàn)證此結(jié)果,以期進(jìn)一步優(yōu)化參數(shù),提高分類識(shí)別率。