劉 超,林壽英,王彩霞,李新亮,張曉青,謝奕濤
(1.福建農(nóng)林大學(xué),福建 福州350002; 2.閩江學(xué)院,福建 福州350108)
中華蜜蜂(Chinese bee),簡(jiǎn)稱中華蜂,屬于蜜蜂科藥用最廣的昆蟲(chóng)之一,其自身的價(jià)值以及采集到的蜂蜜均被用于醫(yī)療和養(yǎng)生領(lǐng)域數(shù)年之久。在醫(yī)藥界中華蜂的價(jià)值更是被放大化,不僅能治療常見(jiàn)的燒傷燙傷,而且對(duì)于心臟病的治療還能起到舉足輕重的作用。位于福建省福州市的中華蜂養(yǎng)殖產(chǎn)業(yè)也是緊跟時(shí)代要求,一步一步發(fā)展壯大。
國(guó)內(nèi)關(guān)于中華蜂的檢測(cè)還處在人為檢測(cè)階段,耗費(fèi)大量的人力和時(shí)間。國(guó)內(nèi)對(duì)于中華蜂的識(shí)別還處于依賴光電傳感器的檢測(cè)階段,由于傳感器自身的安裝不便捷、維護(hù)成本高,以及檢測(cè)結(jié)果準(zhǔn)確性不高等問(wèn)題,致使傳統(tǒng)中華蜂的識(shí)別方式?jīng)]辦法得到推廣應(yīng)用。中華蜂的圖像分類對(duì)于中華蜂養(yǎng)殖產(chǎn)業(yè)來(lái)說(shuō)始終處于不可或缺的地位,對(duì)于近些年全球智能化的發(fā)展趨勢(shì),國(guó)內(nèi)許多養(yǎng)殖產(chǎn)業(yè)紛紛處于被動(dòng)狀態(tài)。在這些養(yǎng)殖產(chǎn)業(yè)中蜜蜂養(yǎng)殖產(chǎn)業(yè)卻在不斷地更迭技術(shù),發(fā)展壯大。本研究將圖像識(shí)別與中華蜂養(yǎng)殖相結(jié)合,通過(guò)圖像識(shí)別方式高效識(shí)別出中華蜂物種,為后期智能蜂箱養(yǎng)殖系統(tǒng)做足準(zhǔn)備工作。
本文提出基于Gabor特征提取的SVM中華蜂識(shí)別方法,該方法首先將人工采集到的圖片進(jìn)行統(tǒng)一灰度化、歸一化處理,并對(duì)處理后的圖片經(jīng)過(guò)Gabor濾波器進(jìn)行特征向量提取,將提取后的高維特征向量進(jìn)行PCA降維,隨后采用支持向量機(jī)進(jìn)行訓(xùn)練和建模,對(duì)比不同核函數(shù)SVM的建模時(shí)長(zhǎng)、識(shí)別準(zhǔn)確率及識(shí)別圖像的時(shí)長(zhǎng),選擇出最佳的核函數(shù)。
依據(jù)所采集到的中華蜂圖像,將圖片進(jìn)行預(yù)處理,降低外界因素對(duì)圖像造成的影響,對(duì)處理后的圖像進(jìn)行歸一化,使得圖像的大小保持一致,為后續(xù)Gabor濾波器提取特征值做鋪墊。經(jīng)過(guò)特征提取后的圖片再一次進(jìn)行以下采樣方式降維,最后將降維后的特征向量采用不同核函數(shù)的SVM機(jī)進(jìn)行分類和識(shí)別,試驗(yàn)流程如圖1所示。
圖1 試驗(yàn)流程Fig.1 Experimental flowchart
中華蜂圖片均是由試驗(yàn)小組人員進(jìn)行采集,得到的圖片統(tǒng)一進(jìn)行灰度化及歸一化處理,使得數(shù)據(jù)庫(kù)中的所有圖片統(tǒng)一灰度減少外界環(huán)境對(duì)圖片的影響,并且圖片保持在32×32像素的大小,為后續(xù)的特征提取步驟做好鋪墊[1]。
2.1.1圖像灰度化
定義RGB空間的彩色圖片,每一個(gè)像素點(diǎn)均是由R、G、B的3個(gè)分量共同決定,每個(gè)分量在內(nèi)存所占的位數(shù)共同決定了圖像的顏色。對(duì)于將RGB圖像進(jìn)行灰度化處理,即對(duì)圖像RGB的3個(gè)分量進(jìn)行加權(quán)平均進(jìn)而得到最終的灰度值,本次研究采用OpenCV開(kāi)放庫(kù)中所采用的灰度權(quán)值,如式(1)所示[2-3]。
Gray=0.072 169B+0.715 160G+0.212 671R
(1)
2.1.2圖像歸一化
人工采集到的中華蜂圖片容易受到拍攝角度或拍攝距離的影響,造成收集到的圖片大小尺寸不一,對(duì)后續(xù)的特征提取造成了不必要的麻煩,故采用OpenCV庫(kù)函數(shù)將所采集的圖片進(jìn)行大小統(tǒng)一調(diào)整,得到32×32像素的圖片庫(kù)。
Gabor濾波器可以抽取空間局部頻率特征,是一種有效的紋理檢測(cè)工具。在圖像處理中,Gabor函數(shù)屬于邊緣提取的線性濾波器,濾波器自身的頻率和方向表現(xiàn)內(nèi)容與人類視覺(jué)系統(tǒng)相近[4-5]。不同參數(shù)構(gòu)成的二維Gabor濾波器具有明顯的空間顯著性,以及在方向和頻率的抉擇方面具有顯著的優(yōu)勢(shì),所以其在模擬視覺(jué)神經(jīng)方面可以獲得較好的效果。
二維Gabor濾波器的一般函數(shù)表達(dá)式:
(2)
式中kμ,v=kveiφμ
z=(x,y)——空間位置
v——Gabor濾波器尺度參數(shù)
μ——Gabor濾波器方向
kμ,v——平面波矢量
σ——高斯窗口尺度因子
exp(ikμ,v)——復(fù)數(shù)波,其中實(shí)數(shù)部分和虛數(shù)部分分別為cos(kμ,z)和sin(kμ,z)
(3)
式中kmax——最大頻率
f——頻域內(nèi)核函數(shù)的空間因子
φμ——Gabor濾波器的方向選擇
二維Gabor濾波器的函數(shù)一般具有自相似的特性,故又稱為Gabor小波。在Gabor濾波器中參數(shù)的選擇起著舉足輕重的作用,為了更加充分地描述圖像特征,采取在5個(gè)尺度和8個(gè)方向上組成濾波器組,即v={0,1,2,3,4},μ={0,1,2,3,4,5,6,7}。因?yàn)閳D像的紋理分布是隨機(jī)的,φμ的取值范圍是0~2π,由于Gabor濾波器自身的對(duì)稱性,φμ的取值范圍可以等價(jià)于是0~π。
中華蜂圖像經(jīng)過(guò)Gabor濾波器提取后的特征向量具有較高的維數(shù),由于圖像歸一化后像素為32×32,經(jīng)過(guò)根據(jù)本研究所選取的尺度和方向參數(shù)得到圖像的Gabor特征位數(shù)是灰度圖像維數(shù)的40倍,即提取后的維數(shù)為40 960(32×32×40),致使檢索速度變慢,所以要對(duì)其產(chǎn)生的特征向量進(jìn)行線性降維操作,即主成分分析法(PCA)。
主成分分析法是通過(guò)某種線性投影,將高維數(shù)據(jù)映射到低維的空間中,并期望在所投影的維度上數(shù)據(jù)所保留的信息量最大,不失真程度最低,等價(jià)于方差最大[6]。以此降低數(shù)據(jù)高維不易處理的難度,且更大程度地保留了數(shù)據(jù)信息的完整性。
假設(shè)有數(shù)據(jù)中含有M個(gè)樣本{X1,X2,…,XM},每個(gè)樣本均是含有N維特征,即Xi=(x1,x2,…,xN)T,且每一個(gè)特征xj均含有自身的特征值。第一步對(duì)所有特征進(jìn)行中心化,去除自身的均值,即
(4)
第2步對(duì)去均值后的特征值進(jìn)行協(xié)方差矩陣C的求解,即
(5)
式(5)中cov(xi,xi+1)表示為
(6)
第3步求解協(xié)方差矩陣C的特征值和相應(yīng)的特征向量,求解協(xié)方差矩陣C的特征值λ和μ特征向量,即
Cu=λu
(7)
數(shù)據(jù)集中的特征值λ有N個(gè),每一個(gè)λi對(duì)應(yīng)一個(gè)特征向量ui,將求得的特征值按照從大到小的順序排列,并選擇前k個(gè)特征值,將提取到的k個(gè)特征值組合成一組新的矩陣,即{(λ1,u1),(λ2,u2),…,(λk,uk)}[7]。
最后將原始的數(shù)據(jù)矩陣集合投影到選取的特征向量上,即可得到降維后的k維特征向量,即
(8)
支持向量機(jī)(SVM),又稱為支持向量網(wǎng)絡(luò),具有相關(guān)學(xué)習(xí)算法的監(jiān)督學(xué)習(xí)模型,該算法對(duì)數(shù)據(jù)進(jìn)行評(píng)估和識(shí)別,并應(yīng)用于分類和回歸分析,對(duì)于未經(jīng)訓(xùn)練的樣本具有較高的預(yù)測(cè)準(zhǔn)確率。SVM的實(shí)現(xiàn)原理:通過(guò)已選擇的核函數(shù)將輸入向量映射到一個(gè)高維數(shù)特征空間中,在這個(gè)高維特征空間中構(gòu)造一個(gè)最優(yōu)分類的超平面[8]。
由于決策邊界直接取決于訓(xùn)練數(shù)據(jù)自身,因此決策邊界的分離余量在訓(xùn)練SVM模型中稱為特征空間的高維空間中最大化。該學(xué)習(xí)策略基于統(tǒng)計(jì)學(xué)習(xí)理論,該理論將訓(xùn)練數(shù)據(jù)和未知數(shù)據(jù)分類中的錯(cuò)誤最小化。
支持向量機(jī)可以看作為內(nèi)核機(jī),內(nèi)核常常被稱為相似性函數(shù),用于提供給機(jī)器學(xué)習(xí)算法功能[9-10]。
SVM常見(jiàn)的內(nèi)核如下。
(1)徑向基函數(shù)。在機(jī)器學(xué)習(xí)中,徑向基函數(shù)核(RBF)是一種局部性強(qiáng)的核函數(shù),其可以將樣本映射到更高維的空間中,應(yīng)用范圍廣,無(wú)論樣本大還是小都能表現(xiàn)出較強(qiáng)的性能[6]。
對(duì)于兩個(gè)樣本X和Y,RBF核函數(shù)表示為某些輸入空間中的特征向量,定義為
(9)
(2)多項(xiàng)式函數(shù)。多項(xiàng)式內(nèi)核用于識(shí)別輸入樣本的標(biāo)注特征以此確定之間的相似性和他們的組合關(guān)系。在回歸分析的框架中,該類型組合成為交互功能。多項(xiàng)式內(nèi)核的隱式特征空間與多項(xiàng)式回歸的隱式特征空間相似,但是二者之間的模型學(xué)習(xí)參數(shù)沒(méi)有關(guān)聯(lián)。多項(xiàng)式核函數(shù)可以實(shí)現(xiàn)將低維的輸入空間映射到高維的特征空間,但是多項(xiàng)式核函數(shù)的參數(shù)多,當(dāng)多項(xiàng)式的階數(shù)比較高的時(shí)候,核矩陣的元素值將趨于無(wú)窮大或者無(wú)窮小,計(jì)算復(fù)雜度會(huì)大到無(wú)法計(jì)算。對(duì)于q≥1時(shí),多項(xiàng)式內(nèi)核函數(shù)定義為
(10)
(3)線性核。線性核主要用于線性可分的情況下,特征空間與輸入空間的維度是相同的,且其自身參數(shù)少,運(yùn)算速度快,對(duì)于線性可分性數(shù)據(jù),其分類效果明顯[7]。其核函數(shù)定義為
K(x,y)=xTy+c
(11)
(4)二次內(nèi)核。二次內(nèi)核的計(jì)算強(qiáng)度較RBF較低,當(dāng)RBF的準(zhǔn)備過(guò)程變得繁雜時(shí),二次內(nèi)核是一個(gè)適宜的替代方案。其定義為
(12)
(5)Sigmoid核。Sigmoid核函數(shù)被采取時(shí),支持向量機(jī)實(shí)現(xiàn)了一個(gè)包含隱藏層的多層感知機(jī)網(wǎng)絡(luò)模型,其中的權(quán)值和隱藏層節(jié)點(diǎn)數(shù)均是由SVM算法內(nèi)部自動(dòng)擬合而形成的,其定義為
K(x,y)=tanh[v(x·y)]+c
(13)
本研究的訓(xùn)練平臺(tái)為一臺(tái)臺(tái)式機(jī),硬件部分為Intel core i9-10850K(3.6GHz)十核CPU,以及GeForce GTX 1080ti 11GB GPU(3584 CUDA)和32 GB的內(nèi)存,在Windows 10 64位系統(tǒng)上運(yùn)行,軟件部分采用Python3。
人工采集到的中華蜂圖片共有3類(蜂王、雄蜂、工蜂),共6 930張圖片,將得到的圖片灰度化并歸一化處理后,得到32×32像數(shù)大小的圖片,之后經(jīng)過(guò)Gabor濾波器提取特征向量并進(jìn)行采樣,得到的特征向量進(jìn)行PCA降維。降維后的特征向量經(jīng)過(guò)不同核函數(shù)的SVM進(jìn)行訓(xùn)練、建模并預(yù)測(cè)分析。
人工采集到的蜜蜂樣本如圖2所示。
圖2 人工采集的蜜蜂樣本圖像Fig.2 Bee sample images collected manually
將采集到的圖片進(jìn)行灰度化、歸一化并由Gabor濾波器進(jìn)行特征提取后,得到如圖3所示的圖片,將蜜蜂與蜂巢二者的紋理特征進(jìn)行有效的提取,更加突出了圖片的特征。
圖3 經(jīng)過(guò)預(yù)處理及Gabor處理后的圖像Fig.3 Sample image obtained after preprocessing and Gabor processing
進(jìn)一步將取得的圖像矩陣進(jìn)行PCA降維后并交由不同核函數(shù)的SVM進(jìn)行訓(xùn)練。訓(xùn)練結(jié)果如表1所示。
表1 訓(xùn)練結(jié)果
從結(jié)果中可以看出,在建模時(shí)間上徑向基核函數(shù)和Sigmoid核函數(shù)花費(fèi)的時(shí)間很長(zhǎng),但是在預(yù)測(cè)準(zhǔn)確率方面優(yōu)勢(shì)十分明顯,而多項(xiàng)式、線性及二次核函數(shù)在訓(xùn)練建模耗費(fèi)時(shí)長(zhǎng)上占據(jù)優(yōu)勢(shì),卻在預(yù)測(cè)準(zhǔn)確率上相較其余二者較低。綜合對(duì)比5種核函數(shù),Sigmoid核函數(shù)在對(duì)于經(jīng)過(guò)預(yù)處理及Gabor提取特征后得到中華蜂圖像的SVM識(shí)別預(yù)測(cè)中占據(jù)優(yōu)勢(shì)。
對(duì)采集到的中華蜂圖像進(jìn)行預(yù)處理及特征提取并降維后,經(jīng)過(guò)分析不同核函數(shù)的SVM所得出的建模時(shí)間,預(yù)測(cè)準(zhǔn)確率以及識(shí)別時(shí)長(zhǎng),可以得出在常見(jiàn)的SVM核函數(shù)中Sigmoid核函數(shù)對(duì)于中華蜂的識(shí)別分類效果最好,為隨后的中華蜂圖像識(shí)別研究奠定基礎(chǔ)。
在蜂箱養(yǎng)殖蜜蜂過(guò)程中抑制有害物種的入侵對(duì)蜂農(nóng)增加的工作負(fù)荷很大,同時(shí)在抑制過(guò)程中蜂農(nóng)開(kāi)箱檢測(cè)的工作量也十分龐大。本研究將圖像識(shí)別應(yīng)用于蜂箱養(yǎng)殖,有效識(shí)別出中華蜂,為后期識(shí)別危害中華蜂的物種,即蟑螂和馬蜂,提供前期的準(zhǔn)備工作,為智能蜂箱的建立提供了堅(jiān)實(shí)的算法基礎(chǔ)。