陳 都,王 雷,方天宇
(南京理工大學(xué) 電子工程與光電技術(shù)學(xué)院,南京 210094)
為解決盲人出行安全問題,我國(guó)在大部分城鎮(zhèn)均鋪設(shè)了盲道,但由于非法占用及盲道本身設(shè)計(jì)不合理等諸多因素,導(dǎo)致電子導(dǎo)盲設(shè)備識(shí)別率低、大部分盲道沒有實(shí)現(xiàn)對(duì)應(yīng)功能。本文利用現(xiàn)有盲道特征和盲道導(dǎo)航系統(tǒng),提出了一種基于顏色紋理和SVM的盲道分割算法。目前,盲道分割算法主要分為基于顏色、基于紋理兩類。以閾值分割和區(qū)域生長(zhǎng)等為代表的基于顏色的分割方法[1]效率高,能相對(duì)較好地實(shí)現(xiàn)盲道分割,但該方法對(duì)顏色及光照強(qiáng)度十分敏感,很多時(shí)候由于盲道與背景區(qū)域顏色相近而無法正確分割;基于紋理的分割方法[2]通過提取紋理特征再對(duì)其進(jìn)行聚類,基本不受顏色和光照影響,能夠相對(duì)較好地實(shí)現(xiàn)盲道分割,但由于針對(duì)不同類型盲道得到不同效果圖,所以普遍性不足,且由于采用聚類方法對(duì)紋理特征進(jìn)行分類,在一定程度上增加了處理時(shí)間。此外,現(xiàn)有盲道分割算法針對(duì)的盲道背景相對(duì)單一,雖然極大降低了盲道檢測(cè)難度,但與實(shí)際盲道背景相差較大,使算法無法很好地應(yīng)用于實(shí)際盲道分割。
近年來眾多學(xué)者對(duì)盲道分割算法進(jìn)行了深入研究。如文獻(xiàn)[3]利用基于顏色聚類的分割算法,在盲道與周圍環(huán)境顏色區(qū)別不大、或受光照和陰影等干擾時(shí),其盲道分割效果很差;文獻(xiàn)[4]、[5]利用的是基于紋理的分割算法,雖然基本不受光照和陰影影響,但是對(duì)不同類型的盲道很難得到理想的分割效果,普適性差。因此本文設(shè)計(jì)了一種基于顏色紋理和SVM的盲道分割算法(CT-SVM),其具有良好的普適性和抗噪性,盲道分割效果較好。
首先通過對(duì)多組盲道小塊和非盲道小塊樣本進(jìn)行分析,提取其中紋理特征,并通過分析其在顏色空間中樣本特征差異,再選取樣本在HSV色彩空間下的特征進(jìn)行分類訓(xùn)練。最終利用SVN訓(xùn)練模型對(duì)輸入圖像進(jìn)行特征判斷,將盲道從輸入圖像中提取出來。實(shí)驗(yàn)結(jié)果證明,本算法可以準(zhǔn)確提取出盲道,具有良好的普適性和抗噪性。
支持向量機(jī)(Support Vector Machine,SVM)是由Vapnik等[6]基于結(jié)構(gòu)風(fēng)險(xiǎn)最小化原理提出的一種有監(jiān)督的統(tǒng)計(jì)學(xué)習(xí)方法。該方法通過尋求結(jié)構(gòu)化最小風(fēng)險(xiǎn),提高學(xué)習(xí)機(jī)泛化能力,實(shí)現(xiàn)經(jīng)驗(yàn)風(fēng)險(xiǎn)和置信范圍最小化,從而達(dá)到在樣本量較少的情況下,亦能獲得良好的統(tǒng)計(jì)規(guī)律,其分類原理分為線性可分與線性不可分兩種情況。
假設(shè)有n個(gè)線性可分的訓(xùn)練樣本(x1,y1),(x2,y2),…,(xn,yn),yi∈{1,+1},均存在權(quán)向量ω和偏置b,如圖1所示,其滿足:
yi(ωT·xi+b)≥1,i=1,2,…,n
(1)
針對(duì)組別相同的訓(xùn)練樣本,能夠使用不同的超平面(Hyperplane)進(jìn)行劃分。利用SVM進(jìn)行分類,找到最佳權(quán)重值ω0以及最佳偏置值b0,ω0和b0能對(duì)兩類數(shù)據(jù)進(jìn)行最佳分割,且對(duì)測(cè)試樣本具備最優(yōu)泛化能力[7]。
實(shí)際生活與自然界中很多問題并不是線性的,如圖1(a)所示,故需要通過一種非線性變換(x→z=?(x))把輸入空間X內(nèi)的輸入向量x映射到另一個(gè)高維的特征空間F中,令其變成線性可分樣本[8],如圖2(b)所示。
圖1 SVM非線性分類原理圖
在F空間內(nèi),z=?(x)屬于線性可分的情況,故式(1)能夠應(yīng)用于此處,僅需要把x替換為z,即:
(2)
其中,K表示一個(gè)非負(fù)定對(duì)稱函數(shù),即核函數(shù)(Kernelfunction)[9]。K通常能夠取不同的函數(shù)形式,如多項(xiàng)式函數(shù)、高斯函數(shù)、徑向基函數(shù)等。經(jīng)過非線性變換后,二次規(guī)劃[10]則變成對(duì)L(α)求解極值,
(3)
與此同時(shí),分類決策函數(shù)變換為:
(4)
其中,
(5)
在使用SVM算法時(shí)參照如下步驟:
(1)初始化αi,λ。
(2)Fork= 1,…,itemax執(zhí)行步驟(3)到步驟(7)。
(3)Fori= 1,…,n執(zhí)行步驟(4)到步驟(5)。
(4)假設(shè)一個(gè)變量qi:
(6)
(6)對(duì)γ,λ進(jìn)行計(jì)算。
(7)
(8)
(7)若滿足k=itemax亦或是γ=γmax,則循環(huán)停止,否則跳轉(zhuǎn)到步驟(2),開始執(zhí)行下個(gè)k值。
(8)執(zhí)行后續(xù)計(jì)算。
根據(jù)以上SVM原理和分類算法[11],構(gòu)建一個(gè)通用二類分類器,并應(yīng)用于在復(fù)雜環(huán)境中的盲道分割。
若使用SVM分類器對(duì)盲道進(jìn)行分割,則需采集盲道區(qū)域的正樣本和非盲道區(qū)域的負(fù)樣本。實(shí)驗(yàn)拍攝了100幅現(xiàn)實(shí)生活中盲人在盲道上行走的場(chǎng)景圖像,包含了不同類型盲道。如圖2(a)所示,由于圖像上方的盲道特征極不明顯,且干擾項(xiàng)眾多,故綜合考慮后,對(duì)拍攝圖像進(jìn)行預(yù)處理,即將其上方30%舍去,如圖2(b)所示。隨后將50幅圖像作為訓(xùn)練樣本,另外50幅圖像作為測(cè)試樣本。從50幅訓(xùn)練圖像中隨機(jī)截取大小20*20的盲道小塊以及非盲道小塊各100張作為SVM分類器的正負(fù)樣本,其中部分樣本如圖4、圖5所示。在截取正樣本時(shí),盡量保證每種類型的盲道小塊數(shù)量均勻;在截取負(fù)樣本時(shí),使非盲道小塊的種類盡可能多樣化。
圖2 圖像示例
圖3 部分盲道小塊(正樣本)
圖4 部分非盲道小塊(負(fù)樣本)
在圖像處理中,經(jīng)常使用的顏色空間有RGB空間、Lab空間以及HSV空間。
分別計(jì)算盲道小塊和非盲道小塊顏色空間的平均值,對(duì)比發(fā)現(xiàn),在各個(gè)顏色空間中盲道小塊和非盲道小塊樣本差異較大的是HSV顏色空間[12],故顏色特征選取HSV顏色空間。HSV顏色空間由色調(diào)(Hue)、飽和度(Saturation)、亮度(Value)3個(gè)通道構(gòu)成。色調(diào)H代表不同類型的顏色;飽和度S代表顏色深淺;亮度V代表顏色明暗,如圖5所示。
圖5 HSV顏色空間對(duì)比
圖6 Gabor濾波器三維結(jié)構(gòu)
現(xiàn)階段紋理特征提取主要分為以下4種[4]:基于統(tǒng)計(jì)的方法、基于信號(hào)處理的方法、基于結(jié)構(gòu)的方法以及基于模型的方法。本文采用的Gabor變換[13-15]屬于基于信號(hào)處理的方法。
通常情況下,實(shí)Gabor濾波器[16-17]有兩種類型:正弦型Gabor濾波器以及余弦型Gabor濾波器,分別由正弦函數(shù)及余弦函數(shù)通過調(diào)制二維高斯函數(shù)獲得,其中正弦Gabor濾波器在空域中是奇對(duì)稱函數(shù),而余弦Gabor濾波器則為偶對(duì)稱函數(shù)。正弦Gabor濾波器與余弦Gabor濾波器的三維示意結(jié)構(gòu)[18]如圖6所示,由圖6可知,Gabor濾波器與簡(jiǎn)單細(xì)胞的響應(yīng)相似,此外Gabor濾波器的空間域及頻率域局部化性質(zhì)相對(duì)較好。
Gabor濾波器組的參數(shù)難以確定。Tan[19]利用譜峰檢測(cè)技術(shù)對(duì)Gabor濾波器組中心頻率進(jìn)行自動(dòng)確定。Li[20]利用免疫遺傳算法確定Gabor濾波器參數(shù)。Jain等[5]提出Gabor濾波器組中心頻率依次是:√2,2√2,4√2,…,(Nc/4)√2周期/圖像寬度,其中Nc表示圖像數(shù)組列寬。本文從生物視覺的角度確定Gabor濾波器參數(shù),更加貼近人的視覺感知系統(tǒng)。通過參考以上Gabor濾波器參數(shù)設(shè)計(jì)方法,選取Gabor濾波器組波長(zhǎng)為:2.82、5.65、11.31、22.62及45.25,方向角為0°、45°、90°、135°。在Gabor濾波之后進(jìn)行非線性處理,即將圖像經(jīng)過正弦Gabor及余弦Gabor濾波之后的結(jié)果均取平方,然后進(jìn)行相加,再對(duì)其進(jìn)行開方運(yùn)算得到Gabor能量。
分別計(jì)算盲道小塊與非盲道小塊樣本的Gabor能量平均值,并對(duì)其進(jìn)行對(duì)比。發(fā)現(xiàn)在Gabor濾波器組中,盲道小塊與非盲道小塊樣本差異較大的是波長(zhǎng)為2.82,方向角為0°、45°的Gabor濾波器、波長(zhǎng)為5.65,方向角為0°、45°的Gabor濾波器以及波長(zhǎng)為11.31,方向角為0°、45°的Gabor濾波器。故紋理特征選取波長(zhǎng)分別為2.82、5.65、11.31,方向角分別為0°、45°,即總共3個(gè)頻率和2個(gè)方向角的Gabor濾波器組,如圖7所示。
圖7 波長(zhǎng)為2.82的Gabor能量對(duì)比
利用SVM分類器訓(xùn)練樣本。首先,分別計(jì)算盲道小塊與非盲道小塊樣本特征向量x、y,其特征向量為第二節(jié)中選取的顏色特征和紋理特征的組合,分別是HSV顏色空間的3個(gè)特征與波長(zhǎng),分別為2.82、5.65、11.31,方向角分別為0°、45°的Gabor濾波器組的6個(gè)特征;然后,將盲道小塊樣本的特征向量x組成正樣本訓(xùn)練集X= [x1,x2,…,xN]T,將非盲道小塊樣本的特征向量y組成負(fù)樣本訓(xùn)練集Y= [y1,y2,…,yN]T,其中N表示樣本數(shù);最后,將正樣本集X與負(fù)樣本集Y輸入SVM分類器中進(jìn)行訓(xùn)練,得到SVM訓(xùn)練模型,其中SVM分類器采用的核函數(shù)為多項(xiàng)式函數(shù)。
計(jì)算測(cè)試圖像的特征向量,即HSV顏色空間的3個(gè)特征與波長(zhǎng)分別為2.82、5.65、11.31,方向角分別為0°、45°的Gabor濾波器組的6個(gè)特征,共9個(gè)特征;再將測(cè)試圖像每一個(gè)像素點(diǎn)的特征向量導(dǎo)入SVM訓(xùn)練模型,對(duì)該像素進(jìn)行分類;最后對(duì)分類后的圖像進(jìn)行二值化,輸出分割后的盲道圖像。
CT-SVM算法步驟如下:
Step1:采集100張盲道正樣本與非盲道負(fù)樣本。
Step2:計(jì)算盲道正樣本訓(xùn)練集X與非盲道負(fù)樣本訓(xùn)練集Y,將其輸入SVM分類器中訓(xùn)練,得到SVM訓(xùn)練模型。
Step3:計(jì)算測(cè)試圖像的特征向量,將每個(gè)像素點(diǎn)的特征向量輸入SVM訓(xùn)練模型中進(jìn)行分類。
Step4:將分類后的圖像進(jìn)行二值化,即得到分割后的盲道圖像。
對(duì)實(shí)際拍攝的盲道圖像進(jìn)行測(cè)試,將文獻(xiàn)[3]、[4]和[5]的測(cè)試結(jié)果圖進(jìn)行對(duì)比,其中文獻(xiàn)[3]利用基于顏色的分割算法,文獻(xiàn)[4]、[5]利用基于紋理的分割算法。本實(shí)驗(yàn)的硬件環(huán)境是:Inter Core i3-2310M CPU 2.10GHz,4G內(nèi)存,軟件環(huán)境是Windows 7 + VS2012。實(shí)驗(yàn)結(jié)果如圖8所示。
圖8 各算法的盲道分割結(jié)果
表1列出了各種方法對(duì)測(cè)試圖像進(jìn)行計(jì)算得到與之對(duì)應(yīng)的盲道分割圖消耗的平均運(yùn)算時(shí)間,其中CT-SVM消耗時(shí)間相對(duì)較少,能夠滿足導(dǎo)盲系統(tǒng)實(shí)時(shí)性需求。
表1 各算法盲道分割平均時(shí)間
本文提出了一種基于顏色紋理和SVM的盲道分割算法(CT-SVM)。通過對(duì)SVM理論的研究,在此基礎(chǔ)上,選取了盲道小塊和非盲道小塊的HSV色彩空間顏色特征,將Gabor紋理特征與SVM結(jié)合,對(duì)樣本進(jìn)行訓(xùn)練,隨后利用SVM訓(xùn)練模型對(duì)輸入圖像進(jìn)行特征判斷,最終將盲道從目標(biāo)區(qū)域中分割出來。從實(shí)驗(yàn)結(jié)果和分析可以看出CT-SVM克服了現(xiàn)有盲道分割算法僅依賴于某一特性的不足,能較準(zhǔn)確、快速地將盲道分割出來,具有良好的普適性和抗噪性,可應(yīng)用在電子導(dǎo)盲設(shè)備上,提高盲道利用率。