摘要:通過介紹基于機(jī)器學(xué)習(xí)的分類器的訓(xùn)練過程。首先對(duì)模式識(shí)別的相關(guān)知識(shí)進(jìn)行介紹,并對(duì)分類器的訓(xùn)練進(jìn)行具體的說明;然后給出了機(jī)器學(xué)習(xí)中最常用的支持向量機(jī)(SVM)方法和梯度方向直方圖特征描述的相關(guān)知識(shí),重點(diǎn)講述了其原理和計(jì)算過程,建立了工程車輛樣本庫,采用梯度方向直方圖作為樣本特征,使用線性支持向量機(jī)的方法訓(xùn)練分類器,最后通過實(shí)驗(yàn)證明了算法的正確性和可行性。
關(guān)鍵詞:梯度方向 支持向量 工程車輛 HOG特征
中圖分類號(hào):TP391.1 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1007-9416(2016)06-0000-00
1 引言
一個(gè)完整的模式識(shí)別系統(tǒng)應(yīng)該包括從信息數(shù)據(jù)的采集、處理、分析到?jīng)Q策的整個(gè)過程[1]。而要使機(jī)器具有人的智能,相應(yīng)的必須具備人體所擁有的一些最基本的功能,比如視覺、觸覺;而且應(yīng)該具備大腦一樣的分析決策能力。就算一個(gè)簡(jiǎn)單的人的動(dòng)作讓機(jī)器來模仿也是相當(dāng)困難的。如圖1給出了一個(gè)完整的模式識(shí)別系統(tǒng)流程圖[2-3]。
從圖1中可以看出完整的模式識(shí)別所經(jīng)過的不同的模塊。傳感器相當(dāng)于人的感官,主要負(fù)責(zé)數(shù)據(jù)信息的采集;特征提取器所提取的特征具有以下性質(zhì):同一類別的不同樣本特征值非常接近、不同類別的樣本的特征值有很大差異、這些特征值對(duì)與類別不相關(guān)的變換具有不變性;而且特征提取相比分類器更加依賴問題所在的具體領(lǐng)域,所有相應(yīng)領(lǐng)域的知識(shí)能夠幫助尋找出更有效的特征 [4-5]。分類器是模式識(shí)別系統(tǒng)的核心模塊,相當(dāng)于這個(gè)系統(tǒng)的大腦,其作用是根據(jù)特征提取器得到的特征值來對(duì)一個(gè)被測(cè)樣本進(jìn)行分類標(biāo)記;同樣理想的分類器是不可能得到的,作為解決方案,往往采用確定一個(gè)可能類別的概率,根據(jù)概率分析結(jié)果;后處理是根據(jù)分類器給出的結(jié)果做出相應(yīng)的動(dòng)作,是模式識(shí)別系統(tǒng)的輸出,也是模式識(shí)別最終的目的。
圖2給出了分類器訓(xùn)練的流程圖,所采用的是有監(jiān)督學(xué)習(xí)的方法。數(shù)據(jù)采集是對(duì)于訓(xùn)練樣本而言的,是有監(jiān)督學(xué)習(xí)的方法。特征的選擇需要根據(jù)特定領(lǐng)域的具體問題而定,選取具有明顯區(qū)分意義的和不易被噪聲干擾的特征。訓(xùn)練分類器,利用樣本的特征數(shù)據(jù)確定分類器的過程;分類器的訓(xùn)練是一個(gè)比較復(fù)雜的問題,起碼到目前為止沒有一個(gè)通用的方法可以完美的解決所遇到的所有問題,但采用基于樣本的分類器訓(xùn)練方法已得到人們的共識(shí)。
1 選擇訓(xùn)練樣本
訓(xùn)練樣本作為訓(xùn)練系統(tǒng)的輸入內(nèi)容,承載了所要識(shí)別對(duì)象的主要特征信息。機(jī)器學(xué)習(xí)就是去模仿人類的大腦的能力,通過對(duì)樣本知識(shí)的學(xué)習(xí)去辨別新的問題;然而現(xiàn)有的技術(shù)遠(yuǎn)遠(yuǎn)達(dá)不到人類的水平,學(xué)習(xí)的能力很難達(dá)到需要區(qū)分的高度。這樣選取的樣本對(duì)分類器的訓(xùn)練結(jié)果起到了決定性的作用。為彌補(bǔ)技術(shù)上的不足,通常采取選取與實(shí)際環(huán)境比較相近的樣本、加大樣本的數(shù)量等方法提高分類器的準(zhǔn)確率。用于訓(xùn)練車輛分類器的樣本必然使用包含所要識(shí)別車輛的圖片作為正圖像,而且圖像的尺寸不宜太大;所有樣本變換為同樣大小的尺寸。
2 訓(xùn)練分類器
分類器的訓(xùn)練是一個(gè)機(jī)器學(xué)習(xí)的過程,根據(jù)模式識(shí)別的知識(shí)可以了解具體的步驟:第一步是選取一定數(shù)量的樣本;第二步是提取樣本的特征信息,本算法采用的特征是梯度方向直方圖,用于對(duì)圖像進(jìn)行描述,提取樣本的信息就是計(jì)算樣本的梯度方向直方圖特性,得到的是一個(gè)多維的特征向量;第三步就是對(duì)特征信息進(jìn)行學(xué)習(xí)最后得到一個(gè)能用于檢測(cè)識(shí)別的分類器,為檢測(cè)的時(shí)候方便,在得到分類器之后將其轉(zhuǎn)換成能可以直接用于對(duì)圖像進(jìn)行檢測(cè)的檢測(cè)算子。如圖3所示是樣本分類器訓(xùn)練系統(tǒng)的流程圖。
計(jì)算出所有樣本的HOG特征,得到一組2916維度的特征向量;這一組向量作為線性SVM的輸入,其中正樣本的向量標(biāo)識(shí)為1,負(fù)樣本的向量標(biāo)識(shí)為0。訓(xùn)練的原理在SVM原理中有所介紹;其過程是根據(jù)確定的分類間隔和給出的樣本點(diǎn),不斷的對(duì)分類函數(shù)進(jìn)行修正,最后求解出分類函數(shù)的系數(shù)向量 ;由此得到分類器。分類器作為訓(xùn)練結(jié)果,包含的信息可能比較多,而不適合直接用于圖像中目標(biāo)的檢測(cè);為檢測(cè)方便,將分類器轉(zhuǎn)換為檢測(cè)算子的形式,可以用于任何尺寸圖像的目標(biāo)檢測(cè)。
3 工程車輛的特征提取
算法選用梯度方向直方圖(HOG)作為樣本的特征信息。本文將樣本圖像劃分成均勻的小塊,每個(gè)小塊包含8×8的像素,求取每個(gè)像素點(diǎn)的邊緣(梯度信息);并以每個(gè)小塊為單位將邊緣映射到9個(gè)不同的方向塊中。每個(gè)方向塊的范圍為20度;8×8像素梯度方向投影到9個(gè)方向塊內(nèi),形成9維的特征向量作為細(xì)胞的值。投影是采用加權(quán)投票的方式,這個(gè)權(quán)值是根據(jù)該像素點(diǎn)的梯度幅度計(jì)算出來的。大塊(Block)表示相鄰的2×2cell。一個(gè)大塊(Block)中包含36(4×9)維的特征向量,其中相鄰大塊之間是相互重疊的,步長(zhǎng)按照cell的大小行進(jìn)。以80×80像素的圖像為例,根據(jù)步長(zhǎng)為8個(gè)像素,圖像包含9×9個(gè)大塊,轉(zhuǎn)化為HOG特征描述為一個(gè)2916(9×9×36)維的向量。
4 結(jié)語
本文主要介紹了基于機(jī)器學(xué)習(xí)的分類器的訓(xùn)練過程。首先對(duì)模式識(shí)別的相關(guān)知識(shí)進(jìn)行介紹,并對(duì)分類器的訓(xùn)練進(jìn)行具體的說明;然后給出了機(jī)器學(xué)習(xí)中最常用的支持向量機(jī)(SVM)方法和梯度方向直方圖特征描述的相關(guān)知識(shí),重點(diǎn)講述了其原理和計(jì)算過程;在此基礎(chǔ)上介紹了本文算法的分類器訓(xùn)練過程。
參考文獻(xiàn)
[1] 李宏東,姚天翔 譯.Richard O.Duda,Peter E.Hart,David G..Stork,模式分類(第二版)[M].北京:機(jī)械工業(yè)出版社,2003.
[2] 劉麗,匡綱要.圖像紋理特征提取方法綜述[J].中國(guó)圖像圖形學(xué)報(bào),2009(4):622-635.
[3] VAPNIK V. Statistical learning theory[M].New York:Wiley,1998,56-70.
[4] 曹翼.基于支持向量機(jī)理論的車輛監(jiān)控技術(shù)研究與應(yīng)用[D].上海:上海交通大學(xué),2010:30-32.
[5] 車志富.基于支持向量機(jī)的行人檢測(cè)[D].北京:北京交通大學(xué),2010:25-27.
收稿日期:2016-03-30
作者簡(jiǎn)介:崔鵬宇(1982—),男,遼寧丹東人,碩士,講師,研究方向:計(jì)算機(jī)應(yīng)用、網(wǎng)絡(luò)安全、計(jì)算機(jī)控制方面的教學(xué)與科研工作。