摘 要:隨著圖像識(shí)別技術(shù)的發(fā)展,人車分類已經(jīng)成為一個(gè)重要的研究課題。它能夠有效地提高對(duì)敏感區(qū)域的監(jiān)控效率,同時(shí)良好地進(jìn)行人車分類,能夠有效幫助后期的行為理解。本文將就一個(gè)人車分類系統(tǒng)中的人車分類技術(shù)進(jìn)行較為全面的闡述,提出了串聯(lián)分類器,根據(jù)運(yùn)動(dòng)檢測(cè)出來(lái)的二值圖中的區(qū)域、離散度、面積比以及類似于HOG的梯度計(jì)算方法等信息來(lái)建立特征,使用神經(jīng)網(wǎng)絡(luò)分類器進(jìn)行分類,當(dāng)分類結(jié)果自信度低于一定門限時(shí),根據(jù)運(yùn)動(dòng)檢測(cè)出來(lái)的二值圖的位置信息以及圖像信息,使用HOG進(jìn)行建立特征,并利用SVM分類器進(jìn)行人車分類。
關(guān)鍵詞:人車分類;SVM;神經(jīng)網(wǎng)絡(luò)
中圖分類號(hào):TP391
1 論文的意義及背景
智能視頻監(jiān)控包括很多方面的研究,人車分類作為基于運(yùn)動(dòng)視頻分析其中的一個(gè)重要課題已經(jīng)得到了廣泛的關(guān)注該,在智能安全領(lǐng)域、智能交通領(lǐng)域、虛擬現(xiàn)實(shí)以及運(yùn)動(dòng)分析等許多方面有著廣泛的應(yīng)用前景。隨著計(jì)算機(jī)視覺(jué)技術(shù)、數(shù)字圖像處理技術(shù)以及模式識(shí)別技術(shù)的日益發(fā)展,人車分類技術(shù)將受到越來(lái)越多的關(guān)注,得到更為有影響力的發(fā)展,其應(yīng)用范圍將更加廣泛。
2 人車分類技術(shù)的選擇以及整體框架
本章針對(duì)人車分類方法進(jìn)行整體方面的簡(jiǎn)單闡述,說(shuō)明了整個(gè)模塊的采用此方法的原因以及它的運(yùn)行流程、所使用到的特征以及分類器在其中如何工作。
2.1 特征選擇與分類器選擇
本人車分類模塊整個(gè)框架采用HOG特征和基于二值圖兩種特征,使用SVM和神經(jīng)網(wǎng)絡(luò)分類器。為了達(dá)到實(shí)時(shí)性要求,神經(jīng)網(wǎng)絡(luò)分類的分類速度要快于SVM分類器的分類速度。因此,當(dāng)神經(jīng)網(wǎng)絡(luò)分類器去處理二值圖的特征進(jìn)行分類的情況下,基本可以做到對(duì)運(yùn)動(dòng)目標(biāo)的實(shí)時(shí)分類。由于對(duì)行人檢測(cè)更加敏感,在神經(jīng)網(wǎng)絡(luò)分類后,串聯(lián)上SVM+HOG的分類方法,以便保證模塊的可靠性。
2.2 人車分類框架
整個(gè)模塊基于運(yùn)動(dòng)檢測(cè)的結(jié)果,采用串聯(lián)分類方法的方式,對(duì)運(yùn)動(dòng)目標(biāo)實(shí)現(xiàn)人車分類。整個(gè)模塊依賴于運(yùn)動(dòng)檢測(cè)的結(jié)果來(lái)進(jìn)行運(yùn)算,兩種不同的分類方法以串聯(lián)形式結(jié)合在一起,將可靠性相對(duì)較高但實(shí)時(shí)性較差的分類方法放在后面,相當(dāng)于在認(rèn)為前期分類不準(zhǔn)確時(shí),對(duì)結(jié)果進(jìn)行一次驗(yàn)證,并由可靠性更高的分類方法做出最終決定。
3 特征提取
特征提取的目的是[2]:根據(jù)最終的分類目標(biāo),從圖像中將能夠穩(wěn)定反映分類目標(biāo)區(qū)別的信息提取出來(lái),以便使用這些信息中的統(tǒng)計(jì)規(guī)律來(lái)完成對(duì)未知目標(biāo)類別的判斷。
3.1 基于二值圖的特征提取
通過(guò)運(yùn)動(dòng)檢測(cè)后得到了二值圖,它主要提供了形狀信息。目前,圖像算法中基于形狀描述主要分為兩大類:基于邊界的描述和基于區(qū)域的描述。
基于邊界的描述主要是通過(guò)區(qū)域周長(zhǎng)、傅里葉描述子、鏈表、邊緣凸凹性四個(gè)方面。目前,針對(duì)二值圖特征提取部分全部使用的是基于區(qū)域的描述信息,主要使用比例特征、類HOG特征、Hu不變矩特征、水平、垂直重心特征四個(gè)方面的特征信息。
3.2 基于灰度圖的特征提取
因?yàn)楸灸K是基于運(yùn)動(dòng)檢測(cè)的基礎(chǔ)上進(jìn)行人車分類,所以可以利用現(xiàn)有的關(guān)于行人檢測(cè)的方法[4]。當(dāng)前關(guān)于行人檢測(cè)比較流行的是小波算法、SITF、HOG算法等,本模塊采用的是著名的HOG算法。
HOG(Histograms of Oriented Gradients)就是梯度方向直方圖[2],最早是在2005年Dalal等提出。該算法用于檢測(cè)行人相對(duì)比較準(zhǔn)確,但是,當(dāng)該算法對(duì)圖像計(jì)算比較詳細(xì)時(shí),由于為了使特征具有一定不變形而增加重疊計(jì)算率時(shí),特征維數(shù)將急劇增大,導(dǎo)致提取速度以及后期的訓(xùn)練時(shí)間的大大延長(zhǎng)。HOG計(jì)算的具體過(guò)程包括伽馬變換、計(jì)算各像素點(diǎn)梯度、Cell的意義、Block以及線性內(nèi)插與歸一化、生成特征向量。
4 降維算法
維數(shù)過(guò)高帶來(lái)的直接后果是分類器訓(xùn)練難度的加大,運(yùn)算復(fù)雜度的提高,分類速度的降低。因?yàn)樘卣鲾?shù)據(jù)中存在相關(guān)性和大量冗余,所以可以通過(guò)數(shù)學(xué)方法對(duì)獲得的特征維數(shù)進(jìn)行降維處理,降維后的數(shù)據(jù)大體上能夠保證對(duì)不同特征的區(qū)分性。
4.1 PCA算法
PCA(Principal component analysis)算法是由Turk等基于KL變換的基礎(chǔ)上提出的一種正交變換方法,通過(guò)計(jì)算最大化總體方差的方式來(lái)得到相對(duì)理想的數(shù)據(jù)低維表達(dá)。
4.2 LDA算法
LDA(Linear Discriminant analysis),即線性鑒別分析,是以區(qū)分模式數(shù)據(jù)為目標(biāo)的監(jiān)督降維技術(shù)。其思想是通過(guò)一組最佳鑒別矢量達(dá)到類內(nèi)離散矩陣的秩最小化而類間離散矩陣的秩最大化,以便區(qū)分不同類別。PCA能夠獲得最大化的總體樣本區(qū)分信息,但由于沒(méi)有針對(duì)類別信息,在變換后不同類別的數(shù)據(jù)可能會(huì)混疊在一起。而LDA卻能夠充分保持不同類別的區(qū)分度。
5 分類器
分類器是指通過(guò)分析輸入的不同類型數(shù)據(jù),找到能夠準(zhǔn)確區(qū)分不同類型的描述或模型,從而可以對(duì)未知的數(shù)據(jù)類型進(jìn)行分類劃分。分類器都有各自不同的分類學(xué)習(xí)算法,通過(guò)訓(xùn)練樣本來(lái)構(gòu)造分類模型。
5.1 神經(jīng)網(wǎng)絡(luò)分類器
基于人類對(duì)自身大腦的認(rèn)知,以實(shí)現(xiàn)某種功能為目的,通過(guò)人工手段建立類似于大腦神經(jīng)運(yùn)行機(jī)理的網(wǎng)絡(luò)就是人工神經(jīng)網(wǎng)絡(luò)[1]。其實(shí)質(zhì)是通過(guò)神經(jīng)元的反饋效應(yīng),在輸入與輸出之間建立了一種函數(shù)關(guān)系,從而達(dá)到區(qū)分不同輸入類型的效果。神經(jīng)網(wǎng)絡(luò)使用的是多層前饋網(wǎng)絡(luò),通過(guò)誤差反向傳播算法對(duì)該模型的權(quán)值參數(shù)進(jìn)行修正。通過(guò)不斷的傳入,不斷的修正達(dá)到最終的理想模型。
5.2 SVM分類器
九十年代中期,支持向量機(jī)依托其核心理論[4]:學(xué)習(xí)一致性條件、VC維、推廣性的界理論以及結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則的基礎(chǔ)上發(fā)展起來(lái)的一種新的機(jī)器學(xué)習(xí)方法。它能夠使用有限的樣本達(dá)到較好的學(xué)習(xí)效果,已經(jīng)在模式識(shí)別等領(lǐng)域表現(xiàn)出卓越的性能。
低維空間向高維空間的映射主要依賴于核函數(shù)[3],因此,核函數(shù)的選擇及其參數(shù)的調(diào)節(jié)直接影響到SVM的類型、復(fù)雜度以及性能。在實(shí)際應(yīng)用中,一般直接使用已有的常用核函數(shù),有線性、多項(xiàng)式、Gauss徑向基和Sigmoid核函數(shù)。
其中,使用線性核函數(shù)進(jìn)行訓(xùn)練時(shí)速度最快,但是效果不一定理想。徑向基核函數(shù)具有良好的局部調(diào)節(jié)性,在參數(shù)選擇恰當(dāng)時(shí)其性能不低于線性核函數(shù),同時(shí)其應(yīng)用也最廣,因此,本模塊使用該核函數(shù)。
6 總結(jié)與展望
本文闡述了人車分類模塊的工作流程,接著說(shuō)明了人車分類中所用到的特征提取方法,然后針對(duì)提取到的特征維數(shù)問(wèn)題,介紹了模塊中使用到得降維算法PCA和LDA;最后介紹了兩種分類器神經(jīng)網(wǎng)絡(luò)和SVM。
下一步需要改進(jìn)的地方:(1)分類器選擇與在線學(xué)習(xí)。分類器自身有很多參數(shù),什么樣的參數(shù)才合適于人車分類,需要進(jìn)一步測(cè)試。同時(shí),其他類型的分類器以及混合使用分類器的具體效果也需要進(jìn)行測(cè)試;(2)特征選擇。目前使用的特征大多是區(qū)域特征以及梯度特征,其他還有例如紋理等很多類型的特征可以考慮加入。人車分類的關(guān)鍵在于邊緣信息與結(jié)構(gòu)信息的結(jié)合,但如何實(shí)現(xiàn)這一目標(biāo)需要將來(lái)進(jìn)一步研究。
參考文獻(xiàn):
[1]朱齊丹,張智,邢卓異.支持向量機(jī)改進(jìn)序列最小優(yōu)化學(xué)習(xí)算法[J].哈爾濱工程大學(xué)學(xué)報(bào),2007(02):183-188.
[2]劉麗麗.基于形狀特征的運(yùn)動(dòng)目標(biāo)分類方法研究[D].湖南:湖南大學(xué),2006.
[3]趙丹.基于SVM分類機(jī)的DNA序列分類方法[D].江西:南昌大學(xué),2010.
[4]許言午.面向行人檢測(cè)的組合分類計(jì)算模型與應(yīng)用研究[D].安徽:中國(guó)科學(xué)技術(shù)大學(xué),2009.
作者簡(jiǎn)介:冷霞(1970.09-),女,日照人,本科;畢業(yè)院校山東農(nóng)業(yè)大學(xué),初級(jí)職稱,研究方向:計(jì)算機(jī)。
單位名稱:山東廣電網(wǎng)絡(luò)有限公司日照分公司,山東日照 276800