李瑞帥
摘 要:人體檢測是計算機視覺與模式識別中一個重要的分支,在多個領域有著廣闊的應用前景。引入一種雙支持向量機TWSVMs,通過兩個形如SVM的凸規(guī)則規(guī)劃問題來構建兩個非超平面,能將訓練時間縮減,它具有SVM的優(yōu)點,卻對大規(guī)模數(shù)據(jù)具有更好的處理能力。
1.研究意義
人體檢測是計算機視覺與模式識別中一個重要的分支,在智能監(jiān)控、基于內容的圖片和視頻檢索、視頻標識、輔助駕駛、輔助生活、數(shù)字娛樂、高級人機交互、運動分析等領域有著廣闊的應用前景。但是,因為人的姿態(tài)、衣著以及人所處的背景環(huán)境、光照強度等的千變萬化,再加上觀察者的視覺角度的不同,導致檢測的環(huán)境非常的復雜,這對人體檢測技術的研究者來說,是個不小的挑戰(zhàn)。目前,人體識別主要有基于多模板匹配、基于邊緣輪廓特征和基于運動特征等各種方法。然而,從實際效果來看, 目前最好的是 DALAL N 和TRIGGS B 提出的基于 HOG 特征的人體檢測方法。 DALAL N 等人通過使用 16×16 大小的塊在檢測窗口中滑動,然后按一定方式統(tǒng)計塊中的梯度向量直方圖,將各個塊的梯度向量直方圖串聯(lián),組成特征向量。滑動窗口檢測方法是使用一個滑動窗口,在圖像的不同尺度上,從圖像的左上角開始,逐列或者逐行地進行掃描,直到圖像右下角的像素。通過這種掃描方式,來收集像邊緣、片段、小波系數(shù)、顏色等特征,并把收集好的特征輸入訓練好的分類器進行分類判斷。檢測效果雖然理想,但耗時,難以達到實時性的要求。
2.國內外研究現(xiàn)狀
人體檢測與識別技術有著廣闊的應用前景,也面臨這一系列的挑戰(zhàn)。作為計算機視覺與模式識別領域的一個非常重要的課題,近年來吸引了大批研究者的目光,也取得了長足的進步。在行人檢測的領域內,國內外學者經過多年的研究,形成了幾種比較流行的框架結果。可以把這些框架簡單的劃分為兩類:第一類為基于視頻中的運動信息的目標檢測算法,例如背景減除,混合高斯模型(GMM),運動歷史圖像(MHI)等等。第二類為基于檢測目標的特征,設計訓練相應的分類器進行檢測,例如利用紋理特征Haar、局部二值化模式特征進行檢測,利用邊緣特征梯度方向直方圖(Histograme of Oriented Gradient,HOG,Edgelet等特征進行檢測等。第一類算法主要利用圖像幀差分的思想,構建運動前景圖像,從而達到目標檢測的目的。雖然該類算法比較單間,擁有很好的實時性,不過對于場景經常性變化、目標距離很近、目標間相互遮擋或者目標長時間沒有顯著運動的情況下,該算法的檢測精度會下降的很大。第二類算法主要針對目標的表象、輪廓等選擇響應的特征以及分類器進行訓練,通過滑窗技術,把訓練好的分類器應用于圖像幀中檢測用戶感興趣的目標。該類算法既可以應用的視頻序列中,也可以應用于單幀圖像,可以很好的解決目標距離很近或者目標長時間沒有顯著運動的情況下,目標無法檢測的問題。但是因為該類算法采用的是分類器以及滑窗技術,檢測無法達到實時的效果。
3.理論簡介
支持向量機(SVM )作為神經網(wǎng)絡的一個重要分支,與傳統(tǒng)的機器學習方法相比,它具有全局優(yōu)化、適應性強、理論完備、訓練時間短、推廠性能好等優(yōu)點,具有良好的潛在應用價值和發(fā)展前景。它可以在小樣本空間中獲得很好的推廣能力,是一種優(yōu)秀的學習方法。所以從理論上說將支持向量方法運用到圖像分割中具有一定的優(yōu)勢。但由于運用SVM對樣本分類時要解決二次規(guī)劃的問題非常費時,為了避免訓練時間過長的問題,引入一種孿生支持向量機TWSVMs(Twin Support Vector Machines),TWSVMs在形式上類似于傳統(tǒng)的支持向量機不僅具有傳統(tǒng)支持向量機的優(yōu)點,而且對大規(guī)模數(shù)據(jù)具有更好的處理能力。TWSVMs為兩個類各自得到一個分類平面屬于每個類的數(shù)據(jù)盡量圍繞在與之相對應的分類平面周圍,然后TWSVMs通過優(yōu)化一對分類平面來構建分類超平面。也就是說,TWSVMs需要解決一對QPP問題,而SVM則是解決一個QPP問題,從計算復雜度上來說其計算速度是傳統(tǒng)支持向量機的4倍。
本文在對基于HOG特征的行人識別方法進行研究的基礎上,為了提高檢測的速度與性能,對分類器的選取、訓練方法、結果融合等方面進行了研究。
4.總結
本文將雙支持向量機法,應用到行人檢測中,相對于傳統(tǒng)算法其具有良好的推廣能力,并速度較快。但由于雙支持向量機理論的具體應用相對比較復雜,涉及的內容較多,本文的研究在很多方面還不夠深入,有待于在今后的研究工作中繼續(xù)改進和完善。