藍(lán)章禮,陳巍,楊揚
(重慶交通大學(xué)信息科學(xué)與工程學(xué)院,重慶400074)
高速公路上發(fā)生的追尾事故占事故總數(shù)很大比例。保持安全的車距是避免發(fā)生追尾的主要預(yù)防措施。前向車輛檢測系統(tǒng)可以檢測前方車輛,目前向車輛檢測系統(tǒng)所采用的檢測技術(shù)主要有:毫米波雷達[1]、激光[2]、紅外[3]、計算機視覺[4-5]等,其中計算機視覺具有捕獲信息豐富,設(shè)備成本低等優(yōu)點,因此,研究和發(fā)展基于計算機視覺的車輛檢測技術(shù)在減少追尾事故方面有非常重要的意義。
基于計算機視覺的車輛檢測方法大致可以分為基于模型、基于特征、基于光流場,基于機器學(xué)習(xí)4種[5]?;谀P偷姆椒╗6]建立車輛的二維或三維模型,然后與檢測圖像機型匹配?;谔卣鞯臋z測方法[7]根據(jù)車輛的對稱性、陰影等特征或特征的組合對車輛進行檢測。光流法[8-19]通過檢測目標(biāo)的運動或者相機的運動或者兩者的共同運動,該方法計算量大,對噪聲敏感。機器學(xué)習(xí)[10-11]利用大量數(shù)據(jù)提取特征通過學(xué)習(xí)得到模型,雖然訓(xùn)練的過程計算量大,但是通過學(xué)習(xí)到的模型進行預(yù)測計算量小,精度高。深度學(xué)習(xí)[12-13]是機器學(xué)習(xí)的一種,通過多層神經(jīng)網(wǎng)絡(luò)實現(xiàn)端到端的學(xué)習(xí),深度學(xué)習(xí)可以完成計算機視覺中的分類,檢測等任務(wù),但是深度學(xué)習(xí)的模型龐大,需要經(jīng)過模型壓縮[14]才能在實際中應(yīng)用。
本文在上述工作的基礎(chǔ)上,提出了一種基于邏輯回歸[15]的車輛檢測算法,通過在互聯(lián)網(wǎng)上搜集車輛與非車輛的圖片,提取HOG[16]特征,并訓(xùn)練邏輯回歸模型完成對車輛的檢測。在視頻檢測中,通過對每一幀視頻進行滑動窗口檢測是否包含車輛,并采用非極大值抑制技術(shù)剔除多余的候選窗口。
為了實現(xiàn)對車輛的檢測,首先要完成對車輛的識別,本文使用的識別算法是用HOG特征和邏輯回歸模型實現(xiàn)的。
HOG(Histogram of Oriented Gradient),即方向梯度直方圖,是一種在計算機視覺領(lǐng)域用來描述物體特征的特征描述算子。HOG特征廣泛應(yīng)用于圖像識別中,在行人檢測中獲得了極大的成功,通過搜集了大量車輛圖片,車輛的圖像特征也可以通過梯度特征的概率分布描述。HOG特征獲取的主要流程是,首先對圖像灰度化,計算每個像素的梯度(包括方向和大?。袼攸cI(x,y)的梯度計算公式如下:
式中,Gx(x,y)、Gy(x,y)分為I(x,y)的水平方向和垂直方向的梯度。
將圖像劃分為若干個單元(cell),按梯度方向劃分為9個區(qū)間(bin),每個區(qū)間統(tǒng)計對應(yīng)梯度方向的梯度大?。ㄌ荻确较蛳嗖?80o的算同一梯度),得到一個9維的特征向量,如圖1所示。
圖1 方向直方圖原理
由于局部光照的變化和前景-背景對比度變化大,需要將HOG特征進行歸一化處理。
如圖2所示,4個單元構(gòu)成一個塊(block),把一個塊內(nèi)所有單元的特征向量聯(lián)起來得到塊的特征向量。歸一化能減弱圖像局部梯度變化過大的影響。用塊對樣本圖像進行掃描,掃描步長為一個單元。最后將圖像中所有塊的特征串聯(lián)起來就得到了圖片的HOG特征。
圖2 4個cell歸一為block
圖3 正樣本(車輛)的原圖(左)及其HOG示意圖(右)
圖4 負(fù)樣本(非車輛)的原圖(左)及其HOG示意圖(右)
從圖3、4可以看出,車輛與非車輛的HOG特征在結(jié)構(gòu)上有明顯的差別,因此可以作為分類的依據(jù)。
LRM[15](logistic regression model)是統(tǒng)計學(xué)中一種經(jīng)典的分類算法,常用于二分類問題。對于一個回歸或者分類問題,邏輯回歸是這樣一個過程:建立代價函數(shù),然后通過優(yōu)化方法迭代求解出最優(yōu)的模型參數(shù),然后測試驗證我們這個求解的模型的好壞。
對于二分類的邏輯回歸,通常稱為二項邏輯回歸模型,由條件概率分布P(Y|X)表示,其中,隨機變量X取值為實數(shù),隨機變量Y取值為1或0,所以,二項邏輯回歸模型由如下的條件概率分布表示:
其中,x∈Rn是輸入,Y∈{0,1}是輸出,ω∈Rn和b∈R是參數(shù),ω稱為權(quán)重向量,b稱為偏置,ω·x為ω和x的內(nèi)積。
不過警方查明,投毒案發(fā)生期間,勒維斯住在紐約,并沒有去過芝加哥。顯然,他只是渾水摸魚,想趁機發(fā)一筆大財,并非真正的兇手。最終,勒維斯以勒索、造假賬、偽造信用卡等6項罪名,被判處20年監(jiān)禁。
對于給定的輸入實例x,由式(3)和(4)可以求得P(Y=1|x)和P(Y=0|x),邏輯回歸會比較這兩個條件概率的大小,將實例x分到概率較大的那一類。為了計算方便,將偏置b擴充至向量ω中,得到ω=(ω(1),ω(2),...,ω(n),b)T,x=(x(1),x(2),...,x(n),1)T,此時的邏輯回歸模型為:
一個事件發(fā)生的概率與不發(fā)生的概率的視作幾率,對于邏輯回歸而言,對數(shù)幾率可表示為:
由此可知,在回歸模型中,輸出Y=1的對數(shù)幾率是輸入x的線性函數(shù)。對模型中的參數(shù)ω的求解通常使用極大似然估計法。
設(shè):P(Y=1|x)=π(x),P(Y=0|x)=1-π(x)
則似然函數(shù)為:
對數(shù)似然函數(shù)為:
化簡后為:
由此可得ω的更新過程:
其中,為第i個樣本實例的第j維特征,α為學(xué)習(xí)率,是梯度下降步長。假設(shè)J(ω)最小時的ω為ωˉ,則學(xué)習(xí)到的邏輯回歸模型為:
由于一個視頻幀中可能存在多個車輛,因此本文采用了滑動窗口機制,遍歷視頻幀中的所有窗口,在每個窗口中利用訓(xùn)練好的LRM檢測每個窗口是否包含車輛。由于檢測到車輛的窗口會發(fā)生重疊,本文使用了非極大值抑制技術(shù)來去除多余的檢測窗口。
對于監(jiān)控視頻中的每一幀,車輛可能出現(xiàn)在不同的位置,所以需要采用滑動窗口機制來截取視頻幀中的一部分區(qū)域作為窗口,通過HOG特征和LRM來進行分類判定當(dāng)前窗口是否包含車輛,遍歷視頻幀中的每一個窗口實現(xiàn)檢測車輛的目的。因為需要檢測的車輛集中于視頻幀的下半部分,上半部分為天空和遠(yuǎn)景,車輛的投影很小,距離較遠(yuǎn),為了使滑動窗口計算量更小,本文的滑動窗口搜索區(qū)域只在視頻幀的下半部分,這是符合實際的。同時本文使用了兩本尺寸的窗口,便于對不同尺寸的車輛進行檢測,如圖5所示。
圖5 滑動窗口示意圖
從一個視頻幀中可能找到多個可能是車輛的窗口,用IOU表示兩個窗口A、B的重疊度:
式中,SA、SB、SI分為表示窗口A的面積、窗口B的面積,窗口A、B共有的面積。
為了從多個窗口中準(zhǔn)確的選擇包含車輛的窗口并且不重復(fù),使用了基于非極大值抑制的窗口選擇算法,算法流程:
1)將現(xiàn)有所有窗口按照屬于車輛的概率大小排序得到(W1,W2,…,Wm);
2)i從1到m-1:
若IOU(Wi,Wm)≥ T,刪除Wi;
若沒有窗口刪除則轉(zhuǎn)3),否則轉(zhuǎn)1);
3)算法結(jié)束。
其中,T為設(shè)定的IOU閾值,當(dāng)兩個窗口的IOU大于等于閾值時,則保留較大概率的窗口,刪除較小概率的窗口,否則,表示這兩個窗口分別檢測到兩個車輛,兩個窗口都應(yīng)該保留。
筆者從互聯(lián)網(wǎng)上搜集1000張圖像并裁剪為相同的大小,其中600為車輛,400張為非車輛的其他圖片,1000張圖片隨機選800張(保證車輛與非車輛的數(shù)量比為3:2)作為訓(xùn)練集,用來訓(xùn)練LRM分類器,剩余200張用作測試集用來測試訓(xùn)練后的LRM的準(zhǔn)確率。
本文在python2.7環(huán)境下通過對搜集到的車輛與非車輛圖片先將大小歸一化為400×300,然后提取HOG特征,利用訓(xùn)練集對LRM分類器進行了訓(xùn)練,用測試集測試LRM分類器,正確率達到96.23%。為了說明本文所提出的檢測方法在輔助駕駛系統(tǒng)中的正確性和有效性,采集了多個車輛駕行駛的前向拍攝視頻進行分析,并用本文提出的技術(shù)進行車輛的檢測,實驗結(jié)果如圖6所示。
圖6 車輛行駛視頻截圖和檢測結(jié)果
從以上截圖可以看出,在(a)圖中,對于無車的情況下沒有檢測窗口,從(b~f)對于一個或多個車輛能進行正確的檢測,但是圖(e)沒有檢測出被植物遮擋的一個車輛,圖(f)沒有檢測到被一個其他車輛遮擋了大部分的車輛。對近處的車輛識別效果較好,對被嚴(yán)重遮擋的車輛可能會漏識別,對在滑動窗口范圍內(nèi),但是距離較遠(yuǎn)的車輛,也會漏識別。本文為了減少計算量,簡化了窗口的搜索空間,窗口的尺寸只有兩種,若加大搜索空間和引入更多的窗口尺寸會進一步提高識別準(zhǔn)確率,但同時也會成倍加大計算量。由于引入了非極大值抑制技術(shù)去除多余的候選窗口,可能會造成檢測不到圖像中被嚴(yán)重遮擋的車輛,距離較遠(yuǎn)的車輛在視頻幀中的HOG特征發(fā)生了變化,以至于LRM分類器識別出錯。
文中探索了基于滑動窗口和邏輯回歸模型的車輛檢測方法,實驗證明能在大部分情況下準(zhǔn)確識別車輛,識別的正確率可達到96.23%,但是還不能達到100%,對于被嚴(yán)重遮擋或者距離較遠(yuǎn)的車輛會漏識別。在未來的研究中,更一步探索基于深度學(xué)習(xí)的車輛檢測技術(shù),實現(xiàn)更準(zhǔn)確的車輛檢測技術(shù)。