付 洋,宋煥生,2,陳 艷,朱小平
(1.長(zhǎng)安大學(xué) 信息工程學(xué)院,陜西 西安710064;2.陜西省道路交通智能檢測(cè)與裝備工程技術(shù)研究中心,陜西 西安710064)
混合交通是中國(guó)交通的主要特點(diǎn),其中行人交通占有很大一部分比例,特別是在城市交通環(huán)境中,而且這種現(xiàn)象也將維持相當(dāng)長(zhǎng)一段時(shí)間。因此,保障行人安全和減少其對(duì)機(jī)動(dòng)車(chē)輛正常行駛的干擾是交通建設(shè)的重要目標(biāo)。近年來(lái),隨著圖像處理技術(shù)的快速發(fā)展,基于視頻的行人檢測(cè)技術(shù)被廣泛用于智能交通管理,成為研究的熱點(diǎn)。
麻省理工學(xué)院(MIT)人工智能實(shí)驗(yàn)室的Miacheal Oren等人提出的基于小波變換的模板匹配檢測(cè)算法[1],首先對(duì)大量樣本圖片做Haar小波變換得到這些圖片的特征參數(shù),其次對(duì)這些特征參數(shù)求取平均值并以此建立模板庫(kù),最后對(duì)輸入圖像做小波變換后,將得到的參數(shù)與模板庫(kù)匹配,可以準(zhǔn)確地識(shí)別行人。但該算法計(jì)算量太大,雖然,HaliElzein等人對(duì)此方法做了一定的改進(jìn)[2],通過(guò)選取一部分有代表性的樣本建立模板,使得計(jì)算復(fù)雜度有一定的提高,仍然不能滿(mǎn)足實(shí)時(shí)性要求。於建生等人提出了一種基于視頻的新型行人識(shí)別方法[3]。該方法通過(guò)背景差法得到視頻圖像中的前景物體,結(jié)合行人的形狀、非剛體性等特征對(duì)前景目標(biāo)采用Kalman濾波器進(jìn)行匹配跟蹤,實(shí)現(xiàn)行人識(shí)別。姚亞夫等通過(guò)背景差分得到有行人運(yùn)動(dòng)目標(biāo)二值圖像,引入水平融合值、垂直融合值將滿(mǎn)足融合要求的非連通區(qū)域外接矩形融合得到一個(gè)新矩形,以該矩形的中心作為行人位置特征,以此對(duì)行人檢測(cè)和跟蹤[4]。后兩者提出的方法能準(zhǔn)確地檢測(cè)行人,但都是針對(duì)于近場(chǎng)景中出現(xiàn)的行人目標(biāo),當(dāng)有遮擋和光照等影響時(shí)會(huì)導(dǎo)致目標(biāo)跟蹤丟失,嚴(yán)重影響檢測(cè)效率,無(wú)法滿(mǎn)足實(shí)際交通場(chǎng)景中行人檢測(cè)的要求。這兩種算法效率較前面方法有一定的提高,但對(duì)圖像的處理都以像素為基本單位,如果圖像分辨力較大時(shí)仍然不能滿(mǎn)足系統(tǒng)的實(shí)時(shí)性要求。
本文提出了一種基于背景差法提取運(yùn)動(dòng)目標(biāo)的方法,依據(jù)行人的輪廓、行人的像素高度與實(shí)際距離的線(xiàn)性變化關(guān)系和行人位置特征,對(duì)行人目標(biāo)做連續(xù)多幀匹配跟蹤求得其平均速度,最后結(jié)合行人速度特征,從而實(shí)現(xiàn)行人目標(biāo)檢測(cè)。該方法具有識(shí)別準(zhǔn)確度高、實(shí)時(shí)性強(qiáng),并能有效地解決遮擋和光照干擾等特性。同時(shí),將圖像分為大小相同的塊,以塊為單位處理圖像數(shù)據(jù),有效地降低了算法復(fù)雜度,具有良好的實(shí)時(shí)性。
本文采用背景差法提取運(yùn)動(dòng)目標(biāo),根據(jù)李璄等人提出的道路背景提取更新算法[5]提取背景模板并加以實(shí)時(shí)更新。對(duì)于連續(xù)輸入的圖像序列,通過(guò)背景差法做二值化處理即可得出運(yùn)動(dòng)目標(biāo),同時(shí)使用形態(tài)學(xué)濾波消除噪聲的干擾。實(shí)時(shí)灰度圖像如圖1所示。
圖1 實(shí)時(shí)灰度圖像
在實(shí)際的交通場(chǎng)景中因光照影響使得背景差得到的二值化目標(biāo)常帶有影子,嚴(yán)重影響運(yùn)動(dòng)目標(biāo)的檢測(cè)。為了提高算法效率,本文將二值化圖像分割成相等大小的塊,以塊為單位對(duì)二值化圖像進(jìn)行處理,像素二值化圖像如圖2所示。假設(shè)輸入圖像大小為H×W(H表示圖像高度,W表示圖像寬度),將圖像分割為R×C(R為塊高度,C為塊寬度)。如果每個(gè)塊中白色像素的個(gè)數(shù)大于該塊像素總和的一半,就將該塊賦為白色,否則賦為黑色,該過(guò)程稱(chēng)為塊二值化過(guò)程,如圖3所示。后文提到坐標(biāo)均指塊坐標(biāo),每個(gè)塊坐標(biāo)用其左下角像素點(diǎn)的坐標(biāo)表示。
如圖3所示,二值化圖像上行人的高度明顯比影子要高,本文利用這一特點(diǎn)來(lái)實(shí)現(xiàn)陰影消除。首先,對(duì)二值化圖像做連通域標(biāo)記,獲得每個(gè)目標(biāo)的高度和寬度信息。如圖3中所示的目標(biāo)外接矩形。假設(shè)一個(gè)二值化目標(biāo)的外接矩形內(nèi)每個(gè)塊的狀態(tài)用B(i,j)表示,那么有
圖4 消影處理后的圖像
在預(yù)處理的基礎(chǔ)上,依據(jù)提取目標(biāo)的輪廓特征,結(jié)合目標(biāo)實(shí)際距離與像素高度的線(xiàn)性變化關(guān)系,初步判定行人目標(biāo),結(jié)合目標(biāo)的運(yùn)動(dòng)位置特征對(duì)同一目標(biāo)做連續(xù)多幀匹配跟蹤,最后,通過(guò)計(jì)算目標(biāo)的平均速度,實(shí)現(xiàn)行人目標(biāo)檢測(cè)。
交通場(chǎng)景中一般出現(xiàn)較多的是車(chē)和行人,而車(chē)和人的輪廓形狀有很大差異,行人一般保持著豎立行走,即便是有負(fù)重、攜帶物品等影響,在圖像上滿(mǎn)足高度大于寬度。
通過(guò)連通域標(biāo)記可以獲得運(yùn)動(dòng)目標(biāo)在圖像中的高度和寬度,假設(shè)分別為Hy和Wx,則高寬比為Rt=Hy/Wx。如果Rt≤2,則該目標(biāo)為非人;如果Rt>2,則對(duì)該目標(biāo)做后續(xù)檢測(cè)。對(duì)圖3中每個(gè)目標(biāo)按照輪廓檢測(cè)算法處理后,結(jié)果如圖4,得到滿(mǎn)足該條件的行人目標(biāo)。
根據(jù)攝像機(jī)成像原理和文獻(xiàn)[6]可以得到攝像機(jī)、圖像平面、人和實(shí)際路面有如圖5的成像關(guān)系。
圖5 相機(jī)、圖像平面、人和實(shí)際路面幾何成像關(guān)系圖
圖5 中,P為圖像平面的最底行,RS和UT分別為人在圖像上不同位置處的像素高度,AB和EF為行人的實(shí)際高度。D,A,C,E,G分別為圖像平面的點(diǎn)P,S,R,T,U映射到實(shí)際路面的點(diǎn)。OV為相機(jī)距離路面的實(shí)際高度。BH和FI分別垂直于VA和VE。
在實(shí)際的交通場(chǎng)景中,攝像機(jī)距離地面的距離一般在5 m左右,攝像機(jī)拍攝的視角一般都在幾十米至幾百米之間,可以忽略O(shè)V,近似有OA=VA,OE=VE,∠AVB=∠EVF,BH=AB=FI=FE,VP=VS=VR=VT=VU。那么有△AVB和△EVF均為等腰三角形,且△SVT和△TVU分別與△AVB和△EVF相似。則有如下關(guān)系式
通過(guò)文獻(xiàn)[7]和文獻(xiàn)[8]中提到圖像平面每個(gè)像素到實(shí)際路面距離的映射關(guān)系可以建立圖像上像素點(diǎn)到實(shí)際距離的映射表,映射表所對(duì)應(yīng)的實(shí)際距離為以D點(diǎn)為參考點(diǎn),但在實(shí)際的交通場(chǎng)景中,OD是未知的。首先,在圖像上標(biāo)定同一行人在不同位置處像素坐標(biāo)R,S,U,T,如圖6所示。
圖6 行人像素高度標(biāo)定
對(duì)同一行人則有
由連通域標(biāo)記可得每個(gè)目標(biāo)在圖像上S點(diǎn)和T點(diǎn)的對(duì)應(yīng)的像素高度RS和UT,通過(guò)查找映射表,可得S點(diǎn)和T點(diǎn)對(duì)應(yīng)的實(shí)際距離DA和DE,通過(guò)方程(3)和方程(4)可以解得OD值。
由公式(3)與式(4)相比可得
且當(dāng)0.7<βk<1.4時(shí),就認(rèn)為該目標(biāo)為行人目標(biāo),繼續(xù)做位置匹配跟蹤;否則為非行人目標(biāo),不再處理。
據(jù)統(tǒng)計(jì),成人的速度一般在1.4 m/s左右,且通常保持基本相同的低速前進(jìn)或者靜止?fàn)顟B(tài)。本文以相鄰幀之間的運(yùn)動(dòng)目標(biāo)的質(zhì)心位移小于某一閾值L作為匹配準(zhǔn)則,實(shí)現(xiàn)連續(xù)多幀跟蹤,最后計(jì)算得到行人速度。
對(duì)于第k幀圖像中某一運(yùn)動(dòng)目標(biāo),其質(zhì)心計(jì)算如下
式中:NB為當(dāng)前運(yùn)動(dòng)目標(biāo)標(biāo)記區(qū)域白塊的個(gè)數(shù)。
在滿(mǎn)足2.1節(jié)和2.2節(jié)條件的運(yùn)動(dòng)目標(biāo)第一次出現(xiàn)的圖像中,記錄當(dāng)前幀圖像位置信息(xk,yk)。則第k幀和第k+1幀的位移變化量為
對(duì)于同一目標(biāo)在相鄰兩幀滿(mǎn)足式(8)時(shí),認(rèn)為該目標(biāo)實(shí)現(xiàn)匹配跟蹤。當(dāng)匹配跟蹤達(dá)到N次時(shí),計(jì)算N幀內(nèi)的平均速度。首先,查映射表找到圖像上點(diǎn)(xk,yk)和(xk+N,yk+N)所對(duì)應(yīng)的實(shí)際的距離Lk和Lk+N,則該目標(biāo)的平均速度為
式中:N-1為相鄰兩幀匹配次數(shù);t為相鄰幀時(shí)間間隔。
取一個(gè)閾值VT,當(dāng)V<VT時(shí),就認(rèn)為該目標(biāo)為行人;否則,判定為非行人。
當(dāng)行人在攝像機(jī)的遠(yuǎn)視角區(qū)域時(shí),會(huì)出現(xiàn)背景更新不均勻的現(xiàn)象;有時(shí),也會(huì)出現(xiàn)運(yùn)動(dòng)車(chē)輛對(duì)行人短時(shí)間、部分區(qū)域遮擋的現(xiàn)象。以上兩種現(xiàn)象都會(huì)造成二值化目標(biāo)提取失敗,無(wú)法匹配跟蹤。當(dāng)?shù)趉幀的目標(biāo)在第k+i幀重新出現(xiàn)時(shí),如果幀差i滿(mǎn)足i<T,且式(10)成立時(shí),就認(rèn)為第k幀的目標(biāo)在第k+i幀能夠匹配,實(shí)現(xiàn)跟蹤匹配。當(dāng)總的匹配次數(shù)為N時(shí),采用式(11)計(jì)算該目標(biāo)的平均速度V',當(dāng)V'<VT時(shí),就認(rèn)為該目標(biāo)為行人;否則,目標(biāo)判定為非行人。公式為
式中:N-1為相鄰兩幀匹配次數(shù);t為相鄰幀時(shí)間間隔;i為匹配丟失幀數(shù)。
利用本文提出的算法對(duì)幀頻為25 f/s(幀/秒),分辨力為720×288的視頻序列做行人檢測(cè)實(shí)驗(yàn)。在TMS320DM6437 DSP嵌入式系統(tǒng)、內(nèi)存128 Mbyte、主頻600 MHz的環(huán)境下測(cè)試,該算法具有良好的實(shí)時(shí)性。
圖7是針對(duì)高速公路場(chǎng)景進(jìn)行的行人檢測(cè)。該場(chǎng)景的車(chē)流量密度小,干擾信息少,從圖7c可以看出,該算法能夠通過(guò)對(duì)行人目標(biāo)的多次匹配跟蹤準(zhǔn)確地檢測(cè)行人目標(biāo)。其中陰影部分為過(guò)去每幀行人目標(biāo)標(biāo)記,白色為當(dāng)前幀中行人目標(biāo)標(biāo)記。
圖7 高速公路場(chǎng)景行人檢測(cè)
圖8 為城市交通場(chǎng)景遠(yuǎn)景區(qū)域行人的檢測(cè)。由于車(chē)流量密度大和綠化帶等干擾因素,遠(yuǎn)景區(qū)域背景更新不均勻造成的運(yùn)動(dòng)目標(biāo)提取失敗。圖8c中第3 046幀為目標(biāo)丟失前一幀匹配跟蹤圖,第3 051幀為行人目標(biāo)丟失,當(dāng)前幀中無(wú)法實(shí)現(xiàn)匹配跟蹤,第3 054幀為行人目標(biāo)再次出現(xiàn),從其匹配跟蹤框軌跡可以看出,行人目標(biāo)在丟失9幀后再次實(shí)現(xiàn)匹配跟蹤,準(zhǔn)確地檢測(cè)出行人目標(biāo)。
圖8 城市交通場(chǎng)景遠(yuǎn)景行人檢測(cè)
圖9 是城市交通場(chǎng)景中運(yùn)動(dòng)車(chē)輛對(duì)行人的部分遮擋問(wèn)題。圖9c中第5 395幀為行人目標(biāo)丟失前一幀匹配跟蹤軌跡圖,第5 400幀為行人目標(biāo)被遮擋,在當(dāng)前幀中丟失匹配跟蹤目標(biāo),第5 410幀為行人再次出現(xiàn),從其匹配跟蹤軌跡可以看出,行人目標(biāo)在丟失15幀后能再次實(shí)現(xiàn)匹配跟蹤,將行人目標(biāo)準(zhǔn)確地檢測(cè)出來(lái)。
圖9 城市交通場(chǎng)景車(chē)輛遮擋行人檢測(cè)
本文提出的行人圖像像素高度和實(shí)際距離的線(xiàn)性關(guān)系,結(jié)合行人位置特征,通過(guò)多幀匹配跟蹤,能有效地解決遮擋、遠(yuǎn)景背景更新不均勻等造成行人目標(biāo)丟失的情況。同時(shí),本文中提出投影法能有效地消除光照產(chǎn)生的陰影,以塊為單位處理圖像有效地降低了算法復(fù)雜度,提高系統(tǒng)的實(shí)時(shí)性。
[1]OREN M,PAPAGEORGIOU C,SINHA P,et al.Pedestrian detection using wavelet templates[C]//Proc.IEEE Computer Vision and Pattern Recognition,1997.Washington,DC,USA:IEEE Press,1997:193-199.
[2]ELZEIN H,LAKSHMANAN S,WATTA P.A motion and shape-based pedestrian detection algorithm[C]//Proc.IEEE Computer Vision and Pattern Recognition,2003.[S.l]:IEEE Press,2003:500-504.
[3]於健生,汪宏,顧晶.一種基于視頻的新型行人識(shí)別方法[J].信息化研究,2010,36(3):19-21.
[4]姚亞夫,劉佰昂.基于位置特征的運(yùn)動(dòng)行人檢測(cè)與跟蹤方法[J].廣西大學(xué)學(xué)報(bào),2009,34(6):769-773.
[5]李璟,劉懷愚,洪留榮.改進(jìn)的道路北京提取和更新算法[J].計(jì)算機(jī)應(yīng)用,2010,30(6):1266-1267.
[6]羅珍茜,薛雷,孫峰杰,等.基于HALCON的攝像機(jī)標(biāo)定[J].電視技術(shù),2010,34(4):100-102.
[7]于艷玲.視頻檢測(cè)技術(shù)中車(chē)速檢測(cè)研究[D].西安:長(zhǎng)安大學(xué),2009.
[8]王子亨,穆森,邱桂蘋(píng).攝像機(jī)非線(xiàn)性標(biāo)定方法[J].計(jì)算機(jī)工程與設(shè)計(jì),2010,31(15):3526-3529.