楊大偉,郭 超,呂伊鵬,程 凡
(大連民族大學 機電工程學院,遼寧 大連 116605)
利用行人運動特性的TLD快速檢測算法
楊大偉,郭 超,呂伊鵬,程 凡
(大連民族大學 機電工程學院,遼寧 大連 116605)
針對TLD目標檢測時需全局窮舉搜索耗時較高的問題,提出一種基于行人運動特性的區(qū)域優(yōu)化算法。該算法可有效預測行人在圖像中的可能區(qū)域,從而減小檢測計算復雜度,提高算法效率。經(jīng)仿真分析表明,該算法在原有目標檢測性能不變的情況下,檢測耗時較原算法平均降低81.54 %,跟蹤速率平均提升4倍,跟蹤實時性明顯提高。
行人檢測;運動特性;TLD算法;區(qū)域優(yōu)化
TLD(Tracking Learning Detection)算法是一種單目標長時性跟蹤算法[1],相較于一般目標跟蹤方法運行速度更快。但TLD目標檢測始終進行全局搜索,大量非目標特征占用絕大多數(shù)計算時間和資源,導致算法實時性不高,也會增加相似目標的分析風險。
由于TLD利用簡單的特征即可實現(xiàn)較好的跟蹤效果,所以一直吸引著許多專家學者的關注。文獻[2]在TLD的基礎上加入Kalman濾波算法來預測運動目標軌跡以縮小圖像檢測范圍,使得TLD的運算速度和適應性有所提高,但遇行人目標運動靜止或轉向時則極易失效。文獻[3]通過在TLD算法的跟蹤模塊中加入粒子濾波,使得TLD在目標非線性運動或是存在較大面積遮擋的情況下跟蹤魯棒性提高,但粒子濾波跟蹤算法本身計算量大,采樣效率低,增加了算法的負擔。文獻[4]通過將TLD跟蹤器的改為復雜度較高的多重實例學習算法來提高TLD的跟蹤器準確性。文獻[5]通過改進TLD的歸一化互相關匹配算法以提高TLD的實時性。TLD算法的復雜度主要集中在檢測模塊[6],文獻[4-5]只對跟蹤器進行改進,雖然跟蹤準確性提升,但實時性提升并不明顯。
本文提出一種利用行人運動特性的TLD快速檢測MOP算法(Motion characteristic of Pedestrian)。通過分析行人運動方式,在TLD中加入Kalman濾波算法進行目標區(qū)域預估,對檢測器進行優(yōu)化,從而調(diào)整TLD檢測器的檢測區(qū)域,使其能夠快速鎖定目標,有效降低原有算法的復雜度,提高實時應用能力。
原TLD的目標跟蹤算法并不考慮實際目標的運動規(guī)律,本文所提出的MOP算法引入基于行人行為運動特性的決策機制,極大地減小了檢測框數(shù)量,改善了原有TLD算法檢測環(huán)節(jié)計算量大、效率低的問題。
1.1 Kalman 濾波器數(shù)學模型
本文使用TLD跟蹤目標框中心信息來初始化Kalman濾波算法,Kalman濾波器數(shù)學模型如下:
狀態(tài)方程
xk=Axk-1+ωk-1,
(1)
觀測方程
zk=Hxk+νk,
(2)
式中,xk為系統(tǒng)在k時刻的狀態(tài)向量,zk為同一時刻下系統(tǒng)的觀測向量。
1.2 行人運動特性(MOP)算法原理
MOP算法的核心是TLD加行人運動特性分析,這里行人運動具有很強的隨機性,其行為受身體的生物特性以及所屬物理空間慣性約束,具體表現(xiàn)為位移的不可突變性[7-8],且在單位時間內(nèi)行人目標移動距離的分布符合距離均值μd,標準差δd的高斯分布特性。受慣性影響,目標行人可能存在區(qū)域由運動方向往非運動方向收縮。設行人加速度的最大值為A/s2(A∈[0,11],R+),采樣時間t。行人在時間t內(nèi)不同初速下以最大加速度改變當前運動狀態(tài)的最大可能區(qū)域仿真示意圖如圖1。
圖1 行人初速度分別在0 m·s-1, 2 m·s-1, 5 m·s-1,和 11 m·s-1時中心范圍示意圖
圖2 實際搜索區(qū)域框示意圖
1.3 算法實現(xiàn)
據(jù)上述算法原理,MOP算法具體實現(xiàn)步驟如下:
第1步,初始化TLD目標框生成正負樣本并進行原TLD檢測器與跟蹤器的訓練,初始化Kalman濾波器的xk和zk并產(chǎn)生下一幀的預測點pt+1。
第3步,對第2步所確定的目標區(qū)域進行檢測。
第4步,結合TLD原算法的分析方法判斷第3步是否找到目標,未找到進入第5步,找到進入第6步。
第6步,更新Kalman濾波器的xk和zk,將新的預測值賦予pt+1進入下一幀。
第7步,重復第2步到第6步直至跟蹤結束。
為驗證本文所提MOP算法的有效性,與原有TLD算法的仿真結果進行對比分析,以獲取其性能改善效果。彷真環(huán)境為64位CENTOS6.5操作系統(tǒng),硬件參數(shù):內(nèi)存4G,CPU酷睿i5,頻率3.2GHz;行人最大加速度11m·s-2,采樣時間1/24s下對23個行人視頻進行了仿真分析。限于篇幅,本文以行人折返和變向變速作為典型場景進行分析。測試視頻參數(shù):視頻格式AVI,視頻幀率24,視頻尺寸640×480,視頻色值24bit,行人變向變速視頻124幀,行人折返視頻159幀。行人變向變速初始目標框大小36×124像素,行人折返初始目標框大小17×82像素,其余參數(shù)見文獻[9],部分視頻跟蹤效果截圖如圖3。
圖3 MOP算法跟蹤效果截圖
可以看出,MOP算法適用于室內(nèi)外多種不同場景,在考慮到光照變化、相似目標干擾的情形下,也能較好地實現(xiàn)運動目標的檢測與跟蹤。行人折返和變向變速場景的軌跡跟蹤仿真結果如圖4-5。
圖4 折返視頻MOP與TLD跟蹤軌跡對比圖
圖5 變向視頻MOP與TLD跟蹤軌跡對比圖
對比MOP算法與原有TLD算法可以看出,TLD算法在行人目標跟蹤中出現(xiàn)目標中心點跳變的現(xiàn)象,這說明TLD存在相似目標干擾問題,而MOP算法因在檢測時有效地限定了檢測區(qū)域,從而使得跟蹤軌跡呈現(xiàn)平滑的穩(wěn)定狀態(tài),且能夠顯著減小檢測目標中心和實際目標中心的偏差。通過仿真測試進一步證明MOP算法相較于原TLD算法,具有更高的穩(wěn)定性和檢測精度,其跟蹤幀速率及檢測用時對比結果見表1。
表1 典型視頻跟蹤結果對比
本文對包含表1在內(nèi)的23個測試數(shù)據(jù)進行分析,得出跟蹤準確性不變的情況下,優(yōu)化的MOP算法使得原算法目標檢測搜索框數(shù)量大幅降低,平均降低了79.46 %,檢測耗時平均降低81.54 %,跟蹤速率提升約4倍,算法的實時性明顯提升。
本算法在行人目標突然加速或遮擋消失時,搜索框在原尺寸的基礎上以1.2的指數(shù)倍放大,擴大到原圖像尺寸大小。若在同一幀的檢測中搜索框擴大次數(shù)過多或搜索框尺寸等于圖像尺寸時,稱此幀為失效檢測幀,此時應使用原TLD檢測算法進行全局搜索。
TLD是一種較新的高性能單目標跟蹤方法,只需較少的先驗信息便能實現(xiàn)對目標的長期在線跟蹤,廣泛吸引著研究者對其進行改進?,F(xiàn)有的TLD算法改進主要從算法本身入手,專注于研究行人輪廓與顏色的特征,改進重心多為采用更為準確的行人特征表達和尋找精度更高的跟蹤器,部分檢測區(qū)域優(yōu)化的改進方法也只是憑經(jīng)驗進行一個最可能的行人區(qū)域劃定。本文從行人的運動特性出發(fā),通過對行人基本尺寸及速度信息進行統(tǒng)計分析,得出行人在圖像空間中的可能區(qū)域分布概率,引入Kalman濾波器使用其預估參數(shù)作為目標中心預判點,從理論上在保證行人目標區(qū)域全涵蓋的同時使檢測器運算資源得以最大化節(jié)省。該算法還根據(jù)行人目標運動的不確定性大小,對Kalman濾波器參數(shù)進行實時更新,有效避免了Kalman濾波器在目標非線性運動情況下易失效的情況。對使用該方法優(yōu)化的TLD算法進行仿真測試,測試視頻包括原有行人測試視頻及新采集的行人目標在不同場景、光照、移動速度、局部遮擋、消失再出現(xiàn)、相似目標干擾等情況下的總計23個行人測試視頻。測試結果為改進后的TLD目標檢測框數(shù)量平均降低80 %,跟蹤幀速率平均提升4倍且跟蹤穩(wěn)定性更好。該算法的跟蹤速率可以滿足移動視覺機器人在視頻目標跟蹤及行人運動目標跟隨上的工程應用需求,并且更高的跟蹤速率也意味著在交通、安保、司法取證、娛樂等領域具有更為廣泛的工程應用價值。
[1]KALALZ,MKOLAJCZYKK,MATASJ.TrackingLearningDetection[J].PatternAnalysisandMachineIntelligence, 2012, 34(7):1409-1422.
[2] 周鑫, 錢秋朦, 葉永強,等. 改進后的TLD視頻目標跟蹤方法[J]. 中國圖像圖形學報, 2013, 18(9):1115-1123.
[3] 谷文華, 蔣念平, 李振興. 基于粒子濾波的TLD目標跟蹤算法[J]. 電子科技, 2015, 28(12):45-47.
[4] 高帆, 吳國平, 刑晨,等.TLD目標跟蹤算法研究[J]. 電視技術, 2013, 37(11):70-74.
[5] 邢藏菊, 溫蘭蘭, 何蘇勤.TLD視頻目標跟蹤器快速匹配的研究[J]. 小型微型計算機系統(tǒng), 2015, 36(5):1113-1116.
[6] 龔小彪. 基于TLD框架的目標跟蹤算法研究[D]. 成都:西南交通大學, 2014, 6-14.
[7] 湯澄清. 步長與身高相關關系的統(tǒng)計研究[J]. 中國刑警學院學報, 2009(3):35-36.
[8] 馬云龍, 熊輝, 蔣曉蓓,等. 行人特性對步行行為影響分析[J]. 交通與運輸, 2009(1):98-101.
[9]KALALZ,MATASJ,MIKOLAJCZYKK.P-Nlearning:Bootstrappingbinaryclassifiersbystructuralconstraints[J].ComputerVisionandPatternRecognition(CVPR), 2010IEEEConferenceonSanFrancisco, 2010, 238(6):49-56.
(責任編輯 鄒永紅)
An Improved TLD Algorithm Based on Motion Characteristics of Pedestrian
YANG Da-wei, GUO Chao, LV Yi-peng, CHENG Fan
(School of Electromechanical Engineering, Dalian Minzu University, Dalian Liaoning 116605, China)
For the huge time-waste problem in original TLD algorithm with full-search object-detection, this paper proposes a regional optimization algorithm which is based on the motion characteristics of pedestrian. It can effectively predict the pedestrian’s position in the image so as to reduce object-detection computational complexity and improve efficiency of original TLD algorithm. Simulation analysis shows that the proposed algorithm can reduce 81.54 % detection time-cost in average and increase 4 times tracking-speed in average on the basis of the original TLD algorithm object-detection process, which obviously improved the real-time performance of object tracking compared with the original TLD algorithm.
pedestrian detection; motion characteristics of pedestrian; TLD algorithm; regional optimization
2016-10-24;最后
2016-11-16
大連金州新區(qū)科技創(chuàng)新主體支持計劃(KJCX-ZTPY-2014-0005);中央高?;究蒲袠I(yè)務費專項資金自主項目(DC201501089)。
楊大偉(1978-),男,黑龍江哈爾濱人,副教授,博士,主要從事機器人視覺圖像處理研究。
2096-1383(2017)01-0036-04
TP242.6
A