蔣 巍,張 健,曾 浩
(1.重慶郵電大學(xué)通信與信息工程學(xué)院,重慶400065;2.中國電子科技集團公司第三研究所音視頻研發(fā)部,北京 100015)
隨著視頻監(jiān)控的應(yīng)用范圍的不斷擴大,視頻處理技術(shù)的迅速發(fā)展,智能監(jiān)控系統(tǒng)應(yīng)運而生。智能監(jiān)控系統(tǒng)通過對采集到的圖像序列進行分析和處理,對運動目標進行檢測和跟蹤,掌握其運動特征,判斷其運動趨勢,并及時作出信息反饋,廣泛應(yīng)用于安防、刑偵、金融、醫(yī)療衛(wèi)生等領(lǐng)域。而在當今智能視頻監(jiān)控領(lǐng)域,利用嵌入式穩(wěn)定性高、尺寸小、硬件可裁剪、模塊化程度高而且支持以太網(wǎng)等特點,結(jié)合現(xiàn)代圖像處理技術(shù),提高系統(tǒng)的智能化程度,已經(jīng)成為技術(shù)改良的新方向。
在智能監(jiān)控的具體應(yīng)用環(huán)境中,例如刑事偵查、交通管理系統(tǒng),對運動目標檢測的需求不斷提高,要求系統(tǒng)在保證實時性的前提下同樣達到精確程度上的提升。目標檢測中,在傳統(tǒng)的光流法、幀間差分法、背景差分法的基礎(chǔ)上,一些新的算法例如基于特征點和基于背景建模結(jié)合的算法、Surendra型背景更新算法等。但是基于算法復(fù)雜程度和實現(xiàn)環(huán)境條件限制的問題,實際應(yīng)用較難。所以,結(jié)合嵌入式系統(tǒng)實現(xiàn)更有效的運動目標檢測、識別和追蹤,也成為本文研究和需要解決的重點問題。
本文結(jié)合具體項目需求,硬件系統(tǒng)處理器選用TI公司的基于DaVinci技術(shù)的TMS320DM365,其ARM926EJ-S內(nèi)核可到300 MHz速率,具有視頻處理子系統(tǒng)(VPSS),同時集成了 H.264,MPEG-4,MPEG-2,MJPEG 和 VC1 編解碼器,并提供了免專利費編解碼套件以及高級音視頻套件,可以同時輸出720p,D1,CIF等碼流或更多組合方式。TMS320DM365還集成了多種組件和多種板載外設(shè),可有效地降低開發(fā)成本。本文以該處理器為核心,完成周邊基礎(chǔ)硬件模塊的配置,搭建智能監(jiān)控系統(tǒng)硬件平臺。在此基礎(chǔ)上,針對系統(tǒng)設(shè)計需求,設(shè)計軟件流程,構(gòu)建軟件平臺,對目標檢測跟蹤部分進行算法的分析改進。利用改進型背景更新的差分方法對監(jiān)控圖像中的運動目標進行檢測和提取,同時保證了檢測的實時性和準確性;利用Kalman濾波法,對運動目標進行跟蹤,實現(xiàn)該模塊的功能流程。通過對仿真實驗的結(jié)果分析,可以說明,改進型背景跟新算法對實時背景的更新具有明顯的效果,對監(jiān)控環(huán)境光線變化的適應(yīng)能力提高;引入Kalman濾波可以有效地對運動目標進行跟蹤,滿足設(shè)計需求。
該系統(tǒng)平臺的構(gòu)成需要為上述選定的TMS320DM365配套硬件模塊,硬件模塊構(gòu)成結(jié)構(gòu)示意圖如圖1所示。
1)電源模塊
圖1 系統(tǒng)硬件結(jié)構(gòu)示意圖
TMS320DM365內(nèi)核與DDR2需要各自不同的電源,其中內(nèi)核需1.35 V;內(nèi)核和外圍需3.3 V,1.8 V;USB設(shè)備需5 V。電路的輸入電源為12 V,3.3 V與5 V采用DCDC,可以提高效率,降低發(fā)熱量。
2)Flash模塊
TMS320DM365提供的異步外部存儲器接口(Asynchronous External Memory Interface,AEMIF)支持 Nand 和Nor Flash??紤]到開發(fā)的成本和便捷性,選用K9F1G08U0BPCB00_TSOP1芯片,用作內(nèi)核文件的存儲。
3)SDRAM模塊
TMS320DM365提供了專門的DDR2控制接口(DDR2/mDDR Memory Controller),這個接口支持兼容JESD79D.2A標準的DDR2 SDRAM設(shè)備和兼容移動DDR SDRAM的設(shè)備,可支持256 Mbyte的存儲空間,作為系統(tǒng)程序的運行空間。
4)接口模塊
RS-485協(xié)議采用SN65HVDl2D作為RS-485的主IC,并且根據(jù)RS-485的時序,利用觸發(fā)邏輯,使得RS-485可以自動切換傳輸方向。當主機端無數(shù)據(jù)發(fā)送時,RS-485為讀狀態(tài),當主端發(fā)送數(shù)據(jù)時,為寫狀態(tài)。
5)網(wǎng)絡(luò)模塊
由于TMS320DM365集成了MAC控制器EMAC,直接選擇PHY芯片KS8001L即合格。EMAC由器件的ARM CPU控制而不受DSP CPU控制,EMAC控制從系統(tǒng)到PHY的數(shù)據(jù)包,MDIO模塊控制PHY的配置和狀態(tài)監(jiān)視。主要負責(zé)對以太網(wǎng)的接入,并提供數(shù)據(jù)包的緩存。
6)視頻采集模塊
系統(tǒng)要求在TMS320DM365的1個輸入口輸入多路信號,選擇實現(xiàn)疊加的數(shù)模轉(zhuǎn)換芯片TW2835,此款芯片支持NTSC/PAL信號,并可以對微弱信號、噪聲信號進行鎖存。
7)視頻處理模塊
視頻處理模塊由視頻處理前端(VPFE)和視頻處理后端(VPBE)組成。其中VPEE由CCD控制器(提供連接數(shù)字圖像傳感器和數(shù)字視頻源的接口)、預(yù)覽引擎(把原始圖形轉(zhuǎn)變?yōu)閅CbCr422數(shù)據(jù))、柱狀模塊(控制自動聚焦/自動白平衡/自動曝光的循環(huán))、硬件(構(gòu)成統(tǒng)計發(fā)生器)。VPBE由線視頻顯示處理器(將視頻數(shù)據(jù)和顯示/位圖數(shù)據(jù)整合后,以YCbCr形式提供給視頻編碼器)和視頻編碼器(產(chǎn)生NTSC/PAL、SECAM等格式的模擬視頻輸出)和數(shù)字LCD控制區(qū)組成(產(chǎn)生數(shù)字RGB/YCbCr數(shù)據(jù)輸出)。
在完成了硬件平臺的基礎(chǔ)上,需要對軟件平臺進行搭建?;趯崟r性、編碼效率、開發(fā)成本的考慮,本文選擇在Linux環(huán)境下進行編譯開發(fā)。確定了操作系統(tǒng)之后,需要對交叉編譯環(huán)境進行搭建。首先在宿主機安裝Vmware workstation,再在其基礎(chǔ)上安裝Red Hat 9.0系統(tǒng)和交叉編譯器,交叉編譯器生成的文件可以最終燒寫入目標機得以運行。在完成操作系統(tǒng)和編譯器的安裝后,需要進行處理器開發(fā)包的安裝,燒寫Flash、UBOOT、Linux內(nèi)核等,完成以上流程后,即可對TMS320DM365進行編程燒寫。
軟件流程圖如圖2所示。
圖2 軟件流程圖
以上過程可以表述為:視頻采集設(shè)備輸入的PAL流模擬信號,首先進行A/D轉(zhuǎn)換,將模擬信號轉(zhuǎn)化為數(shù)字信號;對數(shù)字信號進行視頻編碼操作,轉(zhuǎn)化為適合傳輸?shù)母袷?編碼后的碼流經(jīng)過處理,可以轉(zhuǎn)入存儲,或者經(jīng)過傳輸,進入視頻解碼器,經(jīng)過視頻解碼后的信號傳入視頻智能化處理單元進行處理后輸出至顯示端。
視頻智能化處理單元是研究的重點,它包括圖像的檢測和跟蹤。此單元的圖像處理不僅僅關(guān)系到圖像的質(zhì)量、系統(tǒng)的性能,更是系統(tǒng)智能化程度的重要體現(xiàn)。其中的目標檢測部分選用改進型的背景更新差分算法,并用Kalman濾波對運動目標進行跟蹤。本文希望通過以上算法的引入對系統(tǒng)智能檢測和跟蹤的性能進行改善。
目前,對運動目標檢測中較為常用的方法主要有幀間差分法、光流法、背景差法。其中光流法運算相對復(fù)雜,運算量大,難以滿足實時性的要求。本文在綜合考慮系統(tǒng)模塊對應(yīng)用環(huán)境、實時性、運算復(fù)雜難易度的前提下,利用改進型背景更新差分法對運動目標進行識別和檢測。該算法合理利用了幀間差分法的實時性強、檢測快速的優(yōu)勢,同時結(jié)合背景差分方法對背景進行實時更新,保證了檢測的精確程度,也彌補了傳統(tǒng)背景差分法對于環(huán)境光照強度變化適應(yīng)能力的不足。
該算法的主體可以表述為:先利用幀間差分法將圖像序列中相鄰幀或相隔幀t幀、t+n幀在同一方向進行圖像的差分,可以在相對短的時間內(nèi)檢測出待測幀之間圖像像素強度的變化。對像素強度的變化設(shè)定相應(yīng)閾值,對運動目標進行檢測。
運動檢測部分的算法流程圖如圖3所示。
圖3 幀差分法算法流程圖
根據(jù)以上的思想,可以建立以下數(shù)學(xué)模型
式中:St和St+n分別代表所選取的t和t+n幀的圖像,Bt(x,y)和Bt+n(x,y)代表第t幀和第t+n幀的背景圖像,V(x,y)和V(x+Δx,y+Δy)代表第t幀和第t+1幀中的運動目標,其中Δx和Δy是兩幀圖像間的運動矢量,Nt(x,y) 和 Nt+n(x,y))分別代表 t,t+n 幀中的噪聲部分。
設(shè)定
式中:ΔSt+n/t代表第t幀和第t+n幀之間的差分結(jié)果,[Bt+n(x,y) - Bt(x,y)]+[V(x+ Δx,y+ Δy) - V(x,y)]代表運動部分像素強變化,[Nt+n(x,y)-Nt(x,y)]代表殘留噪聲部分的強度變化。
設(shè)K(x,y)為二值差分圖像,則有
式中:K(x,y)如果取1,表示所選兩幀之間的像素強度變化達到超過閾值T,可認為目標發(fā)生運動;如果取0,表示所選兩幀之間的像素強度發(fā)生變化小于閾值T,可認為是靜止區(qū)域。其中,閾值的選取關(guān)系到檢測的精確度,設(shè)定動態(tài)閾值T=α+3β,其中α代表噪聲分布的期望,β代表噪聲分布的方差。
此算法的主要思想是在原幀差分方法的基礎(chǔ)上,標記像素強度的變化區(qū)域,得到修正后的背景,通過累計差分得到提取背景圖像進行自適應(yīng)更新,再根據(jù)上一幀圖像得到當前幀的背景圖像,通過差分方法量化光照幅度變化,并以此對參考背景進行光照強度的補償,得到最終實時背景的更新。改進型背景差分法背景更新部分算法流程圖如圖4所示。
圖4 實時背景更新算法流程圖
根據(jù)前文所述,同理可知,ΔSt-n/t表示選取的t幀同t-n幀間的差分。設(shè)P(x,y)為二值差分圖像,公式為
如果(x,y)處的二值差分圖像P(x,y)不為0,表示該像素點屬于運動區(qū)域,不能構(gòu)成實時更新的背景;如果此處的Pxy為0,則表示該像素點屬于背景區(qū)域上的點,構(gòu)成實時更新的背景??捎肧t幀的像素代替背景區(qū)域以便得到修正后的背景值。設(shè)定在非零區(qū)域內(nèi)采樣Bm和其他區(qū)域采樣Bn,可得實時背景圖像B為
然后逐幀循環(huán)進行上述過程,不斷累積更新背景模板,保證背景提取的可靠。用更新的背景圖像BM表示為B和Bm的加權(quán)和,表示如下
由于實施背景更新的質(zhì)量受權(quán)值σ對更新速度影響較大,所以使用所選取幀之間的光照幅度的變化作為自適應(yīng)的權(quán)值,可以滿足光照適應(yīng)度的需求。
圖像背景的實時更新中,需要借助當前幀t圖像的背景Bt作為參照得到t+1幀的實時背景Bt+1,而且時間進程中,圖像光照強度的驟變是影響實時更新質(zhì)量的主要問題。根據(jù)鄰幀差分法的原則,被認為是運動目標的區(qū)域像素強度跳變較大,而其他像素區(qū)域強度變化相對較小。此處,應(yīng)用時域內(nèi)的鄰幀差分法,取連續(xù)相鄰幀St+1和St的差分的平均值作為平均光照幅度的變化值,以若干相鄰幀差分的均值來量化光照變化的幅度,可以減小以單幀背景作為參考時環(huán)境突變帶來的準確性方面的影響。
光照幅度的變化為
取得光照幅度的變化值CBt+1/t的目的在于為實時更新的圖像背景進行光照強度的補償,而對于光照強度變化甚小的圖像進行逐一像素的補償,不僅增加運算量,對更新質(zhì)量的提高也很小。所以,考慮到系統(tǒng)設(shè)計盡量降低運算復(fù)雜度的要求,設(shè)定光照強度變化的閾值TS(通常取0.5~1),即在光照強度的變化大于TS的前提下,才進行光照補償,之后實時更新背景圖像。
設(shè)更新后的背景圖像為
在本文設(shè)計的系統(tǒng)中,通過圖像的快速處理,追蹤目標的運動軌跡是其實現(xiàn)智能監(jiān)控的的基礎(chǔ)之一。系統(tǒng)的時效性要求引入的算法盡可能地縮小搜索范疇,減少運算量。基于上述要求,本文在運用改進型背景更新法對運動目標進行檢測的基礎(chǔ)上,選擇Kalman濾波方法作為運動目標跟蹤的方法。
Kalman濾波是在時域內(nèi)對動態(tài)系統(tǒng)的序列采用遞歸原則進行最小均值誤差估計的方法,它利用觀測值修正估計值的狀態(tài),對運動系統(tǒng)狀態(tài)進行可靠的估計和描述。用建立數(shù)學(xué)模型的方法來表示Kalman濾波的具體流程,系統(tǒng)狀態(tài)方程為
式中:Xk代表系統(tǒng)在k時刻的狀態(tài)矢量,Ak+1/k代表系統(tǒng)由k時刻到k+1時刻的狀態(tài)轉(zhuǎn)移矩陣,wk代表系統(tǒng)k時刻系統(tǒng)輸入隨機噪聲矢量。
系統(tǒng)觀測方程為
式中:Zk代表系統(tǒng)觀測矢量,Hk代表系統(tǒng)觀測矩陣,vk代表系統(tǒng)共觀測噪聲矢量。由于一般情況下系統(tǒng)隨機噪聲和觀測噪聲符合高斯白噪聲過程,因此,本文假設(shè)系統(tǒng)噪聲{wk,k≥0}和{vk,k≥0}是不相關(guān)且均值為0的高斯白噪聲,協(xié)方差分別為Qk和Rk。
系統(tǒng)狀態(tài)的估計,需要依照估計準則和獲取的觀測信息。Kalman濾波的估計準則可以表示為
式中:E[~Xk]=E[Xk]表示估計是Xk的無偏和最小方差估計。
Kalman預(yù)估在先不考慮系統(tǒng)和觀測噪聲的前提下獲得狀態(tài)的先驗估計,并推算出狀態(tài)變量。由于先驗估計值與真實值之間存在誤差,所以再用先驗估計值和觀測變量的加權(quán)線性組合構(gòu)成得到后驗估計,當后驗估計協(xié)方差取得最小值時可取得系統(tǒng)狀態(tài)的最優(yōu)估計值。根據(jù)以上思想,可建立先驗估計的狀態(tài)矢量預(yù)測方程以及狀態(tài)矢量協(xié)方差方程為
Kalman增益矩陣為
后驗估計的狀態(tài)矢量更新方程以狀態(tài)矢量協(xié)方差更新方程為
上述式(12)~式(17)中,~X'k+1表示先驗估計的系統(tǒng)狀態(tài),是利用上一時刻的狀態(tài)矢量預(yù)測的結(jié)果;P'k+1表示先驗估計的誤差方差矩陣;Pk+1表示狀態(tài)最優(yōu)估計的誤差方差矩陣;Kk代表使系統(tǒng)狀態(tài)獲得最優(yōu)估計時的系數(shù)矩陣,即Kalman增益,用作最小化k時刻的后驗估計在誤差協(xié)方差;~Xk+1表示對系統(tǒng)狀態(tài)的最優(yōu)估計。
用改進型背景差分算法的代碼在TMS320DM365上運行,設(shè)定幀率為12,光照變化強度的閾值TS設(shè)定為0.5。同時采用改進型背景差分方法和一般背景差分方法對圖像進行目標的檢測提取,實施背景更新,光照適應(yīng)能力的測試并進行比對。以視頻序列前20幀作為初始化參考幀。在第15幀,一個著黑衣男子進入監(jiān)控圖像。圖4a代表目標出現(xiàn)在序列第一幀;圖4b代表第200幀后利用改進型方法得到的更新背景圖像;圖4c代表用一般背景差分法得到的背景圖像,從對比細節(jié)可以看出利用改進型方法得到的背景圖像更準確;圖4d代表第300幀的圖像;圖4e代表利用改進型方法檢測到的目標;圖4f代表用一般背景差分法檢測到的目標,從對比中可以發(fā)現(xiàn)利用改進型方法檢測到的目標像素區(qū)域判斷較為準確,利用一般背景差分法得到的運動區(qū)域存在對背景像素區(qū)域的重疊和誤判;圖4g代表新一視頻序列中發(fā)生光照強度突變時的圖像;圖4h代表利用改進型方法進行光照補償后得到的實時背景更新圖像;圖4i代表利用一般背景差分法得到的背景圖像,存在光強度的誤差,從對比中可以明顯發(fā)現(xiàn)光照強度的差異,說明光照補償在背景更新中具有顯著的作用。
在對智能監(jiān)控系統(tǒng)的軟硬件完成配置后,本文重點對運動目標檢檢測、識別和跟蹤部分進行了研究。利用改進型的背景差分方法對運動目標進行檢測,利用Kalman濾波法對運動目標進行跟蹤。實驗結(jié)果表明,相對于一般背景差分方法,利用改進型背景差分法進行目標檢測和跟蹤,檢測目標區(qū)域的判定更為準確,背景更新更具實時性,并且保證了精確性,在光照強度變化的環(huán)境中,自適應(yīng)能力更強,滿足了系統(tǒng)設(shè)計性能要求。
:
[1]TI Incorporated.TMS320DM365 Digital Media System-on-Chip(DMSoC)[EB/OL].[2011-10-20].http://ishare.iask.sina.com.cn/f/14960771.html?from=like&retcode=0.
[2]趙其杰,屠大維,高健,等.基于Kalman濾波的視覺預(yù)測目標跟蹤及其應(yīng)用[J]. 光學(xué)精密工程,2008,16(5):937-942.
[3]萬琴,王耀南.一種多運動目標檢測、跟蹤方法研究與實現(xiàn)[J].計算機應(yīng)用研究,2007,24(1):199-202.
[4]王建東,王亞飛,張晶.基于卡爾曼濾波器的運動目標跟蹤算法[J].數(shù)字通信,2009(6):53-57.
[5]趙龍,吳康.新型自適應(yīng)Kalman濾波算法及其應(yīng)用[J].壓電與聲光,2009,31(6):908-911.
[6]楊賀.基于TMS320DM642的運動目標檢測跟蹤系統(tǒng)的設(shè)計[D].哈爾濱:哈爾濱工程大學(xué),2007.
[7]王徐華,樊曉光,徐顯亮.基于TMS320DM642的視頻圖像處理系統(tǒng)設(shè)計與實現(xiàn)[J]. 電視技術(shù),2009,33(10):28-31.
[8]施家棟,王建中.動態(tài)場景中運動目標檢測與跟蹤[J].北京理工大學(xué)學(xué)報,2009(10):858-860.
[9]陳勇.智能視頻監(jiān)控中運動目標檢測技術(shù)研究[D].武漢:武漢理工大學(xué),2007.