三亞學(xué)院 高華玲
?
智能視頻監(jiān)控技術(shù)的研究與應(yīng)用
三亞學(xué)院 高華玲
【摘要】智能視頻監(jiān)控的核心技術(shù)是目標(biāo)檢測(cè)、目標(biāo)分類、目標(biāo)跟蹤、異常行為分析等,相關(guān)的算法研究已經(jīng)比較成熟。本文歸納相關(guān)的核心算法,并進(jìn)行簡(jiǎn)單的優(yōu)缺點(diǎn)評(píng)述。后續(xù)對(duì)近年來(lái)智能視頻監(jiān)控系統(tǒng)的應(yīng)用現(xiàn)狀進(jìn)行總結(jié),最后探討相關(guān)技術(shù)的未來(lái)發(fā)展方向。
【關(guān)鍵詞】智能視頻監(jiān)控;算法;應(yīng)用
智能視頻監(jiān)控系統(tǒng)的功能強(qiáng)調(diào)對(duì)圖像的智能識(shí)別、分析和管理,并能在遠(yuǎn)程網(wǎng)絡(luò)進(jìn)行操作。隨著平安城市的建設(shè),攝像頭的數(shù)量不斷增加,監(jiān)控設(shè)備性能得到了提高,并產(chǎn)生了大量的監(jiān)控?cái)?shù)據(jù)。在物聯(lián)網(wǎng)和大數(shù)據(jù)的背景下,智能視頻監(jiān)控系統(tǒng)的應(yīng)用更加注重效率和監(jiān)控效果,更加強(qiáng)調(diào)對(duì)大量的監(jiān)控?cái)?shù)據(jù)進(jìn)行實(shí)時(shí)檢測(cè)、跟蹤和分析。分布式的監(jiān)控系統(tǒng)是一種面向?qū)ο蟮募夹g(shù),以多終端的并行處理和控制為優(yōu)勢(shì),成為新一代智能視頻監(jiān)控系統(tǒng)的發(fā)展方向。
智能視頻監(jiān)控技術(shù)經(jīng)歷了模擬化、數(shù)字化、智能化三個(gè)時(shí)代。智能視頻監(jiān)控的關(guān)鍵技術(shù)的算法包括目標(biāo)檢測(cè)、目標(biāo)跟蹤、行為分析等。
2.1運(yùn)動(dòng)目標(biāo)檢測(cè)
視頻中動(dòng)態(tài)目標(biāo)的檢測(cè)方法可以分為兩大類,其一是通過(guò)背景建模來(lái)檢測(cè),其二是通過(guò)對(duì)目標(biāo)建模來(lái)檢測(cè)感興趣的研究目標(biāo)。這里介紹三種典型的檢測(cè)算法——背景減除法、幀間差分法和光流法。
2.1.1背景減除法
首先分析視頻圖像的底層特征對(duì)背景建模(單高斯背景建模機(jī)票混合高斯背景建模),然后利用當(dāng)前圖像和背景圖像的差分來(lái)檢測(cè)運(yùn)動(dòng)目標(biāo)。算法的優(yōu)點(diǎn)是計(jì)算精確度高,算法性能好,缺點(diǎn)是占用系統(tǒng)資源較多,對(duì)光線變化、動(dòng)態(tài)背景、攝像機(jī)抖動(dòng)等表現(xiàn)敏感。
2.1.2幀間差分法
利用圖像序列相鄰幀之間的差異獲取運(yùn)動(dòng)目標(biāo)的特征,將結(jié)果進(jìn)行閾值分割來(lái)獲取運(yùn)動(dòng)區(qū)域。優(yōu)點(diǎn)是環(huán)境適應(yīng)力強(qiáng),實(shí)時(shí)性好,具有一定的抗噪能力,占用系統(tǒng)資源少,對(duì)光線變化不敏感,缺點(diǎn)是算法精確度不高,需要根據(jù)物體運(yùn)動(dòng)的快慢選擇合適的時(shí)間幀進(jìn)行比較,并僅在目標(biāo)運(yùn)動(dòng)時(shí)限內(nèi)能夠檢測(cè)。
2.1.3光流法
利用運(yùn)動(dòng)目標(biāo)像素的瞬時(shí)速度來(lái)區(qū)分運(yùn)動(dòng)目標(biāo),即研究在一定時(shí)間內(nèi)圖像灰度值的變化與運(yùn)動(dòng)目標(biāo)的結(jié)構(gòu)、運(yùn)動(dòng)方式之間關(guān)系。優(yōu)點(diǎn)是不需要關(guān)心背景信息,缺點(diǎn)是計(jì)算結(jié)果會(huì)受到遮擋、陰影、光線變化等因素的影響,計(jì)算復(fù)雜度高,實(shí)時(shí)性較差。
2.2動(dòng)態(tài)目標(biāo)跟蹤
目標(biāo)跟蹤常常根據(jù)運(yùn)動(dòng)目標(biāo)的各種特征值進(jìn)行判斷,比如形狀特征、顏色特征、空間關(guān)系特征、紋理特征和輪廓特征等。三種比較經(jīng)典的目標(biāo)跟蹤算法是Meanshift算法[1]、Camshift跟蹤算法[2]和Kalman濾波算法[3]。
Meanshift算法是一種基于核密度估計(jì)的梯度上升算法,任意點(diǎn)為起點(diǎn)向核密度梯度上升的方向在離線模型中進(jìn)行搜索,最后收斂于核密度的局部最大值。算法優(yōu)點(diǎn)是計(jì)算復(fù)雜度低,無(wú)需參數(shù),容易與其他的算法相結(jié)合,常用于圖像切割和視頻跟蹤。缺點(diǎn)是搜索框的核函數(shù)帶寬不變,所選的特征值單一,抗干擾能力差。
Camshift跟蹤算法是根據(jù)圖像序列中像素的色度直方圖信息對(duì)運(yùn)動(dòng)目標(biāo)進(jìn)行跟蹤的。它是Meanshift算法的擴(kuò)展。
Kalman基于預(yù)測(cè)的濾波算法是一種基于運(yùn)動(dòng)目標(biāo)的特征進(jìn)行遞推預(yù)測(cè)的算法。此算法的優(yōu)點(diǎn)是系統(tǒng)處理速度快,抵抗遮擋性能好,但是缺點(diǎn)是難以建立準(zhǔn)確地隨機(jī)模型,局限于固定的運(yùn)動(dòng)模型。
2.3異常行為檢測(cè)
人體行為是通過(guò)在視頻監(jiān)控中檢測(cè)出較為理想的人體輪廓,提取瞬間輪廓特征進(jìn)行分析的。人體行為的研究集中在少數(shù)具有危害性的異常行為,常見(jiàn)有三種:徘徊行為檢測(cè)、人體異常行為檢測(cè)和遺留物檢測(cè)。比如人體異常行為有停車(chē)場(chǎng)背景中的跌倒、下蹲、打、砸、敲、踢等。
1)徘徊行為檢測(cè)的方法有基于二維馬爾科夫隨機(jī)游走模型的方法[4]、利用貝葉斯表征跟蹤器建模的方法[5]和計(jì)算離散曲率熵和方差的方法[6]等。
2)人體異常行為檢測(cè)的方法主要介紹3種常用方法,一是利用簡(jiǎn)單的人體幾何模型對(duì)人體行為進(jìn)行識(shí)別;二是基于不同時(shí)刻空間狀態(tài)變化計(jì)算聯(lián)合概率,確定行為分類標(biāo)準(zhǔn),如隱馬爾科夫模型[7]和動(dòng)態(tài)貝葉斯方法;三是對(duì)人體運(yùn)動(dòng)方向、軌跡、位置、速度、角度等運(yùn)動(dòng)特征進(jìn)行描述的方法。
3)遺留物檢測(cè)的方法
遺留物檢測(cè)是針對(duì)某物體進(jìn)入視頻場(chǎng)景之后,檢測(cè)該物體是否是遺留物,待物體滯留一段時(shí)間后觸發(fā)報(bào)警系統(tǒng),防止意外發(fā)生。劉強(qiáng)使用codebook模型構(gòu)建背景模型,對(duì)實(shí)時(shí)更新和非實(shí)時(shí)更新的背景圖像差值檢測(cè)遺留物[6]。
1)VSAM是1997年美國(guó)國(guó)防部高級(jí)研究項(xiàng)目署的視頻監(jiān)控重大項(xiàng)目,目的是為了預(yù)防恐怖襲擊。該項(xiàng)目由卡內(nèi)基梅隆大學(xué)和麻省理工學(xué)院等高校進(jìn)行研究,能夠應(yīng)用于民間場(chǎng)景和戰(zhàn)場(chǎng)的人體和車(chē)輛的監(jiān)控。
2)W4是美國(guó)馬里蘭大學(xué)(Maryland)開(kāi)發(fā)的視頻監(jiān)控系統(tǒng),檢測(cè)和跟蹤戶外環(huán)境下的多人運(yùn)動(dòng),能夠有效的對(duì)住宅、停車(chē)場(chǎng)、銀行等場(chǎng)所進(jìn)行可疑人員的排查,通過(guò)外觀建模檢測(cè)出物品攜帶者,并跟蹤監(jiān)控。
3)Pfinder是麻省理工學(xué)院(MIT)的Wren等人根據(jù)對(duì)象的顏色、形狀等特征構(gòu)建多種模型,通過(guò)這種方式建立單個(gè)未遮擋人體的三維模型,對(duì)人體各部位進(jìn)行構(gòu)造。實(shí)驗(yàn)時(shí)對(duì)實(shí)驗(yàn)室的人員進(jìn)行實(shí)時(shí)監(jiān)視,結(jié)果顯示此系統(tǒng)可以克服短暫的光照變化和遮擋等因素,較為準(zhǔn)確地判斷其行為方式。
4)CBSR是國(guó)內(nèi)較成功的智能監(jiān)控系統(tǒng),此系統(tǒng)檢測(cè)所有路過(guò)的車(chē)輛,并進(jìn)行跟蹤和處理,同時(shí)進(jìn)行人臉跟蹤和識(shí)別。
5)ADVISOR是歐盟信息社會(huì)技術(shù)程序委員會(huì)開(kāi)發(fā)的一個(gè)視頻監(jiān)控和檢索系統(tǒng),此系統(tǒng)對(duì)公共交通中的人群進(jìn)行監(jiān)控,分析行人的行為模式。
從歷年的視頻監(jiān)控白皮書(shū)中獲悉,視頻監(jiān)控系統(tǒng)的應(yīng)用行業(yè)增速最快的是城市監(jiān)控、能源行業(yè)和教育機(jī)構(gòu)。常見(jiàn)的應(yīng)用在軍事、安保、交通、港口和大型活動(dòng)中較多。國(guó)外以美國(guó)為首的應(yīng)用規(guī)模不斷擴(kuò)大,智能視頻技術(shù)逐漸成為具有影響力的產(chǎn)業(yè)。美國(guó)和歐洲掌握了智能視頻監(jiān)控領(lǐng)域的核心技術(shù),市場(chǎng)占有率非常高。歐美等研發(fā)的智能視頻監(jiān)控系統(tǒng)已經(jīng)比較成熟,大量應(yīng)用于實(shí)際的安防系統(tǒng),如美國(guó)ObjectVideo、Vidient和Verint系統(tǒng),日本NICE系統(tǒng)和以色列的Mate、IOimage系統(tǒng)。中國(guó)的市場(chǎng)份額在近年來(lái)增長(zhǎng)迅速。根據(jù)權(quán)威的電子行業(yè)調(diào)研公司IHS的子公司IMS Research的預(yù)測(cè),2016年全球視頻監(jiān)控設(shè)備市場(chǎng)的營(yíng)業(yè)收入將從2010年的96億美元上升到205億美元,大增114%。2016年中國(guó)已經(jīng)成為世界最主要的視頻監(jiān)控市場(chǎng),市場(chǎng)占有率將達(dá)到全球市場(chǎng)的40%以上。全球視頻監(jiān)控產(chǎn)品按分類看,網(wǎng)絡(luò)智能攝像機(jī)、模擬高清和家用攝像頭需求快速增長(zhǎng)。按終端用戶分類看,平安城市、智能交通、平安社區(qū)、平安校園等城市監(jiān)控需求增速最快,能源行業(yè)和教育行業(yè)的應(yīng)用也逐步增速。
4.1安防類應(yīng)用
安防類的應(yīng)用是最為常見(jiàn)的應(yīng)用。用于機(jī)場(chǎng)、監(jiān)獄、軍事和其他的大型活動(dòng)中的安全視頻監(jiān)控,智能化技術(shù)需求包括高級(jí)視頻移動(dòng)偵測(cè)、物體追蹤、人臉識(shí)別、車(chē)輛識(shí)別、非法滯留等。
4.2輔助管理類應(yīng)用
輔助管理類的應(yīng)用是應(yīng)用在賓館、商場(chǎng)等服務(wù)性質(zhì)的企業(yè)當(dāng)中,
為了了解客戶行為,把握市場(chǎng)定位,是進(jìn)一步提高服務(wù)水平的參考依據(jù)。這類應(yīng)用包括人數(shù)統(tǒng)計(jì)、人流控制、注意力控制和交通控制等。
近年來(lái),隨著用戶對(duì)遠(yuǎn)程監(jiān)控、管理和高質(zhì)量圖像的需求增加,監(jiān)控系統(tǒng)網(wǎng)絡(luò)化的趨勢(shì)明顯。例如在恐怖襲擊、暴亂和公共安全破壞案件中,常常需要高清智能視頻圖像作為案件佐證材料。同時(shí)監(jiān)控系統(tǒng)的智能化是不可避免的發(fā)展趨勢(shì),網(wǎng)絡(luò)化、數(shù)字化的需求也促進(jìn)了智能化的需求。在實(shí)際應(yīng)用中,已經(jīng)成功開(kāi)發(fā)的智能視頻監(jiān)控系統(tǒng)的功能常常局限于單一特定的領(lǐng)域,如目標(biāo)檢測(cè)、目標(biāo)跟蹤或者人臉識(shí)別,集成多種功能的完整系統(tǒng)尚不多見(jiàn)。目前,智能視頻監(jiān)控系統(tǒng)還不能完全自動(dòng)化,特別在異常行為檢測(cè)和報(bào)警的相關(guān)應(yīng)用中,仍需不斷的降低誤報(bào)率、提高檢測(cè)的準(zhǔn)確性。
參考文獻(xiàn)
[1]Comaniciu D.An Algorithm for Data-Driven Bandwidth Selection[J].IEEE Transactions on Pattern Analysis & Machine Intelligence,2003,25(2):281-288.
[2]Morimoto T,Kiriyama O,Harada Y,et al.Object tracking in video pictures based on image segmentation and pattern matching[C]//IEEE International Symposium on Circuits and Systems.IEEE,2005:3215-3218 Vol.4.
[3]Weng S K,Kuo C M,Tu S K.Video object tracking using adaptive Kalman filter[J]. Journal of Visual Communication & Image Representati on,2006,17(6):1190-1208.
[4]Zin T T,Tin P,Toriu T,et al.A Markov Random Walk Model for Loitering People Detection[C]//Sixth International Conference on Intelligent Information Hiding and Multimedia Signal Processing.IEEE Computer Society,2010:680-683.
[5]ChungHsien Huang,YiTa Wu,MingYu Shih.Unsupervised Pedestrian Re-identification for Loitering Detection[C]//Advances in Image and Video Technology, Third Pacific Rim Symposium,PSIVT 2009,Tokyo,Japan,January 13-16,2009.Proceedings.2009:771-783.
[6]劉強(qiáng).智能視頻監(jiān)控中幾種異常行為檢測(cè)研究[D].安徽大學(xué),2012.
[7]朱旭東,劉志鏡.基于主題隱馬爾科夫模型的人體異常行為識(shí)別[J].計(jì)算機(jī)科學(xué),2012, 39(3):251-255.
高華玲(1980—),碩士,講師,研究方向:信息隱藏、計(jì)算機(jī)視覺(jué)、語(yǔ)義分析。
項(xiàng)目基金:三亞市院地合作項(xiàng)目(No.2013YD43)、三亞學(xué)院校級(jí)一般項(xiàng)目(No.XYZZ1319)。
作者簡(jiǎn)介: