邵 恒,王楠溢
(江蘇省測繪工程院,江蘇 南京 210013)
當(dāng)前,我國正處于全面建成小康社會決勝階段,國情省情繼續(xù)發(fā)生深刻變化,經(jīng)濟發(fā)展進入新常態(tài),國土開發(fā)利用與保護面臨重大機遇和嚴峻挑戰(zhàn),必須順應(yīng)國際大勢,立足基本國情,把握時代要求,科學(xué)研判發(fā)展形勢。如何全面、準(zhǔn)確、及時地掌握國土資源的數(shù)量、質(zhì)量、分布及其變化趨勢,進行合理開發(fā)和利用,直接關(guān)系到國民經(jīng)濟的可持續(xù)發(fā)展。
智慧國土視頻監(jiān)控系統(tǒng)是綜合運用計算機、圖像處理、模式識別、網(wǎng)絡(luò)監(jiān)控、網(wǎng)絡(luò)流媒體技術(shù),通過視頻監(jiān)控設(shè)備對耕地、礦區(qū)等國土資源違法違規(guī)易發(fā)多發(fā)區(qū)域及地質(zhì)災(zāi)害頻發(fā)區(qū)域進行實時監(jiān)控,并對視頻監(jiān)控結(jié)果進行自動識別、判斷、處置的一種輔助管理工具[1]。運動目標(biāo)提取是智能視頻監(jiān)控的關(guān)鍵,識別出的運動目標(biāo)既可以作為后續(xù)目標(biāo)跟蹤的初始位置[2],也可以作為敏感監(jiān)控區(qū)域。
最典型的運動相機中運動目標(biāo)提取算法基于對背景模型進行拓展:它通過使用多種圖像配準(zhǔn)技術(shù),將若干視頻幀拼接建立起全景背景模型,將當(dāng)前視頻幀匹配到全景模型相應(yīng)位置,從而將問題轉(zhuǎn)化為固定相機運動目標(biāo)提取問題[3-6]。然而這種方法存在背景建模困難、圖像拼接有誤差、計算時間耗費量大、實時性差等問題。
本文提出用一種新的魯棒的運動目標(biāo)提取算法以解決傳統(tǒng)方法中存在的問題。該算法能在不建立全景背景模型基礎(chǔ)上,魯棒的在運動相機中檢測運動目標(biāo),并且支持實時在線檢測,通過與一系列圖像預(yù)處理方法配合使用,能夠提高檢測效率。
本技術(shù)較為關(guān)鍵的部分是求出背景模型和當(dāng)前視頻幀之間未能匹配上的特征點的密度估計(圖1)。
圖1 算法流程注:L1、L2代表特征點的坐標(biāo),L1′是L1經(jīng)過配準(zhǔn)后的特征點坐標(biāo),D1、D2分別代表兩張圖像特征點的描述子。
傳統(tǒng)的運動相機目標(biāo)檢測方法在建立背景模型時需要對相關(guān)參數(shù)進行假設(shè),因此存在準(zhǔn)確性較差的問題,而建立參數(shù)相關(guān)的背景模型并不是運動目標(biāo)檢測所必需的。本算法在PTZ相機所需要重點監(jiān)控的若干位置中選取一系列經(jīng)過配準(zhǔn)圖像作為初始背景模型,從而縮短了建立背景模型的學(xué)習(xí)時間,提高了算法運算效率。
該算法第一步需要在背景模型與當(dāng)前視頻幀中提取關(guān)鍵點。算法采用Harris角點作為圖像關(guān)鍵點,設(shè)置較低閾值使得Harris角點能夠盡量遍布整個圖像。算法采用SURF[6]作為關(guān)鍵點的局部特征描述子。
完成圖像配準(zhǔn)后,需要對特征點進行匹配來進行后續(xù)的背景減除。在這一階段,算法并不是簡單將背景模型特征點和當(dāng)前視頻幀特征點進行匹配的,而對于每一幀圖像,對背景模型與當(dāng)前視頻幀特征點的合集進行運算。
完成特征點匹配后,未匹配成功的特征點將被視為前景的一部分。算法使用非參數(shù)估計的方法對視頻幀的每一個像素點建立未匹配成功的特征點概率密度估計,從而對視頻幀像素點進行分析。算法通過使用核密度估計[7]方法得到概率密度估計函數(shù)。
假設(shè)(p1,…,pn)為N個未匹配的特征點,對于像素x點,其概率密度估計函數(shù)為:
(1)
式(1)中,K是用作估計像素點概率密度的核函數(shù),參數(shù)h用來平滑像素點x鄰域?qū)λ淖饔?。算法選擇高斯核函數(shù)作為估計用的核函數(shù):
(2)
相對dh,可以發(fā)現(xiàn)Ndh與圖像中實際檢測出的特征點數(shù)量無關(guān),因此更傾向于使用Ndh作為分類的參數(shù)。
由于背景處于不斷變化中,算法需要考慮背景模型的更新問題。其核心問題在于如何用當(dāng)前視頻幀中被分類為背景的像素點替換背景模型中同樣位置的點。算法采用以下規(guī)則對背景進行更新:
若Ndh>s,
bgn(x)=bgn-1(x)
(3)
否則:
(4)
從式(3)—(4)可以看出,算法采用的更新規(guī)則可歸納為2方面:① 對于當(dāng)前視頻幀中被檢測為前景的點,將不對背景中相同位置的點進行更新;② 對于未被檢測為前景的點,采用較低的學(xué)習(xí)率對背景進行更新,以保證背景更新的平滑度,并減少由光照突然變化而增多的特征點,降低背景減除的誤檢率。
為驗證以上算法的有效性,本文選取若干PTZ攝像機拍攝的視頻進行驗證。每個視頻幀序列包含不同的運動目標(biāo)數(shù)量、光照情況和攝像機高度,視頻幀分辨率為320×420。為了展示該算法的有效性,本文將結(jié)果與一些傳統(tǒng)的移動相機運動目標(biāo)檢測算法[7]進行比較(圖2—3)。
圖2 驗證結(jié)果
圖3 驗證結(jié)果
由圖2—3得出,算法能明顯減少圖像配準(zhǔn)錯誤,對光照突然變化、攝像頭突然移動有較好魯棒性。
從檢測結(jié)果可以直觀看出,本文提出的基于特征點概率密度匹配的算法較傳統(tǒng)建立全景模型的算法能更好去除噪聲,檢測結(jié)果更有效(表1—2)。
為了衡量算法檢測效率,綜合統(tǒng)計不同算法的檢測速度(FPS),得到檢測效率統(tǒng)計表(表3)和內(nèi)存占用情況統(tǒng)計表(表4)。
表1 去除噪點精度統(tǒng)計
表2 去除偽前景精度統(tǒng)計
表3 檢測效率統(tǒng)計
表4 內(nèi)存占用情況統(tǒng)計
(1)針對如何在PTZ相機監(jiān)控視頻中快速檢測運動目標(biāo)這一難題,提出了一種新方法:通過將背景模型與當(dāng)前視頻幀特征點進行匹配建立了關(guān)鍵點概率密度估計函數(shù),根據(jù)該函數(shù)能較快速、準(zhǔn)確地對視頻幀數(shù)據(jù)進行前景檢測。
(2)該方法在國土視頻巡查監(jiān)控實際使用中也取得了較好效果,解決了傳統(tǒng)需要建立全景模型的方法所產(chǎn)生的諸如初始化緩慢、計算量龐大、圖像配準(zhǔn)不精確,對光照變化魯棒性差等多種問題。今后,可以將該方法更深入應(yīng)用到可疑物體跟蹤監(jiān)控、自動預(yù)警等“智慧國土”相關(guān)領(lǐng)域中,從而有效提高國土監(jiān)控的智能化程度。
[1] 于麗娜.國土資源執(zhí)法監(jiān)察視頻監(jiān)控網(wǎng)建設(shè)五點建議[J].中國土地,2013(3):19-21.
[2] Wang,J.,Bebis,G.,Nicolescu,M.,ect. Improving target detection by coupling it with tracking[J]. Machine Vision and Applications,2009,20(4):205-223.
[3] Guillot,C.,Taron,M.,Sayd,P.,Pham,ect. Background subtraction adapted to ptz cameras by keypoint density estimation[J]. Machine Vision and Applications, 2009,20(4):1-10.
[4] Hayman,E.,Eklundh,J.O.Statistical background subtraction for a mobile observer[J]. Computer Vision,2003(1):67-74.
[5] Kang,S.,Paik,J.,Kosehan,A.,Abidi, etc, Real-time video tracking using ptz cameras[J]. Proceedings of the SPIE 6th International conference on Quality Control by Artificial Vision 5132. 2003(4):103-111.
[6] Herbert Bay,Andreas Ess,Tinne Tuytelaars,Luc Van Gool “SURF: Speeded Up Robust Features”[J]. Computer Vision and Image Understanding (CVIU), 2008,110(3):346-359.
[7] 王國印,郭彥輝.基于改進GMM的動態(tài)背景建模[J].測繪,2016,39(5):217-219.