鄭孜祎
中國(guó)人民公安大學(xué),北京,100038
如今,大量監(jiān)控系統(tǒng)已出現(xiàn)在人們的生活中,其組成部分包括電視墻與相關(guān)監(jiān)控器。雖然工廠、公共場(chǎng)所等機(jī)構(gòu)均對(duì)視頻監(jiān)控系統(tǒng)予以了運(yùn)用,但也只是單純的錄像操作而已,只是為了讓后續(xù)的取證管理更加方便,進(jìn)而也就降低了圖像價(jià)值。而就算事后取證是必然,但如果能事前預(yù)警無(wú)疑是最好的,對(duì)此便需要計(jì)算機(jī)系統(tǒng)對(duì)監(jiān)控視頻的實(shí)際內(nèi)容展開(kāi)快速分析。目前,隨著科學(xué)技術(shù)的發(fā)展速度不斷加快,計(jì)算機(jī)的相關(guān)性能也越來(lái)越完善,也使得圖像處理技術(shù)、計(jì)算機(jī)視覺(jué)等在智能監(jiān)控系統(tǒng)中得到了充分應(yīng)用[1]。
智能視頻監(jiān)控系統(tǒng)以圖像處理、計(jì)算機(jī)視覺(jué)技術(shù)和模式識(shí)別為主要手段,將智能視頻分析模塊加入系統(tǒng)中,并通過(guò)計(jì)算機(jī)在數(shù)據(jù)處理方面擁有的強(qiáng)大能力,過(guò)濾畫(huà)面中用不到或是對(duì)正常畫(huà)面產(chǎn)生干擾的信息,監(jiān)控系統(tǒng)主要是發(fā)揮監(jiān)控技術(shù)的優(yōu)勢(shì)將視頻中有價(jià)值的信息抽取出來(lái),當(dāng)發(fā)生異常情況時(shí)立即報(bào)警,該監(jiān)控技術(shù)能夠?qū)ν话l(fā)事件進(jìn)行處理,為警察處理相關(guān)問(wèn)題提供有效幫助[2]。作為人工智能研究領(lǐng)域的一個(gè)分支,計(jì)算機(jī)視覺(jué)技術(shù)可讓映射關(guān)系在圖像和圖像描述間形成,基于此可通過(guò)數(shù)字圖像處理以及分析等方式,理解視頻畫(huà)面中包含的相關(guān)內(nèi)容[3]。
智能視頻監(jiān)控在具體發(fā)展過(guò)程中,需要將傳統(tǒng)視頻監(jiān)控作為基礎(chǔ)。對(duì)于傳統(tǒng)視頻監(jiān)控系統(tǒng)的發(fā)展而言,涉及以下階段。第一,模擬時(shí)代。20世紀(jì)末,模擬閉路視頻監(jiān)控系統(tǒng)等設(shè)備的依賴性極強(qiáng),諸如監(jiān)視器、錄像機(jī)等。圖像在進(jìn)行傳輸時(shí),通常運(yùn)用同軸電纜,涉及無(wú)法遠(yuǎn)程訪問(wèn)等相關(guān)缺點(diǎn)。并且,臃腫的存儲(chǔ)方式也加大了信息查詢與檢索的難度。第二,數(shù)字時(shí)代。20世紀(jì)中期,隨著數(shù)字視頻壓縮編碼技術(shù)的持續(xù)進(jìn)步,形成了將數(shù)字硬盤(pán)錄像機(jī)等作為基礎(chǔ)的半數(shù)字系統(tǒng)。在存儲(chǔ)數(shù)字化的推動(dòng)下,提高了用戶對(duì)視頻信息進(jìn)行處理的能力。第三,網(wǎng)絡(luò)時(shí)代。進(jìn)入新世紀(jì)后,在計(jì)算機(jī)與網(wǎng)絡(luò)技術(shù)更新迭代速度逐漸加快的背景下,人們逐漸加強(qiáng)了對(duì)IP視頻監(jiān)控系統(tǒng)的關(guān)注,其還被稱為網(wǎng)絡(luò)數(shù)字視頻錄像機(jī)系統(tǒng)[4-5]。對(duì)于此系統(tǒng)而言,是將標(biāo)準(zhǔn)TCP/IP協(xié)議作為基礎(chǔ),通過(guò)互聯(lián)網(wǎng)實(shí)現(xiàn)傳播工作,并在流媒體技術(shù)的作用下于網(wǎng)絡(luò)上多路復(fù)用傳輸所采集的信息,同時(shí)借助中央控制服務(wù)器、轉(zhuǎn)發(fā)視頻流等,促使整個(gè)監(jiān)控系統(tǒng)的存儲(chǔ)、調(diào)度、指揮以及授權(quán)控制等功能順利實(shí)現(xiàn)。
2.2.1 安全相關(guān)類(lèi)應(yīng)用
(1)高級(jí)視頻運(yùn)動(dòng)檢測(cè)。系統(tǒng)能夠在惡劣天氣環(huán)境中準(zhǔn)確檢測(cè)單個(gè)、多個(gè)物體的實(shí)際運(yùn)動(dòng)狀況,諸如運(yùn)動(dòng)方向、速度等。
(2)運(yùn)動(dòng)跟蹤。順利檢測(cè)到運(yùn)動(dòng)物體后,立足于物體運(yùn)動(dòng)狀況,結(jié)合攝像機(jī),對(duì)控制指令進(jìn)行自動(dòng)發(fā)送,保證計(jì)算機(jī)能夠自動(dòng)對(duì)物體予以全面跟蹤,若物體經(jīng)過(guò)運(yùn)動(dòng)之后脫離了監(jiān)控區(qū)域,那么會(huì)立即向物體所處區(qū)域的攝像機(jī)進(jìn)行通告,使之對(duì)物體進(jìn)行繼續(xù)跟蹤[6]。
(3)人物面部識(shí)別。對(duì)人物的臉部特征進(jìn)行自動(dòng)識(shí)別,同時(shí)借助對(duì)比數(shù)據(jù)庫(kù)檔案對(duì)身份進(jìn)行識(shí)別與驗(yàn)證,諸如機(jī)場(chǎng)、火車(chē)站等。
(4)車(chē)輛識(shí)別。準(zhǔn)確識(shí)別車(chē)輛形狀、顏色以及車(chē)牌號(hào)碼等信息,然后第一時(shí)間反饋給監(jiān)控人員。在跟蹤被盜車(chē)輛等場(chǎng)景中,這一類(lèi)應(yīng)用發(fā)揮了重要作用。
(5)智能監(jiān)護(hù)。通過(guò)對(duì)正常人動(dòng)作行為的學(xué)習(xí)與鍛煉,當(dāng)家里老人等存在異常狀況時(shí),可迅速檢測(cè)然后發(fā)出警報(bào)。
2.2.2 非安全相關(guān)類(lèi)應(yīng)用
(1)人數(shù)統(tǒng)計(jì)與人群控制。系統(tǒng)能夠?qū)χ付▍^(qū)域中的人流量進(jìn)行全面統(tǒng)計(jì),并對(duì)人群表現(xiàn)出來(lái)的整體運(yùn)動(dòng)特點(diǎn)予以識(shí)別,諸如方向、速度等,預(yù)防產(chǎn)生擁堵的狀況,或是迅速發(fā)現(xiàn)人群表現(xiàn)出來(lái)的反常狀況,主要應(yīng)用于超市、火車(chē)站等場(chǎng)景。
(2)交通流量控制。用于監(jiān)視高速公路或是環(huán)線公路上的交通,完成對(duì)車(chē)流量、平均車(chē)速、違章行車(chē)行為、交通事故的統(tǒng)計(jì)。
圖像增強(qiáng)指的是根據(jù)特定需求突出圖像內(nèi)的某些關(guān)鍵信息,在此基礎(chǔ)上消除無(wú)用信息,有效增強(qiáng)圖像對(duì)比度,優(yōu)化其視覺(jué)效果,更好地進(jìn)行之后的圖像分析。對(duì)該技術(shù)而言,現(xiàn)階段已經(jīng)涉及諸多算法,各類(lèi)算法針對(duì)特殊場(chǎng)景與對(duì)象能夠發(fā)揮出較好的增強(qiáng)作用,但依舊存在自身的缺陷。
圖像增強(qiáng)算法通常來(lái)說(shuō)涉及空域增強(qiáng)以及頻域增強(qiáng)兩種類(lèi)型。前者一般有灰度變換、直方圖均衡、平滑增強(qiáng)以及模板濾波增強(qiáng)等。直方圖均衡算法屬于相對(duì)簡(jiǎn)單、運(yùn)用廣泛的一種算法,然而針對(duì)高照度圖像進(jìn)行處理的過(guò)程中會(huì)存在過(guò)飽和現(xiàn)象,同時(shí)容易增加噪聲,導(dǎo)致圖像整體視覺(jué)效果降低。匹配的改進(jìn)算法主要有自適應(yīng)直方圖均衡、對(duì)比度限制的自適應(yīng)直方圖均衡等,按照?qǐng)D像的局部統(tǒng)計(jì)數(shù)據(jù)對(duì)其灰度動(dòng)態(tài)范圍進(jìn)行調(diào)整,能夠得到更加豐富的細(xì)節(jié),最終實(shí)現(xiàn)圖像增強(qiáng)的目標(biāo)。而從頻域角度來(lái)說(shuō),相關(guān)算法主要有低通濾波、高通濾波、帶通以及帶阻濾波等。圖像變換一般有傅里葉變換、小波變換以及離散余弦變換等。同時(shí),近年來(lái)基于小波變換而逐漸衍生出的Curvelet與Contourlet變換,表現(xiàn)出更高的精度,所以也常常將其運(yùn)用到圖像邊緣以及輪廓信息的表達(dá)過(guò)程中,在很大程度上促進(jìn)了圖像增強(qiáng)效果的提升。在實(shí)踐中針對(duì)紋理細(xì)節(jié)較多的圖像,僅僅進(jìn)行尺度表達(dá)無(wú)法有效符合處理要求,小波變換算法屬于多角度分析算法的典型代表。圖像通過(guò)小波變換細(xì)化為各種尺度的子帶圖像,借助調(diào)整子帶小波系數(shù)來(lái)達(dá)到圖像增強(qiáng)的目標(biāo)。同時(shí),由小波變換理論逐漸衍生出新的圖像多尺度分析理論:曲波變換,這一算法表現(xiàn)出更加精確的辨識(shí)度,有效提高了圖像內(nèi)直線以及曲線的幾何特點(diǎn)表達(dá)能力,可以更為準(zhǔn)確地識(shí)別其中的邊緣細(xì)節(jié)以及噪聲,但是該算法在實(shí)際應(yīng)用中存在復(fù)雜性較高的缺點(diǎn),因此并未得到普及應(yīng)用。
運(yùn)動(dòng)目標(biāo)檢測(cè)屬于視覺(jué)系統(tǒng)以及智能視頻分析系統(tǒng)的重要工作,是現(xiàn)階段的主要研究方向,為后續(xù)的目標(biāo)追蹤、行為分析以及事件檢測(cè)的相關(guān)研究提供了更加豐富的理論和技術(shù)支持。借助運(yùn)動(dòng)目標(biāo)檢測(cè)可以將運(yùn)動(dòng)前景和背景予以分離,將運(yùn)動(dòng)目標(biāo)直接從視頻序列中進(jìn)行提取,最終結(jié)果的優(yōu)劣在很大程度上關(guān)系到后續(xù)算法能否發(fā)揮出實(shí)際作用。同時(shí)針對(duì)智能視頻監(jiān)控來(lái)說(shuō),很多事件檢測(cè)也能夠通過(guò)運(yùn)動(dòng)目標(biāo)檢測(cè)算法予以實(shí)現(xiàn),包括入侵檢測(cè)、人數(shù)統(tǒng)計(jì)以及車(chē)流量統(tǒng)計(jì)等?,F(xiàn)階段主要包含如下幾種。
首先是光流法。該方法是借助于光流方程對(duì)各個(gè)像素點(diǎn)的實(shí)際運(yùn)動(dòng)狀態(tài)進(jìn)行計(jì)算,對(duì)圖像實(shí)施動(dòng)態(tài)分析,通過(guò)這樣的方式獲取目標(biāo)的位置、數(shù)量等信息,在此基礎(chǔ)上實(shí)現(xiàn)對(duì)目標(biāo)的追蹤。另外,這一算法對(duì)噪聲相對(duì)敏感,實(shí)際精準(zhǔn)度不是很高,難以有效掌握目標(biāo)的精確邊界,同時(shí)該方法需要龐大算量支持,無(wú)法大范圍推廣應(yīng)用。
其次是幀差法。這一方法是針對(duì)相鄰兩幀或是多幀圖像差分,隨后通過(guò)閾值分割的手段,超過(guò)閾值像素將其當(dāng)作前景目標(biāo),不超過(guò)的則當(dāng)作背景。幀差法一般來(lái)說(shuō)對(duì)動(dòng)態(tài)環(huán)境表現(xiàn)出更高的適應(yīng)性,然而提取目標(biāo)存在空洞問(wèn)題,也可能出現(xiàn)漏檢的問(wèn)題。
最后是背景差分法。該方法屬于現(xiàn)階段普遍使用的一種,其基本原理是針對(duì)背景實(shí)施建模之后和視頻幀予以對(duì)比,從而獲取差分圖像,其中像素值變化更大的可以判定為前景目標(biāo)。相對(duì)上述兩種方法來(lái)說(shuō),該方法能夠有效實(shí)現(xiàn)實(shí)時(shí)監(jiān)控,同時(shí)檢測(cè)準(zhǔn)確性更高,優(yōu)勢(shì)更大,但實(shí)際檢測(cè)結(jié)果往往受到背景建模環(huán)節(jié)精準(zhǔn)度的影響。在實(shí)施背景建模的過(guò)程中必須充分考慮到具體場(chǎng)景中一些不能預(yù)測(cè)的因素出現(xiàn),比如動(dòng)態(tài)背景、光照變化以及相機(jī)自身抖動(dòng),更加精準(zhǔn)地建模對(duì)于前景目標(biāo)檢測(cè)來(lái)說(shuō)提出了很大的技術(shù)難題,高斯混合模型便屬于非常經(jīng)典的建模策略,可以有效處理光線變化以及背景混亂等問(wèn)題,但這一方法的應(yīng)用必須定期予以更新,還涉及不同參數(shù)的設(shè)置,需要消耗較大算量,難以保證實(shí)時(shí)性的要求。目前普遍使用的建模算法還包括SACON201、ViBe、GMG3P等算法。
圖像匹配技術(shù)屬于諸多領(lǐng)域都會(huì)采用的一項(xiàng)基礎(chǔ)又非常重要的技術(shù),如電子穩(wěn)像、圖像配準(zhǔn)、圖像融合、目標(biāo)識(shí)別和跟蹤以及三維重建等,也是智能視頻監(jiān)控系統(tǒng)重要研究?jī)?nèi)容之一。一般來(lái)說(shuō),圖像匹配方法主要分為兩種,分別是基于灰度相關(guān)匹配與基于特征匹配。前者具有復(fù)雜的算法,對(duì)于圖像間的多個(gè)方面均有較高的敏感度,包括尺度縮放、亮度變化等,缺乏良好的抗噪聲能力。而后者的算法又由兩部分構(gòu)成,即全局特征匹配算法、局部特征匹配,其中全局特征抽取于整個(gè)圖像中,而局部特征則抽取于某個(gè)局部區(qū)域。在檢索領(lǐng)域中,全局特征多用于對(duì)整個(gè)圖像內(nèi)容進(jìn)行描述,比如顏色直方圖的檢索性能就非常好。但圖像混疊以及存在遮擋時(shí)不適合采用全局特征,而需采用局部特征描述。
局部特征具有諸多不變性,體現(xiàn)在旋轉(zhuǎn)、尺度、仿射變換等方面。提取圖像局部特征,主要是提取角點(diǎn)、區(qū)域特征以及斑狀等。提取結(jié)束后,需借助一種有效方法描述相應(yīng)圖形的局部特征。為保證局部特征相似性的度量成功實(shí)現(xiàn),需要采用一種緊湊且完整的局部特征的描述。而其中最具代表性的描述子就是SIFT特征描述子,其性能得到了大家一致的認(rèn)可,在局部特征研究領(lǐng)域該項(xiàng)工作具有里程碑意義。基于SIFT理論研究,還提出了如GLOH、SURF以及PCA-SIFT等其他描述子,但都對(duì)SIFT特征描述子的生成方法予以了借鑒,但在很多方面,如局部特征提取速度、穩(wěn)定性等,也相應(yīng)地改進(jìn)了SIFT特征描述子,獲得的效果較為理想。
綜上所述,相較于傳統(tǒng)意義上的視頻監(jiān)控技術(shù),智能視頻監(jiān)控技術(shù)與之存在很大的不同。傳統(tǒng)的視頻監(jiān)控系統(tǒng)一般只負(fù)責(zé)錄制、存儲(chǔ),而智能視頻監(jiān)控系統(tǒng)則可利用計(jì)算機(jī)視覺(jué)和模式識(shí)別的方案,自動(dòng)分析研究監(jiān)控設(shè)備采集的圖像,同時(shí)定位場(chǎng)景中的目標(biāo)物體,對(duì)其展開(kāi)精確識(shí)別,無(wú)需人為干預(yù),所以在很多方面均擁有良好的應(yīng)用空間。