姬貫新 周利莉
(解放軍信息工程大學(xué)信息工程學(xué)院,鄭州,450002)
智能視頻監(jiān)控技術(shù)是近些年研究的一個熱點,它賦予監(jiān)控系統(tǒng)觀察分析場景內(nèi)容的能力,使其能夠更加智能化,能夠在幾乎不需要人為干預(yù)的情況下對攝像機拍攝的視頻序列進行自動分析并做出及時反應(yīng)。因此,該技術(shù)已經(jīng)廣泛應(yīng)用于社會的各個方面,例如交通、軍事邊防、機場、銀行、視頻會議、商業(yè)、工業(yè)等。一個完整的智能視頻監(jiān)控系統(tǒng)主要包括監(jiān)控視頻獲取、圖像恢復(fù)超分辨率重建、目標檢測、目標分類、目標跟蹤、視頻內(nèi)容分析理解等流程[1]。隨著近些年智能監(jiān)控系統(tǒng)的廣泛應(yīng)用,人們發(fā)現(xiàn)監(jiān)控系統(tǒng)中出現(xiàn)了大量的干擾,嚴重影響了監(jiān)控系統(tǒng)后續(xù)流程的監(jiān)控效果,甚至使整個監(jiān)控系統(tǒng)失去作用。尤其是在大型監(jiān)控系統(tǒng)中,攝像機的數(shù)目繁多,當(dāng)一個或多個攝像機出現(xiàn)嚴重的干擾時很難被及時發(fā)現(xiàn),對于某些關(guān)鍵場所,這些干擾甚至?xí)斐刹豢赏旎氐膰乐負p失,如銀行、軍事基地、交通狀況等。因此,如何實時準確地檢測出監(jiān)控系統(tǒng)中的各種干擾并將其分類以便及時處理是目前急需解決的重要問題。
監(jiān)控系統(tǒng)中的干擾主要來自3方面,一是監(jiān)控系統(tǒng)中視頻本身信號在采集、傳輸?shù)冗^程中產(chǎn)生的噪聲或監(jiān)控系統(tǒng)出現(xiàn)故障;二是攝像機所監(jiān)控場景的客觀環(huán)境變化如天氣、光照等引起的干擾;三是不法分子為了達到一些不可告人的目的而進行的蓄意破壞或干擾。一般來說,常見的干擾類型主要有:被轉(zhuǎn)動、抖動、被遮擋、失焦、亮度異常(過曝光或曝光不足)、偏色、噪聲污染等。
目前,干擾檢測的主要方法有背景減法和相鄰幀差法兩種。背景減法利用攝像機監(jiān)控場景固定的特點,通過檢測背景圖像是否變化來檢測干擾;而相鄰幀差法則利用視頻中相鄰兩幀圖像的差異變化情況來檢測干擾。Ribinck等人[2]提出一種基于長短緩存結(jié)構(gòu)的相鄰幀差法,該算法用顏色直方圖和邊緣直方圖度量視頻幀間的差異,一定程度上降低了誤報率,但計算量較大,實時性一般;王寶君[3]在文獻[2]的基礎(chǔ)上采用圖像的角點特征檢測干擾,取得了一定的效果,但計算量仍然較大。Anil[4]利用背景減法和小波變換對遮擋、失焦等干擾類型進行了有效的檢測;Saglam[5]在Anil的基礎(chǔ)上增加了對轉(zhuǎn)動干擾的檢測。徐璐[6]依據(jù)干擾發(fā)生時背景圖像更新的像素比例較高的特性,利用混合高斯模型的背景消除法來檢測干擾,取得了較好的效果。
綜上所述,目前的檢測算法雖然能夠較好地檢測出干擾,但沒有識別出干擾的類型。在實際應(yīng)用中,人們更期待監(jiān)控系統(tǒng)能夠識別出其類型以便監(jiān)控系統(tǒng)或工作人員及時做出相應(yīng)的處理。本文對被遮擋、失焦、亮度異常、偏色、噪聲污染等5種干擾分別提出有效的特征,進行分類檢測和識別。實驗表明,本文算法對5種干擾具有較好的檢測和識別效果,且能夠滿足監(jiān)控系統(tǒng)實時性的要求。
當(dāng)監(jiān)控系統(tǒng)不存在干擾時,視頻圖像的內(nèi)容變化較小;當(dāng)出現(xiàn)干擾時,干擾圖像的內(nèi)容變化較大。因此,本文對5種干擾的特點進行分析,有針對性地提取特征,進行分類檢測和識別。
遮擋干擾一般是由于某些不法分子的刻意破壞而造成的,如在鏡頭表面覆蓋異物等。當(dāng)監(jiān)控系統(tǒng)正常時,由于攝像機監(jiān)控的場景范圍較大,圖像內(nèi)容豐富,信息量較大,其灰度級分布范圍較廣;當(dāng)發(fā)生遮擋干擾時,由于遮擋物覆蓋在鏡頭表面,圖像包含內(nèi)容較少,其動態(tài)范圍較小,灰度級主要集中在某個值附近,像素間的相關(guān)性較強。
圖1為正常圖像和攝像機被不同物體遮擋的圖像。圖2為對應(yīng)的灰度直方圖,可以看出:遮擋圖像的灰度級比較集中,其峰值與正常圖像相比明顯增大。圖3為對應(yīng)的灰度圖像的差分直方圖,可以看出:與正常圖像相比,遮擋圖像像素間的相關(guān)性增強,其灰度圖像差分直方圖灰度級在0處的值(即峰值)變大。因此,灰度圖像直方圖和差分直方圖的峰值能夠較好地檢測遮擋干擾。
圖1 遮擋圖像
設(shè)第n幀圖像為fn(x,y),其灰度直方圖為Hi(fn),0≤i≤32,i為經(jīng)過量化后的圖像灰度級;其4個方向的差分直方圖分別為為差分圖像的灰度級。由于差分直方圖的峰值在0處,因此本文采用式(1)衡量圖像的相關(guān)性。
圖2 遮擋圖像灰度直方圖
式中,max(Hi(fn))為第n幀灰度直方圖的峰值,能夠較好地代表圖像的主要灰度級,EH(fn)為第n幀灰度圖像4個方向差分圖像直方圖峰值的平均值,較好地表征了圖像的相關(guān)性。當(dāng)DHn>th1時,則判定發(fā)生遮擋干擾。
圖3 遮擋圖像灰度差分直方圖
當(dāng)監(jiān)控系統(tǒng)正常時,其采集的視頻圖像邊緣輪廓清晰可辨,高頻分量較高。當(dāng)攝像機發(fā)生失焦時,圖像會變得比較模糊,高頻分量較少。失焦檢測換言之為圖像清晰度評價。圖像清晰度評價函數(shù)在自動調(diào)焦領(lǐng)域具有較為長久的發(fā)展,其應(yīng)用比較成熟,其主要的評價函數(shù)有Tenengrad函數(shù)、能量函數(shù)、Brenner函數(shù)、方差函數(shù)、拉普拉斯函數(shù)、頻譜評價函數(shù)、熵評價函數(shù)、小波變換評價函數(shù)、神經(jīng)網(wǎng)絡(luò)評價函數(shù)等[7-9]。綜合分析各種清晰度評價函數(shù)的特點,頻譜函數(shù)性能較好,對其他干擾敏感度較低,且快速傅里葉變換(Fast Fourier transform,F(xiàn)FT)算法在硬件上的實現(xiàn)保證了算法能夠保證滿足實時性的要求,因此本文選擇頻譜函數(shù)評價圖像的清晰度。
設(shè)第n幀圖像為fn(x,y),大小為M×N,其傅里葉變換為
式中:μ=0,1,2,…,M-1;v=0,1,2,…,N-1。
其高頻信息量為
式中:G(μ,v)是高斯低通濾波器,能夠?qū)⒏哳l分量從圖像的頻譜中分離出來,HFn是第n幀圖像的高頻值的總和。
則定義檢測失焦干擾的特征為
在實際應(yīng)用中,為了便于使用FFT算法,提高運算速度,一般取圖像中心寬度為M=N=128的塊作計算,代表圖像的高頻含量。
當(dāng)監(jiān)控視頻中出現(xiàn)失焦干擾時,HFn減小,DFn變大。因此,DFn能夠較好地表征失焦時圖像高頻分量的變化情況。當(dāng)DFn>th2時,則判定出現(xiàn)失焦干擾。
畫面亮度異常是指攝像機因曝光不足或曝光過量導(dǎo)致的圖像動態(tài)范圍變小,從而使得圖像細節(jié)損失的現(xiàn)象。圖4為正常圖像和曝光過量圖像,圖5為其對應(yīng)的灰度直方圖。觀察發(fā)現(xiàn),當(dāng)圖像曝光正常時,其灰度圖像動態(tài)范圍廣泛;當(dāng)圖像曝光過量時,圖像灰度在255一側(cè),像素數(shù)目激增,出現(xiàn)溢出,靠近0一側(cè)像素數(shù)目較少,甚至為0,從而導(dǎo)致圖像的動態(tài)范圍變小,當(dāng)出現(xiàn)曝光不足時則相反。與正常圖像相比,亮度異常圖像的灰度直方圖出現(xiàn)一定的平移,其直方圖寬度變小,灰度級0和255的像素數(shù)目級驟減或驟增,兩者之差變大。
設(shè)第n幀圖像的灰度直方圖為Hi(fn),直方圖的寬度為Δω
當(dāng)圖像亮度異常時,Δω減小增大,同時增大。DMn只對亮度異常敏感,對其他干擾不敏感,能夠較好地表征圖像亮度異常時的變化情況。當(dāng)DMn>th3時,則判定監(jiān)控視頻中出現(xiàn)亮度異常干擾。
顏色是圖像的重要特征,如果監(jiān)控視頻中出現(xiàn)偏色現(xiàn)象,將對目標的檢測、分類和跟蹤等算法造成嚴重的影響,甚至導(dǎo)致算法失效。傳統(tǒng)的圖像偏色檢測算法主要有直方圖法、灰度平衡法、白平衡法等[10-13],這些算法均是基于單幅圖像的,沒有參考圖像,且大部分算法都有一定的前提假設(shè)。當(dāng)不滿足假設(shè)條件時,算法完全失效,造成嚴重的誤判現(xiàn)象。當(dāng)視頻中出現(xiàn)偏色時,相鄰幀圖像的內(nèi)容變化較小,其灰度圖像只在亮度上存在差異,像素間的相關(guān)性變化不大。
圖4 亮度異常圖像
圖5 亮度異常圖像灰度直方圖
設(shè)第n幀圖像3個顏色通道的均值分別為相鄰兩幀圖像的顏色差異為
式中:ΔCn為相鄰兩幀圖像的顏色差異,ΔEHn為相鄰兩幀圖像的相關(guān)性差異,EH(fn)用式(1)計算可得。當(dāng)出現(xiàn)其他干擾時,ΔCn和ΔEHn均變化較大;當(dāng)圖像出現(xiàn)偏色時,ΔCn會突然增大,ΔEHn變化不大。因此,DCn對偏色干擾較為敏感,而對其他干擾敏感度較低,能夠衡量圖像是否出現(xiàn)偏色現(xiàn)象。當(dāng)DCn>th4時,則判定產(chǎn)生偏色干擾。
在監(jiān)控系統(tǒng)中,視頻畫面經(jīng)常遇到各種各樣的噪聲,導(dǎo)致監(jiān)控系統(tǒng)后續(xù)流程受到嚴重影響。當(dāng)圖像中存在噪聲時,圖像的隨機性增強,像素間的相關(guān)性較正常圖像變?nèi)??;叶裙采仃囀墙⒃诠录艌D像的二階組合條件概率密度函數(shù)的基礎(chǔ)上,通過計算圖像中有某種位置關(guān)系的亮點灰度之間的相關(guān)性,來反映圖像在方向、間隔、變化幅度及快慢上的綜合信息。因此,灰度共生矩陣能夠較好地描述圖像像素間的相關(guān)性,實現(xiàn)對圖像噪聲的檢測。
灰度圖像共生矩陣的定義為從圖像灰度值為i的像素(x,y)出發(fā),統(tǒng)計與其距離為d,灰度值為j的像素(x+a,y+b)同時出現(xiàn)的頻度p(i,j,d,θ),其數(shù)學(xué)表達式為
式中:#(x)表示集合x中元素的個數(shù),θ為相距為d兩像素與橫坐標軸的夾角,是灰度共生矩陣的生成方向,通常選取0°,45°,90°,135°四個方向。對比度是基于灰度共生矩陣的二次統(tǒng)計量,度量了矩陣值的分布情況和圖像局部變化。其數(shù)學(xué)定義如下
式中g(shù)為圖像的灰度級。由于圖像256個灰度級產(chǎn)生的灰度共生矩陣計算量大,一般在計算之前先將圖像的灰度范圍從[0,255]壓縮到[0,32]。
為了能夠較好地表征圖像的相關(guān)性,本文設(shè)d=1,取4個方向灰度共生矩陣的對比度的平均值來表示圖像的對比度。設(shè)第n幀圖像的灰度共生矩陣4個方向的對比度分別為,則其均值為
圖6為正常圖像與被不同程度噪聲污染的圖像。圖7為其對應(yīng)的0°方向灰度共生矩陣。
觀察可知:與正常圖像相比,噪聲污染圖像的隨機性增強,相關(guān)性明顯減小,灰度共生矩陣p(i,j,d,θ)遠離對角線的元素值波動明顯,且噪聲越大,波動越劇烈,灰度共生矩陣的對比度越大。因此,p(i,j,d,θ)的對比度能夠較好地檢測圖像中的噪聲。當(dāng)DWn>th5時,則判定監(jiān)控視頻中存在噪聲。
圖6 噪聲污染圖像
圖7 噪聲污染圖像灰度共生矩陣
本文分析了各種干擾類型的特點,分別提取了檢測特征,在一定程度上起到了分類的效果。然而某些特征間存在交互影響,為了消除特征間的相互影響,進一步提高檢測率,本文采取了一定的檢測分類策略,檢測分類流程如圖8所示。
檢測閾值的選擇對檢測效果有著重要的影響,如何確定閾值是本文檢測方法的關(guān)鍵之一。在監(jiān)控系統(tǒng)中,攝像機的數(shù)目非常多,其監(jiān)控的場景內(nèi)容也不盡相同,無法選擇統(tǒng)一的閾值。此外,通過訓(xùn)練獲取的閾值,使算法的實用性受到了極大地限制。因此,檢測方法應(yīng)具有一定的自適應(yīng)性,能夠根據(jù)不同的監(jiān)控場景自主選擇閾值進行檢測和分類。
設(shè)D(fn)為本文針對不同干擾類型所提取的特征,當(dāng)D(fn)>th=m+sσ時,則判定產(chǎn)生該類型干擾。m和σ分別為向 量X= {D(fn-k),D(fn-k+1),D(fn-k+2),…,D(fn)}的均值和標準方差,根據(jù)當(dāng)前幀視頻實時更新。
圖8 檢測分類流程圖
k值越小,閾值計算時間越短,但閾值選擇偶然性越強,檢測性能越差;k值越大,閾值計算時間越長,但閾值選擇越穩(wěn)定,檢測性能越好。一般而言,取k=10~30較為合適。s是一個比較小的數(shù),但當(dāng)s過小時,容易造成誤檢,反之,容易造成漏檢。本文實驗中根據(jù)經(jīng)驗選k=20,s=2。
本文方法對不同類型的干擾分別提取特征,所提特征只對一種類型干擾敏感,對其他類型干擾敏感度較低。與正常情況相比,產(chǎn)生該類型干擾時,所對應(yīng)的特征值變化明顯,采用統(tǒng)一的參數(shù)值進行閾值自適應(yīng)更新時,對檢測效果影響較小,增加了檢測方法的通用性和適用范圍。
目前還沒有統(tǒng)一公開的實驗視頻,本文采用文獻[2]和文獻[5]的實驗視頻與本實驗室拍攝的監(jiān)控視頻共16種監(jiān)控場景進行測試實驗,其中包含5種不同類型的干擾,共計156段,干擾類型數(shù)目具體分布如表1所示。
表1 干擾類型數(shù)目分布
實驗視頻規(guī)格為320像素×240像素,實驗平臺為聯(lián)想臺式PC機,Intel Pentium(R)4CPU,主頻2.93GHz,開發(fā)環(huán)境為 VC++6.0。實驗中,本文方法基本達到實時性的要求,沒有明顯的時間延遲。將檢測效果較好的文獻[2]和文獻[5]方法仿真與本文方法進行對比。其中文獻[2]對5種干擾均進行了檢測,文獻[5]對遮擋、失焦、轉(zhuǎn)動3種干擾進行了檢測,而本文方法沒有實現(xiàn)對轉(zhuǎn)動干擾的檢測。為了保證比較的公平性,3種方法均在相同條件下進行比較,實驗結(jié)果如表2和表3所示。
表2 與文獻[2]方法對比結(jié)果
由表2可以看出:文獻[2]方法虛警數(shù)目較少,漏警數(shù)目較多。原因在于文獻[2]所采用的長短緩存結(jié)構(gòu)有效地過濾了監(jiān)控視頻中的偶然變化,減少了虛警數(shù)目;同時由于對含有輕微噪聲圖像的敏感度較低,且算法不具有自適應(yīng)性,不同的監(jiān)控場景采用了統(tǒng)一的閾值,導(dǎo)致其漏警數(shù)目較多。本文方法與文獻[2]相比,虛警數(shù)目較多,漏警數(shù)目較少。原因在于本文方法所提特征較多,多個特征同時檢測,且算法具有自適應(yīng)性,有效地降低了漏警率;同時由于檢測的干擾變化突然,視頻中存在的偶然變化易被本文方法判定為干擾,從而導(dǎo)致虛警數(shù)目較多。尤其是在室內(nèi)監(jiān)控環(huán)境,由于目標在圖像中的比例較大,目標活動容易造成背景圖像變化劇烈,容易造成誤判。此外,本文方法具有自適應(yīng)性,適用范圍較為廣泛。
表3 與文獻[5]方法對比結(jié)果
由表3可以看出:文獻[5]方法和本文方法在檢測遮擋和失焦干擾方面性能接近。造成兩種方法虛警的原因均是因為室內(nèi)監(jiān)控環(huán)境中目標的運動影響所致;漏警的原因是因為攝像機被部分遮擋,與正常圖像差別不大。此外,兩種方法均具有自適應(yīng)性,適用范圍廣。
目前還沒有相關(guān)文獻對各種類型的干擾進行分類,本文對各種干擾分類的實驗結(jié)果如表4所示。
由表4可以看出:針對5種不同的干擾,本文方法的分類正確率為92.2%,基本能夠滿足監(jiān)控系統(tǒng)的要求。實驗中測試發(fā)現(xiàn),當(dāng)用紋理簡單的物體(如白紙)遮擋攝像機、攝像機嚴重失焦、圖像嚴重偏色時,本文方法容易判決錯誤,分類效果不佳。
表4 本文方法分類結(jié)果
本文對視頻監(jiān)控系統(tǒng)中的遮擋、失焦、亮度異常、偏色和噪聲5種干擾分別有針對性地提取了特征。采用多種特征同時檢測干擾,有效地降低了漏警率,并對干擾類型進行了分類。與以往方法相比,本文方法在保證優(yōu)異的檢測性能的同時,達到了較好的分類效果。除此之外,閾值的自適應(yīng)選取使得本文方法的適用范圍更廣,具有重要的應(yīng)用價值。如何進一步提高分類正確率是下一步的研究方向。
[1]王素玉,沈蘭蓀.智能視覺監(jiān)控技術(shù)研究進展[J].中國圖象圖形學(xué)報,2007,12(9):1505-1514.Wang Suyu,Shen Lansun.Intelligent visual surveillance technology:A survey[J].Journal of Image and Graphics,2007,12(9):1505-1514.
[2]Ribinck E,Atev S,Masoud O.Real-time detection of camera tampering[C]//Proceedings of the IEEE International Conference on Video and Signal Based Surveillance.Sydney,Australia:IEEE,2006:10-16.
[3]王寶君,胡福橋.基于角點的監(jiān)控攝像頭檢測[J].計算機應(yīng)用及軟件,2010,27(5):243-259.Wang Baojun,Hu Fuqiao.Tamper detection for surveillance camera based on corner[J].Computer Applications and Software,2010,27(5):243-259.
[4]Aksay Anil,Temizel Alptekin.Camera tamper detection using wavelet analysis for video surveillance[C]//Advanced Video and Signal Based on Surveillance.London,UK:[s.n.],2007:558-562.
[5]Saglam A,Temizel A.Real-time adaptive tamper detection for video surveillance[C]//Advanced Video and Signal Based on Surveillance.Genoa,Italy:[s.n.],2009:430-435.
[6]徐璐,胡福橋.基于混合高斯模型的攝像機移動檢測[J].計算機應(yīng)用及軟件,2010,27(6):233-235.Xu Lu,Hu Fuqiao.Detecting movement of video camera using Gaussian mixture models[J].Computer Applications and Software,2010,27(6):233-235.
[7]Shen C,Chen H.Robust focus measure for low contrast images[C]//International Conference on Consumer Electronics.Las Vegeas,USA:[s.n.],2006:69-70.
[8]Gmitro A F,Rodriguez J.Image classification based on focus[C]//International Conference on Image Processing.San Diego:[s.n.],2008:397-400.
[9]陳國金,朱妙芬,張克松.圖像調(diào)焦過程的清晰度評價函數(shù)研究[J].數(shù)據(jù)采集與處理,2009,24(2):165-169.Chen Guojin,Zhu Miaofen,Zhang Kesong.Image definition evaluation function in auto-focusing process[J].Journal of Data Acquisition &Processing,2009,24(2):165-169.
[10]徐曉昭,蔡軼珩.基于圖像分析的偏色檢測及顏色校正方法[J].測控技術(shù),2008,27(5):10-12.Xu Xiaozhao,Cai Yiheng.Color cast detection and color correction methods based on image analysis[J].Measurement & Control Technology,2008,27(5):10-12.
[11]Seong Dae Kim,Wook Joong Kim.Automatic white balance based on adaptive feature selection with standard illuminants[C]//International Conference on Image Processing.San Diego:[s.n.],2008:485-488.
[12]Cai Yiheng,Cao Meiling.Color correction for digital images based on the finite-dimensional linear-model[C]//International Conference on Computer Science and Software Engineering.Wuhan,China:[s.n.],2008:313-317.
[13]Doutre C,Nasipoulos P.Color correction preprocessing for multiview video coding[J].IEEE Transactions on Circuits and Systems for Video Technology,2009,19(9):1400-1404.