楊瑞鋒, 黃 山
(四川大學電氣信息學院,成都 610065)
圖像作為人類感知世界的視覺基礎,是人類獲取信息、表達信息和傳遞信息的重要手段。隨著計算機視覺和圖像處理在各個領域內的廣泛應用,運動目標檢測[1]成為當今研究的熱點。近些年來,基于稀疏表示的壓縮感知理論發(fā)展使稀疏表示成為一種有效的數(shù)據(jù)表示方式。低秩矩陣恢復(RPCA)[1]已經(jīng)成為一種流行的數(shù)據(jù)獲取和表示方式,隨著文獻[2]提出矩陣RPCA,開始通過引入稀疏表示從而提高對含有大噪聲和異常點的觀測數(shù)據(jù)的魯棒性。然而隨著現(xiàn)代視頻數(shù)據(jù)的數(shù)據(jù)結構維度增高和更為復雜,為了更好地表達高階數(shù)據(jù)復雜的本質結構,文獻[3]提出張量高階奇異值分解,將矩陣的奇異值分解擴展到張量,為高維數(shù)據(jù)的分析和處理提供有力的支撐。因此,越來越多的研究人員運用張量高階奇異值分解來實現(xiàn)運動目標提取。但是對實驗正則化參數(shù)的調試過程是一項工作量大并且耗時長的工程,研究者們開始關注于正則化參數(shù)的自適應估計?,F(xiàn)有選擇參數(shù)的方法有Morozov’s 偏差準則[4]、廣義交互驗證法(Generalized Cross-Validation,GCV)[5]、Curve法[6]和變分貝葉斯法(Variational Bayes’ Approach)[7]等。文獻[8]中利用Morozov’s 偏差準則實現(xiàn)了基于全變分的圖像去模糊的正則化參數(shù)自適應估計,受此啟發(fā),本文將采用Morozov’s偏差準則實現(xiàn)基于HOSVD的運動目標檢測的正則化參數(shù)自適應估計。
以圖像恢復為例引入Morozov’s偏差準則。一般而言,圖像的退化過程可以表示為
V=KUclean+N
(1)
式中:V為觀測圖像;K為已知的模糊算子的矩陣表示形式;Uclean為原始圖像;N為高斯白噪聲。根據(jù)V估計出Uclean是一個不適定逆問題。用正則化方法求解該問題的最小化方程,即
(2)
式中:J(U)為正則項,U為Uclean的估計值;二次項被稱作數(shù)據(jù)保真項;λ為正則項參數(shù),平衡了保真項和正則項的相對權重。
根據(jù)偏差準則,上述問題的解應該存在于集合中
(3)
式中,c=τmnσ2,τ是一個提前確定的參數(shù),mn表示圖像的大小,σ2表示噪聲方差。當噪聲方差σ2未知時,文獻[9]提出可以通過中值估計方法(Median Absolute Deviation,MAD)估計出σ2。該方法的理論基礎是噪聲小波系數(shù)主要集中在高頻子帶中,因此可以通過高頻子帶系數(shù)近似估計噪聲系數(shù)。另外,中值操作的原因是避免高頻子帶中存在極少數(shù)的大幅度系數(shù)對方差估計[10]造成影響。MAD噪聲水平估計方法的數(shù)學表示為[11]
σ=1.482 6MAD(real(YHH))
(4)
式中:MAD( · )表示求中值;real( · )表示求實部;YHH表示圖像經(jīng)二維小波分解后得到的最高頻子帶的系數(shù)。
在偏差準則下,式(2)問題等價于有約束的優(yōu)化問題,即
(5)
通過拉格朗日定理可以將式(5)有約束問題轉化為式(2)無約束問題。如果U是特定的λ下式(5)的解,那么它也是式(2)的解,用U*(λ)表示式(2)對應的最優(yōu)解。那么,作為式(5)的最小化,有:U*(0)∈S,λ=0或者
張量又稱為多階陣列,是向量和矩陣的高階推廣。其中,零維張量為標量,一維張量為向量,二維張量為矩陣,N階張量表示為A∈RI1×I2×…×IN,其中元素(i1,i2,…,iN)表示為ai1,i2,…,iN。張量也能夠用矩陣形式表示,該過程稱為張量的n-模式展開,是將張量的元素重新排列成矩陣。
張量A與矩陣U∈RJn×In的n-模式積是一個維度為I1×I2×…In-1×Jn×In+1×…×IN的張量,用A×nU表示,其元素為
(6)
通常需要求核張量S,可通過下式求得
S=A×1(U(1))T×2(U(2))T×…×N(U(N))T
(7)
式中:S∈RJ1×J2×…×JN為奇異值分解后得到的核心張量,矩陣U(n)∈RIn×In為將張量A的n-模式展開矩陣A(n)進行SVD分解得到的左酉矩陣,符號×n表示張量與矩陣的n-模式積[12]。
將輸入的I3幀大小為I1×I2×3的RGB圖像序列均轉化為I3幀大小為I1×I2的灰度圖序列,觀測圖像序列表示為三階張量O∈RI1×I2×I3。恢復張量表示的背景部分可由如下凸優(yōu)化問題形式表示,即
(8)
(9)
引入輔助變量A=B,則將上式轉化為如下問題,即
(10)
s.t.>A=B>。
根據(jù)拉格朗日定理,上述有約束優(yōu)化問題的拉格朗日函數(shù)為
(11)
式中:Y1是拉格朗日乘子;β1是正的懲罰參數(shù)。本文采用ADMM來求解上述問題,采用偏差準則,推導出參數(shù)λ和μ的更新公式,每一次迭代中,隨其他變量的更新,參數(shù)λ和μ也會按照固定的規(guī)律不斷更新,直到算法終止。將上述問題分解為以下幾個子問題求解,每次迭代中固定其他變量只更新一個變量,迭代步驟如下。
1) 固定其他變量,更新變量A。
(12)
對奇異值閾值收縮進行張量擴展,通過如下3個步驟求得式(12)的最優(yōu)解。
>;
(13)
② 對S進行軟閾值收縮;
③ 張量重建
(14)
2) 更新變量B和μ。
(15)
對式(15)右邊B求導,令求導后的式子為0,可得
(16)
c(k+1)=τI1I2I3(σ(k+1))2
>。
(17)
根據(jù)上文可得
(18)
如果
(19)
B*(0)∈S1,μ=0,即
(20)
如果
(21)
(22)
(23)
更新變量M,這里引入輔助變量E=M,即
(24)
s.t.>E=M
>。
根據(jù)拉格朗日定理,上述有約束優(yōu)化問題的拉格朗日函數(shù)為
(25)
式中:Y2是拉格朗日乘子;β2是正的懲罰參數(shù)。
3) 更新變量E。
(26)
可通過軟閾值收縮算子Sα(Z)求得最優(yōu)解
(27)
4) 同步驟2),更新變量M和λ。
(28)
(29)
6) 判斷終止條件。
(30)
若式(30)滿足或者達到最大迭代次數(shù),則終止迭代。
7) 輸出表示背景的B(k+1)、表示運動目標的M(k+1);最后對輸出的運動目標部分M進行二值化處理,得運動目標G為
(31)
然后進一步對G進行形態(tài)學中開閉運算,消除運動目標區(qū)域外的噪聲,填充目標區(qū)域內的空洞,最終提取較準確的運動目標。
本文數(shù)據(jù)是從標準的change detection video database (http://www.changedetection.net)數(shù)據(jù)庫中選取4組真實視頻序列進行測試,在相同實驗環(huán)境下,本文方法與近期極具競爭力的魯棒性主成分分析法(RPCA),以及基于迭代張量高階奇異值分解(HOSVD)的運動目標提取方法進行比較。
視頻1的圖片像素大小為180×120。實驗選取80幀進行測試,結果如圖1 所示。
圖1 視頻1運動目標檢測結果Fig.1 Moving target test results of Video 1
視頻2的像素大小為240×140。實驗中選取80 幀進行測試,結果如圖2 所示。
圖2 視頻2運動目標檢測結果Fig.2 Moving target test results of Video 2
視頻3的像素大小為160×120。實驗選取80 幀進行測試,結果如圖3 所示。
圖3 視頻3運動目標檢測結果Fig.3 Moving target test results of Video 3
視頻4的像素大小為160×120。實驗選取80幀進行測試,結果如圖4 所示。
圖4 視頻4運動目標檢測結果Fig.4 Moving target test results of Video 4
從實驗結果可以看出,本文方法在多種場景下比RPCA的提取效果要好很多,與HOSVD方法結果差別不大,能較準確完整地提取運動目標。
為量化評估算法提取運動目標的性能,本文采用召回率(Rrecall)、準確率(PPrecision)和兩者的調和平均值F-Measure來衡量運動目標檢測效果的好壞,即
(32)
(33)
F-Measure能夠有效地維持Rrecall,PPrecision這兩個標準的平衡,依此評價標準,F(xiàn)-Measure的大小和目標檢測的效果成正比,即F-Measure值越高,目標檢測的效果越好。
分別計算各視頻序列的Rrecall,PPrecision和F-Measure,從表1結果可以看出,本文方法的Rrecall,PPrecision和F-Measure都比RPCA方法高。實驗結果證明本文方法提取運動目標更為準確,且能在不需要進行繁瑣的手動調試參數(shù)的情況下,取得和HOSVD方法幾乎相同甚至更好的效果。
表1 各個視頻在不同算法下的結果指標
圖5展示了8組圖像序列基于常規(guī)的HOSVD運動目標檢測[14]的F-Measure指標隨正則化參數(shù)λ變化的曲線圖。對于不同的圖像序列,它們對應的最優(yōu)參數(shù)都不同,而且這8條曲線都很陡峭,說明λ變化很快,F-Measure值對λ比較敏感;從變化范圍看:對于8個圖像序列,盡管λ的變化范圍都很小,在0~0.04之間,F(xiàn)-Measure的值變化卻很大,變化范圍從最小值0到最大值1。
圖5 F-Measure隨λ變化曲線圖Fig.5 The changing of F-Measure with λ
綜合上述實驗數(shù)據(jù)可知:1) 常規(guī)的HOSVD運動目標檢測效果的好壞對正則化參數(shù)的變化極其敏感;2) 針對不同的實驗數(shù)據(jù),正則化參數(shù)的最優(yōu)值都不同。由于這兩個原因,通過試錯法手動調試正則化參數(shù)是一件極其困難的事,需要通過大量的實驗才能找到最優(yōu)參數(shù),而本文方法能在不需要進行繁瑣的手動調試參數(shù)的情況下,取得和HOSVD方法幾乎相同甚至更好的效果。
正則化參數(shù)不需要設置初值,算法中上限c是已知的與噪聲相關的數(shù),本文采用c=τI1I2I3σ2來估計c。τ=1是一個經(jīng)驗值,當τ=2時,目標檢測效果最佳且該算法對懲罰參數(shù)β1和β2的值不敏感,當它們的取值在較大范圍內變動時,實驗結果變化不明顯,這里選擇β1=β2=3×10-3。
本文提出了一種基于正則化參數(shù)自適應估計和HOSVD的運動目標提取方法。以Morozov’s偏差準則為理論基礎,根據(jù)誤差水平對正則化參數(shù)進行選擇和調整。實驗結果證明,本文方法能很好地實現(xiàn)運動目標提取,并且節(jié)省了大量的調試參數(shù)的時間。但由于模型的局限性,在動態(tài)背景干擾很大時提取效果還不理想。因此在未來的工作中,將繼續(xù)優(yōu)化本文模型和算法,建立魯棒性更強的優(yōu)化模型并找到簡潔、高效的奇異值分解算法,使之能更好地去除動態(tài)背景帶來的劇烈干擾。