羅 暉,褚紅亮,王世昌
(華東交通大學(xué)信息工程學(xué)院,江西 南昌 330013)
基于K-SVD的低信噪比WMSN視頻圖像稀疏去噪
羅 暉,褚紅亮,王世昌
(華東交通大學(xué)信息工程學(xué)院,江西 南昌 330013)
無(wú)線多媒體傳感器網(wǎng)絡(luò)WMSN因感知視頻等信息的優(yōu)勢(shì)而被廣泛應(yīng)用,但受天氣、光照等外因干擾,所采集視頻圖像常含有較為嚴(yán)重的噪聲。因此,在低信噪比條件下進(jìn)行視頻圖像去噪是保證WMSN視頻監(jiān)測(cè)有效性和可靠性的關(guān)鍵。在分析WMSN視頻圖像特征的基礎(chǔ)上,首先對(duì)其進(jìn)行周期性采集、分幀及幀差等預(yù)處理;然后對(duì)關(guān)鍵幀運(yùn)用K-SVD訓(xùn)練DCT冗余字典以充分稀疏表示圖像特征,并采用基于殘差比的改進(jìn)型Batch-OMP實(shí)現(xiàn)關(guān)鍵幀去噪及重構(gòu),而對(duì)殘差幀則基于DCT冗余字典進(jìn)行稀疏去噪處理;最后,疊加去噪后的關(guān)鍵幀和殘差幀,從而整體上實(shí)現(xiàn)低信噪比WMSN視頻圖像的去噪及重構(gòu)。實(shí)驗(yàn)表明,本算法能更加有效地、較為快速地濾除視頻圖像噪聲,適用于低信噪比WMSN視頻圖像去噪。
稀疏去噪;K奇異值分解;殘差比;低信噪比;無(wú)線多媒體傳感器網(wǎng)絡(luò)
無(wú)線多媒體傳感器網(wǎng)絡(luò)WMSN(Wireless Multimedia Sensor Network)[1]是由一組具有計(jì)算、存儲(chǔ)和通信能力的多媒體傳感器節(jié)點(diǎn)組成的分布式感知監(jiān)測(cè)網(wǎng)絡(luò),常用于智能交通、工業(yè)控制等領(lǐng)域。然而,WMSN監(jiān)測(cè)視頻不可避免地受到雨雪霧惡劣天氣、光照等外界因素的影響,致使圖像信噪比低,視覺(jué)效果較為模糊;此外,WMSN監(jiān)測(cè)場(chǎng)景復(fù)雜,視頻圖像中存在大量的邊緣、紋理等細(xì)節(jié)信息[2]。傳統(tǒng)去噪方法如高斯濾波、小波閾值去噪等,未考慮圖像和噪聲之間的相互獨(dú)立性,會(huì)丟失圖像有用信息、破壞圖像原有特征、造成邊緣和細(xì)節(jié)模糊或偽吉布斯效應(yīng),從而在整體上降低了視頻圖像的可解釋性,增大了不可預(yù)測(cè)事故發(fā)生的可能性。因此,迫切需要研究適用于低信噪比WMSN視頻圖像的去噪方法,以保證視頻監(jiān)測(cè)的可靠性和有效性。
近年來(lái),信號(hào)的稀疏性日益受到關(guān)注,廣泛應(yīng)用于信號(hào)處理,如圖像去噪、壓縮傳感等。其中,鑒于圖像稀疏表示能更好地刻畫(huà)圖像本質(zhì)特征,并能有效區(qū)分圖像有用信息和噪聲,已形成稀疏去噪理論并應(yīng)用于視頻、圖像等去噪領(lǐng)域[3]。其中,作為一種高效的稀疏表示方法,超完備字典在很大程度上決定了圖像結(jié)構(gòu)特征能否被有效地表示[4]。依據(jù)Mallat S等人提出的超完備字典信號(hào)分解思想, 離散余弦變換DCT(Discrete Cosine Transform)冗余字典、多尺度Ridgelet字典[5]以及級(jí)聯(lián)字典等算法得到深入研究。但是,上述基于某種變換框架的字典數(shù)學(xué)模型較為簡(jiǎn)單,自適應(yīng)性不強(qiáng)。為了提高字典自適應(yīng)性,近幾年出現(xiàn)了最優(yōu)方向法、K-SVD等字典訓(xùn)練方法。其中,Aharon M等人[6,7]提出的K-SVD算法應(yīng)用最為廣泛。K-SVD可同時(shí)實(shí)現(xiàn)圖像的稀疏估計(jì)與去噪,對(duì)噪聲方差較大的圖像具有較好的去噪魯棒性;算法非常靈活,可與常見(jiàn)的稀疏分解最優(yōu)原子搜索算法,如OMP(Orthogonal Matching Pursuit)[7]、Batch-OMP[8]等,結(jié)合使用。其中,正交匹配追蹤系列算法因其復(fù)雜度較低、運(yùn)行速度快而被廣泛應(yīng)用,但其通常將硬閾值作為迭代終止條件,會(huì)丟失圖像的部分有用信息,且在低信噪比下容易引入重構(gòu)噪聲。
為了在保證視頻圖像去噪有效性的同時(shí),最大限度地保留圖像有用信息,避免在圖像重構(gòu)過(guò)程中引入噪聲,本文首先對(duì)WMSN視頻圖像進(jìn)行周期性采集、分幀及幀差等預(yù)處理,然后對(duì)關(guān)鍵幀和殘差幀采用不同的去噪算法,保證視頻圖像質(zhì)量的同時(shí)減少數(shù)據(jù)量,在整體上實(shí)現(xiàn)低信噪比WMSN視頻圖像的去噪及重構(gòu)。
實(shí)驗(yàn)結(jié)果表明,該算法在去除噪聲的同時(shí),有效保留了圖像的有用信息,能夠較為快速地得到視覺(jué)效果良好的去噪視頻圖像,適用于高噪聲強(qiáng)度的WMSN監(jiān)測(cè)環(huán)境。
(1)
Figure 1 PPreprocessing of the WMSN video images圖1 WMSN視頻圖像的預(yù)處理
對(duì)WMSN視頻圖像進(jìn)行周期性采集、分幀、幀差等預(yù)處理,可以在保證視頻圖像質(zhì)量的同時(shí)減少數(shù)據(jù)量、降低網(wǎng)絡(luò)能耗、提高算法運(yùn)行速度,以確保WMSN視頻監(jiān)測(cè)的有效性和可靠性。
這里,針對(duì)關(guān)鍵幀的稀疏去噪加以具體闡述。首先,根據(jù)視頻圖像特征分析,采用K-SVD算法以關(guān)鍵幀圖像塊為訓(xùn)練樣本逐列更新DCT冗余字典,獲得充分反映視頻圖像結(jié)構(gòu)特征的字典。然后,考慮到WMSN視頻圖像的信噪比較低,采用基于殘差比[10]的改進(jìn)型Batch-OMP算法對(duì)含噪圖像進(jìn)行充分和快速的重構(gòu)及去噪。
對(duì)關(guān)鍵幀的稀疏去噪算法的具體實(shí)現(xiàn)過(guò)程可描述為:
(1)獲得稀疏系數(shù)矩陣。
s.t ?i,‖αi‖0≤T0
(2)
通過(guò)求解式(2)可獲得K-SVD算法所需的稀疏系數(shù)矩陣α。
(2)運(yùn)用K-SVD算法更新字典。
在獲取訓(xùn)練樣本集和稀疏矩陣α后,K-SVD訓(xùn)練字典交替應(yīng)用l1范數(shù)稀疏約束的追蹤和奇異值分解算法,逐列更新初始字典D,其大致過(guò)程如下:
(3)
其中,矩陣Ek代表的是去掉原子dk的成分在所有N個(gè)樣本中所造成的誤差。
(3)采用基于殘差比的改進(jìn)型Batch-OMP重構(gòu)去噪關(guān)鍵幀。
作為OMP算法的改進(jìn),在基于同一冗余字典對(duì)大量數(shù)據(jù)信號(hào)進(jìn)行稀疏分解時(shí),Batch-OMP算法會(huì)針對(duì)冗余字典進(jìn)行預(yù)處理,從而提高算法運(yùn)算速度、有效減少算法內(nèi)存占用率,大大降低了算法的復(fù)雜度[8],尤其適用于數(shù)據(jù)量巨大的WMSN視頻圖像處理。
假設(shè)第m次迭代為:
si=sim+Rm(si)
(4)
由Batch-OMP重構(gòu)算法過(guò)程可知:
(5)
將式(1)代入式(3)可得:
(6)
(7)
其中,
(8)
其中,E為期望值。
采用基于殘差比的改進(jìn)型Batch-OMP獲得去噪關(guān)鍵幀的稀疏系數(shù)矩陣α′,求解式(9)即可獲得去噪后的關(guān)鍵幀S′。
(9)
為了驗(yàn)證并突出本文所采用方法在WMSN視頻圖像去噪中的優(yōu)越性和有效性,分別用本文方法以及另外三種去噪方法對(duì)包含高斯白噪聲的低信噪比WMSN視頻圖像進(jìn)行了去噪效果比較。這些方法分別是基于Wavelet變換的硬閾值去噪算法、基于Contourlet[11]變換的去噪算法及基于DCT冗余字典的稀疏去噪算法[6]。本文算法的具體方案如圖2所示。
Figure 2 Process of the proposed sparse denoising method圖2 基于稀疏分解的WMSN視頻圖像去噪
提取在高速道路上所拍攝視頻圖像的關(guān)鍵幀Road,采用 MATLAB對(duì)其進(jìn)行仿真處理。WMSN視頻監(jiān)測(cè)場(chǎng)景復(fù)雜,在雨雪、光照等外因影響下,視頻圖像中噪聲成分較多。為了反映實(shí)際監(jiān)測(cè)場(chǎng)景,本文采用σ=45的含噪視頻圖像,上述四種方法的去噪效果如圖3所示。
Figure 3 Different performance of the four denoising algorithms圖3 不同算法對(duì)含噪圖像Road的去噪效果
由圖3可以看出,在高強(qiáng)度噪聲環(huán)境下,采用基于小波變換和Contourlet變換的去噪算法所得去噪圖像模糊失真,細(xì)節(jié)信息不清晰;而兩種基于冗余字典的稀疏分解去噪算法均能夠有效去除噪聲,去噪圖像視覺(jué)效果良好。主要原因是基于變換的去噪算法通常會(huì)將圖像邊緣等高頻信息當(dāng)做噪聲而濾除,造成空域邊緣和細(xì)節(jié)的銳度下降;而基于字典的稀疏去噪算法則依據(jù)能否被稀疏表示作為標(biāo)準(zhǔn)將噪聲與有用信息區(qū)分開(kāi)來(lái),受噪聲強(qiáng)度影響較小。
為了更客觀地評(píng)價(jià)圖像的去噪效果和算法的去噪性能,本文還采用圖像結(jié)構(gòu)相似度SSIM(Structural Similarity)作為客觀評(píng)價(jià)標(biāo)準(zhǔn)。圖4顯示了上述四種算法在不同噪聲強(qiáng)度下去噪圖像SSIM值的變化。分析圖4可知,按照客觀評(píng)價(jià)標(biāo)準(zhǔn),基于冗余字典的稀疏分解去噪算法優(yōu)于Wavelet去噪和Contourlet去噪算法,而且本文算法去噪效果更好。
Figure 4 SSIM of the four algorithms at different noise levels圖4 不同噪聲強(qiáng)度下四種算法的SSIM值變化
從視覺(jué)效果和SSIM評(píng)價(jià)標(biāo)準(zhǔn)均可看出,DCT冗余字典稀疏去噪算法效果不如本文算法。前者去噪圖像稍顯模糊,邊緣等細(xì)節(jié)存在一些失真,兩者SSIM差值近似在0.01~0.03,且在σ=45處最大,此時(shí)也最接近WMSN視頻監(jiān)測(cè)的實(shí)際場(chǎng)景。主要原因?yàn)椋阂环矫?,DCT字典未經(jīng)過(guò)訓(xùn)練而無(wú)法實(shí)現(xiàn)字典原子和圖像特征的最大化匹配;另一方面,低信噪比圖像的噪聲方差可能大于有用信號(hào)方差,基于硬閾值的OMP迭代會(huì)將部分噪聲誤認(rèn)為有用信號(hào),在重構(gòu)過(guò)程中引入噪聲成分。而本文算法先采用K-SVD算法以自適應(yīng)訓(xùn)練字典,再結(jié)合基于殘差比的Batch-OMP稀疏分解算法,從而充分刻畫(huà)圖像細(xì)節(jié)特征,并克服硬閾值無(wú)法自適應(yīng)選擇迭代終止閾值的去噪缺陷,表現(xiàn)了更好的去噪效果。這表明相對(duì)于其他三種算法,本文算法在強(qiáng)噪聲環(huán)境中具有更好的去噪性能,適用于WMSN視頻圖像的去噪處理。
此外,本文算法中,Batch-OMP稀疏分解算法會(huì)先對(duì)冗余字典進(jìn)行預(yù)處理,從而減少每個(gè)信號(hào)的每次迭代運(yùn)算量。隨著信號(hào)數(shù)據(jù)量的增大,字典預(yù)處理的復(fù)雜度可以忽略不計(jì),而各次迭代的復(fù)雜度總和相較于OMP等常規(guī)算法會(huì)大大減少。依據(jù)文獻(xiàn)[8]對(duì)于Batch-OMP復(fù)雜度的計(jì)算說(shuō)明,通過(guò)Matlab仿真分析驗(yàn)證可知:在字典D∈Rn×K,n=256條件下,Batch-OMP相比于OMP的算法處理速度可提高7~8倍。同時(shí),K-SVD 訓(xùn)練過(guò)程產(chǎn)生的平均系數(shù)會(huì)呈現(xiàn)迅速遞減趨勢(shì),算法速度也會(huì)不斷提高。
WMSN視頻監(jiān)測(cè)場(chǎng)景復(fù)雜,加之雨雪霧天氣及光照等惡劣條件,視頻圖像信噪比低,極大地影響了視頻監(jiān)測(cè)的有效性和可靠性。信噪比低就意味著噪聲成分的含量更多,分布的頻譜更寬,故傳統(tǒng)方法不適用于WMSN視頻圖像去噪。本文首先針對(duì)WMSN的視頻圖像結(jié)構(gòu)特征進(jìn)行周期性采集、分幀、幀差等預(yù)處理;然后對(duì)殘差幀進(jìn)行DCT冗余字典稀疏去噪,而對(duì)關(guān)鍵幀則運(yùn)用K-SVD訓(xùn)練DCT冗余字典以充分稀疏表示圖像特征,并采用基于殘差比的改進(jìn)型Batch-OMP獲得去噪關(guān)鍵幀,從而在整體上實(shí)現(xiàn)低信噪比WMSN視頻圖像的去噪及重構(gòu)。實(shí)驗(yàn)表明,本文算法能更加有效地、較為快速地濾除圖像噪聲,適用于低信噪比WMSN視頻圖像去噪。其中,K-SVD與Batch-OMP的結(jié)合采用降低了WMSN視頻圖像的處理復(fù)雜度,有利于保證WMSN視頻圖像的實(shí)時(shí)性。本文算法適用于場(chǎng)景固定的WMSN視頻監(jiān)測(cè),若要擴(kuò)展運(yùn)用于運(yùn)動(dòng)場(chǎng)景,需要進(jìn)一步改進(jìn)。
[1] Lu Qin. Research on multi-node cooperative image acquisition and compression technology in wireless multimedia sensor networks [D]. Changsha:National University of Defense Technology, 2009. (in Chinese)
[2] Pinar S, Kerem I, Sebnem B, et al. Image quality estimation in wireless multimedia sensor networks:An experimental study[J]. BROADNETS, LNICST, 2012, 66(2):226-241.
[3] Gribonval R, Nielsen M. Sparse approximations in signal and image processing [J]. Signal Processing,2006, 86(3):415-416.
[4] Yaghoobi M, Blumensath T, Davies M E. Dictionary learning for sparse approximations with the majorization method[J]. IEEE Transactions on Signal Processing, 2009, 57(6):2178-2191.
[5] Candes E, Donoho D. New tight frames of curvelets and optimal representations of objects with C2 singularities[J]. Common Pure and Applied Math, 2004, 57(2):219-266.
[6] Aharon M, Elad M, Bruckstrein A. The K-SVD:An algorithm for designing of over-complete dictionaries for sparse representation [J]. IEEE Transactions on Signal Processing, 2006, 54 (11):4311-4322.
[7] Aharon M, Elad M. Sparse and redundant modeling of image content using an image-signature-dictionary [J]. SIAM Journal on Imaging Sciences, 2008, 1(3):228-247.
[8] Rubinstein R, Zibulevsky M, Elad M. Efficient implementation of the K-SVD algorithm using batch orthogonal matching pursuit[R]. CS-2008-08.Haifa, Israel:Computer Science Department, Technion-Israel Institute of Technology, 2008.
[9] Garg K, Nayar S K. Vision and rain[J]. International Journal of Computer Vision, 2007, 75(1):3-27.
[10] Liang Wei, Que Pei-wen, Chen Liang, et al. Residual ratio iteration termination condition for MP method[J]. Journal of Shanghai Jiaotong University, 2010, 44(2):171-175. (in Chinese)
[11] Cunha L A, Zhou J P, Do M N. The nonsubsampled contourlet transform:Theory, design, and applications [J]. IEEE Transactions on Image Processing, 2006, 15(10):3089-3101.
附中文參考文獻(xiàn):
[1] 魯琴. 無(wú)線多媒體傳感器網(wǎng)絡(luò)多節(jié)點(diǎn)協(xié)同圖像采集與壓縮技術(shù)研究[D].長(zhǎng)沙:國(guó)防科學(xué)技術(shù)大學(xué), 2009.
[10] 梁巍, 厥沛文, 陳亮, 等. 基于殘差比閾值的迭代終止條件匹配追蹤稀疏分解方法[J]. 上海交通大學(xué)學(xué)報(bào), 2010, 44(2):171-175.
LUO Hui,born in 1969,MS,associate professor,his research interests include multimedia information process, and wireless communication system.
K-SVD based sparse denoising for WMSN video image with low SNR
LUO Hui,CHU Hong-liang,WANG Shi-chang
(School of Information Engineering,East China Jiaotong University,Nanchang 330013,China)
As a highly effective method of perceiving multimedia information, Wireless Multimedia Sensor Networks (WMSNs) has shown its potential in many areas. However, the outside interference in the monitoring environment brings severe noise to video images. Obviously, video image denoising becomes the key to ensuring the validity and reliability of WMSN video monitoring. To denoise WMSN video image, firstly, its features are analyzed and some pretreatment are done. Secondly, the K-SVD algorithm is employed to adaptively train DCT dictionary for reflecting the image characteristics and reconstruct the key frame through improved Batch-OMP algorithm with residual ratio as the iteration termination, while DCT dictionary is adopted to sparsely denoise the residual frames. Finally, the video image is reconstructed under the situation of low SNR. Experimental results show that, compared with its counterparts, the superiorities of the algorithm can be observed in both visual and some numerical guidelines, showing the suitability for the WMSN video image denoising in low SNR.
sparse denoising;K-SVD;residual ratio;low SNR;wireless multimedia sensor network
2012-10-15;
2012-12-22
國(guó)家自然科學(xué)基金資助項(xiàng)目(61261040)
1007-130X(2014)03-0497-05
TP391.41
A
10.3969/j.issn.1007-130X.2014.03.021
羅暉(1969-),男,江西南昌人,碩士,副教授,研究方向?yàn)槎嗝襟w信息處理和無(wú)線通信系統(tǒng)。E-mail:lh_jxnc@163.com
通信地址:330013 江西省南昌市華東交通大學(xué)信息工程學(xué)院
Address:School of Information Engineering,East China Jiaotong University,Nanchang 330013,Jiangxi,P.R.China