余義斌,彭 念,甘俊英
(1.五邑大學信息工程學院,廣東江門 529020; 2.浙江省信號處理重點實驗室,浙江杭州 310023)
?
凹凸范數(shù)比值正則化的快速圖像盲去模糊
余義斌1,2,彭念1,2,甘俊英1
(1.五邑大學信息工程學院,廣東江門 529020; 2.浙江省信號處理重點實驗室,浙江杭州 310023)
模糊圖像可表示為清晰圖像和模糊核函數(shù)的卷積,由模糊圖像恢復出清晰圖像,需要同時估計模糊核和清晰圖像,因此是一個病態(tài)問題.優(yōu)化含有先驗項的代價函數(shù)是求解病態(tài)問題最有效方法之一.針對圖像盲去模糊問題,本研究提出具有更強稀疏表達能力的凹凸范數(shù)比值正則化先驗項,在用變量分裂法求解模型時,提出用L1范數(shù)保真項更新估計圖像,在更新模糊核時,提出使用線性遞增權重參數(shù)對模糊核按多尺度方法由粗到細逐步估計,當獲得模糊核后,利用封閉閾值公式估計清晰圖像.該方法能快速得到高質量的清晰圖像,實驗結果驗證了模型的有效性和算法的快速性.
凹凸范數(shù)比值正則化;圖像盲去模糊;變量分裂法;封閉閾值
常見的圖像模糊包括因聚焦不當引起的散焦模糊,因相機與被拍攝目標存在相對運動引起的運動模糊和由光學系統(tǒng)缺陷引起的像差模糊等幾類.圖像模糊會使圖像的有用信息丟失,如日常生活與工業(yè)生產(chǎn)中廣泛使用的數(shù)碼相機在獲取圖像過程中,普遍存在著一定程度的散焦模糊和運動模糊,直接影響圖像質量,又如車輛識別監(jiān)控系統(tǒng)中,車牌模糊將直接導致圖像特征提取等后續(xù)圖像分析失敗.因此圖像去模糊研究具有重要意義.
1990年以前,圖像去模糊技術主要基于空域局部濾波方法[1,2],這類方法優(yōu)點是計算速度快,但其去模糊效果較差.1990年至2005年,基于稀疏變換域的圖像去模糊技術是這一階段的主流,這類方法去模糊質量較高.2006年至今,圖像去模糊技術的熱點主要集中在非局部相似性方法和稀疏表示方法上[3~8].主要要解決的問題依然是去模糊質量與速度.近幾年來,稀疏表示與詞曲學習方法在圖像處理中取得了顯著成功,并廣泛應用圖像去卷積中,基于l1范數(shù)的正則化詞曲學習方法同樣也在圖像去模糊研究中取得了初步成功,但其稀疏表達能力不及l(fā)q(0 圖像去模糊按模糊核是否已知可分為非盲去模糊[3,8,9]和盲去模糊[4,10,11].非盲去模糊是在模糊核已知情況下恢復出清晰圖像,因為有模糊核這個非常重要的信息,去模糊相對容易,主要任務是如何在保持細節(jié)情況下恢復出清晰圖像.盲去模糊是在模糊核未知情況下恢復清晰圖像,在這種情況下,除模糊圖像外,沒有其它任何信息,因此,與非盲去模糊相比,盲去模糊是難度更大的病態(tài)問題. 對于去模糊這類病態(tài)問題,通常利用先驗項將其轉化為優(yōu)化問題求解,一般都能得到較好的解.盲去模糊圖像恢復的一般模型為 (1) 其中,f表示模糊圖像,k表示模糊核,u表示清晰圖像,?表示卷積運算.f(u),h(k)分別為關于清晰圖像u和模糊核k的先驗項,λ和α分別為其對應的正則化權重參數(shù). (2) (3) 采用迭代收縮閾值算法(ISTA)[13]快速求解式(3)的l1正則化問題.同樣,由模型(2)可得到求解k的模型為 (4) 這類模型及算法在圖像去模糊中取得了較好的效果. 圖像模糊模型為 f=u?k+n (5) 其中,f表示模糊圖像,k表示模糊核,u表示清晰圖像,n表示噪聲. 3.1凹凸范數(shù)比值正則化模型 本文提出的模型與現(xiàn)有盲去模糊模型(2)最主要的差別是:當求解清晰圖像u的梯度變換x和模糊核k時,由原來的1個代價函數(shù)變?yōu)閮蓚€代價函數(shù)求解.求解x時(對應于模型的第一個代價函數(shù)),將自然圖像梯度的長尾分布作為先驗子引入第一個代價函數(shù)中,即采用凹凸范數(shù)比值lq/l2作為先驗項,凹凸范數(shù)比值項實際上是超拉普拉斯項除以圖像的總能量得到的規(guī)一化值,同時,不同于現(xiàn)有方法,第一個代價函數(shù)的保真項選擇l1范數(shù)而非l2范數(shù),使用l1范數(shù)保真項既可保證模型對(廣義)噪聲的魯棒性,又使凹凸范數(shù)先驗正則化模型更容易求解;求解k時(對應于模型的第二個代價函數(shù)),保真項選擇l2范數(shù),正則化項選擇l1范數(shù),該代價函數(shù)為一般的非光滑二次凸函數(shù),可保證模型的全局收斂性.由兩個代價函數(shù)組成的優(yōu)化模型為 (6) 3.2凹凸范數(shù)比值正則化求解算法 求解凹凸范數(shù)比值正則化模型(6)分兩步進行,第一步,更新清晰圖像u的梯度變換x,第二步,更新模糊核k.本文對每一尺度的清晰圖像和模糊核由粗尺度到細尺度逐步進行,當獲得模糊核k后,利用封閉閾值公式求解清晰圖像u.具體求解過程如下: (1)x更新 更新x時,保真項選擇l1范數(shù),正則化項為凹凸范數(shù)比值,求解模型為 (7) (8) 因式(8)為一非凸函數(shù),本文采用變量分裂法迭代求解,即引入1個二次項,改善目標函數(shù)的非凸性.引入輔助變量為v,令v=x?k-y,權重參數(shù)為θ,式(8)變?yōu)?/p> (9) 在x更新過程中,用變量分裂法求解時,不同于現(xiàn)有方法,本論文采用動態(tài)權重參數(shù)θ,即根據(jù)不同尺度按線性遞增方式取值 θi=ciθ0 (10) 其中θ0表示θ的初始值,ci與尺度i成線性關系,即ci=2i. (11) (12) 對式(11)求導,得 (13) 利用閾值公式求解 (14) +θ(x?k-y-v)kT] (15) 式中,xk+1表示第k+1步的x值,Δt為迭代步長,利用閾值公式求解 (16) (2)k更新 為保證模糊核計算的準確性和魯棒性,對模糊核的估計采用多尺度方法由粗到細逐步進行,每一尺度下都涉及到x和模糊核k的插值與更新,粗細尺度由模糊核的大小決定,初始核大小為3×3,用粗尺度估計出的模糊核和清晰圖像插值放大后作為細尺度的初始值,通過最小化目標函數(shù)找到最優(yōu)模糊核k. 更新k時,保真項選擇l2范數(shù),正則化項為l1范數(shù),求解模型為 (17) 在模糊核的更新過程中,利用IRLS方法[14]計算模糊核k的權重 (18) 式中,kk-1為上次迭代更新的模糊核,wk為更新的模糊核k的權重.計算出模糊核的權重后,再利用共軛梯度法估計出該尺度下的模糊核k,將k中負值元素設為0,然后重新規(guī)一化,將該尺度下的模糊核經(jīng)過上采樣作為細尺度的初始模糊核. 在最細尺度求出模糊核函數(shù)k后,問題變?yōu)榉敲とゾ矸e,求解模型為 (19) 通過對比文獻[5],[6]和[11]三種非盲去卷積算法,本文采取文獻[5]的封閉閾值算法求解,該算法簡單,恢復效果好,而且速度快. (20) 模型(20)求解分兩步進行,即分別求u和d.求解u時,直接對式(20)求導,并用二維快速傅里葉變換求最優(yōu)解 (21) 其中F和F-1分別表示傅里葉正變換和逆變換,*表示復共軛,⊙表示點乘,Dh和Dv分別表示水平梯度和垂直梯度變換. (22) 當q=2/3時[5] 在圖像盲去模糊實驗中,因用l2/3范數(shù)恢復出的圖像效果略優(yōu)于l1/2范數(shù)的,所以本文采用l2/3范數(shù)的閾值公式對圖像進行去模糊處理.算法歸納如算法1所示,算法流程如圖1所示. 3.3收斂性分析 (1)模型的收斂性分析 (2)算法的收斂性分析 算法1優(yōu)化凹函數(shù)f(x)時,采用了變量分裂法,即引入了二次函數(shù)項(式(9)第3項),改善了凹函數(shù)的凸性;同時,優(yōu)化二次凸函數(shù)g(k)時,可保證算法的全局收斂性.另外,在式(20)第二項引入了二次項,進一步加快了算法的收斂性.總之,較傳統(tǒng)算法,本算法既顯著改善了lq凹函數(shù)收斂性問題,同時也提高了l1優(yōu)化算法收斂速度,第4部分的實驗結果也驗證了本算法的快速收斂性. 3.4算法的復雜性分析 本算法的復雜性較低主要體現(xiàn)在:(1)算法從粗尺度到細尺度迭代,設迭代次數(shù)為M,在每一個尺度下,清晰圖像和模糊核交互迭代更新,其中清晰圖像的更新次數(shù)設為Q1,模糊核更新的次數(shù)設為Q2,則總的迭代次數(shù)為M(Q1+Q2).與其它算法相比,當優(yōu)化f(x)和g(k)時,本文方法均采用變量分裂法并引入二次項,使算法具有超線性收斂性,減小了Q1和Q2,導致總迭代次數(shù)M(Q1+Q2)減小;(2)因采用封閉閾值公式直接求出清晰圖像,避免了求解式(20)中d的多次迭代計算,因而降低了計算復雜性.第4部分的實驗結果也驗證本文方法具有較低的計算復雜性. x更新時內部迭代和外部迭代次數(shù)均設置為2次,并取最大步長為10-4,以避免在迭代過程代價函數(shù)值的波動. 4.1圖像恢復效果比較 本文將通用軟閾值去卷積算法(GST)[6],Krishnan算法[4]和本文的算法進行比較.由于GST算法用于圖像的非盲恢復中,因此,用本文提出算法估計得到的模糊核作為GST算法的已知核.三種方法的圖像去模糊效果如圖2至圖6所示.其中每幅圖像的圖(a)為模糊圖像,圖(b)對應于Krishnan方法,圖(c)對應于GST算法,圖(d)對應于本文算法.從圖中可以看出,本文方法的去模糊效果優(yōu)于Krishnan方法與GST算法,主要體現(xiàn)在偽影明顯減少,圖像細節(jié)部分更清晰.因為沒有原始的清晰圖像,因此無法給出對去模糊效果的客觀評價. 4.2圖像恢復速度比較 本研究采用3.10GHz的Intel CPU和4GB內存的計算機處理相同的圖像,對Krishnan方法,GST算法與本文提出的方法在處理速度上進行比較,比較結果如表1所示,單位為秒. 表1 三種去模糊方法運行時間比較 由表1可看出,相比于Krishnan方法和GST算法,本文提出的凹凸范數(shù)比值正則化的圖像盲去模糊方法在處理相同圖像、估計相同大小模糊核所消耗的時間最短,即本文方法運行速度最快.從消耗時間上看,盡管GST算法與本文方法較接近,但因其為非盲去模糊方法而使用了本文估計的模糊核,因此在運行速度上也得宜于本文方法. 4.3圖像恢復過程中參數(shù)的影響 在模糊核的求解過程中,參數(shù)λ和λ1的值為常數(shù),而且在一定范圍內取值越大,模糊核越收斂,取值越小,模糊核越發(fā)散,不同的圖像對應不同的值.求解清晰圖像時,權重參數(shù)λ2的值也為常數(shù),取值越大,獲得的圖像越銳化,取值越小,圖像越模糊. 在x更新過程中,利用變量分裂法求解,引入權重參數(shù)θ,在多尺度求解過程中,若θ采用定值,則圖像恢復質量明顯下降,主要包括細節(jié)模糊,模糊核不收斂等問題,如圖7(a)所示.本文提出的動態(tài)θ隨尺度線性增加的取值方法,即θi=ciθ0,明顯地改善了圖像恢復質量,模糊核也能更好地收斂,如圖7(b)所示. 本文提出了一種凹凸范數(shù)比值正則化的圖像盲去模糊模型,即利用lq/l2范數(shù)作為正則化先驗項,采用多尺度方法由粗尺度到細尺度逐步迭代求解,用變量分裂法求解模型時,提出用L1范數(shù)保真項更新估計圖像的高頻信息,在清晰圖像恢復時,采用封閉閾值公式以解析解的形式給出,提高了算法速度,同時,更新模糊核時,提出使用線性遞增權重參數(shù)對模糊核按多尺度方法由粗到細逐步進行估計,進一步改善了模糊核的收斂性,提高了去模糊圖像質量.實驗結果表明,該模型能夠更好地恢復出清晰圖像,其效果在圖像細節(jié)處更明顯,而且相比于其它兩種方法,該模型的求解算法計算速度更快. 由圖7(b)可知,雖然恢復圖像在眼睛、相機、衣服等處去模糊效果較其它兩種方法更好,但對于臉部,仍存在少許顏色干擾問題,這些問題將在后續(xù)的研究中找到解決辦法. [1]Helstrom C W.Image restoration by the method of least squares[J].Journal of the Optical Society of America (JOSA),1967,57(3):297-303. [2]Richardson W H.Bayesian-based iterative method of image restoration[J].Journal of the Optical Society of America (JOSA),1972,62(1):55-59. [3]Yuan L,Sun J,Quan,L,et al.Progressive inter-scale and intra-scale non-blind image deconvolution[J].ACM Transactions on Graphics (TOG),2008,27(3):74-83. [4]Krishnan D,Tay T,Fergus R.Blind deconvolution using a normalized sparsity measure[A].IEEE Conference on Computer Vision and Pattern Recognition (CVPR) Proceedings[C].Colorado:IEEE,2011:233-240. [5]Cao W F,Sun J,Xu Z B.Fast image deconvolution using closed-form thresholding formulas of Lq(q=1/2,2/3) regularization[J].Journal of Visual Communication and Image Representation,2013,24(1):31-41. [6]Zuo W M,Meng D Y,Zhang L,et al.A generalized iterated shrinkage algorithm for non-convex sparse coding[A].IEEE international conference on computer vision (ICCV) Proceedings[C].Sydney:IEEE,2013:217-224. [7]Gong P G,Zhang C S,Lu Z S,et al.A general iterative shrinkage and thresholding algorithm for non-convex regularized optimization problems[EB/OL].http://arxiv.org/abs/1303.4434,2013-03-01. [8]Cho S,Wang J,Lee S.Handling outliers in non-blind image deconvolution[A].IEEE International Conference on Computer Vision (ICCV) Proceedings[C].Barcelona:IEEE,2011:495-502. [9]Schmidt U,Rother C,Nowozin S,et al.Discriminative non-blind deblurring[A].IEEE Conference on Computer Vision and Pattern Recognition (CVPR) Proceedings[C].Portland:IEEE,2013:604-611. [10]Levin A,Weiss Y,Durand F,et al.Understanding and evaluating blind deconvolution algorithms[A].IEEE international conference on computer vision (CVPR),Proceedings[C].Miami:IEEE,2009:1964-1971. [11]Cai J F,Ji H,Liu C,et al.Blind motion deblurring from a single image using sparse approximation[A].IEEE international conference on computer vision (CVPR) Proceedings[C].Miami:IEEE,2009:104-111. [12]Krishnan D,Fergus R.Fast Image Deconvolution using Hyper-Laplacian Priors[A].Advances in Neural Information Processing Systems (NIPS) Proceedings[C].Whistler:MIT Press,2009,22:1-9. [13]Beck A,Teboulle M.A fast iterative shrinkage-thresholding algorithm for linear inverse problems[J].SIAM Journal on Imaging Sciences,2009,2(1):183-202. [14]Levin A,Fergus R,Durand F,et al.Image and depth from a conventional camera with a coded aperture[J].ACM Transactions on Graphics (TOG),2007,26(3):70-79. [15]Xu Z B.Data modeling:Visual psychology approach and L1/2 regularization theory[A].International Congress of Mathematicians (ICM) Proceedings[C].Hyderabad:International Mathematical Union,2010:3151-3184. 余義斌(通信作者)男,1966年生于湖北省.2006年畢業(yè)于重慶大學,獲博士學位.現(xiàn)為五邑大學信息工程學院副教授.主要研究方向為圖像分析,凸優(yōu)化理論,計算機視覺與模式識別等. E-mail:yuyibintony@163.com 彭念女,1992年生于湖北省.2011年畢業(yè)于武漢工程大學,獲學士學位,現(xiàn)為五邑大學信息工程學院碩士研究生,主要研究方向為圖像處理,壓縮感知與稀疏表示. E-mail:790893173@qq.com 甘俊英女,1965年生于江西省.2003年畢業(yè)于北京航空航天大學,獲博士學位.現(xiàn)為五邑大學信息工程學院教授.主要研究方向為圖像處理與人臉識別等. E-mail:junyinggan@163.com Fast Blind Image Deblurring Using Ratio of Concave Norm to Convex Norm Regularization YU Yi-bin1,2,PENG Nian1,2,GAN Jun-ying1 (1.InformationEngineeringSchool,WuyiUniversity,Jiangmen,Guangdong529020,China;2.ZhejiangKeyLaboratoryforSignalProcessing,Hangzhou,Zhejiang310023,China) Blurry image can be represented as the convolution of a latent image and a blur kernel,so it is an ill-posed problem to solve the kernel and the latent image inversely from a single blurry image.The most effective way to solving ill-posed problem is using cost function with priori term.For blind image deblurring problem,we propose a ratio of convex norm to concave norm as a regularization priori term,which has more sparse representation ability.When solving the model by variable splitting method,we propose L1 norm fidelity term to update high-frequency information of the latent image.At the stage of updating the blurring kernel,we propose a linear increasing weight parameter to estimate the blurring kernel gradually by multi-scale approach from coarse to fine.After obtaining the blur kernel,we use a closed threshold formula to estimate the latent image.This method can obtain high-quality image efficiently.The experimental results demonstrate the effectiveness of the model and the rapidity of the algorithm. ratio of concave norm to convex norm regularization;blind image deblurring;variable split method;closed-form threshold 2014-09-04; 2015-05-18;責任編輯:馬蘭英 廣東高校省級重點平臺和重大科研項目特色創(chuàng)新項目(自然科學類)(No.2015KTSCX148);浙江省信號處理重點實驗室開放課題(No.ZJKL-4-SP-OP2014-05);國家自然科學基金(No.61372193) TN911 A 0372-2112 (2016)05-1168-06 電子學報URL:http://www.ejournal.org.cn10.3969/j.issn.0372-2112.2016.05.0222 相關研究
3 凹凸范數(shù)比值正則化模型與求解算法
4 實驗結果與分析
5 結論