李 麗,隋立春,2,康軍梅,王 雪
(1. 長安大學地質工程與測繪學院,陜西 西安 710054; 2. 地理國情監(jiān)測國家測繪地理信息局工程中心,陜西 西安 710054)
高分辨率遙感影像在國民經(jīng)濟建設、城市信息提取、精準農(nóng)業(yè),以及軍事測繪等方面都有著廣泛的應用前景[1]。作為衡量衛(wèi)星遙感性能的關鍵性指標,遙感影像空間分辨率在影像的獲取和應用中至關重要[2]。提高遙感影像空間分辨率最直接的方法就是通過硬件改良來提高,但因難度大、成本高且在短時間內(nèi)較難完成而受到限制。因此,利用超分辨率重建技術來提高遙感影像空間分辨率具有重要的現(xiàn)實意義[1]。超分辨率重建的概念最早由Harris和Goodman分別于1964年和1968年提出[3],是通過對一幅或多幅低分辨率觀測圖像的處理來重構高分辨率圖像的一種技術[4-5]。因具有切實有效、成本低廉的優(yōu)點,已被廣泛應用于視頻監(jiān)控、醫(yī)療成像及衛(wèi)星成像等領域[6]。
就目前的研究成果和應用而言,超分辨率重建方法主要分為基于插值、基于重建及基于學習的方法。其中,基于學習的方法因加入更多先驗信息而具有良好的重構結果,已成為目前研究的熱點,主要包括基于樣本的方法[7]、領域嵌入的方法[8]和稀疏表示的方法[9]?;谙∈璞硎镜某直媛手亟ǚ椒?ScSR)最早由Yang等在2010年提出[10],該方法利用L1正則優(yōu)化進行稀疏編碼,使用不同像素位置加權的字典元素集來表示圖像數(shù)據(jù),具有較好的重建結果。但這一模型需提前指定字典大小及噪聲精度,而在實際應用中,該類參數(shù)很難精確估計。非參數(shù)Bayesian方法可以很好地解決上述問題[6],該方法能充分利用圖像數(shù)據(jù)的潛在空間結構,利用先驗信息由圖像數(shù)據(jù)本身推導得到參數(shù),因其非參數(shù)性,減少了人為干涉等因素,提高了模型的自動化程度[11]。且對未知參數(shù)進行概率估計而不是點估計,引入了不確定性,避免了不同參數(shù)間估計誤差的擴大,進一步提高了超分辨率重建結果的質量[12]。本文將非參數(shù)Bayesian模型及稀疏表示理論應用于遙感影像處理,提出了一種結合非參數(shù)Bayesian字典學習模型及稀疏表示的遙感影像超分辨率重建方法,并針對遙感影像進行了試驗。試驗數(shù)據(jù)表明,本文算法在一定程度上提高了重構高分辨率影像的細節(jié)精度。
由于圖像本身存在冗余和自關聯(lián)性,通常情況下,對于圖像信號x∈RN,可以由過完備字典D=[d1d2…dM]∈RN×M(M>N)及向量α=[α1α2…αM]T∈RM線性表示為
(1)
(2)
sik~N(0,1/γs),zik~p(Zik)
αi=si⊙zi
γs~Gamma(e,f),γ~Gamma(c,d)
(3)
πk~Beta(c0η0,c0(1-η0))
zik~Bernoulli(πk)
(4)
式中,超參數(shù)c0、η0為標量,k∈1,2,…,K。當k趨向于無窮大時,Beta-Bernoulli近似于IBP/BP。
利用BP模型進行耦合字典學習,其本質在于利用觀測值及各隱變量的先驗及條件概率,使用Gibbs迭代抽樣形成馬爾科夫鏈,并用其平穩(wěn)分布來近似字典元素及各參數(shù)的后驗分布,進而作用于重建階段的高分辨率影像重構。具體字典學習過程如下:
(1) 抽取N個樣本觀測值;初始化字典元素及各參數(shù)值,迭代次數(shù)t初始值為零。
(2) 利用Gibbs抽樣進行迭代抽樣:將t遞增1。
p(zik=1|-)∝Bernoulli(πk)
p(πk|-)∝Beta(c0η0,c0(1-η0))
(5)
(6)
(4) 當?shù)纬傻鸟R爾科夫鏈為平穩(wěn)分布時,終止迭代;否則繼續(xù)。
(5) 輸出字典D(h)及D(l)。
由于以低分辨率圖像塊的細節(jié)信息作為特征重建效果較好,本文使用一階、二階梯度提取算子對低分辨率影像進行特征提取[10]。具體重建過程即單幅影像超分辨率稀疏重建算法如下:
輸入:低分辨率影像L,字典對D(h)及D(l);
輸出:高分辨率影像H*。
(3) 采用梯度下降算法對步驟(2)中影像塊所構成的初始高分辨率影像進行全局約束,得到最終的重建影像
式中,Rk為提取算子。
試驗測試數(shù)據(jù)為3幅資源三號(ZY3)影像及2幅TM5影像。選取100幅高分辨率遙感影像組成訓練樣本,進行3倍下采樣超分辨率重建試驗。試驗中對應的低分辨率影像由訓練樣本降采樣獲得。字典學習階段,隨機抽取105對8×8像素大小的影像塊對進行字典學習,塊間最大重疊;采用SVD初始化字典元素及各參數(shù)值;超參數(shù)參考Zhou論文取值為c=d=e=f=10-6、c0=2、η0=0.5;字典大小為2048,前1500次抽樣優(yōu)化模型,后1500次抽樣近似字典及各參數(shù)的后驗分布。重建階段,迭代次數(shù)為40。因人類視覺系統(tǒng)對亮度分量比色度分量更為敏感,故算法均只對亮度通道Y進行基于非參數(shù)Bayesian模型的超分辨率重建,而對色度通道(Cb,Cr)僅作雙三次插值處理。
試驗選用峰值信噪比(PSNR)及ERGAS(erreur relative globale adimensionnelle de synthese)作為定量評價指標,對采用雙線性插值方法(Bil.)、雙三次插值方法(Bic.)、yang的ScSR方法及本文所提算法得到的超分辨率重建結果進行了比較。圖1、圖2分別為3倍下采樣時測試影像ZY3-1、TM5-2在不同算法下的超分辨率重建結果。由圖1、圖2可以看出,Bil.及Bic.插值算法重建的影像整體效果較為模糊,存在過度平滑現(xiàn)象,ScSR重建結果優(yōu)于插值方法,但本文算法重建圖像更為清晰,邊緣輪廓及紋理結構更加明顯,更好地保留了高頻細節(jié)信息。
圖1 影像ZY3_1重建效果比較
圖2 影像TM5_2重建效果比較
表1給出了4種算法下重建影像的PSNR及ERGAS指標值。由表1可知,本文算法重構影像的PSNR及ERGAS值均優(yōu)于其他3種算法。綜合5幅影像求均值,較Bil.、Bic.及ScSR方法,文中算法的PSNR值分別提高3.29、1.79、0.17 dB;ERGAS值分別降低0.78、0.37、0.02 dB??傮w上,本文算法能更好地重構高分辨率遙感影像的細節(jié)和紋理特征,證明算法的有效性。
表1 不同算法重構影像PSNR及ERGAS的比較 dB
本文結合稀疏表示理論,提出了一種基于非參數(shù)Bayesian字典學習模型的單幅遙感影像超分辨率重建方法。該方法利用beta先驗相關理論建立字典元素及各參數(shù)的概率分布模型,采用Gibbs抽樣迭代形成馬爾科夫鏈,用其平穩(wěn)分布來近似字典元素的后驗分布,最后作用于重建階段進行高分辨率影像重構。試驗表明,本文算法在視覺效果、峰值信噪比及ERGAS指標3方面均優(yōu)于其他3種算法,證明了算法的有效性。由于馬爾科夫鏈的平穩(wěn)分布需通過大量迭代抽樣才能獲得,對于遙感影像,字典訓練所需時間過長,下一步將研究VB等快速近似解求解算法。