楊家俊, 陳 昕, 丁祝順
(1.超精密航天控制儀器技術(shù)實(shí)驗(yàn)室,北京100039;2.北京航天控制儀器研究所,北京100039)
圖像融合是指從多源信道獲得多幅關(guān)于同一對(duì)象或區(qū)域的圖像數(shù)據(jù),并從中最佳地提取各個(gè)信道中重要的互補(bǔ)信息,最終得到一幅融合了各個(gè)信道重要信息的高質(zhì)量圖像[1]。其目標(biāo)是輸出全面綜合了各個(gè)輸入圖像信息的單一圖像,以便于人的感知或后續(xù)的機(jī)器分析、理解及決策。依據(jù)數(shù)據(jù)來源的不同,可將圖像融合系統(tǒng)分為兩類,一類的源圖像來源于光學(xué)參數(shù)可變的同一傳感器,例如多聚焦圖像融合系統(tǒng);另一類的源圖像來源于不同類型的圖像傳感器,典型場(chǎng)景包括可見光-紅外圖像及多模醫(yī)學(xué)圖像融合系統(tǒng)。圖像融合技術(shù)已經(jīng)逐步成為大多數(shù)圖像信息處理系統(tǒng)實(shí)現(xiàn)數(shù)據(jù)預(yù)處理的關(guān)鍵模塊,被廣泛應(yīng)用于各種實(shí)際場(chǎng)景中,如機(jī)器視覺、安防監(jiān)控、醫(yī)學(xué)圖像分析、遙感圖像解譯、軍事目標(biāo)識(shí)別與跟蹤等[2-5]。
早期的圖像融合算法以加權(quán)平均法、邏輯濾波法及數(shù)學(xué)形態(tài)法為代表,還包括了IHS變換[6-7]、PCA 變換[8]、 多尺度變換[9]等。 近年來, 許多新的圖像融合方法已被提出。2017年,Zhu等[10]提出的多模圖像融合方法將源圖像進(jìn)行了分解,并基于稀疏表示方法融合了高頻成分,使用形態(tài)學(xué)方法融合了低頻成分。2018年,Tang等[11]提出了一種像素級(jí)卷積神經(jīng)網(wǎng)絡(luò)(p-CNN),通過鄰域信息識(shí)別聚焦和散焦像素,以進(jìn)行多聚焦圖像融合。2019年,Farid等[12]提出了一種多聚焦圖像融合方法,使用內(nèi)容自適應(yīng)模糊算法(CAB)檢測(cè)聚焦區(qū)域。2019年,Ma等[13]提出了一種基于生成對(duì)抗網(wǎng)絡(luò)的圖像融合方法FusionGAN,用于可見光及紅外圖像的融合。Yang等[14]首次將稀疏表示理論引入了圖像融合領(lǐng)域,他們的實(shí)驗(yàn)結(jié)果表明,基于稀疏表示(Sparse Representation,SR)理論的圖像融合方法相較于傳統(tǒng)的基于多尺度變換(MST)理論的方法具有非常明顯的優(yōu)勢(shì)。通過對(duì)原始的圖像信號(hào)執(zhí)行對(duì)應(yīng)于某個(gè)空間基的稀疏分解,稀疏表示(SR)理論提供了使用較少數(shù)據(jù)表達(dá)圖像核心信息的能力。這符合信號(hào)的自然稀疏特性,也符合人類視覺系統(tǒng)的生理特點(diǎn),為視覺信息的底層感知與復(fù)原、高層理解和識(shí)別提供了有效的支撐。
采用加權(quán)平均法、邏輯濾波法及數(shù)學(xué)形態(tài)法等技術(shù)直接對(duì)圖像像素進(jìn)行處理,難以利用圖像中較高層次的視覺特征信息,融合圖像質(zhì)量較差。傳統(tǒng)的IHS變換、PCA變換、多尺度變換分析等變換域方法只著眼于特定的視覺特征信息或只適用于特定的圖像融合場(chǎng)景,融合圖像質(zhì)量不及稀疏域變換方法。神經(jīng)網(wǎng)絡(luò)方法依賴訓(xùn)練數(shù)據(jù)和硬件算力,模型解釋性較差,應(yīng)對(duì)新樣本的能力較差?,F(xiàn)有的基于稀疏表示的圖像融合算法只考慮對(duì)稀疏域的稀疏系數(shù)向量所包含的信息進(jìn)一步發(fā)掘和利用,而不考慮使用來自字典的信息進(jìn)一步提升融合圖像的質(zhì)量。本文使用原子向量的l1范數(shù)構(gòu)造信息量權(quán)向量,通過將字典原子的信息引入稀疏系數(shù)向量的融合過程,提升了融合圖像的質(zhì)量。
根據(jù)稀疏表示(SR)理論,假設(shè)原始信號(hào)可以表達(dá)為一個(gè)向量x∈Rn,存在一個(gè)超完備字典矩陣D∈Rn×m(n<m),則原始信號(hào)x可以通過字典D的少量列的線性組合近似表達(dá)為x≈Dα,α∈Rm是未知的稀疏系數(shù)向量。如圖1所示,圖中紅框的線寬對(duì)應(yīng)于稀疏系數(shù)向量α中元素的大小。由于字典D是超完備的,該欠定線性系統(tǒng)有無窮多的可行解。稀疏表示的目標(biāo)是尋找具有最小零階范數(shù)的α,該稀疏編碼過程通常由正交匹配追蹤(Orthogonal Matching Pursuit,OMP)[15]算法實(shí)現(xiàn)。
圖1 稀疏表示理論的示意圖Fig.1 Diagram of sparse representation theory
假設(shè)源圖像為IA、IB, 則基于稀疏表示的圖像融合算法[14,16]的執(zhí)行流程如下:
傳統(tǒng)的基于稀疏表示理論的圖像融合算法將超完備字典的每一列稱為一個(gè)原子,字典原子被用作完成圖像信號(hào)稀疏分解及重構(gòu)的基本信號(hào)元。通過稀疏編碼過程將源圖像信號(hào)分解為字典原子的稀疏線性組合,將相應(yīng)的圖像融合算法視為原子線性組合的系數(shù),即稀疏系數(shù)向量的一階范數(shù)為輸入圖像信號(hào)包含信息量大小的度量標(biāo)準(zhǔn),據(jù)此選擇作為圖像融合結(jié)果的稀疏系數(shù)向量。
通過分析稀疏編碼過程使用的超完備字典的構(gòu)建原理,字典的每一個(gè)原子列所包含的信息量必然存在差異?,F(xiàn)有的相關(guān)研究文獻(xiàn)通常側(cè)重于考慮對(duì)稀疏域的系數(shù)向量所包含的信息量進(jìn)一步發(fā)掘和利用,而較少考慮字典原子的信息量差異。本文以圖像融合系統(tǒng)為應(yīng)用場(chǎng)景,探究對(duì)稀疏字典原子信息特性的進(jìn)一步發(fā)掘和利用。通過對(duì)稀疏域信號(hào)引入來自超完備字典的約束,將稀疏系數(shù)元素及其對(duì)應(yīng)的字典原子綜合考慮,并將其作為稀疏系數(shù)向量的融合依據(jù)。該操作可以降低融合圖像塊的選擇錯(cuò)誤率,提升融合圖像的質(zhì)量。
假設(shè)用于稀疏編碼的超完備字典為D,字典尺寸為“H×W”,源圖像塊對(duì)應(yīng)的稀疏系數(shù)向量分別為ωA和ωB,稀疏系數(shù)向量的融合結(jié)果為ωF。以SR算法為基礎(chǔ),AWSR算法原子加權(quán)部分的執(zhí)行流程如下:
(1)字典規(guī)范化
為了消除原子能量對(duì)其信息量計(jì)算的干擾,使用相應(yīng)的均值對(duì)原子進(jìn)行規(guī)范化。將字典D的每一個(gè)原子的元素除以該原子的l2范數(shù),得到規(guī)范化字典Dn
本文實(shí)驗(yàn)使用K-SVD算法在規(guī)范化圖像數(shù)據(jù)庫(kù)上學(xué)習(xí)到的字典已經(jīng)具有規(guī)范化原子。
(2)信息量度量
以規(guī)范化字典中每一個(gè)原子的l1范數(shù)作為其對(duì)于融合圖像信息量大小的貢獻(xiàn)程度度量,計(jì)算規(guī)范化字典Dn中每一個(gè)原子的一階范數(shù),得到度量原子信息量的行向量VI
(3)構(gòu)造權(quán)向量
調(diào)整不同原子稀疏系數(shù)比重的權(quán)重值,將整個(gè)字典所有原子的總信息量規(guī)范化為1。計(jì)算信息量行向量VI的每一個(gè)元素與元素和的比值,并將其作為對(duì)應(yīng)原子的稀疏系數(shù)加權(quán)值,得到稀疏系數(shù)權(quán)向量Vw
(4)計(jì)算原子加權(quán)融合系數(shù)
分別計(jì)算兩個(gè)源圖像塊對(duì)應(yīng)的稀疏系數(shù)向量ωA、ωB的絕對(duì)值與系數(shù)權(quán)向量Vw的內(nèi)積,得到原子加權(quán)融合系數(shù)wA和wB
(5)加權(quán)稀疏系數(shù)向量融合
融合稀疏系數(shù)向量,選擇原子加權(quán)融合系數(shù)較大值對(duì)應(yīng)的稀疏系數(shù)向量作為融合稀疏系數(shù)向量
將以上原子加權(quán)算法引入傳統(tǒng)的基于稀疏表示的圖像融合框架,即得到了基于原子加權(quán)稀疏表示(Atom-weighted Sparse Representation,AWSR)的圖像融合算法。圖2為完整的AWSR圖像融合算法的流程框圖。此外,該圖像融合框架也可以很容易地?cái)U(kuò)展到融合兩幅及以上源圖像的情況。
圖2 基于原子加權(quán)稀疏表示(AWSR)的圖像融合算法流程框圖Fig.2 Block diagram of image fusion algorithm based on AWSR
由于通常并不存在可以用來和融合圖像進(jìn)行對(duì)比從而評(píng)價(jià)其融合質(zhì)量的標(biāo)準(zhǔn)圖像,很難簡(jiǎn)單地對(duì)融合圖像的質(zhì)量進(jìn)行準(zhǔn)確評(píng)價(jià)。通常設(shè)置一組具有不同評(píng)價(jià)取向偏好的客觀指標(biāo)進(jìn)行實(shí)驗(yàn),通過其綜合表現(xiàn)評(píng)價(jià)融合算法的性能[17]。本文選取了六種常用的融合圖像質(zhì)量客觀評(píng)價(jià)指標(biāo)對(duì)原子加權(quán)稀疏表示(AWSR)圖像融合算法進(jìn)行評(píng)價(jià)。假設(shè)系統(tǒng)輸入的源圖像為A、B,輸出的融合圖像為F,圖像尺寸為H×W。
(1)標(biāo)準(zhǔn)偏差(Standard Deviation,SD)
圖像標(biāo)準(zhǔn)偏差SD的定義為
式(6)中,μ為圖像F的均值。標(biāo)準(zhǔn)偏差主要用來度量融合圖像的對(duì)比度。
(2)基于梯度的融合度量 (QG)
基于圖像特征的評(píng)價(jià)指標(biāo)QG由 Xydeas和Petrovic[18]提出,QG的計(jì)算公式為
式(7)中,QAF和QBF為邊緣強(qiáng)度和方向的保留值,ωA、ωB為其顯著性。評(píng)價(jià)指標(biāo)QG主要用來度量梯度信息由輸入圖像到輸出圖像的保存情況。
(3)基于相位一致性的融合度量(QP)
評(píng)價(jià)指標(biāo)QP由 Zhao等[19]提出,QP的計(jì)算公式為
式(8)中,p、M、m依次為相位的一致性、最大矩和最小矩,實(shí)驗(yàn)取α=β=γ=1。評(píng)價(jià)指標(biāo)QP主要用來度量輸入圖像的邊緣、角點(diǎn)等核心特征保存到輸出圖像的情況。
(4)基于通用圖像質(zhì)量評(píng)價(jià)指標(biāo)(UIQI)的融合度量 (QW)
基于圖像結(jié)構(gòu)相似性的評(píng)價(jià)指標(biāo)QW由Piella和 Heijmans[20]提出,QW的計(jì)算公式為
式(9)中,w為滑動(dòng)窗口,和Q0(B,F|w)來自 UIQI評(píng)價(jià)指標(biāo)[21],λ(w)為由方差計(jì)算的顯著性加權(quán)系數(shù),c(w)為歸一化特征值。評(píng)價(jià)指標(biāo)QW主要用來度量從輸入圖像到輸出圖像的類似人眼視覺的失真情況,包括相關(guān)系數(shù)、亮度以及對(duì)比度。
(5)歸一化互信息(Mutual Information,MI)融合度量 (QMI)
基于信息論的評(píng)價(jià)指標(biāo)QMI由 Hossny等[22]提出, 該指標(biāo)增強(qiáng)了互信息(MI)評(píng)價(jià)指標(biāo)[23]的穩(wěn)定性。QMI的計(jì)算公式為
式(10)中,H(·)為圖像的熵,MI(A,F)和MI(B,F)為互信息(MI)。 評(píng)價(jià)指標(biāo)QMI主要用來度量輸出圖像保留輸入圖像信息的情況。
(6)基于空間頻率(Spatial Frequency)的融合度量 (QSF)
評(píng)價(jià)指標(biāo)QSF由 Zheng等[24]提出,QSF的計(jì)算公式為
式(11)中,SFF為融合圖像由行方向、列方向、主對(duì)角線方向和副對(duì)角線方向一階梯度計(jì)算的空間頻率。參考空間頻率,SFR由源圖像的四個(gè)參考梯度計(jì)算
式(12)中,D代表四個(gè)方向。評(píng)價(jià)指標(biāo)QSF主要用來度量輸出圖像保持輸入圖像空間頻率的情況。
為了構(gòu)建具有廣泛適應(yīng)能力、可以在任何特定場(chǎng)景及系統(tǒng)參數(shù)設(shè)定下使用的通用圖像融合系統(tǒng),字典訓(xùn)練使用的圖像數(shù)據(jù)庫(kù)由不同場(chǎng)景下的高品質(zhì)自然圖像集隨機(jī)采樣獲得。為了消除圖像能量對(duì)稀疏字典信息編碼能力的影響,所有圖像向量的均值在字典訓(xùn)練前均被設(shè)置為0。使用基于學(xué)習(xí)的K-SVD[25]算法獲得的字典中每個(gè)原子的均值也為0,即字典原子中只包含圖像的結(jié)構(gòu)信息。輸入圖像塊的均值在稀疏編碼前也被設(shè)置為0。為了提升算法的穩(wěn)定性及執(zhí)行效率,稀疏編碼過程只作用于局部的圖像塊。為了提高算法對(duì)噪聲及誤匹配的魯棒性,使用滑動(dòng)窗口技術(shù)對(duì)圖像進(jìn)行層疊分塊。
圖3為在圖像融合實(shí)驗(yàn)中使用的數(shù)據(jù)集[26]。為了充分評(píng)價(jià)原子加權(quán)稀疏表示(AWSR)理論在不同類型使用場(chǎng)景中的綜合性能表現(xiàn),實(shí)驗(yàn)選取了三種常見的圖像融合系統(tǒng)應(yīng)用場(chǎng)景下的典型圖像作為測(cè)試數(shù)據(jù)集,包括多聚焦圖像(圖3(a))、可見光-紅外圖像(圖 3(b))及多模醫(yī)學(xué)圖像(圖 3(c), 由計(jì)算機(jī)斷層掃描CT圖像和磁共振MR圖像組成)。實(shí)驗(yàn)使用的圖像塊分解尺寸為8×8,將滑動(dòng)窗移動(dòng)步長(zhǎng)設(shè)置為2,稀疏字典尺寸為64×256。分別使用傳統(tǒng)的基于稀疏表示(SR)的圖像融合算法和基于原子加權(quán)稀疏表示(AWSR)的圖像融合算法對(duì)測(cè)試集源圖像進(jìn)行融合,并評(píng)價(jià)其融合圖像質(zhì)量。
圖3 算法測(cè)試數(shù)據(jù)集Fig.3 Diagram of algorithm test data set
(1)融合圖像質(zhì)量主觀評(píng)價(jià)
圖4為原子加權(quán)稀疏表示(AWSR)圖像融合算法融合實(shí)驗(yàn)的部分輸出圖像。
圖4 原子加權(quán)稀疏表示(AWSR)圖像融合算法的融合結(jié)果示例圖Fig.4 Fusion results of AWSR image fusion algorithm
其中,圖4(a)為兩次多聚焦圖像融合,左側(cè)為前景對(duì)焦圖像,中間為遠(yuǎn)景對(duì)焦圖像,右側(cè)為融合圖像。由于圖像采集設(shè)備景深的硬件限制,只能通過調(diào)節(jié)設(shè)備的光學(xué)參數(shù)使得視場(chǎng)范圍內(nèi)的有限區(qū)域成像清晰。通過對(duì)多幅不同焦距的圖像進(jìn)行融合,可以獲得整幅畫面清晰的理想圖像。由圖4可以看到,圖4(a)右側(cè)的融合圖像(不論是遠(yuǎn)處書架上的書籍、墻壁和綠植,還是畫面近處的鬧鐘及花朵)紋理清晰、細(xì)節(jié)豐富。融合圖像幾乎完美保留了兩幅源圖像中所有的有效信息。
圖4(b)為兩次可見光-紅外圖像融合,左側(cè)為可見光圖像,中間為紅外圖像,右側(cè)為融合圖像。由于圖像傳感器所敏感的電磁波譜的波段不同,可見光和紅外傳感器采集的圖像數(shù)據(jù)具有極強(qiáng)的互補(bǔ)性??梢姽鈭D像包含場(chǎng)景的色彩、細(xì)節(jié)信息,而紅外圖像可感知場(chǎng)景的溫度分布信息。圖4(b)上方的融合圖像恰當(dāng)?shù)厝诤狭丝梢姽鈭D像中的廣告牌、路面燈柱及紅外圖像中的車輛、行人信息。圖4(b)下方的融合圖像既保留了可見光圖像中大面積的植被紋理信息,又保留了在紅外圖像中顯著但在可見光圖像中幾乎無法被辨識(shí)的行人信息。融合圖像大幅增強(qiáng)了單一圖像的信息量及畫面表現(xiàn)力,可以有效提升后續(xù)圖像分析與任務(wù)理解的可靠性。
圖4(c)為兩次多模醫(yī)學(xué)圖像融合,左側(cè)為計(jì)算機(jī)斷層掃描CT圖像,中間為核磁共振MR圖像,右側(cè)為融合圖像。單一模態(tài)的醫(yī)學(xué)圖像只能有效描述特定人體組織的橫斷面信息,CT圖像主要可反映骨骼組織的解剖結(jié)構(gòu),而MR圖像能清晰地反映人體軟組織和器官的解剖結(jié)構(gòu)。圖4(c)右側(cè)的融合圖像既保留了CT圖像腦部四周高亮的骨骼結(jié)構(gòu)信息,也保留了MR圖像中大腦內(nèi)部的軟組織及器官信息。通過恰當(dāng)?shù)厝诤暇哂谢パa(bǔ)特性的多模態(tài)醫(yī)學(xué)數(shù)據(jù),信息更加完備的融合圖像可以有效提升臨床疾病診斷的效率和準(zhǔn)確性。
(2)算法執(zhí)行效率
對(duì)圖像融合程序處理所有26組源圖像的平均運(yùn)行時(shí)間進(jìn)行統(tǒng)計(jì),基于稀疏表示(SR)的圖像融合算法的耗時(shí)為13.0648s,基于原子加權(quán)稀疏表示(AWSR)的圖像融合算法的耗時(shí)為13.2964s,增加比率為1.7732%。相比傳統(tǒng)的基于稀疏表示(SR)的圖像融合算法,原子加權(quán)稀疏表示(AWSR)算法需要在進(jìn)行稀疏編碼之后為稀疏系數(shù)向量引入來自字典原子的權(quán)重信息,這導(dǎo)致了算法的復(fù)雜度有所增加。由實(shí)驗(yàn)結(jié)果可知,圖像融合程序的執(zhí)行耗時(shí)只增加了約1.77%,增幅很小。因此,使用AWSR框架相較于傳統(tǒng)的稀疏表示方法并不會(huì)造成計(jì)算資源需求的明顯增加。
(3)融合圖像質(zhì)量客觀評(píng)價(jià)
在實(shí)驗(yàn)中,對(duì)26組源圖像分別使用傳統(tǒng)的稀疏表示(SR)算法及原子加權(quán)稀疏表示(AWSR)算法進(jìn)行融合,使用六種常用的融合圖像質(zhì)量客觀評(píng)價(jià)指標(biāo)對(duì)融合結(jié)果進(jìn)行評(píng)價(jià)。表1為基于SR和AWSR算法融合圖像的客觀質(zhì)量評(píng)價(jià)得分。評(píng)價(jià)指標(biāo)SD、QG、QP、QW、QMI的數(shù)值越大,圖像質(zhì)量越高。經(jīng)絕對(duì)值處理后,評(píng)價(jià)指標(biāo)QSF數(shù)值越小,圖像質(zhì)量越高。
表1 基于SR及AWSR算法的圖像融合質(zhì)量客觀評(píng)價(jià)Table 1 Objective evaluation of image fusion quality based on SR and AWSR algorithms
由表1可知,所提出的原子加權(quán)稀疏表示(AWSR)圖像融合算法在所有六種常用的具有不同評(píng)價(jià)取向偏好的融合圖像質(zhì)量客觀評(píng)價(jià)指標(biāo)下的得分均優(yōu)于基于傳統(tǒng)稀疏表示(SR)的圖像融合算法。實(shí)驗(yàn)結(jié)果驗(yàn)證了挖掘超完備字典原子的信息表達(dá)特性、使用原子信息量對(duì)稀疏系數(shù)向量進(jìn)行加權(quán)的基于稀疏表示的圖像融合算法的有效性,使用AWSR融合策略使得基于稀疏表示理論的圖像融合質(zhì)量得到了全面、可靠的提升。在所有六種客觀評(píng)價(jià)指標(biāo)中,基于空間頻率的融合度量QSF的評(píng)價(jià)得分提升幅度最大,這表明AWSR算法獲得的融合圖像更好地保持了源圖像的空間頻率,相對(duì)源圖像的失真更小?;谙辔灰恢滦缘娜诤隙攘縌P的提升幅度次之,表明AWSR算法獲得的融合圖像保留了更多的邊緣、角點(diǎn)等源圖像核心特征,提升了融合圖像的信息量和表現(xiàn)力。
(4)算法魯棒性評(píng)價(jià)
融合性能評(píng)價(jià)實(shí)驗(yàn)使用的來自標(biāo)準(zhǔn)數(shù)據(jù)集的測(cè)試圖像通常都具有較高的成像質(zhì)量,但在實(shí)際工作環(huán)境下采集到的圖像普遍會(huì)在圖像采集及數(shù)據(jù)傳輸過程中受到噪聲的干擾。為了進(jìn)一步評(píng)價(jià)原子加權(quán)稀疏表示(AWSR)圖像融合算法的魯棒性,對(duì)測(cè)試圖像集添加不同標(biāo)準(zhǔn)差的零均值加性Gauss白噪聲,以測(cè)試AWSR算法在不同噪聲水平下的融合圖像質(zhì)量。以基于傳統(tǒng)稀疏表示(SR)的圖像融合算法為基準(zhǔn),圖5展示了原子加權(quán)稀疏表示(AWSR)圖像融合算法在不同噪聲水平下的融合圖像質(zhì)量。曲線橫坐標(biāo)為零均值Gauss白噪聲的標(biāo)準(zhǔn)差σ,縱坐標(biāo)為基于AWSR及SR算法的融合圖像質(zhì)量得分,評(píng)價(jià)指標(biāo)QSF經(jīng)絕對(duì)值處理后越小,圖像質(zhì)量越高。
圖5 基于AWSR的圖像融合算法在不同噪聲水平下的融合圖像質(zhì)量評(píng)價(jià)Fig.5 Fusion image quality evaluation of AWSR image fusion algorithm under different noise levels
由圖5可知,六種客觀評(píng)價(jià)指標(biāo)在不同的噪聲水平下絕大部分都保持了對(duì)傳統(tǒng)稀疏表示(SR)圖像融合算法的性能提升,這表明原子加權(quán)稀疏表示(AWSR)圖像融合算法對(duì)噪聲具有較好的魯棒性。
(5)原子加權(quán)最優(yōu)參數(shù)分析
圖6展示了原子加權(quán)稀疏表示(AWSR)圖像融合算法在不同加權(quán)水平下的融合圖像質(zhì)量的變化趨勢(shì),評(píng)價(jià)指標(biāo)QSF的數(shù)值越小,融合圖像的質(zhì)量越好。曲線橫坐標(biāo)為加權(quán)比重p,將原始AWSR框架的稀疏系數(shù)權(quán)向量Vw做進(jìn)一步修正
式(13)中,W為字典的寬度。當(dāng)p=1時(shí),代表原子加權(quán)稀疏表示(AWSR)圖像融合算法。當(dāng)p=0時(shí),代表傳統(tǒng)的基于稀疏表示(SR)圖像融合算法。曲線縱坐標(biāo)為基于AWSR及SR圖像融合算法的評(píng)價(jià)得分,評(píng)價(jià)指標(biāo)QSF越小,表示圖像的質(zhì)量越高。
由圖6可知,幾乎所有的評(píng)價(jià)指標(biāo)曲線隨著加權(quán)比重的增加均呈現(xiàn)先增后減的趨勢(shì)。其中,標(biāo)準(zhǔn)偏差SD指標(biāo)曲線的波動(dòng)較大,這主要是由于標(biāo)準(zhǔn)偏差只度量融合圖像的對(duì)比度,計(jì)算簡(jiǎn)單,但可靠性較差。六種融合圖像質(zhì)量客觀指標(biāo)的最優(yōu)值范圍集中在加權(quán)比重值p處于0.55到0.85之間,AWSR圖像融合算法的最優(yōu)加權(quán)比重參數(shù)值在0.7左右。此外,在圖6中,AWSR算法的六種評(píng)價(jià)指標(biāo)曲線基本都處于SR算法曲線的上方,這進(jìn)一步驗(yàn)證了將原子加權(quán)策略應(yīng)用于稀疏表示理論的有效性。
圖6 基于AWSR的圖像融合算法在不同加權(quán)水平下的融合圖像質(zhì)量評(píng)價(jià)Fig.6 Fusion image quality evaluation of AWSR image fusion algorithm under different weighting levels
(6)光電吊艙圖像融合實(shí)驗(yàn)
為了進(jìn)一步驗(yàn)證算法的可行性及有效性,采用真實(shí)場(chǎng)景圖像數(shù)據(jù)進(jìn)行融合實(shí)驗(yàn)。圖7為將基于原子加權(quán)稀疏表示(AWSR)圖像融合算法應(yīng)用于由光電吊艙采集的真實(shí)場(chǎng)景的可見光及紅外圖像數(shù)據(jù)。其中,圖7(a)為可見光圖像, 圖7(b)為紅外圖像,圖7(c)為使用 AWSR算法進(jìn)行融合的圖像。
圖7 基于AWSR的圖像融合算法應(yīng)用于真實(shí)光電吊艙的多源圖像融合Fig.7 Fusion of multi-source images from real optoelectronic pod based-on AWSR image fusion algorithm
由圖7可知,融合圖像既保留了可見光圖像豐富的紋理、細(xì)節(jié)信息,又保留了如近處可見光圖像過曝的墻面細(xì)節(jié)等紅外圖像提供的信息,綜合了可見光和紅外圖像的表達(dá)優(yōu)勢(shì),增強(qiáng)了圖像的信息表現(xiàn)力,提高了光電吊艙的輸出圖像質(zhì)量。
本文提出了一種使用超完備字典的原子對(duì)稀疏編碼后的稀疏系數(shù)向量進(jìn)行加權(quán)改進(jìn)的基于稀疏表示(AWSR)的圖像融合算法。通過挖掘超完備字典中原子所包含的信息量差異構(gòu)造權(quán)向量,提高了稀疏系數(shù)向量的融合質(zhì)量。使用六種融合圖像質(zhì)量客觀度量指標(biāo)進(jìn)行評(píng)價(jià),針對(duì)多聚焦圖像、可見光-紅外圖像及多模醫(yī)學(xué)圖像的實(shí)驗(yàn)結(jié)果表明,新的圖像融合算法對(duì)源圖像的空間頻率及核心特征的保護(hù)更好、失真更小,提升了融合圖像的質(zhì)量。相較于傳統(tǒng)的基于稀疏表示(SR)圖像融合算法,實(shí)現(xiàn)了全面、可靠的性能提升。
在實(shí)驗(yàn)結(jié)果中,各項(xiàng)客觀質(zhì)量評(píng)價(jià)指標(biāo)的提升幅度較小,但面對(duì)多種圖像融合場(chǎng)景,所有具有不同評(píng)價(jià)偏好的客觀指標(biāo)均得到了全面的提升,這表明了該研究方向及結(jié)果是有效且可靠的,后續(xù)研究可以探索對(duì)字典原子信息特性更加合理、有效的挖掘和利用方式。同時(shí),本文提出的稀疏表示(SR)算法的提升策略是普適性的,不僅可被應(yīng)用于圖像融合系統(tǒng),還可以很容易地被拓展到圖像去噪、壓縮、增強(qiáng)及目標(biāo)識(shí)別等研究框架或非圖像信號(hào)處理系統(tǒng)中。