亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于深度學(xué)習(xí)的單幅圖像超分辨率重建綜述*

        2021-02-03 04:08:20喻夏瓊傅瑞罡
        計算機工程與科學(xué) 2021年1期
        關(guān)鍵詞:網(wǎng)絡(luò)結(jié)構(gòu)殘差尺度

        李 彬,喻夏瓊,王 平,傅瑞罡,張 虹

        (1.國防科技大學(xué)電子科學(xué)學(xué)院,湖南 長沙 410073;2.32021部隊,北京 100094; 3.中國船舶科學(xué)研究中心,江蘇 無錫 214000)

        1 引言

        由于硬件設(shè)備限制和信息傳輸處理的實時性要求,人們獲取到的圖像數(shù)據(jù)往往為低分辨率LR(Low-Resolution)圖像,但在實際應(yīng)用中,高分辨率HR(High-Resolution)圖像可以提供更多信息,幫助專業(yè)人士做出更準確的判斷,同時也具有更好的感知效果。單幅圖像超分辨率SISR(Single Image Super-Resolution)重建利用圖像中像素點與周圍像素點之間存在的內(nèi)在聯(lián)系,學(xué)習(xí)自然數(shù)據(jù)中存在的隱式冗余,可以從單幅的LR圖像恢復(fù)出丟失的細節(jié)信息,從LR圖像得到HR圖像。目前,SISR技術(shù)被廣泛應(yīng)用于諸多領(lǐng)域,如社會安全[1]、醫(yī)學(xué)成像[2]和軍事遙感[3]等。

        現(xiàn)有的SISR算法大致分為3類:基于插值的算法、基于重建的算法和基于學(xué)習(xí)的算法[4]?;诓逯档乃惴ê唵危侵亟▓D像會引入偽影和振鈴現(xiàn)象。基于重建的算法雖然重建效果較好,但是算法執(zhí)行效率低,對尺度縮放因子敏感。基于學(xué)習(xí)的算法解決了對尺度縮放因子敏感的問題,在SISR領(lǐng)域得到了廣泛應(yīng)用。由于SISR問題具有不適定性(存在多種可能解,即多幅HR圖像對應(yīng)同一幅LR圖像),需要構(gòu)建一定條件來約束重建圖像的解空間。

        作為基于學(xué)習(xí)算法的一個分支,基于深度學(xué)習(xí)的SISR算法通過多層卷積神經(jīng)網(wǎng)絡(luò)CNN(Convolutional Neural Network)建立輸入和輸出之間非線性端對端的映射關(guān)系。首個基于深度學(xué)習(xí)算法的SISR網(wǎng)絡(luò)模型SRCNN[5]構(gòu)建了一個簡單淺層的CNN,得到的圖像重建效果相對其他SR重建算法有了顯著提升。近年來,諸多深度學(xué)習(xí)超分辨率SR重建網(wǎng)絡(luò)模型被提出,如ESPCN[6]、VDSR[7]、SRGAN[8]和RCAN[9]等,進一步提升了SISR重建效果。由于基于深度學(xué)習(xí)的SR重建算法通常是構(gòu)建一個端對端的網(wǎng)絡(luò)模型,將LR圖像輸入到該特定網(wǎng)絡(luò)模型中,通過特征映射和尺度放大等方式優(yōu)化網(wǎng)絡(luò)的損失函數(shù),進而得到HR圖像,因而現(xiàn)有的SR重建網(wǎng)絡(luò)模型主要在尺度放大方式、模型結(jié)構(gòu)組成和損失函數(shù)構(gòu)建3個方面存在較大差異,本文針對這3個方面進行了詳細分析。

        2 尺度放大方式

        所謂圖像SR尺度放大,就是進行圖像上采樣,即在放大圖像的尺度的同時提升分辨率。在網(wǎng)絡(luò)構(gòu)建中,上采樣的方法和時機不同,帶來的SR重建效果不同。

        2.1 上采樣方法

        常見的圖像SR上采樣方法主要有3種:基于插值的圖像SR上采樣、基于反卷積的圖像SR上采樣和基于亞像素卷積的圖像SR上采樣。

        基于插值的圖像SR上采樣在LR圖像的基礎(chǔ)上,使用合適的內(nèi)插算法在原有像素點間插入新的像素點。常用的插值算法有最近鄰插值、雙線性插值和雙三次插值等?;诓逯档膱D像SR上采樣原理簡單,能夠?qū)崟r高效地對LR圖像進行尺度放大,但插值放大后的圖像質(zhì)量差,容易帶來鋸齒狀的失真,因而與基于反卷積和基于亞像素卷積的圖像SR上采樣方法相比,其應(yīng)用相對較少。早期網(wǎng)絡(luò)模型也將插值放大結(jié)果作為網(wǎng)絡(luò)輸入,如SRCNN[4]、VDSR[6]等網(wǎng)絡(luò)模型的輸入就是插值放大后的圖像。

        反卷積(Deconvolution),也稱轉(zhuǎn)置卷積,最早的反卷積概念出現(xiàn)在Zeiler等人[10]發(fā)表的論文中。它并不是正向卷積完全的逆過程,而是比較特殊的正向卷積,通過對補零操作后的圖像進行卷積,使輸出圖像的尺度放大,相當于使用一種分數(shù)步長的卷積方法對圖像進行上采樣,基本操作如圖1a所示。相對于基于插值的圖像SR上采樣方法,基于反卷積和基于亞像素卷積的圖像SR上采樣都屬于基于學(xué)習(xí)的上采樣,可以有效減少鋸齒狀失真?;诜淳矸e的圖像SR上采樣方法是目前SISR重建領(lǐng)域中最常用的方法,F(xiàn)SRCNN[11]、EDSR[12]等網(wǎng)絡(luò)結(jié)構(gòu)中都采用基于反卷積的圖像SR上采樣進行尺度放大。

        Figure 1 Principle of deconvolution and sub-pixel convolution圖1 反卷積和亞像素卷積實現(xiàn)原理

        亞像素卷積(Sub-Pixel Convolution)[5]是一種像素洗牌的上采樣方法,雖然名稱為亞像素卷積,但并未進行卷積操作,實際是像素的一種重新排列。亞像素卷積要求輸入是r2(r指尺度放大的倍數(shù))個通道的特征圖,通過一定的規(guī)則對所有像素進行重新排列,從而得到一幅尺度放大的圖像,具體操作如圖1b所示,實質(zhì)上是一種反抽樣的思想。由于亞像素卷積操作中不涉及卷積計算,因而基于亞像素卷積的上采樣速度非???,有助于實現(xiàn)實時上采樣。

        2.2 上采樣實施方式

        根據(jù)上采樣時機的不同,SISR重建網(wǎng)絡(luò)可以采用預(yù)先上采樣、單次上采樣、漸進上采樣和迭代上采樣4種方式。

        預(yù)先上采樣是通過預(yù)處理方式,使得輸入網(wǎng)絡(luò)的圖像為經(jīng)插值放大的中分辨率MR(Middle-Resolution)圖像,該方法最早出現(xiàn)在SRCNN網(wǎng)絡(luò)中,通過簡單的CNN建立MR圖像與HR圖像之的映射關(guān)系。早期的SR網(wǎng)絡(luò)模型,如SRCNN、VDSR[6]、DRCN[13]和DRRN[14]等均采用預(yù)先上采樣的方式提高重建圖像的尺度。由于該方式在預(yù)處理階段對圖像進行上采樣,極大增加了網(wǎng)絡(luò)訓(xùn)練過程中的計算量,特別是隨著網(wǎng)絡(luò)深度的逐步加深,進一步制約著網(wǎng)絡(luò)模型訓(xùn)練的效率和重建圖像質(zhì)量。因而隨著網(wǎng)絡(luò)模型的發(fā)展,預(yù)先上采樣的方式基本不再使用。

        單次上采樣通常指在SISR網(wǎng)絡(luò)模型的最后一個模塊,通過反卷積或亞像素卷積的方法實現(xiàn)特征尺度放大,從而得到重建MR圖像。目前大部分的SISR網(wǎng)絡(luò)模型都采用單次上采樣,典型的有FSRCNN[13]、ESPCN[5]、EhanceNet[15]和IDN[16]等。單次上采樣解決了預(yù)先上采樣帶來的網(wǎng)絡(luò)計算量大的缺點,加快了網(wǎng)絡(luò)訓(xùn)練速度,同時通過基于反卷積和基于亞像素卷積這2種基于學(xué)習(xí)的圖像SR上采樣方法,使得重建圖像效果更加逼真。

        漸進上采樣最早出現(xiàn)在Lapsrn[17]網(wǎng)絡(luò)中,旨在解決大尺度上采樣時單次上采樣方法存在圖像失真和重建質(zhì)量差的問題。漸進上采樣充分利用2倍上采樣的網(wǎng)絡(luò)結(jié)構(gòu)解決4倍、8倍等大尺度上采樣的問題。目前Lapsrn網(wǎng)絡(luò)和EUSR[18]網(wǎng)絡(luò)均采用了漸進上采樣的方式。通過對2倍上采樣網(wǎng)絡(luò)結(jié)構(gòu)堆疊,使各結(jié)構(gòu)之間參數(shù)共享,不僅實現(xiàn)了較好的上采樣效果,同時也有效縮短了訓(xùn)練時間。表1是ESUR網(wǎng)絡(luò)通過2種不同上采樣方法重建的圖像質(zhì)量對比(表中數(shù)字加粗表示最優(yōu)結(jié)果),PSNR和SSIM[19]是2種圖像質(zhì)量評價指標,可以看到,在Set5和Set14數(shù)據(jù)集上的4倍上采樣結(jié)果中,與直接上采樣相比,漸進上采樣效果更優(yōu)。

        Table 1 Comparison of reconstruction effects of different upsampling methods onSet5 and Set14 datasets of ESUR network表1 ESUR網(wǎng)絡(luò)中不同上采樣方法在Set5和Set14數(shù)據(jù)集上重建效果對比

        迭代上采樣的方法伴隨著迭代SR網(wǎng)絡(luò)的提出而得到應(yīng)用,最早出現(xiàn)在DBPN[20]網(wǎng)絡(luò)中,目前在DBPN和SRFBN[21]網(wǎng)絡(luò)中得到了應(yīng)用。迭代上采樣的方法使網(wǎng)絡(luò)能有效學(xué)習(xí)不同深度特征映射的上采樣特性,充分利用淺層和深層的不同特征映射重建上采樣圖像,由于在DBPN網(wǎng)絡(luò)和SRFBN網(wǎng)絡(luò)中展現(xiàn)的良好重建效果,迭代上采樣也成為近兩年SR領(lǐng)域的主流方法之一。

        目前常見的SR重建網(wǎng)絡(luò)都將不同整數(shù)尺度因子的SISR重建作為研究任務(wù),長期以來,任意尺度因子的SR重建網(wǎng)絡(luò)研究一直被忽略。Meta-SR[22]模型構(gòu)建了任意尺度SISR的網(wǎng)絡(luò)結(jié)構(gòu),通過引入元學(xué)習(xí)[23]的思想構(gòu)建元上采樣模塊,該模塊實際是通過一個全連接網(wǎng)絡(luò)預(yù)測上采樣卷積核參數(shù),從而實現(xiàn)圖像任意尺度的SR重建,其基本原理圖如圖2所示。

        Figure 2 Principle of arbitrary upsampling scale圖2 任意尺度上采樣原理

        3 模型結(jié)構(gòu)組成

        目前在SISR重建領(lǐng)域,根據(jù)網(wǎng)絡(luò)模型結(jié)構(gòu)組成不同,基于深度學(xué)習(xí)的網(wǎng)絡(luò)模型可分為以下3種:基于CNN的網(wǎng)絡(luò)模型、基于CNN-RNN(Convolutional Neural Network-Recurrent Neural Network)的網(wǎng)絡(luò)模型和基于生成對抗網(wǎng)絡(luò)GAN(Generative Adversarial Networks)的網(wǎng)絡(luò)模型[24]。其中基于CNN的網(wǎng)絡(luò)模型是該領(lǐng)域應(yīng)用最廣的模型。

        3.1 基于CNN的網(wǎng)絡(luò)模型

        基于CNN的SR網(wǎng)絡(luò)模型不同于一般任務(wù)的深度學(xué)習(xí)網(wǎng)絡(luò)模型,由于要實現(xiàn)圖像的尺度放大,SR網(wǎng)絡(luò)模型一般不使用池化層。基于CNN的網(wǎng)絡(luò)模型也可細分為直接連接模型、殘差連接模型、密集連接模型和注意力模型等模型結(jié)構(gòu)。

        SRCNN網(wǎng)絡(luò)是典型的直接連接結(jié)構(gòu),也是第1個用于SISR重建的CNN網(wǎng)絡(luò)結(jié)構(gòu),它包含了一個3層的淺層CNN,通過訓(xùn)練一組LR和對應(yīng)的HR圖像數(shù)據(jù),尋找一個最優(yōu)的模型F,將該模型應(yīng)用于未訓(xùn)練的測試數(shù)據(jù)X,精確預(yù)測X對應(yīng)的SR圖像。SRCNN網(wǎng)絡(luò)的基本模塊包括特征提取、非線性映射和圖像重建,如圖3所示,其中特征提取采用9×9的卷積核,SRCNN通過1×1的卷積核完成非線性映射,最后經(jīng)過5×5的卷積核完成圖像重建過程。通過使用大的卷積核使得淺層網(wǎng)絡(luò)也能獲得較大的感受野,因而僅僅只用3層卷積網(wǎng)絡(luò)就可以實現(xiàn)較好的SR重建效果。

        Figure 3 Model of SRCNN network圖3 SRCNN網(wǎng)絡(luò)模型

        FSRCNN[13]網(wǎng)絡(luò)在SRCNN的基礎(chǔ)上針對重建方法進行了改進,它主要包括5個模塊,分別是特征提取、收縮、映射、展開和反卷積。由于輸入是原始LR圖像,在重建層通過反卷積對輸入圖像進行尺度放大,因而相對于原始SRCNN網(wǎng)絡(luò)來說,該網(wǎng)絡(luò)降低了計算量,加快了模型訓(xùn)練,同時通過使用更小的卷積核和更深的網(wǎng)絡(luò)結(jié)構(gòu)提升了重建圖像質(zhì)量,ESPCN網(wǎng)絡(luò)主要也是針對SRCNN的重建層進行了改進,網(wǎng)絡(luò)輸入為LR圖像,在重建層采用亞像素卷積層使得網(wǎng)絡(luò)訓(xùn)練速度有了成倍的提高,適用于實時的視頻SR。

        以上3個模型結(jié)構(gòu)都是典型的直接連接的網(wǎng)絡(luò)模型,SRCNN網(wǎng)絡(luò)最主要的優(yōu)點就是網(wǎng)絡(luò)結(jié)構(gòu)非常簡單,使得模型實現(xiàn)以及調(diào)試非常容易,因而該網(wǎng)絡(luò)結(jié)構(gòu)非常適用于深度SR重建領(lǐng)域的初學(xué)者掌握基本方法。但是,SRCNN網(wǎng)絡(luò)模型的缺點也非常致命,大的卷積核的使用和網(wǎng)絡(luò)輸入是插值放大后的圖像使得淺層的網(wǎng)絡(luò)就需要大量的參數(shù)計算,導(dǎo)致該網(wǎng)絡(luò)在增加深度和寬度時反而引起SR重建效果的下降。相對于SRCNN,F(xiàn)SRCNN和ESPCN減少了計算參數(shù),同時也在一定程度上加深了網(wǎng)絡(luò)深度,使得重建效果和圖像重建質(zhì)量有了較大提高,特別是ESPCN,簡單的結(jié)構(gòu)組成和極高的重建速度使其特別適用于高速且重建精度要求不是很高的實時系統(tǒng)。直接連接的結(jié)構(gòu)面臨的最大問題就是隨著網(wǎng)絡(luò)深度的加深,參數(shù)逐漸增加,網(wǎng)絡(luò)訓(xùn)練的難度越來越大,導(dǎo)致網(wǎng)絡(luò)難以收斂,需要更有效的訓(xùn)練方法,因而直接連接網(wǎng)絡(luò)模型目前的發(fā)展已經(jīng)出現(xiàn)瓶頸。

        殘差網(wǎng)絡(luò)建模是目前應(yīng)用最廣泛的技術(shù),在現(xiàn)有的深度模型中幾乎都有應(yīng)用。殘差連接的成功應(yīng)用有效提高了ResNet[25]網(wǎng)絡(luò)的深度,因而在圖像SR重建領(lǐng)域也引起了極大關(guān)注。由于原始LR圖像和輸出的HR圖像在很大程度上是相似的,也就是說LR圖像攜帶的低頻信息與HR圖像的低頻信息基本一致。殘差連接的應(yīng)用使得原始的稠密矩陣學(xué)習(xí)轉(zhuǎn)化為稀疏矩陣學(xué)習(xí),因而使得計算量大幅度降低。Kim等人[7]于2016年提出了第1個基于殘差連接的網(wǎng)絡(luò)模型VDSR,如圖4所示。該網(wǎng)絡(luò)模型通過在輸入和輸出之間引入殘差連接,使模型對HR圖和LR圖的殘差進行建模,加上梯度剪裁的應(yīng)用,有效解決了網(wǎng)絡(luò)加深時無法訓(xùn)練的問題,將網(wǎng)絡(luò)深度提高到20層,同時VDSR通過對不同尺度大小圖像進行混合訓(xùn)練,使網(wǎng)絡(luò)可以實現(xiàn)單一模型的多尺度SR重建。RED30[26]利用卷積和反卷積構(gòu)造編碼器與解碼器結(jié)構(gòu),卷積層充當特征提取器,它保留圖像中對象的主要組件,反卷積層用于恢復(fù)圖像內(nèi)容的細節(jié),通過直接相連對應(yīng)的卷積和反卷積構(gòu)建殘差結(jié)構(gòu),使網(wǎng)絡(luò)深度有效提高到30層。

        Figure 4 Structural contrast diagram of VDSR、EDSR、DRRN圖4 VDSR、EDSR、DRRN網(wǎng)絡(luò)結(jié)構(gòu)對比圖

        EDSR[12]和DRRN[14]通過全局殘差降低網(wǎng)絡(luò)訓(xùn)練的難度,通過局部殘差學(xué)習(xí)更加精細的圖像細節(jié)。有所不同的是,EDSR僅僅是將2個卷積核構(gòu)建的模塊進行簡單的堆疊,如圖4b所示;而在DRRN網(wǎng)絡(luò)中,不僅通過多條殘差連接構(gòu)建了局部信息共享,同時在內(nèi)嵌殘差單元時引入遞歸循環(huán),如圖4c所示,通過遞歸循環(huán)的構(gòu)建從而在加深網(wǎng)絡(luò)的同時不帶來更多計算量,使得網(wǎng)絡(luò)模型在提高重建圖像質(zhì)量的同時,加快了收斂速度。圖4所示為VDSR、EDSR和DRRN的結(jié)構(gòu)對比圖。

        Lapsrn首次使用融合的方法實現(xiàn)SISR重建。引入融合機制可以對不同頻段的像素信息采用不同的SR重建方法,進一步均衡圖像重建質(zhì)量。Lapsrn網(wǎng)絡(luò)將原始LR圖像分解為高頻細節(jié)部分和低頻內(nèi)容部分,對高低頻采用不同的處理方法后將圖像融合,得到最終的SR重建圖像。網(wǎng)絡(luò)模型中設(shè)置2個支路,分別是特征提取支路和圖像重建支路,特征提取支路實現(xiàn)高頻特征提取和尺度放大,重建支路將低頻尺度放大后與高頻特征融合獲得重建圖像。Lapsrn網(wǎng)絡(luò)通過對2倍尺度SR模塊遞歸實現(xiàn)高倍尺度的重建,提升了網(wǎng)絡(luò)訓(xùn)練速度。

        IDN在VDSR的基礎(chǔ)上,引入多個信息蒸餾單元(DBblocks)作為網(wǎng)絡(luò)的基本結(jié)構(gòu),其中,信息蒸餾單元包括一個增強單元和一個壓縮單元。增強單元結(jié)構(gòu)如圖5a所示,包括2個3層的淺層CNN,通過獲取長短路徑的特征圖從而提升網(wǎng)絡(luò)的表達能力,壓縮單元通過1×1的卷積核壓縮增強單元提取的冗余特征。

        Figure 5 Enhance unit of IDN network and channel attention mechanism of RCAN network圖5 IDN網(wǎng)絡(luò)結(jié)構(gòu)增強單元 和RCAN網(wǎng)絡(luò)結(jié)構(gòu)的通道注意力機制

        殘差連接的優(yōu)點是使網(wǎng)絡(luò)在前向傳播時,輸入信號可以從任意低層直接傳播到高層。由于包含了天然的恒等映射,一定程度上可以解決網(wǎng)絡(luò)退化問題[27]。在反向傳播時,誤差信號不經(jīng)過任何中間權(quán)重矩陣變換,直接傳播到低層,該方法一定程度上緩解了梯度彌散問題,因而殘差連接使得原有的復(fù)雜矩陣的學(xué)習(xí)轉(zhuǎn)變?yōu)橄∈杈仃嚨膶W(xué)習(xí),極大地降低了網(wǎng)絡(luò)學(xué)習(xí)難度。但是,VDSR網(wǎng)絡(luò)為了使該網(wǎng)絡(luò)能夠以訓(xùn)練單一的模型實現(xiàn)多尺度的SR重建,因而采用插值放大的圖像作為輸入,這樣的方法使得網(wǎng)絡(luò)計算量大大增加,網(wǎng)絡(luò)深度受到限制;同時只引入單跳躍,使網(wǎng)絡(luò)信息流動提升不夠明顯,導(dǎo)致網(wǎng)絡(luò)收斂難度較大,網(wǎng)絡(luò)模型通過引入梯度剪裁的辦法使網(wǎng)絡(luò)能較好收斂,之后的EDSR等網(wǎng)絡(luò)就是針對這些問題進行了改進得到的。殘差連接由于結(jié)構(gòu)較為簡單,SR重建質(zhì)量也較好,因而能應(yīng)用在大多數(shù)的SR重建場景中。

        密集連接建模是受殘差連接的啟發(fā),在保證網(wǎng)絡(luò)中層與層之間最大程度的信息傳輸?shù)那疤嵯?,直接將所有層連接起來,使網(wǎng)絡(luò)中每一層輸入為之前卷積層輸出的總和,極大地增強了信息流動的能力,有效抑制了梯度爆炸和消失的問題。SRDesnet[28]將密集連接網(wǎng)絡(luò)結(jié)構(gòu)引入圖像SR重建領(lǐng)域,將8個完全一致的稠密塊進行堆疊,每個稠密塊為密集連接的8個卷積層,如圖5b所示,每個稠密塊獲取的特征進行融合重建SR圖像。密集連接的成功應(yīng)用使得圖像SR重建質(zhì)量有了明顯提升。RDN[29]是在SRDesnet稠密塊的基礎(chǔ)上改進直接堆疊連接的稠密塊,通過在密集結(jié)構(gòu)首尾引入殘差連接和1×1卷積進行特征降維,構(gòu)建RDN基本單元RDB,同時RDN網(wǎng)絡(luò)充分利用每個RDB學(xué)習(xí)的分層特征,分層特征的充分利用使該網(wǎng)絡(luò)模型具有更強的特征表達能力。Meta-SR網(wǎng)絡(luò)模型是在RDN網(wǎng)絡(luò)的基礎(chǔ)上,針對上采樣方式進行改進,實現(xiàn)了任意尺度上采樣。

        D-DBPN[20]是在密集連接的基礎(chǔ)上,通過構(gòu)建多個迭代的上下投影單元實現(xiàn)淺層特征到深層特征的映射,同時通過密集連接使該迭代單元的輸入為淺層網(wǎng)絡(luò)和投影網(wǎng)絡(luò)塊的輸出特征堆疊結(jié)果,這樣一來,淺層的信息通過直接的恒等映射能迅速傳遞到深層網(wǎng)絡(luò)結(jié)構(gòu)中,有助于緩解梯度問題。其基本結(jié)構(gòu)如圖6所示,圖中[L1,…,Lt-1]表示對直接傳遞的特征進行拼接。在投影單元內(nèi)構(gòu)建了交替連接的上下采樣和殘差連接,同時反饋網(wǎng)絡(luò)將HR圖像的預(yù)測過程分解為多個步驟,使網(wǎng)絡(luò)具有迭代自糾錯的能力。

        Figure 6 Up-down sampling projection unit of D-DBPN network圖6 D-DBPN網(wǎng)絡(luò)的上下采樣投影單元

        前面提到的網(wǎng)絡(luò)模型在空間域和通道域?qū)μ卣饔成溥M行等價處理,但在實際視覺環(huán)境中一幅圖像中存在不同重要性的區(qū)域和通道[30],等價處理將造成極大的計算資源浪費。RCAN網(wǎng)絡(luò)構(gòu)建了通道注意力結(jié)構(gòu),通過學(xué)習(xí)不同通道的重要性得到一個權(quán)重值,這相當于對信道間特征的相互關(guān)系進行建模,自適應(yīng)調(diào)整每個信道特征,從而在有效強化有用特征通道的同時抑制無用特征通道,使計算資源得到更充分的利用。通道注意力機制如圖7所示,其基本原理相當于對不同通道特征進行重新加權(quán)分布。圖7中,HGP運算提取通道描述符,WD和WO為2個全連接網(wǎng)絡(luò)層的參數(shù),f為非線性變換。同時,RCAN通過構(gòu)建局部殘差和全局殘差,使其成為目前圖像SR重建領(lǐng)域內(nèi)深度最深的網(wǎng)絡(luò)(可達1 000層),從而在現(xiàn)有的硬件條件下,RCAN在峰值信噪比PSNR指標上獲得了最佳結(jié)果。

        Figure 7 Channel attention mechanism of RCAN network圖7 RCAN網(wǎng)絡(luò)的通道注意力機制

        3.2 基于CNN-RNN的網(wǎng)絡(luò)模型

        傳統(tǒng)的CNN網(wǎng)絡(luò)采用的是單路徑的前饋網(wǎng)絡(luò),隨著網(wǎng)絡(luò)結(jié)構(gòu)的加深會引入更多的參數(shù),容易造成網(wǎng)絡(luò)規(guī)模過大,對硬件設(shè)備要求高,同時網(wǎng)絡(luò)訓(xùn)練時易出現(xiàn)過擬合的問題。遞歸神經(jīng)網(wǎng)絡(luò)就是充分利用參數(shù)共享機制,使其在不增加參數(shù)的情況下加深網(wǎng)絡(luò)的深度,降低網(wǎng)絡(luò)的復(fù)雜度,加快訓(xùn)練速度。

        DRCN[13]是第1個CNN-RNN結(jié)構(gòu)的深度網(wǎng)絡(luò),它通過循環(huán)使用同一個卷積層16次使網(wǎng)絡(luò)深度擴展到20層,因而相對于SRCNN網(wǎng)絡(luò)來說,DRCN卷積核的感受野也由原來的13×13擴展到41×41,從而網(wǎng)絡(luò)能夠?qū)W習(xí)到輸入圖像的更多細節(jié)特征,有效提升了圖像重建質(zhì)量。參數(shù)共享機制增加了網(wǎng)絡(luò)深度但并未帶來更多的參數(shù),因而能保持較快的訓(xùn)練速度。但是,遞歸網(wǎng)絡(luò)的應(yīng)用仍然無法避免較高的計算成本,同時會帶來固有的梯度消失和爆炸的問題,網(wǎng)絡(luò)構(gòu)建的多重監(jiān)督一定程度上減緩了梯度爆炸和消失問題,但該問題仍然是影響基于CNN-RNN的網(wǎng)絡(luò)模型重建的重要原因。由于傳統(tǒng)前向卷積網(wǎng)絡(luò)淺層卷積層特征對深層卷積層狀態(tài)影響較小,因而MemNet網(wǎng)絡(luò)[31]在DRCN的基礎(chǔ)上,通過添加門控單元構(gòu)建記憶塊結(jié)構(gòu)。該門控機制可以建立長期記憶,在每個記憶塊中,門控單元自適應(yīng)地控制不同的卷積層在最終輸出中所占的權(quán)重,控制保留哪些門控單元,存儲哪些信息,因而可以自適應(yīng)保留有用特征,其基本結(jié)構(gòu)如圖8a所示。

        SRFBN[21]以迭代反饋結(jié)構(gòu)為基礎(chǔ),構(gòu)建遞歸神經(jīng)網(wǎng)絡(luò)循環(huán)塊。SRFBN構(gòu)建了反饋模塊并對反饋狀態(tài)進行遞歸傳遞,使得遞歸模塊輸入為LR特征及上一次反饋模塊的隱含層的輸出特征,從而充分利用原始LR圖像引導(dǎo)圖像重建過程,獲得更好的SR重建圖像。如圖8b所示為SRFBN網(wǎng)絡(luò)基本單元。3.1節(jié)中提到的DRRN網(wǎng)絡(luò)模型也利用循環(huán)網(wǎng)絡(luò)實現(xiàn)參數(shù)共享。

        Figure 8 Elementary unit of MemNet network and SRFBN network圖8 MemNet和SRFBN網(wǎng)絡(luò)結(jié)構(gòu)的基本單元

        3.3 基于GAN的網(wǎng)絡(luò)模型

        生成對抗網(wǎng)絡(luò)GAN(Generative Adversarial Network)[25]是一種生成模型,SISR的任務(wù)目標也是生成HR圖像,因而GAN非常適宜于解決SISR問題。引入對抗訓(xùn)練能夠使網(wǎng)絡(luò)生成更加精細的紋理細節(jié)。生成器和鑒別器的協(xié)同訓(xùn)練,使網(wǎng)絡(luò)不再拘泥于在像素域判斷生成圖像與實際高分辨率圖像的相似程度,同時更加注重在像素空間中的分布相似程度。Ledig等人[8]提出了第1個基于GAN的網(wǎng)絡(luò)SRGAN,其中生成器采用多個殘差結(jié)構(gòu)完成特征映射,與3.1節(jié)中提到的基于殘差結(jié)構(gòu)的CNN網(wǎng)絡(luò)非常相似。SRGAN網(wǎng)絡(luò)生成器使用亞像素卷積實現(xiàn)上采樣,鑒別器通過二分類網(wǎng)絡(luò)結(jié)構(gòu)對生成圖像和HR圖像進行判別區(qū)分。生成器使生成的圖像盡可能混淆鑒別器的鑒別結(jié)果,鑒別器要盡可能地區(qū)分圖像真假,通過雙方博弈,生成對抗網(wǎng)絡(luò)結(jié)構(gòu),克服了3.1與3.2節(jié)中所提網(wǎng)絡(luò)模型重建圖像感知質(zhì)量差的缺點,生成的圖像更加自然,感知更好。

        ESRGAN[32]在SRGAN的基礎(chǔ)上進行網(wǎng)絡(luò)結(jié)構(gòu)改進。在生成網(wǎng)絡(luò)中,ESRGAN在構(gòu)建基礎(chǔ)網(wǎng)絡(luò)結(jié)構(gòu)中移除SRGAN網(wǎng)絡(luò)中的BN塊,以降低重建圖像中產(chǎn)生的偽影,將網(wǎng)絡(luò)殘差塊的順序連接轉(zhuǎn)化為密集連接,以充分利用各分層提取的特征,使生成網(wǎng)絡(luò)能夠更好地重建圖像。在判別網(wǎng)絡(luò)中ESRGAN將標準判別器更換為相對平均判別器[33],使網(wǎng)絡(luò)可以學(xué)習(xí)更尖銳的邊緣和更細節(jié)的紋理。

        Figure 9 Transformation principle of SR-WDST圖9 SR-WDST圖像變換原理

        SR-WDST[34]充分利用基于感知損失和像素損失的網(wǎng)絡(luò)的優(yōu)點,使用小波變換[35]提取基于像素損失模型和感知損失模型的低頻部分和高頻細節(jié);通過風(fēng)格變換轉(zhuǎn)換方式[36]將基于感知生成的高頻細節(jié)融合到基于像素的細節(jié)中,從而使高頻細節(jié)部分具有基于感知和基于像素的生成模型的雙重特點;對低頻細節(jié)部分通過VDSR進行再重建,以恢復(fù)更多像素細節(jié)部分;最后經(jīng)過小波逆變換[37]融合獲得重建圖像,提高了重建圖像感知和失真的均衡[38]。其圖像變換過程如圖9所示。圖9中,LLP、LHP、HLP和HHP為基于GAN網(wǎng)絡(luò)生成圖像經(jīng)小波分解得到的小波系數(shù),其中LLP為低頻小波系數(shù),LHP、HLP和HHP為高頻小波系數(shù),LL0、LH0、HL0和HH0為基于CNN網(wǎng)絡(luò)生成圖像的分解系數(shù),WDST指圖像風(fēng)格變換,LSE為VDSR圖像,ISWT指小波逆變換。

        基于GAN的網(wǎng)絡(luò)相對基于CNN的SR網(wǎng)絡(luò)獲得了更加接近真實感知的重建圖像,因此基于GAN的網(wǎng)絡(luò)更加適用于一些對觀感要求較高的任務(wù)。但是,由于更加注重像素分布特性,因而圖像整體像素的微調(diào)對圖像的真實感知不會有大的影響,而對于部分需要高精度的像素信息的任務(wù)(如遙感圖像超分辨用于軍事目標識別打擊),基于GAN的網(wǎng)絡(luò)模型明顯不適用。同時,基于GAN的網(wǎng)絡(luò)模型由于要協(xié)調(diào)生成器和鑒別器進行訓(xùn)練,網(wǎng)絡(luò)計算復(fù)雜,學(xué)習(xí)速率慢,同時也對硬件具有較高的要求,因而訓(xùn)練難度非常大。

        上面提到的3種不同的網(wǎng)絡(luò)具有不同的特性,因而具有不同的性能和應(yīng)用場景,其對比如表2所示。

        4 損失函數(shù)構(gòu)建

        SISR重建網(wǎng)絡(luò)的目的是找到一個最優(yōu)的網(wǎng)絡(luò)映射函數(shù)F,對于一組LR圖像X和其對應(yīng)的HR圖像Y,精確預(yù)測X對應(yīng)的SR圖像F(X),使得F(X)通過最大似然估計越接近于Y,重建圖像質(zhì)量越好。目前SISR領(lǐng)域常用的損失函數(shù)有基于像素的損失函數(shù)和基于感知的損失函數(shù)。

        4.1 基于像素的損失函數(shù)

        均方誤差MSE(Mean-Square Error)是最常用的損失函數(shù),在GAN被應(yīng)用于SR重建領(lǐng)域之前,大量的SR重建網(wǎng)絡(luò)中都使用MSE作為損失函數(shù)進行訓(xùn)練,MSE只是最大似然估計的一種特殊情況,其基本表達式如式(1)所示:

        Table 2 Advantages and disadvantages comparison of different network and applicable scenarios表2 不同網(wǎng)絡(luò)的優(yōu)缺點和適用場景對比

        (1)

        其中,L(Θ)表示網(wǎng)絡(luò)需要優(yōu)化的損失函數(shù),N表示每個訓(xùn)練批次中圖像的數(shù)目,Θ表示深度神經(jīng)網(wǎng)絡(luò)的參數(shù),F(xiàn)(Xi,Θ)為經(jīng)網(wǎng)絡(luò)實現(xiàn)超分辨后的圖像,Yi表示對應(yīng)的HR圖像。最小均方誤差的應(yīng)用有效解決了SR重建圖像與目標HR圖像之間差值衡量問題,使得基于深度學(xué)習(xí)的圖像SR模型相對傳統(tǒng)基于學(xué)習(xí)的SR重建模型有了較大的提高。與MSE相同,平均絕對值誤差MAE(Mean-Absolute Error)也是最大似然估計的一種特殊情況。理論上基于L1的損失函數(shù)相對基于L2的損失函數(shù)具有更小的計算量,在EDSR網(wǎng)絡(luò)模型中引入MAE損失函數(shù),網(wǎng)絡(luò)重建圖像的質(zhì)量也有一定的提高。平均絕對值誤差(MAE)的基本表達式如式(2)所示:

        (2)

        其基本符號意義與式(1)中一致。一般來說,對回歸模型進行預(yù)測時,需要使模型在訓(xùn)練數(shù)據(jù)上損失函數(shù)值最小,即經(jīng)驗風(fēng)險函數(shù)最小化。但是,如果只考慮經(jīng)驗風(fēng)險,容易造成過擬合,因此還需要考慮模型的泛化能力。常用方法便是在目標函數(shù)中引入正則項,文獻[17]在L1的基礎(chǔ)上提出了一個魯棒的損失函數(shù),其表達式如式(3)所示:

        (3)

        不論是基于LMSE的損失函數(shù)還是基于LMAE的損失函數(shù),本質(zhì)上都是反映對應(yīng)像素之間的誤差關(guān)系,忽略了像素與鄰域像素間存在的內(nèi)在聯(lián)系,因而重建圖像質(zhì)量存在邊緣模糊和振鈴現(xiàn)象?;谙袼氐膿p失函數(shù)對圖像的微小變化非常敏感,例如,圖像一個像素的移動造成的視覺影響非常小,人眼感知沒有差別,但是會造成評價值PSNR的顯著降低,因而其非常適合用于高精度要求的任務(wù)。

        4.2 基于感知的損失函數(shù)

        基于像素的損失函數(shù)是一種低水平的損失表示方式,導(dǎo)致圖像重建質(zhì)量與人眼視覺感知差距比較大。基于感知的損失函數(shù)可以恢復(fù)更多的高頻信息,使重建圖像感觀質(zhì)量更佳。目前SR網(wǎng)絡(luò)感知損失函數(shù)通常是內(nèi)容損失函數(shù)、對抗損失函數(shù)和上下文損失函數(shù)[39]的組合形式。

        內(nèi)容損失函數(shù)包括特征重建損失函數(shù)和風(fēng)格重建損失函數(shù)。特征重建損失函數(shù)在最小均方誤差或最小絕對值誤差的基礎(chǔ)上,通過預(yù)訓(xùn)練的網(wǎng)絡(luò)結(jié)構(gòu)提取SR圖像和HR圖像在不同網(wǎng)絡(luò)層所得的特征向量,最小化提取的特征向量之間的MSE或者MAE。Bruna等人[40]最早提出特征重建損失,通過預(yù)訓(xùn)練的VGG19網(wǎng)絡(luò)分別提取重建SR圖像和HR圖像在特征空間中對應(yīng)的特征映射并進行對比。事實證明,通過特征重建損失的應(yīng)用使重建圖像在視覺上獲得了相對基于像素損失更令人信服的結(jié)果?;谔卣髦亟ǖ膿p失函數(shù)基本表達式如式(4)所示:

        (4)

        為了使重建SR圖像與HR圖像的顏色、紋理等保持一致,Gatys等人[41]提出了風(fēng)格重建損失函數(shù),該損失函數(shù)是在特征重建損失函數(shù)的基礎(chǔ)上,定義了一個Gram矩陣,如式(5)所示:

        (5)

        (6)

        SRGAN網(wǎng)絡(luò)構(gòu)建的損失函數(shù)中除了基礎(chǔ)的內(nèi)容損失,還包括對抗損失。圖像其實是一種高維概率分布的樣本,基于GAN的網(wǎng)絡(luò)模型就是為使重建圖像具有與真實HR圖像盡可能一致的概率分布。在面對復(fù)雜的自然圖像分布時,構(gòu)建包含對抗損失的目標函數(shù)進行對抗訓(xùn)練能使重建圖像更加自然。對抗損失函數(shù)的基本形式如式(7)所示:

        (7)

        其中,DθD(GθG(X))表示生成圖像GθG(X)是真實的HR圖像的可能性,N表示一個批次內(nèi)的圖像個數(shù),θD和θG分別表示鑒別網(wǎng)絡(luò)和生成網(wǎng)絡(luò)的參數(shù)。SRGAN網(wǎng)絡(luò)最終的優(yōu)化目標是一個最小最大化的問題,如式(8)所示:

        EILR~PG(ILR)[1-logDθD(GθG(ILR))]

        (8)

        其中,Ptrain(IHR)表示標簽HR圖像分布,即抽樣的每個Ptrain(IHR)服從Ptrain(IHR)分布。PG(ILR)表示LR圖像分布,對抗訓(xùn)練使得生成的SR圖像與真實的HR圖像高度相似,從而判別網(wǎng)絡(luò)難以分辨,最終獲得可以以假亂真的SR圖像。ESRGAN在SRGAN的基礎(chǔ)上,將判別網(wǎng)絡(luò)的判別器改為相對平均判別器, SRGAN的判別目標為輸入圖像是否是真,ESRGAN的判別目標為預(yù)測真實HR圖像比生成SR圖像更真實的概率。判別網(wǎng)絡(luò)如式(9)和式(10)所示:

        D(Xr)=σ(C(real))→1,

        D(Xf)=σ(C(fake))→0

        (9)

        DRa(Xr,Xf)=σ(C(real)-Ε[C(fake)])→1,

        DRa(Xf,Xr)=σ(C(fake)-Ε[C(real)])→0

        (10)

        式(9)為SRGAN的判別網(wǎng)絡(luò)原理,式(10)為ESRGAN相對判別器原理。real表示真實HR圖像,fake表示生成SR圖像,C(real)表示鑒別網(wǎng)絡(luò)判斷結(jié)果,E[C(fake)]表示一個批次所有生成SR圖像經(jīng)過鑒別網(wǎng)絡(luò)鑒別的結(jié)果的均值。其中σ表示Sigmoid函數(shù),通過改進判別器幫助網(wǎng)絡(luò)學(xué)習(xí)更銳利的邊緣和細致的紋理特征。

        內(nèi)容損失函數(shù)配合對抗損失函數(shù)是GAN訓(xùn)練的基本方法,GAN網(wǎng)絡(luò)重建的結(jié)果相對真實,更符合人眼感知。但是,GAN也存在缺陷,如非常難收斂,訓(xùn)練難度大,重建結(jié)果影響因素多。為降低訓(xùn)練難度并保證感知質(zhì)量,Roey等人[39]提出了上下文損失函數(shù),通過最小化真實圖像與重建圖像在特征空間中的統(tǒng)計分布來提升圖像重建質(zhì)量。上下文損失函數(shù)通過最小化KL散度[42]實現(xiàn)特征統(tǒng)計分布的一致性。損失函數(shù)表達如式(11)所示:

        (11)

        (12)

        5 實驗方法及結(jié)果分析

        本節(jié)主要對本文所提算法進行比較分析。通過在測試數(shù)據(jù)集上對PSNR、SSIM和NRQM[43]指標進行對比,比較各算法的有效性。常用的SR任務(wù)訓(xùn)練數(shù)據(jù)集為DIV2K[44],它是NTIRE超分辨率比賽專用的訓(xùn)練數(shù)據(jù)集,包括800幅訓(xùn)練數(shù)據(jù)圖像、100幅驗證數(shù)據(jù)圖像和100幅測試數(shù)據(jù)圖像,均為2K的HR圖像,包含了自然界中豐富的圖像紋理細節(jié),同時也包括對應(yīng)不同尺度下采樣的LR圖像,非常適宜圖像SR任務(wù)。在實驗中,需要將數(shù)據(jù)集中的圖像進行對應(yīng)裁剪,以適應(yīng)不同SR網(wǎng)絡(luò)訓(xùn)練。測試數(shù)據(jù)集為Set5、Set14和BSD100等基準數(shù)據(jù)集,它們分別包括5幅、14幅和100幅圖像對。為公平比較各算法的重建效果,本文選取了Set5、Set14和BSD100數(shù)據(jù)集作為測試數(shù)據(jù)集,對4倍尺度SR結(jié)果進行比較,基于像素損失函數(shù)重建方法的各網(wǎng)絡(luò)結(jié)果比較如表3所示。

        表3展示了包括Bicubic和17個本文提到的基于深度學(xué)習(xí)的超分辨網(wǎng)絡(luò)。Bicubic指的是通過雙線性插值直接對圖像尺度進行放大,通過插值相鄰像素,學(xué)習(xí)隱含在其中的亞像素的值,從而獲得尺度放大后的圖像。通過對這18個網(wǎng)絡(luò)分析可以看到,基于深度學(xué)習(xí)的圖像SR網(wǎng)絡(luò)相對傳統(tǒng)SR模型在重建質(zhì)量上取得了質(zhì)的飛躍,同時近年來圖像SR重建領(lǐng)域網(wǎng)絡(luò)結(jié)構(gòu)也呈現(xiàn)不斷加深的趨勢。殘差網(wǎng)絡(luò)結(jié)構(gòu)構(gòu)建使VDSR克服了SRCNN網(wǎng)絡(luò)無法通過加深網(wǎng)絡(luò)提高性能的問題,DRCN和DRRN通過構(gòu)建遞歸循環(huán),有效實現(xiàn)了參數(shù)共享機制,使得網(wǎng)絡(luò)加深的同時不引入過多的參數(shù),提高重建圖像質(zhì)量的同時保證了較快的訓(xùn)練速度。ESPCN中的亞像素卷積層,有效解決了上采樣的速度與質(zhì)量均衡的問題,使得實時視頻上采樣問題得到了解決。SRDesnet充分利用分層網(wǎng)絡(luò)提取的特征映射,保證了信息流的有效傳遞,為圖像重建提供了更多的參考信息。通道注意力機制的應(yīng)用進一步提升了網(wǎng)絡(luò)自適應(yīng)通道處理能力,通過構(gòu)建殘差結(jié)構(gòu)和通道注意力機制,RCAN結(jié)構(gòu)深度可以達到1 000層,同時也獲得了最好的圖像重建效果。表3中加粗的數(shù)據(jù)表示現(xiàn)有模型中最佳的SR重建效果。Meta-SR[22]實現(xiàn)了任意尺度SR,使得圖像SR應(yīng)用更加廣泛。

        Table 3 Comparison of SISR models based on pixel loss function表3 基于像素損失函數(shù)的SISR深度模型的比較

        基于像素損失函數(shù)始終無法避免的問題是重建圖像丟失過多的高頻信息,邊緣平滑,與人眼視覺感知仍存在較大差距。感知損失函數(shù)的應(yīng)用一定程度上提高了圖像人眼視覺感知的質(zhì)量。表4展示了基于感知損失函數(shù)與基于像素損失函數(shù)網(wǎng)絡(luò)在Set14數(shù)據(jù)集上4倍尺度SR結(jié)果的比較(加粗數(shù)據(jù)表示每項評測指標最佳值)。其中L2表示MSE函數(shù),L1表示MAE損失函數(shù),LC表示感知損失中的內(nèi)容損失函數(shù),LGAN表示對抗損失函數(shù),LCX表示上下文損失函數(shù)。為了更好地比較分析,對基于像素損失函數(shù)和基于感知損失函數(shù)的重建圖像進行可視化結(jié)果比較,如圖10所示。

        Table 4 Comparison of SISR models with different loss functions表4 不同類型損失函數(shù)SISR深度模型的比較

        Figure 10 Visualized reconstruction results of different networks on Set14圖10 不同重建網(wǎng)絡(luò)在Set14數(shù)據(jù)集上重建結(jié)果可視化

        通過表4可以看到,在PSNR評價指標上,相對EDSR等基于像素的損失函數(shù)網(wǎng)絡(luò),基于感知損失函數(shù)網(wǎng)絡(luò)在PSNR值有所降低。但是,通過圖10對比可以發(fā)現(xiàn),基于感知損失函數(shù)的網(wǎng)絡(luò)重建圖像邊緣更加清晰、紋理更加豐富,也更符合人眼感知,引入上下文損失和對抗損失的CX網(wǎng)絡(luò)模型在NRQM指標上取得了最好的效果,SR-WDST以基于感知和基于像素損失函數(shù)的網(wǎng)絡(luò)為基礎(chǔ),在視覺感知和像素精確度之間取得了較好的均衡,圖像重建效果更接近感知失真界。

        6 結(jié)束語

        SISR技術(shù)目前已經(jīng)在安防、醫(yī)療等領(lǐng)域內(nèi)得到重要的應(yīng)用,是計算機視覺領(lǐng)域的一個重點研究方向。盡管目前深度學(xué)習(xí)技術(shù)在SISR重建任務(wù)中取得較大成功,但仍然暴露出許多亟待解決的問題??偟膩碚f,作者認為未來深度神經(jīng)網(wǎng)絡(luò)在SISR重建任務(wù)中的發(fā)展趨勢體現(xiàn)在以下幾個方面:

        (1)構(gòu)建輕量有效和高精度2類重建網(wǎng)絡(luò)。網(wǎng)絡(luò)模型可分為2個主要發(fā)展方向,分別是輕量有效的網(wǎng)絡(luò)和高精度的重建。不同的應(yīng)用場景對SR重建效果有著不同的要求,對于對重建速度要求高的應(yīng)用場景,諸如娛樂視頻網(wǎng)站、生活照片修復(fù)等場景,輕量有效的網(wǎng)絡(luò)滿足該場景對重建速度的要求,同時注意力機制、殘差連接、特征融合的應(yīng)用也可以使輕量有效的網(wǎng)絡(luò)具有更好的特征表達能力,實現(xiàn)較好的重建效果。而對于一些軍事應(yīng)用場景,諸如敵情偵查、安全搜救等領(lǐng)域,相對于重建速度,重建的精度要求更加嚴格,因而作者認為輕量有效的網(wǎng)絡(luò)和高精度的重建網(wǎng)絡(luò)都是SR模型發(fā)展的重要方向。

        (2)設(shè)計更加科學(xué)合理的損失函數(shù)。隨著感知損失函數(shù)的提出,SISR重建任務(wù)中恢復(fù)了更多的高頻紋理細節(jié),但同時帶來了PSNR評價指標的下降。因此,低失真和高感知是一個相對矛盾的問題。未來SISR重建任務(wù)要求結(jié)合人眼視覺感知系統(tǒng),提出更加符合人眼感知的損失函數(shù);自注意力機制目前在超分辨重建模型中展現(xiàn)了良好的性能,因而其技術(shù)也可以用于基于GAN的網(wǎng)絡(luò)[45,46],同時結(jié)合任務(wù)需要,在低失真和高感知之間取得均衡。現(xiàn)有網(wǎng)絡(luò)ESRGAN和SR-WDST已經(jīng)在此方面做出了探索。

        (3)構(gòu)建多任務(wù)的SR網(wǎng)絡(luò)?,F(xiàn)有的SR網(wǎng)絡(luò)通常為單任務(wù)的網(wǎng)絡(luò)框架,是以數(shù)據(jù)驅(qū)動的網(wǎng)絡(luò)。實際上,SR重建也可以有效提升圖像目標識別、語義分割的效果,因而構(gòu)建包含SR重建任務(wù)的多任務(wù)網(wǎng)絡(luò)也是未來的一個趨勢。

        猜你喜歡
        網(wǎng)絡(luò)結(jié)構(gòu)殘差尺度
        基于雙向GRU與殘差擬合的車輛跟馳建模
        基于殘差學(xué)習(xí)的自適應(yīng)無人機目標跟蹤算法
        財產(chǎn)的五大尺度和五重應(yīng)對
        基于遞歸殘差網(wǎng)絡(luò)的圖像超分辨率重建
        宇宙的尺度
        太空探索(2016年5期)2016-07-12 15:17:55
        基于互信息的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)
        知識網(wǎng)絡(luò)結(jié)構(gòu)維對于創(chuàng)新績效的作用機制——遠程創(chuàng)新搜尋的中介作用
        滬港通下A+ H股票網(wǎng)絡(luò)結(jié)構(gòu)演化的實證分析
        復(fù)雜網(wǎng)絡(luò)結(jié)構(gòu)比對算法研究進展
        平穩(wěn)自相關(guān)過程的殘差累積和控制圖
        河南科技(2015年8期)2015-03-11 16:23:52
        亚洲av成人噜噜无码网站| 少妇邻居内射在线| 亚洲免费天堂| 久久久精品国产亚洲AV蜜| 日本五十路熟女在线视频| 中文字幕亚洲精品在线| 国产精品久久久久9999无码| 无码人妻av免费一区二区三区| 荡女精品导航| 国产一区二区三区视频大全| 男女视频在线观看一区二区| 国产一区二区三区视频网| 色综合天天综合欧美综合| 亚洲性无码一区二区三区| 蜜臀av免费一区二区三区| 99久久国语露脸国产精品| 最新在线观看免费的a站国产| 日本精品视频一区二区三区四区| 国产激情久久久久影院老熟女免费| 久久综合给日咪咪精品欧一区二区三| 国产av熟女一区二区三区老牛| 麻豆69视频在线观看| 久久久久夜夜夜精品国产| 国精无码欧精品亚洲一区| 日韩精品国产自在欧美| 日本久久一区二区三区高清| 少妇精品揄拍高潮少妇桃花岛| 国产婷婷色一区二区三区深爱网| 亚洲av无码一区二区三区观看| 国产va精品免费观看| 蜜桃在线视频一区二区| 亚洲高清乱码午夜电影网| 亚洲中久无码永久在线观看软件| 国产女主播免费在线观看| 亚洲国产一区二区网站| 国产精品久久久久久人妻无| 最近中文字幕大全在线电影视频| 亚洲熟妇AV一区二区三区宅男| 成人亚洲av网站在线看| 少妇久久久久久人妻无码| 久久亚洲国产精品成人av秋霞|