胥禎浩,沈 茜,李 霞
中國(guó)計(jì)量大學(xué) 信息工程學(xué)院,杭州 310018
磁共振成像技術(shù)(magnetic resonance imaging,MRI)[1]通過(guò)外加磁場(chǎng),激發(fā)氫原子產(chǎn)生共振,并捕捉在共振過(guò)程中釋放的電磁信號(hào)進(jìn)行成像操作。其與X射線、CT等醫(yī)學(xué)影像技術(shù)相比,具有無(wú)創(chuàng)傷、無(wú)電離輻射等優(yōu)點(diǎn),因而成為臨床診斷中常用的輔助診斷技術(shù)[2]。MR采集到的數(shù)據(jù)為K空間數(shù)據(jù),對(duì)其進(jìn)行逆傅里葉變換即可得到MR圖像。其中K空間數(shù)據(jù)點(diǎn)越多,形成的圖像分辨率也就越高。但高質(zhì)量的MR圖像意味著更長(zhǎng)的掃描時(shí)間,從而造成以下一系列問(wèn)題:(1)某些需要短時(shí)間掃描的場(chǎng)合,由于器官運(yùn)動(dòng)(例如呼吸、眨眼、吞咽等非自主運(yùn)動(dòng))造成圖像偽影。(2)磁共振成像環(huán)境較為封閉,過(guò)長(zhǎng)的掃描時(shí)間導(dǎo)致病人產(chǎn)生幽閉恐懼心理,產(chǎn)生不自覺(jué)移動(dòng),降低成像質(zhì)量[3]。因此,研究如何在短時(shí)間內(nèi)快速獲取高質(zhì)量的MR圖像具有重要的實(shí)用價(jià)值和現(xiàn)實(shí)意義。
壓縮感知(compressed sensing,CS)原理[4]被Lustig等人[5]應(yīng)用于MRI的采樣和重建任務(wù)中,該理論以信號(hào)的稀疏性為前提,通過(guò)觀測(cè)矩陣對(duì)稀疏信號(hào)壓縮采樣,從欠采樣的信號(hào)中得到重建MR圖像。雖然CS-MRI在一定程度上加快了K空間的重建,但是其仍然存在很多限制[6-7]:(1)目前CS-MRI使用的稀疏變換過(guò)于簡(jiǎn)單,無(wú)法捕捉復(fù)雜圖像細(xì)節(jié)。(2)非線性優(yōu)化解算器通常涉及迭代計(jì)算和更新,這往往會(huì)延長(zhǎng)重建時(shí)間。(3)CS-MRI中不合適的超參數(shù)預(yù)測(cè),會(huì)導(dǎo)致重建圖像過(guò)于平滑以及不自然。
近年來(lái)隨著深度學(xué)習(xí)的發(fā)展,利用卷積神經(jīng)網(wǎng)絡(luò)強(qiáng)大的特征提取能力,較大地改善了傳統(tǒng)重建技術(shù)的不足。Li等人[6]提出structure-enhanced GAN(SEGAN)結(jié)構(gòu),SEGAN在生成器部分使用一個(gè)全新結(jié)構(gòu)SU-net,在SU-net每一層的網(wǎng)絡(luò)中使用多尺寸卷積核,并將其合并以增強(qiáng)特征表達(dá)能力。Hyun等人[8]通過(guò)使用U-net[9]結(jié)構(gòu),僅利用29%的K空間信息就重建出高質(zhì)量的MR圖像。Seitzer等人[10]提出一個(gè)二階段的訓(xùn)練過(guò)程,將重建任務(wù)和改善視覺(jué)質(zhì)量任務(wù)分成兩個(gè)階段來(lái)訓(xùn)練,提高重建后圖像的視覺(jué)感受。Schlemper等人[11]通過(guò)對(duì)卷積網(wǎng)絡(luò)的級(jí)聯(lián)來(lái)實(shí)現(xiàn)對(duì)欠采樣MR圖像的重建。Yang等人[12]通過(guò)將交替方向乘子法(ADMM)與CNN進(jìn)行聯(lián)合,加快了重建時(shí)間。
雖然目前利用卷積神經(jīng)網(wǎng)絡(luò)對(duì)MRI圖像進(jìn)行重建已經(jīng)取得了諸多成果,但仍存在一些問(wèn)題,如:(1)現(xiàn)階段常用模型是通過(guò)增加網(wǎng)絡(luò)深度和寬度實(shí)現(xiàn)重建性能提升,未能充分利用網(wǎng)絡(luò)感受野實(shí)現(xiàn)偽影去除。(2)現(xiàn)研究MR圖像重建算法更多關(guān)注PSNR指標(biāo)的提升,缺少對(duì)重建圖像視覺(jué)感受的重視。
針對(duì)以上問(wèn)題,將生成對(duì)抗網(wǎng)絡(luò)(generative adversarial network,GAN)[13]作為重建算法原型,利用較少的K空間數(shù)據(jù)即可得到較高質(zhì)量的MR圖像,極大縮短了掃描時(shí)間。本文主要貢獻(xiàn)為:(1)將U-net結(jié)構(gòu)作為GAN網(wǎng)絡(luò)的生成器原型,在其編碼層部分使用殘差結(jié)構(gòu),通過(guò)殘差映射等方式緩解網(wǎng)絡(luò)梯度消失的問(wèn)題,提高特征利用率。(2)提出空洞金字塔結(jié)構(gòu)并將其連接于解碼層之前,通過(guò)使用不同擴(kuò)張率的空洞卷積[14]來(lái)捕獲不同尺度的上下文信息,提高模型對(duì)偽影和細(xì)節(jié)的判別能力。(3)生成器的損失函數(shù)除了使用原始均方誤差和對(duì)抗損失外,還添加感知損失,利用生成圖像和目標(biāo)圖像在特征空間的歐式距離,提高兩者之間的語(yǔ)義相似度,改善視覺(jué)感受。(4)為進(jìn)一步提升MR圖像重建質(zhì)量,在保留原始模型優(yōu)勢(shì)的基礎(chǔ)上引入集成學(xué)習(xí),對(duì)多個(gè)學(xué)習(xí)器進(jìn)行組合以實(shí)現(xiàn)網(wǎng)絡(luò)總體性能的提升。
本文數(shù)據(jù)集選用open access series of imaging studies(OASIS)大型開(kāi)源數(shù)據(jù)集。為了證明模型能適應(yīng)各種采樣率下的MR圖像重建,使用四種不同的采樣因子分別為10、5、3、2來(lái)獲取欠采樣MR圖像,即分別獲取10%、20%、30%、50%的K空間數(shù)據(jù),并進(jìn)行逆傅里葉變換,實(shí)現(xiàn)空間域到圖像域的映射。
基于Hyun等人的理論[8],在采樣時(shí)添加低頻信息,能有效解決位置不確定的問(wèn)題,并且可以保留更多的細(xì)節(jié)信息。在保持上述采樣因子不變的情況下,額外添加4%的低頻信息段,采樣結(jié)果如圖1所示。
圖1 不同采樣操作的MR圖像Fig.1 MR images of different sampling rate
一般情況下,深度學(xué)習(xí)中擁有的數(shù)據(jù)樣本越多,模型的性能越好。由于醫(yī)療圖像數(shù)量的稀缺性,將采用數(shù)據(jù)增強(qiáng)的方式擴(kuò)充數(shù)據(jù)量,使模型更加穩(wěn)健。本文使用在線隨機(jī)增強(qiáng)的方式來(lái)提高模型的魯棒性,在線隨機(jī)增強(qiáng)的方法是每次只獲取一個(gè)批量(batch)的數(shù)據(jù)并對(duì)其進(jìn)行隨機(jī)增強(qiáng),相比離線數(shù)據(jù)增強(qiáng),這極大緩解了硬盤的存儲(chǔ)壓力。本文用四種不同的方式以相同的概率值進(jìn)行隨機(jī)增強(qiáng),以確保數(shù)據(jù)的重復(fù)性保持在較低的水平。以0.25的概率使用上下翻轉(zhuǎn)的增強(qiáng)方式,0.25的概率采用水平鏡像,0.25的概率使用90°倍數(shù)旋轉(zhuǎn)方式,0.25的概率采用平移增強(qiáng)方式。通過(guò)在線隨機(jī)增強(qiáng)降低了模型對(duì)目標(biāo)位置的敏感性,使原本較難收斂的模型快速收斂,提高模型性能。
重建網(wǎng)絡(luò)由兩部分組成:生成器網(wǎng)絡(luò)(簡(jiǎn)稱生成器)和判別器網(wǎng)絡(luò)(簡(jiǎn)稱判別器)。生成器主要學(xué)習(xí)如何將欠采樣MR圖像映射到全采樣圖像的過(guò)程,判別器則主要完成判斷生成器圖像是否“真實(shí)自然”的過(guò)程。
本文以生成對(duì)抗網(wǎng)絡(luò)為原型,生成器部分采用U-net結(jié)構(gòu),考慮到重建任務(wù)本身需要極強(qiáng)的上下文信息提出了空洞金字塔結(jié)構(gòu)并將其連接于U-net解碼層之前,以此實(shí)現(xiàn)上下文信息融合。在判別器中連續(xù)使用8個(gè)卷積層,卷積核個(gè)數(shù)隨著網(wǎng)絡(luò)層數(shù)加深不斷增加。遵循Radford等人[15]總結(jié)的體系結(jié)構(gòu)準(zhǔn)則,在判別器網(wǎng)絡(luò)中避免使用最大池化層,轉(zhuǎn)而采用改變卷積步長(zhǎng)的方式來(lái)實(shí)現(xiàn)特征下采樣,最后通過(guò)兩個(gè)全連接層和sigmoid激活函數(shù)對(duì)圖像進(jìn)行分類,生成對(duì)抗網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示。
圖2 生成對(duì)抗網(wǎng)絡(luò)結(jié)構(gòu)Fig.2 Structure of generative adversarial network
重建網(wǎng)絡(luò)的具體流程為:首先對(duì)原始數(shù)據(jù)進(jìn)行傅里葉變換獲取K空間數(shù)據(jù),然后對(duì)K空間數(shù)據(jù)以不同采樣因子進(jìn)行欠采樣操作且對(duì)其進(jìn)行逆傅里葉變換,以獲取欠采樣圖像作為生成器的輸入。將欠采樣圖像喂入生成器,利用卷積神經(jīng)網(wǎng)絡(luò)的特征學(xué)習(xí)能力實(shí)現(xiàn)輸入圖像與全采樣MR圖像之間的映射,并將重建后的MR圖像和全采樣圖像送入判別器判斷圖像來(lái)源。最后,生成器和判別器通過(guò)反向傳播不斷交替訓(xùn)練和優(yōu)化,使兩者達(dá)到平衡[16],實(shí)現(xiàn)低質(zhì)量MR圖像到高質(zhì)量圖像的重建。
1.3.1 生成器網(wǎng)絡(luò)
本文的生成器結(jié)構(gòu)如圖3所示,主要功能是通過(guò)神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)去除欠采樣MR圖像偽影的功能。其中U-net結(jié)構(gòu)由兩部分組成,左邊為編碼層用于特征提取,右邊為解碼層通過(guò)插值方式將特征放大并使用跳躍連接將編碼層對(duì)應(yīng)的尺度特征進(jìn)行拼接。
圖3 生成器網(wǎng)絡(luò)結(jié)構(gòu)Fig.3 Structure of generator network
在編碼層部分,使用了殘差結(jié)構(gòu)來(lái)進(jìn)行特征提取,此結(jié)構(gòu)由殘差映射和恒等映射兩部分組成,使用此模塊能較好地緩解網(wǎng)絡(luò)隨著深度的加深而產(chǎn)生梯度消失或者網(wǎng)絡(luò)退化等問(wèn)題。
如圖4(a)與(b)所示,H(x)為卷積神經(jīng)網(wǎng)絡(luò)中若干非線性網(wǎng)絡(luò)層的目標(biāo)映射,其中x為網(wǎng)絡(luò)的輸入,而殘差網(wǎng)絡(luò)則需要去擬合殘差映射F(x)。
圖4 普通網(wǎng)絡(luò)模塊與殘差網(wǎng)絡(luò)模塊結(jié)構(gòu)Fig.4 Structure of convolutional unit and residual unit
其數(shù)學(xué)表達(dá)式為:
結(jié)合上述公式及圖4可知?dú)埐顚W(xué)習(xí)比直接對(duì)原始特征進(jìn)行學(xué)習(xí)更為容易。當(dāng)F(x)=0時(shí),卷積堆疊層可實(shí)現(xiàn)恒等映射,保證了網(wǎng)絡(luò)性能的不受影響,事實(shí)上F(x)并不會(huì)一直為0,這樣卷積堆疊層可在輸入的基礎(chǔ)上學(xué)習(xí)到新特征提升性能。
K空間欠采樣過(guò)程因打破奎奈斯特-香農(nóng)采樣定理產(chǎn)生了大量偽影,而網(wǎng)絡(luò)感受野的增大能有效幫助模型區(qū)分偽影和真實(shí)的細(xì)節(jié)信息[17]。因此在進(jìn)入解碼層之前,將編碼層的輸出特征送入提出的空洞金字塔結(jié)構(gòu),來(lái)增大網(wǎng)絡(luò)的感受野。該結(jié)構(gòu)如圖5所示,其相較于標(biāo)準(zhǔn)卷積的不同之處是引入了新的參數(shù)——擴(kuò)張率d,該參數(shù)定義了卷積核處理數(shù)據(jù)時(shí)各值的間距,即在連續(xù)的濾波器值之間引入d-1個(gè)0,如灰色部分。在不增加參數(shù)量和計(jì)算量的前提下,將原本感受野為k的標(biāo)準(zhǔn)卷積擴(kuò)大到了k+(k-1)×(d-1),如綠色部分。本文使用了三種不同擴(kuò)張率(分別為1、2、4)的空洞卷積,利用空洞卷積代替最大池化等增加網(wǎng)絡(luò)感受野的操作,能在分辨率恢復(fù)時(shí)對(duì)特征圖進(jìn)行更密集的計(jì)算,更為重要的是,將不同擴(kuò)張率的多個(gè)空洞卷積進(jìn)行并行操作,再利用1×1卷積將特征融合,可實(shí)現(xiàn)對(duì)目標(biāo)的多尺度捕獲,從而提升重建質(zhì)量。
圖5 空洞金字塔結(jié)構(gòu)Fig.5 Structure of atrous pyramid
在解碼層中,通過(guò)跳躍連接將編碼層同層信息與前一層上采樣信息進(jìn)行拼接,實(shí)現(xiàn)不同層次特征融合,不僅為重建提供了抽象的語(yǔ)義信息,同時(shí)也提供了淺層信息的細(xì)節(jié)特征,從而進(jìn)一步提高了MR圖像重建質(zhì)量。
1.3.2 判別器網(wǎng)絡(luò)
判別器主要功能是對(duì)輸入的MR圖像來(lái)源進(jìn)行判斷區(qū)分,具體結(jié)構(gòu)如圖6所示。判別網(wǎng)絡(luò)由一系列卷積組成,通過(guò)卷積步長(zhǎng)的改變實(shí)現(xiàn)特征下采樣。在每一個(gè)卷積后加上一個(gè)批量標(biāo)準(zhǔn)化(batch normalization)[18],以標(biāo)準(zhǔn)正態(tài)分布作為輸入標(biāo)準(zhǔn)化的方式,避免產(chǎn)生梯度消失的問(wèn)題。對(duì)數(shù)據(jù)進(jìn)行批量標(biāo)準(zhǔn)化后,使用leakyReLU激活函數(shù)[19]來(lái)增強(qiáng)網(wǎng)絡(luò)非線性能力。leakyReLU不同于ReLU[20],其對(duì)負(fù)值輸入有較小的梯度,使負(fù)值的導(dǎo)數(shù)不為零,解決ReLU進(jìn)入負(fù)區(qū)間后神經(jīng)元不學(xué)習(xí)的問(wèn)題。最后使用sigmoid激活函數(shù)來(lái)進(jìn)行二分類(判斷屬于完全采樣還是欠采樣),sigmoid函數(shù)公式如下:
圖6 判別器網(wǎng)絡(luò)Fig.6 Structure of discriminator network
由于sigmoid激活函數(shù)把輸出范圍定于0~1之間,因此在二分類任務(wù)中,其輸出可被視為概率輸出。
1.4.1 生成器損失函數(shù)
整個(gè)生成器的損失函數(shù)l RS包括內(nèi)容損失和對(duì)抗損失,具體表達(dá)式如下:
內(nèi)容損失由兩部分組成,其一為基于像素點(diǎn)的均方誤差而另一個(gè)則為感知損失),并通過(guò)系數(shù)r來(lái)實(shí)現(xiàn)對(duì)兩者的平衡,在文本中設(shè)置r=6×10-3。
具體表達(dá)如公式(4)所示:
除了利用像素間的損失,借鑒Gatys等人[22]的思想,引入感知損失來(lái)解決上文提到的人眼觀察感受下降的問(wèn)題。該方法是通過(guò)將重建圖像和原始全采樣圖像同時(shí)輸入VGG16[23]預(yù)訓(xùn)練的網(wǎng)絡(luò)中,并進(jìn)行特征提取,然后計(jì)算兩者之間的均方誤差。因?yàn)榫矸e網(wǎng)絡(luò)的輸出特征含有較多的紋理信息,不斷優(yōu)化感知損失可以獲得較高的紋理相似度,彌補(bǔ)了MSE缺少紋理特征的不足。具體表達(dá)式如公式(5)所示:
其中,Wi,j和Hi,j為被提取特征的維度,φ是經(jīng)ImageNet數(shù)據(jù)集預(yù)訓(xùn)練的網(wǎng)絡(luò),φi,j為第i個(gè)最大池化層前的第j個(gè)卷積層特征。感知損失函數(shù)通過(guò)測(cè)量圖像之間內(nèi)容和樣式的感知差異,讓圖像顯得更加真實(shí)[24]。
關(guān)于對(duì)抗損失,若判別器對(duì)生成器產(chǎn)生樣本的判斷結(jié)果越接近1,則說(shuō)明其生成的數(shù)據(jù)越接近于真實(shí)分布,具體表達(dá)式如下所示:
其中,DθD(GθG(I LR))代表重建后圖像屬于原始全采樣圖像的概率值。
1.4.2 判別器損失函數(shù)
判別器主要區(qū)分輸入的MR圖像來(lái)源,其優(yōu)化的目標(biāo)在于提高判別準(zhǔn)確率,具體表達(dá)式如下:
其中,Pdata為全采樣MR圖像的數(shù)據(jù)分布,P g為生成器學(xué)習(xí)到的數(shù)據(jù)分布,Εy~Pdata[ln(Dθd(y))]表示判別器對(duì)全采樣MR圖像的期望值,Εy?~P g[(ln(1-Dθd(?)]表示判別器對(duì)網(wǎng)絡(luò)重建MR圖像的期望值。對(duì)于判別器D而言,最小化損失函數(shù)l D即為最大化全采樣圖像y和網(wǎng)絡(luò)重建圖像y?的判斷正確率。
為了進(jìn)一步提高M(jìn)R圖像的重建質(zhì)量,采用了集成學(xué)習(xí)的方式,其思想為通過(guò)訓(xùn)練多個(gè)學(xué)習(xí)器并將這些學(xué)習(xí)器的結(jié)果組合起來(lái),從而達(dá)到更好的學(xué)習(xí)性能,基本結(jié)構(gòu)如圖7所示。
圖7 集成學(xué)習(xí)基本結(jié)構(gòu)Fig.7 Basic structure of ensemble learning
將MR圖像重建和集成學(xué)習(xí)進(jìn)行結(jié)合,構(gòu)造多個(gè)不同的重建模型,根據(jù)算法在驗(yàn)證集上的表現(xiàn)選取若干個(gè)性能較優(yōu)的模型(本文選取了5個(gè)不同模型),然后將測(cè)試數(shù)據(jù)分別輸入被選取的模型獲得預(yù)測(cè)結(jié)果,最后對(duì)各學(xué)習(xí)器輸出的重建圖像加權(quán)集成,得到最終重建結(jié)果。在MR圖像重建任務(wù)中使用集成學(xué)習(xí)不僅能保留本文模型原始優(yōu)勢(shì),而且可進(jìn)一步提高本文方法的建模精度,改善重建結(jié)果。
從OASIS大型開(kāi)源數(shù)據(jù)集中挑選145個(gè)MR圖像文件,將其隨機(jī)打亂,其中70%的MR圖像文件用于訓(xùn)練,剩余30%用于測(cè)試。對(duì)訓(xùn)練集中MR圖像文件進(jìn)行切片生成2 475張圖像,并從2 475張圖像中隨機(jī)抓取20%作為驗(yàn)證集。訓(xùn)練集通過(guò)梯度更新的方式訓(xùn)練模型,使模型盡可能擬合真實(shí)數(shù)據(jù)分布。驗(yàn)證集則用于選擇精度較高的模型以及結(jié)合訓(xùn)練集的情況判斷模型是否過(guò)擬合。測(cè)試集中的MR圖像文件以同樣的方式進(jìn)行切片共生成1 060張圖像,用于驗(yàn)證模型的魯棒性和泛化性。
2.2.1 均方誤差(MSE)
使用均方誤差作為衡量重建圖像和原始圖像相似性的指標(biāo)之一,公式如下所示:
其中,N代表測(cè)試集總數(shù),2562代表單張圖像長(zhǎng)為256像素,寬為256像素,是經(jīng)過(guò)網(wǎng)絡(luò)重建后的圖像像素值,是真實(shí)圖像像素值,當(dāng)MSE的值越小就表明重建后的圖像數(shù)據(jù)分布越接近原始全采樣圖像的數(shù)據(jù)分布。
2.2.2 峰值信噪比(PSNR)
峰值信噪比(peak signal to noise ratio,PSNR),常用于圖像壓縮領(lǐng)域中信號(hào)重建質(zhì)量的測(cè)量,通過(guò)MSE進(jìn)行定義:
其中,MAX I為圖片I可能的最大像素值,如果像素由B位二進(jìn)制表示,那么MAX I=2B-1,本文每個(gè)像素都由8位二進(jìn)制來(lái)表示,所以最大MAX I=255。PSNR越高則表示失真越少。其作為最普遍的圖像評(píng)價(jià)指標(biāo)之一,未考慮到人眼的視覺(jué)特性,因而常出現(xiàn)評(píng)價(jià)指標(biāo)和主觀感受不一致的情況,為此引入了結(jié)構(gòu)相似性作為另一評(píng)價(jià)指標(biāo)[25]。
2.2.3 結(jié)構(gòu)相似性(SSIM)
結(jié)構(gòu)相似性(structural similarity index,SSIM),是一種衡量?jī)煞鶊D像相似度的指標(biāo)。給定兩個(gè)圖像x和y,兩張圖像的SSIM可按照以下方式求出:
其中,u x、u y是x和y的平均值,σ2x、σ2y是x和y的方差,σxy是x和y的協(xié)方差,c1、c2為常數(shù),避免分母為零的現(xiàn)象出現(xiàn)。SSIM值越大則表示兩幅圖像的相似度越高。結(jié)構(gòu)相似性用均值估計(jì)亮度,標(biāo)準(zhǔn)差估計(jì)對(duì)比度,協(xié)方差度量結(jié)構(gòu)相似性,從三個(gè)不同的角度對(duì)兩幅圖像進(jìn)行衡量,更好地適應(yīng)了人類視覺(jué)系統(tǒng),更加客觀地衡量了視覺(jué)感受[26]。
本模型訓(xùn)練主要基于Pytorch框架工具,使用的操作系統(tǒng)為Ubuntu 16.04.2 LTS,CPU采用Xeon?E5-2630 v4,訓(xùn)練顯卡為NVIDIA GeForce GTX TITAN X其顯存為12 GB。本文實(shí)驗(yàn)將batch設(shè)置為10,使用Adam為優(yōu)化器并將學(xué)習(xí)率設(shè)置為1E-4,迭代200個(gè)epoch完成訓(xùn)練(1個(gè)epoch等于訓(xùn)練集的全部數(shù)據(jù)對(duì)模型進(jìn)行一次完整訓(xùn)練)。
通過(guò)上述方法和訓(xùn)練參數(shù)設(shè)置,本文實(shí)現(xiàn)了高質(zhì)量MR圖像重建,重建結(jié)果如圖8所示。
圖8 預(yù)測(cè)結(jié)果可視化圖Fig.8 Visualization of prediction results
采用消融實(shí)驗(yàn)的方式論證各個(gè)模塊的有效性,消融對(duì)比條件為分別去除殘差結(jié)構(gòu)、空洞金字塔結(jié)構(gòu)、感知損失三個(gè)模塊并在采樣率分別為10%、20%、30%、50%上進(jìn)行實(shí)驗(yàn)對(duì)比,其中圖9和表1為各實(shí)驗(yàn)在SSIM、MSE、PSNR三種評(píng)價(jià)指標(biāo)下的結(jié)果。
圖9 不同采樣率下的消融實(shí)驗(yàn)結(jié)果可視化Fig.9 Visualization of results on ablation studies at different sampling rates
表1 各模塊消融結(jié)果Table 1 Ablation results of each module
殘差結(jié)構(gòu)通過(guò)殘差映射等方式提高了特征利用率緩解了梯度消失的現(xiàn)象,且從表1可以看出其最多可提升2.17 dB的PSNR,SSIM提升0.006,MSE降低0.000 6,從數(shù)據(jù)層面進(jìn)一步證明了其有效性。
空洞金字塔結(jié)構(gòu)通過(guò)并行使用不同擴(kuò)張率的空洞卷積,不僅增加了網(wǎng)絡(luò)的感受野使其能有效區(qū)分偽影和細(xì)節(jié)信息且利用1×1卷積將特征融合,實(shí)現(xiàn)對(duì)目標(biāo)的多尺度捕獲,從而提升重建質(zhì)量。與未添加空洞金字塔結(jié)構(gòu)相比,其最多可提升1.23 dB的PSNR值,0.04的SSIM值,降低0.000 3的MSE值。
感知損失將重建后的MR圖像和原始全采樣圖像分別送入卷積神經(jīng)網(wǎng)絡(luò)提取相應(yīng)特征,并計(jì)算兩者之間的歐氏距離作為損失函數(shù)的一部分,實(shí)現(xiàn)從高維感知圖像,提高人眼視覺(jué)感受,由表1可知感知損失最多能提升2.37 dB的PSNR值,0.027的SSIM值,降低0.000 10的MSE值,對(duì)提高M(jìn)R圖像的重建質(zhì)量具有一定幫助。
以上三組消融實(shí)驗(yàn)從不同角度證明了模型的各個(gè)模塊均能提升MR圖像的重建質(zhì)量。為了進(jìn)一步評(píng)估模型的有效性,分別于已有研究成果和主流重建網(wǎng)絡(luò)在相同實(shí)驗(yàn)環(huán)境下,對(duì)相同測(cè)試集進(jìn)行對(duì)比實(shí)驗(yàn),結(jié)果見(jiàn)表2和圖10。
表2 與其他重建網(wǎng)絡(luò)對(duì)比結(jié)果Table 2 Compared with other reconstruction networks
其中表2內(nèi)數(shù)據(jù)為各重建模型在不同采樣率下獲得的MSE、PSNR和SSIM值,可知本文的方法在重建質(zhì)量上均高于其他模型,且模型在不同K空間采樣率下均能保持較高重建精度,表明模型的泛化性能較好。同時(shí)為了更好地提高M(jìn)R圖像的重建質(zhì)量,在保持原始模型優(yōu)勢(shì)的基礎(chǔ)上引入集成學(xué)習(xí)技術(shù),結(jié)合多個(gè)較優(yōu)模型,對(duì)模型預(yù)測(cè)的結(jié)果進(jìn)行集成,獲得最優(yōu)MR重建圖像,根據(jù)表2和圖10可以觀察到集成學(xué)習(xí)的加入可實(shí)現(xiàn)對(duì)各個(gè)重建指標(biāo)的進(jìn)一步提升。
圖10 不同采樣率下重建網(wǎng)絡(luò)對(duì)比結(jié)果可視化Fig.10 Visualization of results on reconstruction networks at different sampling rates
本文提出了一種全新的重建算法:以生成對(duì)抗網(wǎng)絡(luò)為原型,在生成器部分使用U-net網(wǎng)絡(luò)架構(gòu),利用殘差結(jié)構(gòu)有效提高特征利用率緩解梯度消失現(xiàn)象。提出的空洞金字塔結(jié)構(gòu)不僅提升網(wǎng)絡(luò)區(qū)分偽影和圖像細(xì)節(jié)的能力,并且實(shí)現(xiàn)了多尺度信息的融合;在損失函數(shù)部分添加感知損失,通過(guò)計(jì)算重建圖像和目標(biāo)圖像在特征空間的歐氏距離,提高兩者之間的語(yǔ)義相似度,更好地改善了視覺(jué)效果;同時(shí)引入了集成學(xué)習(xí)技術(shù),通過(guò)將不同重建器的預(yù)測(cè)結(jié)果進(jìn)行結(jié)合,可實(shí)現(xiàn)在保持模型原始優(yōu)勢(shì)的基礎(chǔ)上進(jìn)一步提升重建性能。在不同采樣率下進(jìn)行了三組消融實(shí)驗(yàn),即分別去除空洞金字塔、殘差結(jié)構(gòu)、感知損失,證明了各模塊的有效性。在與目前主流重建網(wǎng)絡(luò)對(duì)比實(shí)驗(yàn)中,本文提出的算法表現(xiàn)出一定優(yōu)勢(shì),且該優(yōu)勢(shì)能在多個(gè)不同采樣率下得以保持,進(jìn)一步說(shuō)明了本模型的泛化性和魯棒性。