齊繼,蔣華,張瑞卿,沈陽(yáng),佟彥妮,沙憲政△,常世杰△
(1.中國(guó)醫(yī)科大學(xué)生物醫(yī)學(xué)工程系,沈陽(yáng) 110122;2.中國(guó)醫(yī)科大學(xué)附屬第四醫(yī)院醫(yī)療設(shè)備部,沈陽(yáng) 110032;3.中國(guó)醫(yī)科大學(xué)附屬第一醫(yī)院心血管內(nèi)科,沈陽(yáng) 110054)
心肌梗死按發(fā)生部位分為下壁、前壁、前間壁、廣泛前壁、前側(cè)壁、高側(cè)壁和后壁七個(gè)位置,一般情況下,相較于其他單純部位發(fā)生的心肌梗死,前壁心肌梗死的病變面積較大[1]。心肌梗死的定位診斷可以精確地判斷冠狀動(dòng)脈的病變位置,有助于醫(yī)生進(jìn)行有針對(duì)性的介入治療,也為臨床觀察病情和判斷預(yù)后提供重要依據(jù)[2]。
十二導(dǎo)聯(lián)心電圖可以明確地表現(xiàn)出心肌梗死的多種病變部位,是一種能夠準(zhǔn)確診斷且成本低廉的無(wú)創(chuàng)檢測(cè)方法。十二導(dǎo)聯(lián)心電圖的原理是通過(guò)連接于胸導(dǎo)聯(lián)和肢體導(dǎo)聯(lián)的電極,檢測(cè)心臟傳導(dǎo)系統(tǒng)在每個(gè)心動(dòng)周期中動(dòng)作電位的變化,從而形成電位隨時(shí)間變化的心電波形圖[2]。
心電圖的準(zhǔn)確判讀需要醫(yī)生具有扎實(shí)的專業(yè)基礎(chǔ)和豐富的經(jīng)驗(yàn),但人工判讀心電圖易出現(xiàn)誤判漏判的情況,且工作量較為繁重。為了解決上述問(wèn)題,本研究設(shè)計(jì)一種心電圖輔助診斷算法,它可以準(zhǔn)確地對(duì)心電圖自動(dòng)分析并得出結(jié)果,從而減輕醫(yī)生的負(fù)擔(dān),提高工作效率。
近年來(lái),心電圖輔助識(shí)別的研究相繼出現(xiàn),例如數(shù)字濾波和小波變換等技術(shù),后來(lái)出現(xiàn)特征提取技術(shù),以及近年來(lái)出現(xiàn)的深度學(xué)習(xí)的方法[3]。深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一種,傳統(tǒng)的機(jī)器學(xué)習(xí)有輸入層、隱藏層和輸出層,深度學(xué)習(xí)有多個(gè)隱藏層。深度學(xué)習(xí)的主要框架有卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network, CNN)[4]、循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural networks,RNN)[5]、長(zhǎng)短期記憶網(wǎng)絡(luò)(long short-term memory Network,LSTM)[6]等, 殘差網(wǎng)絡(luò)(residual network,ResNet)是CNN的一種變體,它特有的短連接結(jié)構(gòu)對(duì)于復(fù)雜數(shù)據(jù)有更好的分類效果[7]。ResNet在ILSVRC 2015圖像識(shí)別比賽中獲得第一名, ResNet在語(yǔ)義分割[8]、語(yǔ)音干擾檢測(cè)[9]、交通車輛識(shí)別[10]等研究領(lǐng)域也有一定的應(yīng)用。此外,研究者提出把多分辨率網(wǎng)絡(luò)應(yīng)用于神經(jīng)網(wǎng)絡(luò)中以增加網(wǎng)絡(luò)寬度,提高識(shí)別準(zhǔn)確率,多分辨率網(wǎng)絡(luò)可應(yīng)用于大規(guī)模場(chǎng)景分類[11]、動(dòng)作識(shí)別[12]、生物識(shí)別[13]等研究。
對(duì)于在醫(yī)學(xué)的心電識(shí)別領(lǐng)域,深度學(xué)習(xí)也有一些成功的實(shí)踐,如Kiranyaz 等[14]基于CNN模型和多層感知機(jī)(MLP)模型,對(duì)心室異位節(jié)拍(VEB)和室上性異位節(jié)拍(SVEB)進(jìn)行研究,得到了95%以上的識(shí)別準(zhǔn)確率; Isin等[15]利用CNN對(duì)MIT-BIH數(shù)據(jù)進(jìn)行三分類,得到92.4%的準(zhǔn)確率;Rajpurkar等[16]利用ResNet模型對(duì)心律失常數(shù)據(jù)進(jìn)行研究,得到80.9%的平均識(shí)別準(zhǔn)確率。
目前,從公開(kāi)發(fā)表的文獻(xiàn)可知,尚未有利用深度學(xué)習(xí)技術(shù)進(jìn)行心肌梗死定位的研究。本研究在ResNet的基礎(chǔ)上提出改進(jìn)的多分辨率殘差網(wǎng)絡(luò),該網(wǎng)絡(luò)能夠應(yīng)用于心肌梗死定位的自動(dòng)識(shí)別,并可以輔助醫(yī)生進(jìn)行診斷,有一定的臨床意義。
殘差網(wǎng)絡(luò)(ResNet)是基于CNN在結(jié)構(gòu)方面進(jìn)行的優(yōu)化,一個(gè)ResNet塊由兩個(gè)卷積層和一個(gè)跨層連接組成,見(jiàn)圖1,算法如下:
yl=frelu[conv(i)]
(1)
yl+1=conv(yl)
(2)
o=frelu(i+yl+1)
(3)
其中,y為特定層的輸出,frelu為激活函數(shù),i為ResNet塊的輸入,conv為卷積算法,o為ResNet塊的輸出。
ResNet的主要特點(diǎn)是短連接技術(shù),把輸入引入卷積層之后的輸出,從而實(shí)現(xiàn)跨層連接。ResNet獨(dú)特的跨層連接結(jié)構(gòu)可以解決網(wǎng)絡(luò)很深時(shí)出現(xiàn)的訓(xùn)練退化問(wèn)題和過(guò)擬合問(wèn)題,ResNet可以使網(wǎng)絡(luò)得到充分的訓(xùn)練,隨著網(wǎng)絡(luò)的加深,準(zhǔn)確率顯著升高,但是網(wǎng)絡(luò)深度大于152層時(shí),會(huì)進(jìn)入平臺(tái)期,準(zhǔn)確率不會(huì)有明顯提升[7]。
圖1 殘差網(wǎng)絡(luò)模塊
多分辨率網(wǎng)絡(luò)是針對(duì)復(fù)雜圖像識(shí)別任務(wù)提出來(lái)的,不同尺度空間的圖像信息不同,普通的網(wǎng)絡(luò)結(jié)構(gòu)容易產(chǎn)生誤判,多分辨率網(wǎng)絡(luò)能夠同時(shí)訓(xùn)練粗分辨率和細(xì)分辨率網(wǎng)絡(luò),見(jiàn)圖2。
粗分辨率網(wǎng)絡(luò)利用較大的接受域獲取圖像信息,細(xì)分辨率網(wǎng)絡(luò)利用較小的接受域獲取圖像信息,兩種網(wǎng)絡(luò)經(jīng)訓(xùn)練而得的數(shù)據(jù)特征信息,經(jīng)整合后得到輸出層的預(yù)測(cè)值。粗分辨率網(wǎng)絡(luò)和細(xì)分辨率的網(wǎng)絡(luò)結(jié)構(gòu)通常由CNN構(gòu)成。兩個(gè)網(wǎng)絡(luò)在圖像區(qū)域中對(duì)應(yīng)不同大小的感知域,識(shí)別圖像的效果是互補(bǔ)的,從而提高圖像識(shí)別準(zhǔn)確率[13]。
圖2多分辨率卷積神經(jīng)網(wǎng)絡(luò)
Fig.2Multi-resolution CNN
當(dāng)采用ResNet等經(jīng)典的CNN網(wǎng)絡(luò)訓(xùn)練心肌梗死數(shù)據(jù)時(shí),訓(xùn)練之后的網(wǎng)絡(luò)模型出現(xiàn)了收斂效果不佳,識(shí)別準(zhǔn)確率低的問(wèn)題。為解決這些問(wèn)題,本研究設(shè)計(jì)的網(wǎng)絡(luò)對(duì)ResNet網(wǎng)絡(luò)做進(jìn)一步優(yōu)化,見(jiàn)圖3、圖4。優(yōu)化后的網(wǎng)絡(luò)是以9個(gè)卷積層為主體的31層網(wǎng)絡(luò),每個(gè)卷積層之后都伴隨一個(gè)批量歸一化(batch normalization,BN)層,BN層是一種用來(lái)求解協(xié)變位移的優(yōu)化算法,即把每層網(wǎng)絡(luò)中神經(jīng)元的輸入值限制為均值為0方差為1的正態(tài)分布,使得梯度變大,訓(xùn)練過(guò)程收斂快,使訓(xùn)練速度加快,從而減輕梯度消失問(wèn)題[17]。
該網(wǎng)絡(luò)的訓(xùn)練步驟如下:
(1)見(jiàn)圖3,訓(xùn)練集數(shù)據(jù)進(jìn)入第1個(gè)卷積層,經(jīng)BN層后通過(guò)修正線性單元(recitified linear units,ReLU)函數(shù)進(jìn)行激活,ReLU可以有效緩解隨著網(wǎng)絡(luò)結(jié)構(gòu)加深而出現(xiàn)的梯度消失問(wèn)題,并提高訓(xùn)練效率[18]。
(2)卷積后的局部特征數(shù)據(jù)經(jīng)第3層最大池化(max pool)層的下采樣運(yùn)算后,進(jìn)入ResNet網(wǎng)絡(luò)結(jié)構(gòu),其余8個(gè)卷積層依次組成4個(gè)帶有短連接的ResNet模塊,每個(gè)ResNet模塊有兩個(gè)卷積層。max pool層的算法見(jiàn)式(4):
(4)
(3)第1組ResNet 模塊中第一個(gè)卷積層經(jīng)BN層歸一化處理后,其輸出沿著框架主體向下傳輸,同時(shí)連接至第3組ResNet 模塊中第一個(gè)卷積層的輸出端。
(4)第2組ResNet 模塊中第一個(gè)卷積層經(jīng)BN層歸一化處理后,輸出端沿著框架主體向下傳輸,同時(shí)連接至第4組 ResNet 模塊中第一個(gè)卷積層的輸出端。第2組ResNet 模塊的輸出經(jīng)max pool層處理。
圖3 改進(jìn)的殘差網(wǎng)絡(luò)
(5)第4組的ResNet 模塊經(jīng)平均池化(average pool)層、全連接層后由ReLU函數(shù)激活,再利用dropout層,其作用是在每次訓(xùn)練的時(shí)候,網(wǎng)絡(luò)會(huì)按照使用者設(shè)置的系數(shù)隨機(jī)使相應(yīng)個(gè)數(shù)的神經(jīng)元不參與該次訓(xùn)練,進(jìn)而減輕過(guò)擬合現(xiàn)象[19],最后經(jīng)全連接層和softmax分類器得到輸出。
本研究在改進(jìn)ResNet網(wǎng)絡(luò)的同時(shí)引入多分辨率網(wǎng)絡(luò),見(jiàn)圖4,粗略分辨率網(wǎng)絡(luò)和精細(xì)辨率通道中卷積核的大小分別為1×81和1×9,將上述圖2所示的網(wǎng)絡(luò)分別輸入到這兩個(gè)分辨率的通道中,經(jīng)兩個(gè)通道所訓(xùn)練的輸出相加,得到最終的識(shí)別結(jié)果。
本研究將該網(wǎng)絡(luò)結(jié)構(gòu)稱為多分辨率殘差網(wǎng)絡(luò)(Multi-resolution ResNet)。
圖4 多分辨率殘差網(wǎng)絡(luò)
本研究的數(shù)據(jù)由中國(guó)醫(yī)科大學(xué)附屬第一醫(yī)院支持,研究使用的所有病例均由心電圖工作站中存檔的現(xiàn)有心電圖記錄中收集,電圖工作站為數(shù)字心電圖儀(Nihon Kohden)。心電圖儀輸出標(biāo)準(zhǔn)12導(dǎo)聯(lián)心電圖,采樣率為12位/1 000 Hz(12導(dǎo)聯(lián)同步采集),共模抑制比為120 dB,頻率響應(yīng)為0.05~160 Hz (-3 dB)。所有的患者都在檢查室接受檢查,與醫(yī)生的辦公室分開(kāi),心電圖數(shù)據(jù)通過(guò)網(wǎng)絡(luò)傳輸。心電圖檢查按照標(biāo)準(zhǔn)程序進(jìn)行:患者仰臥位,肢體導(dǎo)聯(lián)采用導(dǎo)電夾粘結(jié),胸部導(dǎo)聯(lián)采用一次性導(dǎo)電膏粘結(jié)。每個(gè)心電圖數(shù)據(jù)的時(shí)間長(zhǎng)度為2.5 s。
本研究從上述心電數(shù)據(jù)原始記錄中選取包括前壁心肌梗死(AMI)、下壁心肌梗死(IWMI)、前間壁心肌梗死(ASMI)在內(nèi)的共計(jì)3 549個(gè)數(shù)據(jù)以及6 250個(gè)正常心電數(shù)據(jù)(NORMAL),其中,每條記錄所屬患者的性別、年齡和種族都是隨機(jī)選取的,本研究設(shè)計(jì)的訓(xùn)練集與測(cè)試集數(shù)據(jù)見(jiàn)表1。
表1 訓(xùn)練集與測(cè)試集的數(shù)據(jù)分布
利用較為經(jīng)典的卷積神經(jīng)網(wǎng)絡(luò)LeNet、Vgg16、ResNet34與本研究提出的多分辨率殘差網(wǎng)絡(luò)進(jìn)行對(duì)比。利用訓(xùn)練集數(shù)據(jù)對(duì)四種網(wǎng)絡(luò)算法分別進(jìn)行訓(xùn)練,測(cè)試集數(shù)據(jù)輸入到訓(xùn)練完畢的模型中,得出識(shí)別結(jié)果。
本研究采用的開(kāi)發(fā)平臺(tái)是Windows 10操作系統(tǒng), CNTK 2.0,編程語(yǔ)言是python 3.5.2。計(jì)算機(jī)配置:CPU為Intel Core i7-8700 3.3 GHz,顯卡為NVIDIA GeForce GTX1080,內(nèi)存大小為16 G。
本研究設(shè)計(jì)的多分辨率殘差網(wǎng)絡(luò)參數(shù)設(shè)置如下:
學(xué)習(xí)率為0.000025~0.0001,輸入數(shù)據(jù)大小為12×1×1 400,輸入層的節(jié)點(diǎn)數(shù)為16 800,隱藏層的節(jié)點(diǎn)數(shù)為32~256,迭代2 000次。
從臨床數(shù)據(jù)庫(kù)選取如表1所示的訓(xùn)練集與測(cè)試集數(shù)據(jù),分別基于LeNet34、Vgg16、ResNet34以及本研究設(shè)計(jì)的多分辨率殘差網(wǎng)絡(luò)進(jìn)行訓(xùn)練,識(shí)別結(jié)果見(jiàn)表2,多分辨率殘差網(wǎng)絡(luò)的識(shí)別準(zhǔn)確率為91.8%,均高于其他四種網(wǎng)絡(luò)。
表2 多分辨率殘差網(wǎng)絡(luò)與經(jīng)典卷及神經(jīng)網(wǎng)絡(luò)測(cè)試集識(shí)別準(zhǔn)確率對(duì)比
為了分析數(shù)據(jù)在迭代過(guò)程中的收斂情況,上述四種網(wǎng)絡(luò)的收斂曲線見(jiàn)圖5。可見(jiàn)與經(jīng)典的CNN網(wǎng)絡(luò)相比,多分辨率殘差網(wǎng)絡(luò)的收斂曲線下降得更快,收斂過(guò)程更加平穩(wěn),收斂效果更好。
測(cè)試集的受試者工作特征(receiver operating characteristic,ROC)曲線見(jiàn)圖6,橫軸表示1-特異度,縱軸表示敏感度,AUC為曲線下面積,曲線越接近左上角,表示模型的準(zhǔn)確性越高,對(duì)疾病的識(shí)別能力越強(qiáng)。
圖5在訓(xùn)練集中多分辨率殘差網(wǎng)絡(luò)與經(jīng)典卷積神經(jīng)網(wǎng)絡(luò)的收斂曲線對(duì)比
Fig.5Comparison of Multi-resolution ResNet and classic CNN′s convergent curve on train data
(a).LeNet;(b).VGG;(c).ResNet34;(d).Multi-resolution ResNet
圖6 在訓(xùn)練集中多分辨率殘差網(wǎng)絡(luò)與經(jīng)典卷積神經(jīng)網(wǎng)絡(luò)的受試者工作特征曲線對(duì)比
本研究基于經(jīng)典的神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)了多分辨率殘差網(wǎng)絡(luò),并將其用于心肌梗死的定位識(shí)別。對(duì)臨床數(shù)據(jù)庫(kù)進(jìn)行四分類,多分辨率殘差網(wǎng)絡(luò)的識(shí)別準(zhǔn)確率高于經(jīng)典的神經(jīng)網(wǎng)絡(luò);與經(jīng)典的神經(jīng)網(wǎng)絡(luò)相比,多分辨率殘差網(wǎng)絡(luò)的收斂效果更好,根據(jù)ROC曲線的分析,其診斷能力更強(qiáng)。
由實(shí)驗(yàn)可知,在心肌梗死定位識(shí)別領(lǐng)域,多分辨率殘差網(wǎng)絡(luò)可以應(yīng)用于臨床的心電圖輔助診斷任務(wù)。在今后的研究中,將收集更多的數(shù)據(jù),并對(duì)心肌梗死以外的心電數(shù)據(jù)進(jìn)行深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練,以期利用深度學(xué)習(xí)技術(shù)能夠識(shí)別更多的心血管疾病,從而在臨床心電數(shù)據(jù)自動(dòng)診斷中實(shí)現(xiàn)更廣泛的應(yīng)用。