魏鵬磊,雷菊陽(yáng)
(201620 上海市 上海工程技術(shù)大學(xué) 機(jī)械與汽車(chē)工程學(xué)院)
新冠病毒疫情之下,醫(yī)生需要尋求更加快捷的診斷方式來(lái)確定疑似病例。除核酸檢測(cè)外,胸部X 射線(xiàn)影像識(shí)別成為篩查病人的主要手段。在國(guó)家衛(wèi)健委發(fā)布的《新型冠狀病毒感染肺炎診療手段(試行第八版)》里,具有新冠肺炎影像學(xué)特征的臨床表現(xiàn)已被明確納入確定疑似病例的診斷標(biāo)準(zhǔn)中[1]。新冠肺炎很多患者是干咳,采集痰液困難,而咽拭子核酸檢測(cè)的總陽(yáng)性準(zhǔn)確率為30%~60%,敏感性欠佳,可能會(huì)漏診。胸部影像診斷敏感性好,準(zhǔn)確率高達(dá)97%。故疑似病例較多的情況下,單憑核酸檢測(cè)容易漏診,胸透篩查更有優(yōu)勢(shì),可早發(fā)現(xiàn)、早隔離、早治療。而在實(shí)際臨床中,疑似病患、密切接觸者篩查會(huì)產(chǎn)生大量胸透影像,醫(yī)生肉眼辨別胸透影像效率較低[2-4]。
鑒于此,本文使用加州大學(xué)圣地亞哥分校的開(kāi)源數(shù)據(jù)集,通過(guò)構(gòu)建卷積神經(jīng)網(wǎng)絡(luò)模型對(duì)影像進(jìn)行識(shí)別,并進(jìn)行數(shù)據(jù)可視化。實(shí)驗(yàn)結(jié)果表明,本文的模型和方法有較好的效果和很強(qiáng)的可行性。
卷積神經(jīng)網(wǎng)絡(luò)(CNN)非常適合做圖片分類(lèi)任務(wù)。通過(guò)制定卷積大小、窗口移動(dòng)大小,一步一步地學(xué)習(xí)數(shù)據(jù)特征。每次學(xué)習(xí)計(jì)算卷積層后,計(jì)算一次最大池化層,就是對(duì)輸入圖像進(jìn)行下采樣。之后,通過(guò)dropout 對(duì)結(jié)果進(jìn)行正則化,這樣可以防止過(guò)擬合,降低維度,經(jīng)過(guò)反向傳播訓(xùn)練,直到最優(yōu)。隨著卷積網(wǎng)絡(luò)的不斷發(fā)展,圖像變得越來(lái)越小,但由于卷積層的存在,圖像也越來(lái)越深(即具有更多的特征圖),如圖1 所示。在堆棧頂部添加一個(gè)常規(guī)的前饋神經(jīng)網(wǎng)絡(luò),該網(wǎng)絡(luò)由幾個(gè)全連接層組成,最后一層輸出預(yù)測(cè)。
圖1 典型的CNN 架構(gòu)Fig.1 Typical CNN architecture
本文所采用的CNN 為一種深度神經(jīng)網(wǎng)絡(luò),其基本模型如圖2 所示。
圖2 深度神經(jīng)網(wǎng)絡(luò)基本模型Fig.2 Basic model of deep neural network
本文所用數(shù)據(jù)集為加州大學(xué)圣地亞哥分校的開(kāi)源數(shù)據(jù)集,該數(shù)據(jù)集共包括542 張附有標(biāo)簽的胸部X 射線(xiàn)影像,其中確診患者胸部影像數(shù)據(jù)共289例,未確診患者胸部影像數(shù)據(jù)共253 例。本實(shí)驗(yàn)選取的訓(xùn)練集、驗(yàn)證集和測(cè)試集數(shù)據(jù)如表1 所示。
表1 新冠肺炎胸部影像數(shù)據(jù)集Tab.1 New coronary pneumonia chest imaging dataset
本實(shí)驗(yàn)中,使用Keras 的ImageDataGenerator加載所需數(shù)據(jù),并且做數(shù)據(jù)增強(qiáng)與處理。對(duì)于訓(xùn)練數(shù)據(jù),分別做以下處理:將像素值歸一化;剪切強(qiáng)度(逆時(shí)針?lè)较虻募羟凶儞Q角度)為0.2;隨機(jī)縮放的幅度為0.2 以及水平翻轉(zhuǎn)。對(duì)測(cè)試數(shù)據(jù)只做歸一化處理,即將RGB 對(duì)應(yīng)的具體數(shù)值轉(zhuǎn)換成0~1之間的值,便于神經(jīng)網(wǎng)絡(luò)計(jì)算。本實(shí)驗(yàn)采用最大最小標(biāo)準(zhǔn)化,計(jì)算公式為
隨機(jī)查看9 張病理圖片,圖片以3 行3 列的方式顯示,每張圖片下面都顯示出對(duì)應(yīng)的病理類(lèi)別,其中covid_with_PNEUMONIA 表示陽(yáng)性,covid_without_PNEUMONIA 表示陰性??梢暬敵鰣D如圖3 所示[5]。
圖3 病理圖Fig.3 Pathological image
本文創(chuàng)建的CNN 模型主要由卷積層、最大池化層和Dropout 層組成,最后有一個(gè)全連接層作為輸出層。首先輸入預(yù)處理后得到的224×224×3 大小的圖片,經(jīng)過(guò)64 個(gè)卷積核的2 次卷積后,采用一次最大池化;再經(jīng)過(guò)2 次128 的卷積核卷積之后,采用一次最大池化;再經(jīng)過(guò)3 次256 的卷積核卷積之后,采用最大池化;繼續(xù)重復(fù)兩次3 個(gè)512 的卷積核卷積,之后再最大池化;最后經(jīng)過(guò)3 次全連接層后輸出。其中,該模型每個(gè)卷積層的卷積核大小均為3×3×3,步長(zhǎng)為1,邊緣填充也是1,最大池化層大小采用2×2,Dropout 層丟棄的比例為0.5。構(gòu)建的神經(jīng)網(wǎng)絡(luò)具體參數(shù)如圖4 所示。
圖4 網(wǎng)絡(luò)模型概況Fig.4 Network model overview
本文使用的優(yōu)化算法為Adam 算法,因?yàn)樗鼘?shí)現(xiàn)簡(jiǎn)單,計(jì)算高效,適用于大規(guī)模數(shù)據(jù)和參數(shù)的場(chǎng)景,設(shè)置學(xué)習(xí)率為0.000 1,batch_size 為16,迭代次數(shù)為10 次,并對(duì)驗(yàn)證集的精確度添加提前終止監(jiān)控,patience 設(shè)置為3。
首先用498 張病理圖片訓(xùn)練樣本進(jìn)行模型訓(xùn)練,其訓(xùn)練結(jié)果的準(zhǔn)確率以及損失函數(shù)分別如圖5、圖6 所示。
圖5 準(zhǔn)確率Fig.5 Accuracy
圖6 損失函數(shù)Fig.6 Loss function
再用54 張病理圖片測(cè)試樣本進(jìn)行評(píng)估。測(cè)試結(jié)果如圖7 所示。
圖7 測(cè)試集準(zhǔn)確率Fig.7 Test set accuracy
由圖7 的測(cè)試結(jié)果可知,在現(xiàn)有樣本下基于深度學(xué)習(xí)的新冠肺炎影像學(xué)診斷方法準(zhǔn)確率可達(dá)96.23%。為更好地說(shuō)明本模型的可行性以及實(shí)際效果,對(duì)未知標(biāo)簽的新冠肺炎病理圖片進(jìn)行預(yù)測(cè),結(jié)果如圖8 所示。即有97.61%的概率表明該病理影像為陽(yáng)性,有2.38%的概率表明該病理影像為陰性。由此可知,該模型有較好的效果[6]。
圖8 預(yù)測(cè)結(jié)果Fig.8 Forecast result
本文基于深度學(xué)習(xí)對(duì)新冠肺炎影像學(xué)診斷進(jìn)行了分析和網(wǎng)絡(luò)模型構(gòu)建。實(shí)驗(yàn)結(jié)果表明,所構(gòu)建的基于深度學(xué)習(xí)的新冠肺炎影像學(xué)診斷方法具有較高的準(zhǔn)確率,具有一定的實(shí)用性[7]。由于目前新冠病毒毒株仍在不斷變異,該模型存在缺少最新的新冠肺炎影像學(xué)樣本,故還需更多的實(shí)驗(yàn)和樣本對(duì)該模型進(jìn)行完善。