摘" 要:國家衛(wèi)健委辦公廳于2022年3月14日正式發(fā)布的《關(guān)于印發(fā)新型冠狀病毒肺炎診療方案(試行第九版)》中提出,CT影像學(xué)檢查在臨床前期篩查具有不可替代的作用。為提高臨床的CT圖像前期篩查效率,該文分別從可視化分析、預(yù)測表現(xiàn)和計算效率3個統(tǒng)計測度,在不同的分辨率下利用邏輯回歸、隨機(jī)森林、支持向量機(jī)和Fisher線性判別及CNN、Inception網(wǎng)絡(luò)、Residual網(wǎng)絡(luò)和LassoNet對3 616張患有COVID-19的患者和10 192張健康人的肺部CT圖像進(jìn)行分類。實(shí)驗(yàn)結(jié)果表明,LassoNet具有特征選擇的功能,可以直觀得到影響CT圖像分類的重要特征像素點(diǎn),模型解釋性更強(qiáng);在圖像分辨率為100×100時,Residual網(wǎng)絡(luò)的分類精度最高為95.30%,AUC最高為0.937,分類時間處于平均水平,取得最佳表現(xiàn)。該實(shí)驗(yàn)結(jié)果可以進(jìn)一步提高臨床醫(yī)學(xué)的診斷效率,為我國疫情防控常態(tài)下人體肺部CT圖像的臨床識別提供指導(dǎo)。
關(guān)鍵詞:深度學(xué)習(xí);圖像識別;LassoNet;統(tǒng)計測度;肺部 CT
中圖分類號:TP391" " " 文獻(xiàn)標(biāo)志碼:A" " " " " 文章編號:2095-2945(2023)14-0001-06
Abstract: On March 14, 2022, the General Office of the National Health and Medical Commission officially released the \"Pneumonia Diagnosis and Treatment Plan for Novel Coronavirus Infection (Trial Ninth Edition)\", which stated that CT imaging examination has an irreplaceable role in preclinical screening. effect. In order to improve the efficiency of pre-screening of clinical CT images, this paper uses Logisitic regression, random forest, support vector machine and Fisher linear discriminant and CNN, Inception network, Residual network and LassoNet classify 3 616 lung CT images of patients with Covid-19 and 10 192 healthy people. The experimental results show that LassoNet has the function of feature selection, which can directly obtain the important feature pixels that affect CT image classification, and the model interpretation is stronger; when the image resolution is 100×100, the classification accuracy of Residual network is 95.30% and the highest AUC is 0.937, the classification time is at the average level, and the best performance is achieved. The experimental results can further improve the diagnostic efficiency of clinical medicine and provide guidance for the clinical recognition of human lung CT images under the normal situation of epidemic prevention and control in China.
Keywords: deep learning; image recognition; LassoNet; statistical measure; lung CT
截至北京時間2022年4月22日0時19分,全球累計新冠感染確診病例505 035 185例,累計死亡病例6 210 719例。自新冠感染疫情爆發(fā)以來,我國積極應(yīng)對,出臺了各項(xiàng)政策,其中較為重要的當(dāng)屬國家衛(wèi)健委辦公廳于2022年3月14日正式發(fā)布的《新型冠狀病毒肺炎診療方案(試行第九版)》,其中提到:新型冠狀病毒感染確診靠病毒核酸檢測,雖特異性強(qiáng),但敏感性欠佳,現(xiàn)有輔助診斷方法技術(shù)有待進(jìn)一步提高。根據(jù)目前經(jīng)驗(yàn),肺部影像表現(xiàn)早于臨床癥狀。因此,CT影像學(xué)檢查在臨床前期篩查具有不可替代的作用。
在新冠感染疫情防治的早期篩查和診斷領(lǐng)域,機(jī)器學(xué)習(xí)方法早已被廣泛應(yīng)用。2020年中國信通院等單位聯(lián)合發(fā)布的《人工智能助力新冠疫情防控調(diào)研報告》,其中提到的“新型冠狀病毒性肺炎智能評價系統(tǒng)”能夠利用人工智能技術(shù)的深度學(xué)習(xí)、圖像識別等提供量化數(shù)據(jù)對比結(jié)果,幫助醫(yī)生更快完成疑似患者診斷。基于機(jī)器學(xué)習(xí)的CT圖像對于進(jìn)一步提高臨床醫(yī)學(xué)診斷的識別精度及臨床前期診斷篩查具有實(shí)際的研究意義和應(yīng)用價值。
1" 研究現(xiàn)狀與目的
1.1" 國內(nèi)外研究現(xiàn)狀
自2020年新冠感染疫情爆發(fā)以來,各領(lǐng)域的專家學(xué)者基于機(jī)器學(xué)習(xí)對不同地區(qū)新冠感染開始和結(jié)束時間、確診人數(shù)及各類新冠圖像的識別均有較為完善的研究成果,具體如下。
2020年1月,Canayaz[1]利用由COVID-19、健康和肺炎3類肺部X射線圖像組成的數(shù)據(jù)集訓(xùn)練得到AlexNet、VGG19等深度學(xué)習(xí)模型。2020年5月,Elgendi等[2]分析了15種模型,得出ResNet-50是檢測COVID-19的最佳預(yù)訓(xùn)練神經(jīng)網(wǎng)絡(luò)。2020年6月,Ozturk等[3]設(shè)計了ResNet-50,其可被視為COVID-19感染特征和診斷的高靈敏度模型。Punn等[4]使用ResNet和NASNetLarge等方法在有限的后前胸部X線圖像中自動診斷COVID-19。2021年4月郭保蘇等[5]設(shè)計了一種基于CT圖像卷積神經(jīng)網(wǎng)絡(luò)處理新冠肺炎的檢測方法。2021年5月,Narin[6]設(shè)計了5個預(yù)先訓(xùn)練好的基于卷積神經(jīng)網(wǎng)絡(luò)的模型,其中ResNet50模型提供了最高的分類性能。Gunraj等[7]使用COVID-Net CT-2模型通過利用正確的臨床相關(guān)的關(guān)鍵因素,得到其決策行為與放射科醫(yī)生的解釋一致。2021年8月Fouladi等[8]利用ResNet-50、VGG-16、卷積神經(jīng)網(wǎng)絡(luò)、卷積自編碼器神經(jīng)網(wǎng)絡(luò)對COVID-19胸部CT圖像進(jìn)行分類。
綜上所述,已有的研究成果基本上是采用單個深度神經(jīng)網(wǎng)絡(luò)對COVID-19患者肺部CT圖像進(jìn)行識別,僅從單個統(tǒng)計測度進(jìn)行了比較,并未從其他統(tǒng)計測度來選擇最優(yōu)模型。因此本文將從3個統(tǒng)計測度:數(shù)據(jù)可視化、預(yù)測精度和分類效率3個方面比較8種淺層和深度學(xué)習(xí)方法,進(jìn)一步助力我國醫(yī)學(xué)領(lǐng)域初步診斷新冠感染的識別效率。
1.2" 研究目的與意義
基于各領(lǐng)域?qū)<覍W(xué)者的研究基礎(chǔ),文章分別從3個統(tǒng)計測度:可視化分析、預(yù)測表現(xiàn)和計算效率,使用8種機(jī)器學(xué)習(xí)方法對含有COVID-19患者肺部CT圖像的數(shù)據(jù)集進(jìn)行分類實(shí)驗(yàn),選出最優(yōu)圖像分辨率下,預(yù)測表現(xiàn)和計算效率最優(yōu)的方法,進(jìn)一步助力我國疫情防控常態(tài)下的COVID-19患者肺部CT圖像臨床識別,并在一定程度上促進(jìn)機(jī)器學(xué)習(xí)在醫(yī)療和人類生活中的發(fā)展。
2" 實(shí)驗(yàn)
2.1" 數(shù)據(jù)介紹與處理
本文數(shù)據(jù)集來源于Kaggle平臺,該數(shù)據(jù)集的后綴為.png,共有13 808張圖片,每張圖片的分辨率為(299,299),其中確診COVID-19的患者肺部CT照片有3 616張,占總數(shù)據(jù)集的26.19%,健康人的肺部CT照片共有10 192張,占總數(shù)據(jù)集的73.81%。
首先,將2個原始數(shù)據(jù)集歸納為總數(shù)據(jù)集。然后,對原始數(shù)據(jù)進(jìn)行數(shù)據(jù)增強(qiáng)和參數(shù)調(diào)整操作,觀察每張圖像的分辨率數(shù)值量綱是否統(tǒng)一,是否存在偏態(tài)分布,由分析可得每張圖片均值和標(biāo)準(zhǔn)差的跨度比較大,存在一定的偏態(tài)分布,因此需要選將數(shù)據(jù)集進(jìn)行歸一化和中心化操作,表1是對原始數(shù)據(jù)集進(jìn)行量綱統(tǒng)一和數(shù)據(jù)標(biāo)準(zhǔn)化后的結(jié)果,處理過后的數(shù)據(jù)量綱統(tǒng)一,無明顯偏態(tài)分布。
最后,將數(shù)據(jù)集劃分為訓(xùn)練集和測試集,分別占70%和30%,確診COVID-19的患者肺部CT照片樣本標(biāo)簽為1,健康人的肺部CT照片樣本標(biāo)簽為0,在后續(xù)的實(shí)驗(yàn)中對每種機(jī)器學(xué)習(xí)方法進(jìn)行網(wǎng)格搜索遍歷所有可能的參數(shù),以獲得最佳的分類精度。
2.2" 可視化分析
首先,為了便于進(jìn)行后續(xù)實(shí)驗(yàn),將原始圖像轉(zhuǎn)換為256個特征(28×28)和10 000個特征(100×100)的二位變量,如圖1所示。
然后,為了進(jìn)一步觀察數(shù)據(jù)是否具有可分類性,利用降維算法(PCA)將特征像素點(diǎn)降為3維,并將樣本點(diǎn)繪制在3D圖中如圖2所示,觀察樣本的空間分布,其中深灰色點(diǎn)為健康人的肺部CT照片樣本,淺灰色點(diǎn)為確診COVID-19的患者肺部CT照片樣本。初步可得2種不同分類的散點(diǎn)存在一定的距離,單憑肉眼無法直觀得到準(zhǔn)確的分類結(jié)果。
在2021年,由Robert Tibshirani等提出的一種神經(jīng)網(wǎng)絡(luò)框架LassoNet將已有的Lasso回歸及其特征稀疏性推廣至前饋神經(jīng)網(wǎng)絡(luò),在未知最優(yōu)選擇特征數(shù)的前提下同時進(jìn)行特征選擇和參數(shù)學(xué)習(xí)。LassoNet具有特征選擇功能,因此在后續(xù)的實(shí)驗(yàn)中可以嘗試將LassoNet的特征選擇過程可視化。
如圖3所示,第一行為28×28圖像分辨率下,選擇特征數(shù)分別為293、219和157時LassoNet的可視化特征矩陣,第二行為100×100圖像分辨率下,選擇特征數(shù)分別為10 000、598和289時LassoNet的可視化特征矩陣,通過肉眼可以較清晰地看出影響分類結(jié)果程度較大的特征像素點(diǎn),因此嘗試將LassoNet方法中最優(yōu)的特征選擇結(jié)果可視化。如圖4所示,二者均為COVID-19患者的肺部CT圖像,圖4(a)為28×28分辨率下的權(quán)重矩陣,圖4(b)為100×100分辨率下的權(quán)重矩陣。由此可得,分辨率越高,越能清晰直觀地得到影響分類結(jié)果的重要特征位置及其權(quán)重,即LassoNet的可視化效果最佳。
2.3" 實(shí)驗(yàn)一
為了在淺層學(xué)習(xí)方法中選擇預(yù)測表現(xiàn)最佳、計算效率最高的方法,以28×28分辨率的輸入圖像為例,首先繪制4種淺層學(xué)習(xí)方法的混淆矩陣,如圖5所示。由圖5可得隨機(jī)森林判斷正確的樣本量最多,下面進(jìn)一步比較分類精度、分類時間和ROC曲線。
將分類精度隨選擇特征數(shù)變化的折線圖繪制在圖6中,由實(shí)驗(yàn)結(jié)果可得,隨著選擇特征數(shù)的增多,隨機(jī)森林的分類精度由最開始保持較慢速度上升,以極高的速率上升達(dá)到最高90.10%,并一直保持最高水平,邏輯回歸、支持向量機(jī)和Fisher線性判別基本保持相同的速率上升,但分類精度較低。
如圖7所示,左圖為4種分類方法得到最高精度時的分類所需時間,右圖為對應(yīng)的ROC曲線。在消耗時間方面,支持向量機(jī)和邏輯回歸消耗時間較多,隨機(jī)森林處于平均水平,且分類精度最高,F(xiàn)isher線性判別所需時間最短。比較ROC曲線,發(fā)現(xiàn)隨機(jī)森林偏離45°對角線的程度最大,依次是邏輯回歸、支持向量機(jī)和Fisher線性判別等方法。由實(shí)驗(yàn)結(jié)果可得,隨機(jī)森林的分類精度最高,ROC曲線下的面積(AUC)值最大,F(xiàn)isher線性判別所需時間最短。綜合可得,在淺層學(xué)習(xí)方法中,隨機(jī)森林的預(yù)測表現(xiàn)最佳,F(xiàn)isher線性判別的分類效率最高,但其分類精度低于隨機(jī)森林。
2.4" 實(shí)驗(yàn)二
由于圖片維度變?yōu)?00×100(10 000個特征)的分辨率,輸入圖像的維度較高,且變量不一致,對淺層學(xué)習(xí)模型訓(xùn)練會導(dǎo)致內(nèi)存溢出。因此,在實(shí)驗(yàn)二中僅使用4種深度學(xué)習(xí)方法進(jìn)行實(shí)驗(yàn)。為了保證實(shí)驗(yàn)結(jié)果具有可比性,采取控制變量的操作:控制數(shù)據(jù)輸入維度為(batch,1,100,100),控制整個數(shù)據(jù)集的訓(xùn)練次數(shù)(epoch)為50,每次訓(xùn)練模型的輸入數(shù)據(jù)量(mini-batch)為50。圖8表示4種深度學(xué)習(xí)方法的混淆矩陣,觀察可得Residual網(wǎng)絡(luò)判斷正確的樣本量最多,為10 700個樣本,其次是CNN和Inception網(wǎng)絡(luò)下面進(jìn)一步比較分類時間和ROC曲線。
如圖9所示,圖9(a)為分類方法得到最高精度時的分類所需時間,圖9(b)為對應(yīng)的ROC曲線。由實(shí)驗(yàn)可得,CNN所需時間最短為5 279.03 s,其次是LassoNet、Residual網(wǎng)絡(luò)和Inception網(wǎng)絡(luò)。Residual網(wǎng)絡(luò)的ROC曲線偏離45°折線的程度最大,依次是CNN、Inception網(wǎng)絡(luò)和LassoNet。LassoNet與另外3種深度學(xué)習(xí)網(wǎng)絡(luò)存在一定差距,Residual網(wǎng)絡(luò)的分類精度為95.30%最高,Inception網(wǎng)絡(luò)的分類精度為93.91%,CNN的分類精度為94.41%,CNN所需時間最短為5 279.03 s,Inception網(wǎng)絡(luò)所需時間最長為8 755.51 s。
為了進(jìn)一步直觀的觀察數(shù)據(jù),將實(shí)驗(yàn)一和實(shí)驗(yàn)二得到的具體數(shù)值繪制在表2中可得,Residual網(wǎng)絡(luò)分類精度最高為95.30%,AUC值最大為0.937,所需時間為6 868.02 s;CNN分類精度為94.41%,比前者低0.89%,AUC值為0.930,比前者低0.007,但所需時間為5 279.03 s,比前者少1 588.99s;LassoNet分類精度為90.36%,比Residual網(wǎng)絡(luò)低4.94%,AUC值為0.869,比Residual網(wǎng)絡(luò)低0.068,且所需時間為6 541.78 s,比Residual網(wǎng)絡(luò)少326.24 s,因此Residual網(wǎng)絡(luò)的分類效率表現(xiàn)最為優(yōu)異。綜合可得,深度學(xué)習(xí)方法的預(yù)測表現(xiàn)普遍由于淺層學(xué)習(xí)方法,在深度學(xué)習(xí)方法中,Residual網(wǎng)絡(luò)的預(yù)測表現(xiàn)最佳,CNN的分類效率最高,但其分類精度略低于Residual網(wǎng)絡(luò)。
2.5" 實(shí)驗(yàn)結(jié)論
綜上所述,從數(shù)據(jù)可視化角度可得,LassoNet由于具有特征選擇的功能,可以直觀得到影響分類圖像的重要特征像素點(diǎn)、且可視化效果較為清晰,相比傳統(tǒng)的降維算法(PCA)其可視化效果更佳。但從預(yù)測表現(xiàn)角度看,在圖像分辨率為100×100的情況下,Residual網(wǎng)絡(luò)的分類精度表現(xiàn)最好。從計算效率角度可得,在確保精度盡量高的前提下,圖像分辨率為100×100時,CNN的分類時間較短。該實(shí)驗(yàn)結(jié)論可以進(jìn)一步提升臨床醫(yī)學(xué)中判別COVID-19的診斷效率,輔助醫(yī)生快速作出診斷。增強(qiáng)我國實(shí)時監(jiān)控新冠感染疫情的能力。
3" 總結(jié)與展望
為了進(jìn)一步提升臨床醫(yī)學(xué)中判別病人是否患有COVID-19的診斷效率,增強(qiáng)我國實(shí)時監(jiān)控新冠感染疫情的能力,本文利用8種機(jī)器學(xué)習(xí)方法,分別從數(shù)據(jù)可視化、預(yù)測表現(xiàn)和計算效率3個統(tǒng)計測度視角分析病人肺部CT圖像。結(jié)果表明,LassoNet具有較好的模型可解釋性,而殘差網(wǎng)絡(luò)具有最佳的預(yù)測表現(xiàn)。Residual網(wǎng)絡(luò)的分類精度雖然表現(xiàn)最佳,但在后續(xù)的研究中還可以對數(shù)據(jù)集的分辨率進(jìn)一步調(diào)整,選取最優(yōu)輸入分辨率。其次,可進(jìn)一步加入并行化技術(shù),在云計算機(jī)和GPU上運(yùn)行代碼,同時通過提升硬件設(shè)備來加快運(yùn)行速度。
參考文獻(xiàn):
[1] CANAYAZ M. MH-COVIDNET: Diagnosis of COVID-19 using deep neural networks and meta-heuristic-based feature selection on X-ray images[J].Biomedical Signal Processing and Control, 2021, 64: 102257.
[2] ELGENDI M, FLETCHER R, HOWARD N, et al. The evaluation of deep neural networks and X-ray as a practical alternative for diagnosis and management of COVID-19[J]. medRxiv, 2020.
[3] OZTURK T, TALO M, YILDIRIM E A, et al. Automated detection of COVID-19 cases using deep neural networks with X-ray images[J].Computers in biology and medicine, 2020,121:103792.
[4] PUNN N S, AGARWAL S. Automated diagnosis of COVID-19 with limited posteroanterior chest X-ray images using fine-tuned deep neural networks[J].Applied Intelligence,2021, 51(5):2689-2702.
[5] 郭保蘇,莊集超,吳鳳和,等.基于CT圖像卷積神經(jīng)網(wǎng)絡(luò)處理的新冠肺炎檢測[J].計量學(xué)報,2021,42(4):537-544.
[6] NARIN A, KAYA C, PAMUK Z. Automatic detection of coronavirus disease (covid-19) using x-ray images and deep convolutional neural networks[J].Pattern Analysis and Applications, 2021,24(3):1207-1220.
[7] GUNRAJ H, SABRI A, KOFF D, et al. Covid-net ct-2: Enhanced deep neural networks for detection of covid-19 from chest ct images through bigger, more diverse learning[J].Frontiers in Medicine, 2021:8.
[8] FOULADI S, EBADI M J, SAFAEI A A, et al. Efficient deep neural networks for classification of COVID-19 based on CT images: Virtualization via software defined radio[J]. Computer Communications, 2021,176:234-248.