亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        新型冠狀病毒肺炎的深度學(xué)習(xí)診斷方法綜述

        2022-06-23 06:24:32馬金林馬自萍
        計算機(jī)工程與應(yīng)用 2022年12期
        關(guān)鍵詞:準(zhǔn)確率分類深度

        馬金林,裘 碩,馬自萍,陳 勇

        1.北方民族大學(xué) 計算機(jī)科學(xué)與工程學(xué)院,銀川 750021

        2.圖像圖形智能信息處理國家民委重點(diǎn)實驗室,銀川 750021

        3.北方民族大學(xué) 數(shù)學(xué)與信息科學(xué)學(xué)院,銀川 750021

        4.寧夏醫(yī)科大學(xué)總醫(yī)院 放射介入科,銀川 750004

        新型冠狀病毒肺炎[1](COVID-19)的快速診斷對疾病治療和疫情防控具有重要意義。逆轉(zhuǎn)錄-聚合酶反應(yīng)(RT-PCR)[2]檢測是COVID-19檢測的“金標(biāo)準(zhǔn)”,但存在一些缺陷[3]。為了加快診斷速度,提高準(zhǔn)確率,肺部影像篩查方法被大量使用。肺部影像篩查主要利用深度學(xué)習(xí)對肺部影像(X-ray圖像和CT圖像)進(jìn)行分析,深度學(xué)習(xí)技術(shù)可以揭示圖像中許多不顯著的特征,進(jìn)而給出明確的檢測結(jié)果。隨著大量COVID-19深度學(xué)習(xí)分類模型的涌現(xiàn),其性能日益提高[4],COVID-19得以快速準(zhǔn)確地診斷。

        1 COVID-19圖像數(shù)據(jù)集

        自2019年,出現(xiàn)了大量的COVID-19數(shù)據(jù)集,這些數(shù)據(jù)集主要由肺部的X-ray圖像和CT圖像組成(如圖1所示),一般分為COVID-19、病毒性肺炎、社區(qū)獲得性肺炎、細(xì)菌性肺炎、其他肺炎和正常等類別。

        圖1 肺部X-ray圖像和CT圖像Fig.1 X-ray and CT images of lung

        1.1 X-ray數(shù)據(jù)集

        X-ray數(shù)據(jù)集基于X射線獲得胸部照片,因其費(fèi)用較低,最早被廣泛使用,但由于其輻射量大,逐漸被CT、MRI等技術(shù)取代。

        COVID19-DB[5]數(shù)據(jù)集:COVID19-DB包含3 545張胸部X-ray圖像,數(shù)據(jù)源于RSNA肺炎檢測挑戰(zhàn)賽收集的胸部圖像和COVID-19胸部圖像,湘雅醫(yī)院的四名放射科醫(yī)生對胸部X-ray圖像進(jìn)行了COVID-19驗證和標(biāo)注。此外,作者使用多種數(shù)據(jù)增強(qiáng)[6]技術(shù)(如隨機(jī)裁剪、翻轉(zhuǎn)、移動、傾斜和縮放)擴(kuò)展數(shù)據(jù)。

        Chest X-Ray Images(Pneumonia)[7]數(shù)據(jù)集:Pneumonia是非COVID-19數(shù)據(jù)集,包含來自健康受試者、病毒性肺炎患者和細(xì)菌性肺炎患者的5 863張X-ray圖像。該數(shù)據(jù)集由訓(xùn)練集、測試集和驗證集組成,通常被用于其他COVID-19數(shù)據(jù)集的數(shù)據(jù)增強(qiáng)。

        Figure 1 COVID-19 Chest X-ray Dataset Initiative數(shù)據(jù)集:Figure 1 COVID-19 Chest X-ray Dataset Initiative是由COVID-Net團(tuán)隊收集的56個COVID-19圖像組成,圖像格式為PNG和JPG,可通過網(wǎng)址https://github.com/agchung/Figure1-COVID-chestxray-dataset獲取該數(shù)據(jù)集。

        COVID-19 radiography database數(shù)據(jù)集:COVID-19 radiography database是由來自卡塔爾多哈的卡塔爾大學(xué)和孟加拉達(dá)卡大學(xué)的研究人員連同巴基斯坦和馬來西亞的合作者與醫(yī)生合作創(chuàng)建的,包含3 616 COVID-19陽性、10 192正常、6 012肺部混濁(非COVID-19)和1 345病毒性肺炎圖像,格式為PNG??赏ㄟ^網(wǎng)址https://www.kaggle.com/tawsifurrahman/covid19-radiography-database獲取該數(shù)據(jù)集。

        ActualMed COVID-19 Chest X-Ray Dataset Initiative數(shù)據(jù)集:ActualMed COVID-19 Chest X-Ray Dataset Initiative由238張X-ray圖像組成,分為COVID-19和No finding兩類,該數(shù)據(jù)集可通過網(wǎng)址https://github.com/agchung/Actualmed-COVID-chestxray-dataset獲取。

        1.2 CT數(shù)據(jù)集

        CT圖像具有高密度分辨力且能夠進(jìn)行密度量化分析,易于檢查病變,能夠較早發(fā)現(xiàn)小病變,較準(zhǔn)確顯示出病變范圍。臨床中,CT圖像可以克服X線影像重疊的問題,明顯提高病灶檢出率。另外,CT圖像是數(shù)字化圖像,能夠運(yùn)用計算機(jī)軟件進(jìn)行各種處理。

        COVIDx[8]數(shù)據(jù)集:COVIDx是最大的COVID-19陽性病例數(shù)據(jù)集,數(shù)據(jù)集的13 975張CT圖像來自5個公開數(shù)據(jù)庫的13 870例患者,其中COVID-19患者266、普通肺炎患者8 066、正常患者8 066。該數(shù)據(jù)集可通過網(wǎng)址https://github.com/lindawangg/COVID-Net獲取。

        COVID19-CT[9]數(shù)據(jù)集:COVID19-CT包含216位患者的349份COVID-19陽性圖像和397份COVID-19陰性圖像,這些圖像均使用PyMuPDF[10]從文獻(xiàn)中分割而來,其中陽性圖像全部來自于medRxiv[11]和bioRxiv[12]收錄的760篇COVID-19的預(yù)印本文獻(xiàn),陰性圖像的202個來自于PubMed Central(PMC)[13]搜索引擎,其余的195個來自于MedPix。

        COVID-CT-Set[14]數(shù)據(jù)集:COVID-CT-Set是伊朗薩里的內(nèi)金放射科收集的,包含來自95名患者的15 589幅COVID-19圖像和來自282名患者的48 260幅正常圖像,格式為16位TIFF灰度圖像。

        SARS-CoV-2 CT-scan[15]數(shù)據(jù)集:SARS-CoV-2 CTscan收集了來自巴西圣保羅醫(yī)院的2 492位患者的CT圖像,其中1 262例COVID-19陽性和1 230例COVID-19陰性。該數(shù)據(jù)集可通過網(wǎng)址https://www.kaggle.com/plameneduardo/sarscov2-ctscan-dataset獲取。

        CC-CCII[16]數(shù)據(jù)集:CC-CCII在全球范圍內(nèi)可用,其包含4 154名患者的617 775層CT圖像,分為新型冠狀病毒肺炎(NCP)、普通肺炎(CP)和正常(normal)三種類型,其中CP包括細(xì)菌性肺炎和病毒性肺炎。該數(shù)據(jù)集目前已經(jīng)更新到2.3版本,相比1.0版本添加了病灶分割數(shù)據(jù)集和相應(yīng)的CSV文件。

        COVID-CT-Seg[17]數(shù)據(jù)集:COVID-CT-Seg包含了20個標(biāo)注為左肺、右肺和感染的CT掃描圖像(COVID-19圖像),這些標(biāo)注先由初級標(biāo)注師圈定,再由兩名有5年經(jīng)驗的放射科醫(yī)師細(xì)化,最后所有標(biāo)注由一名有10年以上胸部放射學(xué)經(jīng)驗的資深放射科醫(yī)師驗證細(xì)化。該數(shù)據(jù)集可通過網(wǎng)址http://medicalsegmentation.com/covid19/獲取。

        MosMedData[18]數(shù)據(jù)集:MosMedData包含1 000余位患者的胸部CT圖像,分為COVID-19(CT1-CT4)和正常(CT0)五類,采用NIFTI格式。醫(yī)學(xué)專家對一小部分圖像(n=50)進(jìn)行了標(biāo)注,每個CT切片都標(biāo)出COVID-19特有的像素區(qū)域,并標(biāo)注肺組織異常??赏ㄟ^網(wǎng)址https://mosmed.ai/datasets/covid19_1110/獲取該數(shù)據(jù)集。

        1.3 X-ray與CT混合的數(shù)據(jù)集

        COVID-chestxray[19]數(shù)據(jù)集:COVID-chestxray是一個公開的COVID-19病例數(shù)據(jù)集,由434張COVID-19的X-ray圖像和少量CT圖像組成,分為COVID-19、普通病毒性肺炎和細(xì)菌性肺炎(MERS、SARS、ARDS)三種類型。

        COVID-19-CT-CXR[20]數(shù)據(jù)集:COVID-19-CT-CXR是從PubMed Central Open Access(PMC-OA)子集的COVID-19相關(guān)文章中提取的公共數(shù)據(jù)庫,包含COVID-19的1 327張CT圖像和263張X-ray圖像。

        主要的COVID-19數(shù)據(jù)集如表1所示。

        表1 主要COVID-19數(shù)據(jù)集匯總表Table 1 Summary table of major COVID-19 datasets

        2 基于深度學(xué)習(xí)的診斷方法

        基于深度學(xué)習(xí)的診斷方法主要是借助深度學(xué)習(xí)模型對圖像進(jìn)行分類,常用基礎(chǔ)分類模型有:VGGNet[21]、Inception[22]、ResNet[23]、DenseNet[24]、CapsNet[25]和Efficient-Net[26]等模型,整體結(jié)構(gòu)如圖2所示。

        圖2 基于深度學(xué)習(xí)診斷方法的整體結(jié)構(gòu)圖Fig.2 Overall structure diagram of deep learning-based diagnostic methods

        2.1 基于VGGNet的分類模型

        VGGNet主要包含VGG16和VGG19兩種結(jié)構(gòu),通過采用小卷積核、小池化核,增加網(wǎng)絡(luò)深度來提高特征學(xué)習(xí)和模型表達(dá)能力,在保證獲得相同感受野下,減少網(wǎng)絡(luò)參數(shù)同時捕獲更多細(xì)節(jié),部分學(xué)者將VGGNet用做診斷COVID-19的骨干網(wǎng)絡(luò)。

        自動化COVID-19篩查模型TLCoV[27]使用VGG16通過遷移學(xué)習(xí)[28]將在ImageNet數(shù)據(jù)集上學(xué)習(xí)的權(quán)值、偏差和特征轉(zhuǎn)移到TLCoV模型,降低計算量,采用離線增強(qiáng)技術(shù)來增強(qiáng)數(shù)據(jù),實驗在COVID-19、病毒性肺炎和正常的三分類上取得97.67%的準(zhǔn)確率,96.65%的精度,但是并未提及靈敏度和特異性等指標(biāo),且使用了大量池化層丟失了識別對象的空間信息,后續(xù)可以引入膠囊網(wǎng)絡(luò)的路由機(jī)制來避免這一問題。

        Wang等[29]提出以VSBN為骨干網(wǎng)絡(luò),集成卷積塊注意模塊[30](CBAM)和多路數(shù)據(jù)擴(kuò)充方法(IMDA)的ACNC模型來檢測COVID-19。VSBN以VGG作為骨干網(wǎng)絡(luò),CBAM通過通道注意模塊(CAM)和空間注意模塊(SAM)來細(xì)化三維特征圖,專注顯著特征并增強(qiáng)對噪聲的魯棒性,IMDA有助于減少數(shù)據(jù)集過小帶來的過擬合,實驗顯示,該模型對COVID-19、社區(qū)獲得性肺炎、繼發(fā)性肺結(jié)核和健康四種分類的靈敏度、精度都在95%以上。

        Shibly等[31]以VGG16為基礎(chǔ)提出了一個由24個卷積層、兩個全連接層和六個匯集層組成的新框架。該研究使用了13 800圖片作為數(shù)據(jù)集(來自COVIDx和作者定制)進(jìn)行實驗,避免了數(shù)據(jù)集過小的局限。不足的是,該模型在較差圖像的預(yù)測任務(wù)中做出了不正確的結(jié)論。

        COV-VGX[32]引入了兩種類型的分類器,一個是正常、COVID-19和普通肺炎的分類器,另一個是COVID-19和普通肺炎分類器,該模型使用了遷移學(xué)習(xí),在經(jīng)過預(yù)訓(xùn)練的VGG16模型上采用相等且足夠多的數(shù)據(jù)集進(jìn)行評估,結(jié)果顯示兩種分類器上均取得了良好效果,但是無法區(qū)分病毒性肺炎和細(xì)菌性肺炎的圖像。

        整體來看,使用VGG作為骨干網(wǎng)絡(luò)的模型大多都針對小數(shù)據(jù)集實施了改進(jìn)措施,對比結(jié)果可以發(fā)現(xiàn),其中COV-VGX[32]效果最好,證明了一個平衡的大數(shù)據(jù)集對于基于VGG網(wǎng)絡(luò)模型的訓(xùn)練的重要性。

        2.2 基于Inception的分類模型

        相比VGG來說,Inception模型采用不同尺度的多分支結(jié)構(gòu)提取多尺度特特征,通過聚集相關(guān)性強(qiáng)的特征來保持網(wǎng)絡(luò)結(jié)構(gòu)的稀疏性,更多小尺度卷積核也使網(wǎng)絡(luò)更加輕量化,還利用1×1卷積減少參數(shù)量并加深網(wǎng)絡(luò),提高網(wǎng)絡(luò)計算效率和性能。模型使用全局平均池化層替換全連接層,提高了運(yùn)算速度,Inception也常被研究人員應(yīng)用到COVID-19檢測中。

        Das等[13]提出Truncated Inception Net從非COVID-19或健康病例中篩COVID-19陽性圖像。該模型訓(xùn)練時間少,參數(shù)量少,使用六種不同類型的數(shù)據(jù)集進(jìn)行驗證,在COVID-19陽性、肺炎與健康的分類中取得99.96%的準(zhǔn)確率(AUC為1.0)。但該模型受限于其在圖像中定位疾病的能力,從更深層的激活圖中可以看出,該模型開發(fā)的是圖像特征的內(nèi)在表示,而不是準(zhǔn)確的空間熱圖,該問題可以通過在大量不同疾病的圖像上預(yù)訓(xùn)練來避免。

        CoroNet[33]使用Xception[34]作為基礎(chǔ)模型,在末尾添加一個脫落層和兩個全連接層,構(gòu)成新的深度卷積神經(jīng)網(wǎng)絡(luò),使用遷移學(xué)習(xí)來克服過度擬合的問題,實驗結(jié)果顯示CoroNet計算量較小,在小規(guī)模數(shù)據(jù)集上取得了較好的結(jié)果,但是由于數(shù)據(jù)集較小,患者信息較少,給實驗帶來了一定的局限性。

        以Inception為基礎(chǔ)的模型在減少參數(shù)量這一方面具有一定的優(yōu)勢,其中以Truncated Inception Net[13]最低,僅有COVID-Net[8]的18%。

        2.3 基于ResNet的分類模型

        ResNet提出殘差連接將淺層特征信息直接連接到深層,利用新的表達(dá)方式實現(xiàn)層間恒等映射。ResNet的每層特征僅需要在前續(xù)層特征基礎(chǔ)上學(xué)習(xí)新的特征,殘差連接中反向傳播的導(dǎo)數(shù)需要加上恒等項,有效地避免了過小梯度信息的消失,緩解了梯度彌散和網(wǎng)絡(luò)退化問題。通過殘差連接技術(shù)可以加深網(wǎng)絡(luò),從而獲得更強(qiáng)的逐層學(xué)習(xí)能力和更強(qiáng)的模型表達(dá)能力,因此,基于深度學(xué)習(xí)的診斷方法多以ResNet為骨干網(wǎng)絡(luò)。

        以ResNet50[35]為骨干的3D深度學(xué)習(xí)框架COVNet[12]能夠提取肺部CT圖像的二維局部特征和三維全局特征。COVNet使用最大池化操作組合提取切片特征,并反饋到全連接層和softmax激活函數(shù),以生成每種類型(COVID-19、社區(qū)獲得性肺炎和非肺炎)的概率。為了提高模型的可解釋性,作者采用梯度加權(quán)類激活映射(Grad-CAM)[36]方法可視化深度學(xué)習(xí)模型決策的重要區(qū)域,但是該方法主要關(guān)注異常區(qū)域,而忽略了正常區(qū)域,易造成錯判。此外,COVNet只給出疾病的類別,未明確疾病的嚴(yán)重程度。

        為明確COVID-19的嚴(yán)重程度,Goncharov等[37]提出了基于閾值的方法(因為病理組織比健康組織密度大,所以相應(yīng)的CT體素在Hounsfield單位中具有更大的強(qiáng)度)來量化COVID-19嚴(yán)重程度,但是該方法存在血管和支氣管的假陽性預(yù)測和無法將COVID-19相關(guān)病變與其他病理區(qū)分的缺點(diǎn)。因此作者采用了一個多任務(wù)模型,該體系結(jié)構(gòu)的分段部分是切片式的2D三角網(wǎng)模型,輸出用于評估嚴(yán)重性分?jǐn)?shù),分類與分割部分共享一個公共的中間特征圖,這些特征圖被堆疊并通過金字塔匯集層聚集成特征向量,在兩個完全連接層后進(jìn)行sigmoid激活,將特征向量轉(zhuǎn)換為COVID-19概率。實驗證明,該多任務(wù)架構(gòu)同時實現(xiàn)COVID-19識別和嚴(yán)重性量化的最高質(zhì)量指標(biāo),但是在非COVID-19患者中的分類管道會產(chǎn)生相對較少的假陽性警報,需要放射科醫(yī)生二次查看。

        相比COVNet[12]只檢查和修改了一個CNN來說,Ardakani等[38]提出了10個廣泛使用的網(wǎng)絡(luò),通過分析投資回報提高網(wǎng)絡(luò)性能,同時避免了COVNet將整個肺部區(qū)域輸送到網(wǎng)絡(luò)進(jìn)行區(qū)分時冗余數(shù)據(jù)造成的誤診。實驗結(jié)果顯示,所有網(wǎng)絡(luò)中性能最好的是ResNet101,其靈敏度為100%,特異性為99.0%,準(zhǔn)確率為99.5%。因此,作者認(rèn)為ResNet101是一個高靈敏度的模型,比Rahimzadeh等[39]提出的模型靈敏度高了近20%。但該方法也存在一定的局限性,首先,該模型的性能并沒有與放射科醫(yī)生進(jìn)行比較;其次,該實驗數(shù)據(jù)是由醫(yī)生復(fù)核得到的,由于小部分COVID-19患者的RT-PCR結(jié)果為陰性,導(dǎo)致醫(yī)生在篩選圖像時,這些患者可能被錯誤地排除在外,造成一定的實驗誤差。

        遷移學(xué)習(xí)能夠解決小數(shù)據(jù)問題,降低模型計算量,被部分研究人員應(yīng)用到網(wǎng)絡(luò)中。Narin等[40]使用五個預(yù)訓(xùn)練模型(ResNet50、ResNet101、ResNet152、InceptionV3[41]和Inception-ResNet-V2[42])實現(xiàn)三種不同的二分類,即COVID-19和正常(健康)、COVID-19和病毒性肺炎、COVID-19和細(xì)菌性肺炎。雖然作者使用遷移學(xué)習(xí)解決數(shù)據(jù)量少和訓(xùn)練時間不足的問題,但是有限的數(shù)據(jù)依然對研究造成了限制。實驗結(jié)果表明,ResNet50預(yù)訓(xùn)練模型獲得了最好的分類性能(數(shù)據(jù)集1的準(zhǔn)確率為96.1%、數(shù)據(jù)集2的準(zhǔn)確率為99.5%、數(shù)據(jù)集3的準(zhǔn)確率為99.7%)。

        Pathak等[43]用遷移學(xué)習(xí)調(diào)整深層的初始參數(shù),作者用ResNet50提取潛在特征,采用平滑損失函數(shù)來增強(qiáng)結(jié)果,并用10倍交叉驗證方法來防止過擬合問題,但是該研究并沒有考慮超參數(shù)的最優(yōu)選擇問題(該問題由Ucar等[44]和Polsinelli等[45]解決)。

        El-Kenawy等[46]提出了一種基于高級松鼠搜索優(yōu)化算法(ASSOA)的兩階段分類方法,對胸部X-ray圖像中的不同病例進(jìn)行分類。第一階段,使用遷移學(xué)習(xí)技術(shù)進(jìn)行預(yù)訓(xùn)練,采用ASSOA對ResNet-50提取的特征進(jìn)行選擇;第二階段,用選擇后的特征優(yōu)化多層感知器(MLP)神經(jīng)網(wǎng)絡(luò)的連接權(quán)值,對輸入情況進(jìn)行分類。該研究將ASSOA同灰狼優(yōu)化算法(GWO)和遺傳算法進(jìn)行比較,驗證其有效性。實驗顯示,(ASSOA+MLP)算法達(dá)到了99.7%的最高準(zhǔn)確率。此外,該模型能夠有效地對受災(zāi)情況進(jìn)行分類,平均準(zhǔn)確率為99.26%。

        特征金字塔網(wǎng)絡(luò)(feature pyramid networks,F(xiàn)PN)[47]的對模型性能有不小的影響。Rahimzadeh等[14]將FPN用于進(jìn)行圖像預(yù)處理,從而丟棄肺內(nèi)無法正常顯示的CT圖像,以加快處理速度。但是由于測試數(shù)據(jù)集不平衡,導(dǎo)致該方法的實驗準(zhǔn)確性和靈敏度較低。Wang等[5]在COVID-19識別的基礎(chǔ)上添加了肺部定位功能,該研究包含兩個深度學(xué)習(xí)模型Discrimination-DL和Localization-DL:Discrimination-DL在ResNet基礎(chǔ)上構(gòu)建了一個FPN的基本單元作為COVID-19鑒別器確定識別概率;Localization-DL使用殘差網(wǎng)絡(luò)來定位受感染的肺部區(qū)域。其鑒別準(zhǔn)確率和定位準(zhǔn)確率分別為98.71%、93.03%。但由于缺乏來自數(shù)據(jù)源的對應(yīng)圖像,實驗并未納入其他類型病毒性肺炎的X-ray圖像,導(dǎo)致實驗過于單調(diào)。

        ResNet模型輕量化也是一個研究方向,COVIDNet[8]就是一種基于ResNet50的輕量級網(wǎng)絡(luò),該網(wǎng)絡(luò)先在ImageNet數(shù)據(jù)集上進(jìn)行預(yù)訓(xùn)練,然后使用Adam優(yōu)化器在COVIDx數(shù)據(jù)集上訓(xùn)練。COVID-Net不僅能夠在保持低計算復(fù)雜性的同時增強(qiáng)表示能力,而且在檢測COVID-19陽性病例的同時限制假陽性COVID-19檢測的數(shù)量。雖然使用COVID-Net可以幫助臨床醫(yī)生改善篩查,并在加速計算機(jī)輔助篩查時提高信任度和透明度,但實驗結(jié)果顯示該模型對于COVID-19的檢測準(zhǔn)確率較低。

        由于Resnet具有避免小梯度消失,緩解梯度彌散和網(wǎng)絡(luò)退化的特性,但是該類模型在輕量化方面發(fā)展較為緩慢,輕量化的COVID-Net的參數(shù)量遠(yuǎn)大于Truncated Inception Net。

        2.4 基于DenseNet的分類模型

        DenseNet網(wǎng)絡(luò)中任意層進(jìn)行兩兩互連,將ResNet跨層連接進(jìn)一步應(yīng)用,通過對不同層特征圖的復(fù)用,加強(qiáng)網(wǎng)絡(luò)各層之間特征傳遞并減少層間相互依賴性,其中網(wǎng)絡(luò)每層輸入特征圖由前續(xù)所有層信息組合而成,不同長短的跨層連接提供緊湊且有區(qū)別的特征,有效地緩解了深層網(wǎng)絡(luò)中因梯度消失而難以優(yōu)化的問題,DenseNet還利用全部特征進(jìn)行最終預(yù)測來提升模型魯棒性,最終利用較小模型尺寸和計算量,在標(biāo)準(zhǔn)數(shù)據(jù)集上獲得較好性能,因此涌現(xiàn)出許多基于DenseNet的COVID-19分類模型。

        Wang等[48]提出了一個用于COVID-19分類和預(yù)后分析的全自動深度學(xué)習(xí)系統(tǒng),該系統(tǒng)包含:利用DenseNet121[24]+FPN完成肺部區(qū)域的自動分割、非肺區(qū)域抑制和分類與預(yù)后分析三部分。作者使用兩步遷移學(xué)習(xí)策略解決數(shù)據(jù)集較小的問題,并用數(shù)據(jù)鏈可視化算法從兩個角度分析COVID-19網(wǎng)絡(luò)學(xué)習(xí)到的特征。雖然取得了較好的分類效果,但是也存在沒有考慮患者的患病程度(該局限被Goncharov等[37]解決)和小數(shù)據(jù)集導(dǎo)致的準(zhǔn)確性較低的問題。

        Montalbo等[54]提出基于截斷和連接的DenseNet輕量級模型Fused-DenseNet-Tiny來檢測COVID-19。該方法融合了一個截斷的DenseNet模型鏡像,一半從COVID-19病例的X-ray數(shù)據(jù)集和ImageNet中重新訓(xùn)練了整個網(wǎng)絡(luò),另外一半上層部分凍結(jié),以生成不同的特性批處理,兩種模型的不同特征在網(wǎng)絡(luò)結(jié)束前被融合,并通過一組帶有正則化的層來處理,以防止過擬合問題。雖然該模型只有120萬個參數(shù),與其他先進(jìn)的模型相比計算成本和參數(shù)尺寸相對大幅降低,但其提取特征能力下降,使得無法在更大的數(shù)據(jù)集上應(yīng)用。

        DWSDenseNet[55]用深度可分離卷積代替SDenseNet部分稠密塊傳統(tǒng)卷積,以降低網(wǎng)絡(luò)的參數(shù)量。與VGG16、ResNet18、ResNet34、DenseNet121和SDenseNet模型的比較實驗表明,DWSDenseNet在三分類實驗中相較于ResNet34在準(zhǔn)確率、靈敏度和特異性上都有提高。相較于基礎(chǔ)網(wǎng)絡(luò)SDenseNet,DWSDenseNet的參數(shù)量減少了43.9%,但分類效果并未下降。由于實驗僅在一個數(shù)據(jù)集上進(jìn)行,模型的可重復(fù)性未得到充分驗證。

        可以看出,基于DenseNet的分類模型大多一定程度上修改了,使網(wǎng)絡(luò)的參數(shù)量大大降低,尤其是Fused-DenseNet-Tin的參數(shù)量僅有120萬,相比基于Inception的模型更具優(yōu)勢。但是該類模型也存在難以復(fù)現(xiàn)的缺陷,輕量化應(yīng)用是該類模型的發(fā)展前景。

        2.5 基于CapsNet的分類模型

        CapsNet與最先進(jìn)的深度學(xué)習(xí)網(wǎng)絡(luò)不同,它使用淺層網(wǎng)絡(luò),讓capsule層嵌套在其他層中,從而避免增加更多的層使得網(wǎng)絡(luò)深層次化。每個capsule被用于檢測圖像中的特定實體,動態(tài)的路由機(jī)制將檢測到的實體發(fā)送給父層。相比CNN需要從多方面來考慮成千上萬的圖像,capsule網(wǎng)絡(luò)能夠在不同情況下,從多個角度識別物體,減少了數(shù)據(jù)量,在COVID-19檢測中展現(xiàn)了良好的性能。

        COVID-FACT[56]利用膠囊網(wǎng)絡(luò)作為其主要構(gòu)建模型,在第一階段檢測顯示感染的切片,第二階段對患者進(jìn)行劃分,同時增加了一種閾值方法對零個或很少的CT圖像進(jìn)行分類。雖然該模型的可訓(xùn)練的參數(shù)、監(jiān)督要求和注釋遠(yuǎn)少于其他模型,但是其會將社區(qū)獲得性肺炎病例錯誤分類為COVID-19,需要放射科醫(yī)生通過手動改變圖像對比度來檢測這些異常,不僅準(zhǔn)確率低而且會給醫(yī)生帶來不便。相比之下,使用預(yù)訓(xùn)練和遷移學(xué)習(xí)的COVID-CAPS[57]取得了98.3%的準(zhǔn)確率,比COVIDFACT高近8%。

        神經(jīng)網(wǎng)絡(luò)Convolutional CapsNet[58]為二分類(COVID-19和無發(fā)現(xiàn))和多分類(COVID-19、無發(fā)現(xiàn)和肺炎)提供了準(zhǔn)確的診斷方法,Convolutional CapsNet模型相對簡單,具有更少的層,但是所用數(shù)據(jù)集較大,要求輸入圖像的大小相同,需要大量的時間和硬件資源去處理圖像。

        對比發(fā)現(xiàn),基于CapsNet的模型在小數(shù)據(jù)集上更具有優(yōu)勢。

        2.6 基于EfficientNet的分類模型

        EfficientNet提出了B0~B7的縮放尺度,交叉使用3×3和5×5的卷積核進(jìn)行特征提取,提出了組合縮放系數(shù),可同時對寬度、深度和圖片分辨率進(jìn)行參數(shù)調(diào)整,提高了精度。以EfficientNet為基礎(chǔ)的COVID-19檢測模型在準(zhǔn)確率上取得了最佳結(jié)果。

        由中國工程建設(shè)焊接協(xié)會主辦的“中國工程建設(shè)焊接論壇”是我國工程建設(shè)焊接領(lǐng)域的年度盛會,論壇以“新技術(shù)、新工藝、新材料、新設(shè)備”應(yīng)用推廣和技術(shù)交流為主題開展論壇交流,助推工程建設(shè)領(lǐng)域的科技創(chuàng)新,提升工程建設(shè)相關(guān)行業(yè)和會員單位的焊接制造能力和產(chǎn)品質(zhì)量水平,促進(jìn)“產(chǎn)、學(xué)、研、用”的有效融合,推動中國由焊接大國向焊接強(qiáng)國的升級。

        Monshi等[59]基于EfficientNet-B0提出CovidXrayNet模型,通過優(yōu)化數(shù)據(jù)增強(qiáng)管道和模型超參數(shù)來檢測胸部X-ray圖像中COVID-19,解釋并可視化不同數(shù)據(jù)增強(qiáng)技術(shù),使用管道將最佳順序進(jìn)行組合,更好地提取COVID-19診斷相關(guān)特征,模型在增強(qiáng)的平衡COIVDcxr和基準(zhǔn)COVIDx數(shù)據(jù)集的三分類任務(wù)中達(dá)到95.82%準(zhǔn)確率。雖然結(jié)果表現(xiàn)良好,但假陰性的分類結(jié)果(它誤認(rèn)了四名COVID-19患者患有肺炎,一位COVID-19患者是正常的)會給臨床帶來不必要的負(fù)擔(dān)。另外,通過額外的數(shù)據(jù)擴(kuò)充和更好的超參數(shù)來構(gòu)建和優(yōu)化可以避免一些問題,但由于沒有適當(dāng)?shù)腃OVID-19數(shù)據(jù),CovidXrayNet很難在其他數(shù)據(jù)集上實現(xiàn)95.82%的準(zhǔn)確度。

        基于EfficientNet的集成卷積神經(jīng)網(wǎng)絡(luò)ECOVNet[60]使用ImageNet預(yù)訓(xùn)練權(quán)重,通過模型快照和集成預(yù)測降低泛化誤差,通過Grad-CAM可視化一個激活圖來解釋預(yù)測并識別圖像中的關(guān)鍵區(qū)域,實驗在COVIDx上進(jìn)行驗證,顯示對COVID-19的召回率為100%,準(zhǔn)確率為96.07%,高于CovidXrayNet,但實驗并未提及特異性等指標(biāo)。

        Bhatt等[61]在EfficientNetB3模型的基礎(chǔ)上,結(jié)合遷移學(xué)習(xí)技術(shù)與漸進(jìn)調(diào)整技術(shù)[62]增強(qiáng)效果,使用Grad-CAM[36]對圖像進(jìn)行分類,使用COVIDx數(shù)據(jù)集進(jìn)行驗證,在二分類和多分類上準(zhǔn)確性都達(dá)到了100%,但是由于數(shù)據(jù)集過于單一,模型的分類結(jié)果很難復(fù)現(xiàn)。

        從性能來看,基于EfficientNe的分類模型取得的效果最佳,但是網(wǎng)絡(luò)往往缺乏可重復(fù)性,對數(shù)據(jù)集往往有很高的要求。因此,通過數(shù)據(jù)集的多樣化來提高模型泛化能力是該類模型的一個發(fā)展方向。

        2.7 基于多網(wǎng)絡(luò)融合的分類模型

        由于COVID-19的圖像較少,很容易因數(shù)據(jù)集不平衡而影響模型的訓(xùn)練效果。因此,Rahimzadeh等[39]將實驗分為訓(xùn)練和驗證兩部分,訓(xùn)練時將訓(xùn)練集分為8個連續(xù)階段。作者使用基于Xception和ResNet50-V2的級聯(lián)神經(jīng)網(wǎng)絡(luò),實現(xiàn)了99.50%的平均精度,但靈敏度僅有80.5%。

        Tiwari等[63]采用CapsNet與VGG16級聯(lián)網(wǎng)絡(luò),既解決了傳統(tǒng)CNN的局限,又增強(qiáng)了初始特征圖的計算能力,在小數(shù)據(jù)上取得了良好的性能,但是該網(wǎng)絡(luò)更加適用于二分類。

        DenseCapsNet[64]由密集卷積網(wǎng)絡(luò)和膠囊神經(jīng)網(wǎng)絡(luò)融合而成,利用各網(wǎng)絡(luò)的自身優(yōu)勢,減少卷積神經(jīng)網(wǎng)絡(luò)對大量數(shù)據(jù)的依賴。該方法可取得90.7%的準(zhǔn)確度和90.9%的F1值,其COVID-19的檢測靈敏度可達(dá)96%。

        COFE-Net[65]利用模糊邏輯的原理,通過Choquet模糊積分,結(jié)合三個最先進(jìn)的CNN(InceptionV3、Inception-ResNet-V2和DenseNet201)測量決策值檢測COVID-19。雖然使用了Sugeno模糊測量極大地減少了搜索空間,但是通過實驗確定最佳測量仍然是一個耗時的過程。多個數(shù)據(jù)集上的實驗均取得了良好效果。由于CNN分類器的特征提取自整個輸入圖像,但區(qū)別元素集中在圖像的特定部分,會造成一定的分類誤差。

        多融合的網(wǎng)絡(luò)模型是集合了兩種或多種基礎(chǔ)模型的優(yōu)點(diǎn),使融合模型的檢測效果更佳顯著。但是,這也增加了網(wǎng)絡(luò)的深度,使得計算量和參數(shù)量提升,有必要引入輕量化模塊。

        表2匯總了基于深度學(xué)習(xí)的診斷方法。

        表3匯總了基于深度學(xué)習(xí)的診斷方法的性能對比情況。

        表3 深度學(xué)習(xí)診斷方法性能對比表Table.3 Performance comparison table of deep learning diagnostic methods

        3 深度學(xué)習(xí)與其他機(jī)器學(xué)習(xí)方法結(jié)合的診斷方法

        深度學(xué)習(xí)與其他機(jī)器學(xué)習(xí)方法結(jié)合的診斷方法主要分為三種:深度學(xué)習(xí)與有監(jiān)督方法結(jié)合的分類模型、深度學(xué)習(xí)與弱監(jiān)督方法結(jié)合的分類模型和深度學(xué)習(xí)與無監(jiān)督方法結(jié)合的分類模型,其中深度學(xué)習(xí)與有監(jiān)督方法結(jié)合的分類模型又分為結(jié)合SVM分類器的模型、采用貝葉斯算法的分類模型和結(jié)合其他有監(jiān)督方法的模型三種,圖3展示了深度學(xué)習(xí)與其他機(jī)器學(xué)習(xí)方法結(jié)合的診斷方法結(jié)構(gòu)圖。

        圖3 診斷方法結(jié)構(gòu)圖Fig.3 Diagnostic method structure diagram

        3.1 深度學(xué)習(xí)與有監(jiān)督方法結(jié)合的分類模型

        3.1.1 結(jié)合SVM分類器的模型

        Canayaz等[66]分別使用AlexNet[67]、VGG19、GoogleNet和ResNet等網(wǎng)絡(luò)進(jìn)行特征提取,然后借助元啟發(fā)式算法(二元粒子群優(yōu)化[68]和二元灰狼優(yōu)化[69])選擇最有效的特征,最后用SVM[70]分類器進(jìn)行分類。研究表明,使用BPSO[68]算法的VGG19模型獲得了99.38%的最佳精度。該實驗展示了不同深度學(xué)習(xí)模型在COVID-19診斷中的表現(xiàn),但是對比發(fā)現(xiàn)不是每個深度學(xué)習(xí)模型都能在所提出的方法中取得足夠的成功,模型缺乏廣泛性。

        Ozkaya等[71]提出了一種融合和排列深層特征的方法檢測早期COVID-19。作者采用VGG16、GoogleNet和ResNet50模型進(jìn)行特征提取,將得到的特征向量與這些模型進(jìn)行融合,得到高維融合特征,以此來減少從單個CNN網(wǎng)絡(luò)獲得的特征不足的影響。同時采用t檢驗方法進(jìn)行特征排序(通過考慮特征向量中相同特征的出現(xiàn)頻率和平均特征的發(fā)現(xiàn)頻率來進(jìn)行排序),減少了時間損耗和計算機(jī)復(fù)雜性。在進(jìn)行特征融合和排序后,訓(xùn)練二進(jìn)制SVM分類器進(jìn)行分類。SVM使用了線性核函數(shù),并把特征轉(zhuǎn)移到空間,從而更好地分類特征。通過觀察混淆矩陣可以發(fā)現(xiàn),該模型容易將圖像錯判為COVID-19。

        Togacar等[72]開始時使用模糊顏色技術(shù)和疊加技術(shù)來處理數(shù)據(jù),接著,采用兩種深度學(xué)習(xí)模型(MobileNetV2[73]和SqueezeNet[74])對堆疊數(shù)據(jù)集進(jìn)行訓(xùn)練,并用社會模仿優(yōu)化(SMO)算法提取有效的特征,最后使用支持向量機(jī)(SVM)[75]對有效特征進(jìn)行組合和分類。該模型具有參數(shù)量較少的優(yōu)點(diǎn),為集成到便攜式智能設(shè)備中創(chuàng)造了條件。但是,由于采取了疊加技術(shù)該方法要求原始圖像和結(jié)構(gòu)化圖像的分辨率必須相同,并且無法處理低分辨率的圖像。在特定數(shù)據(jù)集上的實驗結(jié)果顯示,單獨(dú)的COVID-19數(shù)據(jù)分類成功率為100%,COVID-19、正常和肺炎圖像三分類的總成功率為99.27%。

        CovXmlc[76]采用多模型分類方法將X-ray圖像分為COVID-19和正常。該模型在VGG16卷積網(wǎng)絡(luò)的最后一層結(jié)合了SVM,并在VGG16和SVM之間增加包含最大池化層、密集層和dropout層的新卷積結(jié)構(gòu),使得VGG16和SVM更好地同步。將CovXmlc與使用不同參數(shù)和度量的五個現(xiàn)有模型進(jìn)行比較表明,在作者提出的最小數(shù)據(jù)集上,CovXmlc的準(zhǔn)確率高達(dá)95%,顯著高于現(xiàn)有模型的準(zhǔn)確率,但實驗未考慮存在不同COVID-19變體的情況。

        3.1.2 采用貝葉斯算法的分類模型

        貝葉斯算法是處理參數(shù)優(yōu)化問題的有效算法[77-78]。Ucar等[44]和Polsinelli等[45]都是在SqueezeNet的基礎(chǔ)上,使用了貝葉斯算法對初始學(xué)習(xí)率(在訓(xùn)練期間用于更新權(quán)重的比率)、動量(該參數(shù)影響權(quán)重更新,考慮到前一次迭代的更新值)、L2正則化(一個正則化項,用于損失函數(shù)的權(quán)重,以減少過度擬合)等超參數(shù)進(jìn)行優(yōu)化[44-45]。不同的是文獻(xiàn)[45]所述方法添加了訓(xùn)練數(shù)據(jù)集的擴(kuò)充、旋轉(zhuǎn)(隨機(jī)角度在0°到90°之間)、縮放(隨機(jī)值在1.1到1.3之間)和高斯噪聲等處理。而文獻(xiàn)[44]則針對數(shù)據(jù)集的不平衡問題添加了多尺度增強(qiáng)過程。

        較高的假陰性會造成診斷成本偏高,針對該問題Ghoshal等[79]采用加權(quán)貝葉斯[80]卷積神經(jīng)網(wǎng)絡(luò)(BCNN)估計深度學(xué)習(xí)的不確定性(缺乏訓(xùn)練數(shù)據(jù)造成的模型不確定性和由于類重疊、標(biāo)簽噪聲等造成的隨機(jī)不確定性)從而提高人機(jī)組合的診斷性能。在數(shù)據(jù)方面,作者使用數(shù)據(jù)集的平均值和標(biāo)準(zhǔn)偏差值對圖像進(jìn)行標(biāo)準(zhǔn)化,并進(jìn)行實時數(shù)據(jù)增強(qiáng)以防止過度擬合并增強(qiáng)模型的學(xué)習(xí)能力;在網(wǎng)絡(luò)方面,作者在ResNet50V2[81]的基礎(chǔ)上引入全連接層,將最大激活層之后的下降權(quán)重作為高斯過程的近似,并將其轉(zhuǎn)換為近似貝葉斯推理來估計模型不確定性。實驗表明,模型的不確定性和預(yù)測的準(zhǔn)確性之間有很強(qiáng)的相關(guān)性。

        3.1.3 結(jié)合其他有監(jiān)督方法的模型

        Hu等[82]創(chuàng)建了一個具有挑戰(zhàn)性的臨床數(shù)據(jù)集COVID19 DIAG,提出一種新的不平衡數(shù)據(jù)分類方法,該方法采用自適應(yīng)輔助損失(DSN-SAAL)深度監(jiān)督學(xué)習(xí)方法進(jìn)行診斷COVID-19。由于所有的模型參數(shù)都是通過網(wǎng)絡(luò)迭代自動學(xué)習(xí)的,該方法可以應(yīng)用于不同的數(shù)據(jù)集,但有限的數(shù)據(jù)集對深度學(xué)習(xí)模型的訓(xùn)練產(chǎn)生一定影響。

        Elazab等[83]提出一種基于GCN的具有監(jiān)督機(jī)制的新方法從X-ray圖像中診斷COVID-19。該模型將監(jiān)督機(jī)制與VGG網(wǎng)絡(luò)結(jié)合起來,豐富了特征提取功能,取得了96.41%的準(zhǔn)確率。該模型只關(guān)注二分類任務(wù),且沒有定量疾病狀態(tài)。

        3.2 深度學(xué)習(xí)與弱監(jiān)督方法結(jié)合的分類模型

        使用三維檢索的DeCoVNet[84]采用弱監(jiān)督[85]的方法:首先使用U-Net[86]分割肺部區(qū)域,然后將分割后的三維肺部區(qū)域輸入三維深度神經(jīng)網(wǎng)絡(luò)來預(yù)測COVID-19感染的概率。為解決數(shù)據(jù)集過小帶來的過擬合問題,DeCoVNet采用了數(shù)據(jù)增強(qiáng)技術(shù)。該模型易導(dǎo)致較高的假陰性,且存在一些局限性:首先,用于肺部分割的U-Net模型沒有利用時間信息,而是使用不完善的真實度模板進(jìn)行訓(xùn)練;其次,研究中使用的數(shù)據(jù)來自一家醫(yī)院,沒有進(jìn)行跨中心驗證;另外,在診斷COVID-19時,以黑盒方式工作,但由于該算法基于深度學(xué)習(xí),其可解釋性仍處于早期階段。

        Uemura等[87]開發(fā)了名為pix2surv的弱監(jiān)督網(wǎng)絡(luò),可用于從圖像中自動計算事件發(fā)生的時間信息,以進(jìn)行愈后預(yù)測。與目前可用的實驗室測試和現(xiàn)有的基于圖像視覺和定量預(yù)測因子相比,該網(wǎng)絡(luò)有利于預(yù)測COVID-19患者的疾病進(jìn)展和死亡率。此外,還可以通過該模型將患者分為低風(fēng)險組和高風(fēng)險組,其范圍比其他預(yù)測因子更廣。但該方法只考慮基于圖像的信息,將非成像臨床數(shù)據(jù)集成到模型中是提高其預(yù)測準(zhǔn)確性的有效方法。Chikontwe等[88]提出基于雙注意對比的MIL(DA-CMIL)模型來檢測COVID-19。DA-CMIL是一種端到端的弱監(jiān)督模型,它將多個患者CT切片(視為實例包)作為輸入,輸出單個標(biāo)簽?;谧⒁饬C(jī)制的池化層用于隱式選擇潛在空間中的關(guān)鍵切片,而空間注意力機(jī)制通過學(xué)習(xí)切片空間上下文進(jìn)行可解釋的診斷。該模型取得了98.4%的AUC,98.6%的精度。但是該文獻(xiàn)沒有研究健康圖像,在檢測健康圖像時會產(chǎn)生不利結(jié)果。

        3.3 深度學(xué)習(xí)與無監(jiān)督方法結(jié)合的分類模型

        Mansour等[89]提出了一種新的基于無監(jiān)督DL的變分自編碼器(UDL-VAE)模型,用于COVID-19檢測和分類。UDL-VAE模型采用基于自適應(yīng)維納濾波(AWF)的預(yù)處理技術(shù)提高圖像質(zhì)量,使用Inception V4作為特征提取器,無監(jiān)督的VAE模型用于分類過程。UDL-VAE模型在二元類和多類上的準(zhǔn)確率分別達(dá)到了0.987和0.992的效果。雖取實驗取得了優(yōu)良效果,但在超參數(shù)設(shè)計方面有待優(yōu)化。

        Bargshady等[90]提出CycleGAN-Inception模型來識別COVID-19,該方法首先采用無監(jiān)督方法進(jìn)行數(shù)據(jù)增強(qiáng)并調(diào)整數(shù)據(jù)大小,之后把規(guī)范化的數(shù)據(jù)傳入InceptionV3預(yù)訓(xùn)練模型中進(jìn)行驗證,實驗使用的數(shù)據(jù)集包含X-ray和CT圖像。該模型具有較好的兼容性,但只使用了一個公共數(shù)據(jù)庫,數(shù)據(jù)缺乏多樣化,模型的可重復(fù)性有待驗證。

        表4匯總了深度學(xué)習(xí)與其他機(jī)器學(xué)習(xí)方法結(jié)合的診斷方法。

        表4 深度學(xué)習(xí)與其他機(jī)器學(xué)習(xí)結(jié)合方法匯總表Table 4 Summary of deep learning combined with other machine learning methods

        表5匯總了深度學(xué)習(xí)與其他機(jī)器學(xué)習(xí)方法結(jié)合診斷方法的性能對比情況。

        表5 深度學(xué)習(xí)與其他機(jī)器學(xué)習(xí)結(jié)合方法性能對比表Table 5 Table of performance comparison between deep learning and other machine learning methods

        4 結(jié)束語

        本文對COVID-19的深度學(xué)習(xí)診斷方法進(jìn)行總結(jié),通過對比可以發(fā)現(xiàn):

        (1)從骨干網(wǎng)絡(luò)來說。基于COVID-19的診斷模型中,分類網(wǎng)絡(luò)有VGG、Inception、ResNet、DenseNet、CapsNet、EfficientNet等多種,其中以ResNet應(yīng)用最為廣泛,部分作者在這些網(wǎng)絡(luò)基礎(chǔ)上添加其他輔助手段,如FPN、注意力機(jī)制、決策樹等,提高模型性能。

        (2)從數(shù)據(jù)集來說。大多數(shù)研究使用的COVID-19數(shù)據(jù)集的圖像數(shù)量在幾十到幾千之間。為解決小樣本問題,部分作者采用了遷移學(xué)習(xí)的方法。在公開可用的大型COVID-19數(shù)據(jù)集中以COVIDx應(yīng)用最多。

        (3)從模型性能來說。以EfficientNetB3[70]為骨干網(wǎng)絡(luò)的方法在二分類和多分類上準(zhǔn)確率達(dá)到100%,充分證明深度學(xué)習(xí)診斷方法在COVID-19診斷中的重要作用。

        可以發(fā)現(xiàn),隨著計算機(jī)視覺的不斷發(fā)展,深度學(xué)習(xí)在圖分類領(lǐng)域不斷進(jìn)步,大多數(shù)基于深度學(xué)習(xí)的COVID-19診斷模型都取得了顯著成果,但是其仍然存在改進(jìn)空間:

        (1)完善數(shù)據(jù)集。一個模型最終性能的確定離不開數(shù)據(jù)集,因此完整、清晰、精確的數(shù)據(jù)集是必不可少的。目前大部分模型在進(jìn)行驗證的時候所應(yīng)用的數(shù)據(jù)集圖像數(shù)目較少且有些數(shù)據(jù)集的圖像不清晰,這很容易產(chǎn)生過擬合。此外,不少模型采用由不同數(shù)據(jù)集合并而成的新數(shù)據(jù)集,易導(dǎo)致數(shù)據(jù)重復(fù)。

        (2)存在算法偏見(算法偏見是指算法在數(shù)據(jù)集構(gòu)建、目標(biāo)制定與特征選取、數(shù)據(jù)標(biāo)注等環(huán)節(jié)中產(chǎn)生的信息偏差,導(dǎo)致算法失去公平和準(zhǔn)確性)。部分研究采用了兒童的相關(guān)影像作為“COVID-19”非對照組,事實上相比于成人,兒童感染COVID-19的幾率要小得多。因此這種設(shè)計上的偏差會讓算法產(chǎn)生很大的偏見。

        (3)模型具有不可重復(fù)性。一般來說有兩種方法來驗證算法的性能,即內(nèi)部驗證和外部驗證。內(nèi)部驗證是指測試數(shù)據(jù)與開發(fā)數(shù)據(jù)屬于相同來源;外部驗證是指測試數(shù)據(jù)屬于不同來源。如果該研究只是基于一家醫(yī)院的數(shù)據(jù),那么它很可能不適用于另一家醫(yī)院。這些數(shù)據(jù)需要多樣性,最好是國際化的,否則,當(dāng)該方法被更廣泛地測試時肯定是要失敗的。

        (4)模型輕量化[91-93]。隨著卷積神經(jīng)網(wǎng)絡(luò)的不斷進(jìn)步,研究人員提出了很多結(jié)構(gòu)更復(fù)雜、層數(shù)更深的卷積神經(jīng)網(wǎng)絡(luò)模型,但隨之而來的即是效率問題,結(jié)構(gòu)復(fù)雜的卷積神經(jīng)網(wǎng)絡(luò)雖然會有較好的準(zhǔn)確率優(yōu)勢,但是具有效率不高、參數(shù)量大和計算量高等不可忽視的缺點(diǎn),因此輕量化卷積神經(jīng)網(wǎng)絡(luò)的研究對于COVID-19模型的優(yōu)化和應(yīng)用推廣具有深遠(yuǎn)意義。

        (5)無監(jiān)督學(xué)習(xí)。COVID-19的深度學(xué)習(xí)分類方法是監(jiān)督式學(xué)習(xí)。但是人類大腦具有思考能力,更像是無監(jiān)督式學(xué)習(xí),人類視覺系統(tǒng)判斷一幅圖像之前并不需要被告知幾千上萬圖像的類別。因此,使用單純的無監(jiān)督學(xué)習(xí)模型來檢測COVID-19也是未來的一個發(fā)展方向。

        隨著COVID-19的常態(tài)化流行,肺部影像篩查的方法起著越來越重要的作用。本文從基于深度學(xué)習(xí)的COVID-19檢測模型出發(fā),首先簡單地介紹了一些常用的COVID-19數(shù)據(jù)集,接著從深度學(xué)習(xí)和深度學(xué)習(xí)與其他機(jī)器學(xué)習(xí)方法結(jié)合兩個方面對模型的骨干網(wǎng)絡(luò)、數(shù)據(jù)集、性能等多個角度進(jìn)行總結(jié)。隨著各種技術(shù)的發(fā)展,檢測模型在準(zhǔn)確率、靈敏度、特異性等評價指標(biāo)上有很大的提升,這對醫(yī)學(xué)領(lǐng)域的診斷有著很大的幫助。但是部分模型仍然存在一些缺陷,期待未來COVID-19檢測技術(shù)能夠克服這些不足,更好地為醫(yī)學(xué)領(lǐng)域做出貢獻(xiàn)。

        猜你喜歡
        準(zhǔn)確率分類深度
        分類算一算
        乳腺超聲檢查診斷乳腺腫瘤的特異度及準(zhǔn)確率分析
        健康之家(2021年19期)2021-05-23 11:17:39
        不同序列磁共振成像診斷脊柱損傷的臨床準(zhǔn)確率比較探討
        2015—2017 年寧夏各天氣預(yù)報參考產(chǎn)品質(zhì)量檢驗分析
        深度理解一元一次方程
        分類討論求坐標(biāo)
        深度觀察
        深度觀察
        深度觀察
        高速公路車牌識別標(biāo)識站準(zhǔn)確率驗證法
        亚洲色成人网一二三区| 一区二区三区人妻av| 亚洲av免费手机在线观看| 一本色道久久88亚洲精品综合| 日本最新一区二区三区视频观看| 国产亚洲超级97免费视频| 无码人妻aⅴ一区二区三区| 无码骚夜夜精品| 色窝窝无码一区二区三区2022| 亚洲中文字幕无码久久2018| 亚洲av噜噜狠狠蜜桃| 久久国产劲爆内射日本| 国产亚洲av综合人人澡精品| 亚洲av无码国产精品色软件| 精品国品一二三产品区别在线观看 | 亚洲一区二区三区乱码在线| 亚洲视频在线中文字幕乱码| 长腿丝袜在线观看国产| 激情在线一区二区三区视频| 性饥渴的农村熟妇| 欧美日韩国产码高清综合人成| 成人做爰69片免费看网站| 高清无码精品一区二区三区| 亚洲精品区二区三区蜜桃| 蜜桃码一区二区三区在线观看| 国产丝袜美腿中文字幕| 亚洲 日韩 激情 无码 中出| 少妇中文字幕乱码亚洲影视| 亚洲视频一区| 最新手机国产在线小视频| 中文字幕精品一区二区三区av| 中文字幕无码乱人伦| a级毛片免费观看在线| 99久久久无码国产精品试看| 国产午夜福利精品| 国产福利小视频在线观看| 黄页国产精品一区二区免费| 国产精品国产三级国产av18| 中文字幕乱码无码人妻系列蜜桃| 久久精品人妻一区二区三区| 国产精品白浆无码流出|