亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于機(jī)器學(xué)習(xí)的多種分類模型在新型冠狀病毒肺炎與社區(qū)獲得性肺炎鑒別診斷中的效能

        2021-05-21 09:30:48田斌余暉任基剛汪漢林徐井旭黃陳翠
        放射學(xué)實踐 2021年5期
        關(guān)鍵詞:分類特征模型

        田斌, 余暉, 任基剛, 汪漢林, 徐井旭, 黃陳翠

        目前新型冠狀病毒肺炎(corona virus disease 2019,COVID-19)仍在全球廣泛傳播,COVID-19的篩查和確診主要依靠核酸檢測,胸部CT作為一種重要的診斷手段不容忽視,已成為篩選、診斷和評估新型冠狀病毒肺炎嚴(yán)重程度的重要工具[1]。因為COVID-19患者首次聚合酶鏈?zhǔn)椒磻?yīng)(reverse transcription poly-merase chain reaction,RT-PCR)檢查的平均時間為(30±13)h[2],因此,胸部CT檢查不僅對COVID-19的診斷起到預(yù)警作用[3,4],還可以在等待RT-PCR結(jié)果時將可疑患者分流、隔離,為疫情的防控爭取時間。

        因此,COVID-19患者的診斷與鑒別診斷非常重要,其早期診斷可避免在等待核酸檢測結(jié)果的過程中造成進(jìn)一步的蔓延和播散。由于傳統(tǒng)的人工閱片方法鑒別診斷COVID-19與社區(qū)獲得性肺炎(community acquired pneumonia,CAP)具有局限性,所以將人工智能(artificial intelligence,AI)技術(shù)用于COVID-19與CAP的鑒別診斷成為當(dāng)下研究的熱點(diǎn)。部分學(xué)者運(yùn)用線性支持向量機(jī)模型(linearSVM)鑒別診斷COVID-19與CAP,結(jié)果表明linearSVM模型可以有效鑒別COVID-19與CAP[5]。然而,機(jī)器學(xué)習(xí)的分類模型種類繁多,給應(yīng)用的選擇帶來一定困難。此外,目前并不清楚其它分類模型是否也能有效鑒別COVID-19與CAP。因此,本研究通過應(yīng)用14種常用的機(jī)器學(xué)習(xí)分類模型鑒別COVID-19和CAP,旨在探討鑒別COVID-19與CAP效能最高的機(jī)器學(xué)習(xí)分類模型,為臨床醫(yī)師的早期干預(yù)提供更充分的影像學(xué)依據(jù)。

        材料與方法

        1.病例資料

        搜集經(jīng)臨床確診的COVID-19患者86例和CAP患者100例,包括其胸部CT圖像及臨床資料。

        COVID-19患者納入標(biāo)準(zhǔn):①至少兩次核酸檢測陽性的新型冠狀病毒肺炎患者;②患病期間有至少一次胸部CT掃描,圖像含有薄層圖像(層厚≤3 mm),且肺部有炎性CT表現(xiàn)。CAP患者納入標(biāo)準(zhǔn):①至少兩次核酸檢測為陰性的肺炎患者;②患病期間至少有一次胸部CT檢查,圖像含有薄層圖像(層厚≤3 mm),且肺部有炎性CT表現(xiàn)。排除標(biāo)準(zhǔn):①胸部CT圖像中有運(yùn)動偽影致病灶顯示不清;②CT圖像中病灶太小不能識別或肺部無炎性CT征象;③胸部CT無薄層圖像(層厚≤3 mm);④臨床資料、核酸檢測資料丟失者。

        2.研究方法

        研究的機(jī)器分類學(xué)習(xí)流程包括回顧性數(shù)據(jù)采集、圖像預(yù)處理、肺部病變分割、特征提取、特征選擇和特征構(gòu)建、性能評價,流程見圖1。對患者進(jìn)行胸部CT檢查,按照胸部CT標(biāo)準(zhǔn)的成像方案進(jìn)行掃描及重建。

        圖1 利用14種機(jī)器學(xué)習(xí)模型對COVID-19與CAP的鑒別診斷流程。

        3.圖像的分割及預(yù)處理

        將所有病例的胸部CT圖像以DICOM格式導(dǎo)入深睿科研平臺(https://research.deepwise.com)進(jìn)行自動分割,分別由兩位經(jīng)驗豐富的放射科醫(yī)生對自動分割的病灶進(jìn)行修改、確認(rèn)后提交,以避開血管及肋骨等非病灶區(qū)域(圖2~7)。

        圖2 經(jīng)臨床確診的COVID-19病例,藍(lán)色線條表示邊界。a~c) 病灶被準(zhǔn)確分割,避開了肋骨。 圖3 經(jīng)臨床確診的COVID-19病例,藍(lán)色線條表示邊界。a~c) 密度不均勻的層面被準(zhǔn)確分割。 圖4 經(jīng)臨床確診的COVID-19病例,藍(lán)色線條表示邊界。a~c) 密度淺淡的層面被準(zhǔn)確分割。 圖5 經(jīng)臨床確診的CAP病例,藍(lán)色線條表示邊界。a~c) 病灶被準(zhǔn)確分割,避開了肋骨和胸膜。 圖6 經(jīng)臨床確診的CAP病例,藍(lán)色線條表示邊界。a~c) 病灶被準(zhǔn)確分割,避開了血管及支氣管。 圖7 經(jīng)臨床確診的CAP病例,藍(lán)色線條表示邊界。a~c) 密度不均勻的層面被準(zhǔn)確分割,并避開了降主動脈。

        14種分類模型采用同樣的圖像預(yù)處理方式。在本研究中,采用了B樣條插值采樣技術(shù)(B-spline interpolation resampling techniques)進(jìn)行圖像預(yù)處理,即將原始薄層圖像重新采樣到1 mm×1 mm×1 mm的分辨率,應(yīng)用高通或低通小波濾波器(wavelet filter)和拉普拉斯高斯濾波器(laplacian of gaussian filter)對原始圖像進(jìn)行預(yù)處理及圖像變換。

        4.特征提取和篩選

        提取原始圖像和預(yù)處理后圖像的影像組學(xué)特征,包括基于原始圖像或預(yù)處理后圖像像素值的一階特征、描述腫瘤形態(tài)的形態(tài)特征及描述腫瘤內(nèi)部和表面紋理的灰度共生矩陣(gray level co-occurrence matrix,GLCM)、灰度游程矩陣(gray level run length matrix,GLRLM)、灰度區(qū)域大小矩陣(gray level size zone matrix,GLSZM)和灰度相依矩陣(gray level dependence matrix,GLDM)紋理特征。為了消除病變標(biāo)注所帶來的影響,對組間進(jìn)行一致性分析,刪除一致性小于0.75的特征,然后對特征進(jìn)行相關(guān)性分析,隨機(jī)剔除相關(guān)性大于0.9的特征,最后采用Lasso算法用于特征降維和篩選,找出系數(shù)不為零的最重要特征用于建模,提升模型表現(xiàn)。

        5.建立放射組學(xué)特征

        利用線性支持向量機(jī)(linear SVM)分類器[6]、增強(qiáng)學(xué)習(xí)分類器(Ada Boost)[7]、邏輯回歸分類器(logistic Regression)[7-10]、線性支持向量分類器(LinearSVC)[11]、決策樹分類分類器(Decision Tree)[12]、隨機(jī)森林分類器(Random Forest)[9,13]、梯度推進(jìn)分類器(Gradient Boosting)[14,15]、極端梯度增加算法分類器(XGBoost)[16]、伯努利貝葉斯分類器(BernoulliNB)[17]、高斯貝葉斯分類器(GaussianNB)[18]、最臨近規(guī)則分類器(K Nearest Neighbors)[19,20]、線性判別分析分類器(LinearDiscriminant Analysis)[9,21]、隨機(jī)梯度下降分類器(stochastic gradient descent,SGD)[22]、多層感知機(jī)分類器(Multilayer Perceptron)[23]等14種分類器分別建立模型,以上模型均采用5折交叉驗證訓(xùn)練方法,即將所有數(shù)據(jù)分為5部分,其中4部分用于模型訓(xùn)練,1部分用于評估模型的有效性,最后將所有數(shù)據(jù)用于訓(xùn)練集和驗證集。完成所有的訓(xùn)練和驗證之后,用5個測試的平均值來評價模型的性能。為了評估預(yù)測模型在訓(xùn)練集和驗證集中的性能,繪制了受試者工作特征(receiver operating characteristic curve,ROC)曲線,并計算出曲線下面積(area under curve,AUC),以評估分類模型的性能,并將AUC作為評價模型性能的指標(biāo)。

        6.統(tǒng)計學(xué)分析

        采用SPSS 16.0軟件分析樣本的人口統(tǒng)計學(xué)數(shù)據(jù),運(yùn)用秩和檢驗和χ2檢驗分別評估COVID-19與CAP患者之間的年齡、性別差異。利用Scikit學(xué)習(xí)軟件包(0.20.3版)建立分類模型,采用Matplotlib(版本3.1.0)繪制ROC曲線。采用SPSS 16.0軟件對一般數(shù)據(jù)進(jìn)行統(tǒng)計學(xué)分析,對于分類數(shù)據(jù),采用χ2檢驗比較組間差異;對于定量數(shù)據(jù),采用獨(dú)立樣本t檢驗比較組間差異。為了評價預(yù)測模型在訓(xùn)練集和驗證集上的性能,繪制ROC曲線,在訓(xùn)練集和驗證集上顯示分類性能。以P<0.05為差異有統(tǒng)計學(xué)意義。

        結(jié) 果

        本研究共納入86例COVID-19患者,其中男34例,女52例,平均年齡(中位數(shù)±四分位間距)為(49.00±27.00)歲;同時納入100例CAP患者,其中男52例,女48例,平均年齡(中位數(shù)±四分位間距)為(38.00±31.75)歲。COVID-19與CAP兩組患者的性別差異無統(tǒng)計學(xué)意義(χ2=2.89,P=0.089),COVID-19組患者的平均年齡大于CAP組(Z=-3.546,P=0.000)。

        本研究使用14種機(jī)器學(xué)習(xí)分類模型,所有模型的AUC均大于0.9(表1),Random Forest模型的AUC最高(0.9406,圖8a),GaussianNB模型的AUC最低(0.9037,圖8b)。

        圖8 機(jī)器學(xué)習(xí)分類模型的診斷效能。a) Random Forest模型的ROC曲線,其AUC最高(0.9406); b) GaussianNB模型的ROC曲線,其AUC最低(0.9037)。

        表1 經(jīng)科研平臺計算出的14種機(jī)器學(xué)習(xí)模型的AUC

        討 論

        核酸檢測是診斷新冠肺炎的金標(biāo)準(zhǔn)[24],但肺部炎癥不明顯的輕癥患者,核酸檢測往往呈陰性[25,26]。胸部CT作為診斷COVID-19的一種重要補(bǔ)充檢測手段,其可靠性得到廣泛認(rèn)可[27-31]。由于各種病毒性肺炎的CT表現(xiàn)具有相似性,為了鑒別診斷COVID-19與CAP,國內(nèi)外學(xué)者提出了許多可供鑒別的征象,如磨玻璃影、肺內(nèi)實變、光暈征、氣泡征、小葉間隔增厚、支氣管充氣征、胸膜下線、條索影、血管增粗、胸腔積液等[25,32-35]。然而有學(xué)者研究發(fā)現(xiàn),甲型(H1N1)流感病毒感染引起的肺炎表現(xiàn)類似于COVID-19的胸部CT表現(xiàn),如外周分布、磨玻璃影、實變、胸膜下線、支氣管充氣征等征象在兩種病變間差異無統(tǒng)計學(xué)意義[36]。另外有報道指出,單純的肺部CT篩查可能導(dǎo)致COVID-19誤診為柯薩奇病毒肺炎[37]。傳統(tǒng)的人工閱片方式受閱片者工作經(jīng)驗和工作年限等因素的影響,不可避免地帶有閱片者的主觀性。相關(guān)文獻(xiàn)報道,4位美國放射科醫(yī)生鑒別診斷219例COVID-19與205例CAP的敏感度分別為93%、83%、73%和73%,3位中國放射科醫(yī)生鑒別診斷219例COVID-19與205例CAP的敏感度分別為72%、72%和94%,特異度分別為94%、88%、24%[38],這說明傳統(tǒng)的人工閱片方法具有局限性。

        因此,有學(xué)者使用人工智能(AI)的方法鑒別診斷COVID-19與CAP,結(jié)果表明AI可有效鑒別COVID-19與CAP[39,40]。還有學(xué)者使用COVNet模型(一種深度學(xué)習(xí)模型)鑒別診斷COVID-19與CAP[3],結(jié)果表明深度學(xué)習(xí)技術(shù)可有效鑒別COVID-19與CAP,但深度學(xué)習(xí)需要大量的樣本數(shù)據(jù)來進(jìn)行模型訓(xùn)練,大量的數(shù)據(jù)不容易獲得,而且比較費(fèi)時。所以本研究采用對數(shù)據(jù)量要求較小的傳統(tǒng)機(jī)器學(xué)習(xí)方法,以胸部CT圖像的影像組學(xué)信息為特征的分類模型來識別和鑒別COVID-19與CAP。目前,基于機(jī)器學(xué)習(xí)的肺部CT作為鑒別COVID-19與CAP的一種可靠方法和工具,已得到許多學(xué)者的研究證實[3,4,41]。

        然而,以往研究多使用LinearSVM或單一的分類模型來鑒別COVID-19與CAP,雖然表現(xiàn)出了優(yōu)越的效能[25],但沒有提出效能最優(yōu)的分類模型。因為機(jī)器學(xué)習(xí)的分類模型有許多種,因此本研究基于傳統(tǒng)的機(jī)器學(xué)習(xí)方法,利用14種機(jī)器學(xué)習(xí)分類模型鑒別COVID-19與CAP,通過AUC來評估分類模型的診斷效能,并取得了很好的結(jié)果(AUC均大于0.9)。通過對14種機(jī)器學(xué)習(xí)分類模型的橫向?qū)Ρ妊芯堪l(fā)現(xiàn),在鑒別診斷COVID-19與CAP方面,Random Forest分類模型的性能最優(yōu)(AUC=0.9406)。研究表明,組合分類器比單一分類器的分類效果更好,Random Forest是一種利用多個分類樹對數(shù)據(jù)進(jìn)行判別與分類的組合分類方法,該分類模型可用于判斷特征的重要程度以及他們之間是否會相互影響,適用于數(shù)據(jù)集較多的情況,相對于其他算法有較大的優(yōu)勢。Random Forest還具有數(shù)據(jù)的隨機(jī)性和特征選取的隨機(jī)性,使得隨機(jī)森林不容易陷入過度擬合,同時也使得隨機(jī)森林具有很好的抗噪聲能力[42],這可能是該模型在本研究中表現(xiàn)出優(yōu)越效能的原因。

        本研究中COVID-19組患者的年齡大于CAP組,兩組之間差異有統(tǒng)計學(xué)意義,這可能是因為COVID-19好發(fā)于中老年人,尤其是患有慢性病的老年人[43,44]。

        本研究存在以下局限性:①手動修改科研平臺自動分割的病灶,存在一定的不穩(wěn)定因素,但本研究通過組間一致性分析剔除了不穩(wěn)定的特征,盡量避免了不穩(wěn)定特征對結(jié)果的影響;②本研究僅使用14種分類模型,而其他機(jī)器學(xué)習(xí)分類模型是否能夠有效鑒別COVID-19與CAP,有待進(jìn)一步研究與開發(fā)。因此需要更多大樣本、多中心的研究為鑒別診斷COVID-19與CAP提供依據(jù)。

        綜上所述,14種機(jī)器學(xué)習(xí)分類模型均可有效鑒別COVID-19與CAP,具有較高的鑒別診斷效能(AUC值均>0.9),效能最高的模型是Random Forest(AUC=0.9406),能夠在早期診斷COVID-19方面發(fā)揮優(yōu)勢。

        猜你喜歡
        分類特征模型
        一半模型
        分類算一算
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
        如何表達(dá)“特征”
        不忠誠的四個特征
        分類討論求坐標(biāo)
        數(shù)據(jù)分析中的分類討論
        教你一招:數(shù)的分類
        抓住特征巧觀察
        亚洲成av人片在www| 性色av一区二区三区密臀av| 99精品久久精品一区| 国产播放隔着超薄丝袜进入| 野花社区www高清视频| 精品国产91久久综合| 蜜桃视频一区视频二区| 老太婆性杂交视频| 亚洲成av人片在线观看无码| 综合91在线精品| 国产午夜三级精品久久久| 欧美精品欧美人与动人物牲交 | 人妻少妇偷人精品视频| 少妇久久久久久被弄高潮| 久久精品一区二区三区av| 国产成人久久精品亚洲小说| 一区二区三区亚洲免费| 又湿又紧又大又爽a视频国产| 日日碰狠狠躁久久躁96avv | 日本护士吞精囗交gif| 国产精品一区二区三级| 亚洲精品在线97中文字幕| 胸大美女又黄的网站| 成人免费视频在线观看| 国产黄片一区视频在线观看| 成人麻豆视频免费观看| 又黄又硬又湿又刺激视频免费| 国产一毛片| 日本伦理视频一区二区| 99久久精品无码一区二区毛片| 国产99久久亚洲综合精品| 亚洲人成无码网站十八禁| 天堂av网手机线上天堂| 伊人久久大香线蕉av网禁呦| 国产三级欧美| 邻居少妇张开腿让我爽视频| 久久成人成狠狠爱综合网| 国产熟妇搡bbbb搡bb七区| 亚洲色图在线视频免费观看| 蜜桃视频国产一区二区| 中国国语毛片免费观看视频|