胡瓊潔, 陳沖, 王玉錦, 胡玉娜, 潘月影, 楊朝霞, 艾濤, 孫子燕, 管漢雄, 夏黎明
肺是惡性腫瘤轉(zhuǎn)移的第三大常見(jiàn)部位,僅次于淋巴結(jié)和肝臟。大約1/3的患者在疾病過(guò)程中會(huì)發(fā)生肺轉(zhuǎn)移。 早期識(shí)別肺部轉(zhuǎn)移對(duì)于患者至關(guān)重要,可通過(guò)更積極和多學(xué)科綜合治療的方法,如肺轉(zhuǎn)移瘤的切除術(shù)或放療等,治療后患者可長(zhǎng)期存活甚至治愈[1-3]。計(jì)算機(jī)斷層掃描(CT),而非胸部X線攝影檢查,是評(píng)估肺轉(zhuǎn)移、隨訪和監(jiān)測(cè)治療反應(yīng)的最有效且安全的檢查手段[4]。此外,這類患者需要反復(fù)多次接受胸部CT檢查,其累計(jì)輻射劑量增加,低劑量計(jì)算機(jī)斷層掃描(low dose CT,LDCT)被推薦用于此類患者。
隨著胸部CT在健康體檢及腫瘤患者隨訪復(fù)查中越來(lái)越廣泛的應(yīng)用,影像科醫(yī)生的工作量與日俱增。目前我國(guó)醫(yī)學(xué)影像數(shù)據(jù)年增長(zhǎng)率約30%,而放射科醫(yī)師數(shù)量增長(zhǎng)率約4%,兩者嚴(yán)重的不匹配意味著放射科醫(yī)師處理影像數(shù)據(jù)的壓力越來(lái)越大,承擔(dān)巨大的負(fù)荷。同時(shí),為了最大限度提高肺結(jié)節(jié)的檢出率和病灶細(xì)節(jié)的顯示,LDCT篩查需要在薄層、不同對(duì)比度的CT圖像(層厚1~1.25 mm)上進(jìn)行觀察,加上至少3種圖像對(duì)比(肺窗、縱隔窗、骨窗),每個(gè)患者所需觀察的圖像將近1000幅,進(jìn)一步增加了影像醫(yī)師的工作負(fù)擔(dān),容易產(chǎn)生視覺(jué)疲勞,降低了工作效率和診斷準(zhǔn)確性,導(dǎo)致對(duì)肺結(jié)節(jié)的漏檢和誤判[5]。研究表明胸外惡性腫瘤患者肺結(jié)節(jié)CT漏診約1/3,其中約20%的結(jié)節(jié)是惡性的[6]。大部分漏診肺結(jié)節(jié)常因體積較小而被漏診。特別對(duì)于剛接觸影像的實(shí)習(xí)學(xué)生而言,CT漏診率更高。
研究表明使用計(jì)算機(jī)輔助檢測(cè)系統(tǒng)(computer-aided detection,CAD)明顯提高肺結(jié)節(jié)檢出的敏感性[7-11]。Awai等[7]闡述了在標(biāo)準(zhǔn)劑量CT掃描中,使用CAD的肺結(jié)節(jié)的檢出率高于不使用CAD的檢出率。Doo等[11]研究表明使用體模CAD對(duì)于肺結(jié)節(jié)檢出率明顯提高。目前尚缺乏CAD對(duì)低劑量CT肺部結(jié)節(jié)檢出率影響,特別是詳細(xì)的臨床研究的相關(guān)報(bào)道。Zhao等[5]發(fā)現(xiàn)CAD在肺癌篩查中具有重要價(jià)值,可提高肺結(jié)節(jié)檢測(cè)的敏感性??筛纳圃u(píng)估低劑量肺癌篩查CT的閱片者的一致性和隨訪建議,在排除小結(jié)節(jié)的情況下[12,13]。有兩篇文獻(xiàn)在標(biāo)準(zhǔn)劑量胸部CT中探討CAD對(duì)胸外惡性腫瘤患者肺結(jié)節(jié)的檢出率[14,15],并未見(jiàn)關(guān)于CAD在低劑量胸部CT對(duì)胸外惡性腫瘤患者檢測(cè)結(jié)節(jié)敏感性的報(bào)道。本研究我們假設(shè)基于卷積神經(jīng)網(wǎng)絡(luò)(CNN)的人工智能CAD系統(tǒng)對(duì)于實(shí)習(xí)醫(yī)生在低劑量?jī)煞NCT掃描劑量中對(duì)肺結(jié)節(jié)的診斷性能顯著提高,包括對(duì)胸外惡性腫瘤患者的小結(jié)節(jié)。評(píng)估CAD對(duì)亞實(shí)性肺結(jié)節(jié)檢出的敏感性相關(guān)研究相對(duì)較少[16],因此本研究根據(jù)結(jié)節(jié)密度特征(實(shí)性,亞實(shí)性和鈣化結(jié)節(jié))、結(jié)節(jié)直徑(<4 mm,4~8 mm,>8 mm)和結(jié)節(jié)分布(胸膜下或非胸膜下)分別比較肺結(jié)節(jié)檢測(cè)的敏感性。
使用CAD發(fā)現(xiàn)肺結(jié)節(jié)的閱片模式主要有3種:包括第一閱片者,第二閱片者(second-reader,SR)和共同閱片者(concurrent-reader,CR)。研究表明使用CAD作為第二閱片者花費(fèi)的時(shí)間更長(zhǎng),因?yàn)樾枰喥瑑纱蝃17]。許多研究表明了第二閱片者模式的有效性[7-10,18-23],而迄今僅有少數(shù)關(guān)于胸部CT共同閱片模式的相關(guān)研究。先前的研究中CAD共同閱片模式的評(píng)估結(jié)果不一致。如,一項(xiàng)研究中表明共同閱片模式,肺結(jié)節(jié)檢測(cè)的靈敏度從56.5%提高到66.5%[24],但另一項(xiàng)研究中[17]使用CAD共同閱片模式診斷的敏感性無(wú)顯著性差異。Beyer等[17]發(fā)現(xiàn)CAD共同閱片模式可以顯著減少閱片時(shí)間,Matsumoto等[24]研究未發(fā)現(xiàn)CAD共同閱片模式對(duì)閱片時(shí)間的影響。此外,尚未見(jiàn)CAD共同讀片模式在低劑量胸部CT情況下對(duì)肺結(jié)節(jié)檢測(cè)影響的相關(guān)報(bào)道。我們假設(shè),CAD的共同讀片模式提高肺結(jié)節(jié)診斷敏感性或減少閱片時(shí)間。
本研究系統(tǒng)地評(píng)價(jià)實(shí)習(xí)醫(yī)師使用CAD作為第二閱片者和共同閱片者在低劑量胸部LDCT肺結(jié)節(jié)檢出中的作用。
本前瞻性研究獲得華中科技大學(xué)同濟(jì)醫(yī)學(xué)院附屬同濟(jì)醫(yī)院倫理委員會(huì)的批準(zhǔn),并且所有受試者簽署了書面知情同意書。2017年7-12月,共招募了129名胸外惡性腫瘤患者,這些患者計(jì)劃進(jìn)行胸部多層螺旋CT檢查以監(jiān)測(cè)或者評(píng)價(jià)肺轉(zhuǎn)移情況。招募受試者時(shí)排除年齡<18歲和孕婦。本研究排除了肺腫塊>100 mm或肺疾病如嚴(yán)重肺氣腫、急性肺部感染、胸腔積液、肺結(jié)核或肺結(jié)節(jié)病的患者。60名患者被納入研究。其中,104例(88.89%)檢測(cè)出肺結(jié)節(jié),13例(11.11%)未檢測(cè)出肺結(jié)節(jié)。
表1 低劑量CT:無(wú)CAD、共同閱片和第二閱片模式檢測(cè)結(jié)節(jié)所用時(shí)間
注:UR=無(wú)CAD模式(unaided reading mode), SR=第二讀片者模式(second-reader mode);P1:UR vs CR; P2:UR vs SR; P3:CR vs SR。
所有患者均以仰臥位吸氣末屏氣時(shí)掃描。采用64排探測(cè)器CT掃描(Discovery CT750 HD,GE Healthcare)。掃描參數(shù):準(zhǔn)直器寬度64×0.625 mm;螺距1.375:1;圖像矩陣512×512。行低劑量CT(BMI≥22:120 kVp,n=88;BMI<22:100 kVp,n=41;20 mAs;NI=30)平掃。 層厚、層間距分別為1.25 mm、1.25 mm,使用ASIR 60%及標(biāo)準(zhǔn)重建方式。
使用CAD系統(tǒng)(推想公司)CAD標(biāo)記,該系統(tǒng)使用卷積神經(jīng)網(wǎng)絡(luò)(CNN)模型。將CAD應(yīng)用于標(biāo)準(zhǔn)劑量和低劑量胸部CT。軟件識(shí)別的候選病灶用圓圈標(biāo)記。每個(gè)病變僅一個(gè)層面上顯示CAD標(biāo)記(即顯示病變的最大直徑層面)。
閱讀疲勞是影響觀察者結(jié)節(jié)診斷敏感性的一個(gè)重要因素。并且不同醫(yī)生診斷敏感性存在差異。為此,隨機(jī)選擇60例用于研究在低劑量胸部CT中,實(shí)習(xí)醫(yī)師在3種不同閱片模式下肺結(jié)節(jié)檢測(cè)的敏感性。3名實(shí)習(xí)醫(yī)師指定為觀察員A、B、C(工作年限小于1年)。3名實(shí)習(xí)生在沒(méi)有CAD的情況下獨(dú)立讀片,8周后以CR模式讀片,6周后以SR模式讀片。觀察者以1到4共4級(jí)對(duì)每個(gè)標(biāo)記結(jié)節(jié)的進(jìn)行評(píng)級(jí),其中4代表最高置信度(確定是結(jié)節(jié)),得分1代表最低置信度(可能不是結(jié)節(jié))[25]。他們根據(jù)自己的需要調(diào)整窗寬、窗位、放大和縮小、和使用最大密度投影(MIP)厚片圖像。記錄真陽(yáng)性率(TP)和假陽(yáng)性率(FP)和讀取時(shí)間。通過(guò)檢測(cè)的結(jié)節(jié)數(shù)除以結(jié)節(jié)總數(shù)來(lái)計(jì)算TP比率。 FP率計(jì)算為每個(gè)CT圖像中假陽(yáng)性結(jié)節(jié)的個(gè)數(shù)。此外,要求3名讀片者手動(dòng)測(cè)量結(jié)節(jié)的平均直徑。采用FROC(free-response receiver operating characteristic)解析(JAFROC 4.2.1,www.devchakraborty.com)分析了獨(dú)立讀片、CR模式和SR模式下的檢出性能[25-28]。肺結(jié)節(jié)參考標(biāo)準(zhǔn)是由3個(gè)沒(méi)有參與讀片研究的胸部放射科醫(yī)師(20年以上經(jīng)驗(yàn))所達(dá)成的共識(shí)確定:3名醫(yī)生閱片2次,兩次閱片之間間隔3個(gè)月。所有高年資胸部放射科醫(yī)師都認(rèn)同的CAD檢出的結(jié)節(jié)亦納入?yún)⒖紭?biāo)準(zhǔn)。 在研究之前,所有觀察者都接受了使用CAD系統(tǒng)的培訓(xùn)。 此外,根據(jù)結(jié)節(jié)最長(zhǎng)直徑(< 4 mm,4~8 mm,>8 mm),結(jié)節(jié)性質(zhì)(實(shí)性,亞實(shí)性和鈣化結(jié)節(jié))和位置(胸膜下或非胸膜下)對(duì)肺結(jié)節(jié)檢測(cè)的敏感性進(jìn)行了總體比較和每個(gè)亞組的比較.
應(yīng)用SPSS 18.0統(tǒng)計(jì)學(xué)軟件進(jìn)行數(shù)據(jù)分析。使用Kolmogrov-Smirnov檢驗(yàn)驗(yàn)證獨(dú)立讀片,第二讀片SR模式,共同讀片CR模式下低劑量CT圖像真陽(yáng)性率,假陽(yáng)性率以及讀片時(shí)間是否滿足正態(tài)分布。符合正態(tài)分布用配對(duì)t檢驗(yàn)或方差分析來(lái)比較正態(tài)變量,不滿足正態(tài)分布使用Wilcoxon秩和檢驗(yàn)或K-W檢驗(yàn)。FROC曲線下面積使用ANOVA方法。P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
首批參加研究受試者81例,其中女44例,男37例,平均年齡(50.63±9.54)歲,年齡范圍29~78歲;BMI(23.82±1.5)kg/m2,BMI范圍22~28kg/m2;采用120 kVp的低劑量CT掃描。第二批參加研究受試者36例,其中女18例,男18例,平均年齡(48.53±13.25)歲,年齡范圍22~76歲,BMI(20.58±0.87)kg/m2,BMI范圍(18.5~22)kg/m2;采用100 kVp的低劑量CT掃描。經(jīng)初步分析,第二批參加研究的36例受試者的輻射劑量更低。隨機(jī)選取60個(gè)病例納入本次研究。診斷參考標(biāo)準(zhǔn):低劑量CT(LDCT)圖像共338個(gè)結(jié)節(jié)(98.48%)。
3名觀察者在獨(dú)立閱讀、CR和SR模式下的閱讀時(shí)間如表1。低劑量CT圖像, CR模式[(259±168) s]閱讀時(shí)間明顯短于獨(dú)立閱片模式[(341±206) s,P<0.0001]和SR模式[(363±165) s,P<0.0001]。
低劑量CT,CAD作為CR模式的平均敏感度(67.36%)顯著高于不使用CAD的平均敏感度(40.83%,P<0.001),而與CAD作為SR模式的平均敏感度(68.34%,P>0.05)無(wú)統(tǒng)計(jì)學(xué)差異。在亞組分析中,對(duì)于<8 mm的結(jié)節(jié),CR模式的平均敏感性高于不使用CAD(P<0.001)。CAD作為CR模式的FP率(5.31/CT)高于不使用CAD (3.28/CT,P<0.0001),而與CAD作為SR模式的FP率(5.23/CT,P=0.263)無(wú)統(tǒng)計(jì)學(xué)差異(表2、3)。
表2 低劑量CT無(wú)CAD模式、共同閱片和第二閱片者模式結(jié)節(jié)檢測(cè)結(jié)果(真陽(yáng)性率和假陽(yáng)性率)
注:UR=無(wú)輔助模式(unaided reading mode), SR=第二讀片者模式(second-reader mode);P1:UR vs CR; P2:UR vs SR; P3:CR vs SR。
表3 低劑量CT:無(wú)CAD,共同閱片模式和第二閱片者模式肺結(jié)節(jié)檢出結(jié)果
注:UR=無(wú)輔助模式(unaided reading mode), SR=第二讀片者模式(second-reader mode);P1:UR vs CR; P2:UR vs SR; P3:CR vs SR。
圖1 FROC曲線代表3名實(shí)習(xí)醫(yī)師使用共同讀片模式(綠線)、第二讀片者模式(紫線)和無(wú)CAD模式(紅線)檢測(cè)肺結(jié)節(jié)的平均性能。
觀察者平均的JAFROC FOM在CR模式下為0.59(95%置信區(qū)間:0.53,0.65),在無(wú)CAD模式下為0.44(95%置信區(qū)間:0.37,0.52),差異有顯著性差異(P<0.0001);SR模式的平均FOM值為0.60(95%置信區(qū)間為0.51,0.69),CR模式與SR模式的FOM值無(wú)統(tǒng)計(jì)學(xué)差異(表4,圖1、2,P=0.675)。
表4 結(jié)節(jié)檢測(cè)的結(jié)果: FOM
注:UR=無(wú)輔助模式(unaided reading mode), SR=第二讀片者模式(second-reader mode);P1:UR vs CR; P2:UR vs SR; P3:CR vs SR。
CT檢查是醫(yī)療輻射暴露最重要因素。近年來(lái),隨著人們對(duì)輻射危害的關(guān)注,低劑量胸部CT越來(lái)越廣泛地應(yīng)用[29]。美國(guó)國(guó)家肺癌篩查試驗(yàn)(national lung screening trial,NLST)表明,低劑量CT降低了肺癌死亡率[30]。此外,累計(jì)輻射劑量的增加引起人們的注意,尤其對(duì)于肺部感染的監(jiān)測(cè),評(píng)價(jià)和監(jiān)測(cè)肺部轉(zhuǎn)移治療反應(yīng),這類患者需要反復(fù)多次進(jìn)行胸部CT檢查[4]。因此也被推薦使用低劑量CT檢查。本研究系統(tǒng)地評(píng)估CAD作為第二閱片者和共同閱片者兩種模式下肺結(jié)節(jié)檢出的效能。盡管實(shí)習(xí)醫(yī)師在低劑量胸部CT圖像上容易漏診結(jié)節(jié),且需要很長(zhǎng)的時(shí)間來(lái)檢測(cè)結(jié)節(jié),但CAD(在第二讀片者和共同讀片模式中)顯著提高了肺結(jié)節(jié)診斷敏感性,同時(shí)使用CAD作為共同讀片模式縮短了閱片時(shí)間。此外,低劑量并沒(méi)有影響實(shí)習(xí)醫(yī)師肺結(jié)節(jié)檢出的假陽(yáng)性率。
圖2 48歲,男,直腸癌患者。 a) 實(shí)習(xí)醫(yī)師不使用CAD時(shí)無(wú)一人在低劑量CT上檢測(cè)到結(jié)節(jié)(直徑約2mm); b) 在共同閱片和第二讀片者模式中, 2名實(shí)習(xí)醫(yī)師正確識(shí)別了該結(jié)節(jié); c) 7個(gè)月后,肺結(jié)節(jié)明顯增大。
許多研究顯示了第二讀片者SR模式[7-10,12,13]的有效性。同樣,我們發(fā)現(xiàn)不論是常規(guī)劑量還是低劑量CT對(duì)于<8 mm結(jié)節(jié),使用CAD作為第二閱片者比較于未使用 CAD,顯著提高實(shí)習(xí)醫(yī)生的診斷準(zhǔn)確度(P<0.001)。
使用CAD系統(tǒng)作為第二閱片者模式,不可避免地延長(zhǎng)讀取時(shí)間。雖然有許多研究表明使用CAD作為第二閱片者模式[7-10,18-23]提高肺結(jié)節(jié)敏感性的有存在性,但關(guān)于CAD作為共同閱片模式的研究很少[17,24,31]。此外,使用CAD作為共同閱片模式在診斷肺結(jié)節(jié)的敏感性和閱片時(shí)間方面存在爭(zhēng)議,并且在低劑量胸部CT,以共同閱片模式使用CAD對(duì)肺結(jié)節(jié)診斷的影響還未見(jiàn)報(bào)道。Beyer等的研究使用CR模式與未使用CAD相比,顯著地減少了閱片時(shí)間,但對(duì)診斷敏感度沒(méi)有影響[17]。他們認(rèn)為共同讀片模式的靈敏度沒(méi)有增加,可能是由于閱片速度的加快,對(duì)CT圖像的視覺(jué)分析不太徹底。最近一項(xiàng)研究表明相比獨(dú)立閱片CR模式閱片時(shí)間并沒(méi)有縮短,但診斷敏感度提高[24]。相反,F(xiàn)oti等[31]研究發(fā)現(xiàn)CR模式既沒(méi)有縮短閱片時(shí)間,也沒(méi)有顯著地提高肺結(jié)節(jié)檢出的敏感性。本研究我們比較了未使用CAD與CAD作為共同讀片模式在低劑量胸部CT,閱片時(shí)間和肺結(jié)節(jié)診斷敏感度的差異。 我們發(fā)現(xiàn)與未使用CAD模式相比,CR模式不僅顯著地減少了讀片時(shí)間,而且還增加了實(shí)習(xí)生在LDCT肺結(jié)節(jié)檢測(cè)的敏感度。 CR模式下(259 s)的讀片時(shí)間明顯短于無(wú)CAD模式(341 s,P<0.01)和SR模式(363 s,P<0.01)。未使用CAD模式的閱片時(shí)間在我們的研究中是直接記錄的;而先前的研究中[17,24,31],未使用CAD模式下的閱片時(shí)間則是從先前的2次閱片中提取的,所以本研究的結(jié)果可靠性更高。共同閱片模式的敏感度(67.36%)高于未使用CAD模式(40.83%,P<0.001),而與第二閱片模型相比,敏感度(68.36%,P>0.05)無(wú)統(tǒng)計(jì)學(xué)差異。在低輻射劑量水平,圖像噪聲隨著輻射劑量減少而增加[5]。盡管實(shí)習(xí)醫(yī)師在低劑量胸部CT圖像上容易漏診結(jié)節(jié),且需要較長(zhǎng)的時(shí)間才能檢出結(jié)節(jié),但使用CAD在共同閱片模式可顯著提高診斷敏感度,且縮短閱片時(shí)間。隨著使用CAD的敏感度的增加,假陽(yáng)性率也增加[32]。我們發(fā)現(xiàn)CR模式中的平均FP率(5.31/CT)比未使用CAD模式高(3.28/CT,P<0.0001),而使用CAD在CR和SR兩種模式平均FP率(5.23/CT,P=0.263)無(wú)統(tǒng)計(jì)學(xué)差異。
JAFROC FOM于2004年首次提出[26],是研究真陽(yáng)性率與假陽(yáng)性率新指標(biāo)[25,27,28]。值得注意的是,我們的研究在低劑量CT使用CAD作為共同閱片者模式的JAFROC FOM顯著高于未使用CAD(P<0.001),而CAD作為共同閱片者比較于作為第二閱片者JAFROC FOM無(wú)統(tǒng)計(jì)學(xué)差異(P>0.05)。 因此,CR模式有益于低劑量CT實(shí)習(xí)醫(yī)師。
本研究局限性在于首先沒(méi)有可利用的外部參考標(biāo)準(zhǔn)(如組織學(xué)證據(jù)),而是3個(gè)高年資胸部放射科醫(yī)師(超過(guò)20年的工作時(shí)間)兩次CT閱片的共識(shí)作內(nèi)部參照標(biāo)準(zhǔn)。這一局限性在評(píng)價(jià)CAD效能的研究中非常普遍。其次,真陽(yáng)性率相對(duì)較低,假陽(yáng)性率相對(duì)較高。然而,考慮到我們研究中90%的結(jié)節(jié)直徑<4 mm,也相對(duì)解釋為什么本研究中的敏感度相對(duì)較低。其次,人類解讀圖像時(shí)的差異不可避免,需要更大多中心的研究來(lái)證實(shí)我們的觀察結(jié)果。最后,本研究結(jié)果僅代表一個(gè)特定算法的在特定參數(shù)時(shí)CAD的表現(xiàn),不能直接用于其它CAD。然而,本研究的重點(diǎn)是讀片者和CAD之間的交互,而非CAD的性能本身。
總之,我們?cè)谂R床上證明了盡管實(shí)習(xí)醫(yī)師在低劑量胸部CT獨(dú)立閱片時(shí)容易漏診結(jié)節(jié),但CAD在共同讀片和第二讀片者模式均顯著提高包括小結(jié)節(jié)在內(nèi)的肺結(jié)節(jié)的診斷敏感性。并且以共同讀片模式使用CAD顯著地縮短了讀片時(shí)間。