李欣菱 郭芳芳 周振 張番棟 王卿 彭志君 蘇大同 范亞光 王穎
肺癌是對人類健康和生命威脅最大的惡性腫瘤之一[1]。降低肺癌死亡率、提高生存質(zhì)量的關(guān)鍵是早診早治。肺結(jié)節(jié)是肺癌的早期表現(xiàn),其檢出率隨著薄層計算機斷層掃描(computed tomography, CT)技術(shù)的發(fā)展而提高,但明顯增多的CT數(shù)據(jù)也增加了醫(yī)師的閱片負擔,從而可能導致肺結(jié)節(jié)的漏診[2]。應用人工智能(artificial intelligence, AI)技術(shù)對海量CT圖像進行初步篩查并標記可疑病變,可以幫助醫(yī)師減少工作量并提高診斷準確率[3,4]。
本研究旨在評估基于深度學習的人工智能軟件在胸部CT惡性及非鈣化結(jié)節(jié)檢測中的應用價值。
1.1 研究對象 自天津醫(yī)科大學總醫(yī)院自建肺結(jié)節(jié)病例庫中隨機抽取200例CT數(shù)據(jù),包含有病理結(jié)果或隨訪兩年以上無變化的結(jié)節(jié)病例。圖像納入標準:①至少包含1枚非鈣化結(jié)節(jié);②有薄層胸部CT圖像(層厚≤1.25 mm);③排除患有彌漫性轉(zhuǎn)移、間質(zhì)性肺病,廣泛瘢痕形成、肺炎、纖維化、肺水腫和具有嚴重運動偽影的圖像。
1.2 CT掃描技術(shù) 所有檢查由16排(General Electric Company, GE)或64排(Light Speed VCT, Discovery HDCT,Optima)螺旋CT機進行掃描。掃描范圍自胸廓入口至肺底部,患者一次吸氣后屏氣完成全肺掃描。掃描方式:螺旋掃描;管電壓120 kV或140 kV;管電流:200 mA-340 mA;螺距:1.375:1;層厚:5.0 mm;圖像矩陣:512×512;視野( field of view, FOV):360 mm。使用標準算法重建1.25 mm層厚軸位圖像。
1.3 肺結(jié)節(jié)檢測 基于深度學習模型的人工智能軟件(Deepwise healthcare, V190120)由深睿醫(yī)療公司提供,將200例胸部CT原始數(shù)據(jù)傳輸至工作站,軟件系統(tǒng)自動批量進行肺結(jié)節(jié)識別和標記。影像醫(yī)師的結(jié)節(jié)檢測基于存檔的影像報告,報告由高年資醫(yī)師對低年資醫(yī)師的初始報告進行審核后完成。
1.4 結(jié)節(jié)標準認定 由2名胸部影像專家在參考AI及影像報告結(jié)果的前提下,在橫斷面進行觀察,確定可疑病灶位置后,參考多平面重建、最大密度投影等結(jié)果來進一步確定標注結(jié)果與肺內(nèi)結(jié)節(jié)的定義是否接近,從而做出判斷,以2人的一致性意見作為真結(jié)節(jié)金標準,同時記錄每個非鈣化結(jié)節(jié)的大小、位置和密度。結(jié)節(jié)的大小分為3組:<5 mm、5 mm-10 mm和>10 mm。結(jié)節(jié)所在位置分成四組:與胸膜相連、周圍性結(jié)節(jié)(距胸膜2 cm以內(nèi),但不與胸膜相連)、肺門區(qū)結(jié)節(jié)(距肺門2 cm以內(nèi))和中心性結(jié)節(jié)(位置介于周圍性和肺門區(qū)結(jié)節(jié)之間)。根據(jù)結(jié)節(jié)密度分為三組:實性結(jié)節(jié)、部分實性結(jié)節(jié)和磨玻璃密度結(jié)節(jié)。 磨玻璃密度結(jié)節(jié)被定義為肺內(nèi)模糊的、密度稍大于肺組織而未掩蓋支氣管、血管等肺紋理結(jié)構(gòu)的結(jié)節(jié);部分實性結(jié)節(jié)被定義為結(jié)節(jié)內(nèi)既包含磨玻璃密度成分,同時也包含實性軟組織密度成分[5,6]。
1.5 統(tǒng)計學方法 應用SPSS 17.0統(tǒng)計學軟件進行資料錄入、整理及統(tǒng)計學分析。分別計算AI和影像醫(yī)師檢出非鈣化肺結(jié)節(jié)的靈敏度及假陽性率。基于<5 mm結(jié)節(jié)臨床意義很小,假陽性率統(tǒng)計時分別計算總體及將<5 mm結(jié)節(jié)排除后的數(shù)值。應用McNemar檢驗比較深度學習模型、影像醫(yī)師檢出肺結(jié)節(jié)的能力,P<0.05為差異有統(tǒng)計學意義。
2.1 結(jié)節(jié)大小及特征 入選200例CT圖像經(jīng)兩位影像專家確認共包含889個真結(jié)節(jié),其中惡性結(jié)節(jié)133例,均經(jīng)病理證實。結(jié)節(jié)大小及特征見表1。
2.2 基于深度學習的人工智能軟件與影像醫(yī)師結(jié)節(jié)檢出靈敏度 對于133例惡性結(jié)節(jié),AI與影像醫(yī)師的檢出率均為100%。AI總體肺結(jié)節(jié)檢測靈敏度明顯高于影像醫(yī)師(99.1%vs43%, χ2=483.20,P<0.001)(表1)。相對于醫(yī)師,AI額外檢測出的結(jié)節(jié)多為直徑<5 mm及5 mm-10 mm的結(jié)節(jié)、實性及磨玻璃密度結(jié)節(jié)。對于亞實性結(jié)節(jié)(圖1),AI的檢出率稍高,但出率沒有顯著性差異。不同位置的結(jié)節(jié),AI的檢出率均高于影像醫(yī)師(表1)。AI共漏檢了8例結(jié)節(jié),均為<5 mm結(jié)節(jié)。
2.3 基于深度學習的人工智能軟件與影像醫(yī)師結(jié)節(jié)檢測的假陽性率 深度學習模型的假陽性結(jié)節(jié)數(shù)為993個,假陽性率為每例CT 4.9個結(jié)節(jié)。若排除直徑<5 mm的假陽性結(jié)節(jié),其假陽性率降低為每例CT 1.5個。假陽性結(jié)節(jié)中,335例(34%)表現(xiàn)為小葉中心性結(jié)構(gòu)(圖2),295例(30%)表現(xiàn)為增粗、相連,聚集、彎曲、交叉及稍膨隆的血管結(jié)構(gòu),126例(13%)表現(xiàn)為為稍擴張、增厚的細支氣管(圖3)或細支氣管內(nèi)分泌物,780例(8%)為片狀實變或磨玻璃密度影,包括局部實變、肺血分布不均、局部肺膨脹不全及慢性炎癥等,73例(7%)與索條、瘢痕等陳舊性病灶相關(guān),30例(3%)為其他原因,如與骨性結(jié)構(gòu)相關(guān),表現(xiàn)為局部凸顯肺野的骨性結(jié)構(gòu),局限性氣體潴留,胸膜斑塊等,22例(2%)與小樹芽等感染性病灶病灶相關(guān),22例(2%)與增厚的小葉間隔及小葉內(nèi)間隔相關(guān),余12例(1%)無特異性。影像醫(yī)師的假陽性總計為3個結(jié)節(jié),皆與血管結(jié)構(gòu)相關(guān),假陽性率為每例CT 0.015個。
表 1 889枚真結(jié)節(jié)大小及特征的檢出情況Tab 1 Characteristics of 889 true pulmonary nodules
我們的研究結(jié)果顯示AI在我們的數(shù)據(jù)集中實現(xiàn)肺癌的100%檢測,相對于放射科醫(yī)生提高了結(jié)節(jié)檢測的靈敏度。AI的總體假陽性率較高,但在排除5 mm結(jié)節(jié)后,假陽性率降低到可接受的水平。
本研究中,AI及影像醫(yī)師對數(shù)據(jù)集中133個惡性結(jié)節(jié)的靈敏度均為100%,說明AI及醫(yī)師對相對較大的和(或)具有一定惡性可能的結(jié)節(jié)檢出情況理想,體現(xiàn)在二者對于大于10 mm的結(jié)節(jié)及部分實性結(jié)節(jié)均具有很高的檢出率(表1)。對于所有非鈣化結(jié)節(jié)的整體檢出情況,AI的靈敏度較醫(yī)師明顯增高,尤其體現(xiàn)在<5 mm、實性結(jié)節(jié)。影像醫(yī)師在靈敏度方面明顯低于AI,但漏診結(jié)節(jié)大部分為<5 mm的結(jié)節(jié),其原因首先在于閱片時采用僅為水平軸位圖像,小結(jié)節(jié)與血管斷面軸位投影相似,容易漏診,其次可能在于影像醫(yī)師閱片時間有限或注意力無法保持全程集中,滿足于較大病變的檢測,對于小的病變認為臨床意義極小而沒有引起重視或依靠自己的經(jīng)驗進行了排除。AI在結(jié)節(jié)檢測方面確實能夠?qū)τ跋襻t(yī)師提供幫助,但從臨床應用的角度考慮,這類結(jié)節(jié)的臨床意義尚有待商榷,完全按照AI的結(jié)果對此類結(jié)節(jié)進行進一步臨床干預會增加醫(yī)療負擔并占用醫(yī)療資源,因此,對這些結(jié)節(jié)進行進一步分析,從而判斷是否需要臨床處理是醫(yī)生和AI需要進一步面對的問題。
我們的研究發(fā)現(xiàn)AI的總體結(jié)節(jié)檢測假陽性率較高,尤其易誤診于小葉核心結(jié)構(gòu),其它主要誤診原因包括:與氣管相關(guān),包括增厚、擴張的細支氣管,氣管及細支氣管內(nèi)分泌物等;與血管相關(guān),包括增粗、迂曲、交叉的血管、肺門增粗的血管等;正?;虍惓5姆谓Y(jié)構(gòu)如小葉核心結(jié)構(gòu),增厚的小葉間隔及小葉內(nèi)間隔;各時期的感染性病灶如索條、瘢痕、樹芽、片狀實變及磨玻璃密度影;其他原因,如局部凸向肺野的骨性結(jié)構(gòu)、局限性氣體潴留、胸膜斑塊等。造成假陽性的原因可能與AI設定的檢出結(jié)節(jié)大小的閾值極低有關(guān)。在我們?nèi)コ? mm的假陽性結(jié)節(jié)后,假陽性率減少約2/3。本研究中影像醫(yī)師的假陽性率極低,其根本原因在于影像醫(yī)師關(guān)于假陽性結(jié)節(jié)的判斷經(jīng)驗明顯較AI豐富,而現(xiàn)階段AI的重點更集中在陽性結(jié)節(jié)的學習,對于假陽性結(jié)節(jié)的學習尚有欠缺。
圖 1 右肺下葉部分實性結(jié)節(jié),與細支氣管相連,直徑10.7 mm,距胸膜43.3 mm,影像醫(yī)師漏診,AI實現(xiàn)檢測。Fig 1 A part-solid nodule located in right lower lobe, connected to the bronchioles, 10.7 mm in diameter, 43.3 mm far from the pleura,missed by radiologist, but detected by AI.
圖 2 右肺上葉花環(huán)狀小葉核心結(jié)構(gòu),AI假陽性。Fig 2 Centrilobular nodules with a garland shape located in right upper lobe, false positive case by AI.
圖 3 右肺下葉增厚、擴張的細支氣管,AI假陽性。Fig 3 Thickened, dilated bronchioles located in right lower lobe, false positive case by AI.
AI作為當前科學技術(shù)發(fā)展中的一門廣泛應用于醫(yī)學領(lǐng)域的前沿學科,對肺結(jié)節(jié)進行檢測是人工智能醫(yī)療發(fā)展的方向[7,8]。深度學習是通過構(gòu)建深層網(wǎng)絡結(jié)構(gòu)進行多層次特征學習的人工智能方法,對比傳統(tǒng)的計算機輔助檢測系統(tǒng)(computer-aided detection, CAD)系統(tǒng)具有優(yōu)勢。本研究所采用的軟件基于三維卷積神經(jīng)網(wǎng)絡(3D-convolutional neural network, 3D-CNN)利用深度學習進行目標檢測,能夠充分利用肺結(jié)節(jié)的空間三維信息[9]。深度學習模型對肺門區(qū)、胸膜下區(qū)及非實性結(jié)節(jié)的檢出能力明顯提高[10,11],對實性結(jié)節(jié)的敏感度比文獻報道中更高[12,13]。深度學習模型有較快的運算速度,隨著經(jīng)驗的不斷積累、模型的不斷迭代,其診斷敏感度及準確性也會不斷上升,而且假陽性也會得到控制。
本研究的局限性在于數(shù)據(jù)集病例數(shù)選擇標準基于回顧性的病例選取,病例均為醫(yī)師發(fā)現(xiàn)的病例,臨床中漏診的病例無法通過回顧性病例選擇獲得,因此存在一定的選擇性偏倚。
綜上所述,基于深度學習的肺結(jié)節(jié)AI檢測軟件具有比醫(yī)師更高的靈敏度,可作為醫(yī)師的輔助檢測工具進行肺結(jié)節(jié)的篩查,排除<5 mm結(jié)節(jié)會降低AI的假陽性率。