周 攀,何 苗,王丹楓,邱 蕾,雷振華,馬瑛龍
耐藥性結核是一種比較嚴重的結核病,一般治療周期需要9個月到2年[1]。中國有7.3萬名耐藥結核病患者,約占全球總數(shù)的13.1%[2]。結核病又與城鄉(xiāng)差別、東西部差別有密切關系。農(nóng)村人口肺結核的患病率大約是城市的1倍[3]。人工智能(AI)具有較為強大的識別能力和數(shù)據(jù)分析的能力,在多種肺部疾病如肺癌的診斷、肺結節(jié)的診斷及胸片質量的控制等方面逐漸應用于臨床,但必須以海量臨床影像數(shù)據(jù)為基礎[4]。本研究旨在建立可用于醫(yī)學影像AI產(chǎn)品訓練或檢測的標準化數(shù)據(jù)庫,該數(shù)據(jù)庫將有助于研發(fā)基于大數(shù)據(jù)技術的耐藥性肺結核輔助診斷模型和臨床輔助診斷決策,AI 輔助診斷系統(tǒng)的研發(fā),將會提高篩檢速度、診斷精度,減輕影像工作者工作負擔,對結核病防治工作具有重要的意義。同時,該項目目標是形成醫(yī)學影像AI模型性能評價體系,促進AI產(chǎn)品的臨床應用。
1.1 構建耐藥性肺結核病多模態(tài)影像數(shù)據(jù)庫 收集750例耐藥性肺結核患者資料,本項目耐藥性肺結核多模態(tài)影像數(shù)據(jù)庫的數(shù)據(jù)來源將包含兩部分,一部分來源于臨床數(shù)據(jù)和樣本資源庫,另一部分來自結核病聯(lián)盟醫(yī)院的多中心多模態(tài)影像數(shù)據(jù)。本研究已獲得寧夏回族自治區(qū)第四人民醫(yī)院倫理委員會批準(2022N0212)。根據(jù)行業(yè)規(guī)范及制定的影像數(shù)據(jù)采集標準、納入標準選擇入庫數(shù)據(jù),然后組建影像醫(yī)生專家共同制定肺結核影像數(shù)據(jù)標注標準,構建肺結核病灶區(qū)標準標注數(shù)據(jù)集,滿足肺結核AI計算中對數(shù)據(jù)基礎的需求。根據(jù)標注標準,利用專用標注軟件對原始CT影像進行三維標注。由2名胸部影像診斷資歷5年以上的診斷醫(yī)師進行雙盲標注,然后由1名胸部影像診斷資歷8年以上的高級診斷醫(yī)師進行審核,有爭議的病例由3名以上高級診斷醫(yī)師根據(jù)標注指南討論確定。
1.2 建立基于CT影像大數(shù)據(jù)的AI輔助診斷模型
1.2.1 耐藥性肺結核病灶自動分割模型 本研究擬采用基于CT影像的卷積神經(jīng)網(wǎng)絡U-Net為基礎,對肺結核區(qū)域進行檢測。網(wǎng)絡結構包含多個編碼器、多個解碼器和一個輸出卷積器。每個編碼器的作用是實現(xiàn)下采樣。每次下采樣后,編碼器輸出的特征圖尺寸會下降,通道數(shù)會增加。每個解碼器的作用是實現(xiàn)上采樣。每次上采樣后,解碼器輸出的特征圖尺寸會增加、通道數(shù)減少。輸出卷積器包含兩個卷積層、一個隨機失活層及激活函數(shù)(Sigmoid)。此外,各個卷積層和反卷積層都含有激活函數(shù)(ReLU)來實現(xiàn)非線性運算。輸出卷積器將之前的特征圖轉化為肺結核病灶區(qū)域的概率圖。分割模型輸出的肺結核病灶區(qū)域概率圖和人工標注的肺結核病灶區(qū)域分布圖之間的誤差通過戴斯相似性系數(shù)進行量化評估。①卷積層是通過若干個卷積核進行卷積運算后輸出圖像的特征圖,卷積核包括偏置項b和權重矩陣W,均是卷積層要學習的內(nèi)容。②下采樣層是一種非線性的下采樣方法,將卷積層輸出的特征圖的尺度縮小,以減少計算量。③經(jīng)過卷積等下采樣層以后,圖像的分辨率依次縮小了 2、4、8、16、32 倍。對于最后一層的輸出圖像,需要進行 32 倍的上采樣,以得到和原圖一樣的大小。這個上采樣通常通過反卷積實現(xiàn)。通過最后一層反卷積得到原圖大小,得到的結果還是不夠精確,一些細節(jié)無法恢復。于是網(wǎng)絡中將第 4 層的輸出和第 3層的輸出也依次反卷積,分別需要 16 倍和 8 倍上采樣,這樣得到的輸出結果就更加精細。④全連接層處于網(wǎng)絡輸出層之前,存在多個連續(xù)的全連接層,其構成了一個多層感知機,起到分類器的作用。通常通過前向傳播進行特征的學習并獲得輸出,通過反向傳播算法優(yōu)化并調整網(wǎng)絡參數(shù)。
1.2.2 耐藥性肺結核鑒別診斷模型 肺結核種類鑒別網(wǎng)絡以密集連接的卷積網(wǎng)絡為基礎,包含5個密集卷積器和兩個全連接層。密集卷積器包含一個批量正則層、多個卷積層和一個最大池化層。最后一個密集卷積器輸出的特征圖被扁平化為一維,然后輸入到之后的全連接層。最后一個全連接層通過歸一化指數(shù)函數(shù)給出肺結核分類的概率分布,概率最高的為算法的第一預測。分類網(wǎng)絡輸出的患者肺結核診斷,與實驗室檢驗的結果進行對比,以準確度、特異度等指標進行量化評估。
1.2.3 激活函數(shù)設計 分割網(wǎng)絡中各個卷積層和反卷積層都含有激活函數(shù)(ReLU)用其來實現(xiàn)非線性運算,同時輸出卷積器采用激活函數(shù)(Sigmoid)輸出分割特征圖。分類網(wǎng)絡中采用 Softmax輸出肺結核分類的概率分布。
Sigmoid是常用的非線性的激活函數(shù),公式如下:
f(z)=1/(1+e-z)
Relu函數(shù)的解析式如下:
Relu=max(0,x)
Softmax用于多分類過程,它將多個神經(jīng)元的輸出映射到(0,1)區(qū)間內(nèi),即為輸出概率大小,其公式如下:
1.3 研發(fā)肺結核AI臨床輔助診斷決策系統(tǒng) 收集多中心結核病確診病例的臨床資料,主要包括臨床病歷、治療前后肺部CT影像及報告、化驗指標、其他生物樣本檢測結果、藥物和醫(yī)療器械使用情況,以及院內(nèi)結局,初步研發(fā)臨床輔助決策支持系統(tǒng),結合肺結核CT影像數(shù)據(jù)庫,集成肺結核AI輔助診斷模型,實現(xiàn)結核病的病人列表查看、臨床信息查看及評估、影像信息查看及分析、治療決策等功能。該系統(tǒng)包含客戶端和服務器端兩部分,基于自然語言處理、OCR技術,結合信息安全和生物信息學技術,在規(guī)范化數(shù)據(jù)庫建設之上,做可視化描述性分析、隊列分析以及高級分析,并通過可視化的分析結果展示,查看研究分析的結果。在技術實現(xiàn)上,將展示與分析邏輯相互分離,從而在代碼層次實現(xiàn)系統(tǒng)安全。
1.4 統(tǒng)計學方法 采用受試者工作曲線(ROC)評價AI 效能。
2.1 AI產(chǎn)品評價體系對耐藥性肺結核病灶分割結果實例 AI產(chǎn)品評價體系對耐藥性肺結核病灶分割結果實例見圖1,AI 算法模型分割結果與金標準相近,具有較高的病灶分割準確度。
最左列為原始圖像,中間列為 AI 算法模型分割結果,右側列為金標準
2.2 AI產(chǎn)品評價體系診斷肺結核的情況 本研究納入的750例患者中,AI產(chǎn)品評價體系診斷出肺結核的例數(shù)為726例,診斷準確率為96.80%;病灶的檢出率為99.33%,誤判率為0.60%,病灶漏檢率為0.07%。
2.3 AI產(chǎn)品評價體系對抗藥性肺結核的診斷價值 ROC曲線分析顯示,AI產(chǎn)品評價體系對抗藥性肺結核的診斷的敏感度為96.80%(726/750),特異度為85.73%(643/750),準確度為96.80%(726/750),曲線下面積(AUC)為0.912 (95%CI為0.865~0.956)。
肺結核是全球第九大致死疾病之一,嚴重危害人類健康,耐藥性結核是一種比較嚴重的結核病。隨著人口數(shù)量及其流動性的增加,耐藥性肺結核病例呈上升態(tài)勢,每年約增加30萬個新病例。WHO曾指出,如果不能及時控制疾病發(fā)展,將會增加今后防控的難度,甚至會發(fā)展成不治之癥[1]。
目前我國診斷肺結核的常用技術有以下幾種:血清學診斷、細菌學診斷(痰培養(yǎng)和痰涂片)、影像學診斷、分子生物學診斷、病理學診斷。我國主要通過痰涂片診斷的方式發(fā)現(xiàn)結核病患者,但痰涂片陽性率不高。WHO關于肺結核診斷的“金標準”是痰培養(yǎng)技術,雖然陽性率與痰涂片相比略高,但仍然存在陽性率太低的問題,而且培養(yǎng)時間太長影響診斷效率[5]。病理學診斷主要是對局部穿刺標本或手術標本進行病理學檢查,起到輔助診斷的作用[6],因而在臨床上的應用范圍受到一定限制。因此,目前結核病診斷的主要手段仍然是影像學診斷,大約60%~70%的活動性肺結核主要依據(jù)胸部影像診斷[7],特別是胸部CT的診斷。胸部CT可以發(fā)現(xiàn)微小病灶,且可以對病灶進行三維重建,在肺結核病診斷中的應用逐漸廣泛。肺結核的 CT 表現(xiàn)復雜,征象多而特異性差,而且隨著疾病的發(fā)展或轉歸,影像學征象不斷變化,同時肺結核與多種胸部疾病具有相似的體征和影像學表現(xiàn),因此,結核病影像學診斷需要影像科醫(yī)師具備較強的診斷和鑒別診斷能力。
隨著計算機軟件及硬件的技術提升,影像學診斷技術特別是影像組學的發(fā)展,數(shù)字圖像處理技術日趨成熟,AI特征識別能力及數(shù)據(jù)分析能力比較強大,在多種肺部疾病的診斷中的應用逐漸受到關注,而構建多源、大樣本的高分辨率 CT 標注數(shù)據(jù)集是獲得高效、精準疾病 AI 診斷模型的重要基石[8-10]。因此,通過建立結核病影像數(shù)據(jù)標注標準,構建結核病影像全量數(shù)據(jù)庫存儲平臺,發(fā)展一種基于大數(shù)據(jù)技術的輔助 CT 影像的診療系統(tǒng),用于實現(xiàn)肺結核疾病的診斷、肺結核的亞型分型以及臨床輔助診斷,是非常必要的。本研究以肺結核影像數(shù)據(jù)為核心,組織專家建立肺結核影像數(shù)據(jù)采集,規(guī)范、確定數(shù)據(jù)標注標準,建立了耐藥性肺結核多模態(tài)影像數(shù)據(jù)庫。
隨著AI算法的進步,其在肺結核的診斷鑒別方面展現(xiàn)了巨大的希望。制定使用AI和機器學習方法來提高結核病診斷分類準確性的策略方面的研究較多[11-13]。本研究中,以建立的抗藥性肺結核多模態(tài)影像數(shù)據(jù)庫作為高質量的人工標注數(shù)據(jù),評價AI產(chǎn)品對耐藥性肺結核的診斷價值,結果顯示,本研究納入的750例患者中,AI產(chǎn)品評價體系診斷出肺結核的例數(shù)為726例,診斷準確率為96.80%,病灶的檢出率為99.33%,誤判率為0.60%,病灶漏檢率為0.07%,ROC曲線分析顯示,AI產(chǎn)品評價體系對抗藥性肺結核的診斷的敏感度為96.80%(726/750),特異度為85.73%(643/750),準確度為96.80%(726/750),AUC為0.912 (95%CI為0.865~0.956)。提示該AI產(chǎn)品對耐藥性肺結核具有較高的診斷率。影像醫(yī)師通常是通過視覺對醫(yī)學圖像進行評估以確定疾病,存在主觀性,而AI的優(yōu)勢為可識別大量成像數(shù)據(jù)中的復雜模式,并可自動進行定量評估,診斷結果比較客觀,因此準確度更高。此外,由于AI擅長大數(shù)據(jù)分析,因此還具有快速高效的特點,該AI產(chǎn)品輔助診斷系統(tǒng)僅需2 s即可自動出具輔助診斷影響報告,而醫(yī)生需要2~3 min方可獨立完成報告,因此在AI產(chǎn)品的輔助診斷下可以顯著縮短出具影像報告的時間,明顯提高門診的診斷效率。該肺結核 AI 輔助診斷模型可以實現(xiàn)結核病患者列表查看、臨床信息查看及評估、影像信息查看及分析、治療決策等功能。
Rusdah等[14]專門討論了用于結核病診斷的不同數(shù)據(jù)挖掘方法,診斷前的原始數(shù)據(jù)必須經(jīng)過數(shù)據(jù)清理、數(shù)據(jù)轉換等數(shù)據(jù)預處理過程。有研究[15]利用人工神經(jīng)網(wǎng)絡建立并評價了一種預測模型用于診斷涂陰肺結核,該研究只考慮了以癥狀和物理信號來設計神經(jīng)網(wǎng)絡,該神經(jīng)網(wǎng)絡采用多層前饋方法,采用BP算法和單隱層算法實現(xiàn),其準確率為 77%。有研究[16]采用具有兩個隱層的多層神經(jīng)網(wǎng)絡和遺傳算法對算法進行訓練,建立了含有150例患者樣本的2類數(shù)據(jù)集,一類為50例結核病患者,另一類為 100例非結核病患者,該方法的分類精度達到 94.88%?;谏疃葘W習的卷積神經(jīng)網(wǎng)絡也越來越多地應用于肺結核的診斷中[17-18]。KHAN等人[19]利用 CNN 的異常檢測CXRs,在該研究中,他們分別實現(xiàn)AlexNet、VGG-16、VGG-19、ResNet-50、ResNet-101、ResNet-152等網(wǎng)絡模型,獲得肺結核檢查結果具有一定的準確性。
本研究首次構建了國內(nèi)耐藥性肺結核多模態(tài)影像數(shù)據(jù)庫,且開發(fā)的AI輔助診斷系統(tǒng)具有較高的肺結核精準診斷及鑒別的價值。