陸琳娟,姚欣
(南京醫(yī)科大學(xué)第一附屬醫(yī)院呼吸與危重癥醫(yī)學(xué)科,南京 210029)
慢性阻塞性肺疾病(chronic obstructive pulmonary disease,COPD)和支氣管哮喘是兩種最常見的慢性炎癥性氣道疾病,肺功能是其診斷和病情評(píng)估的主要工具[1-2],但因病情個(gè)體差異、肺功能檢查禁忌證、儀器和培訓(xùn)未能普及等,仍有眾多COPD及支氣管哮喘患者未能得到早期診斷和準(zhǔn)確的病情評(píng)估。已知COPD和支氣管哮喘的漏診會(huì)導(dǎo)致患者生活質(zhì)量下降、門診就診次數(shù)、住院次數(shù)及長期死亡風(fēng)險(xiǎn)增加,對(duì)其誤診及病情評(píng)估的不準(zhǔn)確則會(huì)導(dǎo)致治療方案不合理、患者病情反復(fù)以及醫(yī)療費(fèi)用增加等[3-5],而上述問題的解決將顯著降低疾病帶來的重大社會(huì)經(jīng)濟(jì)負(fù)擔(dān)。
人工智能(artificial intelligence,AI)是模擬、延伸和擴(kuò)張人類智能的理論、技術(shù)及應(yīng)用的一門科學(xué),其核心是機(jī)器學(xué)習(xí)。AI可以通過計(jì)算機(jī)語言分析大量數(shù)據(jù),建立復(fù)雜、非線性的關(guān)系,彌補(bǔ)傳統(tǒng)分析方法的不足,有助于提高疾病診療的準(zhǔn)確性[6-7]。另外,AI還可以分析以往無法進(jìn)行計(jì)算分析的數(shù)據(jù)類型,如圖像和聽覺數(shù)據(jù),使得對(duì)疾病的診斷和評(píng)估更為全面[6-7]。近年來,已有較多研究將AI應(yīng)用于COPD及支氣管哮喘的診斷和病情評(píng)估?,F(xiàn)就AI在COPD及支氣管哮喘診療中的應(yīng)用進(jìn)行綜述。
AI是計(jì)算機(jī)對(duì)人類智能的模擬。其可以通過計(jì)算機(jī)語言,將數(shù)據(jù)集分為訓(xùn)練集和驗(yàn)證集,在訓(xùn)練集中識(shí)別各數(shù)據(jù)的特點(diǎn)和相關(guān)性,以此構(gòu)建模型得出結(jié)果并輸出,在驗(yàn)證集中加以驗(yàn)證[6-7]。機(jī)器學(xué)習(xí)是AI的核心,主要包括監(jiān)督式機(jī)器學(xué)習(xí)和無監(jiān)督式機(jī)器學(xué)習(xí)[7]。在監(jiān)督式機(jī)器學(xué)習(xí)中,模型輸出的結(jié)果是被規(guī)定的,計(jì)算機(jī)通過算法尋找與結(jié)果相關(guān)的預(yù)測因子,構(gòu)建函數(shù)模型。監(jiān)督式機(jī)器學(xué)習(xí)主要用于診斷和預(yù)測模型的構(gòu)建[7]。如根據(jù)胸部X線片的特征來診斷肺結(jié)節(jié)的良惡性[8]、建立心房顫動(dòng)患者發(fā)生血栓栓塞的預(yù)測模型[9]等。目前,監(jiān)督式機(jī)器學(xué)習(xí)算法主要包括神經(jīng)網(wǎng)絡(luò)模型、支持向量機(jī)、決策樹、隨機(jī)森林和貝葉斯分類器等[10]。每種算法均有其優(yōu)缺點(diǎn),應(yīng)根據(jù)數(shù)據(jù)特征選擇最佳的算法。無監(jiān)督式機(jī)器學(xué)習(xí)不規(guī)定模型輸出結(jié)果,計(jì)算機(jī)通過算法歸類具有相似特點(diǎn)的數(shù)據(jù)[7]。無監(jiān)督式機(jī)器學(xué)習(xí)模型主要用于數(shù)據(jù)探索,如應(yīng)用于識(shí)別心肌病的新表型[11]。其主流算法有層次聚類分析法、K均值聚類等[12]。深度學(xué)習(xí)是機(jī)器學(xué)習(xí)發(fā)展的一個(gè)子集,它使用深度神經(jīng)網(wǎng)絡(luò)模型模擬人腦的操作,建立的模型往往具有多個(gè)參數(shù)和層數(shù),在圖像識(shí)別中具有重大優(yōu)勢[13-14]。如一個(gè)深度神經(jīng)網(wǎng)絡(luò)模型在接受超過37 000次顱內(nèi)出血頭部CT的訓(xùn)練后,對(duì)約9 500例病例進(jìn)行了評(píng)估,使顱內(nèi)出血的診斷時(shí)間縮短96%,準(zhǔn)確度為84%[15]。
相較傳統(tǒng)的統(tǒng)計(jì)學(xué)分析方法,AI的優(yōu)勢體現(xiàn)在:①可以在較短時(shí)間內(nèi)識(shí)別大數(shù)據(jù)樣本;②可以分析傳統(tǒng)方法無法識(shí)別的非線性關(guān)系;③可以識(shí)別圖像數(shù)據(jù)。以上優(yōu)勢使AI在疾病診療評(píng)估方面具有巨大潛力。
2.1AI在COPD診斷中應(yīng)用 調(diào)查數(shù)據(jù)顯示,即使在發(fā)達(dá)國家,仍有部分醫(yī)療單位不具備肺功能檢測儀器,缺乏相關(guān)醫(yī)務(wù)人員的培訓(xùn),這極大限制了COPD的診斷,導(dǎo)致眾多COPD患者的漏診誤診[3-5]。因此,開發(fā)新的診斷COPD的方法顯得尤為重要,而AI在這方面顯示出巨大潛能。有研究者提出了一種AI算法,該算法用1 500例門診就診患者的臨床癥狀及肺功能測試結(jié)果進(jìn)行訓(xùn)練,在前瞻性收集的50例患者的隊(duì)列中進(jìn)行了驗(yàn)證,目的是對(duì)門診首診患者是否患有COPD進(jìn)行判斷。結(jié)果表明,AI軟件在肺功能判讀及COPD診斷中的準(zhǔn)確度達(dá)100%和82%,均高于人工判讀肺功能及診斷COPD的準(zhǔn)確度[16]。
此外,針對(duì)肺功能測試未能完全普及的情況,AI可以根據(jù)患者的臨床癥狀設(shè)計(jì)調(diào)查問卷來建立COPD診斷模型,其診斷COPD的準(zhǔn)確度高達(dá)97.5%[17]。同樣,Lee等[18]基于入選患者的臨床特征、基本信息創(chuàng)建列線圖來預(yù)測第一秒用力呼氣量占用力肺活量比值,最終形成的列線圖診斷COPD的靈敏度和特異度分別為82.3%和68.6%。
AI在圖像識(shí)別上的巨大潛能可用于有肺功能禁忌證COPD患者的診斷。近年兩項(xiàng)研究分別以2 000多次的胸部CT圖像及6 749次的胸部X線片圖像為訓(xùn)練集,利用深度神經(jīng)網(wǎng)絡(luò)模型診斷COPD,得出的曲線下面積分別為0.89[19]和0.837[20]。
以上研究表明,AI利用計(jì)算機(jī)語言綜合患者的癥狀、基本信息、影像學(xué)圖像特征、肺功能測試等診斷COPD,可能較人工診斷更為準(zhǔn)確和客觀。同時(shí)能為無法進(jìn)行肺功能檢測的患者或單位提供診斷工具,減少COPD患者的漏診和誤診。
2.2AI在COPD表型識(shí)別中應(yīng)用 COPD是一種異質(zhì)性疾病,具有不同的表型,對(duì)COPD表型的研究有利于指導(dǎo)精準(zhǔn)治療。AI可以根據(jù)COPD患者的基本信息、臨床癥狀、影像學(xué)特征等進(jìn)行訓(xùn)練,利用聚類分析、深度學(xué)習(xí)等機(jī)器學(xué)習(xí)方法識(shí)別不同的COPD表型,歸納不同表型的臨床特征,指導(dǎo)臨床醫(yī)師對(duì)不同特征COPD患者進(jìn)行個(gè)性化管理和治療。如Yoon等[21]根據(jù)1 195例COPD 患者的基本信息及臨床特征,使用聚類分析的方法確定了4種表型:哮喘-COPD重疊、輕度COPD、中度COPD和重度COPD。其中第1種表型患者具有最高的急性加重風(fēng)險(xiǎn),而第4種表型患者的肺功能最差。Pikoula等[22]基于合并癥和危險(xiǎn)因素,使用聚類分析方法將30 961例COPD患者分為5種表型:焦慮和抑郁、嚴(yán)重的氣流受限和虛弱、合并心血管疾病和糖尿病、肥胖/特應(yīng)性表型及較少有合并癥表型。其中第1種表型患者急性加重率最高,第3種表型患者急性加重時(shí)癥狀最重,第5種表型患者急性加重率最低。此外,Sandeep等[23]基于受試者的呼氣-容量曲線,使用深度神經(jīng)網(wǎng)絡(luò)模型識(shí)別了COPD 4種胸部CT的表型(正常型、小氣道炎癥型、肺氣腫型和混合型)。結(jié)果顯示,深度神經(jīng)網(wǎng)絡(luò)模型在區(qū)分COPD小氣道炎癥型(曲線下面積為0.77)和肺氣腫型(曲線下面積為0.81)上具有較高的準(zhǔn)確率。
聚類分析和深度神經(jīng)網(wǎng)絡(luò)模型通過識(shí)別COPD患者的臨床特征和影像學(xué)特點(diǎn),探索不同的表型分類以指導(dǎo)個(gè)體化治療和管理。但目前AI在COPD表型識(shí)別中的應(yīng)用仍處于研究階段,需要在不同的大型前瞻性隊(duì)列中進(jìn)行驗(yàn)證,今后應(yīng)重點(diǎn)探究不同表型COPD患者的病理生理特征、臨床特征及對(duì)治療的反應(yīng),以探索出具有臨床指導(dǎo)意義的表型。
2.3AI在COPD預(yù)后評(píng)估中應(yīng)用 COPD患者胸部影像學(xué)特征與疾病嚴(yán)重程度密切相關(guān)。AI可以對(duì)COPD患者的胸部CT圖像進(jìn)行肺葉的分割及肺氣腫的量化,以評(píng)估COPD的病情?,F(xiàn)有研究結(jié)果顯示,不同肺葉的肺氣腫程度與COPD全球倡議規(guī)定的COPD分級(jí)有很強(qiáng)的相關(guān)性,其中左肺上葉肺氣腫程度與疾病嚴(yán)重程度的相關(guān)系數(shù)最大(ρ=0.85,P<0.000 1),左肺下葉(ρ=0.72,P<0.000 1)和右肺中葉的相關(guān)系數(shù)最小(ρ=0.72,P<0.000 1)[24]。另一項(xiàng)研究也顯示,基于AI的肺氣腫量化與肺功能具有良好的相關(guān)性[25]。
以上研究揭示,使用機(jī)器學(xué)習(xí)量化胸部CT的肺氣腫程度在無法或無條件進(jìn)行肺功能測試的COPD患者中替代肺功能對(duì)COPD患者進(jìn)行病情評(píng)估有一定的價(jià)值。然而目前尚無大規(guī)模前瞻性隊(duì)列研究進(jìn)行驗(yàn)證,且未來的研究也應(yīng)將COPD患者圖像識(shí)別的特征與更多的肺功能參數(shù)和臨床特征相聯(lián)系。
識(shí)別高急性加重風(fēng)險(xiǎn)及不良預(yù)后的COPD患者是管理COPD的重要環(huán)節(jié)。很多研究開始根據(jù)COPD患者不同的臨床資料,利用不同的機(jī)器學(xué)習(xí)算法預(yù)測COPD的急性加重及不良預(yù)后,對(duì)臨床醫(yī)師識(shí)別頻繁急性加重的COPD患者進(jìn)行早期干預(yù)具有十分重要的意義。Wang等[26]基于COPD患者的臨床資料比較了5種機(jī)器學(xué)習(xí)算法(隨機(jī)森林、支持向量機(jī)、邏輯回歸、K近鄰和貝葉斯分類器)預(yù)測COPD急性加重的性能。結(jié)果顯示,隨機(jī)森林算法獲得的預(yù)測模型性能最佳(靈敏度為0.80、特異度為0.83、陽性預(yù)測值為0.81、陰性預(yù)測值為0.85)。另有研究利用62例COPD患者的影像學(xué)參數(shù)(氣道容積和氣道阻力)建立機(jī)器學(xué)習(xí)模型,結(jié)果顯示其預(yù)測COPD急性加重的陽性預(yù)測值為0.82[27]。BODE(body mass index,airflow obstruction,dyspnea,and exercise capacity index)包括體質(zhì)比大小、氣流受限嚴(yán)重程度、呼吸困難程度和運(yùn)動(dòng)能力強(qiáng)弱4個(gè)方面,是廣泛使用的預(yù)測COPD病死率的評(píng)分系統(tǒng)。有研究對(duì)COPDGene(The Genetic Epidemiology of Chronic Obstructive Lung Disease)隊(duì)列2 632例和ECLIPSE(The Evaluation of COPD Longitudinally to Identify Predictive Surrogate End-points)隊(duì)列1 268例COPD患者的臨床特征及影像學(xué)特征進(jìn)行機(jī)器學(xué)習(xí),建立LMP-COPD模型預(yù)測COPD的患者病死率,結(jié)果發(fā)現(xiàn)其預(yù)測COPD患者病死率的準(zhǔn)確率高于BODE[28]。
可見,AI識(shí)別COPD患者不同的特征建立COPD急性加重預(yù)后模型準(zhǔn)確率高,對(duì)臨床具有重要指導(dǎo)意義。但不同的機(jī)器學(xué)習(xí)算法建立的模型預(yù)測性能不一。未來應(yīng)進(jìn)一步探索如何根據(jù)患者不同的特征,選擇最為合適的機(jī)器學(xué)習(xí)模型。
3.1AI在支氣管哮喘診斷中應(yīng)用 與COPD類似,AI可以結(jié)合患者的癥狀、血液學(xué)特征及遺傳學(xué)特征等進(jìn)行支氣管哮喘的診斷,對(duì)于存在診斷困難的支氣管哮喘患者具有重要意義。然而,不同機(jī)器學(xué)習(xí)算法所獲得的模型診斷支氣管哮喘的性能并不相同。如Tomita等[29]利用566例門診就診患者的癥狀-體征和客觀測試(如肺功能測試和支氣管激發(fā)試驗(yàn))結(jié)果開發(fā)了支氣管哮喘診斷的支持向量機(jī)模型和深度神經(jīng)網(wǎng)絡(luò)模型,結(jié)果顯示其準(zhǔn)確度分別為0.82 和0.98。說明與經(jīng)典的支持向量機(jī)模型相比,深度神經(jīng)網(wǎng)絡(luò)模型診斷支氣管哮喘的性能更高。另一項(xiàng)研究利用就診患者的病例資料建立機(jī)器學(xué)習(xí)模型,比較了CatBoost、邏輯回歸、貝葉斯分類器和支持向量機(jī)這4種機(jī)器學(xué)習(xí)模型識(shí)別兒童支氣管哮喘的性能。結(jié)果表明,CatBoost模型的性能最佳[30]。
此外,利用MTS(Mahalanobis-Taguchi system)識(shí)別常規(guī)血液學(xué)標(biāo)志物,建立機(jī)器學(xué)習(xí)模型來識(shí)別支氣管哮喘患者同樣具有良好的診斷性能。其中,血小板分布寬度、平均血小板體積、白細(xì)胞計(jì)數(shù)、嗜酸粒細(xì)胞計(jì)數(shù)和淋巴細(xì)胞比值在支氣管哮喘診斷中表現(xiàn)良好[31]。
另有研究整合了機(jī)器學(xué)習(xí)的特征選擇和分類模型兩種方法,使用單核苷酸多態(tài)性量化個(gè)體中支氣管哮喘的易感性[32],該模型診斷支氣管哮喘的準(zhǔn)確率和敏感性較高。由此可見,各種機(jī)器學(xué)習(xí)方法的整合非常適合研究高維單核苷酸多態(tài)性數(shù)據(jù)以進(jìn)行支氣管哮喘患者基因型-表型關(guān)聯(lián)和表型預(yù)測。
以上研究表明,AI通過癥狀-體征、客觀測試結(jié)果建立機(jī)器學(xué)習(xí)模型有助于對(duì)診斷困難的支氣管哮喘患者進(jìn)行識(shí)別。與COPD不同,AI診斷支氣管哮喘的現(xiàn)有研究更側(cè)重于不同診斷模型性能的比較及不同機(jī)器學(xué)習(xí)方法的結(jié)合。
3.2AI在支氣管哮喘表型識(shí)別中應(yīng)用 支氣管哮喘的表型識(shí)別對(duì)哮喘的管理和個(gè)體化治療十分重要。目前應(yīng)用于支氣管哮喘表型識(shí)別的AI算法主要有潛在類別分析和K均值聚類兩種。有研究使用潛在類別分析方法成功識(shí)別了150例支氣管哮喘運(yùn)動(dòng)員的兩種支氣管哮喘表型:特應(yīng)性支氣管哮喘表型和運(yùn)動(dòng)性支氣管哮喘表型,并發(fā)現(xiàn)以上兩種表型患者具有不同的臨床特征和發(fā)病特點(diǎn)[33]。另有研究利用潛在類別分析結(jié)合基因組學(xué)信息和臨床信息,識(shí)別了3 001例支氣管哮喘患者的4種表型:非活動(dòng)性/輕度非變應(yīng)性哮喘(18%)、非活動(dòng)性/輕度變應(yīng)性哮喘 (37%)、活動(dòng)性變應(yīng)性哮喘(27%)和活動(dòng)性成人非變應(yīng)性哮喘(18%)[34]。該研究同時(shí)鑒定了15個(gè)與支氣管哮喘表型相關(guān)的單核苷酸多態(tài)性,其中大部分與活動(dòng)性變應(yīng)性哮喘表型相關(guān)[34]。
另外,Wu等[35]使用K均值聚類方法分類支氣管哮喘,識(shí)別不同哮喘患者對(duì)皮質(zhì)類固醇的反應(yīng)性。結(jié)果顯示,在晚發(fā)型、肺功能差以及基線嗜酸粒細(xì)胞增多的支氣管哮喘患者中觀察到的皮質(zhì)類固醇反應(yīng)最大,而在具有嚴(yán)重氣流受限和輕度嗜酸粒細(xì)胞炎癥的年輕、肥胖女性患者中觀察到的皮質(zhì)類固醇反應(yīng)最小。
可見,將不同的AI方法應(yīng)用于支氣管哮喘表型分類,可為哮喘患者的管理和個(gè)體化治療提供重要參考價(jià)值,尤其是對(duì)于難治性支氣管哮喘,同時(shí)減少不必要的皮質(zhì)類固醇使用及相關(guān)并發(fā)癥。但基于不同的臨床特征及不同機(jī)器學(xué)習(xí)算法所得的支氣管表型多樣,如何選擇合適的臨床特征及最優(yōu)的機(jī)器學(xué)習(xí)算法進(jìn)行支氣管哮喘表型識(shí)別,指導(dǎo)支氣管哮喘患者個(gè)體化治療需進(jìn)一步探索。
3.3AI在支氣管哮喘評(píng)估中應(yīng)用 支氣管哮喘急性發(fā)作對(duì)患者的生活質(zhì)量有顯著影響,對(duì)支氣管哮喘患者急性發(fā)作的準(zhǔn)確預(yù)測能為臨床醫(yī)師提供早期干預(yù)的空間,然而目前尚缺乏有效指標(biāo)能準(zhǔn)確識(shí)別支氣管哮喘患者的急性發(fā)作風(fēng)險(xiǎn)?;谂R床數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)模型在評(píng)估支氣管哮喘急性發(fā)作方面顯示出巨大的性能[36-37]。此外,改進(jìn)的人工神經(jīng)網(wǎng)絡(luò)整合了包括氣象和環(huán)境污染數(shù)據(jù)等變量,其預(yù)測支氣管哮喘患者急性發(fā)作風(fēng)險(xiǎn)的總體準(zhǔn)確度達(dá)81%[38]。
Fitzpatrick等[39]使用潛在類別分析預(yù)測學(xué)齡兒童的支氣管哮喘惡化風(fēng)險(xiǎn),該研究使用了來自2 593例輕度至中度支氣管哮喘兒童的19個(gè)人口統(tǒng)計(jì)學(xué)、臨床和實(shí)驗(yàn)室變量組成的數(shù)據(jù)集,分析確定過敏和肺功能是兒童支氣管哮喘急性發(fā)作的主要預(yù)測因素。然而,該研究中的所有數(shù)據(jù)均來自單一醫(yī)療中心,缺乏多中心數(shù)據(jù)集的驗(yàn)證。
AI為診斷和評(píng)估COPD及支氣管哮喘提供了一種新的技術(shù)方法,其優(yōu)勢在于能分析大量數(shù)據(jù)間復(fù)雜的非線性關(guān)系,識(shí)別圖像數(shù)據(jù)類型,整合基因組學(xué)數(shù)據(jù),提高疾病診斷和評(píng)估的準(zhǔn)確性;另外,AI軟件每次被調(diào)用時(shí)均以相同的方式工作,且不會(huì)受到經(jīng)常強(qiáng)加給醫(yī)師的臨床環(huán)境和緊迫壓力的影響。但AI技術(shù)應(yīng)用于COPD及支氣管哮喘仍處于研究階段,尚存在很多問題:①機(jī)器學(xué)習(xí)算法多樣,同一個(gè)數(shù)據(jù)集使用不同算法所得各個(gè)模型的性能并不相同。同樣,不同數(shù)據(jù)集下同一種模型的性能也不相同。因此,為了得到性能最佳的模型,往往需調(diào)用多種不同算法進(jìn)行比較,過程較為煩瑣。②AI成功應(yīng)用于COPD及支氣管哮喘診療的關(guān)鍵是大樣本數(shù)據(jù)庫的建立,而目前研究多集中于單中心或小樣本研究。③臨床工作者對(duì)AI相關(guān)理論技術(shù)的缺乏大大限制了AI的實(shí)際應(yīng)用。④目前有關(guān)AI在COPD及支氣管哮喘中的研究多側(cè)重于如何應(yīng)用AI技術(shù)早期診斷疾病及準(zhǔn)確預(yù)測病情發(fā)展,而關(guān)于其應(yīng)用于COPD及支氣管哮喘患者治療藥物選擇及治療效果評(píng)估的研究較少。因此,未來應(yīng)建立COPD及支氣管哮喘患者大樣本數(shù)據(jù)庫,開展醫(yī)務(wù)人員對(duì)AI理論技術(shù)的學(xué)習(xí),探索AI在COPD及支氣管哮喘中更多的價(jià)值,以推動(dòng)AI在慢性炎癥性氣道疾病診療相關(guān)臨床決策中的輔助作用。