黃文君 葛艷明,2 董鵬,2 范麗
慢性阻塞性肺疾?。╟hronic obstructive pulmonary disease,COPD)是一種以不完全可逆的氣流受限和反復(fù)的呼吸道癥狀為特征的常見慢性病,包括慢性支氣管炎和/或肺氣腫,常見臨床癥狀包括慢性咳嗽、咳痰、氣促、胸悶和呼吸困難等。肺功能檢查(pulmonary function test,PFT)是COPD臨床診斷的金標(biāo)準(zhǔn),當(dāng)吸入支氣管擴(kuò)張劑后,第1 s用力呼氣量(forced expiratory volume in 1 second,FEV1)和用力肺活量(forced vital capacity,FVC)之比(FEV1/FVC)<0.70說明存在持續(xù)的氣流受限,即可確診。影像學(xué)檢查,尤其是胸部CT,在COPD的診斷、鑒別、嚴(yán)重程度評(píng)估、監(jiān)測(cè)療效和預(yù)后評(píng)估等方面具有難以取代的作用。相比于PFT,影像學(xué)檢查可以更早期、敏感地評(píng)估COPD。人工智能(artificial intelligence,AI)是指通過計(jì)算機(jī)系統(tǒng)對(duì)人類智能的模擬,如推理、學(xué)習(xí)和感知等。機(jī)器學(xué)習(xí)(machine learning,ML)是AI的一個(gè)分支,包含監(jiān)督學(xué)習(xí)和非監(jiān)督學(xué)習(xí)。傳統(tǒng)的ML算法包括隨機(jī)森林、決策樹、貝葉斯學(xué)習(xí)、人工神經(jīng)網(wǎng)絡(luò)(artificial neural network,ANN)等,而深度學(xué)習(xí)(deep learning,DL)則是ML的一個(gè)新分支,其對(duì)于提高圖像及語音識(shí)別、視覺對(duì)象認(rèn)知和自然語言處理等有極大的幫助[1]。近年來熱點(diǎn)研究的卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)就是DL的代表性算法之一。AI在COPD的早期篩查及診斷、臨床分級(jí)及風(fēng)險(xiǎn)評(píng)估、影像學(xué)研究及遠(yuǎn)程監(jiān)護(hù)等多方面進(jìn)行了多模態(tài)、多尺度、全方位的探索。
COPD的早篩、早診對(duì)控制疾病的進(jìn)展有重要意義。Chen等[2]開發(fā)了一種在普通人群中預(yù)測(cè)遠(yuǎn)期肺功能和氣流受限的個(gè)體化ML模型,該模型可以篩選出未來可能患COPD的高風(fēng)險(xiǎn)個(gè)體,使得早期干預(yù)這些潛在高風(fēng)險(xiǎn)個(gè)體成為可能。對(duì)于高風(fēng)險(xiǎn)人群,Young等[3]采用ML對(duì)肺活量正常的吸煙者進(jìn)行評(píng)估,構(gòu)建了篩查早期COPD病人的模型,并提出了2種COPD亞型,一種是最多見的“組織-氣道”亞型(70%),即肺氣腫和外周氣道病變?cè)缬谥醒霘獾腊l(fā)生異常;另一種則是與之相反的“氣道-組織”亞型,這2種亞型的提出或許可以揭示COPD發(fā)生發(fā)展過程中存在的不同早期機(jī)制。
在診斷方面,Xu等[4]通過一種CNN轉(zhuǎn)移多實(shí)例學(xué)習(xí)模型對(duì)CT影像進(jìn)行識(shí)別以判斷有無COPD,并且在描述病理變化和空間異質(zhì)性方面有其獨(dú)特優(yōu)勢(shì)。Schroeder等[5]還利用胸部正、側(cè)位X線片影像和與其同期(180 d內(nèi))的PFT結(jié)果訓(xùn)練CNN模型,預(yù)測(cè)COPD的效能[受試者操作特征曲線下面積(AUC)=0.814]高于以放射科報(bào)告文本為訓(xùn)練內(nèi)容的自然語言處理模型(AUC=0.704),提高了胸片診斷COPD的效能。然而,盡管PFT是診斷COPD的金標(biāo)準(zhǔn),但因測(cè)試標(biāo)準(zhǔn)較嚴(yán)格,故部分身體欠佳的受試者可能無法完成測(cè)試。針對(duì)這一問題,Wang等[6]通過支持向量機(jī)開發(fā)了預(yù)測(cè)病人FVC值的ML模型,其準(zhǔn)確度高達(dá)95%。此外,一項(xiàng)關(guān)于AI與肺科醫(yī)生對(duì)肺功能結(jié)果判讀的比較研究[7]顯示,呼吸科醫(yī)生和AI的診斷準(zhǔn)確度分別為44.6%和82%,也表明AI診斷具有良好的效能。
對(duì)于已確診COPD的病人,預(yù)測(cè)其臨床預(yù)后非常關(guān)鍵。Zhang等[8]開發(fā)的特征加權(quán)生存學(xué)習(xí)機(jī)在預(yù)測(cè)COPD病人生存時(shí)間、高低危病人分類方面性能優(yōu)異。Wang等[9]利用無監(jiān)督的ML方法通過電子健康記錄對(duì)病人進(jìn)行分層,將相似特征和風(fēng)險(xiǎn)的病人歸為一類,在COPD病人隊(duì)列中該方法也得到了有效驗(yàn)證。
急性加重的COPD(acute exacerbation of chronic obstructive pulmonary disease,AECOPD)病人生活質(zhì)量會(huì)顯著下降并加速疾病的進(jìn)展。Wang等[10]研究的支持向量機(jī)模型是識(shí)別AECOPD病人的有力工具,該模型的敏感度和特異度分別為80%和83%,AUC值則達(dá)到了0.90。Goto等[11]采用幾種ML算法比較了急診科就診的AECOPD病人2種臨床結(jié)局(危重護(hù)理和普通住院)的預(yù)測(cè)效能,結(jié)果發(fā)現(xiàn)在預(yù)測(cè)危重護(hù)理時(shí)boosting模型效能最好,而在預(yù)測(cè)普通住院時(shí)隨機(jī)森林模型的效能最佳??梢?,AI將來有助于急診科醫(yī)生更合理地處理COPD病人。值得注意的是,Khatri等[12]開發(fā)了一種預(yù)測(cè)呼吸系統(tǒng)疾病病人急診科就診高峰日的ANN分類器,該預(yù)測(cè)系統(tǒng)為急診科醫(yī)生更合理地配置醫(yī)療服務(wù)提供了可能;Wu等[13]基于DL和ML也開發(fā)了一種AECOPD預(yù)測(cè)模型,在判斷病人1周內(nèi)是否會(huì)發(fā)生AECOPD的準(zhǔn)確度(92.1%)極高,為病人的急診科就診提供了充足的預(yù)警時(shí)間。COPD病人再入院十分普遍且住院費(fèi)用昂貴,預(yù)測(cè)病人再入院有助于醫(yī)生盡早干預(yù)病人,避免他們短期內(nèi)再入院?;诖四康?,Min等[14]在醫(yī)療索賠記錄中使用ML成功預(yù)測(cè)了病人30 d內(nèi)的再入院。Agarwal等[15]也提出了一種自然語言處理模型以預(yù)測(cè)病人的再入院,優(yōu)點(diǎn)是僅需要對(duì)病人的臨床記錄進(jìn)行分析,并且此模型還很容易嵌入到現(xiàn)有的電子病歷系統(tǒng)中使用。
除了PFT,臨床上通常還使用定量CT(quantitative CT,QCT)對(duì)COPD進(jìn)行評(píng)估,其對(duì)肺氣腫存在和嚴(yán)重度的評(píng)估已得到充分驗(yàn)證,并通常使用密度測(cè)定法量化肺氣腫[16]。AI用于肺氣腫的快速量化、嚴(yán)重程度分級(jí)和識(shí)別通氣異質(zhì)性等方面的性能得到了提升。Fischer等[17]應(yīng)用基于CNN的DL算法可以快速量化CT影像上的肺氣腫,且量化結(jié)果與PFT參數(shù)高度相關(guān),明顯縮短了量化時(shí)間[18]。Jin等[19]研發(fā)的DL模型不僅提高了肺氣腫量化的準(zhǔn)確性,還減少了肺密度測(cè)定中由于不同CT重建核影響所造成的差異。
低劑量CT常用于肺癌篩查,在進(jìn)行肺癌篩查的同時(shí)對(duì)COPD進(jìn)行篩查或許是一種兼具經(jīng)濟(jì)和效率的方法。有研究者[20]在肺癌早期篩查的低劑量CT數(shù)據(jù)集上驗(yàn)證了一種檢測(cè)COPD的DL算法,該算法利用殘差網(wǎng)絡(luò)得到的診斷準(zhǔn)確度達(dá)到88.9%。Bak等[21]應(yīng)用低劑量CT研究了劑量減少和不同重建核對(duì)肺氣腫定量的影響,還評(píng)估了在肺氣腫量化中基于DL的重建核轉(zhuǎn)換技術(shù)歸一化重建函數(shù)的效率,結(jié)果顯示,在低劑量CT中,對(duì)“硬重建核”進(jìn)行基于DL的重建核轉(zhuǎn)換能明顯減少肺氣腫量化中產(chǎn)生的差異。Wisselink等[22]在超低劑量CT上量化COPD病人的肺氣腫,應(yīng)用基于DL的降噪技術(shù),結(jié)果顯示,與標(biāo)準(zhǔn)劑量CT相比,超低劑量CT不僅減少了84%的輻射劑量,還降低了27%的量化差異,表明低劑量CT評(píng)估COPD具有可行性。
AI也能夠評(píng)估肺氣腫的嚴(yán)重程度。Peng等[23]利用DL中的多尺度殘差網(wǎng)絡(luò)對(duì)CT影像中的肺氣腫進(jìn)行分級(jí)量化,其量化結(jié)果與多種PFT參數(shù)的相關(guān)系數(shù)絕對(duì)值最高可達(dá)0.922。Humphries等[24]不僅通過DL在CT影像上對(duì)肺氣腫的嚴(yán)重程度進(jìn)行分類,而且與無肺氣腫的病人相比,DL算法分類出的各期肺氣腫病人的死亡率均更高。Hasenstab等[25]則能通過CNN對(duì)CT影像中肺氣腫及空氣潴留的狀況進(jìn)行定量分析,并對(duì)COPD嚴(yán)重程度進(jìn)行分期,該分期均能合理預(yù)測(cè)病人未來5年內(nèi)的疾病進(jìn)展及死亡的可能性,且與慢性阻塞性肺疾病全球倡議中的分期性能相當(dāng)。
紋理分析也是一種有效評(píng)估肺氣腫的方法。Ginsburg等[26]使用這種方法對(duì)不吸煙者、非肺氣腫吸煙者和肺氣腫吸煙者進(jìn)行了有效分類,表明利用該技術(shù)評(píng)估肺氣腫是可行的。近年一些研究表明紋理分析是一種較密度測(cè)定更好的評(píng)估肺氣腫的方法。一項(xiàng)肺癌篩查實(shí)驗(yàn)研究[27]發(fā)現(xiàn),相比密度測(cè)定法,紋理分析參數(shù)與病人的肺功能相關(guān)性更強(qiáng),診斷COPD的性能更好,且只有紋理分析參數(shù)能夠預(yù)測(cè)肺功能的快速下降。此外,Westcott等[28]報(bào)道了一種結(jié)合CT紋理分析和ML對(duì)COPD病人進(jìn)行肺功能成像的新方法,結(jié)果發(fā)現(xiàn),該方法顯示的肺通氣區(qū)域與超極化氦(3He)MRI的肺通氣區(qū)域呈高度相關(guān),如果該方法能成功普及,將來僅通過CT即可方便、快捷地獲得與MRI通氣圖相似的COPD肺通氣異質(zhì)性圖。
肺解剖結(jié)構(gòu)的分割、重建是肺部疾病診斷和治療的重要步驟,AI針對(duì)COPD在這些方面的研究也取得了進(jìn)展。首先,是對(duì)支氣管的研究。Bian等[29]基于ML中的隨機(jī)森林分類器完成了對(duì)胸部CT上小氣道的全自動(dòng)分割,該自動(dòng)分割假陽性率較低,且比手動(dòng)分割檢測(cè)出更多的小氣道,這對(duì)以小氣道病變?yōu)橹鞯腃OPD有重要價(jià)值。Yun等[30]提出了一種基于DL的全自動(dòng)氣道分割方法,在多個(gè)數(shù)據(jù)集中都成功驗(yàn)證了該方法的可靠性和實(shí)用性;但需要指出的是,對(duì)于重度COPD病人,由于病人較大的低衰減區(qū)會(huì)導(dǎo)致該方法的性能下降,因此該研究進(jìn)一步提出了3D-CNN模型以解決此問題。Nadeem等[31]提出了一種名為“多參數(shù)凍結(jié)生長(zhǎng)傳播(multi-parametric freeze-and-grow propagation)”的新型算法,該算法在CT上對(duì)人體支氣管樹的全自動(dòng)分割性能優(yōu)于目前已知較先進(jìn)的方法,即慢性阻塞性肺疾病研究的亞群和中間結(jié)局指標(biāo)(subpopulations and intermediate outcome measures in COPD study,SPIROMICS)方案,但其單次掃描時(shí)間過長(zhǎng)(約1 h);該研究團(tuán)隊(duì)又將DL與FG算法相結(jié)合進(jìn)行了研究,結(jié)果發(fā)現(xiàn),2種算法結(jié)合后在保持原水平分割性能的同時(shí),還將掃描時(shí)間減少到單次僅需6.5 min。其次,是對(duì)肺葉的研究。Xu等[32]使用CNN模型自動(dòng)分割肺實(shí)質(zhì),其與人工分割法的一致性達(dá)到了96%;也有研究[18]使用CNN模型對(duì)吸煙者的肺葉及全肺完成了分割,2項(xiàng)研究均顯示出CNN在肺部病變的定位和分析上的潛力。Xie等[33]研究一種利用結(jié)構(gòu)化關(guān)系的非局部神經(jīng)網(wǎng)絡(luò)模塊對(duì)CT影像中肺葉分割的可行性,結(jié)果表明該模塊在目標(biāo)檢測(cè)和分類上的性能尤為突出。Blendowski等[34]則有效地利用了離散配準(zhǔn)方法,提出了一種深度二進(jìn)制3D-CNN描述符來有效評(píng)估COPD病人的肺部運(yùn)動(dòng),結(jié)果顯示,CNN描述符和自相似性描述符兩者結(jié)合生成的圖像配準(zhǔn)特征魯棒性最佳。還有研究以醫(yī)療物聯(lián)網(wǎng)為基礎(chǔ),在DL算法中應(yīng)用遷移學(xué)習(xí)技術(shù)并結(jié)合Parzen概率密度,開發(fā)出了快速、高效的肺部分割模型,其分割時(shí)間僅需5.43 s,而且分割準(zhǔn)確度高達(dá)98.34%[35]。除了CT,DL在MRI肺通氣圖上也有應(yīng)用,極快的重建速度使得未來實(shí)時(shí)地顯示人體肺通氣成為可能[36]。
AI在肺部呼吸音、基因分析、遠(yuǎn)程醫(yī)護(hù)等其他領(lǐng)域的應(yīng)用不僅拓展了COPD的研究范圍,也使得COPD病人能在這些方面受益。①AI在肺部呼吸音中的應(yīng)用。有研究者[37-38]利用ML將肺部呼吸音數(shù)據(jù)與呼吸量測(cè)定數(shù)據(jù)相結(jié)合,從中成功地鑒別出COPD病人,有助于從呼吸音層面幫助臨床醫(yī)生診斷該病。②AI在基因分析中的應(yīng)用。Mostafaei等[39]利用ML和懲罰線性回歸模型識(shí)別出與COPD發(fā)病機(jī)制、肺功能調(diào)節(jié)相關(guān)的44個(gè)基因,其中包含了17個(gè)未被報(bào)道過的基因;Benway等[40]在辨別與COPD易感相關(guān)的基因位點(diǎn)中可能的因果變異時(shí),同樣使用了ML技術(shù),并且成功預(yù)測(cè)了這些變異對(duì)肺細(xì)胞產(chǎn)生的特異性調(diào)節(jié)作用。③AI在遠(yuǎn)程醫(yī)護(hù)中的應(yīng)用。Broadbent等[41]對(duì)家用機(jī)器人輔助COPD病人的效果進(jìn)行了隨機(jī)對(duì)照試驗(yàn),研究表明家庭護(hù)理機(jī)器人可以提高病人的服藥依從性,增加病人的鍛煉時(shí)長(zhǎng)。Orchard等[42]將ML應(yīng)用于COPD病人的遠(yuǎn)程監(jiān)護(hù)中,可以根據(jù)監(jiān)測(cè)數(shù)據(jù)識(shí)別出不同個(gè)體的入院風(fēng)險(xiǎn)。此外,Gurbeta等[43]針對(duì)農(nóng)村、偏遠(yuǎn)地區(qū)的病人和行動(dòng)不便的老年人開發(fā)了一種遠(yuǎn)程專家診斷系統(tǒng),使這些人足不出戶就能享受到專家級(jí)的個(gè)體化醫(yī)療服務(wù)。
AI在COPD相關(guān)研究中的應(yīng)用已經(jīng)有了長(zhǎng)足的進(jìn)步,尤其是與影像技術(shù)及診斷相結(jié)合的領(lǐng)域,如AI在量化肺氣腫、CT紋理分析以及分割解剖結(jié)構(gòu)等方面的研究進(jìn)展迅速。AI用于COPD的MRI研究或許會(huì)是一個(gè)重要的研究方向。當(dāng)今中國(guó)老年人口不斷增加,COPD的患病人數(shù)也逐年增加,AI的廣泛應(yīng)用將在減輕醫(yī)療負(fù)擔(dān)、降低醫(yī)保支出、提升醫(yī)生工作效率、提高病人生活質(zhì)量等方面大有裨益。但是,AI也有其局限性,如數(shù)據(jù)集大小的限制,現(xiàn)有的諸多研究都是基于特定數(shù)據(jù)集得出的,這可能限制了研究結(jié)果的泛化,將來在更大的數(shù)據(jù)集中驗(yàn)證這些結(jié)論是很有必要的,這意味著跨區(qū)域,乃至跨國(guó)家領(lǐng)域的大范圍數(shù)據(jù)收集將勢(shì)在必行,也需要付出巨大的人力物力。另外,隨著對(duì)病人愈加精準(zhǔn)的診斷、愈加個(gè)體化的治療,對(duì)病人的數(shù)據(jù)要求就愈加詳細(xì),由此會(huì)涉及到個(gè)人資料安全保護(hù)的問題,這也是在應(yīng)用AI中應(yīng)密切關(guān)注并需解決的問題。總之,隨著AI技術(shù)的不斷發(fā)展成熟,其在將來解決COPD全球公共衛(wèi)生難題中發(fā)揮更關(guān)鍵的作用。