熊 英 陸霓虹
1.大理大學(xué)公共衛(wèi)生學(xué)院,云南昆明 671003;2.昆明市第三人民醫(yī)院呼吸與危重癥醫(yī)學(xué)科 云南省傳染性疾病臨床醫(yī)學(xué)中心,云南昆明 650041
國際癌癥研究機(jī)構(gòu)(International Agency for Research on Cancer,IARC)公布的數(shù)據(jù)顯示,2020年中國肺癌的發(fā)病率(56.3/100 000)和病死率(49.4/100 000)均居于所有惡性腫瘤的首位[1]。通常肺癌患者五年生存率約為18%,但是其中的ⅠA期患者卻大于75%[2],故早期發(fā)現(xiàn)肺癌,可以極大地提高其生存率。為大幅度降低肺癌的病死率,可以在肺結(jié)節(jié)(pulmonary nodule,PN)高危人群中進(jìn)行低劑量CT篩檢,發(fā)現(xiàn)PN并進(jìn)行管理,盡可能發(fā)現(xiàn)早期肺癌,提高患者的生存率。目前PN的診療方面存在良性結(jié)節(jié)診療過度和惡性結(jié)節(jié)診療不足的問題,考慮到成本-效益問題,應(yīng)綜合評(píng)估,然后對(duì)PN人群進(jìn)行分類管理,盡量減少不必要的侵入性檢查,取得更大的收益。在臨床工作中,對(duì)于PN良惡性的判斷多數(shù)是基于醫(yī)生的經(jīng)驗(yàn)性判斷,這可能缺乏一定的客觀性。迄今為止,已有許多預(yù)判PN的良惡性的診斷模型被開發(fā)出來,本研究就PN危險(xiǎn)因素和良惡性預(yù)測(cè)模型做一綜述,并對(duì)未來PN的管理模式提出了設(shè)想。
隨著年齡的增長,PN的檢出率也隨之增加,且呈現(xiàn)線性增長趨勢(shì)[3-5]。有相關(guān)研究表明,小于40歲的人群中,PN檢出率低于3%,而年齡大于60歲人群中,檢出率可高達(dá)50%[6]。隨著機(jī)體向老年化發(fā)展,免疫力在逐步降低,細(xì)胞的自我修復(fù)能力降低,抵抗有害暴露因素的能力在逐步減弱,容易發(fā)生各種疾病[7]。
性別是否和PN發(fā)生相關(guān),尚有爭(zhēng)議,但是在兩個(gè)納入上萬人的研究中[4,7],均發(fā)現(xiàn)男性人群中有更高的PN檢出率,猜測(cè)這可能與男性人群有更高的吸煙率以及更多的不良生活習(xí)慣有關(guān)[8]。
吸煙可以通過直接損傷細(xì)胞DNA或影響細(xì)胞轉(zhuǎn)錄翻譯的過程引起細(xì)胞惡性變,從而成為PN發(fā)生的誘因[9]。在Gould的研究中,發(fā)現(xiàn)吸煙人群肺部結(jié)節(jié)的檢出率明顯高于非吸煙人群,吸煙是誘發(fā)肺癌的獨(dú)立危險(xiǎn)因素(OR=7.9)[10]。一項(xiàng)肺癌篩檢的研究結(jié)果顯示,在>50歲的吸煙者人群中,PN的檢出率接近50%,而10%的吸煙者在隨后1年的隨訪中會(huì)出現(xiàn)新發(fā)的PN[11]。Kwon等[12]發(fā)現(xiàn)在中度和重度吸煙人群中,PN的發(fā)生率明顯增高。
PN常見于癌癥患者,這些病變通常被認(rèn)為是肺部轉(zhuǎn)移,但對(duì)于一些有肺癌危險(xiǎn)因素的患者,如煙草暴露,新的PN并不總是代表轉(zhuǎn)移。Beller等發(fā)現(xiàn)50%的PN為肺轉(zhuǎn)移,26%為原發(fā)性肺癌[13]。Rena等報(bào)道了131例有腫瘤病史的PN患者,轉(zhuǎn)移性疾病、原發(fā)性肺癌和良性疾病分別占49%、44%和7%[14]。研究表明,家族腫瘤史和既往腫瘤史均是PN的獨(dú)立危險(xiǎn)因素[8,11]。
室內(nèi)空氣污染物包括家庭空氣污染物(household air pollution,HAP)、二手煙、家具釋放的甲醛、燃?xì)猱a(chǎn)生的氮氧化合物以及建筑材料所含的揮發(fā)性有機(jī)化合物等[5]。在一項(xiàng)基于中國北方人群的研究中發(fā)現(xiàn),二手煙及廚房油煙的暴露可能是發(fā)生PN的危險(xiǎn)因素之一,在單因素分析中及多因素分析中,二手煙及廚房油煙暴露組與非暴露組的肺結(jié)節(jié)發(fā)生率均有統(tǒng)計(jì)學(xué)意義,提示上述兩種因素可能是發(fā)生肺結(jié)節(jié)的獨(dú)立危險(xiǎn)因素[3]。
有學(xué)者認(rèn)為高血壓是發(fā)生PN的獨(dú)立危險(xiǎn)因素,其風(fēng)險(xiǎn)比為1.222,但具體機(jī)制不清[8]。在一項(xiàng)病例對(duì)照研究[15]中,經(jīng)單因素及l(fā)ogistic回歸分析后得出幽門螺桿菌(Hp)感染是發(fā)生PN的獨(dú)立危險(xiǎn)因素。抑郁、焦慮及工作和生活壓力也與PN的發(fā)生密切相關(guān)[16]。
2.1.1 早期經(jīng)典傳統(tǒng)模型 傳統(tǒng)模型通常是提取PN患者的流行病學(xué)特征,如年齡、性別等因素,再加上影像學(xué)特征(結(jié)節(jié)大小、毛刺征、胸膜牽拉征等),或者聯(lián)合腫瘤標(biāo)志物,而常采用的模型建立方法是二元logistic回歸。最開始建立的良惡性預(yù)測(cè)模型是梅奧醫(yī)學(xué)中心建立的梅奧模型(mayo model)[17],是基于二元logistic回歸方法建立的,其納入的研究對(duì)象為胸片發(fā)現(xiàn)的629例孤立性PN患者,通過單因素和二元logistic回歸分析,得到了6個(gè)預(yù)測(cè)因子(表1),訓(xùn)練組和驗(yàn)證組的受試者工作特征曲線下面積(area under curve,AUC)分別為0.833和0.801。類似的模型還有Brock模型(Brock model)[18],亦被稱作Pan Can模型或McWilliams模型,也采用了二元logistic回歸方法,預(yù)測(cè)因子有9個(gè)(表1),其訓(xùn)練組和驗(yàn)證組的AUC分別為0.942和0.970;與梅奧模型不同的是,Brock模型是基于低劑量CT建立的模型,故有泛化到體檢人群中評(píng)估PN良惡性的潛質(zhì)。更多的還有VA模型[19],但卻是基于退伍軍人的數(shù)據(jù)建立的,缺乏女性樣本,故臨床實(shí)用價(jià)值有限。另外,國內(nèi)開發(fā)的模型中比較經(jīng)典的是北大模型(PKUPH模型)[20],納入了6個(gè)獨(dú)立預(yù)測(cè)因子(表2)。
表1 四個(gè)傳統(tǒng)經(jīng)典模型對(duì)比表
表2 近期其他模型匯總表
2.1.2 其他基于logistic回歸建立的模型 目前所建立的數(shù)學(xué)模型大都基于二元logistic回歸,所納入的病例大都來自于單中心,惡性占比大且數(shù)量有限,所建立的模型大都缺乏外部驗(yàn)證;而近期主要是在研究變量選擇方面進(jìn)行創(chuàng)新,其中就包括了miRNA、蛋白生物標(biāo)志物、18F-FDG PET/CT等。
隨著放射影像學(xué)技術(shù)的發(fā)展和應(yīng)用,放射科醫(yī)師承擔(dān)了海量的閱片任務(wù),為了改變這種現(xiàn)狀并協(xié)助醫(yī)師診斷,計(jì)算機(jī)輔助診斷(computer-aided diagnosis,CADx)系統(tǒng)應(yīng)運(yùn)而生。誠然,人工智能學(xué)科下有諸多構(gòu)建CADx系統(tǒng)的方法,如機(jī)器學(xué)習(xí)
(決策樹、隨機(jī)森林、邏輯回歸、支持向量機(jī)、K均值聚類算法等)和深度學(xué)習(xí)(卷積神經(jīng)網(wǎng)絡(luò)和深度置信網(wǎng)絡(luò)),但大多數(shù)良惡性預(yù)測(cè)模型構(gòu)建采用的是卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN),它具有結(jié)構(gòu)相對(duì)簡單、訓(xùn)練參數(shù)少和適應(yīng)能力強(qiáng)等優(yōu)點(diǎn),相對(duì)于其他方法,CNN有著更為強(qiáng)大圖像識(shí)別和分類能力,而且即使圖像發(fā)生一定的平移、縮放、傾斜等變形,CNN的輸出也不會(huì)發(fā)生改變。在大多數(shù)研究中,其預(yù)測(cè)效能較好,AUC大多在0.85以上,在良惡性的預(yù)測(cè)上,與有經(jīng)驗(yàn)的放射科醫(yī)師及臨床醫(yī)師無統(tǒng)計(jì)學(xué)意義,甚至可能效果更好[26]。但人工智能畢竟不能像人類醫(yī)師一樣,可以提取影像學(xué)上,可能具有惡性病理意義的特征(如毛刺、血管集束征、胸膜凹陷征等),并且大多模型的構(gòu)建并沒有考慮患者的臨床特征和實(shí)驗(yàn)室數(shù)據(jù),故該模型的作用只是為臨床判斷提供一個(gè)相對(duì)可靠的參考,它不能代替臨床醫(yī)生作出最后的決定。但隨著中國農(nóng)村肺癌發(fā)病率的不斷上升和經(jīng)驗(yàn)醫(yī)師的缺乏,人工智能可能是臨床醫(yī)生用作PN患者影像學(xué)解釋的極佳補(bǔ)充工具。
最近的一項(xiàng)研究中,研究者把人工智能的判讀分析結(jié)果用于構(gòu)建新的數(shù)學(xué)模型,其AUC接近0.9,并且在結(jié)合循環(huán)中攜帶異常遺傳物質(zhì)細(xì)胞的檢測(cè)結(jié)果后,其模型靈敏度和特異度均超過80%[27];同樣地,AI分析結(jié)果也可用于圖形計(jì)算工具(如諾模圖),在多中心的驗(yàn)證隊(duì)列中,構(gòu)建的諾模圖總體預(yù)測(cè)準(zhǔn)確度為91.6%,靈敏度和特異度分別為86.03%和85.88%[28]。
現(xiàn)在PN的分類管理大都是基于結(jié)節(jié)直徑的,但是有時(shí)候直徑測(cè)量所產(chǎn)生的誤差可能大于體積測(cè)量,而且相對(duì)于二維的直徑,三維的體積(可以通過AI實(shí)現(xiàn))可能對(duì)于PN的大小變化會(huì)更敏感,利用體積建立預(yù)測(cè)模型可能比直徑效果更好。
從圖1中可見,結(jié)節(jié)B比結(jié)節(jié)A直徑僅變化了10%,但是其體積卻增大了33.1%;結(jié)節(jié)D相較于結(jié)節(jié)C直徑只增加了2 mm,但體積幾乎增加了
圖1 肺結(jié)節(jié)模擬圖
一倍,這從視覺效果上就有非常明顯的區(qū)別了。結(jié)節(jié)直徑的測(cè)量通常只是基于一個(gè)掃描層面,相較體積測(cè)量存在較大的誤判可能性;而且大多情況下PN并不是完美的球形,測(cè)量出的直徑不能有效代表其體積。故采用體積進(jìn)行分類管理可能會(huì)比直徑更具敏感性,可以盡量縮短惡性結(jié)節(jié)患者確診的時(shí)間,增加患者的生存率。
研究發(fā)生PN的危險(xiǎn)因素,可以為其一級(jí)和二級(jí)預(yù)防提供線索及依據(jù)。PN的發(fā)生和諸多因素相關(guān),例如年齡、吸煙、家族及個(gè)人腫瘤史等。目前建立的數(shù)學(xué)模型其預(yù)測(cè)效能依然欠佳,而且各地區(qū)之前建立的模型可能相互之間并不適用,如相較于歐美,亞洲結(jié)核病發(fā)病率更高,由于肺結(jié)核好發(fā)于肺上葉,也會(huì)有PN的影像學(xué)特征,故在模型中納入是否位于上葉,可能在亞洲地區(qū)并不適用。而且用于建立模型的人群中,其惡性結(jié)節(jié)占比太大,可能不適用于廣大的體檢人群。所以還需要更多的多中心數(shù)據(jù)去完善模型,改善其靈敏度和特異度。
利用AI建立的程序模型有一定的前景,目前已用于輔助放射科醫(yī)師的診斷,AI可以幫助其加快診斷的進(jìn)程,減少因?qū)Υ罅酷t(yī)學(xué)圖像進(jìn)行分類而導(dǎo)致的精神疲勞。并且可以綜合各方面的數(shù)據(jù),構(gòu)建圖形計(jì)算工具,如諾模圖。相較于結(jié)節(jié)直徑,結(jié)節(jié)體積能更加真實(shí)地反映其大小,且對(duì)其變化更具敏感性,未來在PN的管理中,體積監(jiān)測(cè)或更具前景。