羅 藝 秦 齊 王沛豪 郭康順 張鑫平 崔 永
(首都醫(yī)科大學(xué)附屬北京友誼醫(yī)院胸外科,北京 100050)
肺癌是世界上第二大常見的惡性腫瘤,是世界上病死率最高的癌癥,同時也是癌癥相關(guān)死亡的主要原因[1]。非小細(xì)胞肺癌(non-small-cell lung carcinoma,NSCLC)占所有肺癌病例的80%~85%,早期NSCLC以手術(shù)治療為主,腫瘤根治性切除后5年生存率約70%~80%[2]。早期NSCLC以肺腺癌為主,依據(jù)浸潤程度分為不典型腺瘤樣增生(atypical adenomatous hyperplasia,AAH)、原位腺癌(adenocarcinoma in situ,AIS)、微腺癌(minimally invasive adenocarcinoma,MIA)和浸潤腺癌(invasive adenocarcinoma,IAC)。其中AAH、AIS和MIA的5年生存率接近100%,遠(yuǎn)高于IAC的5年生存率60%[3]。肺結(jié)節(jié)專家共識[3]中對于上述不同病理亞型的早期肺腺癌的處理方式略有差異,主要是根據(jù)術(shù)中冰凍明確病變性質(zhì)后決定手術(shù)方式和淋巴結(jié)清掃范圍。然而術(shù)中冰凍診斷肺腺癌的浸潤程度準(zhǔn)確率為80%~90%[4-5],也就預(yù)示著有超過10%的患者在浸潤程度不清或錯誤的情況下采用了不恰當(dāng)?shù)男g(shù)式,這不符合精準(zhǔn)治療的理念,過多的切除也不符合快速康復(fù)理念和肺保護(hù)原則[6]。目前關(guān)于組織性質(zhì)的快速診斷和原位鑒別診斷的研究層出不窮,尤其是以人工智能(artificial intelligence,AI)結(jié)合光譜技術(shù)為核心的快速診斷技術(shù)進(jìn)展迅速。
腫瘤的發(fā)生發(fā)展是一個復(fù)雜的動態(tài)過程,伴隨著細(xì)胞、組織和微環(huán)境的化學(xué)和生物化學(xué)變化,造成了它與正常組織在細(xì)胞形態(tài)、蛋白質(zhì)、脂肪、核酸和代謝產(chǎn)物方面的含量差異化。大量研究[7-11]顯示,高光譜成像(hyper spectral imaging,HSI)、拉曼光譜(Raman spectroscopy,RS)、漫反射光譜(diffuse reflectance spectroscopy,DRS)和熒光光譜(fluorescence spectrum,FS)等光譜技術(shù)可收集組織高度特異性的信息,用于區(qū)分離體病變組織與正常組織,在鑒別組織良惡性方面也有極高的靈敏度和特異度。不同于術(shù)中冰凍診斷只能通過細(xì)胞形態(tài)等信息加以區(qū)分,光譜診斷技術(shù)檢測速度快、靈敏度高,而且可以從上述多個角度反映組織信息,其量化結(jié)果更易被患者和臨床大夫所理解。AI和深度學(xué)習(xí)是光譜數(shù)據(jù)分析的重要工具,本文就當(dāng)前光譜技術(shù)在肺癌鑒別診斷領(lǐng)域的相關(guān)研究及AI 的應(yīng)用進(jìn)行系統(tǒng)綜述,以闡明AI結(jié)合光譜技術(shù)的診斷價值與應(yīng)用前景。
WLI如圖1[12],通過白光觀察異常黏膜改變,對疾病進(jìn)行初步診斷,在肺癌領(lǐng)域主要用于支氣管鏡檢測。在其基礎(chǔ)上衍生而來的窄帶光譜(narrow band imaging,NBI)和HSI可探測目標(biāo)的二維幾何空間及一維光譜信息,使內(nèi)鏡早癌診斷的靈敏度及準(zhǔn)確率均有大幅提高[13]。Zhu等[7]統(tǒng)計了6篇WLI技術(shù)在肺癌領(lǐng)域應(yīng)用的研究,比較WLI和NBI檢測早期肺癌和浸潤性肺癌的靈敏度和特異度,其NBI的匯總靈敏度和特異度分別為86%(95%CI:83%~88%)和81%(95%CI:77%~84%),白光支氣管鏡的匯總靈敏度和特異度分別為70%(95%CI:66%~74%)和66%(95%CI:62%~70%)。WLI可以進(jìn)行肺癌組織和正常支氣管組織之間的鑒別診斷,有研究者[14]開發(fā)AI用于實時評估結(jié)直腸息肉的NBI內(nèi)窺鏡視頻圖像,該模型的準(zhǔn)確率為94%,靈敏度為98%。Zhang等[15]使用三維卷積神經(jīng)網(wǎng)絡(luò)對微觀高光譜圖像中呈現(xiàn)的肺癌進(jìn)行分類,最終總體精度(overall accuracy,OA)為0.962,精確度、召回率和Kappa均值超過0.920。WLI的診斷原理及其分辨能力決定了其不足以實現(xiàn)肺癌術(shù)中浸潤程度的診斷。
圖1 白光成像和窄帶光譜[12]Fig.1 WLI &NBI[12]
當(dāng)光被組織中的化學(xué)鍵吸收導(dǎo)致非彈性散射,將導(dǎo)致光的能量降低,波長變長。波長的偏移包含了組織中不同振動模式的信息,因此散射光子的頻率包含了振動中最具拉曼活性模式的信息[16]。人體組織拉曼帶的常見來源是蛋白質(zhì)、核酸和脂質(zhì)等,常用的激發(fā)波長范圍為700~1 100 nm,因為此時組織和體液的光吸收和自身熒光最小,而滲透深度較高[17]。通過對比肺癌組織和正常組織的RS,可發(fā)現(xiàn)其是能反映組織病變信息的特征光譜[18]。
目前RS技術(shù)及其衍生技術(shù)如拉曼微光譜、表面增強拉曼散射、近紅外拉曼光譜、相干拉曼散射、共振拉曼光譜和空間位移拉曼光譜等使RS的檢測結(jié)果愈發(fā)精準(zhǔn),應(yīng)用范圍愈發(fā)廣泛。已有大量研究[19-21]表明,RS診斷可以用于口腔癌、乳腺癌、食管癌、結(jié)直腸癌等多種癌癥。Wang等[22]使用RS檢測外周靜脈血RS強度,發(fā)現(xiàn)可以通過血清樣本區(qū)分正?;颊吆头伟┗颊?且分期越晚,RS強度越低。唐偉躍等[23]應(yīng)用共焦顯微RS技術(shù)發(fā)現(xiàn)肺癌和癌旁組織在部分波段光譜強度差異明顯,這或許對應(yīng)著肺癌演變過程中的組織形態(tài)、細(xì)胞內(nèi)構(gòu)成發(fā)生了質(zhì)的改變。Chen等[24]研究了RS在肺癌診斷中的整體性能,通過12篇相關(guān)研究的Meta分析,發(fā)現(xiàn)RS在肺癌中的匯總診斷靈敏度和特異度分別為90%(95%CI:87%~92%,P<0.05)和76%(95%CI:72%~79%,P<0.05)。Zheng等[25]的研究使用支持向量機和隨機森林算法分析輔助區(qū)分正常組織和肺癌組織,其準(zhǔn)確率甚至接近99%。因術(shù)中為保證切緣陰性常規(guī)遠(yuǎn)離病灶2 cm,RS僅區(qū)分肺癌組織與正常組織,在臨床中的應(yīng)用價值不大。Kothari等[26]使用兩種機械學(xué)習(xí)方法(K-Means &K-NN)處理RS采集的乳腺癌和正常乳腺組織的光譜信息(圖2),其中K-Means預(yù)測產(chǎn)生的聚類模型具有 93.2%~94.6%的準(zhǔn)確率、89.8%~91.8%的靈敏度和100%的特異度。Weng等[27]采用RS結(jié)合深度學(xué)習(xí)模型區(qū)分肺癌組織,其診斷正常肺組織、小細(xì)胞肺癌、腺癌及鱗癌的準(zhǔn)確率能達(dá)到89.2%。這是當(dāng)前最接近臨床的實際應(yīng)用,然而Weng等[27]采用新鮮組織快速冰凍后解凍30 min再進(jìn)行光譜檢測及病理診斷,與傳統(tǒng)術(shù)中冰凍診斷過程重復(fù),且無明顯診斷優(yōu)勢??傮w而言,RS診斷技術(shù)具有區(qū)分肺癌組織和正常組織的能力,在區(qū)分不同肺部腫瘤組織上也有不俗表現(xiàn),其結(jié)合AI后診斷效能大幅提升。但當(dāng)前研究沒有進(jìn)行新鮮離體組織快速診斷以及術(shù)中原位診斷,這或許是RS診斷替代術(shù)中冰凍技術(shù)的突破點。
圖2 拉曼光譜 [26]Fig.2 Raman spectroscopy [26]Laser Raman spectroscopy (A&B) of normal breast tissue and breast cancer tissue.
當(dāng)光線射入組織表面,一部分光在表層產(chǎn)生鏡面反射;另一部分光折射進(jìn)入組織內(nèi)部,經(jīng)過部分吸收后再次返回組織表層,如此數(shù)次重復(fù),最終從組織各個方向反射出來,即為DRS。DRS包含組織的微觀結(jié)構(gòu)、生化組成和氧合情況等信息,從而實現(xiàn)組織識別。
DRS在結(jié)直腸癌、乳腺癌、皮膚癌等多個領(lǐng)域均有應(yīng)用,Evers等[28]希望通過DRS提高肺結(jié)節(jié)活檢過程的定位準(zhǔn)確性,使用DRS分析離體的肺組織,發(fā)現(xiàn)DRS區(qū)分腫瘤與正常肺組織的靈敏度和特異度分別為89%和79%,總體準(zhǔn)確率為84%,后續(xù)還對乳腺癌患者乳腺組織進(jìn)行體外DRS測量并與術(shù)后病理對比,其區(qū)分正常乳腺組織和腫瘤組織的準(zhǔn)確率為89%[29],另一類似研究[30]的診斷準(zhǔn)確率達(dá)到94%。 Spliethoff等[31]在經(jīng)皮肺活檢過程中使用帶有集成DRS的活檢針進(jìn)行乳腺癌體內(nèi)實時組織檢測(圖3),在術(shù)中測量的21例患者中,腫瘤與周圍組織的水散射比產(chǎn)生56%~81%的對比度差異,并且不受血液影響,該技術(shù)或有助于提高組織病理學(xué)分析的成功活檢率。單獨的DRS診斷肺癌其整體診斷準(zhǔn)確率不及RS,但DRS 特異性識別氧合情況和組織含水量,在術(shù)中原位診斷或穿刺活檢過程可以避免血液干擾。目前DRS與AI結(jié)合診斷肺癌的研究較少,但AI輔助病理診斷是大勢所趨,DRS結(jié)合AI 輔助病理診斷或是今后的研究方向[32]。
圖3 DRS[31]Fig.3 Diffuse reflectance spectra[31]
人體組織內(nèi)含熒光團(tuán)的物質(zhì)主要為氨基酸、結(jié)構(gòu)蛋白、酶、輔酶、脂肪、維生素和卟啉等[33]。當(dāng)熒光團(tuán)所在分子吸收激光能量后,即可從基態(tài)躍遷至激發(fā)態(tài),處于激發(fā)態(tài)的分子通過弛豫降落至第一電子激發(fā)態(tài)的最低振動能級,緊接著再由這個最低振動能級以輻射弛豫的形式躍遷到基態(tài),從而發(fā)出分子熒光[34]。組織在癌變過程中,細(xì)胞異常的新陳代謝將引起熒光物質(zhì)的濃度發(fā)生變化,因此可根據(jù)組織自體FS的差異區(qū)分正常和癌變組織。
FS作為最為敏感的光譜技術(shù),常被用于分析血清樣本。2001年,張文等[35]就驗證了激光誘發(fā)熒光技術(shù)(laser induced fluorescence,LIF)在離體環(huán)境下區(qū)分肺癌組織和正常肺組織上的可行性,其靈敏度和特異度分別為93.2%和88.1%。后續(xù)吳維超[36]使用基于神經(jīng)網(wǎng)絡(luò)的熒光光譜和腫瘤標(biāo)志聯(lián)合檢測進(jìn)行血清學(xué)肺癌檢測,建立了肺癌卷積神經(jīng)網(wǎng)絡(luò)診斷模型,發(fā)現(xiàn)熒光光譜聯(lián)合腫瘤標(biāo)志物模型的靈敏度、特異度和準(zhǔn)確率均遠(yuǎn)遠(yuǎn)優(yōu)于二者獨立預(yù)測,并認(rèn)為神經(jīng)網(wǎng)絡(luò)模型可以作為肺癌的輔助診斷篩查手段。然而血清學(xué)檢測需要繁瑣的預(yù)處理,其最佳應(yīng)用或為肺癌篩查。Kennedy等[37]開發(fā)了一種可以安裝在活檢針中的柔性近紅外共聚焦激光內(nèi)窺鏡系統(tǒng),在活檢過程中檢測腫瘤熒光實現(xiàn)細(xì)胞水平的癌癥檢測(圖4),發(fā)現(xiàn)正常肺組織的平均熒光強度為6.4 A.U. 腫瘤組織的平均熒光強度為20.6 A.U.P<0.001。目前,FS在乳腺癌等腫瘤診斷領(lǐng)域[38]和肺癌探針活檢領(lǐng)域優(yōu)勢突出,但暫無肺癌組織浸潤程度診斷方面的研究。FS具有靈敏度高、選擇性強等特點,可作為其他光譜診斷的補充手段。
圖4 FS:正常肺和不同肺腫瘤的實時NIR-nCLE成像[37]Fig.4 Fluorescence spectrum, real-time NIR-nCLE imaging of normal lung and different lung tumors[37]NIR-nCLE: near-infrared needle-based confocal laser endomicroscopy.
WLI、RS、DRS和FS的診斷原理各不相同,各自從不同維度檢測組織內(nèi)部差異,各光譜技術(shù)對比詳見表1。多光譜(multispectral spectrum,MS)技術(shù)是通過人工智能分類模型,給予不同光譜技術(shù)權(quán)重,從多維度分析組織信息,從而實現(xiàn)組織分類診斷。
表1 各光譜技術(shù)對比Tab.1 Comparison of spectral techniques
Jermyn等[39]設(shè)計了一種結(jié)合內(nèi)在FS、DRS和RS的原位術(shù)中無標(biāo)記光學(xué)癌癥檢測系統(tǒng)。該系統(tǒng)利用多種AI分析方法處理光譜數(shù)據(jù),可以原位檢測腦、肺、結(jié)腸癌和皮膚癌,準(zhǔn)確率、靈敏度和特異度分別為97%、100%和93%。Lin等[40]開發(fā)了一個集成白光成像、RS、DRS和FS的4模態(tài)內(nèi)窺鏡系統(tǒng),采用主成分分析和線性判別分析精選數(shù)據(jù)處理分類。并用該系統(tǒng)進(jìn)行了鼻咽癌檢測的臨床試驗,其診斷靈敏度和特異度分別為98.6%和95.1%。國內(nèi)一款最新的多光譜智能分析設(shè)備[41]集成FS和反射光譜,采集223例新鮮離體的肺癌組織和正常組織的光譜信息(圖5),建立神經(jīng)網(wǎng)絡(luò)模型進(jìn)行自動化診斷,并與術(shù)中冰凍診斷技術(shù)做對比,其臨床驗證組(40例)光譜診斷和FS診斷準(zhǔn)確率均為67.50%(27/40),二者聯(lián)合診斷的AUC為0.949(95%CI: 0.878~1.000,P<0.05),準(zhǔn)確率為95.00%(38/40)。MS診斷系統(tǒng)通過集成各種光譜的優(yōu)勢可以實現(xiàn)腫瘤原位即時診斷,在尋找腫瘤方面與術(shù)中冰凍技術(shù)相當(dāng)。但就浸潤程度區(qū)分而言,暫無一款可與術(shù)中冰凍技術(shù)相提并論的光譜分析儀或光譜診斷技術(shù)。AI可以輔助分析光譜數(shù)據(jù)背后的疾病特征,當(dāng)前研究均受限于數(shù)據(jù)庫較小,無法進(jìn)行相關(guān)性分析。有理由認(rèn)為,通過大量光譜數(shù)據(jù)訓(xùn)練,AI結(jié)合多光譜分析或許可以尋找到區(qū)分不同肺癌不同浸潤程度,區(qū)分不同病理類型的特征光譜。
圖5 多光譜[41]Fig.5 Multispectral[41]
綜上可見不同光譜在特定領(lǐng)域診斷優(yōu)勢明顯,但均不能單獨解決術(shù)中快速鑒別肺癌的臨床問題,且與術(shù)中冰凍技術(shù)相比,多光譜診斷技術(shù)在診斷準(zhǔn)確率方面并無顯著優(yōu)勢,僅少量研究持平[41]。一方面,當(dāng)前肺癌領(lǐng)域快速診斷研究尚少,各光譜技術(shù)在肺癌領(lǐng)域應(yīng)用多局限于離體組織甚至石蠟切片,暫無大樣本研究采集肺癌光譜數(shù)據(jù)進(jìn)行AI分析,大型光譜數(shù)據(jù)庫或許可解決當(dāng)前光譜技術(shù)診斷效能不足的問題;另外多光譜診斷技術(shù)可彌補單一光譜信息采集導(dǎo)致的信息缺失,更詳細(xì)地組織光譜信息也有利于AI分類。另一方面,若將光譜分析技術(shù)定位為輔助診斷技術(shù)或補充診斷技術(shù),作為術(shù)中冰凍診斷的有效補充,可提高冰凍診斷準(zhǔn)確率[41]。
光譜技術(shù)在診斷包括感染、炎癥和各種癌癥在內(nèi)的人類疾病方面具有巨大的潛力。隨著光學(xué)技術(shù)和AI分類的不斷發(fā)展,光譜診斷技術(shù)具有準(zhǔn)確、快速、便攜等特點;AI具有較強的數(shù)據(jù)分析和處理能力,可以定性定量診斷,二者必將在醫(yī)學(xué)診斷領(lǐng)域占據(jù)越來越重要的地位。當(dāng)前大多數(shù)研究還停留在腫瘤良惡性鑒別和確定腫瘤邊界,但已有相關(guān)研究[41-43]證明其在區(qū)分浸潤程度、預(yù)后指導(dǎo)等領(lǐng)域的作用。有理由認(rèn)為,通過技術(shù)改造、優(yōu)化分類模型,以及AI等手段,光譜診斷技術(shù)的準(zhǔn)確性還有提升空間。有望實現(xiàn)輔助甚至取代術(shù)中冰凍診斷肺浸潤性腺癌,從而解決術(shù)中冰凍診斷不確切和誤診的困境。預(yù)計在不久的將來,這些結(jié)合的方法將提供更多的解決方案,不僅用于解決癌癥診斷,而且還有助于更清楚地了解其他疾病的發(fā)生發(fā)展過程,從而為臨床個體精準(zhǔn)化治療提供理論依據(jù)。
利益沖突所有作者均聲明不存在利益沖突。
作者貢獻(xiàn)聲明羅藝、秦齊、王沛豪、郭康順、張鑫平:撰寫并修改論文;崔永:提出文章整體思路,審定和修改論文。