田大偉,王效春,張輝,譚艷*
癌癥是當(dāng)今世界最主要的公共衛(wèi)生問題,在我國有逐年上升的趨勢[1]。病理學(xué)反映了腫瘤的進(jìn)展,能夠識別并提供與腫瘤相關(guān)的表型信息。常規(guī)的病理醫(yī)生在顯微鏡下對組織的微觀結(jié)構(gòu)進(jìn)行觀察以進(jìn)行組織學(xué)評估。然而,人眼識別細(xì)微組織變化的能力有限,可能會出現(xiàn)觀察者內(nèi)和觀察者間差異[2],另外這一手動過程繁瑣且耗時,分析結(jié)果可能受到病理醫(yī)生經(jīng)驗水平和主觀因素的影響,過度疲勞有時也會產(chǎn)生誤診[3-4]。
近年來,隨著人工智能在臨床癌癥研究中的廣泛應(yīng)用[5],影像組學(xué)從腫瘤MRI 數(shù)據(jù)中提取強度、紋理等特征建立診斷、預(yù)后和治療反應(yīng)的預(yù)測模型?;谌斯ぶ悄艿臄?shù)字病理學(xué)能夠使用自動分析圖像的技術(shù)快速檢查和量化組織切片,識別病理信息并突出顯示感興趣和需要重點關(guān)注的區(qū)域,學(xué)習(xí)病理組織圖像更深層的特征,同時減少了人工篩選所需的時間,從而更高效地完成腫瘤的檢測、分類和預(yù)測[6-9]。將影像組學(xué)特征與患者的臨床病理信息融合構(gòu)建的腫瘤預(yù)測模型,能更好地預(yù)測腫瘤的侵襲性,揭示了影像與患者的預(yù)后聯(lián)系[10]。本文就數(shù)字病理學(xué)到人工智能的發(fā)展以及在腫瘤診療中的應(yīng)用,病理信息在MRI中的作用和未來展望作一綜述。
數(shù)字病理學(xué)[11]使用全切片數(shù)字掃描技術(shù)獲得高分辨率圖像,應(yīng)用計算機將病理組織切片轉(zhuǎn)換為高質(zhì)量的數(shù)字圖像,即全切片數(shù)字化圖像(whole slide image,WSI)。數(shù)字病理學(xué)不僅減少了病理醫(yī)生的工作量,將他們從單調(diào)、易出錯的涂片篩選中解放出來,提高了他們的診斷能力并提供更多有價值的信息,還能降低患者病理切片識別錯誤和丟失的風(fēng)險,更迅速獲取外部意見,改進(jìn)了遠(yuǎn)程病理會診和信息的共享,實現(xiàn)了切片的數(shù)字化管理[12]。在數(shù)字病理學(xué)的基礎(chǔ)上,WSI 構(gòu)建的豐富的數(shù)據(jù)集為人工智能技術(shù)在病理學(xué)中的應(yīng)用創(chuàng)造了條件,與人工智能的融合發(fā)展成為數(shù)字病理學(xué)發(fā)展的重要方向。
機器學(xué)習(xí)是人工智能的子集,從大量數(shù)據(jù)中學(xué)習(xí)并構(gòu)建預(yù)測模型,利用機器學(xué)習(xí)可以從腫瘤組織圖像中提取與患者預(yù)后相關(guān)的信息,對腫瘤的預(yù)后做出科學(xué)的判斷[13]。深度學(xué)習(xí)是機器學(xué)習(xí)中一種基于數(shù)據(jù)進(jìn)行表征學(xué)習(xí)的方法,包含多層神經(jīng)元組成的深度神經(jīng)網(wǎng)絡(luò),可以學(xué)習(xí)圖像數(shù)據(jù)的深層次規(guī)律,深度學(xué)習(xí)算法可以增強圖像的分析能力,在腫瘤的診斷、轉(zhuǎn)移、預(yù)后等方面有所幫助[14]。卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)是一種有助于圖像分類的深度學(xué)習(xí)方法,在CNN 的輔助下計算機能夠自動識別圖像的最佳特征,這些特征能夠在不依賴大量預(yù)處理或人類知識的情況下直接分類[15]。人工智能與醫(yī)學(xué)圖像的結(jié)合是目前醫(yī)療領(lǐng)域研究的新熱點,在腫瘤的臨床研究中達(dá)到了新的高度。
在病理學(xué)中,人工智能輔助診斷提高了病理的數(shù)字化程度,可用于腫瘤的分類診斷、分級、預(yù)后預(yù)測和治療。目前,其在膠質(zhì)瘤、乳腺癌、肺癌、腎癌、肝癌、前列腺癌、大腸癌、鼻咽癌、淋巴瘤、黑色素瘤、間皮瘤等多種腫瘤疾病中展開了研究。基于人工智能的病理學(xué)在腫瘤中的應(yīng)用將隨著技術(shù)的發(fā)展不斷擴大,進(jìn)一步開發(fā)新的診斷模式和治療手段。
準(zhǔn)確的腫瘤分類能夠及早輔助腫瘤治療的決策和實施。Liao 等[16]從491 張?zhí)K木精-伊紅(H&E)切片提取了1733 個定量圖像特征,建立基于機器學(xué)習(xí)的模型成功將肝癌與鄰近的正常組織區(qū)分開,測試組中受試者操作特征AUC 為0.988,驗證組中AUC 為0.886。Sun 等[17]利用遷移學(xué)習(xí)從322 張肝病理組織圖像中獲得特征,然后結(jié)合多示例學(xué)習(xí)進(jìn)行分類,將肝臟組織病理圖像區(qū)分為腫瘤和正常組織,準(zhǔn)確率為0.98。
基于人工智能的病理學(xué)不僅能將腫瘤與正常組織區(qū)分開,對于腫瘤亞型的分類、腫瘤與其他異常結(jié)構(gòu)的區(qū)分也有很大的幫助。Tabibu 等[18]開發(fā)了一個基于支持向量機的深度學(xué)習(xí)框架,選擇了1584例腎癌切片圖像,卷積神經(jīng)網(wǎng)絡(luò)在WSI上將透明細(xì)胞癌和嫌色細(xì)胞癌與正常組織區(qū)分開,準(zhǔn)確率分別為93.39%和87.34%,最佳AUC 分別為0.98 和0.95,區(qū)分透明細(xì)胞癌、嫌色細(xì)胞癌和乳頭狀細(xì)胞癌的分類準(zhǔn)確率達(dá)到94.07%,最佳AUC達(dá)到0.93。Han等[19]提出了一種基于類結(jié)構(gòu)的深度卷積神經(jīng)網(wǎng)絡(luò)的分類方法對82 例患者的7909 張乳腺癌組織病理圖像進(jìn)行多分類,平均準(zhǔn)確率為93.2%。Syrykh等[20]設(shè)計了一個深度學(xué)習(xí)框架,使用378例H&E染色的淋巴結(jié)WSIs進(jìn)行訓(xùn)練、驗證、測試,準(zhǔn)確區(qū)分濾泡淋巴瘤和濾泡增生,AUC 為0.99。Hekler 等[21]使用卷積神經(jīng)網(wǎng)絡(luò)對595 例包含痣和黑色素瘤患者的H&E切片進(jìn)行分類,用100例切片對結(jié)果進(jìn)行測試并與11 名病理醫(yī)生進(jìn)行比較,CNN 的敏感度為76%,特異度為60%,準(zhǔn)確度為68%,靈敏度和準(zhǔn)確度均超過病理醫(yī)生。
基于人工智能的病理學(xué)降低了圖像數(shù)據(jù)的高冗余度,能夠處理數(shù)據(jù)的不平衡問題,快速識別病理組織圖像中的癌性組織和腫瘤亞型的結(jié)構(gòu)差異?;谌斯ぶ悄艿哪P湍軌蜃詣舆M(jìn)行腫瘤亞型和正常組織的區(qū)分,較于病理醫(yī)生提高了診斷的準(zhǔn)確性,通過客觀分析降低了病理醫(yī)生間的可變性、不一致性,提高了腫瘤分類的效率。
Rathore 等[22]從735 例神經(jīng)膠質(zhì)瘤患者的WSIs 中提取臨床特征、圖像特征和紋理特征來訓(xùn)練支持向量機模型,使用多層預(yù)測模型將神經(jīng)膠質(zhì)瘤分為Ⅱ-Ⅳ級,準(zhǔn)確度為91.48%,敏感度為93.47%,特異度為85.36%,最佳AUC 為0.927。Lucas等[23]利用WSI中的像素和腫瘤腺體的實質(zhì)性變化訓(xùn)練CNN,使用CNN 對96 個前列腺活檢組織切片進(jìn)行自動Gleason 分級,區(qū)分GP≥4 與GP≤3 的準(zhǔn)確率、靈敏度和特異度分別為90%、77%和94%。Poojitha 等[24]提出了一種深度學(xué)習(xí)的新型混合架構(gòu),其中包含3 個神經(jīng)卷積網(wǎng)絡(luò),對前列腺癌進(jìn)行Gleason分級的準(zhǔn)確度達(dá)到了0.98。Khoshdeli 等[25]使用兩種基于卷積神經(jīng)網(wǎng)絡(luò)的模型對2461例WSIs進(jìn)行分類,深層卷積神經(jīng)網(wǎng)絡(luò)的模型能夠從中將部分腎癌WSIs 分為低級別顆粒腫瘤和高級別透明細(xì)胞癌,準(zhǔn)確度為0.99。
組織病理學(xué)是腫瘤分級的金標(biāo)準(zhǔn),這一過程繁瑣且具有主觀性,人工智能的應(yīng)用能夠改善分級的流程,克服不可重復(fù)性,且診斷準(zhǔn)確率高于一般的病理醫(yī)生?;谏疃葘W(xué)習(xí)能夠從圖像中提取有助于分級的組織學(xué)特征,如微血管增值水平、有絲分裂活性、壞死等。如果結(jié)合放射學(xué)特征和臨床特征會進(jìn)一步提升分級水平。
人工智能技術(shù)加快了病理醫(yī)生對病理圖像的評估,增加了預(yù)測的客觀性和可重復(fù)性。Courtiol 等[26]開發(fā)了一種基于深度卷積神經(jīng)網(wǎng)絡(luò)的方法,不需要病理醫(yī)生局部注釋就能分析WSI,對間皮瘤患者的WSIs進(jìn)行預(yù)處理,使用WSIs的圖像塊預(yù)測總生存期(overall survival,OS),平均c-指數(shù)>0.64。發(fā)現(xiàn)有助于預(yù)測預(yù)后的區(qū)域主要位于基質(zhì)。Kather等[27]通過遷移學(xué)習(xí)利用手動勾畫得到的HE 圖像訓(xùn)練CNN,使用得到的模型從862張I-IV期大腸癌組織切片圖像中提取具有臨床注釋的組織特征,在多變量Cox 回歸模型中計算了一個“深層間質(zhì)評分”,這是總生存期[風(fēng)險比(hazard ratio,HR):1.99]的獨立預(yù)測因子。結(jié)果表明,CNN 能夠根據(jù)病理組織圖像評估腫瘤微環(huán)境并預(yù)測預(yù)后。這些研究證實了腫瘤微環(huán)境在預(yù)測腫瘤預(yù)后方面的重要性。
Campanella 等[28]開發(fā)了一個在多示例學(xué)習(xí)方法下結(jié)合卷積神經(jīng)網(wǎng)絡(luò)和遞歸神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)框架,在44732 張WSIs 的數(shù)據(jù)集上進(jìn)行評估。對前列腺癌、基底細(xì)胞癌和乳腺癌腋窩淋巴結(jié)轉(zhuǎn)移的檢測,AUC 均在0.98 以上。Zadeh Shirazi等[29]開發(fā)了一個基于CNN的分類器,根據(jù)組織病理圖像將腦腫瘤患者的生存期分類(Ⅰ-Ⅳ期),在訓(xùn)練組和驗證組中得到了0.99和0.8的準(zhǔn)確度,最佳AUC為1。Yu等[30]設(shè)計了一個自動化工作流程,從2480個肺腺癌和鱗癌的WSIs中提取了9879 個定量圖像特征,使用機器學(xué)習(xí)方法選擇特征并將Ⅰ期肺癌患者分為短期生存組和長期生存組。研究表明,自動選擇的病理圖像特征能夠預(yù)測肺癌的預(yù)后。Skrede 等[31]基于深度學(xué)習(xí)直接分析常規(guī)的H&E 切片開發(fā)了一種預(yù)測早期結(jié)直腸癌切除術(shù)后患者預(yù)后的生物標(biāo)志物,將II 期和III 期患者分為不同的預(yù)后組。在驗證隊列中,預(yù)后差和預(yù)后良好的HR 為3.83,調(diào)整后的HR 為3.04。結(jié)果表明這一標(biāo)志物優(yōu)于現(xiàn)有的分子和形態(tài)學(xué)預(yù)測標(biāo)志物,改善了風(fēng)險分層。
基于人工智能的病理學(xué)從組織病理圖像中提取客觀特征,建立機器學(xué)習(xí)分類器來預(yù)測腫瘤的生存結(jié)果,快速將患者分為不同的預(yù)后組,間接地輔助治療或評估患者的治療情況。這種能力優(yōu)于根據(jù)腫瘤分級和分期判斷預(yù)后的效果。
Liu 等[32]利用神經(jīng)網(wǎng)絡(luò)對從843 例鼻咽癌患者的訓(xùn)練組中提取的病理微觀特征進(jìn)行分析,根據(jù)受試者操作特征將患者分為高危和低危兩組。結(jié)果顯示,高危組5 年無進(jìn)展生存期(progression-free-survival,PFS)較低危組差,分別為28.1%和86.4% (HR 為10.03)。低危組中接受誘導(dǎo)化療聯(lián)合同期放化療和接受同期放化療的患者5年P(guān)FS相差不大(HR為0.67)。同時,高危組中接受誘導(dǎo)化療聯(lián)合同期放化療的患者5 年P(guān)FS 高于單獨接受同期放化療的患者(HR 為0.50)。結(jié)果證明病理微觀特征有助于指導(dǎo)鼻咽癌患者的治療決策。
神經(jīng)膠質(zhì)瘤的等級和亞型與微血管高度相關(guān),Li 等[33]提出了一種檢測和量化膠質(zhì)瘤中微血管的基于自動深度學(xué)習(xí)的方法,使用350例神經(jīng)膠質(zhì)瘤患者的WSIs,用全卷積網(wǎng)絡(luò)進(jìn)行微血管分割并進(jìn)行識別、特征提取和分析。膠質(zhì)母細(xì)胞瘤中微血管密度和微血管面積分別為95%和170%。結(jié)果表明該方法可以精確地提取微血管的特征,從而指導(dǎo)是否采用放化療或抗血管生成的靶向治療。
基于深度學(xué)習(xí),診斷性的病理學(xué)通過預(yù)測患者的生存風(fēng)險進(jìn)行分組、量化腫瘤微觀結(jié)構(gòu)均可以指導(dǎo)患者的治療。需要注意的是,微觀特征輔助治療的原理不明確,復(fù)雜病理圖像的分割錯誤和過度計數(shù)會對結(jié)果產(chǎn)生偏差,抗血管生成的研究較少,有待進(jìn)一步的研究和驗證。
影像組學(xué)中的病理信息包括病理分化程度、腫瘤標(biāo)志物、免疫組化標(biāo)志物、腫瘤分期等。結(jié)合定性和定量MRI 特征與病理信息可以預(yù)測腫瘤患者的預(yù)后,促進(jìn)個性化治療。Zhao等[34]結(jié)合47例膽管癌患者的影像組學(xué)特征、增強MRI、血管內(nèi)皮生長因子受體構(gòu)建聯(lián)合模型,顯著提高了影像組學(xué)模型的預(yù)測性能,AUC、靈敏度、特異度分別為0.949、0.875、0.774。Cui 等[35]從186 例局部晚期直腸癌放化療前的T2WI、增強T1WI、ADC 圖中提取1188 個影像特征,結(jié)合病理信息構(gòu)建了影像組學(xué)諾模圖,較單獨的影像組學(xué)標(biāo)簽預(yù)測效果更好,最佳AUC 為0.966。另外,結(jié)合病理信息的影像組學(xué)模型在鑒別非小細(xì)胞肺鱗癌和腺癌[36]、預(yù)測淋巴結(jié)轉(zhuǎn)移[37]等方面也可優(yōu)化影像組學(xué)模型。
隨著傳統(tǒng)病理數(shù)據(jù)與MRI 的結(jié)合應(yīng)用,影像組學(xué)模型可以更好地量化腫瘤異質(zhì)性,改善患者的危險分層以提高個性化診療水平,發(fā)揮其在精準(zhǔn)醫(yī)療中的作用。目前人工智能分析大多基于單獨的病理圖像或MRI 圖像,尚無基于人工智能的微觀病理圖像及宏觀MRI 圖像的綜合量化分析研究,多層次的人工智能綜合分析有望成為未來的研究方向。
人工智能技術(shù)的發(fā)展為現(xiàn)代病理學(xué)提供了新的方向和挑戰(zhàn),越來越多的參與了病理醫(yī)生的診斷和決策。但仍有一些局限性,由于人工智能算法的限制、數(shù)據(jù)來源的差異、患者的組織學(xué)形態(tài)和特征不同,目前沒有統(tǒng)一的組織病理學(xué)診斷模式和應(yīng)用于不同類型腫瘤的診斷模型;基于人工智能的病理學(xué)對圖像質(zhì)量的要求比較高,而構(gòu)建大量帶注釋的高質(zhì)量圖像非常昂貴且耗時,質(zhì)量不合格會影響特征的提取和數(shù)據(jù)的分析;病理圖像通常有噪聲。
隨著數(shù)字病理學(xué)的發(fā)展,基于更大、更豐富的數(shù)據(jù)集,構(gòu)建性能更佳的人工智能預(yù)測模型,探索深層的網(wǎng)絡(luò)結(jié)構(gòu)優(yōu)化模型并提高分類和預(yù)后性能。未來的研究應(yīng)該朝著多學(xué)科交叉方向發(fā)展,人工智能不僅基于病理圖像數(shù)據(jù)分析,還能整合影像量化特征和基因信息,基于人工智能的腫瘤多層次、多維度的綜合量化研究有待探索。
綜上所述,基于人工智能的病理學(xué)應(yīng)用于腫瘤的分類、分級、預(yù)后預(yù)測、放化療和靶向治療的指導(dǎo),提高了診斷的效率和準(zhǔn)確性,實現(xiàn)了更快速、更精確的腫瘤診療。傳統(tǒng)病理數(shù)據(jù)結(jié)合MRI 影像組學(xué)的應(yīng)用能改善患者的危險分層并提高個性化診療水平。人工智能基于微觀病理及基因、宏觀MRI 的多層次綜合量化分析研究,將是今后腫瘤精準(zhǔn)診療的研究趨勢。
作者利益沖突聲明:全體作者均聲明無利益沖突。