陳思騰, 鄭軍華
精準(zhǔn)醫(yī)學(xué)時(shí)代的到來(lái)為臨床醫(yī)學(xué)的發(fā)展提供了更多先進(jìn)的研究手段。精準(zhǔn)醫(yī)學(xué)之所以在癌癥研究中舉足輕重,主要的原因就在于它可以根據(jù)個(gè)體腫瘤的特征,為患者匹配相應(yīng)的治療并預(yù)測(cè)其治療效果。人工智能(artificial intelligence)作為計(jì)算機(jī)科學(xué)的一個(gè)分支,通過(guò)模擬人類智能的算法,使用以深度學(xué)習(xí)(deep learning)為代表的智能算法對(duì)醫(yī)學(xué)大數(shù)據(jù)資源進(jìn)行挖掘、提取和擬合,以提高臨床診療的精準(zhǔn)度和有效性,正逐步滲透到精準(zhǔn)醫(yī)學(xué)的研究領(lǐng)域[1-3]。人工智能與醫(yī)學(xué)研究相結(jié)合是生物醫(yī)學(xué)領(lǐng)域研究的重點(diǎn)方向之一,尤其是腫瘤影像組學(xué)(radiomics)和病理組學(xué)(pathomics)的運(yùn)用,恰好為臨床醫(yī)師的診療提供了更加精準(zhǔn)的輔助手段[4-5]。近年來(lái)在腎癌的研究領(lǐng)域,人工智能得到了快速發(fā)展,并取得了豐碩的成果。作為異質(zhì)性極高的惡性腫瘤,腎癌的病理類型多樣,患者的治療效果和臨床預(yù)后也存在著明顯的個(gè)體化差異。人工智能基于個(gè)體化醫(yī)學(xué)大數(shù)據(jù)的方法和技術(shù)恰好能為腎癌的個(gè)體化診療提供重要的支持。本文就人工智能近年來(lái)在腎癌診療中的研究和初步運(yùn)用進(jìn)行綜述,以期為廣大同行提供參考和新的啟發(fā)。
高通量測(cè)序是近年來(lái)高速發(fā)展的一項(xiàng)重要技術(shù)。以美國(guó)癌癥基因組圖譜計(jì)劃(the Cancer Genome Atlas,TCGA)為代表的多中心、大型癌癥基因組項(xiàng)目為腎癌基因組學(xué)、轉(zhuǎn)錄組學(xué)的研究奠定了重要基礎(chǔ)[6-7]。Wang等[8]利用TCGA數(shù)據(jù)庫(kù)中1 020例腎細(xì)胞癌患者和復(fù)旦大學(xué)上海癌癥中心129例腎癌患者的測(cè)序及定量聚合酶鏈?zhǔn)椒磻?yīng)(polymerase chain reaction,PCR)數(shù)據(jù),通過(guò)機(jī)器學(xué)習(xí)算法開發(fā)并驗(yàn)證了基于44個(gè)關(guān)鍵基因的腎癌分類模型,精準(zhǔn)識(shí)別腎癌亞型。通過(guò)機(jī)器學(xué)習(xí)算法開發(fā)的糖酵解相關(guān)腎癌基因標(biāo)簽有望成為腎癌的有效生物標(biāo)志物[9]。此外,基于多組學(xué)數(shù)據(jù)的人工智能分析也有助于鑒定出新的腎癌特異性表觀遺傳特征,為腎癌發(fā)生機(jī)制和治療靶點(diǎn)的進(jìn)一步探索提供新的思路[10]。臨床上,1/3的腎癌患者發(fā)現(xiàn)時(shí)已經(jīng)出現(xiàn)遠(yuǎn)處轉(zhuǎn)移,1/4接受根治性腎切除術(shù)的腎癌患者也會(huì)出現(xiàn)復(fù)發(fā)轉(zhuǎn)移[11-12]?;诟咄繙y(cè)序數(shù)據(jù),人工智能逐步被用于開發(fā)腎癌預(yù)后相關(guān)的臨床模型。氧化還原在腎臟腫瘤的發(fā)生、發(fā)展中起著至關(guān)重要的作用,有研究者利用機(jī)器學(xué)習(xí)的方法基于氧化還原相關(guān)長(zhǎng)鏈非編碼RNA構(gòu)建了腎透明細(xì)胞癌(clear cell renal cell carcinoma,ccRCC)生存預(yù)測(cè)模型,可有效預(yù)測(cè)ccRCC患者的臨床預(yù)后情況[13]。N6-腺苷酸甲基化(N6-methyladenosine,m6A)修飾是真核細(xì)胞中最重要的基因轉(zhuǎn)錄后修飾之一,目前已被證實(shí)與多種惡性腫瘤的發(fā)生、發(fā)展密切相關(guān)[14-15]。國(guó)內(nèi)學(xué)者利用轉(zhuǎn)錄組測(cè)序數(shù)據(jù)和機(jī)器學(xué)習(xí)算法,基于7個(gè)m6A甲基化調(diào)控關(guān)鍵基因構(gòu)建了ccRCC預(yù)后預(yù)測(cè)模型,可以準(zhǔn)確地識(shí)別術(shù)后存在生存高危風(fēng)險(xiǎn)的腎癌患者。結(jié)合病理特征,該智能預(yù)測(cè)模型對(duì)腎癌患者術(shù)后1年、3年、5年的生存預(yù)測(cè)準(zhǔn)確率可以達(dá)到85.2%、82.4%和78.3%[16]。此外,基于機(jī)器學(xué)習(xí)的多組學(xué)智能分析可有效預(yù)測(cè)腎乳頭狀細(xì)胞癌的分期,并為早期癌癥的篩查提供一種新的思路[17]。
臨床上超過(guò)一半的腎臟腫瘤為惡性病變,仍有25%~40%的腫瘤性質(zhì)為良性,包括血管平滑肌、腎纖維瘤、囊腫等[18]。如何準(zhǔn)確、快速地鑒別腎臟良、惡性腫瘤目前仍是臨床上面臨的一個(gè)重要問(wèn)題。病理檢測(cè)一直是鑒別良、惡性腫瘤的金標(biāo)準(zhǔn),但是病理活檢存在有創(chuàng)性、種植轉(zhuǎn)移風(fēng)險(xiǎn)等弊端。此外,對(duì)于微小腎臟腫瘤的病理活檢亦不易進(jìn)行。影像學(xué)檢查作為臨床上最常見的無(wú)創(chuàng)性檢查,可輔助醫(yī)師實(shí)現(xiàn)對(duì)腫瘤病變的初步評(píng)估。但是目前這些檢查尚缺乏定量標(biāo)準(zhǔn),且在腎癌的臨床診斷、治療和預(yù)后評(píng)估方面受限于影像學(xué)方法的局限性、腫瘤組織的影像表現(xiàn)及診斷醫(yī)師的經(jīng)驗(yàn)。影像組學(xué)的概念于2012年由荷蘭學(xué)者首次提出,其利用特征提取和人工智能技術(shù),構(gòu)建對(duì)醫(yī)學(xué)影像大數(shù)據(jù)進(jìn)行定量分析和預(yù)測(cè)的有效方法。影像組學(xué)試圖對(duì)腫瘤宏觀影像特征與微觀基因、蛋白質(zhì)和分子改變建立一種分析模型,通過(guò)修改網(wǎng)絡(luò)的結(jié)構(gòu)可從數(shù)據(jù)中學(xué)習(xí)得到更具有針對(duì)性的特征,結(jié)合神經(jīng)網(wǎng)絡(luò)算法的特點(diǎn),形成基于深度學(xué)習(xí)網(wǎng)絡(luò)的影像組學(xué)算法[19]。相比于傳統(tǒng)病理化驗(yàn)及熒光原位雜交等昂貴、費(fèi)時(shí)的檢查,影像組學(xué)可以通過(guò)非侵入性的三維方式捕獲腫瘤內(nèi)異質(zhì)性,實(shí)現(xiàn)無(wú)創(chuàng)分子分型[20],并優(yōu)化術(shù)前治療策略[21],為腎癌的臨床診斷、療效評(píng)估和生存預(yù)測(cè)等提供便捷的指導(dǎo)。國(guó)外學(xué)者將計(jì)算機(jī)輔助檢查與人工智能相結(jié)合,構(gòu)建了腎癌自動(dòng)深度特征分類模型,利用CT影像可以對(duì)腎細(xì)胞癌和血管平滑肌瘤進(jìn)行自動(dòng)鑒別,準(zhǔn)確率達(dá)到76%[22]。Feng等[23]采用支持向量機(jī)(support vector machine,SVM)聯(lián)合遞歸特征消除的方法評(píng)估CT圖像的定量紋理特征,構(gòu)建了識(shí)別分類器,實(shí)現(xiàn)了對(duì)無(wú)可見脂性成分小血管平滑肌脂肪瘤與腎細(xì)胞癌的鑒別診斷,準(zhǔn)確率最高可達(dá)93.9%。Erdim等[24]基于隨機(jī)森林算法對(duì)腎臟CT圖像進(jìn)行紋理分析并構(gòu)建腎臟良、惡性腫瘤分類器,其受試者工作特征曲線(receiver operating characteristic curve,ROC)的曲線下面積(area under curve,AUC)可達(dá)90.5%。此外,對(duì)小腎臟腫瘤CT圖像上的紋理特征進(jìn)行機(jī)器學(xué)習(xí)對(duì)比分析后發(fā)現(xiàn),平掃圖像上的影像組學(xué)特征可能優(yōu)于增強(qiáng)圖像,有望在提高小腎癌診斷準(zhǔn)確性的同時(shí)降低患者檢查時(shí)所接受的CT輻射劑量[25]。腎細(xì)胞癌的病理類型多樣,包括ccRCC、腎乳頭狀細(xì)胞癌、腎嫌色細(xì)胞癌、腎嗜酸性細(xì)胞瘤等,且不同類型的腎細(xì)胞癌預(yù)后差異較大,使得臨床上對(duì)腎癌不同亞型病變的準(zhǔn)確鑒別顯得格外重要。多項(xiàng)研究表明,腎臟皮質(zhì)期影像紋理特征更有助于腎癌不同病理類型的分型診斷[26-28]。由于ccRCC預(yù)后較其他亞型的腎癌更差,所以非侵入性地鑒別ccRCC在臨床實(shí)踐中顯得更加重要[29]。Kocak等[27]利用卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)在一個(gè)94例腎癌患者組成的隊(duì)列中構(gòu)建了基于CT影像的ccRCC識(shí)別模型,對(duì)ccRCC的鑒別表現(xiàn)良好。Sun等[30]也構(gòu)建了基于機(jī)器學(xué)習(xí)算法的診斷模型,并進(jìn)行了10倍交叉驗(yàn)證,證實(shí)了該模型從腎乳頭狀細(xì)胞癌和腎嫌色細(xì)胞癌中區(qū)分ccRCC的準(zhǔn)確率達(dá)89.8%。然而,基于隨機(jī)森林算法的MRI影像組學(xué)模型對(duì)于ccRCC的診斷準(zhǔn)確率僅為77.9%[31]。此外,Pedersen等[32]基于CNN構(gòu)建了非侵入性CT成像模型,可高效地識(shí)別腎嗜酸性細(xì)胞瘤,準(zhǔn)確率可達(dá)90.0%~93.3%。而基于SVM算法的監(jiān)督學(xué)習(xí)也可以實(shí)現(xiàn)對(duì)腎臟皮質(zhì)期、髓質(zhì)期與排泄期紋理的差異特征分析,指導(dǎo)臨床醫(yī)師更好地鑒別腎嫌色細(xì)胞癌和腎嗜酸性細(xì)胞瘤[33]。Fuhrman核分級(jí)系統(tǒng)是目前腎癌最常用的腫瘤分級(jí)方法,但是目前只能通過(guò)術(shù)后病理或穿刺病理活檢進(jìn)行評(píng)估。此外,該方法需要觀察者同時(shí)評(píng)估細(xì)胞核大小、形狀和核仁特征,因此很大程度上受限于觀察者的經(jīng)驗(yàn)和觀察視野的選擇。人工智能結(jié)合CT影像的紋理分析可實(shí)現(xiàn)對(duì)不同F(xiàn)uhrman分級(jí)的ccRCC的無(wú)創(chuàng)性鑒別,AUC可達(dá)82.6%~84.3%[34]。此外,Coy等[35]發(fā)現(xiàn)腎癌分級(jí)與CT影像的強(qiáng)化程度呈負(fù)相關(guān),這可能是由于Fuhrman分級(jí)與腫瘤內(nèi)微血管密度的相關(guān)性導(dǎo)致的,為影像組學(xué)的無(wú)創(chuàng)性分類診斷運(yùn)用提供了一定的理論基礎(chǔ)。Shu等[36]則基于機(jī)器學(xué)習(xí)算法構(gòu)建了影像組學(xué)模型來(lái)評(píng)估腎癌世界衛(wèi)生組織國(guó)際泌尿病理學(xué)會(huì)(International Society of Urological Pathology,ISUP)分級(jí)系統(tǒng),AUC可達(dá)到90.1%~97.6%,有望成為腎癌可靠的無(wú)創(chuàng)預(yù)后預(yù)測(cè)指標(biāo)。此外,基于MRI圖像的機(jī)器學(xué)習(xí)模型識(shí)別腎癌ISUP級(jí)別的AUC僅為71%~74%[37],提示我們可能基于CT圖像的影像組學(xué)分析更有利于預(yù)測(cè)腎癌核分級(jí)。
傳統(tǒng)的病理學(xué)檢查是由病理醫(yī)師借助顯微鏡通過(guò)肉眼觀察組織或細(xì)胞形態(tài)上的改變,再根據(jù)自身經(jīng)驗(yàn)作出病理學(xué)的診斷,但往往都是定性或者半定量的診斷結(jié)果。更加精準(zhǔn)、便捷的病理診斷有賴于“新型”病理學(xué)技術(shù)的開展。病理組學(xué)的概念是近幾年逐漸興起的新型深度學(xué)習(xí)模式。組織結(jié)構(gòu)中的像差是癌癥診斷和腫瘤分級(jí)的重要指標(biāo)。因此,異常表型特征的提取和組織學(xué)分類可以為計(jì)算機(jī)輔助病理學(xué)提供重要參考數(shù)據(jù)。2018年發(fā)表的一項(xiàng)腎癌案例研究[38],利用CNN分析蘇木精-伊紅染色法(hematoxylin-eosin staining,HE)染色的組織學(xué)切片,研發(fā)對(duì)腫瘤深度網(wǎng)絡(luò)分級(jí)模型和腫瘤結(jié)構(gòu)的分類模型。訓(xùn)練集中的樣本圖像分為正常、脂肪、血液、基質(zhì)、低度粒狀腫瘤和高度透明細(xì)胞癌六類。該研究比較了深層網(wǎng)絡(luò)和淺層網(wǎng)絡(luò)的性能,實(shí)驗(yàn)表明深層網(wǎng)絡(luò)優(yōu)于淺層網(wǎng)絡(luò),腫瘤分級(jí)模型和腫瘤結(jié)構(gòu)分類模型可應(yīng)用于存活率的預(yù)測(cè)。目前已有多項(xiàng)研究報(bào)道了人工智能在腎癌核級(jí)分類中的運(yùn)用,其中基于SVM算法的ccRCC核級(jí)分類系統(tǒng)結(jié)合了梯度變化和數(shù)學(xué)形態(tài)學(xué),通過(guò)對(duì)腎臟顯微圖像進(jìn)行整體的評(píng)估來(lái)預(yù)測(cè)腎癌的Fuhrman分級(jí),準(zhǔn)確率高于90%,為促進(jìn)腎癌病理組學(xué)的研究提供了良好的思路[39]。Holdbrook等[40]開發(fā)的核級(jí)分類系統(tǒng)則聚焦于腎癌中核仁的病理形態(tài)表現(xiàn),可準(zhǔn)確區(qū)分高、低級(jí)別的腎細(xì)胞癌。病理圖像中的細(xì)胞核形態(tài)對(duì)于癌癥的診斷和預(yù)后預(yù)測(cè)起著非常重要的作用。國(guó)內(nèi)學(xué)者基于HE染色病理圖像,創(chuàng)新性地運(yùn)用機(jī)器學(xué)習(xí)的方法,開發(fā)并驗(yàn)證了一種基于機(jī)器學(xué)習(xí)的ccRCC人工智能生存預(yù)測(cè)模型,識(shí)別術(shù)后高風(fēng)險(xiǎn)患者,為臨床醫(yī)師的術(shù)后輔助治療決策提供了有效的指導(dǎo)意見[41]。Cheng等[42]從病理圖像中提取腎癌細(xì)胞核的拓?fù)涮卣?,?gòu)建了腎乳頭狀細(xì)胞癌預(yù)后預(yù)測(cè)模型,通過(guò)不同形態(tài)細(xì)胞的空間分布來(lái)探究潛在的預(yù)后生物標(biāo)志物?;诓±韴D像的聯(lián)合組學(xué)研究也在腎癌中陸續(xù)開展,進(jìn)一步地探究腫瘤形態(tài)學(xué)和基因組學(xué)特征之間的關(guān)系。國(guó)內(nèi)學(xué)者對(duì)腎癌全切片病理圖像中提取的細(xì)胞形態(tài)學(xué)特征與基因組數(shù)據(jù)中提取的共表達(dá)特征基因進(jìn)行關(guān)聯(lián)分析,利用病理組學(xué)和基因組學(xué)聯(lián)合的雙組學(xué)數(shù)據(jù)構(gòu)建智能模型來(lái)預(yù)測(cè)ccRCC患者的生存預(yù)后,顯著地提高了現(xiàn)有模型的預(yù)后預(yù)測(cè)能力[43]。而基于交叉模態(tài)特征的整合框架則利用神經(jīng)網(wǎng)絡(luò)從病理圖像中提取深度特征,并與功能基因組數(shù)據(jù)相結(jié)合,構(gòu)建ccRCC預(yù)后模型,可以顯著區(qū)分高、低風(fēng)險(xiǎn)的腎癌患者,一致性指數(shù)高達(dá)0.808[44]?;跈C(jī)器學(xué)習(xí)的腎癌病理組學(xué)分析還有望進(jìn)一步預(yù)測(cè)免疫反應(yīng)、細(xì)胞外基質(zhì)重建和細(xì)胞代謝等生物學(xué)功能,為組織病理學(xué)和蛋白質(zhì)組學(xué)的整合分析提供了新的見解[45]。
盡管人工智能技術(shù)在腎癌的診療中已經(jīng)得到大量的研究和初步的運(yùn)用,但是現(xiàn)有的研究還存在以下幾點(diǎn)不足:(1)當(dāng)前研究主要聚焦于腎癌的診斷以及簡(jiǎn)單的臨床預(yù)后預(yù)測(cè),針對(duì)腎癌靶向治療、腫瘤免疫治療等療效預(yù)測(cè)的影像組學(xué)和病理組學(xué)研究還未涉及;(2)目前所發(fā)表的腎癌影像組學(xué)研究更多涉及CT圖像,關(guān)于腎癌MRI影像組學(xué)分析則少有報(bào)道;(3)當(dāng)前的報(bào)道多為單中心研究的結(jié)果,可能存在病例數(shù)量過(guò)少、數(shù)據(jù)偏倚等缺陷。靶向治療是治療晚期腎癌的主要方式。其中舒尼替尼作為晚期或者進(jìn)展性腎癌患者的一線治療用藥,能夠顯著縮減腫瘤體積并改善患者預(yù)后。但晚期腎癌患者對(duì)舒尼替尼的客觀反應(yīng)率只有40%左右,甚至后期還可能出現(xiàn)耐藥和疾病進(jìn)展,給患者家庭和社會(huì)帶來(lái)沉重的負(fù)擔(dān)[46-47]。所以,關(guān)于腎癌靶向藥效評(píng)價(jià)的生物標(biāo)志物以及患者的選擇性一直是該領(lǐng)域的研究重點(diǎn)。隨著研究的進(jìn)一步深入,人工智能技術(shù)有望在腎癌靶向藥效評(píng)價(jià)方面開創(chuàng)一條新的道路。未來(lái)仍需開展大規(guī)模、多中心研究進(jìn)一步驗(yàn)證人工智能在腎癌診療領(lǐng)域中的應(yīng)用價(jià)值。