張文泰 范陽華 王賀 王任直
垂體腺瘤在顱內(nèi)腫瘤的發(fā)病率僅次于膠質(zhì)瘤和腦膜瘤,其對人體的危害除了源于腫瘤自身的占位效應,同時還有腺瘤所導致的激素分泌亢進[1]。根據(jù)英國Fernandez 等[2]的流行病學調(diào)查研究結(jié)果,近30 余年來垂體腺瘤的發(fā)病率已由7.5 ~15/10 萬上升至75 ~113/10 萬。根據(jù)是否分泌垂體激素,可將垂體腺瘤分為功能性垂體腺瘤(FPA)和無功能性垂體腺瘤(NFPA)兩種類型,然后再根據(jù)所分泌激素類型的不同,進一步分為垂體生長激素腺瘤(亦稱肢端肥大癥)、垂體促腎上腺皮質(zhì)激素腺瘤(亦稱庫欣?。?、垂體催乳素腺瘤等,在上述所有類型中以垂體催乳素腺瘤所占比例最高,Daly 等[3]曾對7 萬余例比利時垂體腺瘤患者進行流行病學調(diào)查,發(fā)現(xiàn)垂體催乳素腺瘤發(fā)病率高達66.2%,而其他類型所占比例均未超過18%。垂體腺瘤占位效應造成的危害程度主要取決于其侵襲性、體積和生長方向。向鞍上生長者可突破鞍膈,侵襲第三腦室和下丘腦;向后方生長者可壓迫腦干等重要結(jié)構(gòu);向兩側(cè)生長者可侵襲海綿竇,包繞頸內(nèi)動脈,導致海綿竇綜合征。腫瘤質(zhì)地和病灶區(qū)的解剖結(jié)構(gòu)可直接影響手術(shù)醫(yī)師對手術(shù)策略的制定和對患者預后的判斷。垂體腺瘤導致的激素分泌亢進可對機體產(chǎn)生多種不良影響,例如,促腎上腺皮質(zhì)激素(ACTH)分泌亢進(垂體促腎上腺皮質(zhì)激素腺瘤所致)誘發(fā)的庫欣綜合征;生長激素(GH)分泌亢進(垂體生長激素腺瘤所致)引起的肢端肥大癥;催乳素分泌亢進(垂體催乳素腺瘤)導致的閉經(jīng)、溢乳等;此外,還有部分難治性垂體腺瘤,存在易復發(fā)或癌變的傾向。目前在垂體腺瘤的診斷與治療中尚存許多懸而未決的問題,這些問題貫穿于術(shù)前診斷、治療策略、術(shù)后腫瘤復發(fā)及并發(fā)癥預測的整個臨床過程中。例如,如何基于患者臨床資料對庫欣病進行早期診斷、如何判斷早期無癥狀性垂體微腺瘤是否會進展、哪一種類型的垂體腺瘤術(shù)后易復發(fā)、導致術(shù)后并發(fā)癥的危險因素、庫欣病患者精神癥狀的發(fā)生機制等。上述問題對神經(jīng)外科醫(yī)師而言,極具挑戰(zhàn)性,如何通過術(shù)前對患者影像學資料、病歷文本資料的定量分析而指導臨床診斷并制定治療策略,是當前所面臨的問題,而人工智能(AI)恰是一種比傳統(tǒng)神經(jīng)外科醫(yī)師主觀判斷更具一致性、更高效的輔助診斷方法。
“人工智能”一詞最早出現(xiàn)于20 世紀50 年代[4],是以計算機為基礎,通過開發(fā)用于模擬甚至等同于人類智力的理論、方法、技術(shù)的一項科學技術(shù),其優(yōu)勢在于可通過構(gòu)建模型來處理龐大的數(shù)據(jù),計算能力較強;因此采用人工智能技術(shù)處理數(shù)量龐大且內(nèi)容極為復雜的醫(yī)學數(shù)據(jù),有可能成為今后醫(yī)學研究的常用方法[5]。早在20 世紀80 年代即有計算機輔助臨床診斷與治療的個案報道,1985 年,美國羅切斯特大學醫(yī)學院Panzer 等[6]通過計算機輔助決策系統(tǒng)輔助診斷腦出血,但該系統(tǒng)診斷準確率較低,僅為5%~67%;1995 年,美國喬治亞醫(yī)學院的Phillips等[7]通過計算機技術(shù)輔助研究膠質(zhì)母細胞瘤瘤內(nèi)出血病例,成功實現(xiàn)1 例膠質(zhì)母細胞瘤患者MRI 圖像的腦血腫自動分割,但彼時囿于科技水平有限,使人工智能技術(shù)未能在醫(yī)療領(lǐng)域推廣與普及。近年隨著科學技術(shù)的不斷進步,人工智能技術(shù)飛速發(fā)展,2017 年,我國在“十九大”上提出了建設網(wǎng)絡強國的號召,更進一步將大數(shù)據(jù)、人工智能技術(shù)的發(fā)展上升至國家戰(zhàn)略。
1.機器學習和深度學習 機器學習是人工智能技術(shù)的重要組成部分,其中經(jīng)典機器學習作為一門學科,專指通過計算機在數(shù)據(jù)中進行學習,包括線性判別分析(LDA)、Logistic 回歸、決策樹(DT)、樸素貝葉斯(NB)模型等。經(jīng)典機器學習方法屬于淺層學習方法,而近年興起的深度學習則是機器學習頗受關(guān)注的新的研究方向,包含多個隱含層的深度神經(jīng)網(wǎng)絡,可以學習樣本數(shù)據(jù)的深層次規(guī)律,如圖像數(shù)據(jù)、文字數(shù)據(jù)、聲音數(shù)據(jù)等。深度學習并非獨立的學習方法,其與淺層學習的區(qū)別在于,可通過監(jiān)督學習和無監(jiān)督學習方法來訓練深度神經(jīng)網(wǎng)絡。在醫(yī)學領(lǐng)域里,深度學習可通過提取、分析已標注的影像圖片和病理圖片數(shù)據(jù),建立模型,從而對未標注的影像圖片和病理圖片進行診斷,有助于提高放射科和病理科醫(yī)師對疾病診斷的準確性;同時可通過其所構(gòu)建的模型對臨床結(jié)局、腫瘤分子特征等因素進行預測,從而幫助臨床醫(yī)師選擇最為優(yōu)化的治療策略??茖W實驗的再現(xiàn)性十分重要,對于機器學習方法亦是如此,模型的穩(wěn)健性和普遍性至關(guān)重要[8?9],此為機器學習方法在臨床應用過程中亟待解決的問題。
2.機器學習的臨床應用 隨著現(xiàn)代計算機技術(shù)的發(fā)展與進步,機器學習在處理海量數(shù)據(jù)方面的優(yōu)勢得以體現(xiàn)。目前,醫(yī)學研究中使用最多的機器學習方法是監(jiān)督學習,監(jiān)督學習主要應用于兩方面:一是分類,即在不同的亞組中選擇一個亞組,如心電圖的輔助診斷,可在已經(jīng)心內(nèi)科醫(yī)師標注過的心電圖中進行機器學習,建立心電圖預測模型,而應用于臨床;或者在影像學中,對大量已標注診斷結(jié)果的肺結(jié)節(jié)的性質(zhì)進行監(jiān)督學習,通過特定計算方法構(gòu)建肺結(jié)節(jié)診斷模型,而應用于肺結(jié)節(jié)的診斷。二是預測,例如基于臨床資料針對各種疾病并發(fā)癥或轉(zhuǎn)歸的預測。無監(jiān)督學習與之不同,主要進行數(shù)據(jù)內(nèi)分組,或?qū)鹘y(tǒng)的某種疾病基于基因、環(huán)境及個人生活方式等信息給出新的定義,無結(jié)局指標可以預測。使用無監(jiān)督學習的典型范例是精準醫(yī)學倡議[5],所謂“精準醫(yī)學”也可以理解為個體化醫(yī)學,即每一個體的生理病理特點、疾病特征、治療方案均為“量體裁衣”,因此機器無法獲得像監(jiān)督學習那樣精確的已標注數(shù)據(jù),而監(jiān)督學習則需要已標注的樣本數(shù)據(jù),因此監(jiān)督學習的方式無法解決個體化醫(yī)療的需求,而無監(jiān)督學習使用聚類計算法,通過學習未標注數(shù)據(jù)的特征建立模型,可以解決精準醫(yī)學的需求。
3.機器學習存在的弊端 (1)技術(shù)弊端:由于醫(yī)學研究的對象具有參數(shù)多、數(shù)據(jù)量龐大的特征,因此在選擇模型時,一般以容量大(模型擬合復雜函數(shù)的能力)的模型為首選,此類模型大多存在訓練集上表現(xiàn)良好而驗證集上表現(xiàn)較差(過擬合)的弊端。這是由于在訓練集中,除了數(shù)據(jù)點自身的分布外,同時存在觀測誤差,這是基于訓練集和驗證集獨立同分布假設,即兩個集合在總體參數(shù)的分布范圍相同,這種現(xiàn)象亦被稱之為泛化能力較差。而且深度學習、神經(jīng)網(wǎng)絡往往存在可解釋性差的問題,這在醫(yī)學研究中是先天缺陷。(2)應用弊端:除人工智能技術(shù)不完善外,機器學習在醫(yī)學研究中的應用還存在一些至今尚難解決的問題,例如在腫瘤的早期診斷中,機器學習在訓練模型時缺乏“金標準”。術(shù)后病理是目前臨床確診腫瘤性疾病的“金標準”,但是組織病理切片為靜態(tài)圖片,而垂體腫瘤的動態(tài)進展變化對腫瘤的診斷至關(guān)重要,早期垂體腫瘤是否會進展為需要治療的病變,專家意見也不盡一致,因此,雖然機器學習對腫瘤的早期診斷可能比臨床醫(yī)師的經(jīng)驗具有更高的一致性和可重復性,但診斷的準確性目前尚未可知[10],且有可能帶來一個嚴重的問題——過度診斷,因為相比假陽性結(jié)果,臨床醫(yī)師更擔心出現(xiàn)假陰性判斷。
4.影像組學 影像組學是一種從標準醫(yī)療圖像中大規(guī)模挖掘定量圖像特征的技術(shù),可使數(shù)據(jù)能夠被準確提取并應用于臨床決策支持系統(tǒng)[11]。影像組學可通過機器學習的方法提取、處理并分析患者的影像資料。醫(yī)學影像數(shù)據(jù)可反映腫瘤的病理生理學信息,患者的影像資料如MRI、CT、PET 數(shù)據(jù)等均可被轉(zhuǎn)化為可挖掘的高維數(shù)據(jù),再通過人工智能技術(shù)進行數(shù)據(jù)處理[12]?;颊叩亩S影像圖片在計算機進行數(shù)據(jù)提取和分析后,可提取包括時間在內(nèi)的三維甚至四維數(shù)據(jù),腫瘤的影像學特征通常為強度、形狀或尺寸、紋理、小波等,這些數(shù)據(jù)也需要與患者的臨床數(shù)據(jù)相結(jié)合才能夠更好地輔助醫(yī)師進行診療[13]。影像組學的應用較為復雜,但可以大致簡化為五部分:數(shù)據(jù)選擇(標準化圖像)、興趣區(qū)(ROI)分割、特征提取、數(shù)據(jù)分析和建立模型。目前已有較多的影像組學相關(guān)研究,但其計算方法構(gòu)建的模型在性能、再現(xiàn)性和臨床應用方面缺乏標準化的評價準則,很難支撐臨床決策支持系統(tǒng),故建立影像組學標準化評價體系至關(guān)重要。2017 年,有學者提出影像組學質(zhì)量評分(Radiomics Quality Scale)[11],可用于評估影像組學研究的質(zhì)量,但尚待相關(guān)研究加以證實。
1.預測垂體腺瘤預后 庫欣病導致的臨床綜合征對人體危害嚴重且術(shù)后極易復發(fā),因此預后判斷的臨床意義重大。2019 年Neuroendocrinology 發(fā)表了Liu 等[14]采用人工智能技術(shù)預測庫欣病患者預后的研究結(jié)果,354 例均為庫欣病患者,7 種計算方法共納入17 個變量建立模型以預測經(jīng)鼻蝶入路垂體腺瘤切除術(shù)后復發(fā)率,根據(jù)預測性能最終選擇隨機森林計算法,納入8 個變量,所得曲線下面積(AUC)為0.781,隨訪≥12 個月,復發(fā)率為13%;同時采用特征選取計算法選擇對預后影響最大的因素,結(jié)果顯示:年齡(P <0.001)、術(shù)后晨起血漿皮質(zhì)醇(P <0.002)、術(shù)前(P = 0.040)及術(shù) 后(P <0.001)晨起ACTH 水平與復發(fā)率呈顯著相關(guān)。該項研究通過庫欣病患者的臨床資料獲得預后預測模型,較好地預測到庫欣病患者的預后情況,但術(shù)后隨訪時間短,使證據(jù)等級有所下降。術(shù)前對肢端肥大癥患者進行手術(shù)療效預測對其個體化治療方案十分重要,目前仍無針對肢端肥大癥患者手術(shù)療效預測的準確模型。北京協(xié)和醫(yī)院Fan 等[15]通過梯度增強決策樹(Gradient Boosting Decision Tree)算法,預測肢端肥大癥患者經(jīng)鼻蝶入路垂體腺瘤切除術(shù)后癥狀緩解率,共納入668 例患者,包括訓練集534 例、測試集134 例,采用較為常用的6 種計算法構(gòu)建模型,其中由梯度增強決策樹算法構(gòu)建的模型在訓練集和驗證集的AUC 值分別為0.8555 和0.8177,因此最后被采用,該項研究所獲模型可輔助臨床醫(yī)師進行治療方案決策。該作者的另一項預后相關(guān)研究共納入163 例侵襲性功能性垂體腺瘤患者,根據(jù)入院時間分為訓練集108 例、驗證集55 例;提取和處理MRI數(shù)據(jù)后,通過支持向量機構(gòu)建影像學標簽預測手術(shù)療效,共包含7 個影像學特征,通過多因素Logistic回歸分析選擇最有意義的臨床特征,最終構(gòu)建的預測模型包含影像學標簽和文本特征;結(jié)果顯示:在訓練集和驗證集上的AUC 值分別為0.834 和0.808,影像組學標簽和最終的影像組學模型對侵襲性功能性垂體腺瘤預后的預測效果均優(yōu)于臨床模型[16]。
2.對垂體腺瘤藥物反應性或放射治療反應性的預測 Kocak 等[17]采用高維定量質(zhì)地分析的機器學習方法預測47 例肢端肥大癥患者術(shù)前對生長抑素類似物治療的反應性,結(jié)果顯示:24 例患者對生長抑素類似物有反應、23 例無反應,所構(gòu)建模型對生長抑素類似物反應性的預測準確率為85.1%、AUC值為0.847,明顯優(yōu)于其他模型(準確率57.4% ~70.2%、AUC 值0.575 ~0.704),且差異具有統(tǒng)計學意義(P <0.05)。該項研究還同時對47 例肢端肥大癥患者的術(shù)前冠狀位T2WI 進行定量質(zhì)地分析,在T2WI的828 個質(zhì)地特征中,535 個呈較好的再現(xiàn)性。Fan等[18]2019 年報告的另一項研究,通過影像組學的方法預測肢端肥大癥患者對放射治療的反應性,57 例患者均于術(shù)后接受放射治療,共提取病灶中1561 個影像組學特征,通過支持向量機、留一法交叉驗證選取影像組學特征,最終由6 個影像組學特征構(gòu)建影像組學標簽,通過多因素Logistic 回歸分析建立臨床模型,最終選取7 個臨床特征構(gòu)建臨床模型,再將臨床模型與影像模型結(jié)合,得到最終的影像組學模型,經(jīng)放射治療后3 年25 例患者(43.86%)達到臨床緩解、32 例(56.14%)未達到臨床緩解,其臨床模型預測放射治療結(jié)局的AUC 值為0.86、影像學標簽AUC 值0.92,最終將影像學標簽和臨床模型結(jié)合起來的影像組學模型AUC 值為0.96,提示術(shù)后輔助放射治療的肢端肥大癥患者臨床轉(zhuǎn)歸良好,同時也表明影像組學是一種具有良好臨床應用前景的預后判斷方法。
3. 用于垂體腺瘤輔助診斷 Wei 等[19]報告,通過深度學習網(wǎng)絡方法對814 例庫欣綜合征患者、1131 例肢端肥大癥患者和12 598 例正常對照者的人面圖片進行模型構(gòu)建,最終得出庫欣綜合征和肢端肥大癥受試者工作特征(ROC)曲線AUC 值分別為0.9647 和0.9556,提示其診斷效果良好。
目前,人工智能技術(shù)在垂體腺瘤領(lǐng)域的應用研究中存在的不足,一是,大部分研究為單中心臨床試驗,缺乏多中心的參與,因此僅通過機器學習的方法所得結(jié)論之可靠性有待驗證;其二,由于影像學數(shù)據(jù)對臨床診斷是不可或缺的,因此DICOM 數(shù)據(jù)標準化的工作也有待各中心的進一步完善,甚至需要政府層面推動數(shù)據(jù)格式標準化的工作。醫(yī)學是一個交叉學科,自然科學技術(shù)的發(fā)展對醫(yī)學的發(fā)展具有促進作用,希望臨床醫(yī)師能夠順應人工智能技術(shù)的發(fā)展趨勢,善用各種人工智能研究方法,在醫(yī)學研究中權(quán)衡利弊、合理應用,從而實現(xiàn)更好服務于臨床的目的。
利益沖突無