楊德波 牛彩瑯 李鵬宏 景 瑋
(山西醫(yī)科大學(xué)第三醫(yī)院/山西白求恩醫(yī)院神經(jīng)內(nèi)科 太原 030032)
癲癇(epilepsy)是一種神經(jīng)系統(tǒng)常見(jiàn)的慢性病[1-3],具有高致殘率和高致死率的特點(diǎn)[4]。癲癇發(fā)作的不確定性影響患者生活質(zhì)量,因此如何提升癲癇發(fā)作的預(yù)測(cè)準(zhǔn)確率、癲癇患者的治愈率仍是較大挑戰(zhàn)。
人工智能(artificial intelligence,Al)是研究、開發(fā)用于模擬、延伸和擴(kuò)展人類智能的理論、方法、技術(shù)和應(yīng)用系統(tǒng)。機(jī)器學(xué)習(xí)(machine learning,ML)嘗試通過(guò)計(jì)算來(lái)近似或模仿人類識(shí)別模式。傳統(tǒng)的ML模型包括支持向量機(jī)(support vector machine,SVM)、決策樹、邏輯回歸及隨機(jī)森林等。深度學(xué)習(xí)(deep learning,DL)是ML領(lǐng)域中一個(gè)新的研究方向,主要采用多層神經(jīng)網(wǎng)絡(luò),顯著增強(qiáng)了計(jì)算能力[5]。近年來(lái),ML 越來(lái)越多地應(yīng)用于各種醫(yī)療場(chǎng)景,包括腦卒中診斷[6]、肺栓塞診斷[7]、腦動(dòng)脈瘤破裂風(fēng)險(xiǎn)預(yù)測(cè)[8]等。ML在癲癇疾病診療中的應(yīng)用也取得了進(jìn)展,本文主要對(duì)近期ML在癲癇發(fā)作預(yù)測(cè)、癲癇發(fā)作檢測(cè)、癲癇診斷預(yù)測(cè)、抗癲癇藥物(antiepileptic drug,AED)療效預(yù)測(cè)及癲癇手術(shù)預(yù)測(cè)方面的應(yīng)用進(jìn)行總結(jié)分析。
準(zhǔn)確可靠的癲癇預(yù)測(cè)系統(tǒng)可以在癲癇發(fā)作前發(fā)出警報(bào),最大限度地減少或避免癲癇發(fā)作造成的損害,因此,癲癇發(fā)作預(yù)測(cè)極其重要。通過(guò)ML解碼癲癇發(fā)作前的異常腦電,可以有效進(jìn)行癲癇發(fā)作預(yù)測(cè)。研究表明,DTAFNet[9]、幾何深度學(xué)習(xí)(geometric deep learning,GDL)[10]、卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)[11]及 SVM[12]等模型顯示出良好的癲癇發(fā)作預(yù)測(cè)性能。DTAFNet模型對(duì)利用顱內(nèi)和頭皮腦電信號(hào)預(yù)測(cè)癲癇發(fā)作均具有良好性能,但該研究未選取最具代表性的患者腦電數(shù)據(jù)訓(xùn)練基本模型,未進(jìn)一步提高模型的訓(xùn)練速度。GDL獨(dú)立受試者癲癇發(fā)作預(yù)測(cè)器在兩個(gè)數(shù)據(jù)集上的預(yù)測(cè)準(zhǔn)確率都超過(guò)了95%,但其模型所采用的圖形生成方法有待改進(jìn),以便更好地捕獲數(shù)據(jù)中與對(duì)象無(wú)關(guān)的模式。CNN和SVM模型也顯示了良好的預(yù)測(cè)性能。SVM模型[12]在保持較低的誤預(yù)測(cè)率的同時(shí),提高了靈敏度。但該模型未在屬于不同患者的訓(xùn)練和測(cè)試數(shù)據(jù)上執(zhí)行,進(jìn)而未收集關(guān)于不同患者發(fā)作前形態(tài)相似性的一些信息。以上研究表明基于腦電信號(hào)構(gòu)建的ML模型可以有效預(yù)測(cè)癲癇發(fā)作,從而減少癲癇發(fā)作帶來(lái)的傷害,見(jiàn)表1。
構(gòu)建癲癇發(fā)作預(yù)測(cè)模型,對(duì)于減少癲癇患者的發(fā)作,合理管理用藥以及改善生活質(zhì)量有重要意義。然而,ML臨床應(yīng)用面臨重大挑戰(zhàn),包括監(jiān)管問(wèn)題、大數(shù)據(jù)要求和不明確的性能基準(zhǔn)[13]。ML通常需要大量、一致的數(shù)據(jù)集訓(xùn)練算法。患者的一般情況、不同算法解決方案和統(tǒng)計(jì)分析等因素可以積極影響癲癇發(fā)作預(yù)測(cè)的有效性和可行性[14-15]。
癲癇診斷主要依據(jù)病史和腦電圖,對(duì)于沒(méi)有明確的癲癇發(fā)作以及腦電圖沒(méi)有表現(xiàn)出發(fā)作間期癲癇樣放電(interepisodic epileptic discharges,IED)的患者,診斷需要更長(zhǎng)時(shí)間。此外,不同癲癇專家對(duì)IED的判斷不同[16]。因此,基于ML構(gòu)建癲癇診斷預(yù)測(cè)模型極為重要,見(jiàn)表2。SVM模型在癲癇診斷預(yù)測(cè)中也有應(yīng)用?;陟o息狀態(tài)功能磁共振成像(resting state functional MRI,RS-fMRI)構(gòu)建SVM模型[17-18],具有較高準(zhǔn)確率和靈敏度,證實(shí)了基于有向圖度量的SVM模型可作為臨床顳葉癲癇(temporal lobe epilepsy,TLE)診斷的生物標(biāo)志物。在DL領(lǐng)域,CNN[19]模型在癲癇診斷預(yù)測(cè)方面也顯示出了較好的預(yù)測(cè)性能,其可能有助于癲癇診斷實(shí)踐。此外,有研究[20]提出基于正電子發(fā)射斷層顯像(positron emission tomography,PET)的DL模型可有效識(shí)別兒童TLE患者的癲癇病灶,可用于癲癇患兒的未來(lái)診斷。雖然這些研究樣本量有限,但說(shuō)明了ML技術(shù)在成像分析中實(shí)現(xiàn)了新的探索。綜上,許多研究已經(jīng)將ML技術(shù)應(yīng)用于成像數(shù)據(jù)分析。此外,ML技術(shù)也能夠從臨床數(shù)據(jù)中診斷癲癇。例如,使用SVM,Won D等[21]檢查對(duì)比增益控制的視覺(jué)誘發(fā)電位測(cè)量,在區(qū)分特發(fā)性全面性癲癇患者方面獲得良好性能。但是,在癲癇診斷預(yù)測(cè)領(lǐng)域,ML應(yīng)用推廣存在障礙,包括訓(xùn)練數(shù)據(jù)集的大小、混雜的臨床變量以及數(shù)據(jù)的可收集性和接受的可變性。
表2 癲癇診斷預(yù)測(cè)的ML方法概述
癲癇發(fā)作檢測(cè)和診斷通常需要長(zhǎng)時(shí)間監(jiān)測(cè)患者的腦電信號(hào)。然而,不同閱圖者之間的主觀異質(zhì)性及長(zhǎng)時(shí)間信號(hào)的手動(dòng)檢查過(guò)程使其具有挑戰(zhàn)性,因此,構(gòu)建癲癇發(fā)作檢測(cè)系統(tǒng)對(duì)于及時(shí)識(shí)別癲癇發(fā)作具有重要意義。
基于腦電圖信號(hào)[22-23]構(gòu)建SVM模型,在癲癇發(fā)作檢測(cè)方面具有良好預(yù)測(cè)性能,更適合便攜式/可穿戴設(shè)備,同時(shí)可加快臨床醫(yī)生發(fā)現(xiàn)癲癇并對(duì)其進(jìn)行特征描述。但腦電癲癇識(shí)別具有挑戰(zhàn)性。DL神經(jīng)網(wǎng)絡(luò)方法為腦電信號(hào)自動(dòng)分類研究開辟新途徑。研究表明,AnoVAE[24]、BRRM-ONASNet[25]以及CNN[26-27]模型在癲癇發(fā)作檢測(cè)方面具有較高預(yù)測(cè)準(zhǔn)確率(86.68%~100%),顯著提高癲癇檢測(cè)性能。其中AnoVAE算法具有較高靈敏度和較低假陽(yáng)性率(false positive rate,F(xiàn)PR),提高了自動(dòng)癲癇檢測(cè)性能。但是該算法是在住院患者中進(jìn)行評(píng)估的,可能會(huì)降低在日常生活中的監(jiān)測(cè)性能。BRRM-ONASNet檢測(cè)系統(tǒng)框架在一定程度上避免了傳統(tǒng)ML方法的重要非線性特征丟失現(xiàn)象;對(duì)比研究表明,基于BRRM的生物標(biāo)志物有效地識(shí)別了癲癇模式,見(jiàn)表3。
表3 癲癇發(fā)作檢測(cè)的ML方法概述
使用ML技術(shù)構(gòu)建模型,提高了癲癇發(fā)作檢測(cè)性能,對(duì)癲癇早期預(yù)警、臨床管理和靶向治療具有重要意義。但癲癇發(fā)作檢測(cè)領(lǐng)域仍面臨著眾多挑戰(zhàn)。首先,網(wǎng)絡(luò)上公共數(shù)據(jù)集存在不可訪問(wèn)以及不能便捷獲取數(shù)據(jù)問(wèn)題;其次,可用于癲癇發(fā)作檢測(cè)的數(shù)據(jù)集記錄數(shù)量有限;最后,不同數(shù)據(jù)集采樣頻率不一致,較難將其集成到DL網(wǎng)絡(luò)中。建立全面數(shù)據(jù)集有助于開發(fā)準(zhǔn)確和穩(wěn)健的模型。
目前癲癇的主要治療方法是AED,主要依靠醫(yī)生主觀預(yù)測(cè)評(píng)估藥物療效,缺乏客觀有效的生物學(xué)指標(biāo)。因此,構(gòu)建AED療效預(yù)測(cè)模型至關(guān)重要。有研究[28]通過(guò)評(píng)估13種ML算法在預(yù)測(cè)AED療效方面的性能,表明隨機(jī)森林算法性能最佳。該研究可幫助臨床醫(yī)生更好地預(yù)測(cè)家族遺傳性全身性癲癇(genetic generalized epilepsy,GGE)患者的預(yù)后。但該研究在進(jìn)行模型訓(xùn)練時(shí)存在一定隨機(jī)性,最終結(jié)果的數(shù)據(jù)量在實(shí)驗(yàn)數(shù)據(jù)中分布不平衡。有研究[29]將SVM算法與RS-fMRI相結(jié)合,在預(yù)測(cè)AED療效方面顯示出良好性能,為AED病理生理機(jī)制和有效性提供關(guān)鍵見(jiàn)解。同樣,國(guó)內(nèi)也有相關(guān)研究[30]利用SVM算法建立了預(yù)測(cè)丙戊酸鈉血藥濃度的模型,其準(zhǔn)確度、模型預(yù)測(cè)值與實(shí)際觀測(cè)值相關(guān)性較好,可為臨床制訂個(gè)體化給藥方案提供參考。還有研究[31]利用偏最小二乘法(partial least squares,PLS),對(duì)比分析使用左乙拉西坦前后3個(gè)月的腦電圖特征,成功預(yù)測(cè)了TLE患者對(duì)AED的臨床反應(yīng)。此外,基于DL的Transformer 模型[32]在預(yù)測(cè)AED療效中也顯示出中等性能。以上研究均證明ML技術(shù)在預(yù)測(cè)AED療效方面的能力,對(duì)癲癇患者藥物選擇具有指導(dǎo)意義,見(jiàn)表4。
表4 抗癲癇藥物療效預(yù)測(cè)的ML方法概述
綜上,基于ML模型,可有效預(yù)測(cè)AED療效,進(jìn)一步指導(dǎo)醫(yī)生用藥。未來(lái),應(yīng)考慮應(yīng)用先進(jìn)ML技術(shù),解決不平衡分類等問(wèn)題[26];同時(shí)也應(yīng)將研究中得到的ML模型在更多的衛(wèi)生保健環(huán)境中進(jìn)行評(píng)估,以進(jìn)一步確定模型的可推廣性[32]。
癲癇對(duì)人類健康有嚴(yán)重危害,若明確癲癇灶位置則可進(jìn)行手術(shù)治療。然而,由于許多患者的 MRI 呈陰性,定位癲癇病灶具有挑戰(zhàn)性?;赗S-fMRI 構(gòu)建的3DCNN模型[33]在識(shí)別 TLE 患者癲癇發(fā)作區(qū)方面顯示出較高準(zhǔn)確率。定位癲癇灶之后可以對(duì)癲癇患者進(jìn)行術(shù)前評(píng)估,但尚不確定每位患者的臨床特征和術(shù)前評(píng)估結(jié)果如何結(jié)合起來(lái)影響術(shù)后結(jié)果。因此,構(gòu)建癲癇手術(shù)結(jié)果預(yù)測(cè)模型具有重要意義。Sinclair B等[34]基于成人癲癇患者術(shù)前MRI和PET成像構(gòu)建多種ML模型,結(jié)果均顯示出中等預(yù)測(cè)性能。Yossofzai O等[35]利用7個(gè)ML模型預(yù)測(cè)小兒癲癇術(shù)后結(jié)果,結(jié)果顯示XGBoost 性能最佳且優(yōu)于邏輯回歸。從整體上看,上述研究證明ML技術(shù)在典型術(shù)前評(píng)估中獲得的復(fù)雜、多模態(tài)數(shù)據(jù)具有癲癇手術(shù)結(jié)果預(yù)測(cè)能力,可能改善患者選擇,見(jiàn)表5。
表5 癲癇灶定位及癲癇手術(shù)結(jié)果預(yù)測(cè)的ML方法概述
ML方法越來(lái)越多地應(yīng)用于癲癇手術(shù)計(jì)劃和手術(shù)結(jié)果預(yù)測(cè),針對(duì)成人、兒童患者均有相關(guān)研究。然而,此類模型應(yīng)用于臨床實(shí)踐仍需要更大、更多樣化的數(shù)據(jù)集進(jìn)行進(jìn)一步證實(shí),并需要增加外部驗(yàn)證相關(guān)研究。
隨著信息化技術(shù)的快速發(fā)展,ML技術(shù)已經(jīng)在癲癇疾病診療研究中得到廣泛應(yīng)用,同時(shí)仍面臨挑戰(zhàn)。一是目前相關(guān)研究所用樣本量不大,且現(xiàn)有醫(yī)療環(huán)境在數(shù)據(jù)共享方面還存在較大壁壘,預(yù)測(cè)模型準(zhǔn)確率有待進(jìn)一步提高[36]。二是ML技術(shù)的外部驗(yàn)證研究非常少,模型應(yīng)用于臨床實(shí)踐仍需要更大、更多樣化的數(shù)據(jù)集進(jìn)行進(jìn)一步證實(shí)。三是ML對(duì)計(jì)算機(jī)知識(shí)背景要求較高,但目前多數(shù)醫(yī)務(wù)工作者對(duì)該領(lǐng)域了解不多,使其應(yīng)用受限。隨著ML技術(shù)的快速發(fā)展,可推薦醫(yī)務(wù)工作者接受ML相關(guān)培訓(xùn),同時(shí)加強(qiáng)計(jì)算機(jī)科學(xué)領(lǐng)域與醫(yī)務(wù)工作者的合作[36]。四是在將ML和DL技術(shù)引入臨床實(shí)踐之前,要解決以下問(wèn)題:機(jī)器可以學(xué)習(xí)各種圖像特征,包括部分人類無(wú)法識(shí)別的特征,但是ML的技術(shù)機(jī)制基本上是無(wú)法被理解的。在現(xiàn)實(shí)世界中使用機(jī)器模型時(shí),如缺乏對(duì)工作機(jī)制的理解可能會(huì)引發(fā)法律和倫理問(wèn)題[37],過(guò)擬合問(wèn)題尚待解決,必須開發(fā)標(biāo)準(zhǔn)化的方法以測(cè)試各種機(jī)器模型功能,以便在臨床實(shí)踐中普遍以及精確地應(yīng)用ML和DL技術(shù)。