李潔潔,張雁儒,李昊,楊越
(河南理工大學 醫(yī)學院,河南 焦作 454000)
腦卒中是一項影響國計民生的公共衛(wèi)生問題,是全球第二大致死原因,每年約有660萬人死于腦卒中,嚴重影響患者的生命和生活質(zhì)量[1]。近年來,機器學習作為一門交叉學科,被廣泛應用于醫(yī)學領域。利用機器學習對腦卒中進行及時的預測,具有重要的臨床意義,可以幫助醫(yī)護人員做出臨床決策,優(yōu)化醫(yī)療資源配置,對患者危的險因素及時干預,降低腦卒中的患病率和致死率。
因此,了解機器學習在腦卒中研究中的應用進展,可以為機器學習的進一步應用提供參考。本文重點對近年來機器學習在腦卒中復發(fā)、預后和恢復預測方面進行綜述。
機器學習是一門研究如何使用計算機程序模擬人類學習活動的學科[2],是人工智能的一個重要子集,主要用于分析結(jié)構(gòu)化數(shù)據(jù)[3]。在大數(shù)據(jù)時代,機器學習算法的使用大大提高了分析海量臨床數(shù)據(jù)的能力,將醫(yī)生從大量信息中拯救出來,有助于快速做出臨床決策。它在生產(chǎn)率、效率和醫(yī)療服務的地域覆蓋范圍等方面的提升[4],也是醫(yī)療人員研究機器學習的重要原因。
通過文獻檢索,發(fā)現(xiàn)將機器學習用于腦卒中研究始于2005年[5]。腦卒中研究中多是不平衡數(shù)據(jù),而機器學習方法是預測不平衡數(shù)據(jù)的有效工具[6],彌補了這種不對稱。通過回顧性或前瞻性研究,將數(shù)據(jù)分為訓練集和測試集,開發(fā)出基于不同機器學習算法的預測模型。通過兩種方法對開發(fā)出的預測模型的性能進行評價:一種與傳統(tǒng)腦卒中預測評分相比較;另一種與不同機器學習算法所建立的預測模型比較。評價標準:受試者工作特征曲線下面積(area under the curve,AUC)、特異度、敏感度、準確性、召回率、F1-score等。在評價結(jié)果上,利用機器學習算法開發(fā)的預測模型的性能要優(yōu)于傳統(tǒng)預測模型[7-8]。在不同數(shù)據(jù)樣本下,同一機器學習算法會得到不同的預測效果,性能高低也不同。根據(jù)機器學習的常用算法,列出被比較算法,匯總關于腦卒中最優(yōu)機器學習算法的AUC值和樣本量大小,具體如表1所示。
目前,機器學習在腦卒中的研究頗多,也被證明對腦卒中研究有重大價值[14-16]。如預測藥物治療效果[17-18]、腦卒中后肺炎[19]、預測腦卒中最終病變[20]、辨別缺血性腦卒中亞型[21]、對腦卒中患者進行焦慮分析[22]等。機器學習的主要任務是預測,因此,本文重點探討腦卒中復發(fā)、預后及恢復預測。
表1 腦卒中最優(yōu)機器學習算法
有研究證明,至少1/6的腦卒中患者會在5 a內(nèi)復發(fā)[23]。腦卒中一旦復發(fā),就意味著神經(jīng)功能受損更加嚴重、家庭負擔更加巨大??刂聘哐獕骸⑻悄虿?、脂質(zhì)代謝、抽煙、喝酒等[24-26]危險因素一直是臨床常用的降低復發(fā)率的方法,因此有必要根據(jù)患者的一般資料進行危險因素預測。一般情況下,1~2個危險因素可誘導腦卒中患者復發(fā),而大數(shù)據(jù)下的機器學習可以處理危險因素間的復雜關系,處理分析能力更加優(yōu)異。
利用機器學習算法對患者進行30 d、90 d、1 a以及更長期腦卒中復發(fā)預測,結(jié)果顯示,在不同的數(shù)據(jù)和時間長度下,相同的機器學習算法可有不同的性能表現(xiàn)。有研究發(fā)現(xiàn),使用隨機森林、梯度增強機、極端梯度提升、支持向量機和邏輯回歸5種機器學習算法對電子健康記錄的患者數(shù)據(jù)進行30 d模型開發(fā)。結(jié)果顯示,采用rose采樣的極端梯度提升在AUC方面性能最好,AUC為0.74(95% CI為0.64~0.78)[27]。Xu等[28]對腦卒中患者進行了90 d再入院風險預測,極端梯度提升預測能力高于隨機森林模型,預測模型的AUC為0.782。Hung等[29]預測90 d最優(yōu)模型時,使用了8種機器學習算法,包括C4.5、分類和回歸樹、K近鄰、邏輯回歸、多層感知器、Na?ve Bayes、隨機森林和支持向量機,最終認為最優(yōu)模型是Na?ve Bayes模型,其AUC為0.661。但Chan[30]通過交叉驗證,人工神經(jīng)網(wǎng)絡型預測1 a卒中復發(fā)的中位敏感度、特異度、準確性和AUC分別為75%、75%、75%和77%,其預測性能優(yōu)于支持向量機和Na?ve Bayes分類器。Abedi等[31]進行了一項預測5 a卒中復發(fā)研究,使用6種算法(logistic回歸、極端梯度提升、梯度增強機、隨機森林、支持向量機、決策樹)預測卒中復發(fā)情況。結(jié)果顯示,6種模型均可應用于長期卒中復發(fā)的預測,但預測時間越長,性能越低。如1 a預測窗口的最佳AUC為0.79,2、3、4、5a預測窗口的最佳AUC分別為0.70、0.73、0.73、0.69,呈下降趨勢。
對腦卒中患者進行預后是困難的,但同時又很必要。利用機器學習對腦卒中患者進行預后預測在長期決策、患者治療、醫(yī)療資源等方面起著重要作用。醫(yī)護決策者在機器學習制定計劃的基礎上,更好地預測每個患者的患病程度,將患者家庭情況和經(jīng)濟條件考慮在內(nèi),與患者、親屬和醫(yī)院共同作出和護理決策,制定個性化干預,改善預后。
利用5種算法[12](正則化邏輯回歸、支持向量機、隨機森林、極端梯度提升、K近鄰)預測預后的研究中,正則化邏輯回歸的效能最好,AUC為0.86,支持向量機的AUC排第2名,為0.85,所有機器學習模型的AUC均達到0.8以上,比傳統(tǒng)評分預測模型準確性高。例如,在Chiu等[32]和Heo等[11]的研究中,將機器學習預測模型分別與DRAGON評分和ASTRAL評分相比,結(jié)果顯示機器學習預測模型的性能優(yōu)于后者。Li等[33]的研究發(fā)現(xiàn)5個機器學習模型(邏輯回歸、支持向量機、隨機森林分類器、極端梯度提升和全連接深度神經(jīng)網(wǎng)絡)的性能差別不大,驗證了機器學習算法優(yōu)于血管事件總健康風險評分和NADE列線圖。Abedi等[34]利用電子健康記錄的數(shù)據(jù),基于logistic回歸、極端梯度提升和隨機森林3種機器學習模型預測缺血性腦卒中后的短期和長期病死率。結(jié)果顯示,3種模型的AUC在0.76~0.81之間,隨機森林模型在1個月時表現(xiàn)最佳,AUC為0.82。開發(fā)的機器學習模型的性能可以通過數(shù)據(jù)的繼續(xù)訓練而不斷提高。有研究使用3種機器學習模型(支持向量機、隨機森林和人工神經(jīng)網(wǎng)絡)和混合人工神經(jīng)網(wǎng)絡,進行10次重復保留和10次交叉驗證進行評估,開發(fā)的機器學習模型的AUC均超過0.94。再通過增加后續(xù)數(shù)據(jù),預測能力提高到0.97[35]。
卒中后出院的患者需要長期鍛煉以恢復肢體功能。出院后的護理若不成系統(tǒng),會導致醫(yī)療費用增加以及面臨再次入院的風險。機器學習算法可以幫助患者預測醫(yī)療資源需求,幫助護理人員做出匹配的康復計劃,使有限的醫(yī)療資源達到最佳配置。
Thakkar等[13]利用K近鄰和人工神經(jīng)網(wǎng)絡算法預測腦卒中患者恢復功能,K近鄰模型的預測精度為85.42%,AUC為0.89,人工神經(jīng)網(wǎng)絡模型的預測精度為81.25%,AUC為0.77,證明K近鄰模型性能優(yōu)于人工神經(jīng)網(wǎng)絡。有研究采用決策樹、Na?ve Bayes、K近鄰、線性判別分析、AdaBoost、支持向量機、logistic回歸和隨機森林8種機器學習方法,8種機器學習模型的AUC在0.830~0.887之間,其中隨機森林表現(xiàn)最好,AUC為0.887[36]。在識別腦卒中患者的日常生活依賴性時,分類回歸樹模型的準確率為0.830,可以作為預測模型[37]。開發(fā)深度神經(jīng)網(wǎng)絡、邏輯回歸和隨機森林的3種預測模型中,深度神經(jīng)網(wǎng)絡模型預測上下肢功能的AUC分別為0.906和0.822,高于其他模型的AUC值[38]。對腦卒中患者回家可能性的分析中,機器學習算法建立了決策樹、線性判別分析、K近鄰、支持向量機和隨機森林5種模型,基于同一數(shù)據(jù)集構(gòu)建分類系統(tǒng)進行準確率、AUC值、F1評分以及敏感度等比較,結(jié)果顯示,就模型性能而言,支持向量機(AUC為0.91)和K近鄰(AUC為0.88)為優(yōu)異的候選算法[9]。綜上,在進行恢復預測研究時,可以使用K近鄰、深度神經(jīng)網(wǎng)絡、隨機森林等算法。
先進的機器學習算法有潛力改善醫(yī)療保健的獲取和公平,降低醫(yī)療成本,降低診斷錯誤或差異,提高效率,改善醫(yī)療服務。機器學習在預測方面發(fā)揮越來越重要的積極作用,但也要正視其自身固有的弊端。利用機器學習背后可能引起某些群體的歧視及偏見[39],引發(fā)倫理問題,要求醫(yī)生具備相關技能和倫理方面的知識。另外,機器學習性能高低取決于輸入數(shù)據(jù)是否適合。不同數(shù)據(jù)集下的模型的性能不同,有時這些驗證研究會產(chǎn)生相互矛盾的結(jié)果。數(shù)據(jù)量的大小影響算法的性能,通常情況下,數(shù)據(jù)量越多,模型算法的性能越好。大數(shù)據(jù)環(huán)境下,電子健康記錄可以提供海量的數(shù)據(jù),機器學習算法與電子健康記錄相結(jié)合可為機器學習預測工具的開發(fā)提供平臺。應根據(jù)數(shù)據(jù)集的特點選擇最優(yōu)的機器學習算法,在提升預測模型性能的同時可適當增加數(shù)據(jù)訓練和交叉驗證。機器學習正不斷以一種潛在的革命方式,為醫(yī)患帶來新的體驗。