朱 檸,魏海坤,張侃健
(東南大學(xué) 自動(dòng)化學(xué)院,江蘇南京 210096)
癲癇是一種慢性非傳染性腦?。?],被定義為一種持久性產(chǎn)生大腦紊亂的疾病,會(huì)導(dǎo)致嚴(yán)重的機(jī)體、認(rèn)知、心理障礙和社會(huì)后果[2-3]。癲癇發(fā)作是由大腦中異常、過度的神經(jīng)元活動(dòng)導(dǎo)致的短暫癥狀[4]。癲癇的平均發(fā)病率為23~190/10 萬,兒童的發(fā)病率可達(dá)25~840/10 萬[5],且發(fā)展中國(guó)家的癲癇發(fā)病率明顯高于發(fā)達(dá)國(guó)家[6]。傳統(tǒng)的流行病學(xué)和衛(wèi)生統(tǒng)計(jì)方法只考慮疾病死亡率而不考慮殘疾率,導(dǎo)致神經(jīng)系統(tǒng)疾病對(duì)人類健康的影響被嚴(yán)重低估。全球范圍內(nèi)應(yīng)對(duì)神經(jīng)系統(tǒng)疾病的資源分配不足,迫使人們尋求更有效的解決方案。
癲癇發(fā)作時(shí)如果得不到及時(shí)救治,可能會(huì)對(duì)患者生命安全產(chǎn)生極大傷害,預(yù)測(cè)癲癇發(fā)作可有效規(guī)避健康風(fēng)險(xiǎn)。有臨床經(jīng)驗(yàn)的醫(yī)生可通過患者的腦電波圖像對(duì)其病情有大致了解,但可能會(huì)忽視細(xì)小波動(dòng),而采用機(jī)器預(yù)測(cè)癲癇發(fā)作往往需要處理海量數(shù)據(jù)。近年來,人工智能(Artificial Intelligence)和機(jī)器學(xué)習(xí)(Machine Learning)技術(shù)由于其強(qiáng)大的數(shù)據(jù)處理能力,在癲癇發(fā)作的預(yù)測(cè)中發(fā)揮了一定作用[7-8]。目前,研究人員已經(jīng)建立了一套解決癲癇預(yù)測(cè)問題的框架,主要包括4 個(gè)步驟[9],具體為:
(1)原始腦電數(shù)據(jù)的采集與轉(zhuǎn)換。獲取數(shù)據(jù)的方法主要有侵入式腦電和非侵入式腦電(頭皮腦電)兩種。為實(shí)時(shí)獲取數(shù)據(jù),需要將患者腦電信息通過電極連線傳輸?shù)皆O(shè)備中。
(2)數(shù)據(jù)預(yù)處理和特征提取。原始腦電數(shù)據(jù)的信噪比過低,且電極相鄰?fù)ǖ篱g具有強(qiáng)統(tǒng)計(jì)學(xué)相關(guān)性(皮爾森相關(guān)系數(shù)高于80%),因此從原始數(shù)據(jù)中提取有效信息十分關(guān)鍵,一般選擇在一個(gè)確定的時(shí)間窗口內(nèi)對(duì)數(shù)據(jù)特征進(jìn)行提取。綜合現(xiàn)有研究結(jié)果,數(shù)據(jù)特征可分為時(shí)域特征、頻域特征、時(shí)域—頻域特征線長(zhǎng)度、離散小波變換特征、連續(xù)小波變換特征和傅里葉變換特征。例如,王雅靜等[10]采用預(yù)發(fā)作數(shù)據(jù)段選取方法,在MIT 公共頭皮腦電數(shù)據(jù)庫(kù)和宣武醫(yī)院收集的數(shù)據(jù)集上進(jìn)行測(cè)試,召回率分別為95.76%和97.80%。
(3)運(yùn)用機(jī)器學(xué)習(xí)相應(yīng)的分類器。常用的分類器,如支持向量機(jī)(SVM)、隨機(jī)森林(RF)和神經(jīng)網(wǎng)絡(luò)(BP、CNN、RNN)被廣泛用于癲癇發(fā)作模式的識(shí)別。例如,Cho 等[11]將神經(jīng)信號(hào)的鎖相值作為SVM 分類器的輸入特征,得到召回率為82.44%的分類結(jié)果;Ahmad 等[12]將傅里葉變換后的數(shù)據(jù)作為特征,召回率達(dá)到94.8%;Zhang 等[13]將信號(hào)的絕對(duì)/相對(duì)功率譜作為SVM 分類器的輸入,模型性能極大提升,召回率達(dá)到98.68%。RF 模型的擬合能力強(qiáng)于SVM,在癲癇預(yù)測(cè)模型上的分類結(jié)果更優(yōu)。例如,Truong 等[14]選擇時(shí)域特征,Tzimourta 等[15]選擇傅里葉變換后的頻域特征,Sharma 等[16]選擇經(jīng)驗(yàn)?zāi)B(tài)變換后的數(shù)據(jù)作為RF 輸入,得到模型的召回率分別為96.94%、99.74%、98.6%。在神經(jīng)網(wǎng)絡(luò)方面,劉亞朋[17]、O’shea 等[18]和Zhou 等[19]采用的1DCNN模型召回率分別為93.53%、95.9%、95.7%;Cao 等[20]采用的2DCNN 模型召回率為96.2%;Tsiouris 等[21]將時(shí)域和頻域特征作為簡(jiǎn)單3 層長(zhǎng)短期記憶人工神經(jīng)網(wǎng)絡(luò)模型LSTM的輸入,得到的召回率為99.28%。現(xiàn)有神經(jīng)網(wǎng)絡(luò)模型的召回率略低于RF,但其誤報(bào)率一般在0.1/h 內(nèi),而RF的誤報(bào)率一般為0.21~0.77/h。在實(shí)際應(yīng)用中,往往需要根據(jù)具體情況選擇輸入特征和分類器。
(4)模型評(píng)價(jià)。通常采用精確率(Precision)、召回率(Recall)和誤報(bào)率(False Discovery Rate)評(píng)價(jià)模型性能優(yōu)劣。
本文基于南京某醫(yī)院癲癇數(shù)據(jù)集,為醫(yī)患提供較為先進(jìn)的癲癇監(jiān)測(cè)方案,一方面幫助醫(yī)生全面了解患者病情,另一方面使患者對(duì)癲癇發(fā)作產(chǎn)生預(yù)警,以便及時(shí)采取醫(yī)療措施。本文的研究意義在于解決醫(yī)院現(xiàn)有數(shù)據(jù)集的癲癇預(yù)測(cè)問題,是機(jī)器學(xué)習(xí)相關(guān)技術(shù)應(yīng)用于國(guó)內(nèi)癲癇預(yù)測(cè)的實(shí)例;亮點(diǎn)在于該數(shù)據(jù)集與現(xiàn)有公開數(shù)據(jù)集差異較大,主要體現(xiàn)在數(shù)據(jù)量和數(shù)據(jù)處理方式上,同時(shí)本文方法集成了現(xiàn)有框架的優(yōu)勢(shì),具有一定泛用性。
采用南京某醫(yī)院收錄的采用立體定向腦波技術(shù)(SEEG)診斷與治療的癲癇患者腦電信號(hào)數(shù)據(jù),該數(shù)據(jù)集尚未公開。SEEG 是一種侵入式癲癇診斷與治療技術(shù),其通過微創(chuàng)外科手術(shù)將直徑為0.8mm的電極置入腦內(nèi)以實(shí)時(shí)監(jiān)測(cè)癲癇患者的腦電信號(hào),確定發(fā)病腦部區(qū)域?;颊咄ㄟ^SEEG 植入腦部電極后,需要住院24h 實(shí)時(shí)監(jiān)測(cè)腦電信號(hào),癲癇發(fā)作時(shí),射頻熱凝發(fā)生器會(huì)與目標(biāo)電極點(diǎn)接觸,即可對(duì)腦部相應(yīng)區(qū)域?qū)嵤崮讨委煟话阈枰委?~6 次?;谌说乐髁x原則,醫(yī)院一般不會(huì)要求患者為醫(yī)學(xué)研究提供額外的癲癇發(fā)作數(shù)據(jù),因此該數(shù)據(jù)集是本文的核心內(nèi)容。提取其中5 位患者的癲癇發(fā)作數(shù)據(jù),采樣頻率為2kHz,患者間植入電極數(shù)及其分布情況差異較大。除SEEG 信號(hào)數(shù)據(jù)外,臨床上通常輔以肌電圖診斷癲癇,這些數(shù)據(jù)也被記錄在文件中。5 位患者植入的電極數(shù)分別為117、127、84、81、110,電極空間分布為A~J 區(qū),每位患者相同區(qū)域的采集信號(hào)通道數(shù)有一定差異,這是由醫(yī)院硬件設(shè)備連接不穩(wěn)定造成的。數(shù)據(jù)集中記錄的癲癇發(fā)作次數(shù)分別為4 次、6 次、3 次、3 次、6 次。
信道采集的無效數(shù)據(jù)包括3 種情況:第一種是信道已被使用,但由于連接不穩(wěn)定或硬件設(shè)備損壞而產(chǎn)生無效數(shù)據(jù),該種數(shù)據(jù)的特征是在維持一段有效信息后振幅突然激增,并保持較長(zhǎng)時(shí)間,具體如圖1 所示;第二種是信道未在臨床中被使用,該種數(shù)據(jù)有高振幅、周期性波動(dòng)類型,也有高振幅、信號(hào)不連續(xù)類型,具體如圖2 所示;第三種是臨床用于輔助診斷的肌電信號(hào)數(shù)據(jù),與腦電數(shù)據(jù)不同的是,肌電數(shù)據(jù)往往是通過振幅體現(xiàn)肌電信號(hào)變化,且周期遠(yuǎn)小于正常腦電數(shù)據(jù),具體如圖3 所示。在正式處理數(shù)據(jù)之前,需要將這3 類數(shù)據(jù)剔除,降低有效數(shù)據(jù)的提取難度。
Fig.1 Invalid data caused by unstable channel connection圖1 信道連接不穩(wěn)定造成的無效數(shù)據(jù)
Fig.2 Invalid data caused by the channel not being used in the clinic圖2 信道未在臨床中使用造成的無效數(shù)據(jù)
Fig.3 Invalid data caused by EMG data for auxiliary diagnosis圖3 輔助診斷的肌電數(shù)據(jù)造成的無效數(shù)據(jù)
統(tǒng)計(jì)學(xué)三大相關(guān)系數(shù)分別為Pearson、Spearman 和Kendall,反映的都是兩個(gè)變量之間變化趨勢(shì)的程度及方向,數(shù)值范圍為-1~1,0 表示兩個(gè)變量不相關(guān),正值表示正相關(guān),負(fù)值表示負(fù)相關(guān),值越大表示相關(guān)性越強(qiáng)。
Pearson 相關(guān)系數(shù)有兩個(gè)假設(shè),一是兩個(gè)變量服從正態(tài)分布,通常采用t檢驗(yàn)確定相關(guān)系數(shù)的顯著性,二是兩個(gè)變量的標(biāo)準(zhǔn)差不為0。Pearson 相關(guān)系數(shù)的計(jì)算公式為:
式中,cov(X,Y)表示X、Y的協(xié)方差,σX σY表示X、Y標(biāo)準(zhǔn)差的乘積。
Spearman 和Kendall 相關(guān)系數(shù)適用于數(shù)據(jù)秩序相關(guān)的情況,本文研究的是相鄰?fù)ǖ篱g數(shù)據(jù)的相關(guān)性分布,更適合使用判斷兩個(gè)變量是否線性相關(guān)的Pearson 相關(guān)系數(shù)。將原始數(shù)據(jù)通道間的Pearson 系數(shù)值轉(zhuǎn)換成熱力學(xué)圖(heatmap),可以更加明顯地觀察到相鄰?fù)ǖ篱g具有統(tǒng)計(jì)學(xué)強(qiáng)相關(guān)性,具體如圖4(彩圖掃OSID 碼可見)所示。由于數(shù)據(jù)集的采樣頻率為2kHz,通道數(shù)均值為103.8,需要處理的數(shù)據(jù)量遠(yuǎn)高于現(xiàn)有公開數(shù)據(jù)集。為降低模型后續(xù)計(jì)算量,可將具有統(tǒng)計(jì)學(xué)強(qiáng)相關(guān)性的通道數(shù)據(jù)融合。此外,相關(guān)性的驗(yàn)證對(duì)于患者腦部電極接入位置和數(shù)量的確定具有一定參考價(jià)值。
Fig.4 Heatmap of Pearson coefficient between channels圖4 通道間Pearson 系數(shù)熱力學(xué)圖
特征提取的目的是從海量數(shù)據(jù)中提取有效信息,減少模型對(duì)無效信息的擬合,降低模型結(jié)構(gòu)維度,提升模型擬合速度,使醫(yī)院的硬件設(shè)備能夠滿足模型運(yùn)行需要?,F(xiàn)有特征提取方法多基于信道中一段時(shí)間的數(shù)據(jù)進(jìn)行,稱為時(shí)間窗口,通常為5s,移動(dòng)步長(zhǎng)為1s,以提前15min 預(yù)測(cè)癲癇發(fā)作為目標(biāo),也即本文采用的時(shí)間窗口和移動(dòng)步長(zhǎng)大小。這兩個(gè)值實(shí)際上基于癲癇預(yù)測(cè)的準(zhǔn)確性和實(shí)時(shí)性作出的平衡性選擇,并不一定是最優(yōu)解。常用特征提取方法及相關(guān)特征如表1 所示。
Table 1 Time domain and frequency domain feature extraction methods and their characteristics表1 時(shí)域、頻域特征提取方法及其特征
二分類模型的損失函數(shù)一般選擇交叉熵?fù)p失函數(shù)(binary_crossentropy),計(jì)算公式為:
由上式可知,如果樣本類型不平衡,如正樣本數(shù)過少,模型便會(huì)默認(rèn)將所有樣本識(shí)別為負(fù)樣本,擬合結(jié)果的loss值就會(huì)很低,這樣顯然不符合實(shí)際應(yīng)用需求。因此,在對(duì)樣本進(jìn)行分類時(shí)需將正負(fù)樣本的比例設(shè)置為1,最大程度地發(fā)揮模型的擬合性能。癲癇發(fā)作是一個(gè)短暫過程,一般患者住院7 天能監(jiān)測(cè)到的癲癇發(fā)作次數(shù)為3~6 次,每次發(fā)作時(shí)間為30~75s,樣本數(shù)極低。因此,本文采用欠采樣的方式,以保證正樣本/負(fù)樣本=10。這個(gè)比值是綜合考慮模型性能得出的一個(gè)較優(yōu)解,該值過大可能會(huì)導(dǎo)致模型擬合失敗,過小會(huì)導(dǎo)致擬合程度不夠。
XGBoost 采用泰勒二階展開近似代價(jià)函數(shù),使其能夠自定義損失函數(shù),擬合能力更強(qiáng),其還采用L2 范式和列采樣抑制過擬合。LightGBM 相較于XGBoost 具有訓(xùn)練速度快、內(nèi)存占用率低的特點(diǎn),可視為XGBoost的優(yōu)化解,優(yōu)化了模型運(yùn)算量、內(nèi)存消耗等,這是由于LightGBM 采用了直方圖算法和帶深度限制的Leaf-wise的葉子生長(zhǎng)策略。然而,內(nèi)存消耗的降低和計(jì)算效率的提升帶來了一定程度的準(zhǔn)確率降低,這是由于特征被離散化,但在梯度提升(Gradient Boosting)的框架下沒有太大影響。
XGBoost 和LightGBM 是目前機(jī)器學(xué)習(xí)領(lǐng)域泛用性最強(qiáng)、應(yīng)用最多、效果最好的分類器。癲癇數(shù)據(jù)集的數(shù)據(jù)量較大,因此選擇LightGBM 作為分類器。
本文建立的算法流程如圖5 所示,分為數(shù)據(jù)處理、模型訓(xùn)練和預(yù)測(cè)結(jié)果輸出3 個(gè)階段。數(shù)據(jù)處理階段將無效信息篩出,通過特征提取提升樣本有效信息比例,減少計(jì)算量并對(duì)正負(fù)樣本比進(jìn)行平衡;模型訓(xùn)練采用五折交叉驗(yàn)證法,最后采用投票法輸出模型預(yù)測(cè)結(jié)果。
Fig.5 LightGBM five-fold cross-validation algorithm flow圖5 LightGBM 五折交叉驗(yàn)證算法流程
對(duì)每位患者的數(shù)據(jù)單獨(dú)進(jìn)行五折交叉訓(xùn)練,得到基模型的準(zhǔn)確率如表2 所示。投票法結(jié)果表明,5 位患者的數(shù)據(jù)均達(dá)到召回率100%,誤報(bào)率為0h-1的效果。測(cè)試集的選取是在單獨(dú)某次發(fā)作或樣本數(shù)量不足的情況下,加入某段相對(duì)獨(dú)立的發(fā)作信息而來,即測(cè)試集的樣本即使和某次發(fā)作出自同一時(shí)間段,樣本內(nèi)所含時(shí)間步長(zhǎng)也未經(jīng)過模型訓(xùn)練。
Table 2 Accuracy of LightGBM-based model training set表2 LightGBM 基模型訓(xùn)練集準(zhǔn)確率 單位:%
模型在測(cè)試集得到的結(jié)果如表3 所示,測(cè)試集的平均召回率為84.18%,誤報(bào)率為0.57/h。以上結(jié)果是基于每秒進(jìn)行一次模型輸出得出,在實(shí)際應(yīng)用中,往往可以通過一定時(shí)間段內(nèi)的模型輸出結(jié)果綜合確定癲癇是否發(fā)作。模型的誤報(bào)主要集中在發(fā)作前15~25min 內(nèi),可能是由于類別間的劃分間隙不夠明確,位于類別邊緣的點(diǎn)容易造成分類的誤報(bào)和漏報(bào),可通過更加準(zhǔn)確地選取分類標(biāo)簽來改善。
Table 3 LightGBM test set results表3 LightGBM 測(cè)試集結(jié)果
結(jié)合現(xiàn)有癲癇發(fā)作預(yù)測(cè)的研究成果,本文選擇癲癇數(shù)據(jù)集的時(shí)域和頻域特征,融合強(qiáng)統(tǒng)計(jì)學(xué)相關(guān)的通道間數(shù)據(jù),以LightGBM 作為分類器,得到測(cè)試集的平均召回率為84.18%,誤報(bào)率為0.57/h,說明本文方法能較好地解決現(xiàn)有癲癇數(shù)據(jù)集的分類問題。然而,本文僅針對(duì)每個(gè)患者單獨(dú)進(jìn)行建模且要求其至少有1~2 次有記錄的癲癇發(fā)作,距離醫(yī)院實(shí)際應(yīng)用,即找到患者統(tǒng)一的癲癇發(fā)作模式仍有許多工作要做。