李冬梅,爾西丁·買(mǎi)買(mǎi)提,楊日東,陳子怡,田翔華,董楠,張洋,周毅,△
(1.新疆醫(yī)科大學(xué)研究生學(xué)院,新疆烏魯木齊830011;2.新疆醫(yī)科大學(xué)第一附屬醫(yī)院神經(jīng)內(nèi)科,新疆烏魯木齊830011;3.中山大學(xué)中山醫(yī)學(xué)院生物醫(yī)學(xué)工程系,廣東廣州510080;4.中山大學(xué)附屬第一醫(yī)院神經(jīng)內(nèi)科,廣東 廣州510080)
癲癇是由腦部神經(jīng)細(xì)胞群高度同步化異常放電引起的慢性神經(jīng)系統(tǒng)綜合癥[1]。其發(fā)作可能會(huì)引起患者認(rèn)知障礙、驚厥、受傷甚至死亡[2],是老年癡呆、中風(fēng)之后的第三大神經(jīng)系統(tǒng)疾?。?]。據(jù)調(diào)查,全球約有0.7%的人口患有癲癇[4]。盡管很多患者可以通過(guò)臨床藥物治療對(duì)疾病進(jìn)行有效控制,但仍有大約30%的患者是對(duì)藥物無(wú)直接反應(yīng)的[5],對(duì)于藥物無(wú)法控制其發(fā)作的癲癇患者,目前可使其痊愈的唯一手段是手術(shù)切除致癇灶,而手術(shù)成功的關(guān)鍵在于對(duì)致癇灶的精準(zhǔn)定位。
腦電圖(electroencephalogram,EEG)長(zhǎng)期記錄了大腦的電生理活動(dòng)[6],具有明顯的非平穩(wěn)性和非線性特征[7],在神經(jīng)系統(tǒng)疾病的診斷中具有非常重要的作用。目前臨床上對(duì)致癇灶的定位多采用腦電信號(hào)與影像學(xué)相結(jié)合的方法,EEG信號(hào)具有較高的時(shí)間分辨率,影像學(xué)(functionalmagnetic resonance imaging,fMRI)則具有較高的空間分辨率,二者相結(jié)合就能準(zhǔn)確的定位出致癇灶的位置[8-9]。然而,臨床腦電信號(hào)主要是基于人工判斷、診療水平由醫(yī)生理論知識(shí)和經(jīng)驗(yàn)的限制[10],通過(guò)大面積開(kāi)顱采集腦電信號(hào)不僅會(huì)對(duì)患者造成很大的傷害,也會(huì)對(duì)資源造成浪費(fèi)。致癇灶一般只有幾平方厘米,大面積開(kāi)顱無(wú)疑也采集了大量無(wú)利用價(jià)值的腦電數(shù)據(jù),能否在盡量降低對(duì)患者損傷的基礎(chǔ)上采集到有價(jià)值的腦電數(shù)據(jù)是目前亟待解決的問(wèn)題。因此,本研究提出一種基于PCA的方法分析患者頭皮腦電數(shù)據(jù)來(lái)進(jìn)行初定位的方法,達(dá)到初步確定致癇灶大致位置的目的,臨床可以在此基礎(chǔ)上通過(guò)小面積開(kāi)顱來(lái)采集高質(zhì)量腦電數(shù)據(jù)進(jìn)行精準(zhǔn)定位,這樣既減少了對(duì)患者造成的損傷,也節(jié)省了臨床醫(yī)療資源。
本研究提出了基于多特征指標(biāo)的癲癇致癇灶定位方法。首先,選取 Hurst指數(shù)、Lyapunov指數(shù)、樣本熵、排列熵、小波熵五個(gè)特征向量來(lái)表示腦電信號(hào)的非線性特征,并對(duì)特征向量進(jìn)行PCA降維處理,將處理后的特征值輸入已構(gòu)建好的分類器中,對(duì)腦電信號(hào)進(jìn)行準(zhǔn)確分類;其次,將已分類好的正常腦電信號(hào)結(jié)合醫(yī)學(xué)統(tǒng)計(jì)的置信區(qū)間,構(gòu)建醫(yī)學(xué)參考值范圍;最后,將癲癇腦電信號(hào)輸入醫(yī)學(xué)參考值范圍,觀察各導(dǎo)聯(lián)的數(shù)值變化程度,并將結(jié)果進(jìn)行可視化處理。
EEG信號(hào)是一種非線性時(shí)間序列。為了能更好地提取出腦電信號(hào)的特征,本研究選擇常見(jiàn)的非線性動(dòng)力學(xué)指標(biāo)(Hurst指數(shù)、Lyapunov指數(shù)、排列熵、樣本熵、小波熵)對(duì)腦電信號(hào)進(jìn)行處理分析,現(xiàn)將指標(biāo)介紹如下:
(1)Hurst指數(shù):由英國(guó)水文學(xué)家 Hurst提出的基于時(shí)間序列分析的指標(biāo),其可作為在混沌和分形學(xué)科中判斷時(shí)間序列混沌性的統(tǒng)計(jì)參數(shù),它能很好的揭示出時(shí)間序列中的趨勢(shì)性,常被用于定量刻畫(huà)時(shí)間序列的長(zhǎng)程相關(guān)性[11]。
(2)Lyapunov指數(shù):可定量描述相鄰點(diǎn)相互分離的快慢或混沌吸引子中軌道分離的快慢,它表征了相空間中鄰近軌道間收斂或發(fā)散的平均指數(shù)增長(zhǎng)率。在對(duì)信號(hào)的非線性混沌度進(jìn)行定量分析時(shí),通過(guò)Lyapunov指數(shù)可以表征大腦活動(dòng)不同狀態(tài)下的特征。研究表明,Lyapunov指數(shù)對(duì)于部分性發(fā)作癲癇病人EEG信號(hào)的動(dòng)力學(xué)特征具有很好的描述能力[12]。
(3)排列熵(permutation Entropy,PE):一種新的衡量時(shí)間序列復(fù)雜度的非線性動(dòng)力學(xué)特征指標(biāo)。計(jì)算時(shí)間序列復(fù)雜度方面該指標(biāo)與Lyapunov指數(shù)相似,但與Lyapunov指數(shù)相比,排列熵具有計(jì)算簡(jiǎn)潔、數(shù)據(jù)量小、抗噪能力強(qiáng)等特點(diǎn),在非線性動(dòng)力學(xué)應(yīng)用方面有良好的特性[13-14]。
(4)樣本熵(sample entropy,SampEn):由 Richman和Moornan提出的一種新的時(shí)間序列復(fù)雜性測(cè)度方法。可用于測(cè)量?jī)蓚€(gè)新信息發(fā)生的條件率。樣本熵是一種與近似熵類似,但精度更好,可降低近似熵的誤差。
(5)小波熵(wavelet entropy,WE):由于人的大腦在不同狀態(tài)時(shí)EEG也會(huì)在不同頻段上產(chǎn)生能量的變化,小波熵就可以反映出這些變化。時(shí)間序列由小波分解信號(hào)后計(jì)算得出的熵值。小波熵是對(duì)隨機(jī)信號(hào)無(wú)序程度的一種測(cè)量[15],可用于估計(jì)EEG的復(fù)雜程度。
主成分分析(principal component analysis,PCA)是一種將多指標(biāo)問(wèn)題轉(zhuǎn)化為較少的綜合指標(biāo)的重要統(tǒng)計(jì)方法[16],它使我們能夠使用少量的綜合指標(biāo)(這是相互不相關(guān)的)提供最原始的指標(biāo)信息,而且還可以更方便快捷地解決問(wèn)題。腦電信號(hào)具有非平穩(wěn)性的特點(diǎn)[7],導(dǎo)聯(lián)之間關(guān)聯(lián)性大,且極易受噪聲干擾。PCA作為多維數(shù)據(jù)分析常用的方法,既能除去腦電信號(hào)不同類別之間的相關(guān)性,也可同時(shí)處理多導(dǎo)聯(lián)的腦電信號(hào),從而簡(jiǎn)化腦電信號(hào)的分析處理。因此,利用主成分分析對(duì)腦電信號(hào)進(jìn)行特征提取具有獨(dú)特的效果。
假設(shè)m個(gè)變量X1,X2,…,Xm的n次提取數(shù)據(jù)矩陣為X=(Xpq)n×m。由于處理分析得到的數(shù)據(jù)的單位和數(shù)量級(jí)之間的差異,數(shù)據(jù)處理應(yīng)規(guī)范化。其主要步驟如下:
(1)計(jì)算各個(gè)指標(biāo)的樣本均值與標(biāo)準(zhǔn)差
(2)對(duì)Xpq進(jìn)行標(biāo)準(zhǔn)化處理,計(jì)算其標(biāo)準(zhǔn)化矩陣
(3)依據(jù)所得的標(biāo)準(zhǔn)化矩陣Y=(Ypq)n×m,計(jì)算其相關(guān)系數(shù)矩陣R
(5)建立主成分方程,可得前K個(gè)主成分的樣本值
隨著人工智能的發(fā)展,機(jī)器學(xué)習(xí)被越來(lái)越多地應(yīng)用于經(jīng)濟(jì)學(xué)、生態(tài)學(xué)等領(lǐng)域[16-17]。隨機(jī)森林最早在2001年由 Leo Breiman和 Adele Culter提出[18],隨機(jī)森林由許多的決策樹(shù)構(gòu)成,由于決策樹(shù)是由隨機(jī)方法構(gòu)成的,也稱為隨機(jī)決策樹(shù),具有很高的預(yù)測(cè)精度與學(xué)習(xí)能力。其基本思想是:對(duì)訓(xùn)練數(shù)據(jù)進(jìn)行隨機(jī)采樣,隨機(jī)構(gòu)建一片森林,在這片森林中每棵樹(shù)就是一個(gè)決策樹(shù)(每棵決策樹(shù)是相互獨(dú)立的);當(dāng)測(cè)試樣本進(jìn)入隨機(jī)森林時(shí),森林中的每個(gè)樹(shù)分別判斷,并進(jìn)行投票。隨機(jī)森林的決策結(jié)果是所有決策樹(shù)分類結(jié)果的集成,通常隨機(jī)森林會(huì)選擇投票數(shù)最多的分類結(jié)果作為最終結(jié)果。
隨機(jī)森林算法中的樣本與決策樹(shù)均為隨機(jī)選取。將每棵決策樹(shù)的“投票”分類結(jié)果進(jìn)行集成,可以確保結(jié)果的穩(wěn)定性與客觀性;并且隨機(jī)森林不需要人為參與地設(shè)置每個(gè)節(jié)點(diǎn)閾值,完全由算法自動(dòng)實(shí)現(xiàn)對(duì)每棵決策樹(shù)的生長(zhǎng)與修剪過(guò)程,最大限度地避免了人為因素對(duì)最終結(jié)果的干擾。
實(shí)驗(yàn)數(shù)據(jù)來(lái)自于新疆醫(yī)科大學(xué)第一附屬醫(yī)院神經(jīng)科腦電圖室,采樣頻率均為200 Hz,對(duì)12例顳葉癲癇患者腦電數(shù)據(jù)進(jìn)行研究。實(shí)驗(yàn)采用數(shù)據(jù)均為19導(dǎo)頭皮腦電數(shù)據(jù),采集后由臨床腦電圖儀進(jìn)行預(yù)處理后存儲(chǔ)于醫(yī)院數(shù)據(jù)庫(kù)中,因此可直接將其進(jìn)行研究。
首先,構(gòu)建分類器,隨機(jī)選取1病例的腦電數(shù)據(jù)進(jìn)行特征值提取,將得到的多個(gè)特征值進(jìn)行PCA降維處理后,隨機(jī)選取訓(xùn)練集數(shù)據(jù)輸入到分類器構(gòu)建的分類器算法。
構(gòu)建好分類器后,將剩余的11例數(shù)據(jù)作為測(cè)試集數(shù)據(jù)輸入到構(gòu)建好的分類器中,進(jìn)行分類,得到分類結(jié)果。
綜合降維后的特征向量,計(jì)算其在不同時(shí)期特征向量,得到描述頭皮各電極腦電數(shù)據(jù)的復(fù)雜度和各電極動(dòng)力學(xué)變化程度,從而找出動(dòng)力學(xué)變化最明顯的區(qū)域,以此實(shí)現(xiàn)對(duì)致癇灶的初定位。
4.3.1 分類效果 對(duì)特征值進(jìn)行PCA分析,提出主要成分的向量,并將向量進(jìn)行綜合計(jì)算。將綜合的特征值也進(jìn)行分類,并與單一特征值的分類效果進(jìn)行比較。圖中x軸表示不同特征值,y軸表示分類器的分類準(zhǔn)確率,從圖1中可以看出,綜合的特征值的分類效果均比單一特征值的分類效果好,綜合的分類準(zhǔn)確率在90%以上;熵類的特征值(SampEn,Mpe,Wavelet)分類效果較非熵類(Lyapunov,Hurst)而言,準(zhǔn)確率略高。
圖1 PCA降維后綜合特征值與單一特征值的分類結(jié)果Fig 1 The results of the classification of the PCA dimension reduction and the single feature value
為了進(jìn)一步驗(yàn)證綜合特征向量與單一特征向量分類準(zhǔn)確率的優(yōu)劣,本研究采用受試者工作特征曲線(receiver operating characteristic curve,ROC曲線)作為診斷試驗(yàn)性能的評(píng)價(jià),其經(jīng)過(guò)轉(zhuǎn)變?cè)\斷閾值,得到多對(duì)真(假)陽(yáng)性率值。以假陽(yáng)性率(1-特異性)作為橫坐標(biāo),真陽(yáng)性率(敏感度)作為縱坐標(biāo),繪制ROC曲線,曲線下面積(area under curve,AUC)反映診斷試驗(yàn)的綜合精度。本研究將各特征值的分類結(jié)果導(dǎo)入 SPSS,繪制 ROC曲線并計(jì)算 AUC值,其AUC值分別為 0.719,0.742,0.807,0.815,0.86,0.937,均顯著大于隨機(jī)分布模型的AUC值(0.5),見(jiàn)圖2,其中PCA綜合特征值分類結(jié)果的AUC值最大,說(shuō)明它可以更加準(zhǔn)確地對(duì)腦電信號(hào)進(jìn)行分類。經(jīng)統(tǒng)計(jì)檢驗(yàn),除PCA綜合特征值與其他單一特征值之間差異顯著,其他單一特征值均兩兩之間差異不顯著(P>0.05);且熵類特征向量對(duì)應(yīng)的AUC值均大于非熵類的AUC值。
圖2 PCA降維后綜合特征值與單一特征值分類結(jié)果的ROC曲線圖Fig 2 ROC curve chart of the resultsof PCA dimension reduction and single feature value classification
4.3.2 致癇灶初步定位 若正常腦電數(shù)據(jù)計(jì)算的特征值服從正態(tài)分布,利用醫(yī)學(xué)統(tǒng)計(jì)的置信區(qū)間,則可以用這些特征值構(gòu)建一個(gè)醫(yī)學(xué)參考值范圍,一旦某段數(shù)據(jù)的特征值偏離了醫(yī)學(xué)參考值范圍,就有理由相信該段數(shù)據(jù)不是正常的腦電數(shù)據(jù)。將某導(dǎo)聯(lián)在發(fā)作過(guò)程中的特征值放入對(duì)應(yīng)導(dǎo)聯(lián)的醫(yī)學(xué)參考值范圍,偏離的數(shù)據(jù)段越多、偏離得越遠(yuǎn),則認(rèn)為該導(dǎo)聯(lián)的動(dòng)力學(xué)變化越明顯,以此來(lái)定量衡量各導(dǎo)聯(lián)動(dòng)力學(xué)變化的程度。
因此,先對(duì)正常腦電數(shù)據(jù)計(jì)算的特征值驗(yàn)證其正態(tài)性。選取100段正常腦電數(shù)據(jù)的特征值,對(duì)其進(jìn)行正態(tài)性檢驗(yàn),觀察是否具有正態(tài)性。結(jié)果見(jiàn)表1。
表1 正態(tài)性檢驗(yàn)結(jié)果Table 1 Test results of normality
由于所選樣本為小樣本數(shù)據(jù)(小于2000),因此選取S-W檢驗(yàn),并且當(dāng)P>0.1時(shí)認(rèn)為樣本服從正態(tài)分布,所以本研究認(rèn)為正常腦電數(shù)據(jù)的特征值服從正態(tài)分布。隨后取其均值μ和標(biāo)準(zhǔn)差s,構(gòu)建95%的置信區(qū)間;將患者發(fā)作過(guò)程中的腦電數(shù)據(jù)計(jì)算得來(lái)的特征值放入到已構(gòu)建好的置信區(qū)間之內(nèi),篩選出每個(gè)導(dǎo)聯(lián)上位于正常范圍以外的數(shù)據(jù)段,并計(jì)算所有數(shù)據(jù)段偏離置信區(qū)間的距離之和,將結(jié)果進(jìn)行可視化處理,觀察各導(dǎo)聯(lián)的顏色深淺程度。見(jiàn)圖3,圖中右側(cè)彩色條的顏色隨著數(shù)值的增大顏色逐漸加深,左側(cè)的圖中顯示出各導(dǎo)聯(lián)的位置及數(shù)值對(duì)應(yīng)顏色的變化。圖中可以看出,T5導(dǎo)聯(lián)顏色深度明顯。
圖3 各導(dǎo)聯(lián)特征值的變化Fig 3 Changes in the characteristics of the lead
以顏色最深的導(dǎo)聯(lián)為圓心,取偏離程度最大的兩個(gè)導(dǎo)聯(lián)中間位置為半徑進(jìn)行畫(huà)圓,將該區(qū)域和致癇灶一同置于大腦地形圖中,見(jiàn)圖4,深黑色代表動(dòng)力學(xué)變化最明顯的電極,綠色圓區(qū)域?yàn)橛缮詈谏姌O確定的初定位區(qū)域,紅色圓點(diǎn)代表致癇灶所在位置。由圖可見(jiàn),對(duì)顳葉癲癇患者初定位的區(qū)域都包含了臨床確診的病灶區(qū)域,則對(duì)該患者的初步定位成功。
圖4 致癇灶初步定位Fig 4 Initial location of epileptic foci
依據(jù)此方法,對(duì)12位癲癇病例進(jìn)行了初步致癇灶定位(見(jiàn)圖5)。由圖4可以看出,臨床診斷出的致癇灶確切位置與我們計(jì)算出的動(dòng)力學(xué)變化最明顯的電極最接近,這也說(shuō)明了利用PCA這一抗噪性強(qiáng)的非線性綜合特征指標(biāo)來(lái)對(duì)頭皮腦電信號(hào)進(jìn)行分析是可行的。
圖5 12位癲癇病例初步致癇灶定位Fig 512 epilepsy cases of epileptic foci
在本研究中,主成分分析被用來(lái)提取EEG信號(hào)的非線性特征指標(biāo),并將隨機(jī)森林運(yùn)用于癲癇腦電信號(hào)的分類中。在對(duì)腦電信號(hào)進(jìn)行分類的過(guò)程中,采用了一種新的綜合性特征指標(biāo),這種指標(biāo)從多個(gè)角度對(duì)腦電信號(hào)進(jìn)行了分析及綜合,并與醫(yī)學(xué)統(tǒng)計(jì)學(xué)相結(jié)合,對(duì)部分性癲癇患者的致癇灶進(jìn)行了初步的定位,成功對(duì)12位癲癇患者進(jìn)行了初定位。此方法能快速、敏感地提取出腦電信號(hào)中重要的信息,具有較好的抗噪和抗干擾能力,為臨床上建立局灶性癲癇病灶部位的搜索模型提供了理論基礎(chǔ)。
目前,對(duì)于可以采用手術(shù)切除致癇灶來(lái)進(jìn)行治療的患者,如何在盡量降低患者損傷的基礎(chǔ)上準(zhǔn)確的定位出致癇灶所在位置成為手術(shù)治療的關(guān)鍵。本研究將非線性動(dòng)力學(xué)與醫(yī)學(xué)統(tǒng)計(jì)學(xué)相結(jié)合,多方位地對(duì)癲癇腦電信號(hào)進(jìn)行分析研究,很有可能為臨床上定位致癇灶開(kāi)辟一條新的路徑,通過(guò)對(duì)癲癇患者無(wú)損的頭皮腦電信號(hào)進(jìn)行初定位,在此基礎(chǔ)上通過(guò)臨床小面積開(kāi)顱,采集高質(zhì)量腦電數(shù)據(jù)進(jìn)行精準(zhǔn)定位,不僅減少了對(duì)患者造成的損傷,也節(jié)省了臨床醫(yī)療資源。