王 婷,石 藍,黃 瑋,張子辰
(江蘇信息職業(yè)技術(shù)學院,江蘇 無錫 214000)
癲癇是一種常見的神經(jīng)系統(tǒng)疾病。目前,被癲癇疾病影響的人數(shù)全球超過5 000萬人[1]。頭皮電極獲得的腦電圖(EEG)、磁共振成像和計算機斷層掃描等影像技術(shù)結(jié)合使用,是癲癇診斷的常規(guī)方式[2]。在傳統(tǒng)的癲癇檢測中,醫(yī)學專家觀察腦電圖是否包含癲癇特征波,這種方法不僅耗時,而且高度主觀依賴經(jīng)驗。腦電圖中存在的大量噪聲可能會干擾專家的判斷。設(shè)計腦電的可穿戴式檢測芯片的算法,可以自動檢測患者的癲癇發(fā)作情況,從而高效地協(xié)助醫(yī)生進行診斷。
在癲癇信號特征提取階段,為了達到良好的特征區(qū)分和數(shù)據(jù)降維效果,國內(nèi)外已經(jīng)進行了多種提取方式的探索?;诮?jīng)驗?zāi)B(tài)分解的變分模態(tài)分解主要思想是將信號分解為圍繞各中心頻率附近變化的窄帶變分模態(tài)分量,通過尋找約束變分模型的最優(yōu)解來自適應(yīng)獲取變分模態(tài)函數(shù)(VMF)。發(fā)作期腦電的不確定度會明顯降低,出現(xiàn)了許多與熵(En)有關(guān)的腦電特征提取研究方法,主要包括近似熵、樣本熵、模糊熵[3-4]。精細復合多尺度散布熵是在散布熵的基礎(chǔ)上對信號進行多尺度量化得到的,避免了原始散布熵因僅在單一尺度上處理信號而出現(xiàn)的復雜性導致特征提取不完全等問題[5]。
雖然已有許多特征提取方法和分類方法運用于癲癇檢測中,但大多是針對癲癇發(fā)作期腦電與正常腦電的二分類。而對于癲癇患者不發(fā)作時進行的檢測也是有必要的,即發(fā)作間期的檢測。發(fā)作期間的腦電圖通常也可見異常的癲癇樣放電。因此,本文主要研究正常時期、發(fā)作間期與癲癇發(fā)作期3類腦電信號的檢測。發(fā)作間期的腦電圖部分由慢波化組成,若基本節(jié)律中混有較多的慢波,則形成不規(guī)則的腦電圖。針對發(fā)作間期的背景節(jié)律性特點,本文提出一種基于變分模態(tài)分解的癲癇檢測算法。EEG信號經(jīng)VMD分解后獲得變化中心頻率的VMF,對VMF進行能量分離,加強慢波、棘波等特征,再二次提取其均值、方差和RCMDE 3種特征,并利用隨機森林對其進行分類,完成了正常腦電信號、發(fā)作間期與癲癇發(fā)作期的3分類。通過與文獻方法對比,本研究驗證了該方法提取EEG信號的有效性。
圖1為本文提出的基于變分模態(tài)分解的癲癇腦電信號檢測算法的流程圖。本方法包括如下4個步驟:(1)對腦電信號數(shù)據(jù)集進行VMD分解,分解為有不同中心頻率和帶限的固有模式函數(shù)多個子模態(tài);(2)對子模態(tài)進行能量分離,增強信號瞬態(tài)沖擊成分;(3)經(jīng)過能量分離后的信號二次特征提取其均值、方差和RCMDE;(4)將提取的特征輸入隨機森林進行分類。
圖1 癲癇檢測流程
變分模態(tài)分解是自適應(yīng)、完全非遞歸的數(shù)據(jù)處理方法。它是根據(jù)當前數(shù)據(jù)來確定信號序列的模態(tài)分解個數(shù),可以自適應(yīng)對每種模態(tài)的最佳中心頻率和有限帶寬進行變化,有效地對固有模態(tài)分量進行分解。它的核心思想是構(gòu)建和求解變分問題。由于EEG測試時間以及被測樣本的不同,各頻帶段中心頻率也會發(fā)生小范圍的改變,VMD并不是固定的中心頻率,而是將EEG信號分解成在中心頻率附近的變分模態(tài)分量,不斷迭代的中心頻率可以良好表達這種神經(jīng)活動的輕微變化。VMD 算法中懲罰因子可以保證高斯噪聲環(huán)境下信號重構(gòu)的準確性,其值過大會引起模態(tài)重疊,較小會引入噪聲,默認將其設(shè)定為2 000。分解模態(tài)個數(shù)K對序列分解和預測精度都有較大影響,若K值過大會造成過分解,產(chǎn)生無用分量,高頻模式過多,增加計算復雜度。若 K 值過小,序列將不會完全分解,使部分帶限信號分解不出來造成原信號信息的丟失,進而影響分析結(jié)果。腦電信號的癲癇異常信息大多在25 Hz以下,根據(jù)中心頻率觀察法選取分解模態(tài)個數(shù)K=4。對數(shù)據(jù)集A010、D010、E010前1 000個數(shù)據(jù)進行VMD分解,癲癇信號特征波主要集中出現(xiàn)在子頻帶 VMF2~VMF4內(nèi)。故在后續(xù)的特征提取工作中,僅分析 VMF2~VMF4頻帶內(nèi)的腦電信號。
Teager能量算子是一個非線性算子,可以對被測信號相鄰的3個采樣點進行計算,具備優(yōu)良的時間分辨率,計算過程簡單快速,能夠增大癲癇波特征頻率的倍數(shù)。對正常腦電信號數(shù)據(jù)集中的A010、癲癇發(fā)作間期D010 以及癲癇發(fā)作期E010 經(jīng)VMD分解后,將VMF2~VMF4 頻帶信號進行Teager 非線性能量算子計算后,正常腦電信號的Teager能量較為平緩,在0~700 μA范圍內(nèi)波動。癲癇發(fā)作間期,腦電信號的間歇性突增最高達7 000 μA。癲癇發(fā)作期時,能量在棘波處波動非常劇烈,可達2×105μA。經(jīng)過Teager能量分離后,3種EEG信號的特征更加明顯,其中每組信號的四頻帶信號最為敏感,所以只選取正常EEG、發(fā)作間期EEG、發(fā)作期EEG的四頻帶的能量作為后續(xù)二次特征提取。
根據(jù)以上分析,信號經(jīng)能量分離后的四頻帶能量包含腦電信息的重要組成部分,接下來將對四頻帶能量進行二次特征提取,分別提取均值、方差與精細復合多尺度散布熵。RCMDE用來表征TEOV4時間序列的復雜性,人腦非致癇區(qū)域的神經(jīng)活動相對致癇區(qū)域更活躍,通過RCMDE可以更好地觀測EEG的規(guī)則性和組織性,計算 RCMDE 需要對4個參數(shù)分別設(shè)置:類別個數(shù)c,嵌入維度m,時間延遲d以及尺度因子τ。類別個數(shù)c若過大會導致具有較大差異的兩個量被歸為同一類,過小則導致具有較小差異的兩個量被歸為不同類,此處將c值設(shè)為 6。對于嵌入維度m,為了保證統(tǒng)計可靠性,將m值設(shè)為 3。時間延遲d一般取 1,本文尺度因子τ設(shè)為 10,即每個數(shù)據(jù)段提取10個尺度上的 RCMDE 值。利用RCMDE計算能量算子結(jié)果如圖2所示。
圖2 不同EEG的RCMDE
患者在癲癇發(fā)作期間產(chǎn)生的棘波和尖波等波形具有節(jié)律性,在0~10時間尺度上,正常EEG的RCMDE都要大于癲癇患者EEG的RCMDE,發(fā)作間期的腦電信號幅值變化最小。在腦電圖中的潛在的腦電模式未知的情況下,相關(guān)的時間尺度也是未知的。通過RCMDE將腦電信號擴展到10個時間尺度,有利于在時間尺度未知時提供特殊的觀察視角。有可能某一時間尺度上,正常腦電信號的熵值與癲癇信號的熵值接近,但在其他時間尺度則會有明顯差別。RCMDE可以增加癲癇判斷容錯率,進一步利于構(gòu)建后續(xù)腦電信號分類模型。
隨機森林算法(Random Forest,RF)基本單元是決策樹。每棵樹都可以視為單個分類器,分類輸出由所有決策樹投票。RF通過自助抽樣和隨機子空間,能夠?qū)Χ嗑S度、多特征的數(shù)據(jù)進行快速分析以及提高分類性能,將提取的三維特征作為隨機森林輸入,首先假設(shè)N為訓練集中的事例數(shù),則從訓練集中隨機抽取N個樣本,有放回在每個樣本過程和獲取的N個訓練樣本中。從m個特征變量中隨機等概率抽取d個子變量,這些子變量組成此節(jié)點的分裂特征變量子集,然后利用基尼系數(shù)值最小原則選擇一個最優(yōu)的分裂特征變量繼續(xù)對該節(jié)點分裂,建立多個決策樹組合為隨機森林。針對測試的數(shù)據(jù)集,每個決策樹都會得到一個分類結(jié)果,對這些結(jié)果進行投票表決,得票數(shù)最多的分類結(jié)果為最終決策。
實驗數(shù)據(jù)來自德國Born癲癇腦電研究室。此數(shù)據(jù)集中共包含標號從 A~E的 5個子數(shù)據(jù)集,每個子數(shù)據(jù)集均包括100個腦電信號。每個腦電信號的長度為 23.6 s,采樣頻率為 173.6 Hz。
由于EEG是非線性和非穩(wěn)態(tài)的信號,傳統(tǒng)的頻域分析方法只能揭示EEG信號的整體特征。而癲癇的特征波可能會在瞬間出現(xiàn)。為了捕捉腦電信號的瞬時行為,本研究通過使用VMD將原始EEG信號分解為4個數(shù)量的子模態(tài)。子模態(tài)中的癲癇特征信息此時仍然受背景噪聲的干擾,沖擊成分不明顯,采用能量分離對癲癇特征起到增強的作用。為了減少運算,本研究選擇最敏感的能量分布TEOV4作為后續(xù)提取特征。在TEOV4中提取均值、方差和RCMDE3類數(shù)據(jù)特征作為后續(xù)隨機森林的分類特征。隨機森林的分類性能與決策樹的數(shù)量有關(guān),當樹的數(shù)量少于100棵時,誤差會迅速減少,而當樹的數(shù)量大于250棵時,誤差會保持溫和的浮動。因此,在接下來的實驗中,隨機森林的決策樹數(shù)量被設(shè)定為250棵。
在腦電信號數(shù)據(jù)集中,隨機抽取70%的腦電信號作為訓練集,30%作為測試集,隨機森林中包含250棵決策樹。表1顯示了分類器的準確度 (ACC)、靈敏度 (SEN)和特異性 (SPE)3個評價指標。
表1 與其他算法結(jié)果對比
本文針對正常EEG、發(fā)作間期EEG、發(fā)作期EEG進行三分類,而表中兩種算法是針對發(fā)病與非發(fā)病的二分類研究。Acharya 等[6]采用熵等23個特征進行腦電分類獲得87.93%準確度,Bhattacharyya 等[7]基于可調(diào)Q小波變換提取多元模糊熵方法對腦電信號處理獲得了84.67%準確率。實驗結(jié)果表明,本文算法在ACC、SEN、SPE都在一定程度有所提升,證明該方法對于腦電信號分析具有可行性。
由于用癲癇腦電記錄進行人工診斷是一種低效的方式,本文提出了一種基于變分模態(tài)分解的癲癇腦電信號可穿戴芯片的檢測算法。應(yīng)用能量分離,對VMD分解后的信號序列進行特征信息增強,從中提取均值、方差和RCMDE 3種特征,并通過隨機森林進行自動預測,分類了正常時期、發(fā)作間期與癲癇發(fā)作期3類腦電信號。實驗結(jié)果顯示本文所提出的方法分類準確度90.78%,可以輔助臨床醫(yī)生進行診斷,具備潛在臨床應(yīng)用價值。