沈?yàn)t童,畢 卉,王蘇弘,李文杰,鄒 凌
1.常州大學(xué) 信息科學(xué)與工程學(xué)院,江蘇 常州213164
2.常州市生物醫(yī)學(xué)信息技術(shù)重點(diǎn)實(shí)驗(yàn)室,江蘇 常州213164
3.常州市第一人民醫(yī)院,江蘇 常州213003
抑郁癥(Depressive Disorder)是一種常見的精神疾病,其特征是對(duì)自身喜歡的活動(dòng)失去興趣,并伴有至少兩周無法進(jìn)行日?;顒?dòng)的行為。近年來青少年抑郁越來越引起社會(huì)和家庭的關(guān)注[1]。通過計(jì)算機(jī)輔助技術(shù)對(duì)抑郁癥患者和健康人進(jìn)行分類診斷,有助于降低臨床診斷的誤診率,幫助患者及早得到正確的治療。
目前,腦電在抑郁癥的研究領(lǐng)域已經(jīng)有了很多重要發(fā)現(xiàn)。中國科學(xué)院大學(xué)的蓋淑萍等人提取了靜息態(tài)下的腦電信號(hào)的小波包節(jié)點(diǎn)功率譜熵特征,發(fā)現(xiàn)其能夠作為鑒別抑郁癥的有效量化指標(biāo)[2]。Zhu 等根據(jù)靜息狀態(tài)功能磁共振成像研究重度抑郁癥患者自發(fā)性腦部活動(dòng)的變化,發(fā)現(xiàn)了雙側(cè)正中前額葉皮質(zhì)、楔前葉、角回、右側(cè)海馬旁回、右側(cè)顳極自發(fā)腦區(qū)活動(dòng)的改變[3]。Dharmadhikari 等人在靜息態(tài)θ 波段發(fā)現(xiàn)了前額葉區(qū)域的不對(duì)稱性,證明前額葉的θ 不對(duì)稱是一種潛在性的生物標(biāo)志[4]。此外,Esther 在對(duì)成年人抑郁患者的研究中發(fā)現(xiàn),靜息狀態(tài)下抑郁患者產(chǎn)生的心理傷害在腦電δ 波段的左額葉和右額葉存在聯(lián)系[5]。Lee 等在研究中發(fā)現(xiàn),高α 波段(10~12 Hz)功率能夠?qū)σ钟艚M和正常組進(jìn)行區(qū)分,受試者工作曲線值達(dá)到了70%[6]。Mumtaz等使用靜息態(tài)腦電數(shù)據(jù),提取額葉α 不對(duì)稱和信號(hào)頻段功率作為特征,發(fā)現(xiàn)在頂區(qū)、中心區(qū)域、顳區(qū)、枕區(qū)抑郁患者的右半腦特征比左半腦的特征顯著[7]。Bachmann 等通過靜息態(tài)腦電圖(Electroencephalogram,EEG)對(duì)中年女性抑郁患者進(jìn)行了分類研究,并通過對(duì)單導(dǎo)聯(lián)電極Pz的特征提取和分類研究,提出單導(dǎo)聯(lián)檢測(cè)抑郁的可行性[8]。
對(duì)于導(dǎo)聯(lián)的選擇,本質(zhì)是對(duì)導(dǎo)聯(lián)相應(yīng)的信號(hào)提取的特征進(jìn)行選擇的過程。Wang等人利用共空間模式算法(Common Spatial Pattern,CSP),通過空間模式向量和導(dǎo)聯(lián)的最大系數(shù)的關(guān)系對(duì)電極進(jìn)行優(yōu)化選擇[9]。Arvaneh等在此基礎(chǔ)上提出了稀疏共空間模式(Sparse Common Spatial Pattern,SCSP)算法,其是在分類精度約束下對(duì)最小信道數(shù)進(jìn)行優(yōu)化,對(duì)去除噪聲和不相關(guān)信道后的結(jié)果進(jìn)行電極優(yōu)化選擇[10]。此外,Li等使用主成分分析法對(duì)每個(gè)被試的電極對(duì)應(yīng)的數(shù)據(jù)集進(jìn)行計(jì)算,然后根據(jù)不同的任務(wù)刺激的發(fā)生率進(jìn)行導(dǎo)聯(lián)的選擇[11]。
機(jī)器學(xué)習(xí)在腦電分類學(xué)習(xí)中有著廣泛的運(yùn)用,利用決策樹和SVM對(duì)靜息狀態(tài)腦電信號(hào)的波段功率進(jìn)行分類的精度達(dá)到了80%[12],基于此分類方法能夠?qū)螌?dǎo)聯(lián)抑郁癥患者和正常人的分類提供有效的支持。Alaa 等人使用了極限學(xué)習(xí)機(jī)(Extreme Learning Machine,ELM)算法對(duì)抑郁患者和健康人的腦電信號(hào)進(jìn)行分類,達(dá)到了92%的分類精度[13]。Xia 團(tuán)隊(duì)使用靜息態(tài)的腦電數(shù)據(jù),使用小波變換、短時(shí)傅里葉變換、經(jīng)驗(yàn)?zāi)J椒纸馓崛√卣?,使用邏輯回歸算法進(jìn)行分類,發(fā)現(xiàn)小波變換提取的特征精度最高達(dá)到了87.5%[14]。
基于EGI 公司64 導(dǎo)腦電采集系統(tǒng),本文首先采集了16名抑郁患者和16名健康人的靜息狀態(tài)下的腦電信號(hào)。然后,通過對(duì)全導(dǎo)聯(lián)的特征提取和特征分析,確定特征顯著的腦區(qū),并確定最佳導(dǎo)聯(lián),同時(shí)使用遺傳算法進(jìn)行整體導(dǎo)聯(lián)的選擇。最后,對(duì)單導(dǎo)聯(lián)和多導(dǎo)聯(lián)提取特征進(jìn)行分類,并對(duì)時(shí)域和頻域算法的運(yùn)行效率進(jìn)行分析。
頻譜不對(duì)稱分析法是利用功率譜密度計(jì)算單個(gè)導(dǎo)聯(lián)信號(hào)能量比率的算法。它通過計(jì)算α 頻段附近高頻段和低頻段相對(duì)性差異來描述腦電信號(hào)的頻譜不對(duì)稱性[15]。
計(jì)算方法分成三部分,參數(shù)如圖1所示[8]。
圖1 頻域波段分布
(1)計(jì)算高低頻段邊界F1n、F2n、F3n、F4n
其中,n 代表人數(shù)(n ∈[1,32]),m 代表導(dǎo)聯(lián)數(shù)(m ∈[1,64]),F1、F2 代表低頻段,F(xiàn)3、F4 代表高頻段,smn為功率譜密度,Slmn和Shmn分別為高低功率譜密度,fcn為α 波段的功率最大值。
這里F1、F2 的確定在靠近θ 波段處,兩者頻帶寬度相差4 Hz,F(xiàn)3、F4 頻段的確定在靠近傳統(tǒng)意義上的β 段處,兩者頻帶寬度相差24 Hz。
(2)計(jì)算高低頻率功率譜密度總和
(3)計(jì)算選擇高低頻段的SASI值(即為SASI的特征)
去趨勢(shì)波動(dòng)分析算法最早運(yùn)用于DNA 序列的檢測(cè)[16],現(xiàn)在逐漸運(yùn)用于腦電信號(hào)分析領(lǐng)域,其能夠直接計(jì)算時(shí)域上信號(hào)的特點(diǎn)[17]。為了進(jìn)行DFA 的均方根系數(shù)計(jì)算,將4分鐘的EEG信號(hào)分成均等的段數(shù),每段20 s,使用DFA算法進(jìn)行處理。計(jì)算流程通常分為三個(gè)步驟。
(1)計(jì)算擬合序列
對(duì)于一個(gè)時(shí)間序列的信號(hào),定義序列x(i),i 為每段的長(zhǎng)度,區(qū)間為[1,N];通過求離散序列的積分,得到一個(gè)新的時(shí)間序列。如式(8)所示。
(2)計(jì)算均方根系數(shù)F(n)
在確定擬合前后的序列后,通過式(9)計(jì)算出結(jié)果F(n)。
(3)計(jì)算F(n)和n 的關(guān)系
同時(shí)取對(duì)數(shù)ln F(n)~ln n,得到兩者之間的斜率α,α 即為提取的時(shí)域特征。
目前,遺傳算法(Genetic Algorithm,GA)廣泛被運(yùn)用于求最優(yōu)解問題和特征選擇中。以染色體X 為例,X={0,1,0,1,1,0,0,0,0,0},染色體X 由10個(gè)基因以二進(jìn)制形式組成,1 位表示特征選中,0 位表示特征未選中。在特征選擇中,將基因的數(shù)量類比為特征的數(shù)量。
遺傳算法流程分為五部分,分別為初始化、適應(yīng)度函數(shù)、選擇、交叉、變異。具體算法偽代碼如下所示。
步驟1 初始化參數(shù)X、Z、N、Tmax、CN、TC ,設(shè)置X 為初始化染色體群體,Z 為最佳的染色體,N 為最優(yōu)選擇染色體數(shù),Tmax為一代的最大數(shù)量,CN 為交叉的總數(shù),TC 為交叉次數(shù)的兩倍;
步驟2 估計(jì)染色體的適應(yīng)度函數(shù)F(X);
步驟3 For t=1 to Tmax
For i=1 to CN
使用輪盤選擇方法選擇兩對(duì)父母染色體
通過兩對(duì)父母染色體交叉產(chǎn)生兩個(gè)子代
Next i
For j=1 to TC
根據(jù)突變率進(jìn)行變異
Next j
估計(jì)產(chǎn)生子代的適應(yīng)度
添加新產(chǎn)生的子代到當(dāng)前種群X 中
對(duì)種群進(jìn)行排序,選擇最優(yōu)的N 條染色體
如果種群中有更好的染色體,更新Z
Next t
所有被試均在常州市第一人民醫(yī)院經(jīng)臨床確診,共篩選出患有抑郁病癥的青少年16例,健康青少年16例,年齡范圍(16.31±1.25),抑郁組和對(duì)照組之間的年齡無統(tǒng)計(jì)學(xué)意義(p >0.05)。所有被試實(shí)驗(yàn)前均使用漢密頓抑郁量表(Hamilton Depression Rating Scales,HADS)進(jìn)行檢測(cè)[18],抑郁組分?jǐn)?shù)高于對(duì)照組。
兩組的青少年實(shí)驗(yàn)研究已經(jīng)通過常州市第一人民醫(yī)院倫理委員會(huì)批準(zhǔn)。所有受試者或其監(jiān)護(hù)人均簽署了知情同意書,自愿參加本實(shí)驗(yàn)。
采用EGI公司64導(dǎo)聯(lián)腦電采集系統(tǒng),如圖2所示(腦電采集系統(tǒng)帽以61、62號(hào)導(dǎo)聯(lián)為前端,靠近眼部;以35、39、37 號(hào)導(dǎo)聯(lián)為后端,靠近耳部),采樣頻率為500 Hz,電極阻抗設(shè)定在80 kΩ以下,利用Net Station軟件實(shí)時(shí)采集。使用EEGLAB(版本號(hào)v14.1.2)工具箱預(yù)處理原始腦電信號(hào),參考電極使用平均參考。
圖2 64導(dǎo)聯(lián)腦電采集系統(tǒng)
采集的靜息態(tài)的數(shù)據(jù)分為閉眼數(shù)據(jù)和睜眼數(shù)據(jù),閉眼條件下被試受到的外部視覺刺激較少,采集的信號(hào)受到噪聲干擾較小,提升了信號(hào)的質(zhì)量,減少了對(duì)特征提取的干擾。因此,實(shí)驗(yàn)采集了4分鐘閉眼狀態(tài)下的腦電數(shù)據(jù),被試坐在安靜的房間內(nèi),盡量保證頭部不會(huì)大幅度移動(dòng),在數(shù)據(jù)采集過程保持清醒,范式流程圖如圖3所示。
圖3 范式流程圖
將采集的數(shù)據(jù)直接通過Net Station 軟件轉(zhuǎn)換成Matlab可讀取的格式,在EEGLAB工具箱下對(duì)信號(hào)進(jìn)行處理,具體步驟包括:低通和高通濾波(0.5~40 Hz)[8,15]、人工的偽跡檢測(cè)和壞導(dǎo)聯(lián)替換、參考點(diǎn)轉(zhuǎn)換,然后使用獨(dú)立成分分析(Independent Component Analysis,ICA)去除眼動(dòng)以及其他噪聲。最后選擇干凈的3 分鐘內(nèi)的數(shù)據(jù),作為特征提取的數(shù)據(jù)段。
其中,由于β 頻段包含對(duì)抑郁評(píng)估有用的電生理信息,而θ 頻段是穩(wěn)定不受疾病影響的頻段[19],SASI 算法就是通過計(jì)算出這兩個(gè)實(shí)際頻段的功率,得到頻段間功率的差異率。而波段的邊界頻率是專門為每個(gè)個(gè)體選擇的,并與腦電信號(hào)α 頻段的最大功率相關(guān)。理論上所選擇的計(jì)算頻帶接近傳統(tǒng)的β(13~30 Hz)和θ(4~8 Hz)頻段,但當(dāng)最大的功率值落在較高或者較低的α 頻段(8~13 Hz),那么最高和最低的實(shí)際頻率的數(shù)值存在偏移。為了保證范圍,將濾波的頻段定為0.5~40 Hz[15]。
首先,本文對(duì)抑郁癥患者的腦區(qū)進(jìn)行相關(guān)電生理機(jī)制的查詢,發(fā)現(xiàn)在抑郁癥患者的腦電信號(hào)生理機(jī)制研究中,抑郁癥患者相比于正常人在頂葉、枕葉的區(qū)域有較多的改變[20],不對(duì)稱的現(xiàn)象較為常見,這些改變與患者年齡和抑郁癥程度有關(guān)[21]。
然后,根據(jù)SASI 和DFA 算法,提取了全部32 位被試64 導(dǎo)聯(lián)的時(shí)頻特征。根據(jù)式(7)計(jì)算SASI 的值如圖4 所示,抑郁組的整體特征呈現(xiàn)正性相關(guān),對(duì)照組則呈負(fù)性相關(guān)。根據(jù)式(9)計(jì)算的DFA 的值如圖5 所示,發(fā)現(xiàn)抑郁組的特征上升趨勢(shì)比對(duì)照組快,52~61導(dǎo)聯(lián)的數(shù)值存在波動(dòng),能夠發(fā)現(xiàn)31~34導(dǎo)聯(lián)存在一個(gè)明顯的下降趨勢(shì),而SASI的值在31~34更趨于穩(wěn)定。
圖4 SASI各導(dǎo)聯(lián)均值折線圖
圖5 DFA各導(dǎo)聯(lián)均值折線圖
再根據(jù)抑郁患者在頂區(qū)和枕區(qū)發(fā)現(xiàn)的DFA和SASI特征,對(duì)各個(gè)導(dǎo)聯(lián)進(jìn)行結(jié)果統(tǒng)計(jì),并和已發(fā)現(xiàn)的頂區(qū)(P區(qū))和枕區(qū)(O 區(qū))進(jìn)行生理特性結(jié)合,分別對(duì)抑郁組和對(duì)照組頂區(qū)和枕區(qū)的導(dǎo)聯(lián)提取的SASI和DFA的特征進(jìn)行t 檢驗(yàn),根據(jù)兩種特征t 檢驗(yàn)結(jié)果,發(fā)現(xiàn)Pz 導(dǎo)聯(lián)和Oz導(dǎo)聯(lián)具有較高的統(tǒng)計(jì)學(xué)意義(P <0.05),如表1所示。而進(jìn)一步比較發(fā)現(xiàn)Pz 導(dǎo)聯(lián)比Oz 導(dǎo)聯(lián)在統(tǒng)計(jì)學(xué)上更具有差異性,最終選擇Pz導(dǎo)聯(lián)進(jìn)行特征分類。
表1 兩導(dǎo)聯(lián)t檢驗(yàn)結(jié)果
針對(duì)提取32 位被試的64 導(dǎo)聯(lián)的時(shí)頻特征,分別構(gòu)建了SAIS 和DFA 的32×64 維度的特征矩陣,利用遺傳算法對(duì)每個(gè)人每個(gè)導(dǎo)聯(lián)的特征進(jìn)行選擇、交叉、變異,最終將得到的子代的特征對(duì)應(yīng)的導(dǎo)聯(lián)標(biāo)簽號(hào)選出。選取的導(dǎo)聯(lián)的編號(hào)如表2所示。
表2 兩特征選取的導(dǎo)聯(lián)
如表2所示,SASI提取了總共34導(dǎo)聯(lián)的特征(P <0.05),DFA提取了26導(dǎo)聯(lián)的特征(P <0.05)。然后,將兩者同時(shí)選中的導(dǎo)聯(lián)作為兩者的分類導(dǎo)聯(lián),如圖6 所示,以此減少了導(dǎo)聯(lián)數(shù)量,提升了特征質(zhì)量,便于后續(xù)的分類。
圖6 導(dǎo)聯(lián)選擇結(jié)果
Pz導(dǎo)聯(lián)提取的特征作為分類的特征集,構(gòu)建了單導(dǎo)聯(lián)的特征值矩陣,利用SVM建立了分類模型,使用留一法進(jìn)行交叉驗(yàn)證和分類(參數(shù):訓(xùn)練數(shù)據(jù)X ,標(biāo)簽Y ,核函數(shù)Gaussian,懲罰系數(shù)1,預(yù)期標(biāo)準(zhǔn)化true,核尺度5.8,類別[0;1],折數(shù)32)。分類結(jié)果如表3 所示。使用SVM分類器對(duì)Pz導(dǎo)聯(lián)特征分類的結(jié)果來看,SASI分類的精度都達(dá)到了85%,DFA的分類精度達(dá)到了86%。
表3 SVM單導(dǎo)聯(lián)分類結(jié)果 %
根據(jù)遺傳算法選取的每一導(dǎo)聯(lián)對(duì)應(yīng)的特征,使用SVM對(duì)其進(jìn)行分類,分類結(jié)果如表4所示。
表4 SVM多導(dǎo)聯(lián)分類結(jié)果 %
為了能夠更好地為腦機(jī)接口技術(shù)提供范例,本文基于Matlab 2016a 平臺(tái)的Matlab 語言進(jìn)行計(jì)算,統(tǒng)計(jì)了SASI 和DFA 算法的運(yùn)行和時(shí)間,便于后續(xù)BCI 技術(shù)的參考。本文對(duì)于SASI 和DFA 的實(shí)時(shí)性進(jìn)行了分析,分別統(tǒng)計(jì)了一分鐘內(nèi)10 s為間隔下,計(jì)算64導(dǎo)聯(lián)的算法需要運(yùn)行的時(shí)間(機(jī)器配置:Intel?i5-4590CPU,32 GB 內(nèi)存,NVIDIA GeForce GTS 450 顯卡)。DFA 算法計(jì)算時(shí)間如圖7所示,SASI算法計(jì)算時(shí)間如圖8所示。
圖7 DFA算法耗時(shí)
圖8 SASI算法耗時(shí)
從多導(dǎo)聯(lián)選擇的角度分析,遺傳算法對(duì)SASI 方法選取了34導(dǎo)聯(lián),DFA方法選取了29導(dǎo)聯(lián),通過兩者所選取導(dǎo)聯(lián)的交叉比較分析,將3,4,12,19,20,26,27,30,33,34,45,48,58,62,共計(jì)14 個(gè)導(dǎo)聯(lián)進(jìn)行分類(橙色標(biāo)記),如圖4所示。圖4中時(shí)頻特征選擇的導(dǎo)聯(lián)在左側(cè)較多,前額葉、額葉部分均有涉及,頂區(qū)包括了34 號(hào)的Pz以及附近的33 號(hào)導(dǎo)聯(lián),這些區(qū)域?qū)罄m(xù)抑郁癥的研究具有參考意義。
經(jīng)過特征和導(dǎo)聯(lián)分類結(jié)果來看,多導(dǎo)聯(lián)的分類精度比單導(dǎo)聯(lián)的分類精度提升36%左右,DFA算法提升得更加顯著,達(dá)到了90.6%,經(jīng)過遺傳算法提取的導(dǎo)聯(lián)進(jìn)行特征分類能對(duì)分類準(zhǔn)確率進(jìn)行改善。
從特征的性質(zhì)來看,本文提取的DFA 特征是直接從時(shí)域的角度進(jìn)行計(jì)算,將均方根系數(shù)與每個(gè)時(shí)間段的關(guān)系α 作為特征,α 的值在[0.5,1]代表了序列具有相關(guān)性,即大波動(dòng)后可能出現(xiàn)大波動(dòng),小波動(dòng)后可能出現(xiàn)小波動(dòng)[17]。因此α 作為特征進(jìn)行分類過程中能夠更好地對(duì)抑郁癥和正常人的時(shí)間序列進(jìn)行評(píng)估。SASI計(jì)算了最高α 波段功率附近高低頻段的頻譜差異率作為特征,其正性和負(fù)性從頻域上表征了抑郁癥和正常人的特點(diǎn)[15],但是部分患者存在特異性,其頻域的特征表現(xiàn)與正常人一致,這就導(dǎo)致在分類過程中產(chǎn)生了識(shí)別率的差異。而DFA 計(jì)算的是時(shí)間序列的相關(guān)性,相對(duì)的分類準(zhǔn)確率能得到提升。
從算法優(yōu)缺點(diǎn)看,SASI 提取的特征更容易從表面區(qū)分出抑郁癥患者和正常人,但是準(zhǔn)確程度仍有待提高,DFA 提取的特征更能體現(xiàn)抑郁患者時(shí)域特征的變化,患者和正常人的波動(dòng)趨勢(shì)更為明顯,減少了分類過程的容錯(cuò)率。從算法執(zhí)行時(shí)間看,SASI 的運(yùn)算效率最快。在圖5中,64導(dǎo)聯(lián)進(jìn)行頻域特征計(jì)算所需要的時(shí)間在0.3 s 左右,但是DFA 的運(yùn)算效率不高,從圖4 可以看出,隨著所選取的數(shù)據(jù)段的增加,所消耗的時(shí)間呈近似于指數(shù)量級(jí)的增加,消耗的時(shí)間甚至需要16 min以上。
從單導(dǎo)聯(lián)和多導(dǎo)聯(lián)的區(qū)域來看,多導(dǎo)聯(lián)選出的導(dǎo)聯(lián)在前額葉、額葉、中心區(qū)域、頂區(qū)、顳區(qū),如圖6 所示,而單導(dǎo)聯(lián)只反映了一個(gè)頂區(qū)的特性,多導(dǎo)聯(lián)能較為宏觀地包括整個(gè)腦區(qū)的生理特性[21]。因此多導(dǎo)聯(lián)提取的特征質(zhì)量更高,分類效果更好。
綜上,多導(dǎo)聯(lián)分類的結(jié)果相較于單導(dǎo)聯(lián)更令人滿意,對(duì)于區(qū)分抑郁癥患者更有幫助。SASI 算法更適合用于抑郁癥的實(shí)時(shí)反饋階段以及人機(jī)交互部分,而DFA算法則需要對(duì)選取的時(shí)間窗口進(jìn)行界定,從單導(dǎo)聯(lián)的角度進(jìn)行BCI 技術(shù)在抑郁癥上的應(yīng)用,這與DFA 相較于SASI更高的分類準(zhǔn)確率一致。
本研究發(fā)現(xiàn)多導(dǎo)聯(lián)的分類結(jié)果提升顯著,多導(dǎo)聯(lián)的結(jié)果略優(yōu)于單導(dǎo)聯(lián),但實(shí)際分類過程中,由于電極帽佩戴及偏移等因素的影響,單導(dǎo)聯(lián)檢測(cè)存在一定的偏差,多導(dǎo)聯(lián)能從數(shù)據(jù)整體性差異的角度給出一個(gè)大腦全局的屬性特征,具有一定的穩(wěn)定性。未來的研究將繼續(xù)對(duì)特征進(jìn)行優(yōu)化,改善算法運(yùn)行效率,提升分類精度,為后續(xù)BCI和抑郁癥的研究做出貢獻(xiàn)。