羅 渠,馮靜雯,賴(lài)虹宇,李 濤,鄧 偉,劉 凱,張軍鵬
1.四川大學(xué) 電氣工程學(xué)院,成都610065
2.四川大學(xué) 華西醫(yī)院心理健康中心,成都610065
精神類(lèi)疾病給社會(huì)帶來(lái)了相當(dāng)大的經(jīng)濟(jì)負(fù)擔(dān),根據(jù)2015年的多國(guó)統(tǒng)計(jì)數(shù)據(jù),精神分裂癥病人每年的人均花費(fèi)從泰國(guó)的5 818 美元到挪威的94 587 美元波動(dòng),其中在澳大利亞每個(gè)病人的終生花費(fèi)可高達(dá)988 264 美元。根據(jù)2010 年的數(shù)據(jù),歐洲每年在抑郁癥治療上的花費(fèi)也高達(dá)919 億歐元[1-2]。對(duì)于這兩種耗費(fèi)大量社會(huì)資源的精神疾病,及時(shí)準(zhǔn)確的診斷將有助于它們的治療。
精神分裂癥是一組病因不明的重性精神疾病,臨床上往往表現(xiàn)為癥狀各異的綜合征,其涉及感知覺(jué)、思維、情感和行為等多方面的障礙以及精神活動(dòng)的不協(xié)調(diào)[3]。多起病于青少年和成年早期,伴隨有陽(yáng)性癥狀(如幻聽(tīng)、妄想、思維紊亂、顯著緊張和異常行為等)和陰性癥狀(如意志消沉、情感淡漠等)[4]。個(gè)體之間癥狀差異較大,其診斷往往采用精神量表和醫(yī)學(xué)診斷手冊(cè)或通過(guò)影像學(xué)檢查[5]。抑郁癥是一種在青少年中發(fā)病率很高的心理疾病,其特征是情緒消沉,缺乏自信,對(duì)于任何歡愉活動(dòng)缺乏興趣,自卑抑郁,甚至帶有厭世情緒[6]。具有高發(fā)病率、高復(fù)發(fā)率、高自殺率和高自殘率等特點(diǎn),嚴(yán)重?fù)p壞患者的身心健康[7]。這兩種疾病的發(fā)病機(jī)制至今沒(méi)有明確的解釋?zhuān)覂烧叱?huì)有一些相似的臨床表現(xiàn),例如意志消沉、缺乏自信[8]。精神分裂癥患者中抑郁癥的患病率高達(dá)42.5%[9],在精神分裂癥的治療過(guò)程中,其預(yù)后效果不理想也與患者患抑郁癥有很大關(guān)系[10]。研究表明[11],精神分裂癥患者和抑郁癥患者的EEG 信號(hào)在節(jié)律,波幅以及功率等方面均與正常人存在差異,因此本文試圖通過(guò)采集兩類(lèi)患者靜息態(tài)下的EEG 信號(hào),通過(guò)深度學(xué)習(xí)的方法來(lái)對(duì)兩者進(jìn)行區(qū)分。
腦電圖(EEG)是一種使用電生理指標(biāo)記錄大腦活動(dòng)的方法,具有高時(shí)間分辨率,非侵入性,成本低的特點(diǎn)[12]。EEG數(shù)據(jù)的表示方法有很多,最主要的兩種特征表示方法是頻域特征和時(shí)域特征[13-14]。其分析方法也不盡相同,可以采用傳統(tǒng)的機(jī)器學(xué)習(xí)的方法進(jìn)行特征提取與分類(lèi)[15],也可以利用深度學(xué)習(xí)進(jìn)行處理[16]。其中深度學(xué)習(xí)是一種特殊的機(jī)器學(xué)習(xí)算法,它能夠?qū)⑻卣魈崛『头诸?lèi)進(jìn)行結(jié)合,同時(shí)從數(shù)據(jù)中進(jìn)行學(xué)習(xí)[17]。
近年來(lái),深度學(xué)習(xí)在計(jì)算機(jī)視覺(jué)、自然語(yǔ)言處理等方面取得眾多前所未有的成果。從圖像分類(lèi)[18]到目標(biāo)檢測(cè)[19],從語(yǔ)音識(shí)別[20]到語(yǔ)義分割[21]等均有較大突破。并且深度學(xué)習(xí)在醫(yī)療診斷中的應(yīng)用也日益廣泛[22-23],本文根據(jù)數(shù)據(jù)的轉(zhuǎn)換形式采用了深度學(xué)習(xí)中的卷積神經(jīng)網(wǎng)絡(luò)(CNN)來(lái)對(duì)兩種疾病進(jìn)行分類(lèi)。卷積神經(jīng)網(wǎng)絡(luò)是計(jì)算機(jī)視覺(jué)領(lǐng)域中廣泛使用的一種深度學(xué)習(xí)模型。它對(duì)于自然信號(hào)(如圖像和音頻)的處理具有顯著的優(yōu)勢(shì)。通過(guò)多個(gè)卷積層的卷積和非線性組合,模型可以將高級(jí)的特征表示成更加抽象復(fù)雜的低級(jí)特征的組合,這使得模型可以學(xué)習(xí)到模式的空間層次結(jié)構(gòu)。通過(guò)池化層,模型可以學(xué)習(xí)輸入信號(hào)的局部模式,將輸入信號(hào)用較為粗糙的形式進(jìn)行表示,這使得卷積神經(jīng)網(wǎng)絡(luò)學(xué)到的模式具有平移不變性。
考慮到精神分裂癥患者腦電的復(fù)雜性,以及進(jìn)行手動(dòng)提取特征時(shí)的多樣性,本文采用卷積神經(jīng)網(wǎng)絡(luò)來(lái)對(duì)腦電數(shù)據(jù)進(jìn)行自動(dòng)的特征提取和分類(lèi)。為了對(duì)多個(gè)電極通道和頻段進(jìn)行分析,還提出了一種EEG 數(shù)據(jù)表示方法。通過(guò)采集精神分裂癥和抑郁癥患者的EEG 信號(hào),經(jīng)過(guò)數(shù)據(jù)預(yù)處理去除眼電、頭動(dòng)、工頻干擾等偽跡。將轉(zhuǎn)換后的EEG 頻譜圖轉(zhuǎn)換為灰度圖的形式,利用卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行分類(lèi)。
本次研究的數(shù)據(jù)來(lái)源于四川大學(xué)華西醫(yī)院第二門(mén)診部心理衛(wèi)生中心數(shù)據(jù)庫(kù),和該中心簽署了合作協(xié)議和保密協(xié)議,已得到數(shù)據(jù)使用授權(quán)許可,且所有參與數(shù)據(jù)采集的患者均已簽署知情同意書(shū)。實(shí)驗(yàn)收集了70例精神分裂癥患者(SCZ)和70例抑郁癥患者(DP)的腦電數(shù)據(jù),患者年齡均在32歲到51歲之間且服從正態(tài)分布,患者年齡和性別差異均無(wú)統(tǒng)計(jì)學(xué)意義(P>0.05)。數(shù)據(jù)采集設(shè)備使用動(dòng)態(tài)腦電圖儀(NATION8128W,上海諾誠(chéng)電氣有限公司,中國(guó)),采樣頻率為128 Hz。采集涉及16 通道的腦電圖帽(如圖1),傳感器按照10-20 電極放置標(biāo)準(zhǔn)[24]。
圖1 采集EEG信號(hào)的電極分布圖
實(shí)驗(yàn)數(shù)據(jù)采集時(shí),患者處于一個(gè)安靜封閉的室內(nèi)進(jìn)行?;颊咝璞3职察o、放松、清醒的狀態(tài)。實(shí)驗(yàn)開(kāi)始,患者閉眼并做深呼吸3 min,結(jié)束后睜眼給予被試10 s 緩沖時(shí)間。然后開(kāi)始閉眼狀態(tài)保持7 s,睜眼狀態(tài)保持7 s,以此為一個(gè)閉眼睜眼數(shù)據(jù)采集周期,進(jìn)行3個(gè)周期后結(jié)束數(shù)據(jù)采集。由于實(shí)際過(guò)程中存在操作誤差,所以真實(shí)記錄睜眼和閉眼狀態(tài)數(shù)據(jù)時(shí)長(zhǎng)為5~10 s。
用EEGLAB 對(duì)數(shù)據(jù)進(jìn)行必要的預(yù)處理。(https://sccn.ucsd.edu/eeglab/index.php)首先根據(jù)睜眼閉眼的時(shí)間節(jié)點(diǎn)導(dǎo)入原始采樣數(shù)據(jù),進(jìn)行電極定位,其次對(duì)數(shù)據(jù)進(jìn)行濾波操作。具體分兩次進(jìn)行,采用1 408 階FIR(Finite Impulse Response)濾波器進(jìn)行0.3 Hz 的高通濾波,采用38 階FIR 濾波器進(jìn)行45 Hz 的低通濾波,最后設(shè)置50 Hz 陷波以減小工頻干擾。顯示波形后若發(fā)現(xiàn)壞導(dǎo)則去掉壞導(dǎo)并用周?chē)耐ǖ榔骄颠M(jìn)行替代。
然后根據(jù)實(shí)際通道數(shù)利用ICA(Independent Component Analysis)計(jì)算出16 個(gè)獨(dú)立成分,進(jìn)行眼電、頭動(dòng)、工頻干擾等偽跡的去除。原始腦電數(shù)據(jù)一般是由各類(lèi)偽跡與有效的腦電信號(hào)經(jīng)過(guò)線性或近似線性混合得到。由于混合系統(tǒng)未知,因此偽跡和有效腦電信號(hào)均可視為未知隱藏變量,這些變量相互獨(dú)立并且往往服從非高斯分布。利用ICA 可以找到各個(gè)獨(dú)立成分。ICA 的一般線性模型如式(1):
其中z為原始腦電信號(hào),s為有效腦電信號(hào),B為混合矩陣。ICA的目的就是在已知z的情況下,找到一個(gè)混合矩陣W使y的各個(gè)分量相互獨(dú)立(z=Wy),從而使y逼近于s,得到有效腦電信號(hào)。然后通過(guò)偽跡成分的特征就可以進(jìn)行偽跡的剔除。
常見(jiàn)偽跡有眼動(dòng)引起的眨眼、眼漂偽跡,頭動(dòng)引起的偽跡以及工頻干擾產(chǎn)生偽跡。各個(gè)偽跡的特征可以根據(jù)地形圖、時(shí)域Trials 色譜圖、功率譜圖進(jìn)行辨別,具體如圖2所示。
圖2 各偽跡成分特征描述
最后平均所有電極以作為電極重參考。經(jīng)過(guò)數(shù)據(jù)預(yù)處理后,每位患者得到3 段睜眼和3 段閉眼狀態(tài)下的數(shù)據(jù),每段數(shù)據(jù)時(shí)長(zhǎng)為4~10 s,如圖3(a)和(c)。
通過(guò)分析篩選出處理后偽跡仍然較多的數(shù)據(jù),得到精神分裂癥閉眼狀態(tài)和睜眼狀態(tài)下的數(shù)據(jù)各200段,抑郁癥閉眼狀態(tài)和睜眼狀態(tài)下的數(shù)據(jù)各200段。
將上述EEGLAB 處理后的數(shù)據(jù)導(dǎo)入Brainstorm(https://neuroimage.usc.edu/brainstorm/),通過(guò)快速傅里葉變換,將時(shí)域下的每段數(shù)據(jù)(如圖3(a)和(c)轉(zhuǎn)換到頻域(如圖3(b)和(d)。以往也有將時(shí)域EEG數(shù)據(jù)直接輸入深度學(xué)習(xí)模型中進(jìn)行分析的研究[25],但要求對(duì)數(shù)據(jù)進(jìn)行等長(zhǎng)的截取,因此會(huì)損失部分?jǐn)?shù)據(jù)信息。為了盡可能利用所采集的數(shù)據(jù),本文嘗試將4~10 s長(zhǎng)度不一的時(shí)域數(shù)據(jù)轉(zhuǎn)換到頻域,將這些時(shí)長(zhǎng)不同的EEG 數(shù)據(jù)轉(zhuǎn)換成功率譜密度的形式,試圖挖掘出數(shù)據(jù)中更多的潛在信息。通過(guò)人眼直觀的觀察,無(wú)論是在時(shí)域還是在頻域下均很難發(fā)現(xiàn)兩種疾病信號(hào)波形的明顯差異。由于信號(hào)在高頻部分衰減嚴(yán)重,因此在頻域下僅截取1~50 Hz的數(shù)據(jù),并導(dǎo)出為50行16列的功率矩陣(其中行數(shù)表示頻率,列數(shù)表示導(dǎo)聯(lián)數(shù)),以此作為后續(xù)分析的樣本。
圖3 患者閉眼狀態(tài)下的數(shù)據(jù)形式
利用CNN 對(duì)EEG 數(shù)據(jù)進(jìn)行分析時(shí),也有研究者對(duì)數(shù)據(jù)的形式進(jìn)行了處理。如Tabar等人[16]采集人在想象左手和右手活動(dòng)時(shí),大腦C3、C4、CZ這3個(gè)通道的EEG信號(hào)。采用時(shí)頻分析,將EEG信號(hào)轉(zhuǎn)換成橫軸為時(shí)間,縱軸為頻率的圖片樣本,樣本僅利用了Alpha、Beta頻段的數(shù)據(jù)。這種方法所采用的電極和使用的數(shù)據(jù)頻段均較少,考慮到精神病患者腦電的復(fù)雜性,該種對(duì)于EEG樣本的表示方法可能不足以完全提取各個(gè)通道的特征。Emami等人[26]將整個(gè)時(shí)域下所有通道的EEG信號(hào),用時(shí)間窗劃分為EEG 時(shí)域圖片,將整張圖片輸入到卷積神經(jīng)網(wǎng)絡(luò)中區(qū)分癲癇和非癲癇。但這種直接利用EEG的時(shí)域信息進(jìn)行分析的方法,可能會(huì)引入過(guò)多噪聲數(shù)據(jù),并且可能由于圖片尺寸不統(tǒng)一的問(wèn)題而使模型學(xué)習(xí)到更多不屬于信號(hào)本身的特征。
為了避免了分析時(shí)域數(shù)據(jù)時(shí)利用時(shí)間窗截取信號(hào)造成的部分?jǐn)?shù)據(jù)丟失,同時(shí)避免直接輸入數(shù)據(jù)截圖引入其他不屬于數(shù)據(jù)本身的信息。本文提出將時(shí)域下的EEG 數(shù)據(jù)轉(zhuǎn)換成頻譜圖,得到每個(gè)電極通道下1~50 Hz的功率值,從而將每個(gè)樣本轉(zhuǎn)換為功率矩陣的形式。再將每個(gè)通道的功率進(jìn)行max-min 歸一化處理,如公式(2),然后轉(zhuǎn)換為灰度圖,如圖4所示。圖4中,10張灰度圖代表10個(gè)閉眼狀態(tài)下的樣本,每張灰度圖寬16,代表16個(gè)Channel,高為50,表示頻率為50 Hz。每張灰度圖下方的數(shù)字0和1為樣本標(biāo)簽。0表示精神分裂癥,1表示抑郁癥。
圖4 頻譜圖轉(zhuǎn)換成灰度圖的樣本形式
式子中pmax、pmin分別表示單個(gè)電極通道下的最大功率和最小功率,p為該通道下對(duì)應(yīng)頻率的功率,p′為歸一化后的值。為了將數(shù)組轉(zhuǎn)換為灰度圖像,需要在歸一化后乘以像素值255,式中i即為轉(zhuǎn)換后的像素值。通過(guò)頻域的轉(zhuǎn)換可以將長(zhǎng)度不一的時(shí)域數(shù)據(jù)所包含的信息全部轉(zhuǎn)移到固定頻段信號(hào)中,同時(shí)進(jìn)行腦電全通道和全頻段的分析?;叶葓D的形式也適合數(shù)據(jù)增強(qiáng)的方法,更有利于使用CNN進(jìn)行處理。
CNN 在許多領(lǐng)域發(fā)揮著強(qiáng)大的作用。如人臉識(shí)別[27]、x-ray醫(yī)學(xué)圖像分析[28]、視覺(jué)圖像重建[29]、磁共振圖像分析[30]、MEG 大腦狀態(tài)分析[31]等。CNN 能夠進(jìn)行特征的自動(dòng)提取和分類(lèi),由于樣本實(shí)質(zhì)為50×16 的數(shù)組,構(gòu)建一個(gè)8 層的淺層卷積神經(jīng)網(wǎng)絡(luò),具體結(jié)構(gòu)見(jiàn)表1。整個(gè)卷積網(wǎng)絡(luò)包含5 種不同類(lèi)型的層,分別是卷積層(convolution layer)、池化層(pooling layer)、展開(kāi)層(flatten layer),dropout層、全連接層(dense layer)。
表1 對(duì)模型進(jìn)行評(píng)估的各項(xiàng)統(tǒng)計(jì)學(xué)指標(biāo) %
Convolution layer:由許多的隱藏單元(neurons)組成。每個(gè)隱藏單元是一個(gè)矩陣,可以對(duì)輸入的數(shù)據(jù)進(jìn)行卷積,每次卷積的步長(zhǎng)(stride)為1。每個(gè)隱藏單元卷積后產(chǎn)生一張?zhí)卣鲌D(feature map)。
Pooling layer:用于數(shù)據(jù)的下采樣,以減少卷積層輸出后的數(shù)據(jù)維度,可以有效減小計(jì)算量,防止過(guò)擬合。最大池化層(max-pooling layer)是在2×2的窗口中選擇最大的值輸入到下一層。
Flatten layer:可以將最后卷積層的輸出數(shù)據(jù)展成一列。
Dropout layer:可以在訓(xùn)練時(shí)暫時(shí)隱藏部分神經(jīng)元,以達(dá)到減小過(guò)擬合的目的。經(jīng)過(guò)多次實(shí)驗(yàn),本模型將dropout rate設(shè)置為0.5。
Dense layer:可以將之前提取的特征全部關(guān)聯(lián)起來(lái),映射到輸出空間中。
模型使用了兩種激活函數(shù)(activation function),分別是Relu(Rectified linear unit)[32]和Sigmoid。Relu 可以增加模型的非線性,讓模型同時(shí)學(xué)習(xí)輸入數(shù)據(jù)的線性變換和非線性變換,使模型對(duì)于輸入數(shù)據(jù)的噪聲更加具有魯棒性。式(3)即為Relu函數(shù)。
式中x為輸入的數(shù)據(jù),f(x)為對(duì)應(yīng)的輸出。最后一層的激活函數(shù)選擇Sigmoid函數(shù)(式(4)),用于計(jì)算最后模型輸出某一類(lèi)別的概率值。
其中yc表示模型最后一層對(duì)于類(lèi)別c的輸出,pc表示輸出該類(lèi)別c的概率。所以模型的最后一層用于預(yù)測(cè)輸入樣本的類(lèi)別。構(gòu)建好模型的結(jié)構(gòu),開(kāi)始對(duì)模型進(jìn)行訓(xùn)練。本研究分別利用閉眼狀態(tài)和睜眼狀態(tài)下的數(shù)據(jù)進(jìn)行訓(xùn)練和分類(lèi),最后對(duì)兩種狀態(tài)下的分類(lèi)效果進(jìn)行對(duì)比。首先將閉眼下的樣本80%用于訓(xùn)練,20%用于驗(yàn)證,經(jīng)過(guò)多次實(shí)驗(yàn),模型訓(xùn)練時(shí)的參數(shù)設(shè)置如下:選擇優(yōu)化器為RMSProp[33],學(xué)習(xí)率設(shè)置為10?4,每次輸入模型的樣本批量為32,損失函數(shù)選擇binary cross entropy[34]。模型的具體訓(xùn)練過(guò)程如圖5 所示。圖5 中,像輸入模型后首先會(huì)經(jīng)過(guò)卷積層,每一層會(huì)輸出由多張?zhí)卣鲌D堆積而成的長(zhǎng)方體。圖片上的紅色小方塊代表一個(gè)卷積核(隱藏單元),旁邊已標(biāo)出核的大小。箭頭上方的數(shù)字表示特征圖的數(shù)量,也即是卷積核的數(shù)量。經(jīng)過(guò)池化層,特征圖數(shù)量不變,但是特征圖的尺寸變??;經(jīng)過(guò)dropout層,特征圖尺寸不變,每一層的最下方已經(jīng)標(biāo)示出特征圖的尺寸。通過(guò)連續(xù)地卷積池化,原始圖像轉(zhuǎn)換為更高維的特征,再由全連接層將所有的特征關(guān)聯(lián)起來(lái)映射到輸出空間。
圖5 模型訓(xùn)練流程圖
對(duì)于模型的分類(lèi)結(jié)果一般采用混淆矩陣(如圖6(c))來(lái)表示?;煜仃囀且粋€(gè)m×m的數(shù)表,其中m表示類(lèi)別數(shù),列表的行表示真實(shí)的樣本類(lèi)別,列表示預(yù)測(cè)的樣本類(lèi)別。例如對(duì)于一個(gè)二分類(lèi)問(wèn)題來(lái)說(shuō),其混淆矩陣則為2×2,通過(guò)這個(gè)矩陣可以得到其敏感度(sensitivity)、特異性(specificity)、查準(zhǔn)率(precision)、查全率(recall)等指標(biāo),而不是僅僅計(jì)算模型的精度。因?yàn)閷?duì)于不均衡樣本來(lái)說(shuō),僅僅計(jì)算模型的精度并不能完整地衡量一個(gè)模型性能的好壞。例如對(duì)于樣本比例為3∶7的測(cè)試集,全部預(yù)測(cè)為其中多數(shù)類(lèi)的樣本其精度便可以達(dá)到70%。因此常常利用sensitivity、specificity、F1_score、accuracy等指標(biāo)來(lái)綜合考量模型。具體的計(jì)算公式如下:
圖6 數(shù)據(jù)增強(qiáng)(樣本左右翻轉(zhuǎn))后模型的訓(xùn)練結(jié)果
公式中TP表示真陽(yáng)性(預(yù)測(cè)和實(shí)際均為陽(yáng)性),F(xiàn)P表示假陽(yáng)性(預(yù)測(cè)為陽(yáng)性,實(shí)際為陰性),TN 表示真陰性(預(yù)測(cè)和實(shí)際均為陰性),F(xiàn)N 表示假陰性(預(yù)測(cè)為陰性,實(shí)際為陽(yáng)性)。具體可見(jiàn)圖6(c),其中1 視為陽(yáng)性,0 視為陰性。
交叉驗(yàn)證是提高模型可信度的有效方法。本文采用五折交叉驗(yàn)證法無(wú)重復(fù)抽樣地劃分訓(xùn)練數(shù)據(jù)為訓(xùn)練集和驗(yàn)證集,將訓(xùn)練數(shù)據(jù)分成五部分,每次拿四部分進(jìn)行訓(xùn)練,剩下一部分用來(lái)驗(yàn)證模型的精度;通過(guò)這種方法可以對(duì)模型進(jìn)行五次獨(dú)立的訓(xùn)練,最后取五次測(cè)試模型的精度平均值作為模型最后的驗(yàn)證精度。
由于學(xué)習(xí)樣本較少,容易造成模型過(guò)擬合,導(dǎo)致訓(xùn)練出來(lái)的模型其泛化能力不足。如果訓(xùn)練的樣本有很多,則過(guò)擬合問(wèn)題就很容易解決。對(duì)于圖像的分類(lèi)嘗試用數(shù)據(jù)增強(qiáng)進(jìn)行處理,以此減小其過(guò)擬合。數(shù)據(jù)增強(qiáng)能夠從原有的訓(xùn)練樣本中生成更多的樣本,其方法則是通過(guò)旋轉(zhuǎn)、平移、翻轉(zhuǎn)、縮放等手段來(lái)生成更多可信圖像,以此讓模型學(xué)到更多訓(xùn)練樣本中的局部信息。對(duì)于每一種手段,實(shí)驗(yàn)過(guò)程中均按批次生成訓(xùn)練樣本。具體操作為:對(duì)于旋轉(zhuǎn),計(jì)算機(jī)隨機(jī)生成順時(shí)針或逆時(shí)針旋轉(zhuǎn)不超過(guò)36度的圖像;平移分上下平移和左右平移,平移范圍不超過(guò)圖像移動(dòng)方向尺寸的0.2 倍;翻轉(zhuǎn)則分為水平翻轉(zhuǎn)和縱向翻轉(zhuǎn),從而訓(xùn)練樣本量可擴(kuò)大一倍;而縮放為隨機(jī)將圖片放大或縮小,其變化范圍不超過(guò)原來(lái)大小的0.2倍。
最后為了與文中方法進(jìn)行比較,提取轉(zhuǎn)換后的灰度圖樣本中的HOG[35](方向梯度直方圖)特征,采用SVM(支持向量機(jī))進(jìn)行分類(lèi),并記錄各項(xiàng)統(tǒng)計(jì)學(xué)指標(biāo)。
利用快速傅里葉變換將時(shí)域信號(hào)轉(zhuǎn)換到頻域,導(dǎo)出功率矩陣后轉(zhuǎn)換為灰度圖(如圖4)。每張灰度圖即代表一個(gè)信號(hào)樣本。由于睜眼和閉眼下的數(shù)據(jù)分析方法相同,以下分類(lèi)結(jié)果主要以閉眼狀態(tài)下的數(shù)據(jù)為例進(jìn)行介紹。
將上述轉(zhuǎn)換后的樣本分為訓(xùn)練集和驗(yàn)證集,其比例為4∶1,輸入卷積神經(jīng)網(wǎng)絡(luò)中進(jìn)行訓(xùn)練和測(cè)試。模型最終訓(xùn)練了150個(gè)輪次(epochs),最后驗(yàn)證精度為85%,損失值為0.32。對(duì)模型進(jìn)一步評(píng)估,計(jì)算其各項(xiàng)統(tǒng)計(jì)學(xué)指標(biāo)(表1)(以下統(tǒng)計(jì)學(xué)指標(biāo)均以抑郁癥為陽(yáng)性,精神分裂癥為陰性進(jìn)行計(jì)算)。
為了進(jìn)一步評(píng)估模型的性能,觀察模型的泛化能力是否良好,采用交叉驗(yàn)證的方法對(duì)模型進(jìn)行訓(xùn)練。每一折訓(xùn)練后計(jì)算模型的敏感度、特異性、查準(zhǔn)率、精度、F1_score 以及最后各個(gè)指標(biāo)的平均值,并繪制折線圖(圖7(a))。同時(shí)模型的平均訓(xùn)練損失和驗(yàn)證損失的差值變得更大,最后該模型的平均敏感度、特異性和精度分別為78.66%、77.83%、78.50%。
考慮到模型的復(fù)雜度較低,原始樣本的區(qū)分度小,本文在進(jìn)行數(shù)據(jù)增強(qiáng)時(shí)通過(guò)單一的變換手段對(duì)訓(xùn)練數(shù)據(jù)進(jìn)行變換,并計(jì)算不同方式下模型的各項(xiàng)統(tǒng)計(jì)學(xué)指標(biāo)(圖7(a))。經(jīng)過(guò)一系列的實(shí)驗(yàn)后發(fā)現(xiàn)僅對(duì)訓(xùn)練樣本進(jìn)行左右翻轉(zhuǎn),最后訓(xùn)練得到的模型其精度更高。樣本左右翻轉(zhuǎn)后,模型訓(xùn)練過(guò)程中訓(xùn)練精度和驗(yàn)證精度隨著訓(xùn)練輪次增加的變化情況如圖6(a),訓(xùn)練損失和驗(yàn)證損失隨著訓(xùn)練輪次增加的變化情況如圖6(b),其中模型的訓(xùn)練損失和驗(yàn)證損失相差越小表示模型的泛化能力越好,并繪制其混淆矩陣(圖6(c)),0 表示精神分裂癥,1表示抑郁癥,最右邊圖例表示顏色越淺其預(yù)測(cè)的結(jié)果準(zhǔn)確性越高。其敏感度、特異性和精度分別為84.09%、91.67%、87.50%。
采用同樣的方法對(duì)睜眼狀態(tài)下的數(shù)據(jù)進(jìn)行處理。在相同的模型下對(duì)睜眼狀態(tài)的樣本進(jìn)行訓(xùn)練和評(píng)估,通過(guò)五折交叉驗(yàn)證和不同數(shù)據(jù)增強(qiáng)方式訓(xùn)練后得到的結(jié)果如圖7(b)所示。
圖7 五折交叉驗(yàn)證和數(shù)據(jù)增強(qiáng)后的結(jié)果
為了驗(yàn)證算法的有效性,提取了灰度圖樣本中的HOG 特征,并采用SVM 進(jìn)行分類(lèi);同時(shí)與過(guò)去工作中的方法[36]進(jìn)行比較,即提取EEG 頻譜圖中的功率譜熵(信息熵,樣本熵,近似熵)用SVM分類(lèi)的方法進(jìn)行了比較,不同方法下的精度見(jiàn)表2。
表2 不同方法下的分類(lèi)精度%
本文采集了精神分裂癥和抑郁癥患者靜息態(tài)下的EEG信號(hào),試圖通過(guò)這種非侵入性的診斷方式來(lái)對(duì)兩種疾病進(jìn)行區(qū)分,跳過(guò)傳統(tǒng)模式識(shí)別的方法,不對(duì)樣本進(jìn)行手動(dòng)的特征選擇[16](如每個(gè)頻段的相對(duì)功率譜密度,每個(gè)通道下的峰值、均值、方差等)。不同于以往對(duì)于EEG 信號(hào)的表示,本文提出將時(shí)域下的EEG 信號(hào)通過(guò)一系列變換,轉(zhuǎn)換成灰度圖。這些灰度圖集成了每個(gè)信號(hào)樣本不同電極和不同頻率下的功率特征。從轉(zhuǎn)換后的灰度圖可看出多數(shù)樣本在10 Hz左右的亮度較高,即功率值較大,這也跟實(shí)際頻域下的波形圖相吻合。說(shuō)明兩類(lèi)患者的腦電Alpha 波的功率值均較高。從模型的初次分類(lèi)結(jié)果看出,兩種樣本是具有可分性的,也說(shuō)明這種數(shù)據(jù)表示方式是可行的。
模型訓(xùn)練過(guò)程中,影響訓(xùn)練效果的因素有很多。如在訓(xùn)練過(guò)程中將數(shù)據(jù)分為小批次的batch size 值,模型訓(xùn)練輪次的epochs 值,模型中每一層的隱藏單元數(shù),優(yōu)化器的種類(lèi),學(xué)習(xí)率等超參數(shù)。因此實(shí)驗(yàn)中需要對(duì)模型的結(jié)構(gòu)和超參數(shù)不斷進(jìn)行調(diào)試,以使模型的各參數(shù)達(dá)到更優(yōu)。由于本研究采用的數(shù)據(jù)樣本較少,對(duì)模型的評(píng)估可能還具有一定的偶然性。如果樣本在進(jìn)行劃分訓(xùn)練集和測(cè)試集時(shí),將質(zhì)量較差,較難區(qū)分的樣本集中分到一起時(shí),得到的結(jié)果曲線可能會(huì)出現(xiàn)較大的差異。為了得到更可靠的模型,需要對(duì)模型進(jìn)行進(jìn)一步的訓(xùn)練和評(píng)估。交叉驗(yàn)證是提高模型可信度的有效方法。經(jīng)過(guò)五折交叉驗(yàn)證后模型的平均驗(yàn)證精度為78.50%,低于初次訓(xùn)練時(shí)達(dá)到的85%,其敏感度和特異性也均有所降低。而且訓(xùn)練損失和驗(yàn)證損失的差值變大,說(shuō)明模型的泛化能力變差,還需采用其他手段進(jìn)行優(yōu)化。
當(dāng)模型過(guò)訓(xùn)練,除了學(xué)習(xí)到樣本中的數(shù)據(jù)特征,還學(xué)習(xí)了數(shù)據(jù)中所包含的噪聲,從而造成過(guò)擬合的現(xiàn)象。而過(guò)擬合往往會(huì)導(dǎo)致模型在訓(xùn)練數(shù)據(jù)中表現(xiàn)很好的性能,而對(duì)于新的樣本卻沒(méi)有預(yù)計(jì)的精度。特別是針對(duì)于模型結(jié)構(gòu)復(fù)雜而樣本量較少的情況,過(guò)擬合現(xiàn)象更加明顯。為了解決這個(gè)問(wèn)題,往往采用增加樣本的數(shù)量,減少模型的復(fù)雜度,添加正則項(xiàng)等方法。后兩種方法在模型的訓(xùn)練過(guò)程中已經(jīng)進(jìn)行了調(diào)整,因此如何增加樣本量是需要考慮的問(wèn)題??紤]到模型結(jié)構(gòu)簡(jiǎn)單,過(guò)于復(fù)雜的變換反而導(dǎo)致模型的訓(xùn)練效果差強(qiáng)人意。因此文章采用單一的數(shù)據(jù)增強(qiáng)手段來(lái)訓(xùn)練模型,其結(jié)果說(shuō)明,使用水平翻轉(zhuǎn)的方式來(lái)增加樣本量,得到的模型效果最好。模型的精度、敏感度、特異性分別達(dá)到了87.50%、84.09%、91.67%。其訓(xùn)練損失和驗(yàn)證損失的差值變小,與未進(jìn)行數(shù)據(jù)增強(qiáng)前的模型相比性能有了顯著提高。由此說(shuō)明數(shù)據(jù)增強(qiáng)不僅可以應(yīng)用于現(xiàn)實(shí)中的實(shí)物圖像,也適用于生理信號(hào)的處理,這對(duì)于醫(yī)學(xué)圖像的處理是具有借鑒價(jià)值的。
對(duì)比睜眼狀態(tài)和閉眼狀態(tài)下的EEG 分類(lèi)結(jié)果,在相同的模型下進(jìn)行五折交叉驗(yàn)證,發(fā)現(xiàn)睜眼狀態(tài)下的精度為70.75%,使用數(shù)據(jù)增強(qiáng)后的精度為72.50%,閉眼數(shù)據(jù)訓(xùn)練得到的模型的各項(xiàng)指標(biāo)均優(yōu)于睜眼狀態(tài)。并且睜眼數(shù)據(jù)訓(xùn)練曲線損失差值也較大,說(shuō)明利用睜眼數(shù)據(jù)訓(xùn)練出的模型的泛化能力要低于閉眼狀態(tài)數(shù)據(jù)訓(xùn)練出的模型。這可能是由于睜眼狀態(tài)下,病人視覺(jué)上容易受到外界景物的干擾,從而采集的EEG 數(shù)據(jù)包含更多的噪聲,造成模型的分類(lèi)效果不好。
最后為了驗(yàn)證本文EEG 灰度圖表示的有效性,提取了閉眼數(shù)據(jù)灰度圖HOG 特征進(jìn)行分類(lèi),精度達(dá)到了86.25%,略低于直接使用CNN 進(jìn)行分類(lèi)的精度。并且睜眼數(shù)據(jù)的分類(lèi)精度仍然較低。與直接使用頻域數(shù)據(jù)提取功率譜熵的方法進(jìn)行比較發(fā)現(xiàn),用CNN 分類(lèi)閉眼數(shù)據(jù)的灰度圖精度更高。進(jìn)一步證明文中提出的表示方法的有效性。
本文通過(guò)采集精神分裂癥和抑郁癥患者靜息態(tài)下的腦電信號(hào),通過(guò)卷積神經(jīng)網(wǎng)絡(luò)模型來(lái)對(duì)兩種疾病進(jìn)行分類(lèi)。通過(guò)對(duì)EEG信號(hào)進(jìn)行分析,提出將時(shí)域下的EEG信號(hào)轉(zhuǎn)換成灰度圖。利用深度卷積神經(jīng)網(wǎng)絡(luò)對(duì)兩種疾病進(jìn)行分類(lèi)并采用交叉驗(yàn)證的方法對(duì)模型進(jìn)行評(píng)估。文章通過(guò)對(duì)睜眼和閉眼下的數(shù)據(jù)分別進(jìn)行訓(xùn)練分類(lèi),發(fā)現(xiàn)閉眼狀態(tài)的數(shù)據(jù)分類(lèi)效果更好。為了進(jìn)一步提高模型的性能,采用數(shù)據(jù)增強(qiáng)的方法使模型的分類(lèi)精度、敏感度、特異性分別達(dá)到87.50%、84.09%、91.67%,與未進(jìn)行數(shù)據(jù)增強(qiáng)前的模型相比有了顯著提高。
本文以靜息態(tài)腦電信號(hào)為基礎(chǔ),利用卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行特征的自動(dòng)提取和分類(lèi),所提出的這種EEG 數(shù)據(jù)的轉(zhuǎn)換和分析方法是值的借鑒的。這些方法不僅適用于特定疾病的EEG 數(shù)據(jù),同時(shí)也能應(yīng)用于臨床上其他電生理信號(hào)的分析。因?yàn)樗梢詫㈦s亂的EEG信號(hào)轉(zhuǎn)換成卷積神經(jīng)網(wǎng)絡(luò)可以識(shí)別的圖像形式,同時(shí)也可以通過(guò)數(shù)據(jù)增強(qiáng)的方法來(lái)進(jìn)一步改善模型的性能,證明該方法除了可以用于現(xiàn)實(shí)中的實(shí)物圖像分類(lèi),還適用于電生理信號(hào)的處理。但本文也存在著一些不足:深度學(xué)習(xí)需要大量的數(shù)據(jù)作為支撐,而本文所使用的數(shù)據(jù)是匱乏的,因此為了減小過(guò)擬合,本文嘗試了多種方法。如果要投入到臨床使用中,還需要盡可能擴(kuò)大新的數(shù)據(jù)集,來(lái)訓(xùn)練更加可靠的模型。雖然EEG數(shù)據(jù)的圖像形式方便分析處理,但該形式可能會(huì)導(dǎo)致通道之間的聯(lián)系減弱,在分類(lèi)時(shí)沒(méi)有提取到有關(guān)于電極通道之間關(guān)聯(lián)性的特征。因此,接下來(lái)如何探討電極之間的關(guān)聯(lián)性,實(shí)現(xiàn)腦網(wǎng)絡(luò)的分析也將是今后研究的一個(gè)重點(diǎn)。