王曉麗
(長(zhǎng)春大學(xué) 電子信息工程學(xué)院,長(zhǎng)春 130022)
癲癇疾病是大量腦神經(jīng)細(xì)胞群引起的腦皮質(zhì)興奮性異常的神經(jīng)系統(tǒng)紊亂性疾病,具有突然性[1]。癲癇發(fā)作期的腦電波形會(huì)成棘波、尖波狀等情況,臨床醫(yī)學(xué)中通常采用長(zhǎng)時(shí)間的腦電監(jiān)測(cè)來(lái)判別患者是否發(fā)病。腦電圖(Electroencephalogram,EEG)是將腦部神經(jīng)活動(dòng)通過(guò)電位的生理活動(dòng)來(lái)記錄的方式,在對(duì)癲癇疾病的檢測(cè)中處于不可取代的地位[2]。但在監(jiān)測(cè)過(guò)程中產(chǎn)生大量的腦電信號(hào)數(shù)據(jù),依靠人工的識(shí)別需要耗費(fèi)大量的時(shí)間,并且判定的結(jié)果存在著主觀性。因此,采用深度學(xué)習(xí)無(wú)疑是解決癲癇腦電信號(hào)自動(dòng)識(shí)別的有力手段。
“機(jī)器學(xué)習(xí)”統(tǒng)屬于人工智能領(lǐng)域,包含有監(jiān)督學(xué)習(xí)、無(wú)監(jiān)督學(xué)習(xí)以及半監(jiān)督學(xué)習(xí)三種。近年來(lái),“深度學(xué)習(xí)”逐漸成為機(jī)器學(xué)習(xí)研究中的一個(gè)新的領(lǐng)域[3]。
圖1 基本BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖
深度學(xué)習(xí)從基本結(jié)構(gòu)看等同于深度神經(jīng)網(wǎng)絡(luò)。深度神經(jīng)網(wǎng)絡(luò)通過(guò)多層次特征學(xué)習(xí)方法,網(wǎng)絡(luò)層數(shù)越多,越能夠?qū)崿F(xiàn)復(fù)雜函數(shù)的逼近,進(jìn)而使其可以表達(dá)淺層神經(jīng)網(wǎng)絡(luò)所不具有的特征表達(dá)能力。
基本BP(Back-Propagate)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖如圖1所示,它由L1輸入層、L2隱藏層和L3輸出層三個(gè)部分組成。深度學(xué)習(xí)通過(guò)組合低層特征形成更加抽象的高層表示屬性類(lèi)別或特征,以發(fā)現(xiàn)數(shù)據(jù)中隱藏的分布式特征表示[5]。因此,對(duì)研究者相關(guān)先驗(yàn)知識(shí)要求低,關(guān)鍵要數(shù)據(jù)充足,即提供了重組的輸入層,算法擬合程度才能夠達(dá)到最佳,再通過(guò)多次訓(xùn)練,就會(huì)等到更好的結(jié)果。因此,深度學(xué)習(xí)越來(lái)越多地應(yīng)用于處理信息量較大的場(chǎng)合。
基于深度學(xué)習(xí)的癲癇腦電信號(hào)分析與檢測(cè)首先應(yīng)選取研究對(duì)象,即樣本。進(jìn)而對(duì)其進(jìn)行預(yù)處理,再提取電線腦電信號(hào)特征,然后進(jìn)一步分析,最后采用分類(lèi)器完成信號(hào)的分類(lèi),從而完成癲癇腦電信號(hào)的檢測(cè)。其結(jié)構(gòu)示意圖如圖2所示。
圖2 系統(tǒng)結(jié)構(gòu)示意圖
深度學(xué)習(xí)的實(shí)現(xiàn)要依靠真實(shí)有效的數(shù)據(jù)源作基礎(chǔ),目前世界上對(duì)癲癇腦電信號(hào)研究中最為普遍的腦電數(shù)據(jù)庫(kù)一共有兩個(gè)。
2.1.1 波恩大學(xué)癲癇數(shù)據(jù)庫(kù)
該數(shù)據(jù)庫(kù)共采集了10名志愿者的數(shù)據(jù),放于5個(gè)集合之中,分別標(biāo)號(hào)為A、B、C、D、E。其中,A組和B 組的腦電數(shù)據(jù)采集于5 名健康志愿者的皮層腦電,A 組的志愿者處于意識(shí)清醒且睜眼狀態(tài),B 組的志愿者處于意識(shí)清醒且閉眼狀態(tài)。C、D、E 三組腦電數(shù)據(jù)采集于5 名癲癇病灶位于海馬區(qū)的癲癇患者術(shù)前的顱內(nèi)腦電。數(shù)據(jù)采樣頻率為173.61Hz。5 個(gè)數(shù)據(jù)子集中,每個(gè)子集包含100 段腦電信號(hào)段,每段數(shù)據(jù)包含4097 個(gè)數(shù)據(jù)點(diǎn),時(shí)長(zhǎng)約23.6 秒[4]。
2.1.2 CHB-MIT Scalp EEG兒童癲癇腦電數(shù)據(jù)庫(kù)
該數(shù)據(jù)庫(kù)收集了23個(gè)病例的記錄。其中共22名受試者,包括5名男性(3~22歲)、 17名女性(1.5~19歲),并且一名女性chb01在病例1.5年后又采集樣本為chb21。每個(gè)案例包含了9到42個(gè)連續(xù)的.edf文件。在大多數(shù)情況下,.edf文件只包含一小時(shí)的數(shù)字化EEG信號(hào),只有案例chb10是2小時(shí)長(zhǎng),案例chb04,chb06, chb07,chb09和chb23是4小時(shí)長(zhǎng)。所有信號(hào)均以每秒256個(gè)樣本采樣,分辨率為16位[5]。
提取腦電信號(hào)的特征是進(jìn)行腦電信號(hào)分類(lèi)的核心。對(duì)于癲癇腦電信號(hào)的特征提取主要包括時(shí)域分析方法、頻域分析方法、時(shí)頻域分析方法、非線性分析方法等。隨著人工智能的發(fā)展,又出現(xiàn)了多種分析角度的癲癇腦電特征提取方法。在深度學(xué)習(xí)中,捕捉數(shù)據(jù)最重要特征的神經(jīng)網(wǎng)絡(luò),即自編碼器神經(jīng)網(wǎng)絡(luò)。
自編碼器神經(jīng)網(wǎng)絡(luò)是一種無(wú)監(jiān)督學(xué)習(xí)技術(shù),利用神經(jīng)網(wǎng)絡(luò)進(jìn)行表征學(xué)習(xí)。即輸入的特征x1、x2…xn之間存在某種特殊的聯(lián)系,但是這些聯(lián)系不需要人為地進(jìn)行特征提取,而是放到網(wǎng)絡(luò)里面進(jìn)行學(xué)習(xí),最終濃縮為更精煉、數(shù)量更少的特征h1、h2…h(huán)m。其中m 圖3 自編碼器的一般結(jié)構(gòu) 2.3.1 基于循環(huán)神經(jīng)網(wǎng)絡(luò)的癲癇腦電信號(hào)分析 RNN(Recurrent Neural Networks)循環(huán)神經(jīng)網(wǎng)絡(luò),允許信息的持久化。但在處理長(zhǎng)期記憶時(shí)出現(xiàn)的缺陷,LSTM(Long Short Term)網(wǎng)絡(luò)可以彌補(bǔ)。LSTM是一種基于RNN的特殊變形,通過(guò)引入細(xì)胞狀的概念,不單單只考慮最近的狀態(tài),而是通過(guò)細(xì)胞的狀態(tài)來(lái)決定狀態(tài)的去留。其二結(jié)構(gòu)圖如圖4所示。 (a)RNN結(jié)構(gòu)示意圖 (b)LSTM結(jié)構(gòu)示意圖圖4 RNN 與LSTM的結(jié)構(gòu)示意圖 通過(guò)LSTM(Long Short Term)網(wǎng)絡(luò)可達(dá)到以下功能: (1)遺忘部分細(xì)胞狀態(tài) 通過(guò)最左邊的通路,也就是sigmoid函數(shù)實(shí)現(xiàn)。根據(jù)輸入和上一時(shí)刻的輸出來(lái)決定當(dāng)前細(xì)胞狀態(tài)是否有需要被遺忘的內(nèi)容。 (2)加入新?tīng)顟B(tài) 新進(jìn)來(lái)的主語(yǔ)被加入到細(xì)胞狀態(tài)中,同理也是靠sigmoid函數(shù)經(jīng)過(guò)tanh來(lái)決定應(yīng)該記住哪些內(nèi)容。此處的sigmoid和前一步的sigmoid層的w和b不同,是分別訓(xùn)練的層。進(jìn)而形成下一時(shí)刻的細(xì)胞狀態(tài)輸入。 (3)當(dāng)前狀態(tài)的輸入決定其輸出 最右側(cè)的通路,通過(guò)sigmoid函數(shù)作門(mén),對(duì)第二步求得的狀態(tài)作tanh后的結(jié)果過(guò)濾,從而得到最終的預(yù)測(cè)結(jié)果。增加了對(duì)過(guò)去狀態(tài)的過(guò)濾,從而可以選擇哪些狀態(tài)對(duì)當(dāng)前更有影響,而不是簡(jiǎn)單地選擇最近的狀態(tài)。 2.3.2 基于Softmax回歸的癲癇腦電信號(hào)分類(lèi) 隨著深度學(xué)習(xí)多分類(lèi)的發(fā)展,Logistic 回歸模型推廣為Softmax 回歸形式。圖5是一個(gè)典型的神經(jīng)網(wǎng)絡(luò),由輸入層、特征處理層,全連接層組成。通過(guò)Softmax分類(lèi)器在全連接層的輸出端得到一個(gè)輸入樣本的條件概率。 圖5 Softmax多分類(lèi)神經(jīng)網(wǎng)絡(luò) Softmax回歸的函數(shù)表達(dá)式為: (1) 對(duì)應(yīng)于每個(gè)輸入值x都會(huì)有一系列的概率得出,即p(y=j|x),這一過(guò)程可以用向量表示: (2) 由此可以得到Softmax的代價(jià)函數(shù)定義式: (3) 其中,1{j=y(i)}是示性函數(shù),其取值規(guī)則為:1{值為真的表達(dá)式}=1,1{值為假的表達(dá)式}=0。Softmax回歸中將x分類(lèi)為類(lèi)別j的概率為: (4) (5) 對(duì)于J(θ)的最小化,使用迭代的優(yōu)化算法,如采用梯度下降算法,其中的偏導(dǎo)數(shù)求解如下: θj:=θj-αδθjJ(θ), (6) J(θ)對(duì)θj求偏導(dǎo)得到: (7) 最后通過(guò)迭代,使得損失函數(shù)達(dá)到最小,實(shí)現(xiàn) Softmax 回歸的分類(lèi)。目前,Softmax 回歸在深度學(xué)習(xí)的多分類(lèi)問(wèn)題中被廣泛應(yīng)用。 基于深度學(xué)習(xí)的癲癇腦電信號(hào)分析與預(yù)測(cè)在近幾年走進(jìn)人們的視野,對(duì)于腦電信號(hào)采用深度學(xué)習(xí)的方法目前存在以下問(wèn)題: (1)深度神經(jīng)網(wǎng)絡(luò)層數(shù)的最優(yōu)化,不是越多的網(wǎng)絡(luò)層數(shù)就能得到最好的結(jié)果。 (2)非線性的大腦檢測(cè)到的腦電信號(hào)輸入大多數(shù)為圖像數(shù)據(jù),而采用數(shù)據(jù)點(diǎn)存在的數(shù)據(jù)目前仍受到一定的制約,數(shù)據(jù)的量也是造成深度學(xué)習(xí)方法無(wú)法深入的原因。本文主要就目前深度學(xué)習(xí)的腦電信號(hào)診斷癲癇作了籠統(tǒng)的總結(jié)與介紹,為未來(lái)采用深度學(xué)習(xí)方法診斷、檢測(cè)癲癇疾病可以提供一些理論參考。2.3 癲癇腦電信號(hào)的分析與分類(lèi)
3 前景展望
長(zhǎng)春大學(xué)學(xué)報(bào)2019年6期