盧伊虹,吳禮祝,潘家輝
(華南師范大學(xué) 軟件學(xué)院 ,佛山 528225)
睡眠是人類各類生理活動進行過程中不可或缺的重要生理活動,睡眠時間大約占了人的一生中33%的時間.良好的睡眠是人們健康生活的重要保障,保證人們進行正常的學(xué)習(xí)、生活和工作等生產(chǎn)生活方式,維持人類基本的生理機能活動.然而在現(xiàn)實生活中,越來越多的人遭受到睡眠問題,這極大干擾了人的正常生活.而睡眠分期作為睡眠醫(yī)學(xué)研究過程中的一個重要步驟,可以有效監(jiān)測、檢查和評估睡眠質(zhì)量,為各類睡眠疾病診斷過程中提供了重要依據(jù),是診斷睡眠問題的關(guān)鍵前提.舊時傳統(tǒng)的人工判別睡眠分期主要是通過醫(yī)學(xué)專家的視覺分析來完成,專家需要花費很多時間去判定,且僅靠專家肉眼觀察分析,效率非常低,容易造成錯誤判斷[1].利用深度學(xué)習(xí)和機器學(xué)習(xí)等技術(shù)現(xiàn)代信號處理技術(shù)對睡眠生理信號實現(xiàn)自動分期,分期結(jié)果更加高效、客觀,這是當代研究自動化睡眠分期的主要方向趨勢,也為未來睡眠問題分析和研究提供了很多機遇和挑戰(zhàn).機器學(xué)習(xí)主要是基于輸入的自定義特征、訓(xùn)練出一個合適的分類算法模型,根據(jù)睡眠各個階段凸出的明顯特征來分類實現(xiàn)自動睡眠分期.其存在一定的局限性.一是需要專家依靠先驗知識手動設(shè)計特征.二是設(shè)計的特征不能完全與睡眠階段貼切相符,目前還沒有找到一個最優(yōu)的睡眠特征與分類器的組合,說明距離睡眠分期準確率的提高始終有“天花板”存在.而深度學(xué)習(xí)能夠從輸入的腦電數(shù)據(jù)中自動進行特征表示,可以通過睡眠腦電數(shù)據(jù)測試集中找到最優(yōu)最合適的睡眠特征,再結(jié)合分類器輸出最終的睡眠分期結(jié)果.但是深度學(xué)習(xí)算法得到的抽象特征往往不能被人們理解和解釋,網(wǎng)絡(luò)層數(shù)越多,得到的特征越復(fù)雜,同時深度學(xué)習(xí)對于調(diào)參、網(wǎng)絡(luò)層數(shù)設(shè)定、最優(yōu)算法選擇等方面需要花費很多時間精力,對開發(fā)人員也有一定的專業(yè)知識儲備要求.然而當今社會中深度學(xué)習(xí)依然是解決很多優(yōu)化分類問題的絕佳方法,具有良好的泛化性能.
基于上述考慮,本文選取CNN 卷積神經(jīng)網(wǎng)絡(luò)與BiLSTM 相結(jié)合,利用卷積神經(jīng)網(wǎng)絡(luò)中提取的高維特征向量按時間作為BiLSTM的輸入,訓(xùn)練出一個可以捕捉腦電數(shù)據(jù)時間依賴性的神經(jīng)網(wǎng)絡(luò)模型,不但可以利用卷積神經(jīng)網(wǎng)絡(luò)提取局部特征的優(yōu)勢,而且能利用雙向長短時記憶網(wǎng)絡(luò)兼顧長時間序列全局特征的優(yōu)勢,同時進行結(jié)構(gòu)建模獲取更高的分類準確率.
(1)關(guān)于睡眠分期的研究
在睡眠分期之前,首先要確定模型分析結(jié)果所要遵守的分期標準.目前典型的睡眠分期標準有兩個,一個是《人類睡眠階段標準化術(shù)語,技術(shù)及劃分系統(tǒng)手冊》,由Rechtschaffen 和Kales 提出并制定,故簡稱R&K 標準[2].另一個是由美國睡眠醫(yī)學(xué)會針對R&K 標準提出的修正版本,簡稱AASM 標準.R&K 標準,將整個睡眠過程劃分為3 個具有一定明顯不同特征的分期階段,第1 個是清醒期(W),第2 個是快速眼動期(REM),最后一個是非快速眼動期(NREM).非快速眼動期可以繼續(xù)劃分為4 個時期,即睡眠1 期、睡眠2 期、睡眠3 期和睡眠4 期,一般標記為S1 期、S2 期、S3 期和S4 期,其中,S1 期和S2 期為淺睡期(light sleep,LS),S2 期和S3 期為深睡期或慢波睡眠期(slow wave sleep,SWS).AASM 標準,與R&K 標準進行比較,其主要變化的是,將非快速眼動期分為非快速眼動一期、非快速眼動二期和非快速眼動三期,一般標記為N1 期、N2 期和N3 期,其中,N1 期和N2 期為淺睡期,N3 期為深睡期(慢波睡眠期).
(2)基于腦電信號(electroencephalogram,EEG)的睡眠分期現(xiàn)狀
現(xiàn)階段,對于獲取到的睡眠腦電信號,如何從腦電信號中提取到合適的高級特征,并根據(jù)特征將睡眠狀態(tài)進行分類,是腦電信號能否在睡眠分期中得到應(yīng)用的關(guān)鍵性一步.近年來,許多研究提出了基于腦電信號的睡眠分期算法,其中,Phan 等人在2016年使用CNN 神經(jīng)網(wǎng)絡(luò)提取原始的腦電信號中的特征,但是并不是以神經(jīng)網(wǎng)絡(luò)端到端的學(xué)習(xí)形式進行特征的提取[3].隨后,有學(xué)者對腦電信號的特征提取進行了神經(jīng)網(wǎng)絡(luò)端到端的自動學(xué)習(xí),但睡眠分期的效果并不是很好[4,5],考慮到腦電信號具有時序依賴性和連續(xù)性,研究人員曾使用循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN)進行睡眠分期,實驗結(jié)果表明RNN 網(wǎng)絡(luò)能夠有效地提高睡眠分期的準確率.然而,該模型對于一些特殊的睡眠吋期的分期準確率并不是太高[6].Supratak 等人基于原始單通道 EEG 提出了結(jié)合卷積神經(jīng)網(wǎng)絡(luò)和雙向長短期記憶網(wǎng)絡(luò)的深度學(xué)習(xí)模型DeepSleepNet,用于自動睡眠階段評分,總體準確率達到 82.00%[7];Mousavi等人基于單通道 EEG 提出了由深度卷積神經(jīng)網(wǎng)絡(luò)組成的SleepEEGNet,總體準確率達到 84.26%[8];Phan 等人提出分層遞歸神經(jīng)網(wǎng)絡(luò)SeqSleepNet,將自動睡眠分期作為序列到序列的分類問題來解決,總體準確率達到87.10%[9].近年來,隨著CNN 技術(shù)的探索發(fā)展,其被廣泛應(yīng)用于語音識別處理、圖像處理、機器視覺、自然語言等領(lǐng)域.2011年Cecotti 等人將CNN應(yīng)用到基于腦電信號的P300 研究實驗中[10],而且也有將CNN 與LSTM 進行結(jié)合應(yīng)用于時間序列的數(shù)據(jù),例如將 CNN-LSTM 進行電影類型的分類.融合CNN 與BiLSTM的模型算法還用于心律失常心拍分類中,其識別準確率相對單獨的CNN 使用與單獨的BiLSTM 使用分別提高了13.97%和7.14%[11].利用CNN 與BiLSTM 網(wǎng)絡(luò)特征結(jié)合進行文本情感分析,也能有效地提高分類的準確率[12].在進行短文本相似度計算中,CNN 與BiLSTM 相結(jié)合的網(wǎng)絡(luò)結(jié)構(gòu)模型優(yōu)于其他方法,其準確率達到84.58%[13].針對上述研究,可以發(fā)現(xiàn)CNN 與BiLSTM相結(jié)合的混合神經(jīng)網(wǎng)絡(luò)在分類問題研究中具有明顯的優(yōu)點.而睡眠數(shù)據(jù)作為一種具有時序信息的信號,顯然地,實現(xiàn)睡眠自動分期如果要達到更佳的效果,我們需要考慮到腦電信號前后數(shù)據(jù)信息之間的時序依賴性和聯(lián)系性,而CNN-BiLSTM 神經(jīng)網(wǎng)絡(luò)可以更好地探究睡眠數(shù)據(jù)前后序列時間信息的關(guān)聯(lián)和依賴,所以本文中采用CNN-BiLSTM神經(jīng)網(wǎng)絡(luò)模型對睡眠腦電數(shù)據(jù)進行分期研究.
本文模型使用的睡眠數(shù)據(jù)是MIT-BIH 生理信息庫中Sleep-EDF 的多通道腦電信號的真實數(shù)據(jù),數(shù)據(jù)記錄了正常人的睡眠狀態(tài)數(shù)據(jù).對腦電信號數(shù)據(jù)的預(yù)處理方法步驟如下.
(1)首先提取公開數(shù)據(jù)集中兩個EEG 信號(Fpz-Cz 通道和Pz-Oz 通道)與醫(yī)學(xué)專家人工判別的睡眠分期標簽,將其解析存儲為pkl 文件.
(2)把連續(xù)30 s 的睡眠數(shù)據(jù)劃分為一個睡眠片段,按照專家的判定將每個睡眠片段劃分為WAKE、NERM和REM 期,根據(jù)對應(yīng)的睡眠分期標簽“W,1,2,3,4,R”轉(zhuǎn)化為“0,1,1,1,1,2”,即分別對應(yīng)著3 分類睡眠階段.
(3)每次加載5 個連續(xù)30 s 的睡眠數(shù)據(jù)和判別標簽,對數(shù)據(jù)使用Mel 帶通濾波器處理,可以得出相應(yīng)的頻譜Mel Spectrogram.濾波后,將其中每5 段連續(xù)30 s的腦電信號數(shù)據(jù)歸為一個組別,構(gòu)造成為特征矩陣.
卷積神經(jīng)網(wǎng)絡(luò)(CNN)的核心思想是:局部感知野、權(quán)值共享和下采樣pooling 層,這3 種核心思想共同作用,減少了網(wǎng)絡(luò)使用的內(nèi)存量,簡單化網(wǎng)絡(luò)參數(shù),提高了精度準確率和網(wǎng)絡(luò)運算速度,緩解了過擬合的網(wǎng)絡(luò)問題[14].從功能結(jié)構(gòu)劃分來看,卷積神經(jīng)網(wǎng)絡(luò)可以分為6 個部分:信息輸入層、卷積運算層、歸一化層、ReLU 激活層、池化層和全連接層.本文模型用到的CNN 深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示.
圖1 CNN 網(wǎng)絡(luò)結(jié)構(gòu)圖
卷積運算層主要進行兩個關(guān)鍵步驟操作:數(shù)據(jù)局部關(guān)聯(lián)和窗口滑動.卷積運算層公式如下:
式中,fcov為激活函數(shù),Hi代表卷積網(wǎng)絡(luò)的第i層的特征輸出,運算符“ ?”代表卷積運算,bi是偏置項,Wi表示第i層使用的卷積核的權(quán)重值,卷積操作的輸出與偏置項的結(jié)果進行相加,再將數(shù)據(jù)通過激活函數(shù)進行處理,CNN 網(wǎng)絡(luò)的卷積操作能夠提取輸入數(shù)據(jù)信號的各種不一樣的特征[6].在CNN 網(wǎng)絡(luò)中的數(shù)據(jù)輸入層將幅度歸一化到同樣的范圍,其輸出數(shù)據(jù)再作為激活層的輸入值,以調(diào)整激活函數(shù)的偏導(dǎo).目前,ReLU函數(shù)作為比較常用的激活函數(shù),在本文中我們采用ReLU 函數(shù):
這里使用max 最大值函數(shù)對輸入值和0 進行比較取最大值.激活函數(shù)可以加入非線性因素,解決線性模型不能解決的問題,同時提高模型魯棒性和充分組合特征,將特征圖投射到新的一個特征空間,有利于訓(xùn)練睡眠數(shù)據(jù).激活層后面緊接著的是池化層,本文網(wǎng)絡(luò)模型采用最大化池化方法,池化層主要作用有特征降維、特征不變性和避免過擬合.全連接層一般出現(xiàn)在池化層的后面,用于分類,對提取的特征進行整合處理[15].最后輸出層采用Softmax 函數(shù)作為激活函數(shù),輸出EEG 信號睡眠分期三分類結(jié)果.
LSTM 長短期記憶神經(jīng)網(wǎng)絡(luò)本質(zhì)上屬于一種特殊的RNN 神經(jīng)網(wǎng)絡(luò).與傳統(tǒng)普通的RNN 進行比較,LSTM能夠?qū)W習(xí)長序列信息前后的依賴和關(guān)聯(lián)關(guān)系,記錄間隔或延遲較長的歷史信息和重要事件.從結(jié)構(gòu)來看,LSTM的結(jié)構(gòu)中添加了一個細胞神經(jīng)狀態(tài)單元,由門控制去選擇性地讓信息通過,添加或者刪除信息.LSTM神經(jīng)網(wǎng)絡(luò)具有3 大特殊功能門,即遺忘門、輸入門和輸出門[16].LSTM 詳細結(jié)構(gòu)架構(gòu)圖如圖2所示.
圖2 LSTM 模型結(jié)構(gòu)圖
相關(guān)計算公式如下:
考慮到腦電EEG 數(shù)據(jù)是非平穩(wěn)、非線性數(shù)據(jù),傳統(tǒng)的方法進行睡眠自動分期遇到了諸多困難.目前來說,CNN 適合處理網(wǎng)絡(luò)結(jié)構(gòu)數(shù)據(jù)如計算機視覺的圖片二維數(shù)據(jù).LSTM 深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)改善了RNN 梯度消失和爆炸的問題,與之相比更適合處理長時序序列前后類型如腦電信號的數(shù)據(jù),尤其在預(yù)估和處理長序列數(shù)據(jù)中間隔或延遲相對時間比較長的事件方面有極大的優(yōu)勢.但是就目前來看,CNN 和LSTM 相結(jié)合形成的神經(jīng)網(wǎng)絡(luò)模型應(yīng)用于一維生物信號(如EEG、EOG、EMG 等)的分類相對較少.
本文深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)模型主要是由卷積神經(jīng)網(wǎng)絡(luò)和雙向長短時記憶神經(jīng)網(wǎng)絡(luò)兩部分組成.CNN 是深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)的一個重要部分,它的權(quán)值共享網(wǎng)絡(luò)結(jié)構(gòu),使神經(jīng)網(wǎng)絡(luò)模型的復(fù)雜度下降,且圖像數(shù)據(jù)輸入到CNN 網(wǎng)絡(luò)中,從而減少復(fù)雜的數(shù)據(jù)提取特征過程和重新建構(gòu)數(shù)據(jù)過程,上一層的局部數(shù)據(jù)區(qū)域通過窗口滑動和權(quán)值共享的卷積核運算操作可以得到下一層的特征,這個特性使得CNN 比其他神經(jīng)網(wǎng)絡(luò)模型對圖像特征的提取、研究、表示與分析更加準確和高效.在本文中,CNN 用來提取腦電數(shù)據(jù)的特征,基于EEG 信號的時頻分析可以得出三維特征矩陣,之后用來構(gòu)建自動睡眠分期網(wǎng)絡(luò)模型.由于人的睡眠數(shù)據(jù)中包含著大量時間序列數(shù)據(jù)信息,而且其在時域上也包含一定的各個不同的睡眠期的隱含特征信息,本文考慮到每個睡眠周期前后是有關(guān)聯(lián)的和有聯(lián)系的,所以采用的模型為卷積神經(jīng)網(wǎng)絡(luò)與雙向長短時記憶神經(jīng)網(wǎng)絡(luò)(BiLSTM)的結(jié)合.前向LSTM 和后向LSTM的結(jié)合構(gòu)成了雙向長短時記憶網(wǎng)絡(luò) BiLSTM,BiLSTM 從兩個不同方向處理長序列的睡眠腦電數(shù)據(jù)信息,可以更好地挖掘探索雙向時序信息和捕捉前后時序數(shù)據(jù)信息關(guān)聯(lián)和依賴性.
該網(wǎng)絡(luò)可以自動提取腦電信號EEG 的長時間序列信息.該神經(jīng)網(wǎng)絡(luò)最后一層是Softmax 分類器輸出層,用于輸出各類睡眠分期結(jié)果的概率.圖3 是本文的CNN-BiLSTM 網(wǎng)絡(luò)模型架構(gòu)概括圖.
圖3 本文模型結(jié)構(gòu)圖
首先將原始信號經(jīng)過預(yù)處理,計算每段30 s 的時間序列EEG 數(shù)據(jù)的Mel 頻譜圖,再將兩個腦電通道的數(shù)據(jù)分別按照5 組連續(xù)的30 s 睡眠片段作為5 組連續(xù)的時間關(guān)聯(lián)數(shù)據(jù)輸入到模型中.輸入層大小為(64,47).模型使用兩個二維卷積層(Conv2d),第一個卷積層的卷積核個數(shù)為8,卷積核大小為(3,3),第二個卷積層的卷積核個數(shù)為16,卷積核大小為(3,3);在兩個卷積層之后進行批標準化(batch normalization);通過ReLU激活函數(shù);再通過二維最大池化層(MaxPooling2d),大小均為(4,4);為了避免訓(xùn)練過程中的過擬合問題[17],dropout 層(ratio=0.2)需要連接到每個池化層后面;再連接Flatten 層,將多維數(shù)據(jù)轉(zhuǎn)化為一維數(shù)據(jù),實現(xiàn)數(shù)據(jù)從卷積層過渡到全連接層;經(jīng)過標準的Dense 一維全連接層,輸出維度為30,進行歸一化和ReLU 激活函數(shù),實現(xiàn)從卷積層到長短時記憶神經(jīng)網(wǎng)絡(luò)的過渡;每5 組連續(xù)的時間關(guān)聯(lián)數(shù)據(jù)的睡眠信號經(jīng)過卷積神經(jīng)網(wǎng)絡(luò)提取特征后,得到(5,60)輸出維度;模型使用一個雙向的長短時記憶時間網(wǎng)絡(luò),其中LSTM 輸出維度unit=15,經(jīng)過前后向LSTM的結(jié)合得到的數(shù)據(jù)維度為(5,30);最后將BiLSTM 輸出的特征經(jīng)過Softmax 層進行三分類任務(wù),將睡眠狀態(tài)分為WAKE,NREM,REM 三個時期.
我們使用多分類的對數(shù)損失函數(shù)(categorica_crossentropy),該損失函數(shù)與Softmax 分類器相對應(yīng);通過Adam 優(yōu)化損失函數(shù),能夠動態(tài)地調(diào)整每個參數(shù)的學(xué)習(xí)率.為了避免過擬合現(xiàn)象,模型在訓(xùn)練過程中使用了早停機制,若連續(xù)迭代3 次損失率不下降,則停止訓(xùn)練.
實驗數(shù)據(jù)為MIT-BIH 生理信息庫Sleep-EDF 多參數(shù)睡眠數(shù)據(jù)集,包含197 個整夜的多導(dǎo)睡眠圖(polysomno graphic,PSG)睡眠記錄,其中包含EEG,EOG 等生理數(shù)據(jù),每條數(shù)據(jù)均有明確的人工睡眠分期標簽,該數(shù)據(jù)集由睡眠盒式磁帶對年齡在25-101 歲的健康白人記錄了大約20 小時的PSG 和利用射頻發(fā)射的記錄儀對22 名白人男性和女性服用藥物后在醫(yī)院記錄了大約9 個小時的PSG 組成.
根據(jù) R&K 標準,根據(jù)睡眠信息數(shù)據(jù)各階段的不同特征,我們可以將睡眠階段分為3 期,即人體睡眠清醒期、快速眼動期和非快速眼動期.本實驗采用兩個通道(EEG Fpz-Cz 和EEG Pz-Oz)的數(shù)據(jù)組合,記錄頻率為100 Hz,劃分連續(xù)30 s 的睡眠腦電數(shù)據(jù)作為睡眠樣本單元,最后顯示一個總的參考性的睡眠狀態(tài).
在本文實驗中,我們選擇數(shù)據(jù)集中80%的數(shù)據(jù)作為數(shù)據(jù)訓(xùn)練集來訓(xùn)練網(wǎng)絡(luò)模型,10%的數(shù)據(jù)作為驗證集驗證模型的能力從而進行模型迭代訓(xùn)練,10%的數(shù)據(jù)作為測試集評估模最終模型的泛化能力.
這里采用測試集的睡眠分期結(jié)果的準確率P來評價各階段睡眠分期分類結(jié)果.
其中,各睡眠分期(WAKE,NREM,REM)都用NP表示預(yù)測出正確睡眠分期分類結(jié)果的樣本數(shù)量,N代表對應(yīng)睡眠分期階段在模型實驗過程中使用的腦電數(shù)據(jù)樣本數(shù)量.
采取子類平均準確AVG評價睡眠分期方法.
式中,Pi,i=1,2,3 分別表示 WAKE,NREM,REM 3 期的子類睡眠分期準確率.
本文采用Sleep-EDF 數(shù)據(jù)集的CNN-BiLSTM 神經(jīng)網(wǎng)絡(luò)模型實現(xiàn)自動睡眠分期,使用23 個實驗對象的腦電數(shù)據(jù)作為測試集對訓(xùn)練完成的模型進行精度檢測,最終預(yù)測結(jié)果的混淆矩陣如表1所示.
表1 分期混淆矩陣表
混淆矩陣能夠很好地檢測分類的準確性,其每一列代表預(yù)測的睡眠階段數(shù),每一行代表的是實際的睡眠階段數(shù).本文睡眠分期為三分類任務(wù),即得到的混淆矩陣為3×3 矩陣,其中,對角線上的數(shù)值代表正確的分類數(shù),非對角線上的數(shù)據(jù)代表錯誤的分類數(shù).從表1可得,測試集中實際為WAKE 期睡眠狀態(tài)的數(shù)據(jù)共有37 244 個,模型將其中676 個數(shù)據(jù)分類為NREM 期,105 個數(shù)據(jù)分類為REM 期;測試集中實際為NREM期睡眠狀態(tài)的數(shù)據(jù)共有15 643 個,模型將其中391 個數(shù)據(jù)分類為WAKE 期,817 個數(shù)據(jù)分類為REM 期;測試集中實際為REM 期睡眠狀態(tài)的數(shù)據(jù)共有4 228 個,模型將其中85 個數(shù)據(jù)分類為WAKE 期,902 個數(shù)據(jù)分類為NREM 期.
從表中的混淆矩陣可以計算得出,模型在WAKE期的準確率P可以達到97.9%,在NREM 期P可以達到92.3%,都具有較高的準確率,在REM 期的準確率P為76.7%,目前還有待提升.圖4 給出了每個睡眠階段時期的分期準確率數(shù)據(jù)顯示.
圖4 分期準確率
根據(jù)式(10)可以求得模型的平均準確率ACC=89.0%.從圖4 中可以看出,3 個睡眠時期都取得了較高的分期準確率.進一步結(jié)合表1 的分期結(jié)果混淆矩陣分析可得,本文提出的睡眠分期算法能夠較精確地識別出WAKE 期和NREM 期,準確率分別達到97.9%和92.3%.除此之外,REM 期的準確率也達到了76.7%以上.在對腦電信號進行自動睡眠分期的過程中,本文所提出的分期算法的總體準確率可以達到89.0%,這表明本文提出的算法模型在自動睡眠分期應(yīng)用中具有良好的分期效果.
目前己經(jīng)有很多的學(xué)者致力于對睡眠腦電EEG的自動分期研究,為了能夠更加全面地分析本文模型算法的分期結(jié)果,本文將近年來有代表性的基于Sleep-EDF 公共數(shù)據(jù)集的睡眠分期模型與本文的模型進行了對比分析,如表2所示.
表2 中,Tsinalis 等人[18,19]使用機器學(xué)習(xí)算法Complex Morlet Wavelets+L-BFGS 對Fpz-Cz 和Pz-Oz 兩個通道進行五分類睡眠分期,得到78.9%的準確率,隨后,又使用 CNN 神經(jīng)網(wǎng)絡(luò)模型進行單通道睡眠信號五分類分期,并從公開數(shù)據(jù)集選取20 位實驗對象的數(shù)據(jù)進行分析,最終得到74.8%的準確率,這與本文選取23 位實驗對象進行準確率評估較為接近;除此之外,Hassan等人[20]使用Spectral features+K-W test+AdaBoost.M2的模型對Pz-Oz 單個腦電通道進行四分類睡眠分期,得到82.8%的準確率;Andreotti 等人[21]使用ResNet模型對Fpz-Cz+EOG 的腦電信號和眼電信號進行五分類睡眠分期,得到86.1%的準確率;Phan 等人[3]使用Image representation + MTCNN 模型對Fpz-Cz+EOG的腦電信號和眼電信號進行五分類睡眠分期,得到82.3%的準確率;Chen 等人[22]使用Wavelet+SVM 模型對單個Fpz-Cz 腦電通道進行四分類睡眠分期,得到86.8%的準確率.對比表2 中的結(jié)果,單純從算法的準確率上比較,本文提出的算法在同一個數(shù)據(jù)集上的準確率達到一個較高的水平.
表2 基于Sleep-EDF 公共數(shù)據(jù)集的其它文獻比較
可以看出,本文提出的算法在睡眠分期的準確度上有了一定的突破.與其它文獻中的分期方法相比,本文模型具有以下不同:①本文創(chuàng)新性地采用Mel 濾波器進行睡眠腦電信號的預(yù)處理,對每一個睡眠周期計算Mel 頻譜圖,通過Mel 頻譜對信號進行時頻轉(zhuǎn)換具有不錯的效果;②本文采用了融合CNN 和BiLSTM的神經(jīng)網(wǎng)絡(luò)模型,充分挖掘了雙向時間結(jié)構(gòu)的信息,實現(xiàn)更精確的特征提取;③本文實現(xiàn)的是三分類算法,在一定程度上也提高了模型的準確率.
為了更清楚地展示本文所提出的模型對于睡眠時期自動分類的結(jié)果,本文將公開數(shù)據(jù)集的其中一名實驗者數(shù)據(jù),也就是文件名為SC4001E0-PSG.edf 的專家給定標簽以及本文模型預(yù)測的結(jié)果進行分別繪制了睡眠時相圖,其中橫軸為時間,即持續(xù)了23 小時的睡眠數(shù)據(jù),縱軸為3 個睡眠期分類.
圖5 中給出了專家對這個持續(xù)23 小時的實驗睡眠數(shù)據(jù)進行了人工判定,實驗被試在不同的時間段分別處于不同的睡眠階段,根據(jù)人工判斷結(jié)果,在12:35-20:35 時間段與03:35 之后的時間內(nèi),該名被試者一直處于WAKE 期,在20:35-03:35 時間段內(nèi),被試者進入睡眠狀態(tài),其睡眠狀態(tài)隨著時間的改變在WAKE、NREM、REM 三種睡眠狀態(tài)下不斷進行變化.而圖6中則是使用本文提出的模型對該睡眠數(shù)據(jù)進行分期的結(jié)果.從模型進行分期的結(jié)果中可以看到,模型對這個持續(xù)23 小時的睡眠數(shù)據(jù)都進行了分期,且在12:35-20:35 時間段和03:35 之后的時間內(nèi),模型得到的分期結(jié)果也為WAKE 期,與圖5 基本接近;在20:35-03:35時間段內(nèi),模型得出的分期結(jié)果也在WAKE、NREM、REM 三種睡眠狀態(tài)下進行變化,但與圖5 還存在一些差異.
圖5 專家分期結(jié)果時相圖
圖6 預(yù)測結(jié)果時相圖
通過對比圖5 和圖6,可以看出本文自動睡眠分期模型與專家人工判別結(jié)果具有較大的重合性,進一步驗證了本文模型的準確性較高.但在不同睡眠時期的過渡階段,模型判定的結(jié)果和專家分期結(jié)果有些不同,考慮到處于過渡時期的睡眠可能具有不同時期的特征,所以這一誤差具有一定的合理性,同時也為本文進一步研究發(fā)展指明了方向.
經(jīng)過實驗證明,本文提出的基于算法對睡眠信號具有較好的分期性能.算法選取Sleep-EDF 數(shù)據(jù)集中雙通道腦電數(shù)據(jù)Fpz-Cz 和Pz-Oz 進行分析,使用Mel 頻譜對信號睡眠信號進行預(yù)處理,結(jié)合卷積神經(jīng)網(wǎng)絡(luò)和雙向長短時記憶神經(jīng)網(wǎng)絡(luò)進行時頻域特征的提取,目前在睡眠分期領(lǐng)域取得了比較好的性能.實驗結(jié)果表明,本文模型在公開的睡眠數(shù)據(jù)集上取得了89.0%的整體準確率,其中WAKE 期的準確率達到97.9%,NREM 期的準確率達到92.3%,REM 期的準確率達到76.7%,證明該模型具有良好的睡眠分期能力.再通過將本文的工作與其他算法進行比較,進一步驗證了本文算法的有效性.
同時,在對比其他不需要手動提取特征的模型時,本文需要用到的生理信號更少,只需要兩個通道的腦電信號.除此之外,本文模型的網(wǎng)絡(luò)結(jié)構(gòu)更加簡單,訓(xùn)練速度也更快.這對于不穩(wěn)定、有起伏變化、非線性的腦電信號數(shù)據(jù)分析處理提供了新的研究思路想法和參考價值.
然而,本文提出的算法還存在一定的缺點,在不同睡眠時期的過渡階段,算法的判定結(jié)果與專家分期結(jié)果還存在一定的差異,這表明了該算法的分期準確率還有一定上升的空間,為本文進一步研究與發(fā)展指明了方向.