葉 仙, 胡 潔, 田 畔, 戚 進(jìn), 車大鈿, 丁 穎
(1. 上海交通大學(xué) 機(jī)械與動(dòng)力工程學(xué)院, 上海 200240; 2. 上海市兒童醫(yī)院, 上海 200240)
人類1/3的時(shí)間都在睡眠中度過.與睡眠相關(guān)的疾病,如睡眠呼吸暫停以及低通氣等睡眠障礙嚴(yán)重地影響了患者的生活質(zhì)量.調(diào)查顯示[1],超過2%的成年女性以及4%的成年男性患有阻塞型呼吸暫停.在睡眠疾病的研究中,睡眠分期是必不可少的關(guān)鍵步驟.臨床上按照Rechtchaffen and Kales(簡(jiǎn)稱R&K)分期準(zhǔn)則[2]將睡眠過程分為清醒期(W)、非快速眼動(dòng)期(N)和快速眼動(dòng)期(R).N期又被分為非快速眼動(dòng)1期(N1)、非快速眼動(dòng)2期(N2)、非快速眼動(dòng)3期(N3)和非快速眼動(dòng)4期(N4),其中N3和N4通常被整合成深睡眠期.醫(yī)療人員根據(jù)美國(guó)睡眠醫(yī)學(xué)會(huì)(AASM)標(biāo)準(zhǔn)[3],通過觀察α節(jié)律波、紡錘波和K復(fù)合波等特征來判別睡眠階段.人的整夜睡眠時(shí)間為7~8 h,人工進(jìn)行睡眠分期通常需要花費(fèi) 2~4 h,并且不同專家的判讀結(jié)果一致度低于90%.針對(duì)人工睡眠分期效率低、準(zhǔn)確性不高的問題,研究人員提出采用自動(dòng)區(qū)分睡眠過程的方法代替?zhèn)鹘y(tǒng)的經(jīng)驗(yàn)判讀方法.
睡眠分期主要包含睡眠信號(hào)(1幀圖像)的特征提取以及睡眠時(shí)段的分類.睡眠信號(hào)的特征提取方法主要包括時(shí)域分析、頻域分析、時(shí)頻分析[4]和復(fù)雜性分析等方法.其中,復(fù)雜性分析方法是通過表征系統(tǒng)的動(dòng)態(tài)特性來研究信號(hào)內(nèi)在特征的,已經(jīng)成為生物信號(hào)時(shí)間序列的研究方向.熵作為表征系統(tǒng)復(fù)雜度的重要指標(biāo),可用于區(qū)分人體生理信號(hào)的復(fù)雜度.Costa等[5]提出多尺度熵(MSE)方法,通過粗?;姆绞綄?duì)時(shí)間序列進(jìn)行多尺度劃分,以實(shí)現(xiàn)對(duì)時(shí)間序列的多尺度分析.MSE方法能夠分析時(shí)間序列隱藏在不同尺度的模式信息,但在多尺度樣本熵粗粒化序列的研究中,基于粗?;x的多尺度計(jì)算方法對(duì)時(shí)間序列長(zhǎng)度的依賴性較強(qiáng).對(duì)于生理信號(hào)中的常見噪聲(白噪聲和1/f噪聲),當(dāng)時(shí)間尺度增加時(shí),所得到的時(shí)間序列越短,MSE與復(fù)合多尺度熵(CMSE)算法引入未定義熵的可能性越大,從而導(dǎo)致算法的有效性降低.在另一方面,睡眠分期的分類算法也存在差異性.Flexer等[6]采用隱馬爾可夫方法(HMM)進(jìn)行睡眠分期,其準(zhǔn)確率達(dá)到了 80.0%;李谷等[7]利用希爾伯特-黃變換方法對(duì)睡眠進(jìn)行自動(dòng)分期,其平均準(zhǔn)確率為 81.7%.近年來,研究人員提出了基于決策樹的多分類支持向量機(jī)(SVM)算法[8],并將其用于睡眠分期的多分類問題.
本文通過改進(jìn)CMSE算法,提出了基于精細(xì)復(fù)合多尺度熵(RCMSE)的睡眠分期算法.對(duì)于較短的生物信號(hào)時(shí)間序列,當(dāng)使用RCMSE算法時(shí)引入未定義熵的概率降低,所以RCMSE算法的有效性和準(zhǔn)確性優(yōu)于MSE以及CMSE算法,并且選擇特征區(qū)分度較高的RCMSE特征作為分類器的輸入,以保證輸入的穩(wěn)定性.另外,結(jié)合層次結(jié)構(gòu)以及SVM的優(yōu)勢(shì),利用多層次的SVM分類器進(jìn)行睡眠分期,達(dá)到了快速準(zhǔn)確的分期效果.
睡眠分期算法的流程如圖1所示.首先,以30 s記錄1幀圖像,對(duì)睡眠的腦電(EEG)信號(hào)以及眼電(EOG)信號(hào)進(jìn)行分段,并且對(duì)原始信號(hào)進(jìn)行濾波處理;然后,對(duì)睡眠信號(hào)的復(fù)雜度進(jìn)行分析,提取分類器的輸入特征,即RCMSE;最后,運(yùn)用多層次的SVM來實(shí)施睡眠分期.
圖1 睡眠分期算法流程Fig.1 Flow chart of the proposed sleep scoring method
本文所用數(shù)據(jù)來源于美國(guó)生理信號(hào)數(shù)據(jù)庫PhysioBank[9]中的Sleep-EDF數(shù)據(jù)庫,選擇10位健康成人作為研究對(duì)象,并對(duì)每位研究對(duì)象睡眠階段的生理信號(hào)的記錄時(shí)間為20 h,選用熄燈以后其EEG(Fpz-Cz)和EOG通道的波形作為研究信號(hào).其中,選擇對(duì)象的睡眠狀態(tài)良好、各個(gè)睡眠時(shí)期已被完整地標(biāo)注.整夜的多導(dǎo)睡眠圖(PSG)包含F(xiàn)pz-Cz通道和Pz-Oz通道的EEG信號(hào)、EOG信號(hào)以及肌電(EMG)信號(hào).采集數(shù)據(jù)的幅值單位為μV,EEG信號(hào)以及EOG信號(hào)的采樣頻率均為100 Hz.EEG信號(hào)與EOG信號(hào)包含大量的生理信息,本文選取EEG(Fpz-Cz)和EOG通道的信號(hào)進(jìn)行分析.
根據(jù)睡眠分期的判讀規(guī)則,睡眠監(jiān)測(cè)開始后,按照每30 s記錄的1幀圖像[10]進(jìn)行判讀.由于EEG信號(hào)和EOG信號(hào)的頻率均為100 Hz,所以以 3 000 個(gè)樣本點(diǎn)為1段對(duì)數(shù)據(jù)進(jìn)行預(yù)分割.睡眠時(shí),EEG信號(hào)極其微弱,背景噪聲較強(qiáng),易于引入干擾,如面部肌肉以及眼球的移動(dòng)等;并且EEG信號(hào)和EOG信號(hào)均是非平穩(wěn)的隨機(jī)信號(hào),難以提取特征,因此,需要利用有效的手段對(duì)其進(jìn)行降噪處理.根據(jù)AASM推薦的各通道濾波標(biāo)準(zhǔn),EEG信號(hào)及EOG信號(hào)的帶通濾波標(biāo)準(zhǔn)均為 0.3~35.0 Hz,因此,設(shè)置巴特沃斯濾波器的通帶頻率為 0.3~35.0 Hz,以對(duì)信號(hào)進(jìn)行濾波處理.
本文以生物信號(hào)的復(fù)雜度作為睡眠分期的判定標(biāo)準(zhǔn).目前,復(fù)雜度的量化方法包括近似熵[11]、樣本熵、多尺度樣本熵和RCMSE等.由于RCMSE的有效性及準(zhǔn)確性較高,所以本文利用RCMSE方法分析睡眠信號(hào)的時(shí)間序列復(fù)雜度,計(jì)算EEG信號(hào)以及EOG信號(hào)的多尺度熵.以下為RCMSE算法的步驟.
(1) 采集研究對(duì)象的EEG和EOG信號(hào),每一通道的信號(hào)為一維的離散時(shí)間序列.令x={x1,x2,…,xN}為長(zhǎng)度為N的時(shí)間序列.粗?;^程如下:
(1)
式中:1≤j≤N/τ,τ為尺度值;1≤k≤τ.
通過式(1)可以得到不同時(shí)間尺度上的粗?;瘯r(shí)間序列.
(2)
式中:
式(2)可簡(jiǎn)化為
(3)
通過考慮多方面的因素來選擇合適的參數(shù).其中:嵌入的維數(shù)m越大,包含的細(xì)節(jié)信息越多,但m值越大,需要的數(shù)據(jù)長(zhǎng)度越長(zhǎng),綜合考慮,本文選取m=2[12];r值一般為原始數(shù)據(jù)標(biāo)準(zhǔn)差b的 0.10~0.25 倍,本文選取r=0.15b;由于選擇太大的τ值將會(huì)影響計(jì)算效率,而選擇太小的τ值將導(dǎo)致無法提取足夠多的有效信息,因而本文設(shè)置粗?;淖罡擀又禐?0.
本文使用SVM方法進(jìn)行模式分類.從本質(zhì)上來說,SVM是一種二分類的方法.假設(shè){(xi,yi),i=1,2,…,N}為訓(xùn)練集,其中xi∈Rd是輸入數(shù)據(jù),yi∈{-1,+1}為分類的標(biāo)簽,分別代表不同的睡眠狀態(tài).將超平面定義為
wTx+b=0
其中:w是d維的向量;b是標(biāo)準(zhǔn)偏差.為獲得更大的邊界以及更強(qiáng)的泛化能力,引入正的松弛變量ξi.根據(jù)以下約束的二次優(yōu)化問題的求解來確定最優(yōu)的超平面:
(4)
使得
yi(wTxi+b)≥1-ξi,i=1,2,…,N
(5)
式中:C是懲罰參數(shù).通過求解優(yōu)化問題來估計(jì)w和b.然后,定義離散決策函數(shù),對(duì)輸入數(shù)據(jù)進(jìn)行分類:
(6)
式中:αi是拉格朗日乘子;K(xi,xj)=φ(xi)φ(xj),為核函數(shù),φ(x)為非線性函數(shù),形成從訓(xùn)練數(shù)據(jù)到高維特征空間的映射.
圖2 多層次SVM分類算法框圖Fig.2 Block diagram of the proposed multi-classification SVM
本文的研究目標(biāo)是將睡眠階段分為5個(gè)不同的時(shí)期,即W期、N1期、N2期、N3期和R期,該分期屬于多分類問題.針對(duì)睡眠分期的多分類問題[13],一般采用將多分類問題轉(zhuǎn)化為兩分類問題來求解.具體方法:① 一對(duì)一法,即在每?jī)深愔g訓(xùn)練一個(gè)分類器.對(duì)于一個(gè)k類問題,存在k(k-1)/2個(gè)分類函數(shù).② 一對(duì)多分類法,在每一類別與其他類別之間構(gòu)造分類函數(shù)(K類問題構(gòu)造K個(gè)兩類分類器).該方法存在分類重疊以及不可分類的缺點(diǎn).與一對(duì)一以及一對(duì)多方法對(duì)比,多層次SVM分類方法的復(fù)雜度更低,能夠快速完成分類.多層次SVM分類算法的框圖如圖2所示.首先,對(duì)RCMSE進(jìn)行特征提取,然后,根據(jù)RCMSE曲線的分布特征來確定不同層次的輸入?yún)?shù).分類器由3層組成:第1層將信號(hào)分為睡眠期以及清醒期,第2層以及第3層分別在上一層分類結(jié)果的基礎(chǔ)上進(jìn)行更深層次的分類,直到將睡眠階段分為5個(gè)獨(dú)立的時(shí)期.其中,RCMSE 值為輸入特征,隨機(jī)選取其中的部分?jǐn)?shù)據(jù)進(jìn)行分類器訓(xùn)練,剩下的睡眠數(shù)據(jù)用于分類器的預(yù)測(cè).通過對(duì)比預(yù)測(cè)的睡眠分期結(jié)果與人工判讀的睡眠分期標(biāo)簽,獲得睡眠自動(dòng)分期的準(zhǔn)確率.
EEG信號(hào)是睡眠分期準(zhǔn)則的主要判別標(biāo)準(zhǔn),所以本文首先選取EEG信號(hào),參考導(dǎo)聯(lián)為Fpz-Cz通道,所得EEG信號(hào)的RCMSE的變化曲線如圖3所示.其中,不同的點(diǎn)表示各個(gè)時(shí)期的RCMSE均值,其上下豎線表示RCMSE標(biāo)準(zhǔn)差.根據(jù)RCMSE的變化趨勢(shì)確定分類器的層數(shù)以及設(shè)置每一層次的輸入?yún)?shù).由圖3可見:W期與其他時(shí)期EEG信號(hào)的RCMSE的差別較為明顯,所以在分類器的第1層將數(shù)據(jù)分為清醒期和睡眠期;N1期、R期與N2期、N3期的RCMSE的區(qū)分度較高,在第2層SVM中對(duì)其進(jìn)行分類;N2期與N3期的RCMSE的差異明顯,可在第3層分類器中對(duì)其分類.
圖3 腦電信號(hào)EEG通道的RCMSE變化曲線Fig.3 RCMSE curves of channel EEG
參考AASM睡眠及相關(guān)事件判讀手冊(cè)[14],可以發(fā)現(xiàn)睡眠R期的低波幅混合頻率與N1期的相似,2個(gè)時(shí)期的EEG信號(hào)相似度較高,但其EOG信號(hào)存在差異.其中,N1期為緩慢眼動(dòng),而R期出現(xiàn)了快速眼動(dòng)的現(xiàn)象.相應(yīng)地,由圖3可見,N1期與R期EEG信號(hào)的RCMSE變化趨勢(shì)非常相似,且其區(qū)分度較差,通過EEG信號(hào)的RCMSE變化特征難以區(qū)分這2個(gè)時(shí)期.為此,本文提取研究對(duì)象的EOG信號(hào)進(jìn)行N1期以及R期的分類.圖4所示為EOG信號(hào)的RCMSE變化曲線.可見,N1期與R期的區(qū)分效果得到了改善.
圖4 眼電信號(hào)EOG通道的RCMSE變化曲線Fig.4 RCMSE curves of channel EOG
人工的睡眠分期準(zhǔn)則對(duì)于特征的選擇具有重要的參考價(jià)值.這個(gè)睡眠分期準(zhǔn)則充分結(jié)合信號(hào)的整體與局部信息,根據(jù)不同的規(guī)則判別睡眠時(shí)期.具體方法:① 在判讀N1期時(shí),1幀圖像中整體背景特征滿足低波幅混合頻率(3~7 Hz)的成分所占比例超過50%,即低波幅混合頻率波的寬度所占比例超過50%,該準(zhǔn)則表征了信號(hào)的整體特點(diǎn);② 在判讀N2期時(shí),需要運(yùn)用局部短時(shí)的K-復(fù)合波特征,該準(zhǔn)則表征了信號(hào)的局部特點(diǎn).與人工的睡眠分期準(zhǔn)則對(duì)應(yīng),本文提出的基于RCMSE特征的睡眠分期方法能夠通過特征尺度的變化來表征信號(hào)的整體或局部特點(diǎn):當(dāng)特征尺度τ=1時(shí),能夠表征信號(hào)的整體特征;當(dāng)τ不斷增大時(shí),能夠表征信號(hào)的局部特征.通過比較RCMSE的均值以及標(biāo)準(zhǔn)差,優(yōu)先區(qū)分差異性較大的睡眠時(shí)期,因此,將RCMSE作為信號(hào)的特征輸入能夠較好地反映睡眠信號(hào)的復(fù)雜度.
分析上述RCMSE的變化曲線可以看出,N1期與R期的區(qū)分度較低,N2期與N3期的變化趨勢(shì)相似.其中,N2期與N3期在τ處于1~10范圍內(nèi)的區(qū)分度較高.因此,選擇容易區(qū)分的尺度范圍作為多層次SVM分類算法的特征輸入,可以保證分類效果并且提高工作效率.對(duì)于每層的分類節(jié)點(diǎn),選取的 RCMSE 特征尺度以及對(duì)應(yīng)的通道見表1.
表1多層次SVM分類的通道以及特征提取
Tab.1RCMSEfeaturesandchannelforSVMclassificationmethod
分類器τ通道清醒期與睡眠期1~20EEG(Fpz-Cz)N1期和R期與N2期和N3期1~20EEG(Fpz-Cz)N1期與R期1~20EOGN2期與N3期1~10EEG(Fpz-Cz)
表2列出了睡眠的SVM自動(dòng)分期結(jié)果與人工判讀分期結(jié)果的對(duì)比.表中,對(duì)角線上的黑體數(shù)值為準(zhǔn)確判讀的數(shù)據(jù)量,非對(duì)角線的數(shù)值為誤判數(shù)據(jù).根據(jù)表2中的內(nèi)容,采用本文算法計(jì)算所得各個(gè)獨(dú)立睡眠時(shí)期的分類準(zhǔn)確率如表3所示.由表3可見:清醒期的分類在第1層SVM分類器中完成,其分類準(zhǔn)確率最高,達(dá)到了 92.4%;第3層SVM分類器完成對(duì)N1期的分類,由于N1期與R期的特征最相似,其中N1期的部分?jǐn)?shù)據(jù)被人工誤判為R期,同時(shí),在整個(gè)睡眠階段的N1期數(shù)據(jù)較少,所以最終導(dǎo)致N1期的人工判讀準(zhǔn)確率較低;N2期及N3期的分類準(zhǔn)確率分別達(dá)到了 89.2% 以及 90.0%.SVM分類器每一層次的分類效果都會(huì)對(duì)最終的分類結(jié)果產(chǎn)生影響,其中W期、N2期、N3期、R期的分類準(zhǔn)確率均高達(dá)85%以上,從而保證了各個(gè)睡眠階段的分類效果.
表2 SVM分類和人工判讀結(jié)果Tab.2 The classification results of SVM
表3 獨(dú)立睡眠時(shí)期的準(zhǔn)確率Tab.3 Accuracy for individual stages
將本文算法與文獻(xiàn)[15-17]中的算法進(jìn)行比較,所得到的分類準(zhǔn)確率如表4所示.由表4可見,與文獻(xiàn)[15-17]中的算法相比,本文所提出的算法的分類準(zhǔn)確率有所提高.另外,由表5可見,本文算法在W期、N1期、N2期以及N3期的分類效果均比文獻(xiàn)[18]中的算法更優(yōu),同時(shí),在R期也保持了較高的分類準(zhǔn)確率.針對(duì)文獻(xiàn)[19]中的算法不能準(zhǔn)確區(qū)分睡眠R期的問題,本文算法有所改進(jìn),在該階段的分類準(zhǔn)確率有所提高,并且在其他階段也保持了較高的分類準(zhǔn)確率.通過對(duì)比各個(gè)獨(dú)立時(shí)期的分類結(jié)果可見,本文算法具有更加平衡的輸出,并且總體的分類準(zhǔn)確率更高.因此,相對(duì)其他的算法,本文提出的算法具有較好的穩(wěn)定性.
表4 不同算法的分類準(zhǔn)確率比較Tab.4 Comparison of classification accuracy
表5 獨(dú)立時(shí)期的分類準(zhǔn)確率比較Tab.5 Performance comparison of individual stages
本文提出了基于RCMSE特征的多層次SVM睡眠自動(dòng)分期模型.從研究對(duì)象的EEG信號(hào)以及EOG信號(hào)中提取RCMSE特征,以RCMSE值作為研究的唯一特征,它可以從多個(gè)尺度表征生理信號(hào)的復(fù)雜度,對(duì)于較短的數(shù)據(jù)可得穩(wěn)定的RCMSE值,其抗噪能力強(qiáng),為睡眠分期提供了良好的輸入?yún)?shù)來源.總體的分類器框架基于多層次SVM分類展開,根據(jù)RCMSE的變化曲線對(duì)分類器層次進(jìn)行設(shè)置,所得睡眠分期的準(zhǔn)確率達(dá)到了 85.3%,從而驗(yàn)證了所提算法對(duì)睡眠分期的可行性和有效性.
然而,在本文的研究中,僅選用EEG信號(hào)以及EOG信號(hào)作為評(píng)價(jià)標(biāo)準(zhǔn),其分類準(zhǔn)確率有待于進(jìn)一步提高.研究表明,在不同的睡眠狀態(tài)下,周期性的腿動(dòng)信號(hào)與翻身信號(hào)有明顯的差異.其中,腿動(dòng)信號(hào)的相對(duì)頻率、持續(xù)時(shí)間和引起醒覺的效應(yīng)都隨著睡眠的加深而逐漸下降,而腿動(dòng)間隔時(shí)間將隨之增加,這對(duì)于判別睡眠階段有所幫助.因此,下一步將研究受試者的體動(dòng)信號(hào),以獲取體動(dòng)能量值,并利用多信息融合技術(shù)分析受試者的睡眠階段.