葉 仙, 胡 潔, 田 畔, 戚 進(jìn), 車大鈿, 丁 穎
(1. 上海交通大學(xué) 機(jī)械與動(dòng)力工程學(xué)院, 上海 200240; 2. 上海市兒童醫(yī)院, 上海 200240)
人類1/3的時(shí)間都在睡眠中度過.與睡眠相關(guān)的疾病,如睡眠呼吸暫停以及低通氣等睡眠障礙嚴(yán)重地影響了患者的生活質(zhì)量.調(diào)查顯示[1],超過2%的成年女性以及4%的成年男性患有阻塞型呼吸暫停.在睡眠疾病的研究中,睡眠分期是必不可少的關(guān)鍵步驟.臨床上按照Rechtchaffen and Kales(簡稱R&K)分期準(zhǔn)則[2]將睡眠過程分為清醒期(W)、非快速眼動(dòng)期(N)和快速眼動(dòng)期(R).N期又被分為非快速眼動(dòng)1期(N1)、非快速眼動(dòng)2期(N2)、非快速眼動(dòng)3期(N3)和非快速眼動(dòng)4期(N4),其中N3和N4通常被整合成深睡眠期.醫(yī)療人員根據(jù)美國睡眠醫(yī)學(xué)會(huì)(AASM)標(biāo)準(zhǔn)[3],通過觀察α節(jié)律波、紡錘波和K復(fù)合波等特征來判別睡眠階段.人的整夜睡眠時(shí)間為7~8 h,人工進(jìn)行睡眠分期通常需要花費(fèi) 2~4 h,并且不同專家的判讀結(jié)果一致度低于90%.針對人工睡眠分期效率低、準(zhǔn)確性不高的問題,研究人員提出采用自動(dòng)區(qū)分睡眠過程的方法代替?zhèn)鹘y(tǒng)的經(jīng)驗(yàn)判讀方法.
睡眠分期主要包含睡眠信號(1幀圖像)的特征提取以及睡眠時(shí)段的分類.睡眠信號的特征提取方法主要包括時(shí)域分析、頻域分析、時(shí)頻分析[4]和復(fù)雜性分析等方法.其中,復(fù)雜性分析方法是通過表征系統(tǒng)的動(dòng)態(tài)特性來研究信號內(nèi)在特征的,已經(jīng)成為生物信號時(shí)間序列的研究方向.熵作為表征系統(tǒng)復(fù)雜度的重要指標(biāo),可用于區(qū)分人體生理信號的復(fù)雜度.Costa等[5]提出多尺度熵(MSE)方法,通過粗粒化的方式對時(shí)間序列進(jìn)行多尺度劃分,以實(shí)現(xiàn)對時(shí)間序列的多尺度分析.MSE方法能夠分析時(shí)間序列隱藏在不同尺度的模式信息,但在多尺度樣本熵粗?;蛄械难芯恐?,基于粗?;x的多尺度計(jì)算方法對時(shí)間序列長度的依賴性較強(qiáng).對于生理信號中的常見噪聲(白噪聲和1/f噪聲),當(dāng)時(shí)間尺度增加時(shí),所得到的時(shí)間序列越短,MSE與復(fù)合多尺度熵(CMSE)算法引入未定義熵的可能性越大,從而導(dǎo)致算法的有效性降低.在另一方面,睡眠分期的分類算法也存在差異性.Flexer等[6]采用隱馬爾可夫方法(HMM)進(jìn)行睡眠分期,其準(zhǔn)確率達(dá)到了 80.0%;李谷等[7]利用希爾伯特-黃變換方法對睡眠進(jìn)行自動(dòng)分期,其平均準(zhǔn)確率為 81.7%.近年來,研究人員提出了基于決策樹的多分類支持向量機(jī)(SVM)算法[8],并將其用于睡眠分期的多分類問題.
本文通過改進(jìn)CMSE算法,提出了基于精細(xì)復(fù)合多尺度熵(RCMSE)的睡眠分期算法.對于較短的生物信號時(shí)間序列,當(dāng)使用RCMSE算法時(shí)引入未定義熵的概率降低,所以RCMSE算法的有效性和準(zhǔn)確性優(yōu)于MSE以及CMSE算法,并且選擇特征區(qū)分度較高的RCMSE特征作為分類器的輸入,以保證輸入的穩(wěn)定性.另外,結(jié)合層次結(jié)構(gòu)以及SVM的優(yōu)勢,利用多層次的SVM分類器進(jìn)行睡眠分期,達(dá)到了快速準(zhǔn)確的分期效果.
睡眠分期算法的流程如圖1所示.首先,以30 s記錄1幀圖像,對睡眠的腦電(EEG)信號以及眼電(EOG)信號進(jìn)行分段,并且對原始信號進(jìn)行濾波處理;然后,對睡眠信號的復(fù)雜度進(jìn)行分析,提取分類器的輸入特征,即RCMSE;最后,運(yùn)用多層次的SVM來實(shí)施睡眠分期.

圖1 睡眠分期算法流程Fig.1 Flow chart of the proposed sleep scoring method
本文所用數(shù)據(jù)來源于美國生理信號數(shù)據(jù)庫PhysioBank[9]中的Sleep-EDF數(shù)據(jù)庫,選擇10位健康成人作為研究對象,并對每位研究對象睡眠階段的生理信號的記錄時(shí)間為20 h,選用熄燈以后其EEG(Fpz-Cz)和EOG通道的波形作為研究信號.其中,選擇對象的睡眠狀態(tài)良好、各個(gè)睡眠時(shí)期已被完整地標(biāo)注.整夜的多導(dǎo)睡眠圖(PSG)包含F(xiàn)pz-Cz通道和Pz-Oz通道的EEG信號、EOG信號以及肌電(EMG)信號.采集數(shù)據(jù)的幅值單位為μV,EEG信號以及EOG信號的采樣頻率均為100 Hz.EEG信號與EOG信號包含大量的生理信息,本文選取EEG(Fpz-Cz)和EOG通道的信號進(jìn)行分析.
根據(jù)睡眠分期的判讀規(guī)則,睡眠監(jiān)測開始后,按照每30 s記錄的1幀圖像[10]進(jìn)行判讀.由于EEG信號和EOG信號的頻率均為100 Hz,所以以 3 000 個(gè)樣本點(diǎn)為1段對數(shù)據(jù)進(jìn)行預(yù)分割.睡眠時(shí),EEG信號極其微弱,背景噪聲較強(qiáng),易于引入干擾,如面部肌肉以及眼球的移動(dòng)等;并且EEG信號和EOG信號均是非平穩(wěn)的隨機(jī)信號,難以提取特征,因此,需要利用有效的手段對其進(jìn)行降噪處理.根據(jù)AASM推薦的各通道濾波標(biāo)準(zhǔn),EEG信號及EOG信號的帶通濾波標(biāo)準(zhǔn)均為 0.3~35.0 Hz,因此,設(shè)置巴特沃斯濾波器的通帶頻率為 0.3~35.0 Hz,以對信號進(jìn)行濾波處理.
本文以生物信號的復(fù)雜度作為睡眠分期的判定標(biāo)準(zhǔn).目前,復(fù)雜度的量化方法包括近似熵[11]、樣本熵、多尺度樣本熵和RCMSE等.由于RCMSE的有效性及準(zhǔn)確性較高,所以本文利用RCMSE方法分析睡眠信號的時(shí)間序列復(fù)雜度,計(jì)算EEG信號以及EOG信號的多尺度熵.以下為RCMSE算法的步驟.
(1) 采集研究對象的EEG和EOG信號,每一通道的信號為一維的離散時(shí)間序列.令x={x1,x2,…,xN}為長度為N的時(shí)間序列.粗?;^程如下:
(1)
式中:1≤j≤N/τ,τ為尺度值;1≤k≤τ.
通過式(1)可以得到不同時(shí)間尺度上的粗粒化時(shí)間序列.


(2)
式中:
式(2)可簡化為
(3)
通過考慮多方面的因素來選擇合適的參數(shù).其中:嵌入的維數(shù)m越大,包含的細(xì)節(jié)信息越多,但m值越大,需要的數(shù)據(jù)長度越長,綜合考慮,本文選取m=2[12];r值一般為原始數(shù)據(jù)標(biāo)準(zhǔn)差b的 0.10~0.25 倍,本文選取r=0.15b;由于選擇太大的τ值將會(huì)影響計(jì)算效率,而選擇太小的τ值將導(dǎo)致無法提取足夠多的有效信息,因而本文設(shè)置粗?;淖罡擀又禐?0.
本文使用SVM方法進(jìn)行模式分類.從本質(zhì)上來說,SVM是一種二分類的方法.假設(shè){(xi,yi),i=1,2,…,N}為訓(xùn)練集,其中xi∈Rd是輸入數(shù)據(jù),yi∈{-1,+1}為分類的標(biāo)簽,分別代表不同的睡眠狀態(tài).將超平面定義為
wTx+b=0
其中:w是d維的向量;b是標(biāo)準(zhǔn)偏差.為獲得更大的邊界以及更強(qiáng)的泛化能力,引入正的松弛變量ξi.根據(jù)以下約束的二次優(yōu)化問題的求解來確定最優(yōu)的超平面:
(4)
使得
yi(wTxi+b)≥1-ξi,i=1,2,…,N
(5)
式中:C是懲罰參數(shù).通過求解優(yōu)化問題來估計(jì)w和b.然后,定義離散決策函數(shù),對輸入數(shù)據(jù)進(jìn)行分類:
(6)
式中:αi是拉格朗日乘子;K(xi,xj)=φ(xi)φ(xj),為核函數(shù),φ(x)為非線性函數(shù),形成從訓(xùn)練數(shù)據(jù)到高維特征空間的映射.

圖2 多層次SVM分類算法框圖Fig.2 Block diagram of the proposed multi-classification SVM
本文的研究目標(biāo)是將睡眠階段分為5個(gè)不同的時(shí)期,即W期、N1期、N2期、N3期和R期,該分期屬于多分類問題.針對睡眠分期的多分類問題[13],一般采用將多分類問題轉(zhuǎn)化為兩分類問題來求解.具體方法:① 一對一法,即在每兩類之間訓(xùn)練一個(gè)分類器.對于一個(gè)k類問題,存在k(k-1)/2個(gè)分類函數(shù).② 一對多分類法,在每一類別與其他類別之間構(gòu)造分類函數(shù)(K類問題構(gòu)造K個(gè)兩類分類器).該方法存在分類重疊以及不可分類的缺點(diǎn).與一對一以及一對多方法對比,多層次SVM分類方法的復(fù)雜度更低,能夠快速完成分類.多層次SVM分類算法的框圖如圖2所示.首先,對RCMSE進(jìn)行特征提取,然后,根據(jù)RCMSE曲線的分布特征來確定不同層次的輸入?yún)?shù).分類器由3層組成:第1層將信號分為睡眠期以及清醒期,第2層以及第3層分別在上一層分類結(jié)果的基礎(chǔ)上進(jìn)行更深層次的分類,直到將睡眠階段分為5個(gè)獨(dú)立的時(shí)期.其中,RCMSE 值為輸入特征,隨機(jī)選取其中的部分?jǐn)?shù)據(jù)進(jìn)行分類器訓(xùn)練,剩下的睡眠數(shù)據(jù)用于分類器的預(yù)測.通過對比預(yù)測的睡眠分期結(jié)果與人工判讀的睡眠分期標(biāo)簽,獲得睡眠自動(dòng)分期的準(zhǔn)確率.
EEG信號是睡眠分期準(zhǔn)則的主要判別標(biāo)準(zhǔn),所以本文首先選取EEG信號,參考導(dǎo)聯(lián)為Fpz-Cz通道,所得EEG信號的RCMSE的變化曲線如圖3所示.其中,不同的點(diǎn)表示各個(gè)時(shí)期的RCMSE均值,其上下豎線表示RCMSE標(biāo)準(zhǔn)差.根據(jù)RCMSE的變化趨勢確定分類器的層數(shù)以及設(shè)置每一層次的輸入?yún)?shù).由圖3可見:W期與其他時(shí)期EEG信號的RCMSE的差別較為明顯,所以在分類器的第1層將數(shù)據(jù)分為清醒期和睡眠期;N1期、R期與N2期、N3期的RCMSE的區(qū)分度較高,在第2層SVM中對其進(jìn)行分類;N2期與N3期的RCMSE的差異明顯,可在第3層分類器中對其分類.

圖3 腦電信號EEG通道的RCMSE變化曲線Fig.3 RCMSE curves of channel EEG
參考AASM睡眠及相關(guān)事件判讀手冊[14],可以發(fā)現(xiàn)睡眠R期的低波幅混合頻率與N1期的相似,2個(gè)時(shí)期的EEG信號相似度較高,但其EOG信號存在差異.其中,N1期為緩慢眼動(dòng),而R期出現(xiàn)了快速眼動(dòng)的現(xiàn)象.相應(yīng)地,由圖3可見,N1期與R期EEG信號的RCMSE變化趨勢非常相似,且其區(qū)分度較差,通過EEG信號的RCMSE變化特征難以區(qū)分這2個(gè)時(shí)期.為此,本文提取研究對象的EOG信號進(jìn)行N1期以及R期的分類.圖4所示為EOG信號的RCMSE變化曲線.可見,N1期與R期的區(qū)分效果得到了改善.

圖4 眼電信號EOG通道的RCMSE變化曲線Fig.4 RCMSE curves of channel EOG
人工的睡眠分期準(zhǔn)則對于特征的選擇具有重要的參考價(jià)值.這個(gè)睡眠分期準(zhǔn)則充分結(jié)合信號的整體與局部信息,根據(jù)不同的規(guī)則判別睡眠時(shí)期.具體方法:① 在判讀N1期時(shí),1幀圖像中整體背景特征滿足低波幅混合頻率(3~7 Hz)的成分所占比例超過50%,即低波幅混合頻率波的寬度所占比例超過50%,該準(zhǔn)則表征了信號的整體特點(diǎn);② 在判讀N2期時(shí),需要運(yùn)用局部短時(shí)的K-復(fù)合波特征,該準(zhǔn)則表征了信號的局部特點(diǎn).與人工的睡眠分期準(zhǔn)則對應(yīng),本文提出的基于RCMSE特征的睡眠分期方法能夠通過特征尺度的變化來表征信號的整體或局部特點(diǎn):當(dāng)特征尺度τ=1時(shí),能夠表征信號的整體特征;當(dāng)τ不斷增大時(shí),能夠表征信號的局部特征.通過比較RCMSE的均值以及標(biāo)準(zhǔn)差,優(yōu)先區(qū)分差異性較大的睡眠時(shí)期,因此,將RCMSE作為信號的特征輸入能夠較好地反映睡眠信號的復(fù)雜度.
分析上述RCMSE的變化曲線可以看出,N1期與R期的區(qū)分度較低,N2期與N3期的變化趨勢相似.其中,N2期與N3期在τ處于1~10范圍內(nèi)的區(qū)分度較高.因此,選擇容易區(qū)分的尺度范圍作為多層次SVM分類算法的特征輸入,可以保證分類效果并且提高工作效率.對于每層的分類節(jié)點(diǎn),選取的 RCMSE 特征尺度以及對應(yīng)的通道見表1.
表1多層次SVM分類的通道以及特征提取
Tab.1RCMSEfeaturesandchannelforSVMclassificationmethod

分類器τ通道清醒期與睡眠期1~20EEG(Fpz-Cz)N1期和R期與N2期和N3期1~20EEG(Fpz-Cz)N1期與R期1~20EOGN2期與N3期1~10EEG(Fpz-Cz)
表2列出了睡眠的SVM自動(dòng)分期結(jié)果與人工判讀分期結(jié)果的對比.表中,對角線上的黑體數(shù)值為準(zhǔn)確判讀的數(shù)據(jù)量,非對角線的數(shù)值為誤判數(shù)據(jù).根據(jù)表2中的內(nèi)容,采用本文算法計(jì)算所得各個(gè)獨(dú)立睡眠時(shí)期的分類準(zhǔn)確率如表3所示.由表3可見:清醒期的分類在第1層SVM分類器中完成,其分類準(zhǔn)確率最高,達(dá)到了 92.4%;第3層SVM分類器完成對N1期的分類,由于N1期與R期的特征最相似,其中N1期的部分?jǐn)?shù)據(jù)被人工誤判為R期,同時(shí),在整個(gè)睡眠階段的N1期數(shù)據(jù)較少,所以最終導(dǎo)致N1期的人工判讀準(zhǔn)確率較低;N2期及N3期的分類準(zhǔn)確率分別達(dá)到了 89.2% 以及 90.0%.SVM分類器每一層次的分類效果都會(huì)對最終的分類結(jié)果產(chǎn)生影響,其中W期、N2期、N3期、R期的分類準(zhǔn)確率均高達(dá)85%以上,從而保證了各個(gè)睡眠階段的分類效果.

表2 SVM分類和人工判讀結(jié)果Tab.2 The classification results of SVM

表3 獨(dú)立睡眠時(shí)期的準(zhǔn)確率Tab.3 Accuracy for individual stages
將本文算法與文獻(xiàn)[15-17]中的算法進(jìn)行比較,所得到的分類準(zhǔn)確率如表4所示.由表4可見,與文獻(xiàn)[15-17]中的算法相比,本文所提出的算法的分類準(zhǔn)確率有所提高.另外,由表5可見,本文算法在W期、N1期、N2期以及N3期的分類效果均比文獻(xiàn)[18]中的算法更優(yōu),同時(shí),在R期也保持了較高的分類準(zhǔn)確率.針對文獻(xiàn)[19]中的算法不能準(zhǔn)確區(qū)分睡眠R期的問題,本文算法有所改進(jìn),在該階段的分類準(zhǔn)確率有所提高,并且在其他階段也保持了較高的分類準(zhǔn)確率.通過對比各個(gè)獨(dú)立時(shí)期的分類結(jié)果可見,本文算法具有更加平衡的輸出,并且總體的分類準(zhǔn)確率更高.因此,相對其他的算法,本文提出的算法具有較好的穩(wěn)定性.

表4 不同算法的分類準(zhǔn)確率比較Tab.4 Comparison of classification accuracy

表5 獨(dú)立時(shí)期的分類準(zhǔn)確率比較Tab.5 Performance comparison of individual stages
本文提出了基于RCMSE特征的多層次SVM睡眠自動(dòng)分期模型.從研究對象的EEG信號以及EOG信號中提取RCMSE特征,以RCMSE值作為研究的唯一特征,它可以從多個(gè)尺度表征生理信號的復(fù)雜度,對于較短的數(shù)據(jù)可得穩(wěn)定的RCMSE值,其抗噪能力強(qiáng),為睡眠分期提供了良好的輸入?yún)?shù)來源.總體的分類器框架基于多層次SVM分類展開,根據(jù)RCMSE的變化曲線對分類器層次進(jìn)行設(shè)置,所得睡眠分期的準(zhǔn)確率達(dá)到了 85.3%,從而驗(yàn)證了所提算法對睡眠分期的可行性和有效性.
然而,在本文的研究中,僅選用EEG信號以及EOG信號作為評價(jià)標(biāo)準(zhǔn),其分類準(zhǔn)確率有待于進(jìn)一步提高.研究表明,在不同的睡眠狀態(tài)下,周期性的腿動(dòng)信號與翻身信號有明顯的差異.其中,腿動(dòng)信號的相對頻率、持續(xù)時(shí)間和引起醒覺的效應(yīng)都隨著睡眠的加深而逐漸下降,而腿動(dòng)間隔時(shí)間將隨之增加,這對于判別睡眠階段有所幫助.因此,下一步將研究受試者的體動(dòng)信號,以獲取體動(dòng)能量值,并利用多信息融合技術(shù)分析受試者的睡眠階段.