吳振華,邱 倩
(南昌航空大學(xué) 軟件學(xué)院,江西 南昌 330100)
睡眠是人類最重要的生理活動(dòng)之一,良好的睡眠有利于人類保持身體健康。但隨著時(shí)代的進(jìn)步,人們?cè)诠ぷ?、學(xué)習(xí)、生活上的壓力也隨之增加,越來越多的人患有睡眠障礙。睡眠障礙會(huì)產(chǎn)生許多問題,包括疲勞、焦慮、抑郁和死亡風(fēng)險(xiǎn)等,是具有公共危害性的疾病[1-2]。
多導(dǎo)睡眠圖(Polysomnography, PSG)常用于睡眠狀態(tài)評(píng)估,它利用腦電圖機(jī)將被測(cè)試者整夜的腦電(Electroencephalogram, EEG)、肌電(Electromyogram, EMG)、心電(Electrocardiogram, ECG)、眼電(Electrooculogram,EOG)、呼吸等生理參數(shù)同步記錄,由專業(yè)的醫(yī)生根據(jù)R&K準(zhǔn)則[3],將睡眠狀態(tài)劃分成清醒期(WAKE)、快速眼動(dòng)期(Rapid Eye Movements, REM)和非快速眼動(dòng)期(Non Rapid Eye Movements, NREM)。其中NREM又可以劃分為N1~N4共4個(gè)子階段,其中N1、N2期稱為淺度睡眠,N3、N4期稱為深度睡眠。雖然PSG測(cè)試結(jié)果較為準(zhǔn)確,但需要在專業(yè)的睡眠中心進(jìn)行數(shù)據(jù)采集,不適用于民眾長(zhǎng)期日常監(jiān)護(hù)。且在數(shù)據(jù)采集記錄后,專家會(huì)手動(dòng)識(shí)別每個(gè)數(shù)據(jù)所生產(chǎn)的睡眠階段,這項(xiàng)工作繁瑣且勞累,因此,設(shè)計(jì)一種高準(zhǔn)確率的自動(dòng)睡眠分期方法已成為睡眠醫(yī)學(xué)領(lǐng)域的研究熱點(diǎn)[4]。
ECG信號(hào)和呼吸信號(hào)作為人體重要的生理信號(hào),在一定程度上能夠反應(yīng)測(cè)試者在夜間的睡眠情況,國(guó)內(nèi)外均有學(xué)者利用ECG信號(hào)對(duì)睡眠進(jìn)行分期檢測(cè),并取得了不錯(cuò)的成就。Mourad Adnane[5]等通過心率變異性(HRV)、去趨勢(shì)波動(dòng)分析(DFA)和窗口去趨勢(shì)波動(dòng)分析(WDFA)方法從RR序列中提取7個(gè)特征,采用支持向量機(jī)(Support Vector Machine, SVM)的方法對(duì)SLEEP-WAKE二類分期進(jìn)行分類,得到78.5%的準(zhǔn)確率。王金海等[6]采用SVM設(shè)計(jì)并實(shí)現(xiàn)了基于心率變異性的睡眠分期算法,采用主成分分析(PCA)的方式降低了數(shù)據(jù)間的冗余度,獲得了較高的預(yù)測(cè)精度。馮曉星[7]等通過提取單通道ECG信號(hào)的RRI和HRV六個(gè)衍生特征,利用隱馬爾可夫(Hidden Markov Model, HMM)模型對(duì)特征進(jìn)行訓(xùn)練,睡眠分期準(zhǔn)確率達(dá)92.3%。
一些學(xué)者嘗試將ECG信號(hào)和呼吸信號(hào)相結(jié)合進(jìn)行睡眠建模。M.O.Mendez[8]等基于時(shí)域自回歸模型對(duì)特征進(jìn)行提取并使用HMM對(duì)心率變異性進(jìn)行分析,監(jiān)測(cè)準(zhǔn)確率為72%。許良[9]將HMM和BP神經(jīng)網(wǎng)絡(luò)(Back Propagation Neural Networks, BPNN)相結(jié)合的混合算法應(yīng)用到睡眠分期計(jì)算中,先利用HMM對(duì)心率呼吸率信號(hào)進(jìn)行建模,得到各睡眠狀態(tài)下的HMM模型,然后利用BPNN對(duì)HMM分期計(jì)算的結(jié)果進(jìn)行記憶訓(xùn)練,提高睡眠分期的識(shí)別率。李濤[10]等在通過引入ECG信號(hào)QRSTP波之間的間距、幅值以及RR間期的分位數(shù)等新的時(shí)域特征后,利用最小二乘支持向量機(jī)(LSSVM)方式對(duì)所提取的特征進(jìn)行建模分類,在六類分期上得到75.5%的準(zhǔn)確率。由此可見,利用人工智能方式建立睡眠模型具有一定的可行性。
BPNN非常適用于睡眠階段的分析,它容錯(cuò)性強(qiáng),具有學(xué)習(xí)復(fù)雜非線性關(guān)系的能力,但是它反向?qū)W習(xí)過程緩慢,可能導(dǎo)致局部最優(yōu)解出現(xiàn)[11]。極限學(xué)習(xí)機(jī)(Extreme Learning Machine, ELM)克服了BPNN的缺點(diǎn),它基于神經(jīng)網(wǎng)絡(luò)的概念,精確度高、處理數(shù)據(jù)時(shí)間短,相較于BPNN具有更好的泛化能力和處理速度。在建立睡眠模型后,提取原始數(shù)據(jù)中的特征數(shù)據(jù)進(jìn)行學(xué)習(xí),但并非所有特征都是有效的,并且ELM初始化參數(shù)生成方式的隨機(jī)性會(huì)導(dǎo)致模型不可避免的產(chǎn)生隱含層神經(jīng)元冗余、對(duì)位置輸入?yún)?shù)識(shí)別能力差等問題,從而降低預(yù)測(cè)精度。針對(duì)這些問題,本文通過粒子群優(yōu)化算法(Particle Swarm Optimization, PSO)對(duì)原始特征數(shù)據(jù)進(jìn)行擇優(yōu)選擇以及對(duì)ELM的輸入權(quán)值和隱含神經(jīng)元的閾值進(jìn)行尋優(yōu),從而建立PSO-ELM模型以提高睡眠模型的精度。
實(shí)驗(yàn)數(shù)據(jù)來自麻省理工學(xué)院提供的MIT-BIH多導(dǎo)睡眠數(shù)據(jù)庫[12],該數(shù)據(jù)庫中共記錄了17個(gè)受試者的相關(guān)數(shù)據(jù),對(duì)于每位受試者,該數(shù)據(jù)庫提供了包括EEG、ECG、呼吸和血壓等4種生理數(shù)據(jù),并提供了人工標(biāo)注的睡眠分期標(biāo)簽,數(shù)據(jù)采樣頻率為250 Hz。睡眠分期遵循R&K準(zhǔn)則,對(duì)每位受試者的生理數(shù)據(jù)按照30 s進(jìn)行分段,并對(duì)睡眠階段進(jìn)行標(biāo)注。
生理信號(hào)通常會(huì)受一些未知頻率成分的干擾,因此本文對(duì)ECG信號(hào)和呼吸信號(hào)作濾波處理。一般ECG信號(hào)的頻率范圍為0.05~100 Hz,采用巴特沃斯低通濾波器對(duì)ECG信號(hào)進(jìn)行預(yù)處理。呼吸信號(hào)的波形簡(jiǎn)單且頻率較低,噪聲主要以高頻噪聲為主。正常人的呼吸頻率為0.2~0.4 Hz,采用Kasier低通濾波器對(duì)呼吸信號(hào)進(jìn)行預(yù)處理,將濾波器的帶通頻率設(shè)為0.5 Hz,帶阻頻率設(shè)為1.0 Hz,帶通波動(dòng)與帶阻衰減分別設(shè)為0.01和0.001。截取測(cè)試對(duì)象slp01a的一段數(shù)據(jù)(5 000個(gè)數(shù)據(jù)),濾波后的效果如圖1所示。
圖1 ECG信號(hào)、呼吸信號(hào)濾波處理
1.3.1 HRV特征提取
HRV是指連續(xù)心搏瞬間心率的微小差異或逐次心跳間隔即RR間期的變化規(guī)律。主要受心臟交感和副交感神經(jīng)雙重調(diào)節(jié)和相互制約的影響,HRV還呈現(xiàn)出與腦電類相似的周期性變化規(guī)律,其時(shí)域、頻域和非線性信號(hào)在不同的睡眠階段具有不同的特點(diǎn)。本文選取的HRV特征見表1所列。
由表1可知,HRV的時(shí)域特征由mRR、SDNN、RMSSD、SDSD、NN50和pNN50構(gòu)成。其中,mRR指相鄰RR間期的平均值,SDNN指RR間期的標(biāo)準(zhǔn)差,RMSSD指RR間隔之間差異平方均值的平方根,SDSD指相鄰RR間隔之間的差異標(biāo)準(zhǔn)偏差,NN50指相鄰RR間隔相差超過50 ms的個(gè)數(shù),pNN50指相鄰RR間隔相差50 ms的個(gè)數(shù)占總間隔個(gè)數(shù)的百分比。
表1 HRV特征提取總結(jié)表
HRV的頻域特征由VLF、LF、HF、TP、pLF、pHF和LFHF構(gòu)成。一般HRV頻譜劃分為4個(gè)頻帶[13]:甚低頻ULF(<0.03 Hz)、極低頻(0.03~0.04 Hz)、低頻(0.04~0.15 Hz)和高頻(0.15~0.4 Hz)。頻域分析方法應(yīng)選取一段信號(hào)進(jìn)行頻譜分析,睡眠分期標(biāo)簽的時(shí)間是30 s,因此本研究選取30 s的HRV信號(hào)作為時(shí)間尺度,提取該尺度內(nèi)的頻域特征。
近似熵(Approximate Entropy, ApEn)和樣本熵(Sample Entropy, SamEn)是兩種較為常用的非線性分析指標(biāo)。此前,ApEn和SamEn更多用于分析腦電信號(hào)。將ApEn和SamEn應(yīng)用于睡眠心率數(shù)據(jù)和呼吸數(shù)據(jù)的分析,可以定量描述在不同睡眠階段下心率和呼吸的波動(dòng)情況。本文采用ApEn分析HRV的非線性特征。
1.3.2 呼吸信號(hào)特征提取
呼吸作為人體重要的生理信號(hào)之一,隨著睡眠的加深,測(cè)試者的呼吸頻率也會(huì)逐漸降低。呼吸波有著類似HRV的變化規(guī)律,其時(shí)域和頻域特征在不同的睡眠階段有著不同的表現(xiàn)。本文選取的呼吸特征見表2所列。
表2 呼吸特征提取總結(jié)表
采用和HRV相似的時(shí)域分析方法,其中Resppeak_num指一段時(shí)間內(nèi)呼吸波峰數(shù)量,Average_Resp指一段時(shí)間內(nèi)呼吸波峰波谷的間隔平均值,Resppeak_valley_SD指連續(xù)波峰波谷的間隔標(biāo)準(zhǔn)差,Resppeak_SD指連續(xù)呼吸波峰的間隔標(biāo)準(zhǔn)差。
參考已有研究,將呼吸波頻譜分為3個(gè)頻帶:極低頻VLF(0.01~0.05 Hz)、低頻LF(0.05~0.15 Hz)和高頻HF(0.15~0.5 Hz)。呼吸波的頻域特征在一定程度上反應(yīng)了呼吸量的強(qiáng)弱,當(dāng)呼吸頻譜能量較大時(shí),說明呼吸信號(hào)能量集中,呼吸活動(dòng)比較有規(guī)律;當(dāng)頻譜能量較小時(shí),說明呼吸信號(hào)能量分散,呼吸活動(dòng)表現(xiàn)為隨機(jī)性強(qiáng)、規(guī)律性弱。同時(shí),本文也計(jì)算了呼吸波的近似熵來反應(yīng)呼吸波的非線性特征。
1.3.3 心肺耦合信號(hào)特征提取
哈佛醫(yī)學(xué)院的C.K Peng等人[14]將心肺耦合現(xiàn)象用于研究睡眠質(zhì)量和睡眠呼吸事件。通過計(jì)算心率信號(hào)和呼吸信號(hào)在給定頻率下的功率乘積,即測(cè)量互功率譜可以得到這兩個(gè)信號(hào)在該頻率下是否有較大的振幅。另外,計(jì)算心率信號(hào)和呼吸信號(hào)的相干性,由此可知這兩個(gè)信號(hào)的振蕩同步情況,即是否保持恒定的相位同步。用相干性和互功率譜相乘得到的結(jié)果來定量估計(jì)心肺耦合的強(qiáng)度。利用文獻(xiàn)[15]中的研究方法,得到低頻LF(0.04~0.10 Hz)和高頻HF(0.10~0.40 Hz)頻段范圍內(nèi)的耦合能量。
1.4.1 極限學(xué)習(xí)機(jī)
極限學(xué)習(xí)機(jī)(ELM)[16]是一種有效的單隱含層前饋神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法,它與傳統(tǒng)的單隱含層前饋神經(jīng)網(wǎng)絡(luò)相比,能夠有效克服傳統(tǒng)神經(jīng)網(wǎng)絡(luò)因采用梯度下降法進(jìn)行訓(xùn)練而導(dǎo)致陷入局部極值的缺點(diǎn),并且具有處理速度快、泛化能力強(qiáng)、易于實(shí)現(xiàn)等優(yōu)點(diǎn),其結(jié)構(gòu)示意如圖2所示。
圖2 ELM結(jié)構(gòu)示意圖
假設(shè)給定N個(gè)訓(xùn)練樣本{xi, ti),1≤i≤N,xi=[xi1, xi2, ...,xim]T∈Rm,ti=[ti1, ti2, ..., tin]T∈Rn,則ELM的訓(xùn)練模型表示為:
式中:ωi表示連接網(wǎng)絡(luò)輸入層節(jié)點(diǎn)與第i個(gè)隱含節(jié)點(diǎn)的輸入權(quán)值向量;βi表示連接第i個(gè)隱含層節(jié)點(diǎn)與網(wǎng)絡(luò)輸出層節(jié)點(diǎn)的輸出權(quán)值向量;oj表示網(wǎng)絡(luò)輸出值。
為了取得較好的預(yù)測(cè)精度,訓(xùn)練過程應(yīng)以零誤差逼近訓(xùn)練樣本,即:
聯(lián)合式(1)和式(2)可得:
式(3)可表示為:
式中:Y為網(wǎng)絡(luò)輸出矩陣;H為隱含層輸出矩陣。
由于H矩陣為常數(shù)矩陣,則ELM的學(xué)習(xí)過程可等價(jià)于式(4)中β的最小二乘解β′的求解過程,即:
式中,H+是矩陣H的Moore-Penrose廣義逆矩陣。
1.4.2 粒子群優(yōu)化算法
在粒子群優(yōu)化算法(PSO)中[17],所有粒子的適應(yīng)值由適應(yīng)度函數(shù)決定,每個(gè)粒子都被賦予速度用來搜索方向和距離,并且能夠保存尋找的最佳位置信息。粒子群在初始狀態(tài)下,通過計(jì)算個(gè)體的適應(yīng)值選擇個(gè)體的局部最優(yōu)位置向量pbest和種群的全局最優(yōu)位置向量gbest。在迭代尋優(yōu)的過程中,通過pbest和gbest不斷更新自身的速度和位置,即:
式中:W稱為慣性因子,通過調(diào)整W的大小,可以對(duì)全局尋優(yōu)性能和局部尋優(yōu)性能進(jìn)行調(diào)整;c1和c2稱為加速常數(shù),前者為每個(gè)粒子的個(gè)體學(xué)習(xí)因子,后者為每個(gè)粒子的社會(huì)學(xué)習(xí)因子,當(dāng)c1和c2為常數(shù)時(shí)可以得到較好的解,一般取c1=c2∈[0,4],通常設(shè)置c2=c2=2;r1和r2是0到1的隨機(jī)因子,可增加搜索隨機(jī)性。
1.4.3 粒子群優(yōu)化極限學(xué)習(xí)機(jī)
處理好數(shù)據(jù)的所有特征后,需要選擇出最具有代表性的特征放入極限學(xué)習(xí)機(jī)中。通過人工方式選擇特征不一定能夠得到最好的預(yù)測(cè)結(jié)果,并且ELM初始化參數(shù)生成方式是隨機(jī)確定的,有可能導(dǎo)致隱含層神經(jīng)元冗余、對(duì)未知輸入?yún)?shù)識(shí)別能力差等問題,從而影響模型精度。面對(duì)上述問題,R. Ahila[18]等提出了PSO優(yōu)化ELM的方法,該方法通過利用PSO算法對(duì)電力質(zhì)量的數(shù)據(jù)特征以及ELM的輸入權(quán)值和隱含神經(jīng)元的閾值進(jìn)行尋優(yōu),從而提高電力系統(tǒng)干擾分類模型的泛化能力和精確度。雖然睡眠狀態(tài)分期與電力系統(tǒng)干擾分類屬于不同的應(yīng)用領(lǐng)域,但本質(zhì)相同,都是對(duì)采集的信號(hào)進(jìn)行特征提取,并通過提取的特征進(jìn)行狀態(tài)分類。因此,本研究利用R. Ahila等提出的方法建立基于粒子群優(yōu)化極限學(xué)習(xí)機(jī)的睡眠分期模型(PSO-ELM)。
PSO-ELM模型中的每個(gè)粒子都用二進(jìn)制表示,包含2個(gè)部分:特征掩碼和隱含神經(jīng)元。PSO-ELM 粒子表示見表3所列。
表3 PSO-ELM 粒子表示
特征掩碼部分表示所選的特征,n表示所有特征的總數(shù)。當(dāng)pf為“1”時(shí),表示當(dāng)前特征已被選中,如果為“0”則表示未選中該特征。隱含神經(jīng)元部分表示PSO-ELM模型中隱含神經(jīng)元的數(shù)量,其中N表示最大隱含神經(jīng)元的總數(shù)。
在適應(yīng)度函數(shù)中,利用ELM和總特征選擇的精度對(duì)PSO-ELM模型進(jìn)行評(píng)價(jià),如式(7)所示:
式中:wA和wF是權(quán)重因子,表示分類精度acci和所選特征數(shù)的權(quán)重;nf是特征的總數(shù);fj是特征掩碼的第j位;acc表示分類精度,如式(8),其中分類正確和分類錯(cuò)誤的例子分別用cc和uc表示。
PSO-ELM模型的詳細(xì)步驟如下:
(2)對(duì)粒子pi在種群中的每個(gè)位置訓(xùn)練一個(gè)ELM分類器,并計(jì)算適應(yīng)度函數(shù) fi tnessi;
(4)設(shè)置迭代次數(shù),并開始迭代;
(6)對(duì)粒子pi訓(xùn)練一個(gè)ELM分類器并計(jì)算適應(yīng)度函數(shù)fi tnessi;
(7)如果粒子當(dāng)前位置的適應(yīng)度函數(shù) fi tnessi為最大值,則更新局部最優(yōu)解和全局最優(yōu)解;
(8)如果迭代次數(shù)達(dá)到最大,則回到步驟(5),否則進(jìn)行步驟(9);
(10)利用訓(xùn)練好的ELM分類器對(duì)睡眠數(shù)據(jù)進(jìn)行睡眠分期。
PSO-ELM模型的算法流程如圖3所示。
圖3 PSO-ELM模型的算法流程
為證明利用PSO算法對(duì)數(shù)據(jù)特征進(jìn)行尋優(yōu)以及對(duì)ELM分類器中隱含神經(jīng)元數(shù)量進(jìn)行尋優(yōu)后,能夠有效提升睡眠分期模型的精度,本文以三類睡眠分期數(shù)據(jù)為基礎(chǔ)做了以下實(shí)驗(yàn):
(1)確定ELM分類器隱含神經(jīng)元數(shù)量范圍;
(2)ELM、SVM、BPNN分類器在原始特征空間中分類的精度評(píng)估與對(duì)比;
(3)PSO算法對(duì)ELM、SVM分類器在數(shù)據(jù)特征尋優(yōu)后睡眠分類精度的評(píng)估與對(duì)比;
(4)PSO算法對(duì)特征以及ELM分類器中隱含神經(jīng)元數(shù)量進(jìn)行尋優(yōu)后睡眠分類精度的評(píng)估;
(5)本文方法與現(xiàn)有睡眠分類方案的對(duì)比。
原始特征數(shù)據(jù)相對(duì)較大,數(shù)據(jù)與數(shù)據(jù)間存在一定的相關(guān)性,直接用這些特征指標(biāo)來區(qū)分不同的睡眠狀態(tài)會(huì)導(dǎo)致數(shù)據(jù)間的冗余,導(dǎo)致程序運(yùn)行時(shí)間過長(zhǎng)并對(duì)預(yù)測(cè)結(jié)果造成一定影響。因此,本文利用PCA對(duì)原始特征數(shù)據(jù)進(jìn)行主成分提取,將原來具有一定相關(guān)性的數(shù)據(jù)重新組合成一組新的互不相關(guān)的綜合特征向量,用更少的數(shù)據(jù)代替原先數(shù)據(jù),提高運(yùn)算效率。
對(duì)樣本特征數(shù)據(jù)進(jìn)行PCA處理并提取新的特征向量,如圖4所示。由圖中數(shù)據(jù)可知,當(dāng)新的特征向量個(gè)數(shù)為16時(shí),累積貢獻(xiàn)率已達(dá)到95%,表明選取前16個(gè)特征向量足夠表征原始數(shù)據(jù)。通過PCA對(duì)原始特征數(shù)據(jù)進(jìn)行預(yù)處理,在滿足原始數(shù)據(jù)不失真的條件下,降低了數(shù)據(jù)量和數(shù)據(jù)間的相關(guān)性,提高了算法的執(zhí)行速度以及準(zhǔn)確性。
圖4 PCA特征降維
ELM分類器對(duì)原始數(shù)據(jù)的分類精度會(huì)隨著隱含神經(jīng)元數(shù)量的變化而變化[19]。為說明這種行為,以三類睡眠分期數(shù)據(jù)為基礎(chǔ)進(jìn)行實(shí)驗(yàn)。將ELM隱含神經(jīng)元的數(shù)量從10個(gè)增加至110個(gè),其中每新增10個(gè)為一次實(shí)驗(yàn),計(jì)算在不同數(shù)量的隱含神經(jīng)元下ELM分類器對(duì)三類睡眠分期的平均分類精度。表4為訓(xùn)練和測(cè)試時(shí)的精度變化,圖5為相應(yīng)精度變化圖。根據(jù)表4和圖5可以清楚看出,ELM分類器的訓(xùn)練精度隨隱含神經(jīng)元數(shù)量的增加而增加,在隱含神經(jīng)元數(shù)量為90時(shí)達(dá)到最大。測(cè)試精度一開始隨著隱含神經(jīng)元數(shù)量的增加而增加,當(dāng)隱含神經(jīng)元達(dá)到一定數(shù)量后,測(cè)試精度開始逐漸降低。因此,在三類睡眠分期實(shí)驗(yàn)中,隱含神經(jīng)元數(shù)量在80~90區(qū)間時(shí)測(cè)試精度達(dá)到最大。所以,在三類睡眠分期實(shí)驗(yàn)中,若不對(duì)隱含神經(jīng)元數(shù)量進(jìn)行尋優(yōu)選擇,則統(tǒng)一設(shè)定隱含神經(jīng)元數(shù)量為90。
圖5 ELM分類精度變化
表4 ELM隱含神經(jīng)元數(shù)量訓(xùn)練、測(cè)試時(shí)的精度
為能有效評(píng)估ELM分類器在原始特征空間中對(duì)睡眠信息進(jìn)行分類的有效性和優(yōu)越性,進(jìn)行了以下實(shí)驗(yàn)。
利用ELM分類器、SVM分類器以及BPNN分類器分別建立三類睡眠分期模型,并將這3個(gè)模型得到的結(jié)果進(jìn)行比較。實(shí)驗(yàn)結(jié)果見表5所列。
表5 原始特征空間中分類結(jié)果
從表5中可以看出,基于ELM睡眠分期模型的分類結(jié)果明顯優(yōu)于SVM和BPNN睡眠分期模型的分類結(jié)果,并且所耗費(fèi)的時(shí)間也最短。此外,在SVM睡眠分期模型中,訓(xùn)練集和測(cè)試集間的精度誤差高達(dá)29.09%,存在嚴(yán)重的過擬合現(xiàn)象。而在ELM睡眠分期模型中,訓(xùn)練集和測(cè)試集間的精度誤差為7.62%,雖然也存在一定的過擬合現(xiàn)象,但并不嚴(yán)重??梢宰C明,ELM分類器相較于SVM和BPNN分類器,能夠更有效的對(duì)睡眠信息進(jìn)行分類。
在上述實(shí)驗(yàn)參數(shù)不變的情況下,利用PSO算法對(duì)ELM和SVM睡眠分期模型中的特征數(shù)量進(jìn)行尋優(yōu),從而驗(yàn)證通過選擇有效的特征數(shù)量能夠提升睡眠分期模型精度的結(jié)論。其中,PSO算法中的參數(shù)設(shè)置:c1、c2設(shè)置為2,wA和wF分別設(shè)置為0.95和0.05,粒子的數(shù)量設(shè)置為30,共進(jìn)行25次實(shí)驗(yàn),選擇其中分類效果最好的一次為最后的實(shí)驗(yàn)結(jié)果(實(shí)驗(yàn)結(jié)果加粗顯示)。表6和表7分別給出了PSO算法優(yōu)化ELM和SVM睡眠分期模型進(jìn)行特征尋優(yōu)的過程。
表6 PSO算法尋優(yōu)ELM睡眠分期模型特征參數(shù)過程
表7 PSO算法尋優(yōu)SVM睡眠分期模型特征參數(shù)過程
由表6和表7可以清楚看出,可以通過PSO算法對(duì)模型中的特征進(jìn)行尋優(yōu)選擇,從而提升模型的分類精度。這說明,原始特征空間中并不是所有特征數(shù)據(jù)都是必要的,使用了不必要的特征反而會(huì)降低模型的分類精度。此外,相比較表5中ELM和SVM睡眠分期模型的分類結(jié)果,利用PSO算法對(duì)模型特征進(jìn)行優(yōu)化后,訓(xùn)練集與測(cè)試集間的精度誤差明顯降低,尤其是SVM睡眠分期模型,從原先的29.09%降低至2.12%,過擬合現(xiàn)象得到明顯緩解。
通過表4可知,ELM三類睡眠分期模型最優(yōu)的隱含神經(jīng)元的個(gè)數(shù)在80至90之間。為了能夠進(jìn)一步提高睡眠分期模型的精確度,利用PSO算法在ELM睡眠分期模型進(jìn)行特征尋優(yōu)的基礎(chǔ)上增加對(duì)隱含神經(jīng)元個(gè)數(shù)的尋優(yōu),尋優(yōu)過程見表8所列。對(duì)比表6和表8的結(jié)果可以看到,對(duì)隱含神經(jīng)元個(gè)數(shù)進(jìn)行進(jìn)一步尋優(yōu)后,ELM睡眠分期模型的整體精度從86.28%提升至87.11%,測(cè)試集與訓(xùn)練集間的誤差從3.72%降低至3.41%。雖然變化不大,但仍然可以說明利用PSO算法優(yōu)化ELM睡眠分期模型的有效性。
表8 PSO尋優(yōu)ELM特征參數(shù)和隱含神經(jīng)元個(gè)數(shù)過程
此外,表9給出了在4種不同睡眠分期狀態(tài)下,SVM睡眠分期模型、PSO-SVM睡眠分期模型、ELM睡眠分期模型以及PSO-ELM睡眠分期模型之間的對(duì)比。實(shí)驗(yàn)證明,無論是在哪種睡眠分期狀態(tài)下,利用PSO算法對(duì)SVM睡眠分期模型和ELM睡眠分期模型進(jìn)行優(yōu)化后,均可提升模型的精確度,并且能夠有效緩解過擬合現(xiàn)象。
表9 4種睡眠分期模型對(duì)比
從上述實(shí)驗(yàn)可知,PSO-ELM睡眠分期模型具有優(yōu)秀的表現(xiàn)力,以三類睡眠分期的PSO-ELM模型為基礎(chǔ),與已有的基于心電和呼吸信號(hào)的睡眠分期方案進(jìn)行比較。為保證實(shí)驗(yàn)的有效性,使用在同一數(shù)據(jù)集下的數(shù)據(jù),用文獻(xiàn)中提出的不同方法對(duì)ECG信號(hào)和呼吸信號(hào)的特征進(jìn)行提取和建模,并與本文所提方法相比較,結(jié)果見表10所列。許良[9]提出用HMM-BP模型對(duì)睡眠進(jìn)行分類,這種方法在睡眠的NREM期能得到較好的判別效果,但在REM期的表現(xiàn)不佳。李濤[10]利用LSSVM的方式對(duì)所提取特征進(jìn)行建模分類,這種分類方式在睡眠的NREM期表現(xiàn)不錯(cuò),準(zhǔn)確率達(dá)86.58%,但在WAKE期和REM期的準(zhǔn)確率均不超過80%。本文提出的PSO-ELM睡眠分期模型在WAKE期、REM期以及NREM期的準(zhǔn)確率均超過80%,NREM期的準(zhǔn)確率達(dá)88.96%。由此可以看出,PSO-ELM睡眠模型相比較現(xiàn)有睡眠分期方案具有一定優(yōu)勢(shì)。
表10 不同睡眠分期方案比較
睡眠分期是研究睡眠障礙和相關(guān)疾病的重要客觀指標(biāo),為提高睡眠分期模型的準(zhǔn)確率,本文提出了基于粒子群優(yōu)化極限學(xué)習(xí)機(jī)的睡眠分期方法。實(shí)驗(yàn)結(jié)果表明,粒子群優(yōu)化算法結(jié)合極限學(xué)習(xí)機(jī)對(duì)數(shù)據(jù)特征進(jìn)行尋優(yōu),并對(duì)ELM的輸入權(quán)值和隱含層神經(jīng)元的閾值進(jìn)行尋優(yōu),這種方法相比ELM模型而言,在睡眠分期的準(zhǔn)確率上均占有明顯優(yōu)勢(shì),并且在一定程度上能夠緩解模型的過擬合現(xiàn)象,是一種有效的睡眠分期模型,具有良好的應(yīng)用前景。