鄭 銳,劉久富 ,楊 忠,王志勝,劉海陽,丁曉彬
(1.南京航空航天大學 自動化學院,江蘇 南京 211100;2.東南大學 電子科學與工程學院,江蘇 南京 210096)
睡眠質量問題一直是人們關注自身健康和科學研究的重點之一,有效地區(qū)分睡眠質量的高低對于治療睡眠呼吸暫停,失眠和發(fā)作性睡病十分有益。以往,人們對睡眠質量的檢測基本是依靠人自身的主觀感受,醫(yī)學專家只有通過病人口述癥狀和結合其他并發(fā)癥狀才能判斷出病人的睡眠情況,這種方法缺乏客觀性,過程繁瑣,準確性不高。睡眠研究的重要數據人體腦電信(electroencephalogram,EEG)數據量巨大,人工通過實驗觀察存在較大的復雜性。計算生物學上常應用統(tǒng)計學和計算機算法對復雜海量的生物學信號進行識別和處理,可以有效地提取有用的信息[1]。文中引入了睡眠專家標注過的六狀態(tài)睡眠分期腦電信號進行分析。
馬氏田口方法作為一種模式識別與分類方法,廣泛應用于多元系統(tǒng)的自動化異常診斷與分析中,準確性較好[2-3]。通過構建馬氏基準空間,可以有效地區(qū)分正常樣本和異常樣本。通過正交表和信噪比來對各個變量進行優(yōu)化,選取最優(yōu)的變量從而對所研究的問題進行更好的分類和預測[4]。文中在人工專家睡眠分期標記過的腦電信號數據的基礎上,采用施密特正交化馬氏田口方法(Mahalanobis-Taguchi-Gram-Schmidt process,MTGS)對人睡眠質量的正常和異常進行檢測。與傳統(tǒng)的馬氏田口方法(Mahalanobis-Taguchi system,MTS)需要計算相關矩陣的逆矩陣不同,該方法通過施密特正交化計算馬氏距離,能夠有效地處理多重共線性問題,不必通過正交表計算信噪比,降低了算法的運算復雜度。
MTGS比MTS具有更大的優(yōu)勢,為了突出顯示這些方法之間的差異,先闡述一下MTS,之后將討論MTGS及其改進的變體。
在馬氏田口系統(tǒng)中計算馬氏距離(Mahalanobis-distance,MD)可參見下列公式[5-6]:
(1)
Zij=(Xij-mi)/si
(2)
其中,i(i=1,2,…,k)表示變量數目,k表示變量總數;j(j=1,2,…,n)表示樣本數目,n表示樣本總數;Zij表示歸一化變量Xij的標準化向量,Xij表示第j個樣本的第i個變量值;mi表示健康組中的第i個變量的平均值;si表示健康組中第i個變量的標準偏差;C表示健康組的關聯矩陣。
在計算馬氏距離(MD)之后,使用正交陣列來計算每個實驗的信噪比S/N。在正交陣列中,考慮了兩個級別的變量,這表明它們的存在或不存在。根據用于構建MD的變量,確定信噪比S/N的類型。對于真實水平異常未知的制造檢驗,信噪比S/N越大越好[7]。信噪比S/N可以用以下方式計算:
(3)
在式1中,對于所考慮的變量之間存在相關性非常高的情況,相關矩陣變得奇異,相關矩陣C的逆矩陣不正確。這種在變量之間具有強相關性的現象稱為多重共線性,根據式1和式2,可能不準確。此外,在某些情況下需要觀察到良好的異常值發(fā)生方向,MTS無法識別異常的方向,對于異常方向的多重共線性和識別,優(yōu)選MTGS方法。
MTGS是對MTS的改進,通過Gram-Schmidt正交化處理(Gram-Schmidt orthogonalization process,GSP)可以計算出MTGS方法中的MD。
Gram-Schmidt正交化處理將線性獨立向量轉換成正交向量。通過式2得到的正態(tài)變量(Zij)的標準化向量被視為線性獨立向量以計算向量的正交集合。Gram-Schmidt正交化過程的方程組如下[8-9]:
(4)
其中,Zk=(Zk1,Zk2,…,Zkn)是根據等式獲得的標準矢量的第k組;Uk=(Uk1,Uk2,…,Ukn)是具有相同線性跨度的相互垂直向量的第k組。
對應第j次觀測的馬氏距離如下式[10]:
(5)
其中,Ukj是正交矢量Uk的元素;Sk是Uk的標準偏差;k是變量總數。
在MTGS方法中,可以直接計算變量的S/N比。第i個變量的信噪比S/N[11]為:
(6)
然而,根據式6計算S/N,只有當所考慮的變量之間的部分相關性的影響不顯著時才有效。另外,通過利用式6在MTGS過程中,結果取決于考慮變量的順序。因此,通過MTGS方法計算MD并采用正交陣列,并根據式3評估S/N比的方法消除了MTS和MTGS的所有缺點。這里使用改進過的MTGS方法。
算法:MTGS異常檢測算法
輸入:Xij,M,N;
1.獲取數據序列Xij。
3.求解歸一化向量Zij。
While(1≤i≤M)
While(1≤i≤N)
Zij=(Xij-mi)/si
End While;
End While;
ReturnZij
4.施密特正交化處理,得到Uij。
While(1≤k≤M)
End While;
ReturnU1,U2,…,Uk
5.求解Uk的標準差si,Uij為Uk中的元素。
6.計算信噪比值ηi。
While(1≤j≤N)
While(1≤i≤M)
ηi=-10*log(Si*Si/Uji*Uji)
End While;
End While;
Returnηi
While(1≤j≤N)
x=x+ηi
End While;
多導睡眠圖是一種應用于睡眠障礙診斷和治療的技術,其中腦電信號(EEG)是代表大腦神經元活動的一種電信號,可無創(chuàng)測量,所以EEG信號一直是研究人體不同睡眠周期大腦活動的有力工具[12]。傳統(tǒng)的睡眠階段分類是專家根據Rechtschaffen和Kales(R & K)制定的分類標準。文中使用R & K標準中的六狀態(tài)睡眠階段:清醒期(Awa),第1階段(S1),第2階段(S2),第3階段(S3),第4階段(S4)和快速眼動期(REM)。
使用的實驗數據來自Sleep-EDF數據庫,它是Physionet數據庫的一部分。文中使用了兩組實測的睡眠腦電數據記錄,測試者的年齡為21~55歲,平均年齡36歲。第一組數據記錄了112例睡眠健康志愿者的睡眠數據,把這一組作為研究的睡眠正常組。第二組數據記錄了108例有輕度睡眠障礙的受試者的睡眠數據,把這一組作為研究的睡眠異常組。在這項研究中,選擇Pz-Oz和Fpz-Cz兩個通道的EEG信號來分析和識別睡眠階段。這些段的原始睡眠階段用6個類別來標記:S1,S2,S3,S4,REM和Awa,文中研究僅涉及AWA,S1~S4和REM睡眠階段。對每個通道的每個睡眠階段分別采樣,兩個通道的六個周期各采集200組EEG信號值,EEG信號圖如圖1所示。
圖1 EEG信號
采用前述的GSP方法對睡眠數據進行處理。MTGS異常檢測算法展示了數據處理的全過程,健康組樣本和異常組樣本均采用該算法。
利用六個周期的健康組和異常組樣本數據,計算出各個通道的均值mi、標準差si。然后根據式2對原始向量進行標準化處理以得到線性獨立向量,對線性獨立向量做正交化處理。使用式6計算出各樣本的S/N信噪比值。分別求取健康組和異常組六個睡眠周期的S/N比率的平均值,繪制健康組與異常組S/N信噪比平均值分布的波形圖,如圖2所示。
可以看出,從清醒期開始,第一階段到第四階段,再到REM階段,睡眠正常者的各周期信噪比均值均處于睡眠異常者的上方,由此看來,可以明顯區(qū)分出睡眠正常者和睡眠異常者。
圖2 S/N均值波形
圖中,睡眠異常者的清醒期的信噪比均值與睡眠正常者相比,差距很大,進入睡眠第一階段后有一個明顯的提升。相較于睡眠正常者,異常者的六個睡眠周期的信噪比均值的波動性較大。此外,兩條信噪比均值的曲線都呈上升趨勢,其中異常者的上升幅度明顯快于正常者。
在清醒期(Awa),睡眠正常者和異常者信噪比均值分別為-51.84和-67.94,二者差值達到了16.1,差距很大。在睡眠周期的第一階段,睡眠正常者信噪比均值為-44.22,睡眠異常者信噪比均值為-51.62,比健康者降低了7.4,相較于清醒期差值有所減??;第二階段相較于第一階段二者的差距有所拉大;第三階段,睡眠正常者的信噪比均值為-45.64,睡眠異常者的信噪比均值為-51.13,異常者要比正常者低了5.49,信噪比均值的差距縮小,但仍大于第一階段的差距;第四階段,睡眠異常者要比正常者低了7.0,相較于上一階段差距增大;在REM階段,睡眠正常者與異常者的差值達到6.21,比上一階段有小幅減少。
闡述了人體睡眠質量的自動檢測方法,采用施密特正交化馬氏田口方法求取EEG信號的信噪比均值,進而實現對正常者和異常者的有效辨識。采用的EEG信號由人工專家精確劃分為六個睡眠周期,分別對這六個睡眠周期使用馬氏田口正交化處理方法(MTGS)求取信噪比值。最后對各個周期的信噪比均值波形進行對照發(fā)現,從清醒期開始,第一階段到第四階段,再到REM階段,睡眠正常者的各周期信噪比均值均處于睡眠異常者的上方。因此,使用MTGS方法可以有效地區(qū)分睡眠正常者和睡眠異常者。將該算法應用于人體睡眠質量判別,為人工智能自動檢測睡眠質量取代傳統(tǒng)人工判別提供了新的思路。
將馬氏田口模型應用于解決人體睡眠質量的檢測問題,有一定的可行性,但考慮其實現的前提是要基于人工專家劃分完成的六個睡眠分期,使其應用存在局限性。未來可考慮采用馬氏田口模型對睡眠腦電信號進行自動睡眠分期,從而提升整體睡眠質量檢測算法的應用范圍。