李 昕, 李梓澎, 劉 毅, 謝 平,3, 王玉琳
(1.燕山大學 電氣工程學院,河北 秦皇島 066004; 2.河北省測試計量技術及儀器重點實驗室,河北 秦皇島 066004; 3.燕山大學 康養(yǎng)產業(yè)技術研究院,河北 秦皇島 066004;4.秦皇島市第一醫(yī)院,河北 秦皇島 066099)
世界衛(wèi)生組織將癡呆癥定義為一種會影響記憶力、思維能力和日?;顒幽芰Φ纳窠浲诵行约膊1],近七成的癡呆癥病例是由阿爾茨海默癥(Alzheimer disease,AD)引起。AD是由于大腦的神經細胞損傷、蛋白質異常沉積(P-tau蛋白和β-淀粉樣蛋白42)引起的老年斑和神經原纖維纏結導致,進而引起神經元連接失活、腦部炎癥和氧化應激[2]。介于健康老齡化和AD之間的臨床中間階段被稱為輕度認知障礙(mild cognitive impairment,MCI)[3]。
MCI可出現(xiàn)多種癥狀,當記憶喪失是主要癥狀時,它被稱為遺忘型輕度認知障礙(amnestic mild cognitive impairment,aMCI),經常被視為AD的前驅階段[4]。值得注意的是這一階段的患者尚具有可逆性[5]。因此,能夠準確地診斷出MCI患者并對其實施必要的干預措施,可在一定程度上延緩病情惡化、有利于其早日康復,從而能夠有效降低AD患者數(shù)量及護理成本,顯著提升患者及家屬的生活質量。
腦電(electroencephalogram,EEG)又稱腦電圖、腦波圖,是一種能夠記錄神經電生理活動的神經成像技術手段,具有非侵入式、高時間分辨率等優(yōu)點,能夠很好地反映大腦電生理活動[6]。相較于磁共振成像等設備,基于EEG的診斷方案使得認知障礙患者的低成本大規(guī)模篩查成為可能。腦電信號為直接測量大腦活動,提供了豐富的認知信息[7,8],宏觀上反映了大腦皮層神經元之間相互作用產生的電磁場的疊加效應,因此由神經元引起的認知障礙可以通過腦電圖來間接研究[9]。具體而言,當患者認知功能和皮層結構發(fā)生變化時,相應的會在腦電圖中觀察到異常場電位信號[10]。這類異常表現(xiàn)為腦電信號功率譜減慢[11~17](低頻節(jié)律的能量增加、高頻節(jié)律能量減少),復雜性減小[14,18],同步性、連通性喪失[14,19,20]。
基于此,在以往的研究中,絕對、相對頻譜功率[21]和小波相關性等時頻特征附加空間連通性、同步性度量[22]常被用于描述不同患者間腦電信號差異。此外由于腦電信號存在非線性、非平穩(wěn)特性,也有學者綜合考慮諸如常規(guī)頻段的相對功率、中值頻率、譜熵[23,24]、樣本熵[25]、Tsallis熵[26]、排序熵、模糊熵、Lempel-Ziv復雜度、分形維數(shù),Hurst指數(shù)和自互信息[27]等時頻、統(tǒng)計、非線性特征并將其應用于認知障礙患者腦電信號的分析中,根據(jù)特征矢量的維度構建復雜度相匹配的自動診斷模型,取得了不錯的成果。總體而言,相關研究大多集中在對特征空間的探索方面,實際應用中,在EEG數(shù)據(jù)訓練前饋神經網絡、k-近鄰、支持向量機、決策樹等傳統(tǒng)機器學習模型之前,通常會將特征空間的統(tǒng)計信息和由腦電信號提取的低維特征量轉換為特定大小的特征矢量,進而實現(xiàn)認知障礙患者的診斷和檢測[28,29]。
伴隨著由信息時代跨到了大數(shù)據(jù)時代,以卷積神經網絡(convolutional neural network,CNN)為代表的深度學習模型在處理醫(yī)學圖像數(shù)據(jù)時表現(xiàn)出了良好的性能[30,31]。深度學習技術是根據(jù)反向傳播算法自動更新權值,直接從數(shù)據(jù)供應側自動提取表征信息,但如果直接將腦電圖作為網絡模型的輸入數(shù)據(jù),效果并不是很理想[32]。這一現(xiàn)象可能是由于個體之間的生理差異造成的,這些差異的大小各不相同,但會嚴重影響旨在跨對象推廣的模型性能[33],這是CNN在應對以腦電圖為數(shù)據(jù)樣本的特定場景會受限的潛在原因之一。因此針對腦電信號非線性、非平穩(wěn)特性建立一種有效的維度變換方法是十分必要的。此外,現(xiàn)有研究的工作重心在于如何提高診斷系統(tǒng)的準確性,而對于認知障礙診斷這一應用場景而言,如果能夠對受試者的腦電信號進行正確、穩(wěn)定的分類,以此為基礎開發(fā)的自動診斷系統(tǒng)可以有效的輔助醫(yī)師做出更好的臨床決策,從而緩解緊張的醫(yī)療資源。為了探究這一問題,以腦電圖為數(shù)據(jù)源對比分析了CNN和傳統(tǒng)機器學習模型的魯棒性,并構建了一種用于aMCI篩查的自動診斷方案。
考慮到認知障礙在腦電圖層面的表現(xiàn)形式,時頻分析是研究認知障礙的一個重要手段[34]。時頻分析是通過構造時間和頻率的聯(lián)合函數(shù)來描述腦電信號在不同時間和頻率的能量密度或強度,從而實現(xiàn)由一維時序數(shù)據(jù)到二維圖像數(shù)據(jù)的轉換。提出了基于譜熵的維度轉換方法,對比分析了以短時傅里葉變換(short-time fourier transform,STFT)和小波變換(wavelet transform,WT)為代表的時頻分析方法。
STFT使用固定窗函數(shù),窗函數(shù)類型的選擇以及窗寬的選定直接影響信號的分析效果,需兼顧時域分辨率和頻域分辨率來選擇窗函數(shù)和窗寬。單通道EEG信號x(t)的短時傅里葉變換計算公式為:
(1)
式中:g(t)為可以沿著時間軸移動的窗函數(shù)。本文所用的窗函數(shù)為Kaiser窗,指定頻域分辨率為3 Hz。
小波變換能夠同時在時域和頻域內對信號進行局部分析[35],它是將無限長的三角函數(shù)基換成了有限長的帶有衰減因子的小波基,通過對高頻使用窄窗口大小和對低頻使用寬窗口大小來提供最佳的時頻分辨率[36]。更適用分析腦電信號在時域和頻域的局部信息[37]。單通道EEG信號x(t)的小波變換計算公式為:
(2)
式中:t為時間;ψ為母小波;a為尺度參數(shù);b為平移參數(shù);XWT(a,b)為小波系數(shù)(一系列小波的幅度),*表示復共軛。當尺度參數(shù)a較大時,它伸展信號適用于低頻;而小的尺度參數(shù)a壓縮信號適用于高頻。該變換不僅作用于母小波的伸縮尺度,還作用于幅值。如果a大,則小波的振幅低,如果a小,則小波振幅高。換言之,小波函數(shù)根據(jù)平移參數(shù)b掃描輸入信號,以獲得特定的尺度參數(shù)a值,并對每個a值重復該過程。本文采用的母小波為Morse(3,60)小波[38],其作為解析小波的一種復值小波,因而適用于腦電信號的復雜和非平穩(wěn)特性。
(3)
則譜熵XPS定義為:
(4)
式中:N為總頻率點。使用歸一化譜熵,定義為:
(5)
式中:分母log2N表示白噪聲均勻分布在頻域的最大譜熵。信號的譜熵越高,信號越無序(復雜);相反,譜熵越低,信號越有序(簡單)。
診斷方案如圖1所示:(1)對原始腦電信號進行預處理,并采用加窗移動分段方法(窗口長度為 4 s)對時序數(shù)據(jù)進行增強。(2)計算每個案例的功率譜、譜熵以及小波變換系數(shù),以將其轉換為適合作為網絡輸入的圖像數(shù)據(jù)。最后將得到的圖像數(shù)據(jù)集用于模型的訓練和評估。
圖1 基于腦電信號的輕度認知障礙診斷方案流程圖Fig.1 Flow chart of diagnosis scheme for mild cognitive impairment based on EEG signal
準確度(accuracy,ACC)是一種廣泛使用的直觀度量,但僅僅獲得較高的ACC并不足以確保良好的分類性能,因為它可能隱藏了較少的被模型預測為正類的正樣本和被模型預測為負類的負樣本[40]。而F1-score是精確度和召回率的加權平均值,因此,F1-score越高意味著模型同時具備更好的精確度和召回率[41]。
后來,關之琳的乳罩倏地落了下去,快得像閃電一樣,我連什么也沒有看清,鏡頭便一轉:瓦藍瓦藍的天空下,筆直的高速公路上,車群如蟻。
本文采用十折交叉驗證將樣本隨機劃分為訓練集和測試集(7.2/10折用于學習、更新網絡權重,1.8/10折用于驗證、防止模型過擬合,1/10折用于測試、評估模型),分別計算了準確度、F1-score來評估模型的整體性能。
本研究依據(jù)《赫爾辛基宣言》進行,經秦皇島市第一醫(yī)院醫(yī)學倫理委員會批準,共有46名符合納入和排除標準的老年人在簽署知情同意書后開展實驗。其中,選取的受試者包含aMCI受試者26人;健康對照(healthy controls,HC)受試者為20人。
使用數(shù)字腦電圖儀(NT9200,北京中科新拓儀器有限公司,中國)對受試者的16導靜息態(tài)腦電信號進行記錄。每個受試者的腦電信號記錄時長為15 min,采樣率為1 000 Hz。
腦電信號預處理包括帶通(0.5~40 Hz)濾波和獨立成分分析以去除50 Hz的工頻干擾以及眼電偽跡、肌電偽跡、突變斜坡、離群值。對預處理完的數(shù)據(jù)集采用窗口寬度為4 s,重疊率為50%(滑動步長為2 s)的滑動時間窗對腦電信號進行分段,得到預處理后的數(shù)據(jù)集。
如圖2所示按照國際標準10/20系統(tǒng)放置電極,預處理后的每個樣本均為16×4 000(通道×數(shù)據(jù)點)的腦電圖。
圖2 電極相對位置及16通道腦電信號示意圖Fig.2 Relative position of electrodes and schematic diagram of 16 channel EEG signal
為了挖掘時頻圖像中潛在的表征信息,針對樣本特性構建了卷積神經網絡。在經過每層卷積運算時,輸出圖像數(shù)據(jù)的空間尺寸逐漸減小、通道數(shù)量逐漸增加。通過Matlab構建神經網絡模型時也遵循了這一設計原則,進而避免信息瓶頸。如圖3 所示模型主體是2個卷積層(C1,C2),每個卷積層使用ReLU激活函數(shù),然后通過在每個卷積層之后添加最大池化層(P1,P2)來對數(shù)據(jù)進行下采樣。卷積運算完成后,緊接著是全連接層和Softmax層。為防止模型過擬合將Dropout算法(P=0.95)添加到全連接層和C2之間。
圖3 CNN網絡結果示意圖Fig.3 Schematic Diagram of CNN Network Results
實驗中,采用Glorit初始化器(也稱為Xavier初始化器)初始化權重[42],并用零初始化偏差。訓練過程中使用Adam優(yōu)化算法[43],并將學習率設置為10-5~10-4。為了使神經網絡更好地學習數(shù)據(jù)集,將批次大小設置為64。此外,對比分析了快速、可解釋強的判別分析(DA)、前饋神經網絡(FNN)、最近鄰分類器(KNN)、邏輯回歸模型(LR)、樸素貝葉斯分類器(NB)、支持向量機(SVM)和集成樹(TR)共7種常用機器學習模型在輕度認知障礙分類任務中的性能。圖4展示了模型優(yōu)化過程中最小分類誤差曲線。表1展示了通過貝葉斯尋優(yōu)得到的模型最佳配置參數(shù)。
表1 分類器最佳超參數(shù)Tab.1 Best super parameter of classifier
圖4 模型超參數(shù)貝葉斯優(yōu)化最小分類誤差曲線圖Fig.4 Curve chart of minimum classification error for model hyperparametric Bayesian optimization
短時傅里葉變換、連續(xù)小波變換和譜熵3種維度變換方法如圖5所示,由腦電數(shù)據(jù)集進行上述維度變換構建時頻圖像數(shù)據(jù)集, 依次命名為P50、W50、S50;由3個圖像數(shù)據(jù)集分別訓練CNN模型。并對結果進行了比較分析,探討了維度變換方法的有效性。
圖5 腦電信號3種維度變換示意圖Fig.5 Schematic Diagram of Three Dimensional Transformation of EEG Signal
圖6 3種維度變換方法對應的平均驗證準確率和損失曲線Fig.6 Average verification accuracy and loss curve corresponding to three dimensional transformation methods
CNN在對應的測試數(shù)據(jù)集上性能指標的檢驗分析如圖7所示(十折交叉驗證對應測試集的模型評估指標,Kolmogorov-Smirnov test,*p<0.05,**p<0.01)。根據(jù)同一模型在不同維度變換方法對應數(shù)據(jù)集的性能表現(xiàn)可以發(fā)現(xiàn)相較于時頻分析而言,譜熵算法在表征受試者認知障礙模式更具優(yōu)勢。針對腦電這一非平穩(wěn)時間序列數(shù)據(jù)而言,相較于短時傅里葉變換,小波變換通過伸縮和平移所獲取的時頻表示更富足。先前的研究表明[44]認知障礙程度不同的受試者腦電圖功率譜是相似的,存在顯著差異的主要是頻率成分的不確定度。而譜熵是在時頻分析的基礎上引入了非線性度量,需盡可能的增大類別間的差異性。此外,模型本質上是數(shù)據(jù)中潛在映射關系的一種表達方式,因此模型性能在一定程度上反映了3種維度變換方法的有效性。這或許是譜熵維度變換方法對應的模型性能具有良好綜合指標的原因所在。因此在構建以腦電信號為代表的診斷模型時,譜熵是一種值得考慮的維度變換方法。
圖7 3種維度變換方法對應的模型測試性能Fig.7 The odel performance corresponding to the three dimensional transformation methods
鑒于譜熵對應CNN模型的上述優(yōu)異性能,隨后從機器學習分類器入手由S50數(shù)據(jù)集提取特征矢量構建認知障礙模式識別的常規(guī)方案。針對機器學習分類器的特性,從平均幅度和標準差2個角度提取譜熵圖像的特征矢量作為時頻特征數(shù)據(jù)集。具體而言,由一幅16×4 000(通道×數(shù)據(jù)點)的腦電圖可以得到與通道相對應的16幅17×17的時頻圖像,相應的由時頻圖像逐通道計算均值和標準差可以得到16×2特征矢量。圖8展示了基于譜熵的維度變換對應CNN和其他7種分類器的測試性能。性能由高到底依次為;CNN、SVM、FNN、KNN、TR、DA、LR、NB。
圖8 譜熵方法對應的不同分類器性能Fig.8 Performance of Different Classifiers Corresponding to Spectral Entropy Dimension Transformation Method
分別對原始測試樣本及其加噪測試樣本(對應的腦電信號添加10dbW的高斯噪聲)探究2種診斷方案的穩(wěn)定性。圖8展示了分類器的測試(原始測試集)、預測(加噪測試集)性能。可以看出在測試集上CNN性能遠高于其他機器學習分類器;而對于加噪后的測試樣本而言,包含CNN在內的分類模型性能均出現(xiàn)了不同程度的驟降。但結合性能下降百分比可知,CNN模型具有較強的數(shù)據(jù)容錯能力,能夠挖掘出具有更穩(wěn)定的表征信息。
為了探究性能衰退的潛在原因,對加噪前后的特征矢量進行組間統(tǒng)計檢驗。檢驗結果如圖9所示(Kolmogorov-Smirnov test,*p<0.05,**p<0.01)??梢园l(fā)現(xiàn)加噪后的特征矢量(特征矢量的構成成分包含譜熵圖像逐通道計算的均值、標準差)組間差異顯著性降低,特別是左側顳葉和枕葉。
圖9 信號加噪前、后譜熵特征矢量的組間差異性Fig.9 Inter-group differences of spectral entropy feature eigenvector of signal before and after adding noise
這一檢驗結果和認知障礙相關文獻[45]中所描述的敏感腦區(qū)是一致的,即這些腦區(qū)對應的腦電通道或許在進行認知障礙模式識別對發(fā)揮著不可或缺的作用。在模型層面,傳統(tǒng)的機器學習分類模型搭配使用了包含特征矢量的構建、遴選在內的特征工程[46]。而卷積神經網絡則以譜熵圖像為輸入,通過逐層捕捉到的漸變特征鏈進行模式識別。此外,卷積神經網絡自身所具備的的3種結構(局部感受域;卷積層;池化或子采樣層)在一定程度上提升了其空間魯棒性和容錯性[47]。這或許是圖8中CNN性能下降百分點不多的原因。
上述研究結果表明,大多數(shù)分類器在充分預測輕度認知障礙方面具有較高的模式識別能力。8個分類器中,有6個(CNN、SVM、TR、KNN、FNN、DA)的ACC和F1得分超過80%。當數(shù)據(jù)集具有高維特征矢量且只有少數(shù)實例時,FNN和SVM是值得考慮的,李昕[48]等人的先前研究也證明了這一點。基于腦電信號的輕度認知障礙早期臨床篩查,診斷方案的準確性、穩(wěn)定性比模型的實時性更重要。而本文提出的以譜熵為代表的維度變換結合CNN診斷方案可以很好的滿足這一性能需求。
傳統(tǒng)的診斷方案通過對腦電圖的特征矢量進行模式識別來實現(xiàn)阿爾茨海默癥臨床前階段的辨識,但其因精度低、穩(wěn)定性差等原因未能在臨床中得到很好的應用。針對這一現(xiàn)象,在時頻分析的基礎上提出了一種基于譜熵的維度變換方法,并由CNN對3種維度變換方法進行了比較分析。實驗結果表明在時頻分析中引入非線性度量的譜熵更符合CNN在圖像分類方面的優(yōu)勢。
此外,從穩(wěn)定性的角度探究了譜熵圖像結合CNN的抗干擾能力。實驗分析發(fā)現(xiàn)高度抽象的特征矢量對噪聲似乎更敏感,而以神經網絡為代表的漸變特征鏈具備更好的抗干擾能力。因此,以譜熵為代表的維度變換方法結合卷積神經網絡可以有效地實現(xiàn)輕度認知障礙診斷。