李 昕, 李梓澎, 劉 毅, 謝 平,3, 王玉琳
(1.燕山大學(xué) 電氣工程學(xué)院,河北 秦皇島 066004; 2.河北省測試計(jì)量技術(shù)及儀器重點(diǎn)實(shí)驗(yàn)室,河北 秦皇島 066004; 3.燕山大學(xué) 康養(yǎng)產(chǎn)業(yè)技術(shù)研究院,河北 秦皇島 066004;4.秦皇島市第一醫(yī)院,河北 秦皇島 066099)
世界衛(wèi)生組織將癡呆癥定義為一種會(huì)影響記憶力、思維能力和日常活動(dòng)能力的神經(jīng)退行性疾病[1],近七成的癡呆癥病例是由阿爾茨海默癥(Alzheimer disease,AD)引起。AD是由于大腦的神經(jīng)細(xì)胞損傷、蛋白質(zhì)異常沉積(P-tau蛋白和β-淀粉樣蛋白42)引起的老年斑和神經(jīng)原纖維纏結(jié)導(dǎo)致,進(jìn)而引起神經(jīng)元連接失活、腦部炎癥和氧化應(yīng)激[2]。介于健康老齡化和AD之間的臨床中間階段被稱為輕度認(rèn)知障礙(mild cognitive impairment,MCI)[3]。
MCI可出現(xiàn)多種癥狀,當(dāng)記憶喪失是主要癥狀時(shí),它被稱為遺忘型輕度認(rèn)知障礙(amnestic mild cognitive impairment,aMCI),經(jīng)常被視為AD的前驅(qū)階段[4]。值得注意的是這一階段的患者尚具有可逆性[5]。因此,能夠準(zhǔn)確地診斷出MCI患者并對(duì)其實(shí)施必要的干預(yù)措施,可在一定程度上延緩病情惡化、有利于其早日康復(fù),從而能夠有效降低AD患者數(shù)量及護(hù)理成本,顯著提升患者及家屬的生活質(zhì)量。
腦電(electroencephalogram,EEG)又稱腦電圖、腦波圖,是一種能夠記錄神經(jīng)電生理活動(dòng)的神經(jīng)成像技術(shù)手段,具有非侵入式、高時(shí)間分辨率等優(yōu)點(diǎn),能夠很好地反映大腦電生理活動(dòng)[6]。相較于磁共振成像等設(shè)備,基于EEG的診斷方案使得認(rèn)知障礙患者的低成本大規(guī)模篩查成為可能。腦電信號(hào)為直接測量大腦活動(dòng),提供了豐富的認(rèn)知信息[7,8],宏觀上反映了大腦皮層神經(jīng)元之間相互作用產(chǎn)生的電磁場的疊加效應(yīng),因此由神經(jīng)元引起的認(rèn)知障礙可以通過腦電圖來間接研究[9]。具體而言,當(dāng)患者認(rèn)知功能和皮層結(jié)構(gòu)發(fā)生變化時(shí),相應(yīng)的會(huì)在腦電圖中觀察到異常場電位信號(hào)[10]。這類異常表現(xiàn)為腦電信號(hào)功率譜減慢[11~17](低頻節(jié)律的能量增加、高頻節(jié)律能量減少),復(fù)雜性減小[14,18],同步性、連通性喪失[14,19,20]。
基于此,在以往的研究中,絕對(duì)、相對(duì)頻譜功率[21]和小波相關(guān)性等時(shí)頻特征附加空間連通性、同步性度量[22]常被用于描述不同患者間腦電信號(hào)差異。此外由于腦電信號(hào)存在非線性、非平穩(wěn)特性,也有學(xué)者綜合考慮諸如常規(guī)頻段的相對(duì)功率、中值頻率、譜熵[23,24]、樣本熵[25]、Tsallis熵[26]、排序熵、模糊熵、Lempel-Ziv復(fù)雜度、分形維數(shù),Hurst指數(shù)和自互信息[27]等時(shí)頻、統(tǒng)計(jì)、非線性特征并將其應(yīng)用于認(rèn)知障礙患者腦電信號(hào)的分析中,根據(jù)特征矢量的維度構(gòu)建復(fù)雜度相匹配的自動(dòng)診斷模型,取得了不錯(cuò)的成果??傮w而言,相關(guān)研究大多集中在對(duì)特征空間的探索方面,實(shí)際應(yīng)用中,在EEG數(shù)據(jù)訓(xùn)練前饋神經(jīng)網(wǎng)絡(luò)、k-近鄰、支持向量機(jī)、決策樹等傳統(tǒng)機(jī)器學(xué)習(xí)模型之前,通常會(huì)將特征空間的統(tǒng)計(jì)信息和由腦電信號(hào)提取的低維特征量轉(zhuǎn)換為特定大小的特征矢量,進(jìn)而實(shí)現(xiàn)認(rèn)知障礙患者的診斷和檢測[28,29]。
伴隨著由信息時(shí)代跨到了大數(shù)據(jù)時(shí)代,以卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)為代表的深度學(xué)習(xí)模型在處理醫(yī)學(xué)圖像數(shù)據(jù)時(shí)表現(xiàn)出了良好的性能[30,31]。深度學(xué)習(xí)技術(shù)是根據(jù)反向傳播算法自動(dòng)更新權(quán)值,直接從數(shù)據(jù)供應(yīng)側(cè)自動(dòng)提取表征信息,但如果直接將腦電圖作為網(wǎng)絡(luò)模型的輸入數(shù)據(jù),效果并不是很理想[32]。這一現(xiàn)象可能是由于個(gè)體之間的生理差異造成的,這些差異的大小各不相同,但會(huì)嚴(yán)重影響旨在跨對(duì)象推廣的模型性能[33],這是CNN在應(yīng)對(duì)以腦電圖為數(shù)據(jù)樣本的特定場景會(huì)受限的潛在原因之一。因此針對(duì)腦電信號(hào)非線性、非平穩(wěn)特性建立一種有效的維度變換方法是十分必要的。此外,現(xiàn)有研究的工作重心在于如何提高診斷系統(tǒng)的準(zhǔn)確性,而對(duì)于認(rèn)知障礙診斷這一應(yīng)用場景而言,如果能夠?qū)κ茉囌叩哪X電信號(hào)進(jìn)行正確、穩(wěn)定的分類,以此為基礎(chǔ)開發(fā)的自動(dòng)診斷系統(tǒng)可以有效的輔助醫(yī)師做出更好的臨床決策,從而緩解緊張的醫(yī)療資源。為了探究這一問題,以腦電圖為數(shù)據(jù)源對(duì)比分析了CNN和傳統(tǒng)機(jī)器學(xué)習(xí)模型的魯棒性,并構(gòu)建了一種用于aMCI篩查的自動(dòng)診斷方案。
考慮到認(rèn)知障礙在腦電圖層面的表現(xiàn)形式,時(shí)頻分析是研究認(rèn)知障礙的一個(gè)重要手段[34]。時(shí)頻分析是通過構(gòu)造時(shí)間和頻率的聯(lián)合函數(shù)來描述腦電信號(hào)在不同時(shí)間和頻率的能量密度或強(qiáng)度,從而實(shí)現(xiàn)由一維時(shí)序數(shù)據(jù)到二維圖像數(shù)據(jù)的轉(zhuǎn)換。提出了基于譜熵的維度轉(zhuǎn)換方法,對(duì)比分析了以短時(shí)傅里葉變換(short-time fourier transform,STFT)和小波變換(wavelet transform,WT)為代表的時(shí)頻分析方法。
STFT使用固定窗函數(shù),窗函數(shù)類型的選擇以及窗寬的選定直接影響信號(hào)的分析效果,需兼顧時(shí)域分辨率和頻域分辨率來選擇窗函數(shù)和窗寬。單通道EEG信號(hào)x(t)的短時(shí)傅里葉變換計(jì)算公式為:
(1)
式中:g(t)為可以沿著時(shí)間軸移動(dòng)的窗函數(shù)。本文所用的窗函數(shù)為Kaiser窗,指定頻域分辨率為3 Hz。
小波變換能夠同時(shí)在時(shí)域和頻域內(nèi)對(duì)信號(hào)進(jìn)行局部分析[35],它是將無限長的三角函數(shù)基換成了有限長的帶有衰減因子的小波基,通過對(duì)高頻使用窄窗口大小和對(duì)低頻使用寬窗口大小來提供最佳的時(shí)頻分辨率[36]。更適用分析腦電信號(hào)在時(shí)域和頻域的局部信息[37]。單通道EEG信號(hào)x(t)的小波變換計(jì)算公式為:
(2)
式中:t為時(shí)間;ψ為母小波;a為尺度參數(shù);b為平移參數(shù);XWT(a,b)為小波系數(shù)(一系列小波的幅度),*表示復(fù)共軛。當(dāng)尺度參數(shù)a較大時(shí),它伸展信號(hào)適用于低頻;而小的尺度參數(shù)a壓縮信號(hào)適用于高頻。該變換不僅作用于母小波的伸縮尺度,還作用于幅值。如果a大,則小波的振幅低,如果a小,則小波振幅高。換言之,小波函數(shù)根據(jù)平移參數(shù)b掃描輸入信號(hào),以獲得特定的尺度參數(shù)a值,并對(duì)每個(gè)a值重復(fù)該過程。本文采用的母小波為Morse(3,60)小波[38],其作為解析小波的一種復(fù)值小波,因而適用于腦電信號(hào)的復(fù)雜和非平穩(wěn)特性。
(3)
則譜熵XPS定義為:
(4)
式中:N為總頻率點(diǎn)。使用歸一化譜熵,定義為:
(5)
式中:分母log2N表示白噪聲均勻分布在頻域的最大譜熵。信號(hào)的譜熵越高,信號(hào)越無序(復(fù)雜);相反,譜熵越低,信號(hào)越有序(簡單)。
診斷方案如圖1所示:(1)對(duì)原始腦電信號(hào)進(jìn)行預(yù)處理,并采用加窗移動(dòng)分段方法(窗口長度為 4 s)對(duì)時(shí)序數(shù)據(jù)進(jìn)行增強(qiáng)。(2)計(jì)算每個(gè)案例的功率譜、譜熵以及小波變換系數(shù),以將其轉(zhuǎn)換為適合作為網(wǎng)絡(luò)輸入的圖像數(shù)據(jù)。最后將得到的圖像數(shù)據(jù)集用于模型的訓(xùn)練和評(píng)估。
圖1 基于腦電信號(hào)的輕度認(rèn)知障礙診斷方案流程圖Fig.1 Flow chart of diagnosis scheme for mild cognitive impairment based on EEG signal
準(zhǔn)確度(accuracy,ACC)是一種廣泛使用的直觀度量,但僅僅獲得較高的ACC并不足以確保良好的分類性能,因?yàn)樗赡茈[藏了較少的被模型預(yù)測為正類的正樣本和被模型預(yù)測為負(fù)類的負(fù)樣本[40]。而F1-score是精確度和召回率的加權(quán)平均值,因此,F1-score越高意味著模型同時(shí)具備更好的精確度和召回率[41]。
后來,關(guān)之琳的乳罩倏地落了下去,快得像閃電一樣,我連什么也沒有看清,鏡頭便一轉(zhuǎn):瓦藍(lán)瓦藍(lán)的天空下,筆直的高速公路上,車群如蟻。
本文采用十折交叉驗(yàn)證將樣本隨機(jī)劃分為訓(xùn)練集和測試集(7.2/10折用于學(xué)習(xí)、更新網(wǎng)絡(luò)權(quán)重,1.8/10折用于驗(yàn)證、防止模型過擬合,1/10折用于測試、評(píng)估模型),分別計(jì)算了準(zhǔn)確度、F1-score來評(píng)估模型的整體性能。
本研究依據(jù)《赫爾辛基宣言》進(jìn)行,經(jīng)秦皇島市第一醫(yī)院醫(yī)學(xué)倫理委員會(huì)批準(zhǔn),共有46名符合納入和排除標(biāo)準(zhǔn)的老年人在簽署知情同意書后開展實(shí)驗(yàn)。其中,選取的受試者包含aMCI受試者26人;健康對(duì)照(healthy controls,HC)受試者為20人。
使用數(shù)字腦電圖儀(NT9200,北京中科新拓儀器有限公司,中國)對(duì)受試者的16導(dǎo)靜息態(tài)腦電信號(hào)進(jìn)行記錄。每個(gè)受試者的腦電信號(hào)記錄時(shí)長為15 min,采樣率為1 000 Hz。
腦電信號(hào)預(yù)處理包括帶通(0.5~40 Hz)濾波和獨(dú)立成分分析以去除50 Hz的工頻干擾以及眼電偽跡、肌電偽跡、突變斜坡、離群值。對(duì)預(yù)處理完的數(shù)據(jù)集采用窗口寬度為4 s,重疊率為50%(滑動(dòng)步長為2 s)的滑動(dòng)時(shí)間窗對(duì)腦電信號(hào)進(jìn)行分段,得到預(yù)處理后的數(shù)據(jù)集。
如圖2所示按照國際標(biāo)準(zhǔn)10/20系統(tǒng)放置電極,預(yù)處理后的每個(gè)樣本均為16×4 000(通道×數(shù)據(jù)點(diǎn))的腦電圖。
圖2 電極相對(duì)位置及16通道腦電信號(hào)示意圖Fig.2 Relative position of electrodes and schematic diagram of 16 channel EEG signal
為了挖掘時(shí)頻圖像中潛在的表征信息,針對(duì)樣本特性構(gòu)建了卷積神經(jīng)網(wǎng)絡(luò)。在經(jīng)過每層卷積運(yùn)算時(shí),輸出圖像數(shù)據(jù)的空間尺寸逐漸減小、通道數(shù)量逐漸增加。通過Matlab構(gòu)建神經(jīng)網(wǎng)絡(luò)模型時(shí)也遵循了這一設(shè)計(jì)原則,進(jìn)而避免信息瓶頸。如圖3 所示模型主體是2個(gè)卷積層(C1,C2),每個(gè)卷積層使用ReLU激活函數(shù),然后通過在每個(gè)卷積層之后添加最大池化層(P1,P2)來對(duì)數(shù)據(jù)進(jìn)行下采樣。卷積運(yùn)算完成后,緊接著是全連接層和Softmax層。為防止模型過擬合將Dropout算法(P=0.95)添加到全連接層和C2之間。
圖3 CNN網(wǎng)絡(luò)結(jié)果示意圖Fig.3 Schematic Diagram of CNN Network Results
實(shí)驗(yàn)中,采用Glorit初始化器(也稱為Xavier初始化器)初始化權(quán)重[42],并用零初始化偏差。訓(xùn)練過程中使用Adam優(yōu)化算法[43],并將學(xué)習(xí)率設(shè)置為10-5~10-4。為了使神經(jīng)網(wǎng)絡(luò)更好地學(xué)習(xí)數(shù)據(jù)集,將批次大小設(shè)置為64。此外,對(duì)比分析了快速、可解釋強(qiáng)的判別分析(DA)、前饋神經(jīng)網(wǎng)絡(luò)(FNN)、最近鄰分類器(KNN)、邏輯回歸模型(LR)、樸素貝葉斯分類器(NB)、支持向量機(jī)(SVM)和集成樹(TR)共7種常用機(jī)器學(xué)習(xí)模型在輕度認(rèn)知障礙分類任務(wù)中的性能。圖4展示了模型優(yōu)化過程中最小分類誤差曲線。表1展示了通過貝葉斯尋優(yōu)得到的模型最佳配置參數(shù)。
表1 分類器最佳超參數(shù)Tab.1 Best super parameter of classifier
圖4 模型超參數(shù)貝葉斯優(yōu)化最小分類誤差曲線圖Fig.4 Curve chart of minimum classification error for model hyperparametric Bayesian optimization
短時(shí)傅里葉變換、連續(xù)小波變換和譜熵3種維度變換方法如圖5所示,由腦電數(shù)據(jù)集進(jìn)行上述維度變換構(gòu)建時(shí)頻圖像數(shù)據(jù)集, 依次命名為P50、W50、S50;由3個(gè)圖像數(shù)據(jù)集分別訓(xùn)練CNN模型。并對(duì)結(jié)果進(jìn)行了比較分析,探討了維度變換方法的有效性。
圖5 腦電信號(hào)3種維度變換示意圖Fig.5 Schematic Diagram of Three Dimensional Transformation of EEG Signal
圖6 3種維度變換方法對(duì)應(yīng)的平均驗(yàn)證準(zhǔn)確率和損失曲線Fig.6 Average verification accuracy and loss curve corresponding to three dimensional transformation methods
CNN在對(duì)應(yīng)的測試數(shù)據(jù)集上性能指標(biāo)的檢驗(yàn)分析如圖7所示(十折交叉驗(yàn)證對(duì)應(yīng)測試集的模型評(píng)估指標(biāo),Kolmogorov-Smirnov test,*p<0.05,**p<0.01)。根據(jù)同一模型在不同維度變換方法對(duì)應(yīng)數(shù)據(jù)集的性能表現(xiàn)可以發(fā)現(xiàn)相較于時(shí)頻分析而言,譜熵算法在表征受試者認(rèn)知障礙模式更具優(yōu)勢。針對(duì)腦電這一非平穩(wěn)時(shí)間序列數(shù)據(jù)而言,相較于短時(shí)傅里葉變換,小波變換通過伸縮和平移所獲取的時(shí)頻表示更富足。先前的研究表明[44]認(rèn)知障礙程度不同的受試者腦電圖功率譜是相似的,存在顯著差異的主要是頻率成分的不確定度。而譜熵是在時(shí)頻分析的基礎(chǔ)上引入了非線性度量,需盡可能的增大類別間的差異性。此外,模型本質(zhì)上是數(shù)據(jù)中潛在映射關(guān)系的一種表達(dá)方式,因此模型性能在一定程度上反映了3種維度變換方法的有效性。這或許是譜熵維度變換方法對(duì)應(yīng)的模型性能具有良好綜合指標(biāo)的原因所在。因此在構(gòu)建以腦電信號(hào)為代表的診斷模型時(shí),譜熵是一種值得考慮的維度變換方法。
圖7 3種維度變換方法對(duì)應(yīng)的模型測試性能Fig.7 The odel performance corresponding to the three dimensional transformation methods
鑒于譜熵對(duì)應(yīng)CNN模型的上述優(yōu)異性能,隨后從機(jī)器學(xué)習(xí)分類器入手由S50數(shù)據(jù)集提取特征矢量構(gòu)建認(rèn)知障礙模式識(shí)別的常規(guī)方案。針對(duì)機(jī)器學(xué)習(xí)分類器的特性,從平均幅度和標(biāo)準(zhǔn)差2個(gè)角度提取譜熵圖像的特征矢量作為時(shí)頻特征數(shù)據(jù)集。具體而言,由一幅16×4 000(通道×數(shù)據(jù)點(diǎn))的腦電圖可以得到與通道相對(duì)應(yīng)的16幅17×17的時(shí)頻圖像,相應(yīng)的由時(shí)頻圖像逐通道計(jì)算均值和標(biāo)準(zhǔn)差可以得到16×2特征矢量。圖8展示了基于譜熵的維度變換對(duì)應(yīng)CNN和其他7種分類器的測試性能。性能由高到底依次為;CNN、SVM、FNN、KNN、TR、DA、LR、NB。
圖8 譜熵方法對(duì)應(yīng)的不同分類器性能Fig.8 Performance of Different Classifiers Corresponding to Spectral Entropy Dimension Transformation Method
分別對(duì)原始測試樣本及其加噪測試樣本(對(duì)應(yīng)的腦電信號(hào)添加10dbW的高斯噪聲)探究2種診斷方案的穩(wěn)定性。圖8展示了分類器的測試(原始測試集)、預(yù)測(加噪測試集)性能??梢钥闯鲈跍y試集上CNN性能遠(yuǎn)高于其他機(jī)器學(xué)習(xí)分類器;而對(duì)于加噪后的測試樣本而言,包含CNN在內(nèi)的分類模型性能均出現(xiàn)了不同程度的驟降。但結(jié)合性能下降百分比可知,CNN模型具有較強(qiáng)的數(shù)據(jù)容錯(cuò)能力,能夠挖掘出具有更穩(wěn)定的表征信息。
為了探究性能衰退的潛在原因,對(duì)加噪前后的特征矢量進(jìn)行組間統(tǒng)計(jì)檢驗(yàn)。檢驗(yàn)結(jié)果如圖9所示(Kolmogorov-Smirnov test,*p<0.05,**p<0.01)??梢园l(fā)現(xiàn)加噪后的特征矢量(特征矢量的構(gòu)成成分包含譜熵圖像逐通道計(jì)算的均值、標(biāo)準(zhǔn)差)組間差異顯著性降低,特別是左側(cè)顳葉和枕葉。
圖9 信號(hào)加噪前、后譜熵特征矢量的組間差異性Fig.9 Inter-group differences of spectral entropy feature eigenvector of signal before and after adding noise
這一檢驗(yàn)結(jié)果和認(rèn)知障礙相關(guān)文獻(xiàn)[45]中所描述的敏感腦區(qū)是一致的,即這些腦區(qū)對(duì)應(yīng)的腦電通道或許在進(jìn)行認(rèn)知障礙模式識(shí)別對(duì)發(fā)揮著不可或缺的作用。在模型層面,傳統(tǒng)的機(jī)器學(xué)習(xí)分類模型搭配使用了包含特征矢量的構(gòu)建、遴選在內(nèi)的特征工程[46]。而卷積神經(jīng)網(wǎng)絡(luò)則以譜熵圖像為輸入,通過逐層捕捉到的漸變特征鏈進(jìn)行模式識(shí)別。此外,卷積神經(jīng)網(wǎng)絡(luò)自身所具備的的3種結(jié)構(gòu)(局部感受域;卷積層;池化或子采樣層)在一定程度上提升了其空間魯棒性和容錯(cuò)性[47]。這或許是圖8中CNN性能下降百分點(diǎn)不多的原因。
上述研究結(jié)果表明,大多數(shù)分類器在充分預(yù)測輕度認(rèn)知障礙方面具有較高的模式識(shí)別能力。8個(gè)分類器中,有6個(gè)(CNN、SVM、TR、KNN、FNN、DA)的ACC和F1得分超過80%。當(dāng)數(shù)據(jù)集具有高維特征矢量且只有少數(shù)實(shí)例時(shí),FNN和SVM是值得考慮的,李昕[48]等人的先前研究也證明了這一點(diǎn)。基于腦電信號(hào)的輕度認(rèn)知障礙早期臨床篩查,診斷方案的準(zhǔn)確性、穩(wěn)定性比模型的實(shí)時(shí)性更重要。而本文提出的以譜熵為代表的維度變換結(jié)合CNN診斷方案可以很好的滿足這一性能需求。
傳統(tǒng)的診斷方案通過對(duì)腦電圖的特征矢量進(jìn)行模式識(shí)別來實(shí)現(xiàn)阿爾茨海默癥臨床前階段的辨識(shí),但其因精度低、穩(wěn)定性差等原因未能在臨床中得到很好的應(yīng)用。針對(duì)這一現(xiàn)象,在時(shí)頻分析的基礎(chǔ)上提出了一種基于譜熵的維度變換方法,并由CNN對(duì)3種維度變換方法進(jìn)行了比較分析。實(shí)驗(yàn)結(jié)果表明在時(shí)頻分析中引入非線性度量的譜熵更符合CNN在圖像分類方面的優(yōu)勢。
此外,從穩(wěn)定性的角度探究了譜熵圖像結(jié)合CNN的抗干擾能力。實(shí)驗(yàn)分析發(fā)現(xiàn)高度抽象的特征矢量對(duì)噪聲似乎更敏感,而以神經(jīng)網(wǎng)絡(luò)為代表的漸變特征鏈具備更好的抗干擾能力。因此,以譜熵為代表的維度變換方法結(jié)合卷積神經(jīng)網(wǎng)絡(luò)可以有效地實(shí)現(xiàn)輕度認(rèn)知障礙診斷。