徐 晴,葛 成,蔡 標(biāo),陸 翼,常 珊
(江蘇理工學(xué)院電氣信息工程學(xué)院生物信息與醫(yī)藥工程研究所,常州 213001)
癲癇是一種慢性非傳染性的腦部疾病,是全球最常見(jiàn)的神經(jīng)系統(tǒng)疾病之一。據(jù)世界衛(wèi)生組織報(bào)道,全球約超過(guò)5 000 萬(wàn)人患有癲癇,在中國(guó)就有高達(dá)900 多萬(wàn)的癲癇患者,而且日益年輕化[1]。癲癇發(fā)作可以從短暫的注意力喪失以及肌肉抽搐發(fā)展到嚴(yán)重且長(zhǎng)時(shí)間的抽搐,癲癇發(fā)作的頻率也可能從一年一次發(fā)作發(fā)展為一天多次發(fā)作,這對(duì)癲癇預(yù)測(cè)造成了非常大的困難。而且由于癲癇發(fā)病的不確定性、突發(fā)性、反復(fù)性等,通常會(huì)導(dǎo)致患者對(duì)身體失去控制以及意識(shí)喪失,造成如摔倒、骨折、溺水或車(chē)禍等傷害[2]。腦電(Electroencephalographic,EEG)信號(hào)可以反映大腦神經(jīng)元放電活動(dòng),具有較高的時(shí)間分辨率以及非侵入性等優(yōu)點(diǎn),廣泛應(yīng)用于監(jiān)測(cè)癲癇、帕金森、睡眠障礙、阿爾茨海默癥、情緒狀態(tài)以及認(rèn)知負(fù)荷等[3-5]。由于在癲癇發(fā)作期的腦電信號(hào)比正常腦電信號(hào)更混亂,會(huì)呈現(xiàn)出快速劇烈的變化,出現(xiàn)尖波、棘波、棘慢綜合波等[6],這與非發(fā)作期時(shí)的信號(hào)相比差異較大,因此通過(guò)分析腦電信號(hào)可以實(shí)現(xiàn)癲癇發(fā)作檢測(cè)。
癲癇發(fā)作檢測(cè)在本質(zhì)上是屬于腦電信號(hào)的二分類(lèi)或多分類(lèi)問(wèn)題,通過(guò)對(duì)每一時(shí)刻的信號(hào)判斷其所屬狀態(tài)來(lái)實(shí)現(xiàn)發(fā)作檢測(cè)。癲癇腦電信號(hào)的分類(lèi)研究主要由特征提取和分類(lèi)兩部分組成,常用的特征提取方法主要有自回歸(Autoregressive,AR)模型、共空間模式(Common spatial pattern,CSP)、小波變換(Wavelet transform,WT)、功率譜密度(Power spectral density,PSD)估計(jì)、非線(xiàn)性動(dòng)力學(xué)等[7]。迄今為止,在很多癲癇腦電信號(hào)的特征提取中應(yīng)用了這些方法。Nassim 等[8]利用自回歸系數(shù)對(duì)EEG 信號(hào)進(jìn)行分解,將提取特征參數(shù)通過(guò)多層感知機(jī)神經(jīng)網(wǎng)絡(luò)進(jìn)行分類(lèi),獲得了97.76%的最高準(zhǔn)確率;Lu 等[9]選擇樣本熵和分形錐數(shù)兩個(gè)指標(biāo)作為特征,并使用支持向量機(jī)對(duì)癲癇腦電信號(hào)進(jìn)行自動(dòng)分類(lèi),準(zhǔn)確率達(dá)到了89.8%。劉倩倩等[10]使用多變量符號(hào)轉(zhuǎn)移熵對(duì)癲癇腦電信號(hào)進(jìn)行研究分析,該實(shí)驗(yàn)通過(guò)將原始信號(hào)符號(hào)化后進(jìn)行數(shù)值分析,并對(duì)導(dǎo)聯(lián)信號(hào)、信號(hào)長(zhǎng)度的選取以及穩(wěn)健性進(jìn)行分析,結(jié)果表明該方法可以有效區(qū)分正常人與癲癇病人的腦電信號(hào)。劉偉楠等[11]則使用不同波段的絕對(duì)功率譜、相對(duì)功率譜和功率譜比值組成混合特征對(duì)睡眠中的癲癇發(fā)作進(jìn)行預(yù)測(cè)。上述方法需要人工設(shè)計(jì)和提取信號(hào)特征再結(jié)合機(jī)器學(xué)習(xí)分類(lèi)器進(jìn)行分類(lèi),會(huì)存在特征提取不充分、適應(yīng)性不強(qiáng)及準(zhǔn)確率不高等問(wèn)題。
與傳統(tǒng)方法相比,深度學(xué)習(xí)不需要特征處理,可以學(xué)習(xí)不同的信號(hào)特征,提高分類(lèi)準(zhǔn)確性。2018年,Rajendra 等[6]首次使用了1 個(gè)13 層的深度卷積神經(jīng)網(wǎng)絡(luò)來(lái)檢測(cè)正常、發(fā)作前期和發(fā)作期的3 種類(lèi)別,該模型的準(zhǔn)確性、特異性和靈敏度分別為88.67%、90.00%和95.00%。George 等[12]將一維腦電數(shù)據(jù)轉(zhuǎn)換為二維腦電圖像,使用卷積神經(jīng)網(wǎng)絡(luò)的子類(lèi)ResNET-50 模型將波士頓兒童醫(yī)院的頭皮腦電數(shù)據(jù)分為發(fā)作期、非發(fā)作期和發(fā)作前期3 類(lèi),最終該模型達(dá)到了94.98%的準(zhǔn)確率。程偉等[13]通過(guò)深度密集卷積網(wǎng)絡(luò)實(shí)現(xiàn)癲癇腦電信號(hào)的二分類(lèi),識(shí)別的準(zhǔn)確率、精確度、靈敏度和和特異性分別達(dá)到了96.94%、97.46%、87.18%和99.42%??裸懙龋?4]提出一種1DCNN 算法與XGBoost 算法相結(jié)合的單通道癲癇腦電分類(lèi)模型,利用一維卷積模型自動(dòng)提取特征,再利用XGBoost 算法實(shí)現(xiàn)分類(lèi),最終在波恩大學(xué)癲癇腦電數(shù)據(jù)集上得到了98.83%的分類(lèi)準(zhǔn)確率。除此之外,由于腦電信號(hào)是一種時(shí)間序列信號(hào),鑒于循環(huán)神經(jīng)網(wǎng)絡(luò)在這方面的成功應(yīng)用,Thara 等[15]使用BiLSTM 模型對(duì)德國(guó)伯恩大學(xué)數(shù)據(jù)集實(shí)現(xiàn)癲癇發(fā)作與非發(fā)作的二分類(lèi)。Kishori 等[16]分別提出了單向和雙向的3 層LSTM 網(wǎng)絡(luò),用于檢測(cè)癲癇發(fā)作,結(jié)果雙向LSTM 網(wǎng)絡(luò)模型更優(yōu)。
上述研究成果表明,基于深度學(xué)習(xí)的癲癇腦電分類(lèi)與傳統(tǒng)方法相比,準(zhǔn)確率有所提高。但需要大量的網(wǎng)絡(luò)層和不同深度學(xué)習(xí)算法的組合,增加了檢測(cè)系統(tǒng)的復(fù)雜性。同時(shí)根據(jù)文獻(xiàn)[12],除了對(duì)一維腦電數(shù)據(jù)進(jìn)行處理,還可以將一維腦電數(shù)據(jù)轉(zhuǎn)換為二維腦電圖像進(jìn)行癲癇與非癲癇的分類(lèi)。目前關(guān)于圖像分類(lèi)的深度學(xué)習(xí)算法中,傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)通過(guò)單獨(dú)調(diào)整輸入網(wǎng)絡(luò)的深度、寬度及圖像分辨率來(lái)進(jìn)行擴(kuò)展,而EfficientNetV2 模型使用1 個(gè)復(fù)合系數(shù)從這3 個(gè)維度擴(kuò)展網(wǎng)絡(luò)[17],所以EfficientNetV2 模型總體上顯著優(yōu)于其他網(wǎng)絡(luò)。為進(jìn)一步提高癲癇腦電分類(lèi)的準(zhǔn)確率,本文根據(jù)2 種不同的腦電信號(hào)數(shù)據(jù)類(lèi)型,使用BiLSTM、DenseNet 和EfficientNetV2 三種模型進(jìn)行分類(lèi),并進(jìn)行比較分析。同時(shí)采用了梯度加權(quán)類(lèi)激活映射(Gradient-weighted class activation mapping,Grad-CAM)方法對(duì)分類(lèi)結(jié)果進(jìn)行可視化分析。
實(shí)驗(yàn)數(shù)據(jù)來(lái)自德國(guó)伯恩大學(xué)癲癇數(shù)據(jù)集的預(yù)處理版本。原始的數(shù)據(jù)集是由A~E 五個(gè)不同子集組成,每個(gè)子集中有100 個(gè)同類(lèi)型的文件,每個(gè)文件包含了4 097 個(gè)腦電時(shí)間序列,共計(jì)23.6 s 的大腦活動(dòng),采樣頻率為173.61 Hz。其中,子集A 和B 是無(wú)癲癇疾病的正常人分別在睜眼和閉眼狀態(tài)下采集的腦電信號(hào);子集C 是癲癇患者在發(fā)作間期的病灶對(duì)側(cè)區(qū)域采集的腦電信號(hào);子集D 是癲癇患者在發(fā)作間期對(duì)病灶區(qū)采集的信號(hào);子集E 是在發(fā)作期的腦電信號(hào)[18]。由于本文是對(duì)癲癇腦電信號(hào)進(jìn)行二分類(lèi),發(fā)作期的數(shù)據(jù)集僅有子集E,數(shù)據(jù)量較少,所以選取該數(shù)據(jù)集的預(yù)處理版本。
預(yù)處理版本是對(duì)原始腦電數(shù)據(jù)進(jìn)行預(yù)處理和重構(gòu)。數(shù)據(jù)集的預(yù)處理主要是使用0.53~40 Hz 的帶通濾波器進(jìn)行濾波操作,以及使用視覺(jué)檢測(cè)技術(shù)去除偽跡干擾,兩步操作已由德國(guó)伯恩大學(xué)完成[13]。數(shù)據(jù)重構(gòu)是指原始數(shù)據(jù)集的4 097 個(gè)時(shí)間序列分為23 個(gè)數(shù)據(jù)塊并隨機(jī)排列,每個(gè)數(shù)據(jù)塊包含178 個(gè)信號(hào)序列,時(shí)間長(zhǎng)度共計(jì)1 s。因此,原始數(shù)據(jù)集被拆分為11 500 條數(shù)據(jù),每條數(shù)據(jù)由178 個(gè)信號(hào)序列組成,最后一列數(shù)據(jù)標(biāo)簽為{1,2,3,4,5}。其中標(biāo)簽為1 的是癲癇發(fā)作期的數(shù)據(jù),標(biāo)簽2~5 是癲癇未發(fā)作狀態(tài)的數(shù)據(jù)。
本文采取2 種數(shù)據(jù)類(lèi)型進(jìn)行處理,即一維時(shí)間序列和二維圖像。在二維圖像中,由于調(diào)整了電壓值范圍,2 個(gè)狀態(tài)的波形差異增大。圖1 是癲癇未發(fā)作狀態(tài)時(shí)的波形,其中圖1(a)是典型波形,整體平緩,波動(dòng)幅度??;圖1(b)是非典型波形,在整體平緩無(wú)波動(dòng)的情況下,有一波峰的存在,與圖1(a)有較大差異。圖2 是癲癇發(fā)作狀態(tài)時(shí)的波形,其中圖2(a)波動(dòng)幅度大,無(wú)明顯規(guī)律,是典型的癲癇發(fā)作狀態(tài)下的波形;相反,圖2(b)則呈現(xiàn)小幅波動(dòng)??梢钥闯?,在調(diào)整了電壓值范圍的條件下,仍然存在2 種狀態(tài)波形差異較小的圖像,如圖1(a)和圖2(b),肉眼無(wú)法正確判斷,容易造成誤判,所以使用二維圖像做分類(lèi)處理仍然有意義。為了保持?jǐn)?shù)據(jù)平衡,分別從標(biāo)簽為2~5 的數(shù)據(jù)中隨機(jī)抽取2 300 條作為癲癇未發(fā)作的數(shù)據(jù),將這些數(shù)據(jù)標(biāo)簽統(tǒng)一設(shè)置為0,與標(biāo)簽為1 的數(shù)據(jù)重組為4 600 條數(shù)據(jù),因此癲癇發(fā)作與未發(fā)作的數(shù)據(jù)比例為1∶1。同時(shí),將重組的數(shù)據(jù)集按照8∶1∶1 的比例隨機(jī)劃分為訓(xùn)練集、驗(yàn)證集以及測(cè)試集。
圖1 癲癇未發(fā)作狀態(tài)Fig.1 State of non-epileptic seizure
圖2 癲癇發(fā)作狀態(tài)Fig.2 State of epileptic seizure
(1)一維時(shí)間序列的處理模型
長(zhǎng)短期記憶(Long short term memory,LSTM)網(wǎng)絡(luò)模型改善了循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent neural network,RNN)梯度消失和爆炸的問(wèn)題,更適合處理長(zhǎng)時(shí)序序列問(wèn)題。BiLSTM 模型由前向LSTM 和后向LSTM 組成,可以從兩個(gè)方向更好地處理癲癇腦電數(shù)據(jù)信息。由文獻(xiàn)[15-16]可知,雙向長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)在處理腦電序列上更具優(yōu)勢(shì),所以本文選用BiLSTM 模型處理一維序列信號(hào),算法流程如圖3 所示。本文BiLSTM 模型的輸入首先通過(guò)1 個(gè)ReLU 激活的線(xiàn)性層;然后經(jīng)過(guò)1 個(gè)雙向循環(huán)層,將循環(huán)單元指定為L(zhǎng)STM 單元,共有128 個(gè);再經(jīng)過(guò)2 個(gè)線(xiàn)性層,每個(gè)線(xiàn)性層前都有Dropout 和BN 層;最后使用Softmax 作為激活函數(shù),實(shí)現(xiàn)癲癇發(fā)作與未發(fā)作的二分類(lèi)。
圖3 基于BiLSTM 算法的流程圖Fig.3 Workflow based on BiLSTM algorithm
(2)二維腦電圖像的處理模型
針對(duì)癲癇腦電的二維圖像,使用EfficientNetV2 模型,同時(shí)將DenseNet作為實(shí)驗(yàn)對(duì)照組,算法流程如圖4 所示。EfficientNetV2 網(wǎng)絡(luò)模型在EfficientNetV1 的基礎(chǔ)上進(jìn)行了改進(jìn),在訓(xùn)練速度和參數(shù)數(shù)量上進(jìn)行了優(yōu)化,同時(shí)提出了改進(jìn)后的漸進(jìn)學(xué)習(xí)方法會(huì)根據(jù)訓(xùn)練圖像的尺寸動(dòng)態(tài)調(diào)整正則方法。EfficientNetV2 模型由卷積、Fused-MBConv 和MBConv 模塊組成。二維腦電圖像首先通過(guò)1 個(gè)3×3 的卷積層提取特征值;之后再分別通過(guò)Fused-MBConv 和MBConv 模塊,其中卷積核k的大小統(tǒng)一設(shè)置為3×3;最終通過(guò)1 個(gè)1×1 的卷積層、池化層以及全連接層實(shí)現(xiàn)二分類(lèi)。DenseNet 在深度殘差網(wǎng)絡(luò)的基礎(chǔ)上采用密集連接機(jī)制,互相連接所有的層,每層都會(huì)與前面所有層連接在一起實(shí)現(xiàn)特征重用,并作為下一層的輸入。在圖4 的DenseNet 網(wǎng)絡(luò)結(jié)構(gòu)中,除第1 個(gè)Conv7×7 外,每一個(gè)Conv 前都有BN 和ReLU 層,其中Conv1×1、Conv3×3 模塊按照左側(cè)數(shù)字設(shè)置層數(shù),每一層均采用密集連接機(jī)制;最終經(jīng)由平均池化層、全連接層實(shí)現(xiàn)線(xiàn)性分類(lèi)并輸出。
圖4 EfficientNetV2 和DenseNet 算法流程圖Fig.4 Workflow of EfficientNetV2 algorithm and DenseNet algorithm
對(duì)于訓(xùn)練的深度學(xué)習(xí)算法,它是如何根據(jù)圖像進(jìn)行分類(lèi)往往是未知的,所以深度學(xué)習(xí)算法被很多人認(rèn)為是個(gè)黑匣子,缺乏可解釋性。而Grad-CAM[19]是為卷積神經(jīng)網(wǎng)絡(luò)模型的視覺(jué)解釋而開(kāi)發(fā)的,用于可視化模型判斷的基礎(chǔ)。通過(guò)Grad-CAM 生成一個(gè)粗略的定位圖,對(duì)應(yīng)分類(lèi)類(lèi)別,突出顯示網(wǎng)絡(luò)模型關(guān)注的重要區(qū)域。而且對(duì)于圖像分類(lèi),可視化不僅可以捕捉到重要區(qū)域,還可以對(duì)看似不合理的分類(lèi)有合理的解釋。Grad-CAM 是在不改變?cè)W(wǎng)絡(luò)結(jié)構(gòu)的情況下,實(shí)現(xiàn)對(duì)不同類(lèi)別的特征層加權(quán)求和后通過(guò)激活函數(shù)計(jì)算,利用梯度全局平均來(lái)計(jì)算權(quán)重,有
式中:A代表最后一個(gè)卷積層輸出的特征層;k為特征層A中第k個(gè)通道;c代表所分類(lèi)的類(lèi)別;Ak代表特征層A中通道k的數(shù)據(jù);代表針對(duì)Ak的權(quán)重,其計(jì)算公式為
式中:yc代表未經(jīng)Softmax 激活的針對(duì)類(lèi)別c預(yù)測(cè)的分?jǐn)?shù);代表特征層A在通道k中坐標(biāo)為ij處的數(shù)據(jù);Z為特征層的寬度×高度。
為了便于比較,采用準(zhǔn)確性(Accuracy,Acc)、敏感性(Sensitive,Sens)、特異性(Specificity,Spec)和精確率(Precision,Prec)作為評(píng)價(jià)指標(biāo),定義為
式中:TP 為真陽(yáng)性;TN 為真陰性;FP 為假陽(yáng)性;FN 為假陰性。同時(shí),采用ROC 曲線(xiàn)和AUC 來(lái)評(píng)估模型性能:ROC 曲線(xiàn)通過(guò)真陽(yáng)率與假陽(yáng)率兩項(xiàng)指標(biāo)來(lái)評(píng)估分類(lèi)模型的性能,AUC 則是ROC 曲線(xiàn)下的面積,越接近1 表明模型越好。
本文使用了3 種模型處理兩種類(lèi)型的腦電數(shù)據(jù):一維序列使用BiLSTM 模型,二維腦電圖像使用 DenseNet 和 EfficientNetV2 模 型,其 中DenseNet 作為實(shí)驗(yàn)對(duì)照組。實(shí)驗(yàn)設(shè)置如表1所示。
表1 實(shí)驗(yàn)設(shè)置Table 1 Experimental settings
本文實(shí)驗(yàn)在Linux 環(huán)境下基于Pytorch 深度學(xué)習(xí)框架搭建,在1 臺(tái)Tesla V100 機(jī)器上進(jìn)行訓(xùn)練,其顯存為32 GB。在3 種模型中,學(xué)習(xí)率為0.001,損失函數(shù)選擇binary_crossentropy,優(yōu)化函數(shù)選擇adam,訓(xùn)練批次尺寸設(shè)置為64。通過(guò)多次參數(shù)調(diào)優(yōu),BiLSTM 模型的迭代周期設(shè)置為100,DenseNet 和Efficient-NetV2 設(shè)置為20。
本研究使用了3 種分類(lèi)模型對(duì)兩種數(shù)據(jù)類(lèi)型比較,模型分別為BiLSTM、DenseNet 和Efficient-NetV2,結(jié)果分析所用評(píng)價(jià)指標(biāo)為準(zhǔn)確性、敏感性、特異性、精確率以及ROC 曲線(xiàn),訓(xùn)練結(jié)果如表2 所示,ROC 曲線(xiàn)如圖5 所示。
由表2 可以看出,在準(zhǔn)確性上3 種模型的效果都很好,相較于處理一維序列的BiLSTM 模型,處理二維圖像的DenseNet 和EfficientNetV2 模型結(jié)果更優(yōu),其中EfficientNetV2 模型的準(zhǔn)確性最高,達(dá)到了98.69%;同樣在敏感性、特異性以及精確率中,處理二維圖像的2 種模型優(yōu)于BiLSTM 模型,且2 種模型中EfficientNetV2 模型均是最高值,分別達(dá)到了98.33%、99.09%和99.15%。圖5 中的ROC 曲線(xiàn)顯示3 種模型的AUC 值均達(dá)到了99%以上,EfficientNetV2 最高為99.90%。通過(guò)比較這3 種模型的各項(xiàng)評(píng)判指標(biāo)可以發(fā)現(xiàn),3 種模型對(duì)癲癇腦電信號(hào)的識(shí)別效果較好,其中EfficientNetV2 模型表現(xiàn)最佳。
圖5 3 種模型的ROC 曲線(xiàn)Fig.5 ROC curves of three models
圖6 是BiLSTM、DenseNet 以及EfficientNetV2 模型在訓(xùn)練過(guò)程中的準(zhǔn)確性與損失函數(shù)變化曲線(xiàn)。其中Train_loss 和Val_loss 表示模型在訓(xùn)練集和驗(yàn)證集上訓(xùn)練時(shí)的損失值,Train_Acc 和Val_Acc 表示模型在訓(xùn)練集和驗(yàn)證集上訓(xùn)練時(shí)的準(zhǔn)確率??梢钥闯?,BiLSTM 模型在迭代20 個(gè)周期后,準(zhǔn)確性曲線(xiàn)與損失函數(shù)變化曲線(xiàn)逐漸進(jìn)入收斂狀態(tài),雖然在后續(xù)輪次中驗(yàn)證集的損失函數(shù)曲線(xiàn)出現(xiàn)了振蕩現(xiàn)象,但是仍穩(wěn)定在一定范圍內(nèi)。最終訓(xùn)練集的識(shí)別準(zhǔn)確性穩(wěn)定在100%左右,驗(yàn)證集的準(zhǔn)確率穩(wěn)定在97%左右,最終測(cè)試集的最高準(zhǔn)確率為97.39%。DenseNet 模型在迭代4 個(gè)周期后,準(zhǔn)確性曲線(xiàn)與損失函數(shù)變化曲線(xiàn)逐漸進(jìn)入收斂狀態(tài),最終測(cè)試集的最高準(zhǔn)確率為98.04%。EfficientNetV2 模型在迭代5 個(gè)周期后,準(zhǔn)確性曲線(xiàn)與損失函數(shù)變化曲線(xiàn)逐漸進(jìn)入收斂狀態(tài),訓(xùn)練集的識(shí)別準(zhǔn)確性穩(wěn)定在100%附近,驗(yàn)證集的準(zhǔn)確性穩(wěn)定在99%附近,最終測(cè)試集的最高準(zhǔn)確率為98.69%。
圖6 3 種模型的訓(xùn)練準(zhǔn)確度-損失大小變化曲線(xiàn)Fig.6 Variation curves of training accuracy-loss of three models
由于EfficientNetV2 模型的分類(lèi)結(jié)果最好,所以使用該模型利用Grad-CAM 方法進(jìn)行可視化分析。通過(guò)將EfficientNetV2 模型最后一層卷積層的梯度信息生成加權(quán)熱力圖,可以顯示模型的重點(diǎn)關(guān)注區(qū)域,并以紅色、橙色標(biāo)注;非重點(diǎn)區(qū)域以藍(lán)紫色標(biāo)注顯示。從測(cè)試集中,分別選取癲癇發(fā)作與未發(fā)作狀態(tài)下的典型波形以及非典型波形進(jìn)行對(duì)比分析,結(jié)果如表3 和表4 所示。同時(shí),對(duì)同一張腦電圖像的不同預(yù)測(cè)結(jié)果,Grad-CAM 方法可以對(duì)模型重點(diǎn)關(guān)注的區(qū)域顯示,如表3 和表4 中的熱力圖1 和熱力圖2。熱力圖1 是針對(duì)癲癇發(fā)作,即標(biāo)簽為1 的分類(lèi)結(jié)果繪制的熱力圖;熱力圖2 是針對(duì)未發(fā)作狀態(tài),即標(biāo)簽為0 的分類(lèi)結(jié)果繪制的熱力圖。即使模型對(duì)二維圖像做出了誤判,但通過(guò)2 張不同的熱力圖對(duì)比,仍然可以作為模型錯(cuò)誤分類(lèi)的依據(jù),并提供一個(gè)合理的解釋。
在表3 中,波形a 和b 都有明顯的棘波、尖波等存在,在熱力圖1 中由于是針對(duì)癲癇發(fā)作這一分類(lèi)結(jié)果繪制的熱力圖,所以它的重點(diǎn)關(guān)注區(qū)域除了整條波形,對(duì)于波形波動(dòng)幅度過(guò)大的區(qū)域即棘波、尖波等被重點(diǎn)標(biāo)注,而在熱力圖2 中需要關(guān)注的平穩(wěn)波形較少,所以波形a 和b 可以經(jīng)由EfficientNetV2 模型被正確分類(lèi)。波形c 和d 都是癲癇未發(fā)作時(shí)的圖像,波形c 整體上呈現(xiàn)有規(guī)律且小幅度波動(dòng),波形d 則幾乎無(wú)波動(dòng)。在兩者的熱力圖1 中,僅有較小范圍內(nèi)的波形被關(guān)注,而在熱力圖2 中模型所關(guān)注的特征是波形的平穩(wěn)性,所以整條波形成為了模型的重點(diǎn)關(guān)注區(qū)域,自然就被正確分類(lèi)為未發(fā)作狀態(tài)。
表3 典型波形及其熱力圖Table 3 Typical waveforms and their class activation maps
表4 中的4 個(gè)非典型的波形,波形a 和b 分別屬于癲癇未發(fā)作和發(fā)作狀態(tài),但2 個(gè)圖像都被誤判。波形a 的熱力圖1 誤將波形的波動(dòng)作為顯著特征,模型將整條波形重點(diǎn)關(guān)注,在熱力圖2 中僅將波形前半段作為分類(lèi)特征,區(qū)域較小,所以導(dǎo)致了錯(cuò)誤的分類(lèi)結(jié)果。波形b 的熱力圖1 同樣只將波形前半段的波動(dòng)作為特征,不足以支撐它被分類(lèi)為發(fā)作狀態(tài),而熱力圖2 中模型提取的特征是整條波形,所以同樣導(dǎo)致了誤判。波形c 和d 分別是未發(fā)作和發(fā)作狀態(tài),但在波形c 中存在一個(gè)尖波,波形d 整體較平穩(wěn),與表3 中的4 種典型波形有較大的區(qū)別。波形c 有個(gè)尖波,所以熱力圖1 中也僅僅只關(guān)注到該區(qū)域,而熱力圖2 整條波形都有關(guān)注,尤其是后半段,所以分類(lèi)正確。波形d 的2 個(gè)熱力圖關(guān)注區(qū)域相差較小,但也能明顯看出熱力圖1 關(guān)注區(qū)域多,將前半段的波動(dòng)作為顯著特征,熱力圖2 則是僅僅關(guān)注了波形開(kāi)始時(shí)的平穩(wěn)波段,所以該波形可以被正確分類(lèi)為癲癇發(fā)作狀態(tài)。
表4 非典型波形及其熱力圖Table 4 Non-typical waveforms and their class activation maps
本文針對(duì)癲癇腦電數(shù)據(jù)的兩種數(shù)據(jù)類(lèi)型,即一維時(shí)間序列和二維腦電圖像,分別通過(guò)BiLSTM、DenseNet 和EfficientNetV2 模型在德國(guó)波恩大學(xué)癲癇腦電數(shù)據(jù)集上實(shí)現(xiàn)癲癇發(fā)作的檢測(cè)。結(jié)果表明,EfficientNetV2 模型對(duì)癲癇腦電的二維腦電圖像的分類(lèi)效果最好,獲得98.69%的準(zhǔn)確率,證實(shí)了EfficientNetV2 模型在癲癇發(fā)作檢測(cè)上的可行性。同時(shí),針對(duì)二維圖像的處理,引入了Grad-CAM 進(jìn)行可視化分析,對(duì)于分類(lèi)結(jié)果有了更好的可解釋性。一般在臨床中會(huì)通過(guò)觀察臨床癥狀和腦電圖2 種方式來(lái)檢測(cè)癲癇發(fā)作,但是人工判斷腦電圖不僅數(shù)據(jù)量大效率慢,而且僅依據(jù)以往經(jīng)驗(yàn)會(huì)產(chǎn)生誤判。所以本文針對(duì)癲癇發(fā)作與未發(fā)作狀態(tài)進(jìn)行二分類(lèi),有利于患者在后期病情掌控中的監(jiān)護(hù)和臨床診斷。如果要進(jìn)一步實(shí)現(xiàn)患者的日常居家監(jiān)護(hù),則需要對(duì)發(fā)作前期和發(fā)作間期進(jìn)行分類(lèi),本文方法也同樣適用,這也是進(jìn)一步需要研究的方向。