丁勝 吳全玉 孫健 潘玲佼 陶為戈
摘 要:腦機接口技術(shù)是很多學(xué)科融合的前沿研究方向,腦電信號分類的準(zhǔn)確率是限制腦機接口系統(tǒng)實現(xiàn)的難題之一。針對腦電信號分類準(zhǔn)確性問題,采用兩種概率校準(zhǔn)方法Platt Scaling和Isotonic Regression。首先對預(yù)處理后的運動想象腦電數(shù)據(jù)利用功率譜密度提取腦電頻域特征,使用主成分分析算法進行特征降維。其次選擇邏輯回歸和支持向量機構(gòu)建分類預(yù)測模型,使用上述兩種概率校準(zhǔn)方法進行模型校準(zhǔn)。最后,選用ROC曲線下的面積AUC、Brier得分和可靠性曲線評估校準(zhǔn)模型的性能,并且繪制交叉驗證學(xué)習(xí)曲線,觀察模型在不同數(shù)據(jù)量下的擬合效果,以及模型的泛化能力。在BCI競賽IV Datasets 2a腦電數(shù)據(jù)集上進行實驗驗證,結(jié)果表明,概率校準(zhǔn)的方法能夠?qū)δP皖A(yù)測輸出結(jié)果進行有效校準(zhǔn)。
關(guān)鍵詞:運動想象;概率校準(zhǔn);功率譜密度;邏輯回歸;支持向量機
中圖分類號:TP18;TP301.6? 文獻標(biāo)識碼:A? 文章編號:1673-260X(2023)04-0011-05
1 引言
腦機接口(Brain-Computer Interface,BCI)是一種不利用外周神經(jīng)和肌肉,由大腦完成控制命令輸出的與外界進行通訊的新方式[1,2],已在神經(jīng)康復(fù)、生物醫(yī)學(xué)及生活娛樂等領(lǐng)域被廣泛研究。運動想象(Motor Imagery, MI)是BCI中的一個重要實驗范式,這是一種特殊的心理表象類型[3,4],人進行運動想象,通過BCI可以實現(xiàn)單獨操縱設(shè)備[5]。然而腦電信號(Electroencephalogram,EEG)具有復(fù)雜,時變,非線性等特點[6],使得挖掘到有效地腦電信號存在很大的困難,因此,研究如何利用算法對腦電信號進行準(zhǔn)確分類顯得非常重要[7]。
經(jīng)典的機器學(xué)習(xí)算法發(fā)展時間長,且具有成熟的數(shù)學(xué)理論基礎(chǔ),常被用于運動想象腦電信號的分類。許多研究學(xué)者對腦電信號分類算法進行一些改進。Shi等[8]采用改進的松鼠搜索算法優(yōu)化支持向量機的參數(shù),提高了模型的分類精度。Miao等[9]在樸素貝葉斯(Naive Bayesian,NB)基礎(chǔ)上提出加權(quán)樸素貝葉斯(Weighted NB,WNB),對多個時頻特征進行加權(quán),得到不錯的分類結(jié)果。
然而許多分類算法的預(yù)測輸出值并不是真正的概率輸出,即具有一定的偏差[10],在實際應(yīng)用場景中可能會導(dǎo)致一些嚴(yán)重的后果。例如支持向量機(Support Vector Machines,SVM)算法,先尋找讓邊際最大的決策邊界,然后計算測試樣本點到?jīng)Q策邊界的距離來判定該樣本屬于哪一類,但是大部分樣本點都徘徊在決策邊界附近,模型很容易做出錯誤的判斷,只有離決策邊界較遠的樣本才有很高的置信度,所以說SVM是一個“極度不自信”的算法。即使是NB這種真正的概率算法,也會存在有偏的預(yù)測。NB產(chǎn)生的分數(shù)通常太過極端[11],概率分布存在兩邊高,中間低的現(xiàn)象。因此NB模型無法產(chǎn)生準(zhǔn)確的概率估計[12],是一個“過分自信”的算法。特別當(dāng)測試樣本的特征之間并不是條件獨立時,樸素貝葉斯分類器輸出的概率估計也是存在偏差的。
概率校準(zhǔn)的方法可以將有偏差的概率輸出結(jié)果進行校準(zhǔn)。概率校準(zhǔn)是指尋找一個校準(zhǔn)函數(shù),將初始預(yù)測映射為更加精確的后驗概率[13]。使用概率校準(zhǔn)的方法不僅將非概率分類器的輸出轉(zhuǎn)化為概率類型,而且也對概率分類器的結(jié)果進一步提升[14]。目前比較可靠的兩個概率校準(zhǔn)方法為Platt Scaling[15]和Isotonic Regression[16]。
本文選擇支持向量機和邏輯回歸(Logistic Regression,LR)作為預(yù)測模型,引入上述兩種概率校準(zhǔn)的方法,將模型在第四屆BCI競賽2a數(shù)據(jù)集上進行驗證,結(jié)果顯示,概率校準(zhǔn)后的模型比原始模型有更好的表現(xiàn)。
2 數(shù)據(jù)集和方法
2.1 數(shù)據(jù)集
試驗數(shù)據(jù)來源于2008年第四屆國際BCI競賽Datasets 2a數(shù)據(jù)集[17]。該數(shù)據(jù)集一共記錄了9名受試者(A01,A02,A03,A04,A05,A06,A07,A08,A09)關(guān)于左手、右手、雙腳和舌頭四種不同的運動想象任務(wù),每名受試者在不同的日期記錄兩次實驗。本文只對左右手兩類任務(wù)進行分類,每個受試者的數(shù)據(jù)由兩個部分組成,一部分用于訓(xùn)練,另一部分用于測試,每個部分都包含了144次試驗,每次試驗持續(xù)7.5秒。所有數(shù)據(jù)均是通過分布在頭部的25個Ag/AgCl電極記錄的,采樣頻率為250Hz,并對采集EEG信號進行0.5Hz-100Hz帶通濾波。具體細節(jié)參考https://www.bbci.de/competition/iv/。
2.2 預(yù)處理
為了更有效地提取腦電信號特征,先對原始腦電數(shù)據(jù)進行預(yù)處理。本文選用Python語言,在集成開發(fā)環(huán)境PyCharm中進行編程,利用MNE工具箱對腦電信號預(yù)處理,受試者A03原始的腦電信號如圖1所示。該數(shù)據(jù)集包含3個眼電偽跡的通道,刪除這三個無用通道。與MI有關(guān)的頻率主要集中在α節(jié)律(8~13Hz)和β節(jié)律(14~30Hz)[18],因此對腦電信號進行8-30Hz的帶通濾波。濾波后不僅方便選擇后續(xù)工作所需要的有效頻段,而且可以減輕高頻干擾與工頻噪聲[19]。腦電信號中摻雜著各種生理偽跡[20],調(diào)用MNE工具箱中內(nèi)置的獨立成分分析(Independent Component Analysis,ICA)算法進行去噪處理。
2.3 特征提取與降維
2.3.1 特征提取
對預(yù)處理后的腦電信號使用功率譜密度(Power Spectral Density,PSD)提取反映受試者意圖的頻域信號特征,受試者A03的腦電數(shù)據(jù)經(jīng)帶通濾波后的功率譜密度如圖2所示。計算對應(yīng)頻率段的曲線下面積作為腦電信號在該頻段的能量值。對每名受試者的22個通道分別計算Alpha(8-13Hz),Beta1(14-20Hz),Beta2(21-28Hz)三個頻段的腦電信號功率,共提取66維腦電特征。
2.3.2 特征降維
提取到的腦電特征包含許多冗余信息,會影響分類模型的識別準(zhǔn)確率,使用主成分分析(Principal Component Analysis,PCA)算法降維。PCA通過矩陣分解將高維特征數(shù)據(jù)壓縮到少量特征上,并且信息量不會損失太多,形成新的含有大量有效信息的低維特征矩陣。
2.4 模參型數(shù)
精細調(diào)參可以提高分類器的準(zhǔn)確率,使用學(xué)習(xí)曲線和網(wǎng)格搜索的方法確定SVM和LR模型的參數(shù)。SVM的核函數(shù)設(shè)為‘linear,選擇L2正則化防止模型過擬合,懲罰項系數(shù)C設(shè)為0.8,最大迭代次數(shù)max_iter為-1。LR模型選用L2正則化,C設(shè)為0.78,設(shè)置‘lbfgds作為目標(biāo)損失函數(shù)的迭代優(yōu)化算法。
2.5 概率校準(zhǔn)
2.5.1 Platt Scaling
Platt Scaling是一種參數(shù)化校準(zhǔn)方法,模型校準(zhǔn)的過程實際上是在確定最優(yōu)參數(shù)(a,b)。將分類器的預(yù)測輸出值通過Sigmoid函數(shù)進行轉(zhuǎn)換,將分類器的原始預(yù)測輸出值映射為較為準(zhǔn)確的概率值,其范圍為(0,1)。假設(shè)輸入樣本為xi,分類器的預(yù)測輸出值為f(xi),則分類器最終輸出概率的計算公式為:
參數(shù)(a,b)通過極大似然估計的方法可求得:
其中,pi為校準(zhǔn)后的概率,yi為輸入樣本的真實類別,pi用式(3)表示:
在實際應(yīng)用中,為了防止分類器過度擬合,經(jīng)常會使用下式給樣本正類y+和負類y-賦值:
其中,N+和N-分別是正負樣本的數(shù)量。
2.5.2 Isotonic Regression
Isotonic Regression是一種非參數(shù)校準(zhǔn)的方法,假設(shè)分類器預(yù)測輸出值為yi,輸入樣本的標(biāo)簽為Yi,則模型定義為:
其中,F(xiàn)為分類器預(yù)測輸出值yi和樣本真實值Yi之間擬合的單調(diào)遞增的函數(shù),?著i為誤差。若給定數(shù)據(jù)集set(yi,Yi),則F可以通過式(7)求解:
式(6)的一種求解算法是PAV(Pool Adiacent Violators)[21],通過不斷更新違反函數(shù)單調(diào)性的局部區(qū)間,找到最終滿足單調(diào)性的區(qū)間。
3 評估方法與結(jié)果分析
3.1 評估方法
模型的評估是非常重要的一步,為了評估概率校準(zhǔn)后模型的效果,本文采用了三種指標(biāo):布里爾分數(shù)(Brier Score),可靠性曲線(Reliability Curve),ROC曲線下面積AUC來評估概率校正后模型的效果。
3.1.1 布里爾分數(shù)
布里爾分數(shù)是一項衡量概率校準(zhǔn)表現(xiàn)的標(biāo)準(zhǔn)指標(biāo),其計算方法為樣本真實值與概率預(yù)測之間的均方誤差。具體表達式如下:
其中,N是樣本數(shù)量,fi是分類器預(yù)測輸出值,yi是樣本的真實標(biāo)簽。式(8)的范圍從0到1,衡量概率預(yù)測值和真實值的差異,布里爾分數(shù)越小,模型的預(yù)測精度越高。
3.1.2 可靠性曲線
可靠性曲線,又稱為概率校準(zhǔn)曲線(Probability Calibration Curve),它是一種可視化的評估方法,可以直觀地看出模型在進行二分類任務(wù)時,其概率輸出與理論最優(yōu)分類器預(yù)測的偏差程度,可以幫助我們了解模型的置信度。如果模型具有很好的置信度,那么可靠性曲線應(yīng)該接近45度對角線。而如果模型的置信度有問題,可靠性曲線可能會出現(xiàn)明顯的偏差。
3.1.3 AUC
ROC(Receiver Operating Characteristic)曲線,又稱為感受性曲線,ROC曲線是一種以真陽性率為縱坐標(biāo),以假陽性率為橫坐標(biāo)的二維曲線。模型的預(yù)測效果可以通過ROC曲線下面積AUC來進行評估,AUC值越大則模型的預(yù)測效果越好。通常,AUC值被用來衡量二分類模型的分類效果,其取值范圍在0到1之間。當(dāng)AUC值越接近1時,模型的分類效果越好。
3.2 結(jié)果分析
表1展示了9名受試者采集的腦電信號在原始模型和概率校正后模型下的分類準(zhǔn)確率。為了敘述方便,下文以‘模型+Platt、‘模型+Isotonic的方式命名校準(zhǔn)后的模型。SVM、SVM+Platt、SVM+Isotonic、LR、LR+Platt和LR+Isotonic在9名受試者腦電數(shù)據(jù)上的平均準(zhǔn)確率分別為70.96%、73.74%、72.18%、72.28%、74.78%和73.94%。可以看出經(jīng)概率校準(zhǔn)的分類器的準(zhǔn)確率比原始分類器的準(zhǔn)確率有所提高,且Platt概率校準(zhǔn)方法在該數(shù)據(jù)集上比Isotonic概率校準(zhǔn)方法更有優(yōu)勢。
由于篇幅限制,本文只展示受試者A03的概率校準(zhǔn)模型的可靠性曲線圖。如圖3所示,明顯看到經(jīng)過概率校準(zhǔn)的模型SVM+Platt、SVM+Isotonic、LR+Platt和LR+Isotonic都比未校準(zhǔn)的模型更靠近對角線,模型效果更好。支持向量機模型的布里爾分數(shù)為0.140,經(jīng)概率校準(zhǔn)后SVM+Platt和SVM+Isotonic的布里爾分數(shù)分別為0.124,0.126;邏輯回歸模型的布里爾分數(shù)為0.130,經(jīng)概率校準(zhǔn)后LR+Platt和LR+Isotonic的布里爾分數(shù)分別為0.119, 0.120。校準(zhǔn)的模型布里爾分數(shù)降低,說明模型的概率預(yù)測輸出與樣本真實標(biāo)簽更接近,模型變得更加穩(wěn)定可靠。
圖4展示了應(yīng)用本文采用的概率校準(zhǔn)方法后,SVM+Platt的AUC比原始SVM模型的AUC提高0.03,達到0.93;SVM+Isotonic的AUC略微遜色達到0.92。對于原始LR模型,模型本身效果就比較好,AUC為0.92;概率校準(zhǔn)后,LR+Platt的AUC有所上升,達到0.93,而LR+Isotonic的AUC則與LR的AUC持平。
4 討論
本文對第四屆BCI競賽2a腦電數(shù)據(jù)集進行解碼,利用概率校準(zhǔn)方法對模型的預(yù)測輸出進行再學(xué)習(xí),模型準(zhǔn)確率上升,達到實驗預(yù)期。概率校準(zhǔn)并不是對所有的數(shù)據(jù)集都起作用,如表1中,受試者A07的腦電數(shù)據(jù),經(jīng)過兩種概率校準(zhǔn)方法校準(zhǔn)后,模型的準(zhǔn)確率反而下降;對于受試者A09,經(jīng)Platt方法校準(zhǔn),模型的準(zhǔn)確率升高,經(jīng)Isotonic方法校準(zhǔn),模型的準(zhǔn)確率下降或持平。SVM+Platt、SVM+Isotonic、LR+Platt和LR+Isotonic四種校準(zhǔn)模型在9名受試者的腦電數(shù)據(jù)上進行建模,平均準(zhǔn)確率比原始模型分別提高2.78%,1.22%,2.50%,1.66%。通過調(diào)研文獻資料發(fā)現(xiàn),Platt校準(zhǔn)方法在數(shù)據(jù)量較少時會有更好的效果,因為Isotonic校準(zhǔn)方法非常容易過擬合,當(dāng)有足夠多的數(shù)據(jù)時,Isotonic方法會更有效。
通過繪制交叉驗證學(xué)習(xí)曲線觀察6種模型在受試者A03數(shù)據(jù)集上的表現(xiàn)情況。由于訓(xùn)練數(shù)據(jù)集和測試數(shù)據(jù)集分別有144個,數(shù)據(jù)量偏少,選擇將兩組數(shù)據(jù)組合在一起,總共288個數(shù)據(jù)樣本,建立模型后,以每次訓(xùn)練的不同的樣本數(shù)量為橫坐標(biāo),訓(xùn)練分數(shù)和測試分數(shù)為縱坐標(biāo)來繪制學(xué)習(xí)曲線,如圖5所示。從圖上可以看出,支持向量機和邏輯回歸模型在訓(xùn)練數(shù)據(jù)量較小時都存在嚴(yán)重的過擬合現(xiàn)象,隨著樣本量的增大,模型過擬合的情況會得到緩解;概率校準(zhǔn)后,有效地減輕了模型的過擬合情況。兩種概率校準(zhǔn)后的模型測試準(zhǔn)確率均高于原始模型的表現(xiàn),達到85%以上,且經(jīng)Platt方法校準(zhǔn)的模型表現(xiàn)略勝一籌,說明Platt方法在數(shù)據(jù)集較少時的表現(xiàn)確實好于Isotonic方法。從圖上可以預(yù)見,采集更多的腦電數(shù)據(jù)用于訓(xùn)練,兩種方法校準(zhǔn)后模型的準(zhǔn)確率會進一步提高。
本文的不足之處:第一,只提取腦電信號頻域特征,有效信息量過少,接下來工作會從時域、頻域、空域三種不同的角度提取腦電信號特征,然后進行特征融合,利用啟發(fā)式算法選擇特征。第二,經(jīng)典單一分類器的表現(xiàn)效果或許不如多模型融合以及神經(jīng)網(wǎng)絡(luò)模型,后續(xù)工作會進行驗證。
5 結(jié)束語
腦機接口技術(shù)改變了人們與外界的信息交互方式,在未來許多領(lǐng)域必定會大放異彩,腦電信號的解碼至關(guān)重要。本文對運動想象腦電信號使用PSD方法提取頻域特征,利用PCA技術(shù)降低特征維數(shù),選擇SVM和LR兩種算法建立腦電信號分類預(yù)測模型,選用Platt、Isotonic兩種概率校準(zhǔn)方法對模型有偏的輸出結(jié)果進行校準(zhǔn),兩種方法在本文數(shù)據(jù)集中多名受試者的腦電數(shù)據(jù)上均達到不錯的效果,且隨著數(shù)據(jù)量的增加,模型過擬合情況得到緩解,分類準(zhǔn)確率也能進一步提高。
——————————
參考文獻:
〔1〕Kamhi S, Zhang S, Ait Amou M, et al. Multi-Classification of Motor Imagery EEG Signals Using Bayesian Optimization-Based Average Ensemble Approach[J]. Applied Sciences, 2022, 12(12): 5807.
〔2〕許冬萍,陳峰.基于改進小波變換和模糊熵的腦電信息研究[J].計算機仿真,2019,36(10):227-232.
〔3〕Yang Y J, Jeon E J, Kim J S, et al. Characterization of kinesthetic motor imagery compared with visual motor imageries[J]. Scientific Reports, 2021, 11(01): 1-11.
〔4〕田貴鑫,陳俊杰,丁鵬,等.腦機接口中運動想象的執(zhí)行與能力的評估和提高方法[J].生物醫(yī)學(xué)工程學(xué)雜志,2021,38(03):434-446.
〔5〕劉拓, 葉陽陽,王坤,等.運動想象腦電信號分類算法的研究進展[J].生物醫(yī)學(xué)工程學(xué)雜志,2021, 38(05):995-1002.
〔6〕Li C, Chen M, Zhang L. A Domain Adaptation-Based Method for Classification of Motor Imagery EEG[J]. Mathematics, 2022, 10(09): 1588.
〔7〕魯杰,楊曉棟,彭靖宇,等.基于LSTM的運動想象腦電信號分類方法[J].電子設(shè)計工程,2021,29(04):88-92.
〔8〕Shi M, Wang C, Li X Z, et al. EEG signal classification based on SVM with improved squirrel search algorithm[J]. Biomedical Engineering/Biomedizinische? Technik, 2021, 66(02): 137-152.
〔9〕Miao M, Zeng H, Wang A, et al. Discriminative spatial-frequency-temporal feature extraction and classification of motor imagery EEG: An sparse regression and Weighted Na?觙ve Bayesian Classifier-based approach[J]. Journal of neuroscience methods, 2017, 278: 13-24.
〔10〕Niculescu-Mizil A, Caruana R. Predicting good probabilities with supervised learning[C]//Proceedings of the 22nd international conference on Machine learning. 2005: 625-632.
〔11〕Zadrozny B, Elkan C. Transforming classifier scores into accurate multiclass probability estimates[C]//Proceedings of the eighth ACM SIGKDD international conference on Knowledge discovery and data mining. 2002: 694-699.
〔12〕Zhong W, Kwok J T. Accurate probability calibration for multiple classifiers[C]//Twenty-Third International Joint Conference on Artificial Intelligence. 2013.
〔13〕范雙龍,趙志強,余紅梅,等.基于概率校準(zhǔn)的彌漫性大B細胞淋巴瘤患者死亡風(fēng)險預(yù)測[J].中國衛(wèi)生統(tǒng)計,2021,38(05):670-674.
〔14〕肖瑤,謝貴才,朱兵.淺談分類問題中的概率校準(zhǔn)[J].中國統(tǒng)計,2018,66(05):35-37.
〔15〕Platt J. Probabilistic outputs for support vector machines and comparisons to regularized likelihood methods[J]. Advances in large margin classifiers, 1999, 10(03): 61-74.
〔16〕Qin J, Garcia T P, Ma Y, et al. Combining isotonic regression and EM algorithm to predict genetic risk under monotonicity constraint[J]. The annals of applied statistics, 2014, 8(02): 1182.
〔17〕Naeem M, Brunner C, Leeb R, et al. Seperability of four-class motor imagery data using independent components analysis[J]. Journal of neural engineering, 2006, 3(03): 208-216.
〔18〕Tang Z, Li C, Sun S. Single-trial EEG classification of motor imagery using deep convolutional neural networks[J]. Optik, 2017, 130: 11-18.
〔19〕Daud S S, Sudirman R. Butterworth bandpass and stationary wavelet transform filter comparison for electroencephalography signal[C]//2015 6th international conference on intelligent systems, modelling and simulation. IEEE, 2015: 123-126.
〔20〕吳全玉,張文強,潘玲佼,等.一種結(jié)合自適應(yīng)噪聲完備經(jīng)驗?zāi)B(tài)分解和盲反卷積去除腦電中眼電偽跡的新方法[J].數(shù)據(jù)采集與處理,2020,35(04):720-729.
〔21〕Ayer M, Brunk H D, Ewing G M, et al. An empirical distribution function for sampling with incomplete information[J]. The annals of mathematical statistics, 1955: 641-647.
收稿日期:2023-02-11
通訊作者:吳全玉(1977-),男,漢族,安徽碭山人,副教授,碩士研究生導(dǎo)師。研究方向:嵌入式康復(fù)系統(tǒng)開發(fā)、醫(yī)學(xué)信號處理和血流動力學(xué)仿真。
基金項目:國家自然科學(xué)基金青年項目(62001196);江蘇省重點研發(fā)計劃(SBE2020648);常州市社會發(fā)展項目(CE20225045)