利用噪聲能量和卡方分布約束的虛假鋒電位篩除方法
李志輝,劉新玉,尚志剛
(鄭州大學 電氣工程學院,河南 鄭州 450001)
摘要:神經(jīng)元鋒電位可靠檢測在神經(jīng)科學研究與腦機接口應用中具有重要價值.針對低信噪比條件下鋒電位檢測的假陽性問題,提出了一種利用鋒電位信號背景噪聲能量和服從卡方分布約束的虛假鋒電位去除方法.首先使用K-Means算法對過閾值檢測的待判鋒電位進行聚類,并用最小協(xié)方差算法估計各聚類總體噪聲均值向量與協(xié)方差;進而計算各噪聲樣本與對應總體之間的馬氏距離平方作為鋒電位背景噪聲能量和的度量指標;最后利用該指標卡方分布的置信區(qū)間對虛假鋒電位進行篩除.不同信噪比條件下的仿真數(shù)據(jù)和動物實驗數(shù)據(jù)應用結果表明:與傳統(tǒng)的基于鋒電位波形特征的陣列去噪算法相比,該方法可以有效識別出單電極記錄神經(jīng)信號中的虛假鋒電位,正確率在95%以上,并且計算結果不依賴于聚類參數(shù)的選擇.
關鍵詞:鋒電位檢測;虛假鋒電位;噪聲能量和;馬氏距離;卡方分布;K-Means聚類
收稿日期:2015-05-01;
修訂日期:2015-06-29
基金項目:國家自然科學基金資助項目(U1304602,61473266,61305080);河南省高等學校重點科研資助項目(15A120016)
作者簡介:李志輝(1978—),女,鄭州大學講師,博士生,研究方向為神經(jīng)信號處理,E-mail:lizhrain@zzu.edu.cn.
通訊作者:尚志剛(1975—),男,鄭州大學副教授,博士,研究方向為數(shù)據(jù)挖掘與信號處理,E-mail:zhigang_shang@zzu.edu.cn.
文章編號:1671-6833(2015)05-0111-05
中圖分類號:R318.04
文獻標志碼:A
doi:10.3969/j.issn.1671-6833.2015.05.024
Abstract:The reliable detection of neuronal spikes plays an important role from basic research in neuroscience to brain-machine interface applications. In order to solve the false positive problem in spike detection, a method was proposed to remove fake spikes, by using the chi-square distribution constraint of noise energy sum. First, the detected spikes over the threshold were separated by K-Means clustering, and the noise samples were acquired so that its means and covariance could be estimated by minimum covariance determinant (MCD) algorithm. Then, the Square of Mahalanobis Distribution (SMD) between each noise event and corresponding population was calculated to indicate the energy sum of noise. Finally, fake spikes were identified if their SMD value were not included in the confidence interval of corresponding chi-square distribution. The results from synthetic data and real neural data showed that the de-noising performance of this method is superior to the traditional methods. Its accuracy rate to identify the fake spikes is above 95%, and its performance is not dependent on the choice of clustering number.
0引言
神經(jīng)元鋒電位是利用微電極胞外記錄方式檢測到的神經(jīng)元動作電位信息,對其可靠檢測在神經(jīng)信息編碼機制、腦機接口研究中具有重要應用價值[1-2].在神經(jīng)電生理實驗中,尤其是在信噪比較低的清醒動物神經(jīng)信號采集中,微電極除了記錄神經(jīng)元放電活動之外,還會記錄到大量的神經(jīng)系統(tǒng)背景噪聲、肌電干擾、電磁干擾、以及設備本底噪聲等,尤其是背景噪聲中的一些大幅值有色干擾,與鋒電位具有相似的頻域和時域特征,在以閾值為基礎的檢測方案中經(jīng)常會被誤檢為鋒電位,即產(chǎn)生假陽性問題,從而降低后續(xù)分析結果的準確性和可靠性[3-5].
對于虛假鋒電位的篩除,模板匹配是最簡單最常用的方法,例如Quiroga等[6]通過對鋒電位樣本集聚類,將相似度低于給定閾值的樣本作為虛假鋒電位剔除.但該類算法去噪的性能很大程度上取決于聚類的結果,而虛假鋒電位的存在同時又會對聚類效果造成干擾,去噪效果在低信噪比條件下不甚理想.Ludwig等[7]提出的共同平均參考去噪、Paralikar等[8]提出的虛擬參考去噪算法則是將不同通道的神經(jīng)信號疊加平均作為參考信號,各通道信號與參考信號對消以去除大幅值干擾.此外,Paralikar等[4]還提出了電極間相關法(Inter-Electrode Correlation,IEC)用于去除虛假鋒電位.這些利用多通道信號去噪算法的一個基本假設是認為噪聲一旦發(fā)生就會被微電極陣列中多個電極同時記錄到,而且波形相似.但是對于空間距離≥250 μm的兩個電極而言,幾乎不可能同時記錄到來自于同一個神經(jīng)元且波形相似的神經(jīng)信號[6],而且各類有色噪聲引起的大幅值干擾往往只會在單個通道中出現(xiàn),無法利用上述陣列方法進行去除.萬紅等[8]采用多元小波閾值去噪算法用于去除鋒電位檢測中的大幅值干擾,吳丹等[9]采用主成分和小波閾值相結合的聯(lián)合去噪方法用于去除鋒電位檢測信號中的有色噪聲.但是這兩種方法只有在不同通道鋒電位信號之間相互獨立并且包含相關噪聲的情況下才能達到較好的效果,而且在去噪的同時也會對鋒電位波形造成畸變,對后續(xù)鋒電位分類造成影響.
鑒于上述方法存在的問題,筆者提出了一種利用噪聲能量和卡方分布約束的虛假鋒電位篩除方法,并利用仿真數(shù)據(jù)和動物實驗數(shù)據(jù)對算法性能進行了對比評估.
1方法
1.1理論基礎
X~Np(μ,∑).
(1)
式中:μ為總體均值向量;∑為協(xié)方差矩陣.
對于單個總體的多元空間異常值(或離群點)的檢測,存在以下定理[11]:
對于n個p維空間中的樣本X1,X2,…,Xn,如果Xi~Np(μ,∑),i=1,2,…,n,∑>0,那么樣本馬氏距離(Mahalanobis Distance)的平方服從自由度為p的卡方分布,即
(2)
因此,總體中的異常樣本可以通過設置卡方分布的1-α置信水平閾值來篩選,如果某個樣本的平方馬氏距離大于該閾值,則認為這個樣本為異常值.
在實際應用中,檢測到的多個鋒電位通常來自多個總體,且總體的個數(shù)與均值都未知.無法直接應用上述單個總體異常值檢測方法.筆者提出了一種間接思路,采用K-Means聚類,對于一個來自X~Np(μit,∑) 總體的鋒電位,設其所屬聚類的類別均值為μic,則有
ei=Xi-μic~Np(μit-μic,∑).
(3)
對于屬于一個聚類類別的樣本,其類別均值都為μit,如果該類別樣本確實來自同一總體,則該類樣本與聚類均值的誤差都服從相同的多元高斯分布,如公式(2).根據(jù)前述單個總體異常值檢驗方法,該類噪聲樣本的馬氏距離平方應服從卡方分布約束,表征了本底噪聲的加權能量和.
為了保證聚類類別中的樣本盡可能來自同一總體,在K-Means聚類中,給定的聚類個數(shù)應相對多些,這樣一個真實的總體可能會分裂為多個子類,但聚類數(shù)過多會導致聚類后各類樣本數(shù)過少,無法估計協(xié)方差.另外,考慮到單根電極同時能記錄到的神經(jīng)元活動一般為4個,最多不會超過8個[12],因此在設置聚類數(shù)時,應保證其取值不小于真實的類別個數(shù).
1.2虛假鋒電位去除算法
在上述分析基礎上,筆者提出一種利用聚類樣本與類別均值誤差的馬氏距離作為鋒電位辨別特征,根據(jù)卡方分布確定的閾值來篩除虛假鋒電位.為便于描述,將這種算法命名為MDD(Mahalanobis Distance Denoising,MDD)算法.
在MDD算法中,最重要的步驟就是準確估計聚類后各類別中的噪聲樣本的均值與協(xié)方差.在采用K-Means算法獲得各聚類樣本與類別均值的噪聲樣本后,筆者采用最小協(xié)方差行列式(Minimum Covariance Determinant,MCD)算法對噪聲的均值和協(xié)方差進行估計.MCD是一種常用的多元位置參數(shù)和尺度參數(shù)估計算法[13],可以有效減小奇異樣本對估計結果的影響,提高均值和協(xié)方差估計的魯棒性.
綜上所述,對于給定的多個鋒電位事件樣本,MDD算法的主要步驟如下.
① 對信號進行預處理,即將所有樣本的負峰值點沿著同一豎線對齊.
② 利用K-Means算法對所有樣本進行聚類,期望聚類數(shù)設為10~16個,計算聚類后各類樣本個數(shù).考慮到協(xié)方差估計的需要,因此在初步聚類后對于樣本數(shù)較少的類別與其距離近的類別融合,保證各類中樣本數(shù)大于特征維數(shù)p.
③ 利用MCD算法分別估計出每個聚類總體噪聲樣本的均值向量與協(xié)方差.
④ 利用式(2)計算噪聲樣本與對應聚類總體之間的馬氏距離平方.
2算法應用結果
2.1仿真實驗結果
參考文獻為了測試MDD算法的性能,首先利用仿真數(shù)據(jù)對算法進行了驗證.仿真數(shù)據(jù)來自[14],由真實鋒電位、背景噪聲和虛假鋒電位組成,真實鋒電位分別來自于3個不同的神經(jīng)元.虛假鋒電位與真實鋒電位具有相同的幅度水平和頻帶.仿真數(shù)據(jù)共由噪聲水平分別為0.05、0.10、0.15、0.20、0.25、0.30、0.35和0.40的8段數(shù)據(jù)組成.噪聲水平定義為背景噪聲的標準差.圖1為噪聲水平為0.1時從仿真數(shù)據(jù)中檢測出的信號波形及聚類結果,共包括521個鋒電位及51個虛假鋒電位.圖1(a)為所有鋒電位事件波形圖(幅值經(jīng)過方差歸一化);圖1(b)為利用K-Means和MCD算法估計出的不同聚類的鋒電位均值的波形圖,此處設置K-Means的期望聚類數(shù)為16個;圖1(c)為K-Means算法獲得的不同類別的鋒電位波形圖.
圖1 Spike仿真信號波形及其K-Means聚類
圖2為從圖1信號中獲得的噪聲及其馬氏距離分布. 圖2(a)中左圖為從信號中提取的多個噪聲波形,右圖為其波形的幅值統(tǒng)計分布及高斯擬合曲線(擬合精度R-square=0.99);圖2(b)為噪聲樣本的馬氏距離分布圖,圖中的直線是根據(jù)卡方分布設定的臨界值,MDD算法共識別出了49個虛假鋒電位,正確率96%.
表1為不同噪聲水平下MDD算法的識別正確率.識別正確率定義為正確識別的鋒電位個數(shù)(TP)與正確識別鋒電位個數(shù)及漏檢的鋒電位個數(shù)(FN)和誤判的鋒電位個數(shù)(FP)之和的比(即TP/(TP+FN+FP)).由表1可知,在不同噪聲水平下,MDD算法的識別正確率都在95%以上.
注:圖中星號(*)標記的事件為真正的虛假鋒電位;圓圈(°)標記的事件為識別出的虛假鋒電位.
圖2 信號的噪聲波形及其馬氏距離分布
2.2實驗結果
為了進一步測試算法的性能,筆者利用動物實驗實測數(shù)據(jù)對MDD算法進行驗證,并將其與多通道相關法IEC算法進行了對比.實測數(shù)據(jù)采用神經(jīng)信號采集系統(tǒng)(CerebusTM,Blockrock Inc.),在7只LE(Long Evans)大鼠V1區(qū)利用微電極陣列(Microprobe Inc.,2×8鉑銥合金微電極陣列,電極阻抗在1 kHz下為0.5~1.0 MΩ)記錄得到.視覺刺激和實驗過程詳見參考文獻[15].采集后的信號使用通帶為0.25~5 kHz的二階帶通Butterworth濾波器濾波,并采用內(nèi)置的幅度閾值方法進行鋒電位檢測,各通道的鋒電位檢測閾值為4或5倍噪聲標準差.將檢測后的鋒電位負峰值點沿同一豎線對齊.數(shù)據(jù)運算在MATLAB 7.6.0(R2008a)環(huán)境下進行.從7只大鼠共112個通道中去除無效通道后(信噪比較差或檢測到的事件個數(shù)小于500的通道被視為無效通道),共提取了46個有效通道.
MDD算法與IEC算法的對比結果如圖3所示.圖3(a)為信號最大的兩個主成分散點圖,由圖可見,IEC算法識別出的虛假鋒電位大多離聚類中心較近,而MDD算法識別出的大都遠離聚類中心. 圖(b)和(c)分別為IEC算法和MDD算法識別出的有效鋒電位波形圖,對比二者可以看到,采用MDD算法篩除虛假鋒電位后的鋒電位波形變異要明顯小于IEC算法.
注:圖中灰色圓點(?)代表記錄到的事件;黑色下三角形(▽)為IEC算法識別出的虛假鋒電位;黑色上三角形(△)為MDD算法識別出的虛假鋒電位.
圖3 IEC算法和MDD算法識別結果對比圖
(4)
其中單個鋒電位的信噪比計算公式為
(5)
式中:std(·)為標準差;max(·)為最大值;min(·)為最小值.
噪聲標準差為各鋒電位信號噪聲成分的平均標準差,計算公式為
(6)
獲得的46組神經(jīng)信號在去噪前、IEC算法去噪后、MDD算法去噪后的信噪比、噪聲標準差對比結果如表2所示.經(jīng)過去噪之后,MDD算法去噪后信號的信噪比高于IEC算法(p<0.05),而噪聲能量低于IEC算法(p<0.05),展現(xiàn)出良好的去噪性能.
表2 IEC算法和MDD算法去噪性能對比
3結論
通過對實驗結果的分析可以看到,筆者提出的MDD算法可以有效識別出鋒電位中混雜的虛假鋒電位事件,識別正確率在95%以上;與基于多通道信息的IEC算法相比,MDD算法表現(xiàn)出了更好的去噪效果.仿真數(shù)據(jù)和實測數(shù)據(jù)的應用結果表明,筆者提出的MDD算法可以有效篩除神經(jīng)信號中的虛假鋒電位.
虛假鋒電位的篩除目前并沒有通用有效的方法.筆者提出的MDD算法是一種單通道去噪算法,利用真實鋒電位背景噪聲能量和應服從卡方分布這一約束來實現(xiàn)對虛假鋒電位的辨別,可以避免如平均參考去除、小波分解等算法在鋒電位檢測前進行去噪而造成信號畸變、識別準確率下降的問題.此外,MDD算法中雖然采用了K-Means聚類,但并不需要精確對鋒電位進行聚類,聚類數(shù)目的選擇并不影響虛假鋒電位的篩除效果.不過,MDD算法會把疊加的鋒電位信號識別為虛假鋒電位,因此對于識別出的虛假鋒電位事件還需要進一步篩選出疊加鋒電位信號,并利用相應的方法進行解耦合處理.
[1]HOHL S S, CHAISANGUTHUM K S, LISBERGER S G. Sensory population decoding for visually guided movements[J]. Neuron, 2014, 79(1): 169-179.
[2]BECEDAS J and QUIROGA R Q Real time decoding for brain-machine interface applications[J]. Journal of Bioinformatics and Biological Engineering, 2014, 2(1): 20-32.
[3]WAN Hong, LIU Xin-yu, NIU Xiao-ke, et al. The design and implementation of anti-interference system in neural electrophysiological experiments[J]. Electrical Engineering and Control, Lecture Notes in Electrical Engneering, 2011(98): 605-611.
[4]PARALIKAR J K, RAO C R, CLEMENT R S. New approaches to eliminating common-noise artifacts in recordings from intracortical microelectrode arrays: inter-electrode correlation and virtual referencing[J]. Journal of Neuroscience Methods, 2009, 181(1): 27-35.
[5]HILL D N, MEHTA S B, KLEINFELD D. Quality metrics to accompany spike sorting of extracellular signals[J]. Journal of Neuroscience, 2011, 31(24): 8699-8705.
[6]QUIROGA R Q, NADASDY Z, BEN S Y. Unsupervised spike detection and sorting with wavelets and superparamagnetic clustering[J]. Neural Computation, 2004, 16(8): 1661-87.
[7]LUDWIG K A, MIRIANI R M, LANGHALS N B, et al. Using a common average reference to improve cortical neuron recordings from microelectrode arrays[J]. Journal of Neurophysiology, 2009, 101(3): 1679-1689.
[8]萬紅, 李曉燕, 劉新玉, 等. 鋒電位檢測信號的多元小波去噪方法研究[J]. 系統(tǒng)仿真學報, 2013, 25(10): 2487-2498.
[9]吳丹, 封洲燕, 王靜. 微電極陣列神經(jīng)元鋒電位信號的去噪方法[J]. 浙江大學學報:工學版, 2010, 44(1): 105-110.
[10]FAISAL A A, SELEN L P, WOLPERT D M, Noise in the nervous system[J], Nat Rev Neurosci, 2008, 9(4): 292-303.
[11]高惠璇. 應用多元統(tǒng)計分析[M].北京:北京大學出版社, 2005.
[12]PEDREIRA C, MARTINEZ J, ISON M J, et al. How many neurons can we see with current spike sorting algorithms[J]. Journal of Neuroscience Methods. 2012, 211(1): 58-65.
[13]HUBERT M, DEBRUYNE M, Minimum covariance determinant[J],Wiley Interdisciplinary Reviews: Computational Statistics, 2010, 2(1):36-43.
[14]MARTINZE J, PEDREIRA C, ISON M J, et al. Realistic simulation of extracellular recordings[J]. Journal of Neuroscience Methods. 2009, 184(2): 285-293.
[15]劉新玉. 神經(jīng)元鋒電位干擾抑制算法研究及實現(xiàn)[D]. 鄭州:鄭州大學電氣工程學院, 2012.
A Method to Remove Fake Spikes by Means of Chi-Square Distribution
Constraint of Noise Energy Sum
LI Zhi-hui, LIU Xin-yu, SHANG Zhi-gang
(School of Electrical Engineering, Zhengzhou University, Zhengzhou 450001, China)
Key words: Spike detection; fake spike; noise energy sum; mahalanobis distance; chi-square distribution; K-Means clustering