丁尚文,王純賢
(1.合肥工業(yè)大學基礎(chǔ)部,安徽 宣城 242000; 2.合肥工業(yè)大學機械工程系,安徽 宣城 242000)
飲酒作為一種社會習俗和文化已經(jīng)流傳了幾千年。酒文化的巨大作用和影響推動了社會的發(fā)展,同時也給社會帶來了巨大損失。長期過量飲酒會產(chǎn)生高血壓、糖尿病及心腦血管等疾病。高劑量攝入酒精會引發(fā)腦細胞毒性水腫,并且長期酗酒會導致腦部形態(tài)在額葉、胼胝體等部位發(fā)生特異性損傷[1]。
對于過量飲酒危害是否對腦認知功能產(chǎn)生損傷,國內(nèi)外學者開展了相關(guān)研究工作。Michael等采用威斯康星卡片分類對急性飲酒志愿者進行測驗,結(jié)果表明急性酒精中毒可導致大腦執(zhí)行控制能力下降,其相應(yīng)的持續(xù)語言功能由于受到酒精抑制而導致語言表達不連貫[2]。謝成娟等對酒精依賴患者進行愛荷華博弈測試(Iowa gambling test,IGT)。試驗結(jié)果表明,對照組的IGT凈得分顯著高于酒精依賴組,并推測認為患者的IGT表現(xiàn)受損,可能與眶額葉皮質(zhì)、杏仁核受損等有關(guān)[3]。Ehler等采用腦電(electroencephalogram,EEG)技術(shù)研究發(fā)現(xiàn)酒精依賴患者在靜息態(tài)下額葉部位β功率明顯高于對照組[4]。劉桂青等[5]對酗酒者腦皮層EEG信號的同步性開展研究,結(jié)果發(fā)現(xiàn)酗酒者大腦不同區(qū)域間的功能連接強度受到一定程度的損傷。Korucuoglu等采用EEG方法研究急性飲酒對腦認知功能的影響,結(jié)果發(fā)現(xiàn)與安慰劑組相比急性飲酒志愿組的額葉處EEG信號α功率有明顯的增強[6]。文獻[7]采用的Flanker范式考察被試者在清醒狀態(tài)和飲酒狀態(tài)下的事件相關(guān)電位(event-related potentials,ERP)的差異性,研究結(jié)果發(fā)現(xiàn)飲酒會導致前扣帶回處的神經(jīng)活動興奮,進而使得覺察、認知功能和控制能力下降。
綜上分析可以發(fā)現(xiàn),國內(nèi)外研究人員采用認知量表、EEG技術(shù)等研究了酗酒成癮者腦認知功能損傷問題,研究結(jié)果給出了飲酒對腦認知功能產(chǎn)生影響的定性結(jié)論。進一步研究期望獲得研究個體EEG信號評估特征參數(shù);利用已經(jīng)獲得的評估參數(shù)對酗酒者EEG信號識別與分類。
支持向量機(support vector machine,SVM)是以統(tǒng)計學理論為基礎(chǔ)的一種模式分類識別技術(shù)[8]。為了對訓練數(shù)據(jù)進行分類,SVM的基本原理就是要尋找一個最優(yōu)分類面,盡可能使得訓練數(shù)據(jù)中樣本間距最大,從而將訓練數(shù)據(jù)分類。最優(yōu)分類面如圖1所示。圖1中的虛線表示分類的邊界線,在邊界線上的向量稱之為支持向量。邊界線之間的距離稱之為分類間隔。
圖1 最優(yōu)分類面示意圖
wx+b=0為分類線方程。該方程滿足條件:
yi[(wxi)+b]-1≥0
(1)
采用Lagrange求極值方法,利用對偶理論將式(1)中目標函數(shù)最值求解問題轉(zhuǎn)化為求下列目標函數(shù)最值問題[8]:
(2)
求解式(2)中對偶問題,得到最優(yōu)分類面的權(quán)系數(shù)向量以及分類域值為:
(3)
x(1)為式(3)中的訓練數(shù)據(jù)中第一類樣本點,x(-1)為第二類樣本點。式(4)中的最優(yōu)分類函數(shù)稱之為支持向量機,又稱之為最優(yōu)分類函數(shù)。
(4)
(xi·x)在式(4)中表示為內(nèi)積,且(xix)可選用核函數(shù)K(xix)替換,核函數(shù)的選取滿足Merce條件即可,但核函數(shù)表達式的不同對SVM分類結(jié)果有不同影響。另外,對于訓練樣本不可分情況,SVM借助松弛變量ξ以判斷對訓練數(shù)據(jù)xi的分類程度,懲罰因子C用來判斷最小錯分樣本點個數(shù)和分類間隔,最終獲得最優(yōu)分類面。式(4)中的(x1,y1),(x2,y2),…,(xn,yn)為已知訓練樣本。其中,xi∈Rl,yi∈{+1,-1},i=1,2,…,n。支持向量算法優(yōu)化的目標函數(shù)為:
(5)
s.t.yi(w·xi+b)≥1-ξi,ξi≥0
常用的核函數(shù)形式主要有線性核函數(shù)、內(nèi)積核函數(shù)、徑向基核函數(shù)等[8]。
本文分析采用的數(shù)據(jù)均來自于紐約大學HenriB教授在互聯(lián)網(wǎng)上公開的EEG數(shù)據(jù)庫。該數(shù)據(jù)主要涉及的是酒精中毒病人的相關(guān)腦電信號數(shù)據(jù)。試驗記錄了兩組試驗對象,即酗酒者和對照組在3種視覺刺激條件下的EEG信號。試驗時,按照國際標準在受試者頭部放置64導電極,設(shè)備采樣頻率為256 Hz,每次試驗記錄1 s的數(shù)據(jù)。試驗過程施加單一刺激或者復合刺激。數(shù)據(jù)采集存放在兩個數(shù)據(jù)集SMNI_CMI_TRAIN和SMNI_CMI_TEST。數(shù)據(jù)選擇:本文數(shù)據(jù)選擇來源于該試驗的大數(shù)據(jù)集(The Large Data Set),受試者包括酗酒者和正常人。各選擇10例受試者數(shù)據(jù)用來測試。從酗酒者和對照組的EEG數(shù)據(jù)中分別隨機選擇6段數(shù)據(jù)作為分析樣本,每組試驗數(shù)據(jù)作為訓練樣本或者測試樣本,共計三組數(shù)據(jù),分別簡稱數(shù)據(jù)1、數(shù)據(jù)2和數(shù)據(jù)3。
本文將酗酒者和健康者EEG信號相關(guān)參數(shù)作為標準,采用SVM方法期望借助評估參數(shù)對酗酒者和健康者EEG信號進行分類識別,同時優(yōu)選出用于識別兩類不同EEG信號的最佳評估因子。
能量參數(shù):在EEG節(jié)律特征研究中,大多選擇特征波的能量這一特征值對信號進行特征識別。EEG信號的低頻率節(jié)律相關(guān)能量E可用式(6)計算得到:
(6)
式中:x(n)為EEG信號的幅值;N為采集到數(shù)據(jù)點個數(shù)。
通過式(6),能夠計算出低頻率節(jié)律波EEG中相關(guān)的α、β和θ節(jié)律波段的能量[9]。
EEG信號功率譜AR參數(shù):在信號頻譜分析方法中,AR譜估計(簡稱AR模型)由于可用較短時長數(shù)據(jù)獲得較高頻率分辨的優(yōu)點而被研究者廣泛使用。AR算法詳見文獻[10]。該算法是建立在數(shù)據(jù)基礎(chǔ)上的基于自回歸系數(shù)求解的有效算法。
EEG信號近似熵:Pincus等在研究混沌現(xiàn)象課題時發(fā)現(xiàn)熵可以用來描述混沌現(xiàn)象[11],他們利用信號的時間序列復雜度提出了近似熵模型。通過近似熵判斷時間序列中新信息發(fā)生的可能性,以此判斷混沌現(xiàn)象中產(chǎn)生新模式的可能性。近似熵具體算法詳見文獻[11-12]。
將酗酒者和健康者的EEG信號的特征參數(shù)集合{‘EEG信號能量參數(shù)’,‘EEG信號功率譜AR參數(shù)’,‘EEG信號近似熵’}中任意元素作為EEG信號評估參數(shù),將該參數(shù)對應(yīng)的信號數(shù)據(jù)作為支持向量的訓練樣本。例如將EEG信號能量值作為訓練樣本(x1,y1),(x2,y2),…,(xn,yn),xi∈R2,yi∈{+1,-1},i=1,2,…,n。酗酒者的EEG信號能量值標簽對應(yīng)設(shè)定為1,健康者的EEG信號能量值標簽對應(yīng)設(shè)定為-1。將10例酗酒者和10例健康者的EEG信號能量值數(shù)據(jù)作為訓練樣本,對SVM模型參數(shù)進行訓練和估計。將對應(yīng)的兩類EEG信號能量值各10例為測試樣本,分別對應(yīng)的標簽設(shè)置為1和-1,具體流程見圖2。根據(jù)圖2算法流程,對EEG數(shù)據(jù)采用SVM方法(使用libsvm軟件包)進行訓練和測試。本文選擇線性核函數(shù)作為SVM的核函數(shù),借助EEG信號不同頻率段對應(yīng)的能量值,將酗酒者和健康者EEG信號分類。
圖2 基于SVM的酗酒者和健康者的EEG信號分類流程圖
基于不同數(shù)據(jù)組的測試效果對比如表1所示。
表1 基于不同數(shù)據(jù)組的測試效果對比
從表1可以發(fā)現(xiàn),采用近似熵、AR參數(shù)作為訓練樣本,能夠?qū)π锞普逧EG信號和健康者EEG信號分類識別,測試誤差率最小值分別為22.5%和25%。采用α、β和θ能量值作為訓練樣本,能夠?qū)π锞普逧EG信號和健康者EEG信號分類識別,測試誤差率最小值分別為25%、35%和10%。對應(yīng)的基于θ能量評估參數(shù)的酗酒者和健康者EEG信號分類結(jié)果見圖3。通過以上的分類結(jié)果比較,可以發(fā)現(xiàn)最佳的評估因子為θ能量評估參數(shù),且使用θ能量評估參數(shù)采用SVM方法能夠?qū)深惒煌珽EG信號分類識別,識別精度最高達到90%。
圖3 第十通道EEG信號θ能量評估參數(shù)分類結(jié)果圖(分類誤差10%)
酗酒會對腦認知功能產(chǎn)生嚴重損傷,國內(nèi)外研究者采用認知量表、EEG等技術(shù)已進行大量的研究,并給出較為可靠的腦認知損傷報告。本文提出基于支持SVM方法的EEG信號自動分類檢測技術(shù)。本文的工作能夠為當前國內(nèi)外研究機構(gòu)對酗酒成癮者評估檢測提供技術(shù)參考,能夠?qū)】碉嬀普呤欠裼行锞苾A向提供輔助檢測。