王忠民,趙玉鵬,鄭镕林,賀 炎,張嘉雯,劉 洋
1.西安郵電大學(xué) 計(jì)算機(jī)學(xué)院,西安710121
2.陜西省網(wǎng)絡(luò)數(shù)據(jù)分析與智能處理重點(diǎn)實(shí)驗(yàn)室,西安710121
3.西安市大數(shù)據(jù)與智能計(jì)算重點(diǎn)實(shí)驗(yàn)室,西安710121
情緒是人在外界刺激條件下所產(chǎn)生的一種綜合狀態(tài)。良好的情緒狀態(tài)有利于保持身心健康,而長期的不良情緒對人的心理健康和生理健康都有極大的影響。例如,長期的不良情緒容易引發(fā)抑郁癥,影響人的社會(huì)功能和人際交往,甚至?xí){到生命安全;對于心腦血管疾病患者來說,憤怒、焦慮等極端情緒會(huì)增加發(fā)病的風(fēng)險(xiǎn);駕駛員在駕駛過程中產(chǎn)生的憤怒情緒,容易引發(fā)路怒癥,嚴(yán)重影響駕駛員和其他交通參與者的生命安全等。綜上所述,情緒對人類生活的各個(gè)方面都產(chǎn)生著重要的影響,因此,準(zhǔn)確地識(shí)別情緒顯得尤為重要。
現(xiàn)階段情緒識(shí)別的方式主要分為兩方面:一是通過人的面部表情、語音聲調(diào)、身體姿態(tài)等非生理信號(hào)進(jìn)行識(shí)別,由于這些非生理信號(hào)可以通過偽裝等手段進(jìn)行人為控制,導(dǎo)致有時(shí)不能獲取到可以代表情緒的真實(shí)信號(hào),從而無法準(zhǔn)確地識(shí)別出真實(shí)的情緒狀態(tài)。另一方面可以利用腦電信號(hào)(electroencephalography,EEG)、眼電信號(hào)(electrooculogram,EOG)、心電信號(hào)(electrocardiogram,ECG)、肌電信號(hào)(electromyography,EMG)、皮膚電流反應(yīng)(galvanic skin response,GSR)等生理信號(hào)進(jìn)行情緒識(shí)別。由于伴隨情緒所產(chǎn)生的生理信號(hào)是由人體的神經(jīng)系統(tǒng)和內(nèi)分泌系統(tǒng)自發(fā)產(chǎn)生的,不易受到人為因素的影響,生理信號(hào)能夠更準(zhǔn)確地反映人類的情緒狀態(tài),基于生理信號(hào)的情緒識(shí)別能獲得更加客觀真實(shí)的結(jié)果,也更有利于實(shí)際應(yīng)用。
腦電是由中樞神經(jīng)系統(tǒng)產(chǎn)生的一種空間離散的非平穩(wěn)隨機(jī)信號(hào),可以直接記錄頭皮電位的變化情況,相比其他生理信號(hào)更能真實(shí)可靠地反映人的情緒狀態(tài)。隨著腦科學(xué)的不斷發(fā)展和信號(hào)處理技術(shù)的不斷進(jìn)步,腦電信號(hào)在情緒識(shí)別領(lǐng)域受到了越來越多研究者的青睞,并取得了一定的研究成果。
傳統(tǒng)的研究方法通常是通過提取腦電信號(hào)的線性和非線性特征來進(jìn)行情緒識(shí)別,忽略了腦區(qū)之間的信息交互。近些年來,越來越多的學(xué)者將復(fù)雜網(wǎng)絡(luò)理論引入到腦電情緒識(shí)別研究中,通過構(gòu)建腦功能網(wǎng)絡(luò)來探尋情緒產(chǎn)生機(jī)理,進(jìn)而進(jìn)行情緒識(shí)別。
本文從腦電情緒識(shí)別研究基礎(chǔ)、特征提取和選擇、腦網(wǎng)絡(luò)構(gòu)建和屬性提取以及分類識(shí)別方法等方面出發(fā),詳細(xì)介紹了腦電情緒識(shí)別的相關(guān)理論以及使用腦電信號(hào)進(jìn)行情緒識(shí)別的主要方法和研究進(jìn)展,最后對目前存在的問題以及未來的挑戰(zhàn)進(jìn)行了總結(jié)和展望。
情緒是在外界刺激條件下的人的復(fù)雜的生理物理變化過程,具有3 種成分:主觀體驗(yàn),即人對于不同情緒的自我感受;外部表現(xiàn),即人處在不同情緒時(shí)身體各部分動(dòng)作的量化反應(yīng)形式,包括面部表情、姿態(tài)表情和語調(diào)表情;生理喚醒,即由情緒的變化所引起的生理信號(hào)的變化,生理喚醒是一種生理的激活水平,不同情緒的生理反應(yīng)模式是不一樣的。
目前,情緒識(shí)別相關(guān)研究大多在可控的實(shí)驗(yàn)環(huán)境下進(jìn)行,情緒識(shí)別研究的一個(gè)重要條件就是誘發(fā)出被試的不同情緒,Picard 等人將情緒誘發(fā)方法分為兩種,一種是主體誘發(fā),一種是事件誘發(fā)。主體誘發(fā)是指通過讓被試做情緒所需要的表情,或者回憶帶有某種情緒的事件,來使被試產(chǎn)生相應(yīng)的情緒。事件誘發(fā)是一種通過文字、圖片、聲音、視頻片段等刺激素材來誘發(fā)被試特定情緒狀態(tài)的方法。主體誘發(fā)方法雖然能有效地誘發(fā)出目標(biāo)情緒,但是由于它需要被試有意識(shí)的合作,會(huì)導(dǎo)致實(shí)驗(yàn)條件不可控。為了使實(shí)驗(yàn)更加可控,很多研究者選擇使用事件誘發(fā)方式來進(jìn)行情緒誘發(fā)相關(guān)實(shí)驗(yàn)。在事件誘發(fā)方法中,使用視頻片段作為刺激素材同時(shí)綜合了聽覺、視覺情緒刺激的優(yōu)點(diǎn),能夠更有效地誘發(fā)情緒,因此視頻片段情緒誘發(fā)方法被廣泛應(yīng)用。目前最常用的情緒誘發(fā)方法是通過圖片、音樂和視頻等外部刺激誘發(fā)被試的不同情緒。Koelstra 等人通過音樂視頻材料的刺激誘發(fā)被試情緒,采集了32 名被試觀看音樂視頻時(shí)的32 導(dǎo)腦電信號(hào),并且記錄了被試對誘發(fā)視頻的效價(jià)(valence)、喚醒(arousal)、喜好(liking)、支配(dominance)心理量表以及前22 名被試的面部表情視頻,提出了一個(gè)用于分析人類情緒狀態(tài)的多模態(tài)數(shù)據(jù)集(DEAP 數(shù)據(jù)集)供研究者們使用。上海交通大學(xué)的呂寶糧教授領(lǐng)導(dǎo)的BCMI 實(shí)驗(yàn)室提供了SEED 數(shù)據(jù)集供研究者們下載使用,該數(shù)據(jù)集通過視頻材料的刺激誘發(fā)被試情緒,其中影片剪輯經(jīng)過仔細(xì)選擇,以引起積極(positive)、消極(negative)和中性(neutral)等不同類型的情緒,采集了15 名中國受試者在觀看15 個(gè)中國電影片段時(shí)的62 導(dǎo)腦電信號(hào),其中男性7 名,女性8 名,平均年齡為23~27 歲。
情緒識(shí)別的另一問題是如何劃分情緒,也就是建立情緒分類模型。采用一個(gè)世界通用的分類標(biāo)準(zhǔn)將有利于不同研究結(jié)果間的可比性和推廣性?,F(xiàn)有的情緒量化模型主要有離散模型和連續(xù)模型兩種。在離散模型中,情緒空間由離散而有限的基本情緒構(gòu)成,例如著名心理學(xué)家Ekman 提出的6 種基本情緒類別(憤怒(anger)、厭惡(disgust)、恐懼(fear)、高興(happiness)、悲傷(sadness)、驚訝(surprise))在情緒識(shí)別領(lǐng)域得到廣大學(xué)者的認(rèn)可。隨著情緒研究的深入,人們認(rèn)識(shí)到情緒的產(chǎn)生和消失是一個(gè)持續(xù)不斷的過程,從而提出了連續(xù)模型。連續(xù)模型認(rèn)為每種情緒都是一個(gè)連續(xù)體上的一部分,每種情緒狀態(tài)都可以在二維空間或者三維空間中找到與之對應(yīng)的一點(diǎn)。常用的連續(xù)模型是二維情緒模型,基于認(rèn)知評價(jià)將情緒空間劃分為效價(jià)和喚醒兩個(gè)維度,效價(jià)表示情緒是積極還是消極的,喚醒度反映情緒的強(qiáng)烈程度,如圖1 所示,在維度模型中,各種復(fù)雜的情緒都可以用這兩個(gè)維度的線性組合來表示。
圖1 二維情緒分類模型Fig.1 Two-dimensional emotion classification model
腦電信號(hào)(EEG)是大腦中大量神經(jīng)元放電活動(dòng)中突觸后電位引起的細(xì)胞外場電位的總和,它是一種使用電生理指標(biāo)記錄大腦活動(dòng)的方法。腦電信號(hào)大體上可分兩種:(1)自發(fā)腦電。無任何特定的外加刺激時(shí),神經(jīng)系統(tǒng)自發(fā)產(chǎn)生的大腦電位變化。(2)誘發(fā)腦電。對人施加某種感官刺激(如聲、光、圖像、體感等)時(shí),在腦中相應(yīng)部位誘發(fā)的電位變化。腦電信號(hào)的產(chǎn)生機(jī)理復(fù)雜,卻蘊(yùn)含著豐富的信息。EEG是一種空間離散的非平穩(wěn)時(shí)變信號(hào),時(shí)域波形較不規(guī)則,難以總結(jié)規(guī)律,從頻域上看,它具有節(jié)律性,各個(gè)節(jié)律和具體描述如表1 所示。
表1 腦電信號(hào)的不同頻帶及其描述Table 1 Different frequency bands of EEG signal and their description
腦電信號(hào)的采集一般是通過將物理電極放置在頭皮處實(shí)現(xiàn)的,采集方式主要分為侵入式和非侵入式兩種。侵入式采集方法得到的腦電信號(hào)具有更高的精度和更低的噪聲,但是為了安全起見,非侵入式的采集方法仍然被廣泛使用。根據(jù)采集設(shè)備的不同,非侵入式采集方式主要分為干電極采集設(shè)備和濕電極采集設(shè)備兩種,如圖2 所示。濕電極采集設(shè)備需要在電極和大腦皮層之間添加一些導(dǎo)電介質(zhì),可以減少電阻干擾,有利于采集信號(hào)的穩(wěn)定性,但是導(dǎo)電介質(zhì)容易消耗磨損,使用周期較短,因此不利于持續(xù)性長時(shí)間的腦電信號(hào)采集。此外,在頭皮上涂抹粘稠的電解質(zhì)也會(huì)影響被試的體驗(yàn)。干電極采集設(shè)備的優(yōu)點(diǎn)是不需要添加導(dǎo)電介質(zhì),可以減少受試者長時(shí)間參與實(shí)驗(yàn)產(chǎn)生的不適感,更有利于腦電采集實(shí)驗(yàn)的進(jìn)行以及腦電可穿戴設(shè)備的普及和應(yīng)用。缺點(diǎn)是電極與頭皮間的接觸不靈敏,受到的干擾較大,導(dǎo)致采集的信號(hào)強(qiáng)度較弱,在后續(xù)實(shí)驗(yàn)過程中增大特征提取的難度。由于兩種采集設(shè)備各有優(yōu)缺點(diǎn),在研究過程中可以根據(jù)實(shí)驗(yàn)時(shí)長等因素選擇合適的設(shè)備進(jìn)行腦電信號(hào)采集。
圖2 非侵入式腦電采集設(shè)備Fig.2 Non-invasive EEG acquisition equipment
腦電采集設(shè)備上帶有很多電極用于采集頭皮腦電信號(hào),不同采集設(shè)備的電極數(shù)量不同,常用的有16電極、32 電極和64 電極等。這些電極根據(jù)10-20 系統(tǒng)電極放置法放置在大腦頭皮的不同位置,用于采集不同腦區(qū)的腦電信號(hào)。圖3 是目前使用最廣泛的10-20 系統(tǒng)電極安放位置,其中10 和20 表示相鄰電極間的實(shí)際距離是前后或者左右頭骨的距離的10%或者20%。
圖3 國際標(biāo)準(zhǔn)10-20 腦電記錄系統(tǒng)電極安放位置Fig.3 International standard 10-20 EEG recording system electrode placement
在腦電數(shù)據(jù)采集過程中,由于外界環(huán)境、眼動(dòng)、肌肉運(yùn)動(dòng)等因素的影響,會(huì)引入一些干擾噪聲。數(shù)據(jù)預(yù)處理就是為了去除原始腦電信號(hào)中的干擾噪聲,得到可以用來進(jìn)行情緒識(shí)別的較為純凈的腦電信號(hào)。目前比較常用的預(yù)處理方法主要包括濾波、主成分分析、獨(dú)立成分分析等。濾波可以去除一些頻段比較固定的干擾,比如工頻干擾可以通過帶通濾波或低通濾波的方式進(jìn)行過濾。對于那些不易通過濾波去除的腦電噪聲,如眼電噪聲、肌電噪聲等可以采用主成分分析、獨(dú)立成分分析等方法進(jìn)行處理。主成分分析(principal component analysis,PCA)是在EEG 各導(dǎo)聯(lián)分布的基礎(chǔ)上,把腦電信號(hào)分解為互相獨(dú)立的成分,去掉不需要的干擾部分,再重構(gòu)EEG,以達(dá)到去偽跡的效果。由于主成分分析方法是利用正交原理將原始EEG 信號(hào)分解為互相獨(dú)立的成分,對于一些和EEG 波形相似的偽跡,主成分分析就無法進(jìn)行有效分離。獨(dú)立成分分析(independent component analysis,ICA)是一種盲源信號(hào)分離方法,由于腦電信號(hào)中的心電、眼電等偽跡都是由獨(dú)立的信號(hào)源產(chǎn)生的,通過ICA 便可以對原始數(shù)據(jù)進(jìn)行解混,剔除心電、眼電等干擾信號(hào),從而得到干凈的腦電信號(hào)。ICA 去偽跡時(shí)不需要專門記錄偽跡的參考電極,分解之后各分量相互獨(dú)立,偽跡去除的精度較高,已被廣泛應(yīng)用于腦電信號(hào)的預(yù)處理當(dāng)中,使用Matlab 的工具箱EEGLAB、Python 的工具包MNE 等都可以對腦電數(shù)據(jù)進(jìn)行獨(dú)立成分分析。
Bartels 等人將盲源分離和支持向量機(jī)相結(jié)合,提出了一種去除腦電信號(hào)中的眼電(EOG)和肌電(EMG)偽跡的預(yù)處理方法。結(jié)果表明,使用該方法預(yù)處理過的數(shù)據(jù)可以大大提高識(shí)別性能,進(jìn)而表明該預(yù)處理算法是有效的。Zhang 等人利用離散小波變換和獨(dú)立成分分析相結(jié)合來分離偽跡分量,提出了一種基于先驗(yàn)偽跡信息的數(shù)據(jù)預(yù)處理算法,通過情緒腦電數(shù)據(jù)進(jìn)行驗(yàn)證,結(jié)果表明采用提出的預(yù)處理方法進(jìn)行偽跡去除能在一定程度上提高情緒識(shí)別的準(zhǔn)確率。Yang 等人為了解決傳統(tǒng)方法去除眼電偽跡需要額外電極來記錄眼電信號(hào)的弊端,提出了一種基于深度學(xué)習(xí)網(wǎng)絡(luò)的眼電偽跡去除方法。該方法不需要額外附加電極,并且可以分析任意通道數(shù)量的EEG 數(shù)據(jù),具有很強(qiáng)的泛化能力,與經(jīng)典的去偽跡方法相比具有更好的處理效果。
利用腦電信號(hào)進(jìn)行情緒識(shí)別的主要步驟包括腦電信號(hào)采集、數(shù)據(jù)預(yù)處理、特征提取和分類識(shí)別,如圖4 所示。其中,特征提取分為傳統(tǒng)特征和腦網(wǎng)絡(luò)特征兩部分。
圖4 腦電情緒識(shí)別框架Fig.4 EEG emotion recognition framework
在基于EEG 的情緒識(shí)別研究過程中,特征提取主要是為了降低腦電數(shù)據(jù)的維數(shù)從而提取出與情緒相關(guān)的特征,用來對被試的情緒狀態(tài)進(jìn)行研究。作為情緒識(shí)別的關(guān)鍵環(huán)節(jié),特征的優(yōu)劣直接決定了情感識(shí)別模型的性能,提取表征性好、與情緒高度相關(guān)的特征對情緒識(shí)別來說至關(guān)重要。目前,常用的EEG 信號(hào)特征主要有四類:時(shí)域特征、頻域特征、時(shí)頻特征和非線性特征。
腦電信號(hào)的采集大多是以時(shí)域形式進(jìn)行的,因此時(shí)域特征是最直觀易得的。腦電信號(hào)的時(shí)域特征很早就被用來進(jìn)行腦電的相關(guān)研究,常用的腦電信號(hào)時(shí)域特征主要包括:幅值、方差、均值、均方根、過零點(diǎn)分析、方差分析、直方圖分析、峰值檢測、波形參數(shù)分析以及線性預(yù)測等。
Kashihara通過刺激被試獲取事件相關(guān)電位,將信號(hào)均值、標(biāo)準(zhǔn)差等統(tǒng)計(jì)特征作為EEG特征。Tripathi等人在DEAP 數(shù)據(jù)集上提取了EEG 信號(hào)的偏斜度和峰度等特征,分別使用深度神經(jīng)網(wǎng)絡(luò)(deep neural networks,DNN)和卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)在效價(jià)和喚醒兩個(gè)維度上進(jìn)行情感識(shí)別研究,取得了較好的分類識(shí)別效果。Zhang等人將對稱電極間的振幅差作為腦電特征,和面部表情等特征相結(jié)合進(jìn)行情緒識(shí)別。
時(shí)域分析表現(xiàn)的是腦電波形隨時(shí)間的變化情況,而頻域分析表現(xiàn)的是腦電波形隨頻率的變化情況。頻域分析的主要思想是將時(shí)域中的信號(hào)通過某種算法變換到頻域上,體現(xiàn)出信號(hào)隨頻率變化的特性,從而更直觀地觀察到EEG 中的各個(gè)節(jié)律的分布變化情況。頻域分析通常將EEG 信號(hào)分為delta 頻段(0~4 Hz)、theta 頻段(4~8 Hz)、alpha(8~13 Hz)、beta(13~25 Hz)和gamma 頻段(25~50 Hz)進(jìn)行特征提取。常用的EEG 頻域特征有功率、功率譜密度和能量等,這些特征的提取通常都建立在功率譜估計(jì)的基礎(chǔ)上。其特點(diǎn)是計(jì)算方便,對信號(hào)的適應(yīng)性強(qiáng),物理意義明顯。
傅里葉變換(Fourier transfer,F(xiàn)T)是一種線性的積分變換,通常被用來進(jìn)行腦電信號(hào)時(shí)域到頻域的轉(zhuǎn)換,連續(xù)時(shí)間信號(hào)()的傅里葉變換為:
離散時(shí)間序列(1),(2),…,()的傅里葉變換為:
一般通過上述時(shí)頻域轉(zhuǎn)換之后再分別提取功率、功率譜密度等頻域特征進(jìn)行情緒識(shí)別。
功率譜密度是最常用的腦電信號(hào)頻域特征,它定義為單位頻帶內(nèi)信號(hào)的功率大小,功率譜曲線橫坐標(biāo)是腦電頻率,縱坐標(biāo)是功率大小,表現(xiàn)的是腦電信號(hào)功率在不同頻段上的分布狀況。設(shè)()為離散時(shí)間序列(1),(2),…,(),則信號(hào)的功率譜密度可以定義為:
Zouridakis 等人采用帶通濾波得到delta(0~4 Hz)、theta(4~8 Hz)、alpha(8~13 Hz)、beta(13~25 Hz)和gamma(25~50 Hz)5 個(gè)頻段的腦電信號(hào),然后計(jì)算5 個(gè)頻段的功率譜密度作為腦電特征進(jìn)行情緒識(shí)別。Gadade 等人使用快速傅里葉變換將EEG 數(shù)據(jù)從時(shí)域轉(zhuǎn)換到頻域,然后使用帶通濾波得到theta、alpha、beta 和gamma 4 個(gè)頻段的腦電信號(hào),計(jì)算各個(gè)頻段功率特征,采用Relief-F 算法進(jìn)行特征選擇,在效價(jià)、喚醒、支配和喜歡4 個(gè)維度進(jìn)行情緒分類識(shí)別,平均準(zhǔn)確率均在85%~92%。Al-Nafjan 等人使用從EEG 中提取的功率譜密度特征與深度神經(jīng)網(wǎng)絡(luò)相結(jié)合,對情緒進(jìn)行分類。Li 等人使用短時(shí)傅里葉變化 進(jìn)行時(shí)頻轉(zhuǎn)換,分別計(jì)算了theta、alpha、beta 和gamma 波段的功率譜密度特征和面部表情特征,進(jìn)行融合,使用長短期記憶網(wǎng)絡(luò)進(jìn)行情緒識(shí)別,取得了較好的識(shí)別效果。
腦電信號(hào)是一種非平穩(wěn)信號(hào),通過頻域分析只能觀察到信號(hào)中有哪些頻率成分,無法獲知各個(gè)成分出現(xiàn)的時(shí)間。為了研究信號(hào)頻率隨時(shí)間的變化情況,時(shí)頻分析應(yīng)運(yùn)而生。所謂時(shí)頻分析,就是既考慮了信號(hào)的時(shí)域特征,又考慮信號(hào)的頻域特征,描述信號(hào)隨時(shí)間和頻率的變化情況,時(shí)頻分析可以更全面地反映出腦電信號(hào)的特征信息。時(shí)頻分析通常是劃分一定數(shù)目的時(shí)間窗,把整個(gè)時(shí)域信號(hào)分解成數(shù)個(gè)等長的小過程,每個(gè)小過程可以看作是平穩(wěn)的,然后對每個(gè)小過程的信號(hào)進(jìn)行時(shí)域到頻域的轉(zhuǎn)換,之后提取頻域特征,滑動(dòng)時(shí)間窗可處理不同時(shí)段,可以得到信號(hào)在各個(gè)時(shí)刻的瞬時(shí)頻率和幅值,從而可以估算某種情緒開始和持續(xù)的時(shí)間。常用的時(shí)頻分析方法有:短時(shí)傅里葉變換(short-time Fourier transform,STFT)、小波變換(wavelet transform,WT)、希爾伯特-黃變換(Hilbert-Huang transform,HHT)等。
短時(shí)傅里葉變換是Gabor 于1946 年提出的一種時(shí)頻分析方法,其實(shí)質(zhì)是加了窗函數(shù)的傅里葉變換,在對信號(hào)進(jìn)行傅里葉變換之前引入窗函數(shù),假定信號(hào)在短時(shí)間內(nèi)是平穩(wěn)的,窗函數(shù)隨著時(shí)間軸移動(dòng),把腦電信號(hào)分割成等長的時(shí)間單元,然后對每個(gè)信號(hào)單元進(jìn)行傅里葉變換:
之后求出各窗函數(shù)內(nèi)的頻域特征,就可以得到信號(hào)頻率隨時(shí)間的變化關(guān)系。對于短時(shí)傅里葉變換來說,選擇合適的時(shí)間窗長度至關(guān)重要,時(shí)間窗過窄的話,窗內(nèi)信號(hào)太少,會(huì)導(dǎo)致頻域分析不夠精準(zhǔn);時(shí)間窗太寬的話又會(huì)導(dǎo)致時(shí)間不夠精細(xì),時(shí)域分辨率降低。目前情緒識(shí)別研究中效果好的時(shí)間窗長度多為1~2 s。
小波變換是Morlet 于1982 年提出的另一種時(shí)頻分析方法,它繼承和發(fā)展了短時(shí)傅里葉變換局部化的思想,將短時(shí)傅里葉變換的時(shí)間窗函數(shù)變?yōu)榱丝梢噪S頻率改變的可變窗口,改進(jìn)了其時(shí)窗不可變的缺點(diǎn),小波變換計(jì)算方法:
其中,是縮放因子,當(dāng)||<1 時(shí),基小波被壓縮,對應(yīng)到高頻;反之,當(dāng)||>1 時(shí),對應(yīng)到低頻,是平移參數(shù),用來移動(dòng)基小波的位置,不同頻率的信號(hào)段,可用不同寬度的基小波時(shí)窗函數(shù)進(jìn)行約束,時(shí)頻域特征都能夠進(jìn)行準(zhǔn)確高效的分析。當(dāng)式中參數(shù)、取連續(xù)值時(shí),稱為連續(xù)小波變換,當(dāng)參數(shù)、取離散值時(shí),稱為離散小波變換。
小波變換的思想是在短時(shí)傅里葉變換的基礎(chǔ)上將時(shí)窗函數(shù)變?yōu)榱丝勺冮L度時(shí)窗截取變換,繼承了時(shí)頻分析的特點(diǎn),改進(jìn)了其時(shí)窗不可變的缺點(diǎn),時(shí)窗的變化可隨信號(hào)頻率改變。小波變換主要有兩種基本類型:連續(xù)小波變換(continuous wavelet transform,CWT)、離散小波變換(discrete wavelet transform,DWT)。
希爾伯特-黃變換是一種非線性的時(shí)頻特征提取方法,主要包括經(jīng)驗(yàn)?zāi)B(tài)分解(empirical mode decomposition,EMD)和希爾伯特譜分析(Hilbert spectrum analysis,HSA)兩部分。希爾伯特-黃變換處理非平穩(wěn)信號(hào)的過程:首先使用EMD 得到固有模態(tài)函數(shù)(intrinsic mode functions,IMF),IMF 是基于信號(hào)的時(shí)間尺度特征將其分解為有限個(gè)平穩(wěn)的單分量信號(hào)。假設(shè)通過個(gè)IMF 來表征EEG 信號(hào):
其中,()表示殘余函數(shù),殘余函數(shù)由任意信號(hào)()減去每一個(gè)IMF 分量得到。之后對IMF()進(jìn)行Hilbert變換:
上述幾種時(shí)頻分析方法各有優(yōu)缺點(diǎn),在進(jìn)行情緒識(shí)別的研究時(shí)可以根據(jù)實(shí)驗(yàn)需要,從多個(gè)角度出發(fā)選擇合適的時(shí)頻分析方法進(jìn)行時(shí)頻特征的提取。Murugappan 等人利用離散小波變換提取子頻帶能量、子頻帶能量所占比率和Alpha 頻帶小波系數(shù)均方根作為EEG 特征,進(jìn)行了高興、厭惡、恐懼、驚訝四情緒分類。Chen 等人基于重構(gòu)腦電信號(hào)源提取的時(shí)頻域情感特征分析方法,提高了分類識(shí)別準(zhǔn)確率。陳萌等人采用了經(jīng)驗(yàn)?zāi)B(tài)分解(EMD)的方法對腦電數(shù)據(jù)進(jìn)行時(shí)頻分析,提取了波動(dòng)指數(shù)作為特征進(jìn)行腦電信號(hào)和個(gè)人情緒狀態(tài)的關(guān)聯(lián)性分析研究。
腦電信號(hào)是產(chǎn)生于復(fù)雜大腦系統(tǒng)的一種非平穩(wěn)時(shí)變信號(hào),具有顯著的非線性和混沌性,線性分析方法會(huì)丟失很多腦電信號(hào)的原始信息,因此將非線性系統(tǒng)和復(fù)雜度分析應(yīng)用到腦電的分析方法應(yīng)運(yùn)而生。非線性分析方法主要是解釋大腦的動(dòng)力學(xué)特征和不同情緒狀態(tài)之間的關(guān)系,探索不同腦區(qū)在不同情感下的活動(dòng)變化,為采用腦電進(jìn)行情緒識(shí)別等相關(guān)研究提供可靠的技術(shù)支持。常用的腦電信號(hào)非線性特征包括各種類型的熵、相關(guān)維數(shù)、分形維數(shù)等。
Hosseini 等人提取腦電信號(hào)的近似熵、小波熵特征,利用支持向量機(jī)(support vector machine,SVM)進(jìn)行情緒識(shí)別,正確率達(dá)到了73.25%。Liu 等人通過提取腦電的分型維數(shù)等非線性特征進(jìn)行六種情緒分類,取得了不錯(cuò)的效果并搭建了實(shí)時(shí)應(yīng)用系統(tǒng),輔助治療疼痛、抑郁等癥狀。柳長源等人提取了腦電信號(hào)的頻帶能量、微分熵以及不對稱特征,使用遺傳算法優(yōu)化的支持向量機(jī)進(jìn)行情緒分類識(shí)別,結(jié)果表明和傳統(tǒng)的特征相比,不對稱熵特征的識(shí)別率有明顯提高,在DEAP 數(shù)據(jù)集上平均識(shí)別率為88.63%。
大腦是一個(gè)復(fù)雜的系統(tǒng),情緒活動(dòng)的過程大腦并非是一個(gè)腦區(qū)獨(dú)立工作的結(jié)果,而是由多個(gè)腦區(qū)信息交互共同完成的。傳統(tǒng)的基于時(shí)頻特征的情緒識(shí)別方法沒有考慮腦區(qū)之間的信息交互。近年來,為了找出和人的情緒狀態(tài)變化最為相關(guān)的腦區(qū),為腦電信號(hào)在情緒識(shí)別領(lǐng)域的研究和應(yīng)用提供理論基礎(chǔ),越來越多的研究者將復(fù)雜網(wǎng)絡(luò)理論應(yīng)用于腦電信號(hào)情緒識(shí)別研究中。
為了對基于腦網(wǎng)絡(luò)的情緒識(shí)別研究現(xiàn)狀進(jìn)行分析,通過關(guān)鍵詞Emotion Recognition、EEG Network、腦網(wǎng)絡(luò)、情緒識(shí)別,在Web of Science、谷歌學(xué)術(shù)以及中國知網(wǎng)等網(wǎng)站進(jìn)行檢索,篩選出17 篇基于腦網(wǎng)絡(luò)進(jìn)行情緒識(shí)別研究的文章,對文章采用的腦網(wǎng)絡(luò)構(gòu)建方法和度量指標(biāo)進(jìn)行統(tǒng)計(jì),結(jié)果如表2 所示。通過表2 可以發(fā)現(xiàn),相位鎖值(phase locking value,PLV)在面向情緒識(shí)別的腦網(wǎng)絡(luò)構(gòu)建中應(yīng)用較多。
表2 基于腦網(wǎng)絡(luò)的情緒識(shí)別研究Table 2 Research on brain network-based emotion recognition
腦網(wǎng)絡(luò)是借助復(fù)雜網(wǎng)絡(luò)理論將腦電信號(hào)抽象成物理中的網(wǎng)絡(luò),腦網(wǎng)絡(luò)構(gòu)建大致包括三個(gè)步驟:選擇網(wǎng)絡(luò)節(jié)點(diǎn)、節(jié)點(diǎn)之間連接邊的定義、選擇合適的閾值將連接矩陣轉(zhuǎn)二值化。一般選取采集數(shù)據(jù)的通道作為網(wǎng)絡(luò)節(jié)點(diǎn),然后選擇合適的功能連接方法得到功能連接矩陣。根據(jù)功能連接矩陣構(gòu)建方法的不同,腦網(wǎng)絡(luò)可以分為功能腦網(wǎng)絡(luò)和因效性腦網(wǎng)絡(luò)。
功能性腦網(wǎng)絡(luò),主要用來描述腦網(wǎng)絡(luò)中各個(gè)節(jié)點(diǎn)之間的連接關(guān)系,依賴模型本身,而不依賴時(shí)間,是一種相互之間的信息模式,是無向網(wǎng)絡(luò),如圖5(a)所示。因效性腦網(wǎng)絡(luò),本質(zhì)上是一種特殊的功能性腦網(wǎng)絡(luò),它在數(shù)據(jù)預(yù)處理和節(jié)點(diǎn)定義上都與功能性腦網(wǎng)絡(luò)相同,不同之處在于因效性腦網(wǎng)絡(luò)可以反映出不同腦區(qū)之間的信息流向,使功能性腦網(wǎng)絡(luò)的無向圖變成了有向圖,如圖5(b)所示。表3 列舉了常用的功能性腦網(wǎng)絡(luò)和因效性腦網(wǎng)絡(luò)構(gòu)建方法。
圖5 面向情緒識(shí)別的腦網(wǎng)絡(luò)分類Fig.5 Brain network classification for emotion recognition
表3 常用腦網(wǎng)絡(luò)構(gòu)建方法Table 3 Common brain network construction methods
(1)互相關(guān)
互相關(guān)函數(shù)表示兩時(shí)間序列之間的線性同步性,計(jì)算得到的是時(shí)域中兩通道之間的相關(guān)程度。預(yù)處理后的多通道腦電數(shù)據(jù)中任意兩通道腦電信號(hào)(),(),=1,2,…,之間的相關(guān)函數(shù)定義為:
(2)相位鎖值
相位同步分析可以將腦電信號(hào)中的相位成分與振幅成分分離開來,對腦電信號(hào)進(jìn)行精確分析,有利于挖掘腦電信號(hào)中隱含的重要信息。相位鎖值(PLV)是一個(gè)用于度量相位同步性的量化值,表示的是某一時(shí)間段內(nèi)的兩個(gè)信號(hào)之間的同步程度。PLV的定義如式(9)所示。
其中,Δφ()=Δφ()-Δφ()表示表示信號(hào)與信號(hào)在時(shí)刻的相位差,為該時(shí)間段內(nèi)的樣本點(diǎn)總數(shù)。PLV 的值域范圍為0~1,值越大代表兩個(gè)信號(hào)之間的同步性越強(qiáng),PLV 最小值為0,表示兩個(gè)信號(hào)完全不同步,PLV 最大值為1,表示兩個(gè)信號(hào)之間完全相位同步。
(3)互信息
互信息(mutual information,MI)是信息論中用來評價(jià)兩個(gè)隨機(jī)變量之間的依賴程度的一種常用的信息度量,代表的是一個(gè)隨機(jī)變量中包含的關(guān)于另一個(gè)隨機(jī)變量的信息量,在腦電情緒識(shí)別領(lǐng)域,MI 也被用來估計(jì)兩個(gè)電極中腦電信號(hào)之間的同步性大小。兩個(gè)隨機(jī)變量間的互信息可以定義為:
(4)相位滯后指數(shù)
相位滯后指數(shù)(phase lag index,PLI)是一種基于相位的功能連接分析方法,可以用來測量兩個(gè)通道信號(hào)之間的相位同步程度,適用于研究多通道腦電信號(hào)之間的功能連接。它的最大優(yōu)點(diǎn)是可以減少電極間容積傳導(dǎo)效應(yīng)帶來的影響,更多地關(guān)注信號(hào)之間的耦合關(guān)系。PLI鄰接矩陣的計(jì)算方法如下:
其中,表示時(shí)間點(diǎn),Δ(t)表示兩個(gè)信號(hào)在時(shí)間t處的相位差,sign 是一個(gè)符號(hào)函數(shù),當(dāng)自變量為正值時(shí)其輸出為1,當(dāng)自變量為負(fù)值時(shí)其輸出為-1,當(dāng)自變量為0 時(shí)其輸出為0。PLI 的值介于0 和1 之間,若PLI 的值為0,則相位差分布完全對稱,反之,則信號(hào)的相位始終滯后(超前)于信號(hào)。并且滯后越一致,相位差的分布越不對稱。
(5)格蘭杰因果關(guān)系
“因果”這一概念最先由經(jīng)濟(jì)學(xué)家Granger 于1969 年首次提出,文章認(rèn)為,如果用和現(xiàn)在的值預(yù)測的未來值比僅僅使用現(xiàn)在的值預(yù)測的未來值效果好,那么說明對的未來發(fā)展趨勢有影響,即是的格蘭杰原因。1982 年Geweke 將和之間的格蘭杰因果關(guān)系稱為反饋,文章認(rèn)為任意兩個(gè)時(shí)間序列之間要么相互獨(dú)立,要么存在反饋?zhàn)饔?。Friston 在大腦相關(guān)研究中引入格蘭杰因果關(guān)系,用來衡量腦區(qū)之間的因效連接,即假如腦區(qū)可以幫助預(yù)測腦區(qū)的未來,則認(rèn)為在某種程度上是腦區(qū)的原因。格蘭杰因果關(guān)系分析可以得到兩個(gè)時(shí)間序列之間是否存在因果聯(lián)系以及因果相對強(qiáng)度,定義如下:
假設(shè)有兩個(gè)時(shí)間序列()、(),定義()、()的自回歸模型為:
()、()的聯(lián)合回歸模型為:
(6)部分定向相干
部分定向相干(partial directed coherence,PDC)分析是在格蘭杰因果關(guān)系的基礎(chǔ)上發(fā)展出來的一種方法,可以對多通道腦電數(shù)據(jù)進(jìn)行建模,用來研究各腦電通道之間的相互聯(lián)系。PDC 是一種因效性腦網(wǎng)絡(luò)構(gòu)建方法,與傳統(tǒng)的功能連接方法不同的是,PDC是測量通道之間的因果影響,因此是具有方向性的。對于一個(gè)通道的EEG 信號(hào):
可以用一個(gè)多變量的自回歸模型MVAR 來描述:
對模型的稀疏矩陣()做變換可得:
其中,為回歸模型的階數(shù),為相應(yīng)的頻率。現(xiàn)定義:
則當(dāng)頻率為時(shí),通道對通道的PDC 值為:
在構(gòu)建好腦功能網(wǎng)絡(luò)之后,基于圖論對復(fù)雜網(wǎng)絡(luò)進(jìn)行分析,網(wǎng)絡(luò)中的基本元素有節(jié)點(diǎn)和邊,通常電極位置代表節(jié)點(diǎn),節(jié)點(diǎn)之間的邊代表著兩通道之間是否有信息交互。描述網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)以及網(wǎng)絡(luò)中不同的變化的常用屬性有:度、聚類系數(shù)、路徑長度、全局效率和局部效率等。
(1)聚類系數(shù)
聚類系數(shù)是用來量化網(wǎng)絡(luò)中節(jié)點(diǎn)間聚集程度的一種網(wǎng)絡(luò)屬性。節(jié)點(diǎn)的聚類系數(shù)C定義為該節(jié)點(diǎn)和鄰居節(jié)點(diǎn)間已有連接邊數(shù)和該節(jié)點(diǎn)可能連接的最大邊數(shù)的比值,如式(21)所示。
其中,E代表節(jié)點(diǎn)和鄰居節(jié)點(diǎn)間已有連接邊的數(shù)目;k表示節(jié)點(diǎn)的全部鄰接點(diǎn)數(shù)目;k(k-1)/2 表示k個(gè)相鄰節(jié)點(diǎn)之間可能存在的邊數(shù)。
(2)平均最短路徑長度
兩節(jié)點(diǎn)間的最短路徑長度是指從一個(gè)節(jié)點(diǎn)到另一節(jié)點(diǎn)所經(jīng)過的最小邊數(shù)。最短路徑長度描述網(wǎng)絡(luò)內(nèi)節(jié)點(diǎn)之間信息傳遞的性能,反映腦區(qū)間功能整合水平的高低,網(wǎng)絡(luò)的最短路徑長度越短,網(wǎng)絡(luò)節(jié)點(diǎn)間傳遞信息的速率就越快,則網(wǎng)絡(luò)全局效率越高,腦區(qū)的功能整合水平越高。平均最短路徑長度是指兩節(jié)點(diǎn)之間最短路徑長度的均值,平均最短路徑長度的定義如式(22)所示。
其中,d表示節(jié)點(diǎn)到節(jié)點(diǎn)之間的最短路徑長度。
(3)全局效率
全局效率定義為任意兩節(jié)點(diǎn)的最短路徑的調(diào)和平均值的倒數(shù),如式(23)所示。全局效率可以用來度量網(wǎng)絡(luò)的全局信息處理和傳輸能力以及網(wǎng)絡(luò)的整合程度,全局效率的降低說明腦區(qū)之間的信息傳輸和交互效率降低。
其中,d表示節(jié)點(diǎn)和節(jié)點(diǎn)之間的最短路徑長度。
(4)局部效率
局部效率反映的是網(wǎng)絡(luò)中節(jié)點(diǎn)間的分化程度,同時(shí)也代表著網(wǎng)絡(luò)的局部信息傳輸能力和網(wǎng)絡(luò)防御隨機(jī)攻擊的能力。節(jié)點(diǎn)的局部效率計(jì)算如式(24)所示。
其中,G表示節(jié)點(diǎn)的鄰居節(jié)點(diǎn)和節(jié)點(diǎn)間的連接邊所構(gòu)成的子圖,d表示從節(jié)點(diǎn)到節(jié)點(diǎn)所要經(jīng)過的最短路徑長度。
Costa 等人構(gòu)建了基于相位同步的靜態(tài)腦功能連接,用來研究不同情緒狀態(tài)下大腦區(qū)域之間的相互依賴模式,結(jié)果表明在高興狀態(tài)下額葉和枕葉間的相位同步明顯增強(qiáng),在悲傷狀態(tài)下所有腦區(qū)之間的相位同步現(xiàn)象明顯增強(qiáng)。Gonuguntla 等人通過相位鎖值構(gòu)建腦網(wǎng)絡(luò)進(jìn)行研究表明,相位同步分析可以識(shí)別和情緒相對應(yīng)的腦功能網(wǎng)絡(luò)模式和區(qū)域。Wang 等人通過構(gòu)建PLV 腦網(wǎng)絡(luò)將腦電數(shù)據(jù)時(shí)頻特征建模為圖數(shù)據(jù),采用圖卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行情緒識(shí)別,取得了較好的識(shí)別效果。Lee 等人使用相干性、相關(guān)性和相位同步三種方法構(gòu)建了靜態(tài)功能連接網(wǎng)絡(luò),利用不同情緒狀態(tài)下功能連接模式的差異性對積極、中性、消極三種情緒進(jìn)行分類,取得了79%的識(shí)別準(zhǔn)確率,結(jié)果表明不同情緒狀態(tài)下大腦的功能連接模式存在明顯區(qū)別,可以用來進(jìn)行情緒狀態(tài)的識(shí)別和預(yù)測。
分類識(shí)別是腦電情緒識(shí)別研究的重要一環(huán),主要任務(wù)是通過提取的各種類型的腦電特征來確定不同情緒狀態(tài)對應(yīng)的腦電模式,然后未經(jīng)訓(xùn)練的腦電信號(hào)特征進(jìn)行分類。雖然特征提取是決定情緒識(shí)別是否準(zhǔn)確的一個(gè)關(guān)鍵環(huán)節(jié),但是選擇一個(gè)好的分類識(shí)別方法對情緒識(shí)別來說也至關(guān)重要,可以在一定程度上提高準(zhǔn)確率。常用的EEG 情緒識(shí)別分類方法主要有無監(jiān)督學(xué)習(xí)、半監(jiān)督學(xué)習(xí)和有監(jiān)督學(xué)習(xí)。目前,常用的分類器有自組織映射(self-organizing map,SOM)、支持向量機(jī)(SVM)、近鄰(-nearest neighbor,NN)等。
自組織映射(SOM)是一種常用的無監(jiān)督學(xué)習(xí)方法,在對模型進(jìn)行訓(xùn)練時(shí),只需要輸入樣本數(shù)據(jù),不需要輸入樣本的標(biāo)簽信息,學(xué)習(xí)過程中通過對所有樣本內(nèi)在信息進(jìn)行挖掘,找到樣本間的關(guān)系,使得特性相近的樣本聚集在一起,而特性相異的樣本之間互相遠(yuǎn)離,最終實(shí)現(xiàn)樣本的分類。
Khosrowabadi 等人采用圖片作為刺激材料,采集了26 名被試在四種不同情緒刺激下的8 通道腦電信號(hào),由于各種原因的影響導(dǎo)致被試誘發(fā)出的情緒可能會(huì)與所期望的不同,采用自組織映射的無監(jiān)督學(xué)習(xí)方法來找到不同情緒間的邊界,對樣本進(jìn)行情緒類別的劃分,然后提取相應(yīng)的腦電特征,對平靜、高興、悲傷和恐懼四種情緒進(jìn)行分類,識(shí)別準(zhǔn)確率達(dá)到了84.5%。
支持向量機(jī)(SVM)是在腦電情緒分類中最常用的一種方法,它的核心思想是將在低維上不可分的數(shù)據(jù)集映射到高維空間上,找到使得不同類別樣本間的邊緣最大化的超平面,然后實(shí)現(xiàn)對低維空間上數(shù)據(jù)樣本的分類。SVM 中常見的核函數(shù)包括線性核函數(shù)、多項(xiàng)式核函數(shù)、高斯核函數(shù)等,核函數(shù)的選擇對于其性能的表現(xiàn)有至關(guān)重要的作用,通過控制核函數(shù)可以決定判決邊界的線性或非線性,線性核函數(shù)支持向量機(jī)的優(yōu)點(diǎn)是復(fù)雜度較低,速度快,非線性核函數(shù)支持向量機(jī)的優(yōu)點(diǎn)是在很多情況下能夠更好地?cái)M合出不同類別間的邊界。支持向量機(jī)是一種快速可靠的分類算法,可以在有限數(shù)據(jù)量的情況下很好地完成分類任務(wù),因此被廣泛應(yīng)用在腦電情緒識(shí)別研究當(dāng)中。
近鄰法(NN)的核心思想是在對某個(gè)測試樣本進(jìn)行分類時(shí),首先計(jì)算這個(gè)測試樣本和它周圍其他樣本間的歐氏距離,找出距離最近的個(gè)樣本,然后將此樣本歸類為這個(gè)樣本中出現(xiàn)次數(shù)最多的類別。近鄰法是一種相對簡單的非線性有監(jiān)督分類器,原理通俗易懂,廣泛應(yīng)用于擁有較大訓(xùn)練集的分類實(shí)驗(yàn)當(dāng)中。
Degirmenci 等人提出了一種基于經(jīng)驗(yàn)?zāi)B(tài)分解的EEG 情緒分類識(shí)別方法,提取腦電信號(hào)的功率譜密度特征,對比了支持向量機(jī)、線性判別分析、樸素貝葉斯分類器的識(shí)別效果,研究表明,SVM 分類器可以更好地區(qū)分情緒,是一種方便、高精度的情緒識(shí)別分類算法。Qing 等人在DEAP 數(shù)據(jù)集上提取腦電信號(hào)的一階、二階差分特征,在SEED 數(shù)據(jù)集上提取微分熵特征,選擇決策樹、近鄰和隨機(jī)森林作為分類器,進(jìn)行情緒分類研究。
近年來,隨著深度學(xué)習(xí)的快速發(fā)展,越來越多的學(xué)者將深度學(xué)習(xí)方法應(yīng)用于基于腦電信號(hào)的情緒識(shí)別研究當(dāng)中。在腦電情緒識(shí)別領(lǐng)域常用的深度學(xué)習(xí)方法包括卷積神經(jīng)網(wǎng)絡(luò)(CNN)、循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN)、深度信念網(wǎng)絡(luò)(deep belief network,DBN)等。上海交通大學(xué)的鄭偉龍等人引入DBN 構(gòu)建了對積極、中性、消極三種情緒的EEG情緒分類模型,結(jié)果表明,基于DBN 的腦電情緒識(shí)別可以獲得較高的分類精度,與積極、中性和消極情緒相關(guān)的神經(jīng)特征確實(shí)存在,并且它們在個(gè)體之間具有共性。Xing 等人將堆棧自動(dòng)編碼器和長短期記憶神經(jīng)網(wǎng)絡(luò)相結(jié)合,提出了一種新的情緒識(shí)別框架,在效價(jià)和喚醒度上分別取得了81.10%和74.38%的識(shí)別效果。Chen 等人提出了一種基于估計(jì)熵的深度信念網(wǎng)絡(luò)情緒識(shí)別框架,對高興、冷靜、悲傷和恐懼四種情緒的識(shí)別準(zhǔn)確率達(dá)到了83.34%。
深度神經(jīng)網(wǎng)絡(luò)能夠?qū)δX電信號(hào)的預(yù)處理、特征圖提取和分類進(jìn)行端到端的自動(dòng)學(xué)習(xí),基于深度學(xué)習(xí)算法的腦電情緒識(shí)別比人工設(shè)計(jì)的特征維度更高,識(shí)別用時(shí)更短。然而,在研究過程中,研究者們忽略了腦電信號(hào)和情緒產(chǎn)生之間的內(nèi)在關(guān)系,如何將傳統(tǒng)的腦電信號(hào)特征提取方式與深度學(xué)習(xí)算法相結(jié)合,探索新的情緒特征提取方式,提高特征提取和分類識(shí)別性能是以后在腦電情緒識(shí)別領(lǐng)域的重點(diǎn)研究方向。
腦電信號(hào)的非平穩(wěn)特性和個(gè)體差異限制了情緒識(shí)別模型在不同時(shí)間、不同受試者之間的泛化,為了解決該問題,研究者們提出了基于遷移學(xué)習(xí)的跨被試/實(shí)驗(yàn)時(shí)間的情緒識(shí)別分類研究。傳統(tǒng)的機(jī)器學(xué)習(xí)針對不同的域和任務(wù)分別訓(xùn)練模型。遷移學(xué)習(xí)中,不同的域和任務(wù)可共享知識(shí),從一個(gè)域/任務(wù)中獲取的信息,可用于另一個(gè)域/任務(wù)中的模式識(shí)別任務(wù)。李勁鵬為了解決EEG 情緒識(shí)別模型的跨被試適配問題,提出了一種多源遷移學(xué)習(xí)框架。選擇合適的源,在每個(gè)合適的源上,消減目標(biāo)和源的差異,使源上的分類器直接用于推斷目標(biāo)中樣本的情緒標(biāo)簽。在多分類器集成框架下,實(shí)現(xiàn)了對目標(biāo)域的高精度分類。蔡梓良等人為了解決跨被試、跨時(shí)間情緒分類的問題,提出了最大分類器差異域?qū)狗椒?,通過建立神經(jīng)網(wǎng)絡(luò)情感識(shí)別模型,將淺層特征提取器分別對抗域分類器和情感分類器,進(jìn)而使特征提取器產(chǎn)生域不變表達(dá),在實(shí)現(xiàn)近似聯(lián)合分布適配的同時(shí)訓(xùn)練分類器學(xué)習(xí)任務(wù)特異性的決策邊界,提高了情感腦機(jī)接口在實(shí)際應(yīng)用中的泛化能力,為情感腦機(jī)接口走向?qū)嶋H應(yīng)用提供了新的方法。
近年來,基于EEG 的情緒識(shí)別研究取得了一定的進(jìn)展,各種算法的性能也在不斷提升。但是,基于EEG 的情緒識(shí)別研究還遠(yuǎn)未結(jié)束,依照目前的發(fā)展現(xiàn)狀,目前該領(lǐng)域還有一些關(guān)鍵性的問題有待進(jìn)一步研究。
缺少權(quán)威且覆蓋面廣、數(shù)據(jù)量足夠大、公開可免費(fèi)獲取的數(shù)據(jù)集:面對相同的實(shí)驗(yàn)材料,不同個(gè)體對情緒的反應(yīng)強(qiáng)烈程度不同,因此得到的腦電信號(hào)通用性較差,導(dǎo)致可使用的訓(xùn)練數(shù)據(jù)有限。目前較為常用的數(shù)據(jù)集有DEAP 和SEED,兩個(gè)數(shù)據(jù)集的受試者人數(shù)較少,數(shù)據(jù)量較小且沒有覆蓋到各個(gè)年齡段和不同性格特征的人群;此外,還有很多研究者基于自己采集的腦電數(shù)據(jù)進(jìn)行研究,很難與其他研究者的成果進(jìn)行對比分析,不利于該領(lǐng)域的進(jìn)一步發(fā)展。因此建立一個(gè)權(quán)威的、覆蓋面廣、數(shù)據(jù)量足夠大、公開可免費(fèi)獲取的數(shù)據(jù)集對基于腦電信號(hào)的情緒識(shí)別研究非常重要。
最能反映情緒變化的電極尚未明確:目前,腦電情緒識(shí)別大多根據(jù)全通道的腦電信號(hào)進(jìn)行研究,全通道腦電信號(hào)的采集不便于后續(xù)便攜式設(shè)備的開發(fā),且全通道腦電信號(hào)中存在大量冗余信息,為后續(xù)計(jì)算增加了難度。隨著可穿戴技術(shù)的發(fā)展,使用可穿戴腦電設(shè)備進(jìn)行實(shí)時(shí)情緒識(shí)別應(yīng)用前景廣泛,因此采用通道選擇技術(shù)來減少電極數(shù)量是當(dāng)前研究熱點(diǎn)之一。目前,哪些電極與情緒狀態(tài)高度相關(guān)、最能反映情緒變化尚沒有普遍認(rèn)可的標(biāo)準(zhǔn)。
缺少統(tǒng)一的情感識(shí)別方法集成框架:近些年來,隨著神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)等技術(shù)的發(fā)展和應(yīng)用,基于EEG 的情緒識(shí)別研究方法也越來越豐富,許多新方法也取得了良好的效果。但是,要將基于EEG 的情緒識(shí)別技術(shù)應(yīng)用到實(shí)際生活中,還需要建立一個(gè)統(tǒng)一的綜合性方法框架,該框架應(yīng)具有良好的普適性,能夠屏蔽不同性格、不同年齡層次、不同性別、不同種族、不同地區(qū)用戶的差異。
情感產(chǎn)生機(jī)理有待深入研究:情緒是如何產(chǎn)生的,情緒產(chǎn)生和哪些腦區(qū)高度相關(guān),情緒產(chǎn)生過程中各腦區(qū)之間的連通性有什么變化,不同腦區(qū)之間如何協(xié)同工作,情緒轉(zhuǎn)換過程中腦功能網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)的動(dòng)態(tài)變化特點(diǎn),這些問題都有待進(jìn)一步研究,以揭示情緒產(chǎn)生過程中大腦的內(nèi)部機(jī)理。
綜上所述,情緒對人類的社交生活、行為調(diào)控、心理健康等各方面都有重要的影響,情緒識(shí)別研究具有十分重要的理論意義和應(yīng)用價(jià)值。隨著腦電采集技術(shù)和信號(hào)處理技術(shù)的不斷進(jìn)步,利用腦電信號(hào)進(jìn)行情緒識(shí)別的相關(guān)研究越來越多,并且已經(jīng)取得了一些被廣泛認(rèn)可的研究成果。在目前已有的研究成果之上,不斷優(yōu)化基于腦電信號(hào)的情緒識(shí)別方法,找到和情緒狀態(tài)高度相關(guān)的腦區(qū)和頻段,開發(fā)出可靠的非用戶依賴的可穿戴情緒識(shí)別設(shè)備,發(fā)揮出腦電情緒識(shí)別研究的應(yīng)用價(jià)值和社會(huì)效益是未來需要開展的重要工作。