毛小玲,向 往,歐陽明昆,謝揚球
(1.廣西民族大學大學生心理健康教育中心,廣西南寧 530006;2.廣西民族大學教育科學學院,廣西南寧 530006;3.廣西大學資源環(huán)境與材料學院,廣西南寧 530004)
焦慮是一種常見的負性情緒,對人們的認知水平、動作執(zhí)行、身心健康等都存在不同程度的影響[1-3]。準確地識別和診斷出大學生的焦慮情緒,對于針對性地開展心理治療和危機干預,預防其發(fā)展成焦慮障礙或焦慮神經癥具有重要的實踐價值。當前,國內外對焦慮情緒的識別與診斷,主要采用問卷調查[2]、臨床訪談[3]等主觀測評方法。但是,由于受到各類主觀條件(如回答的真實性與被誘導性、診斷者業(yè)務水平)的限制,識別與診斷效果并不理想。
近年來,基于腦電(Electroencephalograph,EEG)信號的焦慮情緒識別與診斷方法受到越來越多的重視。EEG焦慮情緒識別過程一般分為4個步驟[4,5]:EEG采集、濾波與預處理、特征信息提取、模式分類。其中,EEG的特征提取方法主要包括統(tǒng)計特征法、時域法、頻域方法、時頻域法、非線性動力學分析法等[6,7],而對應的模式分類方法主要有支持向量機、K均值聚類法、決策樹等[8]。但是,傳統(tǒng)方法在很大程度上依賴于手動或固定的提取特征方式,往往會忽略一些有用信息,造成分類準確度難以提高。為了克服上述缺點,能夠自動挖掘和抽取特征信息的深度學習方法被越來越多地應用于EEG情緒識別領域[9-11]。Zheng等[9]采用微分熵與深度信念網(wǎng)絡(Deep Belief Network,DBN)相結合的深度學習模型;Alhagry等[10]采用長短期記憶網(wǎng)絡(Long Short-Term Memory,LSTM)構建出一種端到端的神經網(wǎng)絡,有效提高了分類準確率,但模型運算速度較差;針對于此,Liu等[11]進一步考慮了特征表示能力,構建了一種多層特征導引膠囊網(wǎng)絡(Multi-Level Features Guided Capsule Network,MLF-GCN),有效加快了運算速度。總體上看,上述方法的檢測準確性依然有待提高。
近幾年來,卷積神經網(wǎng)絡(Convolutional Neural Networks,CNN)能夠自動學習輸入樣本的特征信息,不需要手動設計,還具有局部連接和權值共享等優(yōu)點,有利于加快學習速度并避免過度擬合,適應性和泛化能力更強[12-14]。因此,CNN模型及其改進方案被越來越多地應用于EEG焦慮情緒識別領域。Gao等[15]采用梯度粒子群優(yōu)化(Gradient-Priority Particle Swarm Optimization,GPSO)算法來執(zhí)行CNN的權值優(yōu)化,Li等[16]采用分層卷積神經網(wǎng)絡(Hierarchical Convolutional Neural Networks,HCNN)來進行EEG情緒識別,獲得了良好的分類效果。但上述EEG焦慮情緒識別方法基本上屬于定性分類,側重于判斷被試對象是否存在焦慮情緒或焦慮等級,而對于焦慮癥狀的嚴重程度、未來產生焦慮情緒的概率等定量化問題,國內外仍缺乏相關的文獻報道。
由于焦慮情緒識別的EEG信號不僅非常復雜,還具有數(shù)據(jù)量大、特征信息繁雜等特點,本研究將對卷積神經網(wǎng)絡這類具有深層結構的深度學習方法進行改進,使其能夠應用于大學生焦慮情緒定量化識別問題的研究,在確保焦慮情緒診斷準確率的基礎上,解決相關的內在病理因素分析與追溯、類別不平衡等問題,為后續(xù)臨床心理治療和心理危機干預提供更詳細可靠的診斷依據(jù)。
采集所得的EEG信號通常是一類微弱的、強時變的非平穩(wěn)非線性信號,而且還會受到強烈的外部擾動,基本上都存在“信號淹沒”現(xiàn)象[17]。因此,必須先經過嚴格的預處理和濾波,才能應用于后續(xù)的建模和特征提取。同時,大約只有1/4的高校大學生會出現(xiàn)不同程度的焦慮情緒,即被試樣本集存在一定程度的“類別不平衡”問題[18,19]。上述的兩個困難對基于EEG信號的大學生焦慮診斷問題帶來了很大的挑戰(zhàn)。針對于此,本研究采用的技術路線如下:首先,對所采集的EEG信號進行多級混合濾波,獲得可用于深度學習模型的有效EEG信號;其次,提出并構建一個基于“擴展信息輸入空間[20,21]”的神經網(wǎng)絡(Neural Network Based on Extended Information Input Space,NN-EIIS)模型,取代末端的Softmax分類器,將傳統(tǒng)CNN模型改進為一種具備定量逼近學習能力的卷積神經網(wǎng)絡(Convolutional Neural Networks with Quantitative Approximation Learning,CNN-QAL);再次,引入具有獨立性的焦慮量表得分(Score of Anxiety Scale,SAS)作為大學生焦慮情緒量化的標準,并應用于CNN-QAL模型訓練的樣本輸出,獲得對應的建模結果和定量分析結果;最后,根據(jù)所構建的CNN-QAL模型和定量分析結果,初步探討和追溯內在病理因素(圖1)。
圖1 技術路線Fig.1 Technical route
由于采集的EEG信號是一種復雜的非平穩(wěn)非線性信號,而且有效的EEG信號往往淹沒在心電、眼電等信號之中[4,17],導致常規(guī)的、單一的濾波和數(shù)據(jù)預處理算法不再適用于EEG信號的濾波和預處理過程。本研究設計了一種基于獨立分量分析(Independent Component Analysis,ICA)的多級混合濾波策略,具體處理過程如下:
①前處理階段。采用MATLAB的EEGlab模塊,依次進行電極定位、重參考設置。
②帶通濾波。采用Bessel帶通濾波器進行濾波,其中,濾波頻帶設置為[0.5,45],能夠完全覆蓋影響焦慮特征信息的分布頻帶(1-40 Hz)。
③ICA濾波。運用ICA算法[22]對上述EEG信號進行盲源分離。對比已知擾動噪聲(如眨眼、心電信號、電極移動、頭部肌肉抖動等)的時頻特性,并參考文獻[2,4,7]的處理方法,將各種干擾噪聲濾除,再將信號恢復重構,得到只包含有效信息的EEG信號。
卷積神經網(wǎng)絡作為一種最受歡迎的深度學習算法,被廣泛應用于圖像處理等領域[23,24],通過多層卷積和池化處理來自動提取輸入信號的各種特征,再通過末端的全連接層和分類器來獲得預期的分類結果。然而,對于焦慮情緒診斷與治療問題來說,僅僅判斷患者是否存在焦慮情緒或者進行簡單的分類,對后期的臨床心理治療或心理危機干預遠遠不夠,實際心理診療過程更需要進行精確的定量分析,以及對病理因素進行合理的追溯分析。鑒于此,本研究對現(xiàn)有CNN模型進行改進,提出一種具備定量逼近學習能力的改進卷積神經網(wǎng)絡。經典CNN模型的總體模型表達式如下[13,14]:
y*=Tanh(FC(Flat(Pool(Re(Conv(x)))))) 。
(1)
由圖2可知,常規(guī)CNN模型通常由兩部分組成:前端進行特征自動提取和處理,主要包括一個輸入層、若干個“卷積-池化”層,相關的網(wǎng)絡結構設置、正向輸出、反向權值調整等算法已經比較完善[13,14],可以直接應用于基于EEG的大學生焦慮情緒識別過程;而末端負責模式分類,主要包括全連接層和輸出層,一般只能進行二分類(如判斷焦慮情緒“存在”或“不存在”)或有限的等級分類(如判斷焦慮情緒程度“低”“中”“高”),這無法滿足實際心理診療的要求。因此,本研究構造一個基于“擴展信息輸入空間”的神經網(wǎng)絡模型[21,25](圖3)。
圖2 經典CNN模型的組成結構示意圖Fig.2 Schematic diagram of the composition structure of the classic CNN model
圖3中Im×1,Ψm×1和On×1分別表示前端“卷積-池化”部分所自動提取的特征信息、所提取的特征經過預處理或演化后的信息、與輸出相關的演化信息,這3類信息共同構成了NN-EIIS模型的“擴展信息輸入空間”,可以更充分、完整地描述EEG與大學生焦慮情感之間的函數(shù)映射關系。m和n分別表示相應的信息演化處理次數(shù);o(k)是模型的輸出空間,結合實際心理診療的要求,本研究選擇被試對象的焦慮量表得分作為模型輸出;Vi(i=1,…,4)為權值向量,H表示隱藏層。如果拓展后的信息輸入空間[I,Ψ,O]具有完備性,NN-EIIS模型就能夠通過網(wǎng)絡訓練來無限逼近系統(tǒng)輸出[20],從而實現(xiàn)高精度的EEG焦慮情緒定量識別。
圖3 基于“擴展信息輸入空間”的神經網(wǎng)絡模型結構示意圖Fig.3 Schematic diagram of neural network structure based on extended information input space
為了獲得更好的建模效果和提高建模精度,H1的激活函數(shù)σ1(·)選擇為雙曲正切函數(shù),而H2的激活函數(shù)σ2(·)則采用線性函數(shù),于是,所構建NN-EIIS模型的正向輸出為
(2)
式中,θi(i=1,…,3)是閥值偏置。
借鑒BP神經網(wǎng)絡的推導方法,獲得相應的反向權值調整算法,若定義代價函數(shù)E和參數(shù)ξ分別為
(3)
(4)
式(3)和式(4)中,op(k)是與EEG信號完全獨立的被試對象焦慮量表得分(SAS),L為數(shù)據(jù)長度,則有
(5)
(6)
(7)
(8)
(9)
(10)
(11)
為了提高收斂速度和魯棒性,本研究采用基于Levenberg-Marquarqt算法[20,21]的批量訓練算法,即
M(l+1)=M(l)[JT(l)·J(l)+μ·I]-1·JT(l)·e(l),
(12)
(13)
為了驗證所提出方案的有效性,在某高校隨機抽取25名在校大學生進行EEG測試實驗。根據(jù)該高校大學生心理健康綜合測量過程中焦慮量表得分(SAS)情況可知,在所抽取的大學生中,需要心理干預和診療的人數(shù)(SAS>50)占比為24%,即不平衡度[19]IR=(1-24%)/24%=3.17,這與該高校的整體測量結果基本相符,存在“類別不平衡”問題。實驗過程中,EEG數(shù)據(jù)采用Neuroscan公司的64導腦電設備及配套軟件采集,設計不同顏色和不同朝向的Gapor patchs圖片為刺激,采集通道為64個,采集頻率為1 kHz,采集時間為10 min,即每位大學生的EEG數(shù)據(jù)長度為3.84×107個,具體的實驗過程參見文獻[26]的實驗7。
值得注意的是,文獻[26]是本課題組成員利用所采集的EEG數(shù)據(jù)來研究大學生在日常學習知識過程中的內隱覺察這一類心理認知問題,而視覺盲區(qū)實驗是通過視覺來學習和接受新知識,不僅伴隨著豐富的大腦活動信號,還包含著學習者的各種情緒變化狀況[4]。此外,與章文佩等[1]采用考試過程的EEG信息來研究焦慮診斷問題相比,本研究采用視覺學習的EEG信號來診斷大學生的焦慮情緒,其準確性更高,主要原因是大學生們在考試過程中普遍會存在習得的緊張和焦慮情緒,而日常學習則更接近學生的實際情緒狀態(tài)[3]。
按照圖1的技術路線進行EEG焦慮情緒識別的建模與泛化檢驗。為了確保所提出的CNN-QAL模型具有足夠的學習能力和建模精度,卷積-池化層的數(shù)量選擇為3層,且卷積核的個數(shù)分別為16,32,64;設置卷積層和池化層的步長為1和2,而作用范圍為5和2。對于新構建的末端NN-EIIS模型,其模型結構設置為m=4 096,n=3,H11=512,H12=8,H2=64。實際中,步長因子μ的初值設置為0.000 1,CNN-QAL模型經過100次迭代后的訓練及泛化結果如圖4所示。為了更好地描述實驗結果,對被試對象的序號按照其原始SAS從高到低重新排序,模型泛化的EEG數(shù)據(jù)同樣來源于本課題組所采集的數(shù)據(jù),即文獻[26]的實驗6,除了更換被試大學生和刺激所用的Gapor patchs圖片以外,參數(shù)設置與建模實驗都是相同的(圖4)。
從圖4可知,訓練所得到的CNN-QAL模型可以精確地逼近焦慮得分,其中,訓練過程的相對誤差在±2%以內,而泛化檢驗的相對誤差在±5%以內。可見,即使被試樣本集的不平衡度IR達到了3.17,CNN-QAL模型仍然能夠精確地建模。由圖4(b)可知,CNN-QAL模型的泛化準確率為96%,只有第7個樣本的泛化檢驗結果發(fā)生了偏差,該學生的SAS為49分,一般認為其不存在焦慮情緒;但CNN-QAL模型的泛化輸出為51.24分,誤將其識別為焦慮狀態(tài)(>50分)。
圖4 模型訓練及泛化結果Fig.4 Model training and generalization results
為進一步驗證CNN-QAL模型的有效性,分別進行了兩個方面的對比實驗:與同類方法的橫向對比實驗、確定自身模型結構的內部分析優(yōu)化實驗。
①橫向對比實驗。由于傳統(tǒng)EEG分類方法的準確率較低,如Power Spectral Density+Support Vector Machine(PSD+SVM)約為73.4%[15],本研究僅與現(xiàn)有的深度學習方法比較,結果如表1所示。
表1 本研究方法與現(xiàn)有方法的比較Table 1 Comparison between this research method and the existing
從表1可知,CNN-QAL模型的準確率最高,主要原因是末端引入了具有連續(xù)逼近功能的NN-EIIS模型,識別精度比離散化的有限分類方法更具優(yōu)勢。但是,所有的識別算法在SAS臨界狀態(tài)更容易發(fā)生偏差,尤其是最接近50分的第7號被試大學生,誤診率最高??梢?,對于SAS為臨界狀態(tài)的大學生,實際臨床診斷還需要借助其他手段如訪談法[3]等進行識別,或將其列入“輕度焦慮”的范疇,通過增加心理咨詢次數(shù)或服用抗焦慮的藥物進行后續(xù)治療。進一步分析可知,對于不具有連續(xù)量化識別的傳統(tǒng)EEG焦慮情緒識別方法來說,本身沒有焦慮情緒(如第8,9號)而被誤診的概率更大,這主要是由“類別不平衡”問題引起的,離散化的有限分類過程往往會向高概率一側收斂[19],更易于產生誤判,而采用本研究的量化識別方案可以有效解決這類問題。
②內部分析優(yōu)化實驗。為了優(yōu)化CNN-QAL模型結構,權衡網(wǎng)絡結構、逼近精度、訓練收斂速度之間的關系是一個重要的課題。實際研究過程中,對于CNN的前端特征提取部分,選擇不同的網(wǎng)絡結構進行對比分析,相關的網(wǎng)絡訓練收斂過程如圖5所示。
圖5 不同網(wǎng)絡結構的訓練收斂過程Fig.5 Training convergence process of different network structures
從圖5可知,采用2層“卷積-池化”(卷積核個數(shù)分別為64,128,即曲線1)的訓練精度較差且收斂速度很慢,MSE收斂曲線在訓練過程中有較大波動(第60-65次)。另外3條曲線都采用了3層“卷積-池化”結構,只是卷積核個數(shù)有區(qū)別,其中,曲線2的收斂速度較慢,在第90次附近才基本進入穩(wěn)態(tài);曲線3和曲線4的收斂速度相差不大,在第20次附近完成第一階段的快速收斂,在第70次附近完成第二階段收斂而進入穩(wěn)態(tài),但曲線4的卷積核數(shù)量比曲線3多一倍??梢姡€3所對應網(wǎng)絡結構的效果最佳。
在實際心理臨床治療過程中,除了需要精確診斷出大學生是否存在焦慮情緒及其嚴重程度之外,還需要找準和判別每個大學生具體的病理因素,才能真正做到對癥治療。借助于心理醫(yī)生的經驗積累等,傳統(tǒng)的訪談類診斷方式一般更具優(yōu)勢[3],這是目前各種EEG情緒診斷方法難以進行推廣應用的主要阻礙。
本研究借鑒已有研究成果[20,21],將病理因素當作建模過程中的一類中間狀態(tài),通過引入NN-EIIS模型,不僅解決EEG信號大學生焦慮情緒的精確量化識別問題,還能在一定程度上進行病理追溯分析。實際上,如果NN-EIIS模型的拓展輸入空間[I,Ψ,O]具有完備性,不僅系統(tǒng)輸出能被精確建模,而且中間狀態(tài)(病理因素)也可以被精確逼近[20];在辨識所得的NN-EIIS模型中,如果把輸入空間的特征信息與模型輸出之間的權值傳遞鏈進行排序,找出主要的EEG特征信息并在時頻域內進行盲源分離[27],就能夠追溯這些EEG信號在大腦中的來源位置并獲得對應的時頻特征,實現(xiàn)對相關病理因素的追溯分析。以焦慮情緒最嚴重的第1號大學生患者為例,導致焦慮的EEG信號分布情況和對應的時頻特征如圖6所示。
圖6 影響最大的內在因素的時頻特征Fig.6 Time-frequency characteristics of the most influential internal factors
結合腦電極布置[26]和圖6可知,導致焦慮情緒產生的EEG信號,主要來源于以F5-FC5和F6-FC6為中心的大腦區(qū)域內,屬于人腦的左、右海馬體部分。海馬體負責記憶和學習,正常人會在有限次重復后,將一個短期記憶片段(如本實驗的9個Gapor patchs子圖片)轉化為長期記憶,即海馬體會將其轉存入大腦皮層[28];如果在短期內再次出現(xiàn)這個記憶片段,對應的EEG信號將出現(xiàn)在大腦皮層而不是海馬體。但是,從圖6的時頻圖可以看出,第1號焦慮情緒障礙患者的海馬體均勻分布著強烈的EEG信號,這說明障礙者存在學習記憶障礙,無法將短期記憶片段正常地轉化為長期記憶。
現(xiàn)有腦科學研究表明,海馬體的長時間持續(xù)興奮是導致緊張焦慮情緒的主要生理學原因,嚴重時將導致大腦出現(xiàn)一定程度的疼痛現(xiàn)象,這也與該大學生在實驗過程中的表現(xiàn)和實驗后的描述吻合??梢姡瑧帽狙芯克岢龅姆桨缚蓪⒃摯髮W生患者的病理因素初步追溯診斷為學習記憶障礙,至少是對具有快速變化且復雜的圖像類知識點(如2.1節(jié)所述的Gapor patchs圖片)進行學習的過程中,存在一定的記憶障礙。這類目前難以進行醫(yī)學檢測但卻具有事實依據(jù)的、客觀的病理追溯性診斷結論,對后期相關的心理治療和心理危機干預是很有價值的。
針對現(xiàn)有EEG焦慮情感識別中存在的問題,本研究設計了一個CNN-QAL模型。通過在CNN模型末端引入并構造一個NN-EIIS模型來取代傳統(tǒng)的分類器,并以被試對象的焦慮量表得分(SAS)作為整個系統(tǒng)的輸出信號,使得CNN-QAL模型具備高精度定量逼近學習能力,有效解決了識別過程中“類別不平衡”的問題。并在此基礎上結合現(xiàn)有的腦科學研究成果運用所獲得的CNN-QAL模型,對具體大學生患者的特定病理因素進行了初步的追溯分析和探索,這對后續(xù)研究和實際的心理危機干預以及心理臨床治療具有有效的理論和實際價值,這將是下一步的研究方向。