黃 申,方 鵬,岳 敏,苗丹民,曹 爽
(火箭軍工程大學: 1政治系, 3作戰(zhàn)保障學院,陜西 西安 710025; 2空軍軍醫(yī)大學軍事醫(yī)學心理學系教學實驗中心,陜西 西安 710032; 4解放軍中部戰(zhàn)區(qū)空軍醫(yī)院心理科,山西 大同 037000)
抑郁障礙高危人群是指具有高抑郁易感人格特質(zhì)的人群[1]。既往研究指出,抑郁障礙高危人群在外界不良因素刺激下,更可能出現(xiàn)亞臨床的抑郁狀態(tài)甚至發(fā)展成抑郁障礙[2]。部隊作業(yè)環(huán)境具有高應激、高壓力等特殊性[3-5],因而早期準確地篩查出應征青年中的抑郁障礙高危人群,從源頭減少部隊抑郁障礙的發(fā)生率,對促進官兵心理健康具有重要的現(xiàn)實意義。
自陳式量表是目前精神障礙及高危人群的主流篩查工具[6-7]。但在自陳式量表廣為使用的同時,也因答題的主觀性而備受質(zhì)疑[8-10]。研究指出,在應聘等高風險情景下,被試在作答量表時普遍存在社會贊許性加工[11],這使得自陳式量表在實際應用場景下出現(xiàn)測量偏差。探索量表答題過程中更為客觀化的識別方法有望彌補這一缺陷,提高檢出效能。
視線追蹤技術(又稱眼動技術)可以精確、無干擾地記錄人眼視覺過程。眼動技術作為一項成熟的認知神經(jīng)檢測技術,反映了個體視覺追蹤、工作記憶、邏輯推理與計劃能力等多個方面[12-15]。本研究擬在抑郁障礙高危人群和正常人群作答自陳式量表的過程中,使用眼動技術探索抑郁障礙高危人群客觀化識別的可能性。
采用整群抽樣的方法,用“抑郁障礙高危人群特質(zhì)篩查量表”[7]對某軍校798名大一新生進行普測,選取量表得分高于均數(shù)兩個標準差以上且“抑郁自評量表”評分未達到抑郁障礙標準,經(jīng)精神科臨床醫(yī)生鑒定屬于抑郁障礙高危人群的37人組成抑郁障礙高危組,均為男性。剔除眼動采集實驗中注視點采集率低于75%的被試(4人),高危組實際人數(shù)為33人。
以未達到“抑郁障礙高危人群特質(zhì)篩查量表”均數(shù)兩個標準差以上的37人為健康對照組,均為男性。剔除眼動采集實驗中注視點采集率低于75%的被試(1人),健康對照組實際人數(shù)為36人。
所有被試年齡在18~25歲之間,均無其他類藥物的使用,且視力均經(jīng)過篩查,符合眼動實驗要求。本研究已通過空軍軍醫(yī)大學西京醫(yī)院臨床試驗倫理委員會審核(許可證號:KY20182047-F-1),所有被試均簽署了知情同意書,并被告知有隨時選擇退出的權利。
本研究使用“抑郁障礙高危人群特質(zhì)篩查量表”測試。該量表共計62題,分為悲觀消極、敏感退讓、興趣缺乏、缺乏自信、急躁憂慮以及心態(tài)脆弱6個維度。該量表的克朗巴哈系數(shù)為0.95,重測信度為0.82[7]。量表中所有題目均為“是”或“否”的迫選題,完成全部題目大約需要10 min。
1.2.1 試驗流程 在實驗開始前,將“抑郁障礙高危人群特質(zhì)篩查量表”的所有題目制作成統(tǒng)一的圖片格式,使用Tobii Pro Lab軟件完成實驗程序的編寫。為了保證研究過程中眼動測量的準確性,在實驗前調(diào)整被試與屏幕之間的相對位置,使被試在實驗中與監(jiān)視器保持65 cm的距離。使用托架固定頭部,使被試瞳孔位于屏幕的中央。
進入正式實驗后,被試首先在電腦屏幕前完成眼動儀的9點校準,在校準時,被試的視線要求追隨屏幕上的紅點,校準成功后開始呈現(xiàn)測試材料。被試的任務是根據(jù)量表的題目進行“是”或“否”的按鍵選擇,選擇完成后自動跳入下一題,直至完成全部量表。每道題目之間均會呈現(xiàn)500 ms的“+”號,以確保被試視線回歸屏幕中央。實驗流程見圖1。
圖1 “抑郁障礙高危人群特質(zhì)篩查量表”結合眼動研究的流程
被試在作答量表的過程中,使用Tobii Pro X30-120眼動儀記錄眼動數(shù)據(jù)。該眼動儀是Tobii公司最新研發(fā)的一款屏幕式眼動條,采樣頻率為120 Hz,即每8.3 ms采集一次視線坐標。
1.2.2 眼動特征提取 眼動數(shù)據(jù)分析的一個重要工作是對刺激材料劃分興趣區(qū)(area of interest,AOI)。本研究針對實驗材料的特點,將量表的每道題目劃分為3個興趣區(qū)。其中題干部分為興趣區(qū)a(AOI a),選項“是”部分為興趣區(qū)b(AOI b),選項“否”部分為興趣區(qū)c(AOI c)。
使用Microsoft Excel 2017及Tobii Pro Lab提取原始眼動數(shù)據(jù)并計算眼動特征。對每道題目的每個興趣區(qū)共提取了17種眼動指標,分別為:注視類指標,包括總注視時長、平均注視時長、注視點個數(shù)、總注視點時長、平均注視點時長及首次注視時長,反映被試對刺激材料的加工程度;眼跳類指標,包括眼跳個數(shù)、開始眼跳峰值速度、結束眼跳峰值速度,反映注視點的轉換;訪問類指標,包括總訪問時長、平均訪問時長、訪問次數(shù),反映更全面更細節(jié)的信息;掃視類指標,包括掃視總時長、平均掃視時長、最大掃視時長、最小掃視時長、掃視次數(shù)等,反映被試閱讀材料時的加工速度和效率。四類眼動指標從時間和空間的角度全面反映被試在作答量表時的認知過程。
1.2.3 數(shù)據(jù)處理 使用提取的眼動特征,用隨機森林算法構建反應傾向性分類模型,以預測被試的作答選項。隨機森林法是以決策樹為弱學習器構建的Bagging集成方法,并在訓練過程中增添了隨機屬性選擇,具有操作簡單、容易實現(xiàn)、計算便捷等特點[16]。使用反應傾向性模型輸出的作答選項,用支持向量機(support vector machine, SVM)算法構建人群分類模型,以預測被試是否為抑郁障礙高危人群。SVM是一種二類分類模型,其基本模型定義為特征空間上的間隔最大的線性分類器。該方法具有較好的“魯棒性”,適合用于小樣本數(shù)據(jù)的分類學習[17]。本研究使用的機器學習算法均由Matlab軟件實現(xiàn)。
本研究共選取了17種眼動特征。量表中每道題目均被劃分成3個AOI,故對于每道題目,共納入了51個眼動指標作為模型的輸入特征。使用隨機森林算法構建反應傾向性模型,以預測被試的作答選項??紤]到樣本集的規(guī)模有限,本研究采用分層交叉驗證的方法對模型進行評價,評價指標包括準確率、精確率、召回率和曲線下面積(area under curve,AUC)。準確率是對分類器在整體數(shù)據(jù)上的評價指標;精確率是對分類器在預測為陽性的數(shù)據(jù)上的評價指標;召回率是對分類器在整個陽性數(shù)據(jù)上的評價指標;AUC是受試者工作特征曲線(receiver operating characteristic curve,ROC)右下角的面積,AUC面積越大,表示分類器的性能越好。本量表共有62道題目,其中第36題只有一個“是”的樣本,其余皆為“否”,在對樣本進行訓練測試集劃分時,無法滿足每個測試集均包含兩類結果樣本的要求,故無法構建模型,其余61道題目使用眼動特征對被試作答選項的分類結果見表1。其中,最高分類準確率可達97.10%(第39題),最低分類準確率為55.07%(第46題),62道題目平均識別準確率可達80.47%。
表1 隨機森林模型的分層交叉驗證
將2.1中反應傾向性模型的輸出結果作為輸入特征,即使用眼動數(shù)據(jù)預測的被試作答選項作為輸入特征,使用SVM算法構建人群分類模型,進行人群的分類識別。由于第36道題目無法構建反應傾向性模型,故該道題目的輸入特征使用被試實際的作答選項。該模型對正常人群的識別率可達94.40%,對抑郁障礙高危人群的識別率可達81.80%,整體準確率可達88.40%。
作為世界上最重要的心理選拔手段之一[6-7],自陳式量表由于答題的主觀性遭受到了越來越多的質(zhì)疑[8-10]。本研究以自陳式量表為刺激,使用被試作答量表時的眼動數(shù)據(jù),通過機器學習算法初步實現(xiàn)了抑郁障礙高危人群的客觀化識別,彌補了傳統(tǒng)自陳式量表的不足。
本研究發(fā)現(xiàn),在使用眼動數(shù)據(jù)預測被試的作答選項時,量表中62道題目的分類準確率均高于基線準確率(基線準確率為50%)。同時,62道題目的平均分類準確率達到80.47%,遠高于基線準確率。這說明眼動數(shù)據(jù)可以較好地識別出被試的作答選項,這為抑郁障礙高危人群分類模型的建立奠定了基礎。此外,在人群分類模型中,研究發(fā)現(xiàn)該模型對抑郁障礙高危人群的識別準確率可達88.40%,這提示我們基于眼動的客觀化識別方法有望打破傳統(tǒng)量表僅依賴被試主觀報告的單一計分模式。
在既往類似研究中,普遍的做法是使用不同人群在量表作答整體維度的眼動數(shù)據(jù),構建人群分類機器學習模型[18-20]。雖然這樣的方法在數(shù)據(jù)結果上具有一定的效果,但也存在一些問題。首先,從理論上看,前人的思路分析是默認人群間的眼動具有差異性模式,但從量表作答的過程來看,應是從每個條目的響應過程出發(fā)進行眼動分析。其次,前人的研究雖然采用了客觀化行為,但在對客觀化行為進行數(shù)據(jù)分析時并沒有與量表本身的計分方式進行很好的融合,這使得量表僅僅成為了采集客觀化行為的刺激材料,而無法對數(shù)據(jù)結果賦予更多的心理學解釋。
與既往研究相比,眼動數(shù)據(jù)在該方法中沒有直接用于人群區(qū)分,而是用于構建題目的反應傾向性分類模型,這使得該技術更加符合量表答題的理論邏輯,并有望解決傳統(tǒng)自陳式量表因作答動機、社會贊許性等產(chǎn)生的反應偏差問題。此外,在人群分類模型中,該技術考慮到了所有條目的眼動數(shù)據(jù)輸出結果,而非整體上的平均值,這使得眼動數(shù)據(jù)與量表的計分方法進行了初步融合,改變了以往靠量表作答計分的傳統(tǒng)判別方式。根據(jù)本研究的結果,我們認為下一步研究中可以納入更多的認知神經(jīng)科學技術,同步采集被試作答過程的客觀化數(shù)據(jù),并使用這些數(shù)據(jù)從單個條目出發(fā),構建量表題目的分類識別器,而不是直接將客觀化數(shù)據(jù)進行人群分類。
需要說明的是,既往類似研究中使用的被試大多是精神障礙人群,本研究中的抑郁高危人群本質(zhì)上不歸屬于精神障礙,因此實驗結論能否推廣至精神障礙人群中還需要進一步的實驗支持。此外,本研究選取的被試均為男性,且樣本量相對較小,因此機器學習構建的模型在實際應用中可能存在一定的誤差,尚需更大的樣本量對結論的可靠性加以驗證。