高廣銀, 劉 姜, 丁 勇
(1.南京理工大學 泰州科技學院 計算機科學與技術系,泰州 225300;2.上海理工大學 管理學院,上海 200093)
大學校園里因心理問題引發(fā)的心理危機事件呈上升趨勢,各種從壓力、抑郁到自傷、他傷等失控行為并不鮮見.專家學者積極研究大學生心理健康教育,分析影響心理健康的因素,并提出了從學生心理委員到學校心理咨詢中心層層報送的高校心理危機監(jiān)控報送體系[1],及以建設校園文化、確立價值觀導向為核心的心理危機干預機制[2],這促進了人們對心理危機問題的關注和思考.然而,這些研究大都停留在心理健康教育的層面,缺乏有效的手段預知大學生是否產(chǎn)生了心理危機.人的心理活動極其復雜,其變化過程也不可見,通過心理危機預測能夠盡早地發(fā)現(xiàn)問題,及時采取干預措施,有效避免心理危機形成、惡化帶來的后果.
隱 馬 爾 科 夫 模 型(hidden Markov model,HMM)[3]作為一種統(tǒng)計分析模型,創(chuàng)立于20世紀70年代,80年代得到了傳播和發(fā)展,并應用于語音人工合成、圖像處理、模式識別及生物信號處理等領域[4].近年來,該模型被應用于金融市場的波動性分析、經(jīng)濟預算、網(wǎng)絡安全[5]、人的行為分析[6]等諸多領域,從而被證明對于解決一類問題,即系統(tǒng)中表層可見事件可能由低層隱藏狀態(tài)引發(fā),具有重要意義.
本文將隱馬爾科夫模型應用于高校學生心理危機的預測,在分析影響大學生心理健康因素的基礎上,利用Vague集理論[7]建立核心因素集,由此確定可觀察序列集,建立隱馬爾科夫模型,對模型參數(shù)進行訓練,并將訓練后的模型應用于心理危機預測.實例分析結果表明基于該模型預測大學生心理危機是可行的.
在大學生心理健康教育研究中,不同的學者由于研究工具和研究對象的不同而得出了許多不同的結論.針對綜合性大學新生的心理調(diào)查發(fā)現(xiàn),大學新生的主要心理問題是學習壓力大、人格缺陷和人際交往障礙[8].基于高職學生的研究表明,導致心理壓力因素主要是學習、就業(yè)和情感等[9].這些研究成果都從不同層面指出了影響大學生心理健康的因素,但是關于這些因素對心理危機產(chǎn)生的影響程度并未闡明.本文首先在已有研究成果的基礎上,結合某獨立學院的實際情況,通過與學院心理輔導教師和輔導員的訪談,概括影響大學生心理健康有4大因素共19項指標:家庭因素(氛圍、父母教養(yǎng)方式、經(jīng)濟條件、重大變故)、社會因素(價值多元化、擴招學費高、競爭就業(yè)難)、學校因素(學習壓力、教育方式、管理制度、設施條件、教工素質(zhì))及個人因素(認知方式、應對方式、歸因方式、自我定位、人際關系、社會認同、生理疾病);其次基于Vague集對這些因素約簡得出影響心理危機產(chǎn)生的核心因素[10].
根據(jù)上述分析的19項指標,可以建立大學生心理健康影響因素的完備集D={a1,a2,…,am},其中m =19.然而這些因素對于心理危機的形成作用不等,只有那些起關鍵作用的因素對于開展心理危機預測有意義,即核心因素.
首先,組建能夠代表心理健康教育各層面的專家組,組員有市教育局心理咨詢師、高校心理學專業(yè)教師、輔導員、其他心理健康教育工作者及家長代表共n 名,并請這n 位專家,對m個因素的重要性表態(tài),分重要、不重要和不好判斷,并分別記為1,-1和0.其次,匯總專家意見,確定每個因素的重要程度,并用Vague集表示[11].
從而,因素完備集D 到核心因素集C 的關系R(D→C)可以定義為一Vague 集關系.每一指標ai(i=1,2,…,m)的 重 要 程 度 可 以 表 示 為(t(ai),1-f(ai)).其中,t(ai)表示指標ai對大學生心理危機產(chǎn)生重要影響的成分;f(ai)表示指標ai不對大學生心理危機產(chǎn)生重要影響的成分.t(ai)及f(ai)定義如下:
最后,計算核函數(shù)H(ai),并給出重要性標準α(0<α<1),當H(ai)≥α 時,ai入選核心因素集C.核函數(shù)H(ai)可以解釋為因素ai對心理危機產(chǎn)生重要影響的重要程度,其定義為
根據(jù)經(jīng)驗,取α=0.3,并用H(ai)≥α 作為判斷準則,從19個因素中篩選出5個核心因素,得到核心因素集C={父母教養(yǎng)方式、重大變故、競爭就業(yè)難、教工素質(zhì)、人際關系},如表1所示(見下頁).
表1 專家評分表Tab.1 Expert score table
隱馬爾科夫模型是一種用參數(shù)表示的用于描述隨機過程統(tǒng)計特性的概率模型,是一個雙重隨機過程.它由馬爾科夫鏈和一般隨機過程兩部分組成,其中馬爾科夫鏈用轉(zhuǎn)移概率矩陣描述狀態(tài)的轉(zhuǎn)移,而一般隨機過程則用觀察概率矩陣描述狀態(tài)與觀察序列間的關系[12].HMM 定義如下:
a.X 表 示 一 組 狀 態(tài) 集 合,X ={S1,S2,…,SN},狀態(tài)數(shù)為N,并用qt表示t 時刻的狀態(tài);
b.O 表示一組可觀察序列的集合,O={V1,V2,…,VM},其中,M 是從每一個狀態(tài)可能輸出的不同觀察值數(shù)目;
c.狀態(tài)轉(zhuǎn)移概率矩陣A={aij},其中,aij=P{qi+1=Sj|qi=Si},i≥1,j≤N;
d.狀態(tài)Sj的觀察概率矩陣B={bj(k)},表示狀態(tài)Sj輸出相應觀察值的概率,其中bj(k)=P{Ot=Vk|qt=Sj},1≤j≤N,1≤k≤M;
e.初始化狀態(tài)分 布π={πi},πi=P{q1=Si},1≤i≤N.
由上,HMM 可以定義為一個五元組λ=(X,O,π,A,B),并簡寫為λ=(π,A,B).
HMM 主要解決3類問題:評估、解碼和學習.
a.評估.給定模型參數(shù)λ=(X,O,π,A,B)及觀察序列O={V1,V2,…,VM},根據(jù)此模型計算此觀察序列的概率P(O|λ).
b.解碼.根據(jù)給定的模型λ=(X,O,π,A,B)及一個觀察序列,選擇最符合該觀察序列的狀態(tài)序列.
c.學習.給出一個觀察序列,調(diào)整模型的參數(shù)A,B,π,使得P(O|λ)最大.
建立預測大學生心理危機的隱馬爾科夫模型,即要確定隱馬爾科夫模型的5個要素,可通過5個步驟完成[13].
步驟1 通過心理專家對大學生心理狀態(tài)進行評估,確定其狀態(tài)的幾種可能情況,一般描述為心理健康、心理亞健康、心理危機等,以此作為預測大學生心理危機的隱馬爾科夫模型的隱狀態(tài),定義隱狀態(tài)集合為:X={S1,S2,…,SN},N=3,其中,S1,S2,S3分別為心理危機、心理亞健康、心理健康3種心理狀態(tài).
步驟2 將核心因素集C={父母教養(yǎng)方式,重大變故,競爭就業(yè)難,教工素質(zhì),人際關系}記為C={a1,a2,a3,a4,a5},為了便于描述這些因素對心理危機產(chǎn)生的影響以及建立隱馬爾科夫模型,本文采用這5個因素的一個組合V 表示,定義為
其中顯然,V 是由0或1組成、長度為m 的串,且可以通過學生問卷調(diào)查或心理測試等方式獲得,從而可以作為隱馬爾科夫模型的可觀察狀態(tài),定義可觀察序列集合為:O={V1,V2,…,VM},M=2m.
步驟3 設置初始狀態(tài)轉(zhuǎn)移概率矩陣
步驟4 根據(jù)大學生心理健康評估歷史數(shù)據(jù)分別統(tǒng)計心理健康、心理亞健康、心理危機3種狀態(tài)下各影響因素組合V,即觀察狀態(tài)的概率B.
步驟5 設置π={1,0,0},即假設大學生入校時不存在心理危機問題.
通過以上步驟,預測大學生心理危機的隱馬爾科夫初始模型λ=(π,A,B)已建立,然而其中的參數(shù)未進行優(yōu)化,無法真正應用于心理危機的預測中,因此需要對模型中的參數(shù)進行訓練和優(yōu)化.
初始模型λ=(π,A,B)經(jīng)過Baum-Welch算法優(yōu)化后,可以得到模型λ′=(π′,A′,B′),其參數(shù)經(jīng)過大量訓練數(shù)據(jù)訓練得出,具體的訓練優(yōu)化流程如下:
a.引入兩個變量εt(i,j)和γt(i,j),其中
式中,εt(i,j)為給定隱馬爾科夫模型λ 和觀察序列O 的前提下,在t 時刻狀態(tài)為Si且在t+1時刻狀態(tài)為Sj的概率;αt(i)為前向變量,表示t 時刻狀態(tài)為Si,且t 時刻之前(包括t 時刻)滿足給定觀測序列的概率;βt(i)為后向變量,表示t 時刻狀態(tài)為Si,且t 時刻以后滿足給定觀測序列的概率.
式中,γt(i)為給定隱馬爾科夫模型λ 和觀察序列O 的前提下,在時刻t 狀態(tài)為Si的概率.合并后得到
b.利用前面定義的變量εt(i,j)和γt(i),可得出狀態(tài)轉(zhuǎn)移概率矩陣A 的優(yōu)化算法,具體推導過程為
最后得出經(jīng)過優(yōu)化后的aij為
c.觀察值概率分布B 的優(yōu)化算法為
d.初始狀態(tài)概率分布π 的優(yōu)化算法為
通過式(9)、式(10)及式(11)分別對轉(zhuǎn)移概率矩陣A、觀察概率矩陣B 及初始化狀態(tài)分布π 進行優(yōu)化,得到訓練后的模型λ′=(π′,A′,B′),并用于心理危機預測.
模型λ′=(π′,A′,B′)應用于心理危機預測,根據(jù)核心因素的觀察序列,尋找生成該觀察序列最可能的隱狀態(tài)序列,即學生的心理狀態(tài),達到預測的目的.這屬于隱馬爾科夫模型中的解碼問題,使用Viterbi算法解決,具體算法過程如下:
a.t=1時,δ1(j)=π(j)bjk1;
b.t>1時,δt(j)=maxi{bjktδt-1(i)aij};
c.t=T 時,計算δT(j),選擇包含最大局部概率的狀態(tài),相應的局部最優(yōu)路徑即為全局最優(yōu)路徑;
d.反 向 指 針φt(j)用 于 回 溯,φt(j)=arg maxi{δt-1(i)aij}.
模型訓練及預測程序基于Eclipse平臺,采用Java語言及google jahmm-0.6.1包編寫.
實例分析數(shù)據(jù)來自南京理工大學泰州科技學院大學生心理健康教育與咨詢中心近兩年來學生心理健康評估原始記錄約2 000條.根據(jù)前文定義的隱狀態(tài)集合及可觀察序列集合對心理健康評估原始數(shù)據(jù)進行預處理,得到觀測符號對應隱狀態(tài)的記錄,其中觀察符號是由0,1組成的長度為5的字符串,共32種,隱狀態(tài)共3種.將預處理后的數(shù)據(jù)分成兩部分:訓練數(shù)據(jù)和測試數(shù)據(jù),分別用于模型訓練和預測.
分析結果表明,隨著訓練樣本容量的增加,模型的預測準確率逐步提高,并在達到一定數(shù)目后趨于穩(wěn)定,模型是收斂的,如圖1所示.使用單個因素的預測效果遠低于使用核心因素集,使用核心因素集的預測準確率能夠達到90%以上;另一方面,各因素對預測結果的影響程度是不等的,其中“父母教養(yǎng)方式、重大變故、競爭就業(yè)難”這3個因素對預測影響較大.
圖1 基于各因素及核心因素集的預測結果Fig.1 Prediction result based on single factor and core factor set
此外,將該模型應用于在校一年級學生心理危機預測,并與心理衛(wèi)生測試國際通用標準UPI篩選及SCL-90進行比較,其中UPI是大學人格問卷,SCL-90是心理健康測試量表.從表2中數(shù)據(jù)可以看到心理衛(wèi)生測試標準的評測結果具有一致性,即UPI與SCL-90對S1,S2,S3這3種狀態(tài)樣本數(shù)的統(tǒng)計結果保持一致.但兩者都傾向于將樣本由S3評測為S2,由S2評測為S1,繼而采取后續(xù)約談等干預手段實施心理健康教育;使用HMM 的預測結果與使用測試標準的評測結果基本吻合,且準確率更高一些,表3中準確率的比較也說明了這一點.
表2 實際預測與標準評測Tab.2 Practical prediction and standard evaluation
表3 準確率對比Tab.3 Accuracy comparison among various methods %
為了解決大學生心理危機預測問題,基于Vague集理論分析并建立了影響大學生心理危機的核心因素集,構造了可觀察序列集合,建立了預測大學生心理危機的隱馬爾科夫模型.運用Baum-Welch算法對模型參數(shù)進行訓練,并將訓練后的模型應用于心理危機預測,通過基于真實數(shù)據(jù)的實例分析驗證模型的正確性.研究結果表明,單個因素無法準確預測,而采用核心因素集能夠顯著提高預測的準確率,且各因素對預測所起的作用不等.下一階段將繼續(xù)研究更合理的因素組合,對模型進行優(yōu)化,運用序列挖掘方法挖掘大學生心理活動變化的規(guī)律,細化隱狀態(tài)及隱狀態(tài)之間的轉(zhuǎn)移,提高預測的精度,通過反向算法還原心理危機的產(chǎn)生過程,分析并給出合理的干預措施建議.
[1]王群,刁靜,林磊.大學生心理危機預防與干預體系的研究[J].上海中醫(yī)藥大學學報,2013,27(2):88-92.
[2]陳小紅,李三崗.生命教育視角下大學生心理危機及其干預探析[J].渭南師范學院學報,2013,28(12):78-80.
[3]Rabiner L R.A tutorial on hidden Markov models and selected applications in speech recognition [J].Proceedings of the IEEE,1989,77(2):257-286.
[4]Yamato J,Ohya J,Ishii K.Recognition human action in time sequential images using hidden Markov model[C]∥Proceedings of IEEE Conference on Computer Vision and Pattern Recognition.Champaign,IL:IEEE,1992:379-385.
[5]Bilmes J A.What HMMs can do [J].IEICE Transactions on Information and Systems,2006,89(3):1-24.
[6]鄔書躍,田新廣.基于隱馬爾可夫模型的用戶行為異常檢測新方法[J].通信學報,2007,28(4):38-43.
[7]Gau W L,Buehrer D J.Vague sets [J].IEEE Transactions on Systems,Man and Cybernetics,1993,23(2):610-614.
[8]劉伶俐,王朝立,于震.CHMM 語音識別初值選擇方法 的 研 究[J].上 海 理 工 大 學 學 報,2012,34(4):323-326.
[9]馬廣水.基于系統(tǒng)動力學大學生心理安全預警技術研究[D].武漢:武漢理工大學,2012.
[10]林志貴,徐立中,劉英平.Vague集理論及其在模糊信息處 理 中 的 應 用[J].信 息 與 控 制,2005,34(1):54-59.
[11]張麗,馬良.基于粗糙集屬性約簡的模糊模式識別[J].上海理工大學學報,2003,25(1):50-53.
[12]彭子平,張嚴虎,潘露露.隱馬爾科夫模型原理及其重要應用[J].計算機科學,2008,35(4):138-139.
[13]閆新娟,譚敏生,嚴亞周,等.基于隱馬爾科夫模型和神經(jīng)網(wǎng)絡的入侵檢測研究[J].計算機應用與軟件,2012,29(2):294-297.