許惠惠
(山西藥科職業(yè)學院器械工程系,太原 030031)
大學生心理健康問題是當今社會廣受關注的重要議題之一。在現(xiàn)代社會中,大學生面臨來自學業(yè)、人際關系、未來就業(yè)等多個方面的壓力,這些壓力可能對他們的心理健康產生負面影響。因此,重視大學生心理健康問題,提供必要的支持和幫助顯得尤為關鍵[1]。
目前,全球范圍內各個國家對大學生心理健康的重視程度逐漸增加。越來越多的國家和教育機構認識到大學生心理健康的重要性,并采取積極的措施來支持和關注這一問題。在許多國家,大學生心理健康已經成為教育政策的重要組成部分[2]。中國教育部、衛(wèi)生健康委員會等相關部門已經多次發(fā)布關于大學生心理健康的政策文件和指導意見,如《普通高等學校學生心理健康教育指導原則》等。這些文件強調了加強心理健康教育的必要性,要求學校加強心理健康教育課程的設置,提供心理咨詢和支持服務,加強心理健康教師隊伍的建設等[3-4]。
在評估大學生心理健康時,傳統(tǒng)的方法大多是居于心理健康問卷調查、心理咨詢和面談、心理測評工具、學業(yè)成績和行為觀察以及學生自助工具和在線資源等。然而,這些方法存在一些問題。例如,它們可能無法有效地捕捉復雜的模式和關聯(lián)關系,只能從為數(shù)不多的幾個指標中分析出大學生的一些心理情況,缺乏全局的特征分析。
為了克服這些問題,本文提出了一種基于多分支深度學習的大學生心理健康評估模型。該模型利用先進的深度學習技術,結合多種學生心理屬性數(shù)據(jù),對潛在的大學生心理異常狀態(tài)(尤其是抑郁)進行評估和預測。相比傳統(tǒng)方法,這種模型具有更高的準確性和實用性,能夠更全面地了解大學生的心理健康狀況,為學校和相關機構提供更有效的干預和支持策略。
本研究旨在構建一種基于多分支深度學習的大學生心理健康評估模型,以綜合評估大學生的心理健康狀況并預測其心理健康水平。該模型的構建理念主要是基于多分支深度學習思想,將每種不同的心理特征類型視為獨立的分支,通過并行處理和融合不同分支的特征來獲取綜合的心理健康評估結果。通過多分支設計,我們能夠充分利用不同數(shù)據(jù)類型的特征信息,從而提高模型的信息提取能力和預測準確性。
該模型的應用研究主要包含以下內容:首先,利用大學生的不同類型指標心理評估結果等信息,對其潛在抑郁狀況進行預測;其次,通過對模型的解釋性分析,我們能深入了解不同心理屬性對心理健康的影響;最后,基于模型對大學生的心理健康水平進行預測,提供個性化的心理健康建議和支持,為進一步的研究和干預提供指導。
由于調查問卷中數(shù)據(jù)的特殊格式,無法直接用于抑郁癥狀的預測,所以首先需要對數(shù)據(jù)進行預處理。
首先,我們需要消除填寫問卷的時間異常短,或者某些測量得分異常的數(shù)據(jù)[5]。如果關鍵字段的得分為0或者是某種明顯的最大值,這可能表明參與者在填寫問卷時沒有認真填寫,我們將這些異常數(shù)據(jù)按學生刪除,這樣的處理有助于過濾掉未認真填寫問卷的異常數(shù)據(jù)。
其次,我們對數(shù)據(jù)中的缺失值進行了補充,檢查心理健康各種屬性數(shù)據(jù)中的缺失值。對于缺失值,我們采用平均值插值的方法對缺失值進行了補充,具體公式如下。
其中,表示第i個缺失值的估計值,Xj表示已知的樣本值,N表示已知樣本的數(shù)量。
為了通過調查問卷的數(shù)據(jù)預測學生的抑郁狀況,我們采用了三分支的深度學習模型,如圖1所示。每個分支都被設計來處理學生問卷中的一種特定類型的心理特征數(shù)據(jù):積極特征數(shù)據(jù)、負向特征數(shù)據(jù)和中性特征數(shù)據(jù)。下面簡要介紹模型結構。
圖1 多分支深度學習心理評估模型框架
首先,我們構建一個全連接神經網絡(fully connected neural network,F(xiàn)CN)分支處理學生積極特征類數(shù)據(jù)[6-7]。這類數(shù)據(jù)包括了參與者的聰慧性、責任性、敢為性、獨立性和自律性。根據(jù)研究表明,高聰慧性增加壓力和期望,高責任感導致自責,高敢為性面對挫折,高獨立性可能感到孤獨,高自律性增加壓力,這些積極心理特征對學生的抑郁情況有潛在的反面作用,而FCN 可以抓取這些積極心理數(shù)據(jù)中的非線性模式,為模型預測學生抑郁狀況提供部分信息特征。
其次,我們構建了一個隨機森林模型來處理學生負向特征心理評估類數(shù)據(jù)。這類數(shù)據(jù)包括學生的幻想性、世故性、支配性、敏感性、懷疑性、憂慮性和緊張性得分。這些特征是學生個體心理負向特征方面的數(shù)據(jù),相比積極心理特征與抑郁癥的關聯(lián)性更大。較高的幻想性和世故性、較強的支配性、敏感性、懷疑性、憂慮性和緊張性可能與抑郁癥風險增加相關。缺乏社交支持、情緒波動大、過度控制他人、焦慮、敏感、猜疑、憂慮和緊張可能導致抑郁情緒。這些信息深度描繪了學生的負向心理狀態(tài)和行為表現(xiàn),由于這些屬性和抑郁性都是作為負性心理指標,所以具有高度的預測價值。隨機森林作為一個非參數(shù)的集成學習模型,能夠有效處理各種特征之間的復雜交互關系,對心理評估數(shù)據(jù)進行深度分析。
最后,我們構建一個新的全連接神經網絡(FCN)分支處理學生心理中的中性特征數(shù)據(jù)。這類數(shù)據(jù)包括了學生的合群性、穩(wěn)定性、興奮性和開放性得分。這些特征涉及個體的內外向傾向和對新奇體驗的接受程度。它們與抑郁癥之間的關系可能相對較弱,與處理積極特征類數(shù)據(jù)的FCN 相似,這個FCN 也可以捕獲這些特征之間的非線性關系,并進一步輔助主要特征提高預測的準確性。
以下是該模型的算法表示:
算法:三分支深度學習心理評估模型
輸入:學生的積極特征數(shù)據(jù)X1,消極(負向)特征數(shù)據(jù)X2,中性特征數(shù)據(jù)X3
輸出:預測的抑郁狀況Y
步驟:
第一步:初始化模型參數(shù)。
第二步:對每一個訓練實例執(zhí)行以下步驟:
①將積極特征數(shù)據(jù)X1輸入到全連接神經網絡(FCN)分支,得到特征表征結果Y1;將消極特征數(shù)據(jù)X2輸入到隨機森林模型分支,得到特征表征結果Y2;②將中性特征數(shù)據(jù)X3輸入到全連接神經網絡(FCN)分支,得到特征表征結果Y3;③拼接整合三個分支的預測結果Y1,Y2,Y3,生成綜合預測結果Y。
第三步:使用交叉熵損失來計算預測結果Y 與實際值之間的差距。
第四步:使用隨機梯度下降法更新模型的參數(shù)。
第五步:重復步驟二~步驟四,直到模型收斂,即損失值不再顯著下降或達到100訓練輪數(shù)。
第六步:輸出預測的抑郁狀況Y。
1.4.1 全連接神經網絡模型(FCN)
全連接神經網絡(FCN)是一種常見的深度學習模型,由多個層次的節(jié)點(或稱為神經元)組成,每一層的節(jié)點與上一層和下一層的所有節(jié)點都相互連接。這種全連接的方式意味著網絡可以捕獲輸入特征之間的復雜關系。每個節(jié)點都是輸入數(shù)據(jù)的加權求和,然后通過一個非線性激活函數(shù),如ReLU或sigmoid,得到輸出。
下面是FCN 方法的分步介紹:
(1)輸入層:多層感知機的輸入層接受輸入數(shù)據(jù)x=(x1,x2,…,xn),其中n為特征數(shù)量。
(2)隱藏層:隱藏層的任務是從輸入數(shù)據(jù)中提取有用的信息。隱藏層的神經元將使用權重和偏置對輸入數(shù)據(jù)進行線性變換,然后通過激活函數(shù)進行非線性變換,得到一個內部狀態(tài)值hi:
其中wij和bi分別表示第i個神經元的權重和偏置項。
(3)激活函數(shù):隱藏層的每個神經元都會對內部狀態(tài)值hi應用一個非線性激活函數(shù)g(hi),得到輸出值ai:
常用的激活函數(shù)包括Sigmoid 函數(shù)、ReLU函數(shù)和Tanh 函數(shù)等,本實驗使用ReLU 函數(shù)。ReLU 函數(shù)具有簡單、高效、非線性和正則化等優(yōu)點,因此在多層感知機模型中廣泛使用[12]。
(4)輸出層:多層感知機的輸出層對隱藏層的輸出值ai進行線性變換,得到最終的輸出值y:
除了基本的全連接層和激活函數(shù),全連接神經網絡中使用其他的技術,Dropout 和Batch Normalization來提升模型性能。
Dropout 是一種正則化技術,它在訓練過程中隨機忽略(即設置為0)部分神經元的輸出,以防止模型過擬合。
Batch Normalization 是一種歸一化技術,它將每一層的輸入標準化到0 均值和1 標準差,以加速訓練過程,并提高模型的泛化能力。
1.4.2 隨機森林
隨機森林(random forest,RF)是一種集成學習方法,它結合了多個決策樹的預測能力來生成最終的輸出。隨機森林在處理回歸問題時,通過對每個樹的預測結果進行平均,產生一個連續(xù)的輸出值。
對于一個給定的訓練集D=(xi,yi)N i=1,隨機森林的基本工作流程如下:
首先從D中進行有放回的抽樣(Bootstrap)以產生一個新的訓練集,然后在這個訓練集上構建T個決策樹。
基于以上構建的T個決策樹,對于一個新的輸入x,隨機森林的預測值是所有決策樹預測值的平均,可以表示為
其中,ft(x)是第t棵決策樹的預測值。
首先,本文實驗平臺基于英特爾I7處理器、64 GB運行內存的超微高性能服務器,并搭載了8 塊NVIDIA GeForce GTX 3090 顯 卡。操 作 系 統(tǒng)為Ubuntu 16.8。軟件方面,使用基于Anaconda3 5.0.1 軟件包管理系統(tǒng)開發(fā),CUDA 版本為9.0。深度學習框架采用PyTorch開發(fā)環(huán)境。
本研究以山西藥科職業(yè)技術學院2021 年心理健康測評數(shù)據(jù)為實驗數(shù)據(jù)集。這個數(shù)據(jù)集包含了19 個班級,其專業(yè)包括藥品質量與安全、中藥制藥技術和中藥學。
本數(shù)據(jù)集基于《卡特爾十六種人格因素測驗》探討了大學生的16 種人格因素的測試,其中包括實驗設計中提到的合群性、聰慧性、穩(wěn)定性、支配性、興奮性等16 種人格因素,它整合了重要的人口統(tǒng)計信息以及自我報告的數(shù)據(jù)和心理測試結果,以全面了解醫(yī)學領域大學生的心理狀態(tài)。
我們的目的是基于數(shù)據(jù)集中的三類數(shù)據(jù)類型(積極、消極、中性)對學生的抑郁情況進行預測,從中分析學生各個數(shù)據(jù)屬性和潛在抑郁心理情況的相關性,從而構建學生的心理健康評估模型。
由于抑郁情況評估任務為回歸問題,本文使用的評價指標包括:
(1)均 方 誤 差(mean squared error, MSE):MSE 是預測值與實際值之差的平方的平均值。公式為
其中,n是樣本數(shù)量,Yi是實際值,是預測值。
(2)均方根誤差(root mean squared error,RMSE): RMSE 是MSE 的平方根,更易于解釋,因為它的單位和原始目標變量相同。公式為
(3)平 均 絕 對 誤 差(mean absolute error,MAE):MAE 是預測值與實際值之差的絕對值的平均值。公式為
(4)R 方值(R2Score): R 方值,也稱為確定系數(shù),衡量的是模型的預測能力。它的取值在0~1 之間,越接近1 表示模型的預測性能越好。公式為
其中,是實際值的平均值。
對于回歸問題,我們希望MSE,RMSE 和MAE的值盡可能小,而R2的值盡可能大。
為了驗證所提出模型的有效性,本文設計了以下方法作為對比方法,并進行相應的對比實驗:
(1)線性回歸(linear regression):線性回歸是最基礎的回歸算法,其目標是找到一條使得預測值與實際值之間誤差平方和最小的直線[8];
(2)嶺回歸(ridge regression):嶺回歸是一種修改版的線性回歸,通過對系數(shù)的大小施加懲罰來防止過擬合[9]。
(3)決策樹回歸(decision tree regressor): 決策樹回歸是一種非線性回歸方法,它將特征空間劃分為一系列的矩形區(qū)域,對于每個矩形區(qū)域的預測值為該區(qū)域內的目標變量的平均值[10]。
(4)支持向量回歸(support vector regression,SVR): SVR 是支持向量機的回歸版本,它嘗試尋找一個超平面,使得所有點到該平面的距離都小于或等于預設的值,并且距離超平面最遠的點盡可能多[11]。
以上算法在本數(shù)據(jù)集上的預測準確率見表1。
表1 各模型預測結果
從表1可以看出,本文提出的多分支心理健康評估模型在各個指標上均優(yōu)于其他模型。本文模型獲得值為0.3 的MSE,說明本文模型預測的殘差平方和最小,進一步闡明本文模型從其他的屬性特征中挖掘抑郁相關信息的能力較強。在R2方面,本文模型有最高的確定系數(shù)0.85,說明模型在挖掘各項不同的屬性數(shù)據(jù)上的能力最強,從中成功捕捉到學生心理抑郁情況的能力最強,而線性回歸模型的R2值最低,為0.72,在解釋變量對結果的影響的能力最弱,預測精度相對較低。
圖2是本文方法和對比方法在RMSE和MAE指標上的結果對比,可以看到本文的方法具有最佳的預測性能。
圖2 不同模型的RMSE(↓)和MAE(↓)結果對比
為了驗證學生的不同指標對學生抑郁情況的影響,我們進行了部分屬性的相關性分析,結果如圖3所示。
圖3 心理屬性相關性分析熱圖
首先,我們發(fā)現(xiàn),學生的憂慮性和緊張性與抑郁癥狀存在正相關關系。憂慮性得分越高,對應的潛在抑郁情況分數(shù)也越高。隨著年齡的增長,學生可能會面臨更多的學業(yè)和生活壓力,導致對學習和生活的憂慮,這可能會提高抑郁癥的風險。同時,緊張性也和抑郁有正相關關系,過度的憂慮和緊張導致負面情緒的積累,增加抑郁的風險。抑郁和焦慮常常共同存在,相互影響,形成一種惡性循環(huán)。憂慮情緒增加可能導致抑郁情緒的加重,而抑郁情緒的存在又會進一步加重個體的憂慮和緊張感。
此外,我們發(fā)現(xiàn)責任感和學生的抑郁情況也存在相互影響。責任感較強的個體可能更容易在面對困難和挫折時產生自責和抑郁情緒。他們可能過分追求完美,對自己的要求過高,當無法達到自己設定的目標時,會感到失望和沮喪。同時,抑郁情緒可能會降低個體對自我責任的感知,導致其對任務和義務的執(zhí)行能力下降。
最后,我們的實驗進一步驗證了積極心理特征中的敢為性與抑郁具有負相關性關系。具有較強敢為性的同學,普遍具有較低的抑郁風險。這可能是因為敢為性的同學更加樂觀和自信,更能夠積極面對挑戰(zhàn)和困難,從而減少抑郁的發(fā)生。
本研究成功開發(fā)出一種基于多分支深度學習模型的大學生心理健康評估工具。通過綜合處理和分析學生的各項心理咨詢數(shù)據(jù)以及心理評估數(shù)據(jù),能夠有效地預測他們的潛在抑郁風險。
研究結果表明,本文模型在預測精度和可靠性上明顯優(yōu)于傳統(tǒng)方法。此外,我們還發(fā)現(xiàn)學生一些消極心理評估結果與他們的抑郁狀況顯著相關,尤其是憂慮、緊張和責任性等因素對學生抑郁風險的影響最為顯著,同時敢為性可以最大程度地減少抑郁風險。
總體來看,本研究為深入理解大學生抑郁癥狀的成因和影響因素,以及設計更精確和針對性的預防和干預措施提供了重要依據(jù)。