徐 潔,陳永涌,2 ,胡永康
(1.青海師范大學(xué)教育學(xué)院,青海西寧,810016;2.青海師范大學(xué)高原科學(xué)與可持續(xù)發(fā)展研究院,青海西寧,810016;3.中國農(nóng)業(yè)大學(xué)信息與電氣工程學(xué)院,北京,100083)
2019年,健康中國行動推進(jìn)委員會發(fā)布了《健康中國行動(2019—2030年)》,指出要以健康為中心,充分利用互聯(lián)網(wǎng)技術(shù),建立完善的心理防治服務(wù)鏈,力求高效掌握健康狀態(tài),及時(shí)提供干預(yù)和指導(dǎo),希冀提升人民群眾生活的幸福感和滿意度,追求身心的共同健康。[1]大學(xué)生是國家和民族的青年一代,其是否具備健康的身心體魄,既關(guān)乎自身的發(fā)展與成長,也關(guān)乎國家的富強(qiáng)與繁榮。對青少年來說,大學(xué)階段是他們成長過程中從“非獨(dú)立的人”成長為“獨(dú)立的人”的重要轉(zhuǎn)折期,他們需要在短時(shí)間內(nèi)學(xué)會自理、自制、自覺。難以跳出固定模式的大學(xué)新生容易出現(xiàn)各種心理狀況,恐懼、抑郁、焦慮等情緒問題是其較為常見的心理健康問題。[2-3]
為預(yù)防大學(xué)生心理危機(jī)事件的發(fā)生,提高大學(xué)生的心理健康素質(zhì),各高?;緯谛律雽W(xué)后的第一個(gè)學(xué)期進(jìn)行心理普查,經(jīng)過“培訓(xùn)準(zhǔn)備—心理測試—數(shù)據(jù)分析—約談篩選—心理咨詢”五個(gè)程序。其中,心理測試和數(shù)據(jù)分析環(huán)節(jié)的工作最耗時(shí)、耗力。若不能及時(shí)篩查出有心理危機(jī)的學(xué)生,將直接延誤心理咨詢的最佳時(shí)期。因此,時(shí)效性和準(zhǔn)確性一直是心理健康測評面臨的挑戰(zhàn)。[4]
在人工智能時(shí)代,機(jī)器學(xué)習(xí)引起了人們的關(guān)注。通過對大量已有數(shù)據(jù)的特征學(xué)習(xí)、數(shù)據(jù)間聯(lián)系的分析、網(wǎng)絡(luò)模型的建立,從而在真實(shí)的數(shù)據(jù)上得到良好的預(yù)測效果[5],使機(jī)器學(xué)習(xí)成為預(yù)測界經(jīng)典統(tǒng)計(jì)模型的有力競爭者。BP神經(jīng)網(wǎng)絡(luò)是實(shí)現(xiàn)機(jī)器學(xué)習(xí)的方式之一,能利用現(xiàn)有的數(shù)據(jù)找出輸入數(shù)據(jù)與輸出數(shù)據(jù)之間的近似關(guān)系并進(jìn)行仿真,從而根據(jù)數(shù)據(jù)的變化特點(diǎn)做到提前預(yù)測。BP算法的運(yùn)行速度快、自學(xué)習(xí)能力強(qiáng),實(shí)時(shí)處理效率高,在心理健康測評領(lǐng)域展現(xiàn)了很大的發(fā)展?jié)摿?。然而,BP算法也存在一些局限性,如學(xué)習(xí)速度慢、訓(xùn)練時(shí)間長、穩(wěn)定性較差等。因此,BP算法常與其他算法結(jié)合起來使用,以彌補(bǔ)單個(gè)算法的不足。GA算法在宏觀搜索和全局優(yōu)化方面有著良好的表現(xiàn)[6],GA算法與BP算法相結(jié)合在一定程度上可以增強(qiáng)高效的全局優(yōu)化的能力,提高網(wǎng)絡(luò)模型的穩(wěn)定性。對此,本研究利用GA算法對BP神經(jīng)網(wǎng)絡(luò)進(jìn)行優(yōu)化,使神經(jīng)網(wǎng)絡(luò)在檢驗(yàn)和分析大學(xué)生心理普查的數(shù)據(jù)方面形成自學(xué)能力,解決傳統(tǒng)心理健康普查過程中出現(xiàn)的時(shí)效性和準(zhǔn)確性低的問題,構(gòu)建基于GA+BP的大學(xué)生心理健康自動評級模型。通過對大學(xué)生心理健康水平的自動評級,心理健康測評能減少數(shù)據(jù)分析過程中因主觀意志而出現(xiàn)的不確定性,節(jié)約傳統(tǒng)數(shù)據(jù)處理的人力資源和時(shí)間成本,提高數(shù)據(jù)篩查的速度和效率,為大學(xué)生提供及時(shí)的心理援助服務(wù)。
BP神經(jīng)網(wǎng)絡(luò)是機(jī)器學(xué)習(xí)算法中一種經(jīng)典的多層感知機(jī)模型,也是一種有監(jiān)督學(xué)習(xí)模型和簡單的神經(jīng)網(wǎng)絡(luò)模型,其模型結(jié)構(gòu)如圖1所示。在BP模型結(jié)構(gòu)中,x是輸入值,y是輸出值,i是輸入層神經(jīng)元,h是隱藏層神經(jīng)元,o是輸出層神經(jīng)元,w是每兩個(gè)神經(jīng)元之間的權(quán)重,b是當(dāng)前神經(jīng)元的偏置。
BP模型的輸出結(jié)果采用前向傳播,即輸入一個(gè)樣本后,通過計(jì)算得到每個(gè)神經(jīng)元的輸出值;每個(gè)神經(jīng)元的計(jì)算方式相同,輸出值都是由其輸入的線性組合得到。[7]BP模型可以通過自學(xué)習(xí)使輸出值和真實(shí)值盡可能地保持一致,輸出值和真實(shí)值兩者的誤差越小,說明結(jié)果越好。該算法通過采用梯度下降算法計(jì)算誤差,并通過反向傳播算法反向調(diào)整每個(gè)神經(jīng)元的權(quán)重和偏置,最終得到模型的最優(yōu)結(jié)果。
GA算法即遺傳算法,最早是由美國的John Holland于20世紀(jì)70年代提出。[8]該算法借鑒了生物演變進(jìn)化的理念,讓數(shù)據(jù)從初始隨機(jī)混沌的狀態(tài)根據(jù)一定的規(guī)則、進(jìn)化演變成合理解。經(jīng)過幾次“選擇—交叉—變異”的重復(fù)操作迭代后,適應(yīng)度高的個(gè)體產(chǎn)生下一代,適應(yīng)度低的個(gè)體被逐步淘汰,這種類似自然界中的優(yōu)勝劣汰法則的算法便是GA算法。隨著計(jì)算機(jī)能力的發(fā)展和實(shí)際應(yīng)用需求的增多,GA算法因其智能尋優(yōu)能力、自適應(yīng)能力、并行計(jì)算等特點(diǎn)被廣泛運(yùn)用于許多領(lǐng)域,且逐漸進(jìn)入實(shí)際應(yīng)用階段。
BP模型存在一定的局限性,如容易陷入局部最優(yōu)解而得不到全局最優(yōu)解,訓(xùn)練時(shí)間較長、學(xué)習(xí)效率低、收斂速度慢,隱藏層神經(jīng)元數(shù)目無法通過現(xiàn)有的理論指導(dǎo)確定,學(xué)習(xí)新樣本時(shí)會遺忘舊樣本等。[9]將BP模型與GA算法結(jié)合使用,在一定程度上可以增強(qiáng)模型的整體智能尋優(yōu)能力和自適應(yīng)能力,提高網(wǎng)絡(luò)模型的穩(wěn)定性,增強(qiáng)高效的全局優(yōu)化的能力?;贕A+BP網(wǎng)絡(luò)的模型設(shè)計(jì)流程如圖2所示。
本研究以青海某高校2021級大學(xué)生為被試,以班級整群抽樣的方法,組織學(xué)生在多媒體教室掃描問卷星二維碼的方式進(jìn)行數(shù)據(jù)的收集。本研究總計(jì)回收了3401份數(shù)據(jù),剔除無效數(shù)據(jù)304份,實(shí)際回收有效數(shù)據(jù)3097份,有效回收率為91%。在研究對象開始填寫問卷前,研究者會用統(tǒng)一的指導(dǎo)語說明本次心理健康調(diào)查的目的和意義,告知自愿制度和保密制度,在征得測查對象的同意后組織班級統(tǒng)一施測。
1.基本情況調(diào)查問卷
本研究采用自編的基本情況問卷,收集該校2021級大學(xué)生的基本背景資料,包括被試的學(xué)號、性別、年齡、民族、專業(yè)等基本內(nèi)容?;颈尘百Y料的收集主要是方便心理普查后的數(shù)據(jù)分析,以及對有心理危機(jī)學(xué)生進(jìn)行定向追蹤。
2.癥狀自評量表(SCL-90)
本研究采用的癥狀自評量表,是最著名、應(yīng)用最廣泛的心理健康測量量表之一。[10]該量表共有90個(gè)項(xiàng)目,以近一周的實(shí)際感受為評分依據(jù),從日常生活、情緒變化到思維意識等方面綜合評估個(gè)體近期的精神狀態(tài)。SCL-90每個(gè)項(xiàng)目都是5級評分(1=“無”—5=“嚴(yán)重”),結(jié)果可以劃分為10個(gè)因子,能清晰地顯示個(gè)人有無心理癥狀及心理癥狀的嚴(yán)重程度。本研究中,SCL-90的Cronbach’s α為 0.954。
1.數(shù)據(jù)特征提取
本研究主要根據(jù)SCL-90的測查結(jié)果進(jìn)行特征學(xué)習(xí)和預(yù)測,因而先要將基本情況問卷中的無關(guān)數(shù)據(jù)清除,把10個(gè)因子的數(shù)據(jù)提取出來,包括F1:軀體化,F(xiàn)2:強(qiáng)迫,F(xiàn)3:人際關(guān)系,F(xiàn)4:抑郁,F(xiàn)5:焦慮,F(xiàn)6:敵對,F(xiàn)7:恐怖,F(xiàn)8:偏執(zhí),F(xiàn)9:精神病性,F(xiàn)10:睡眠、飲食。然后,研究者對量表總分和各因子項(xiàng)目總分做均分處理,以反映個(gè)體心理健康水平所處的級別位置。最后,研究者給均分定級,如表1所示。
表1 90項(xiàng)癥狀自評量表項(xiàng)目均分評級標(biāo)準(zhǔn)
2.數(shù)據(jù)歸一化處理
因本研究采集的原始數(shù)據(jù)分布差異較大、維度較多,但為減少分布差異與維度對實(shí)驗(yàn)結(jié)果帶來的影響,研究者將采用均值歸一法對實(shí)驗(yàn)數(shù)據(jù)進(jìn)行處理,將數(shù)據(jù)縮放到[-1,1]區(qū)間范圍內(nèi),公式如下。
(1)
式中,xi表示每個(gè)樣本數(shù)據(jù)值,mean(x)表示原始數(shù)據(jù)的均值,σ表示原始數(shù)據(jù)的方差,yi表示輸出值。
3.基于GA+BP的模型構(gòu)建
本研究以Python語言為基礎(chǔ),使用Pycharm編程工具,并利用tensorflow和Scikit-learn等框架進(jìn)行構(gòu)建模型。具體的軟硬件實(shí)驗(yàn)環(huán)境如表2所示。
表2 軟硬件實(shí)驗(yàn)環(huán)境配置
由于本研究的數(shù)據(jù)集多為浮點(diǎn)數(shù),對預(yù)測的精確度要求較高,因此,為了降低計(jì)算量和算法的時(shí)間復(fù)雜度,研究者采用浮點(diǎn)數(shù)編碼,即以實(shí)數(shù)表示種群中的各個(gè)體,并設(shè)定初始權(quán)重為區(qū)間[-1,1]內(nèi)的隨機(jī)浮點(diǎn)數(shù)。種群數(shù)量設(shè)置為100,選擇算子采用輪盤賭算法,交叉算子采用單點(diǎn)交叉法,且交叉率設(shè)置為0.5,變異算子采用實(shí)數(shù)突變法,且變異率設(shè)置為0.1,迭代次數(shù)為30代。
同時(shí),BP模型設(shè)置輸入層10個(gè)神經(jīng)元,隱藏層為一層,共32個(gè)神經(jīng)元,激活函數(shù)參數(shù)為relu函數(shù),輸出層為5個(gè)神經(jīng)元,設(shè)置alpha參數(shù)為0.01,學(xué)習(xí)率設(shè)置為0.01,設(shè)置最大迭代次數(shù)為3000次。為防止實(shí)驗(yàn)結(jié)果產(chǎn)生過擬合現(xiàn)象,BP模型設(shè)置dropout參數(shù)為0.3。
在收集的3097份數(shù)據(jù)中,心理健康水平正常、輕度、中度、偏重和嚴(yán)重的檢出人數(shù)分別為1898人、1023人、150人、17人、9人??赡苡行睦砦C(jī)的大學(xué)生共占38.71%,說明大學(xué)生心理健康整體狀況不太樂觀。由SCL-90的調(diào)查結(jié)果可知,大學(xué)生心理健康問題主要集中在強(qiáng)迫、人際關(guān)系和抑郁等維度,具體分布情況如圖3所示。這與前人的調(diào)查結(jié)果比較一致。[11]
全新的人際關(guān)系、生活環(huán)境、學(xué)習(xí)模式和自我認(rèn)知等[12],容易使一些適應(yīng)不良的大學(xué)新生成為心理健康問題的感染群體。及時(shí)進(jìn)行心理干預(yù),預(yù)防心理危機(jī)事件的發(fā)生,也是大學(xué)新生開展心理健康普查的根本目的。
根據(jù)已獲得的3097份數(shù)據(jù)和構(gòu)建的心理健康評級標(biāo)準(zhǔn)表,在大學(xué)生心理健康自動評級模型的基礎(chǔ)上,本研究采用5折交叉驗(yàn)證法進(jìn)行模型訓(xùn)練,即每次驗(yàn)證將數(shù)據(jù)集劃分為80%的訓(xùn)練集數(shù)據(jù)和20%的測試集數(shù)據(jù),并選取訓(xùn)練結(jié)果較不理想的一組進(jìn)行實(shí)驗(yàn)結(jié)果分析。訓(xùn)練周期與損失值之間的關(guān)系如圖4所示。
由圖4可知,隨著訓(xùn)練迭代次數(shù)的增加,該模型的訓(xùn)練集與測試集的損失值在降低,測試集的損失值略低于訓(xùn)練集。在500次迭代訓(xùn)練后,訓(xùn)練集和測試集的損失值都趨于平穩(wěn),且整體收斂效果較好。
為了能夠看出訓(xùn)練集的心理健康水平等級的分類效果,本研究利用ROC曲線和AUC指標(biāo)分別對訓(xùn)練集和測試集的五種評級標(biāo)準(zhǔn)的分類效果進(jìn)行分析。其中,當(dāng)AUC≤0.5時(shí),表示模型訓(xùn)練分類效果較差;當(dāng)0.5 由圖5可知,心理健康水平的五種等級中評級A(正常)的AUC值最高(為0.9587),說明該模型在訓(xùn)練集中識別正常級別的心理健康效果最好;而評級D(偏重)的AUC值最低(為0.6294),說明該模型在訓(xùn)練集中識別偏重級別的心理健康效果最差。平均ROC曲線的AUC值達(dá)到了0.8235,說明該模型在訓(xùn)練集中的表現(xiàn)整體效果較好。 由圖6可知,心理健康水平的五種等級中評級A(正常)的AUC值最高(為0.9815),說明該模型在測試集中識別正常級別的心理健康效果最好;而評級D(偏重)的AUC值最低(為0.5000),說明該模型在測試集中識別偏重級別的心理健康效果最差。平均ROC曲線的AUC值達(dá)到了0.8648,說明該模型在測試集中的表現(xiàn)整體效果很好。 比較圖5和圖6可知,該模型在測試集中的平均ROC曲線的AUC值高于在訓(xùn)練集中的平均ROC曲線的AUC值,且兩者的AUC值都較高,說明該模型在測試集上的表現(xiàn)略好于訓(xùn)練集,反映了該模型針對心理健康水平數(shù)據(jù)集的等級分類問題取得了很好的效果。另外,該模型在識別心理健康水平A(正常)、B(輕度)、C(中度)級別的效果較好,在識別心理健康水平D(偏重)、E(嚴(yán)重)級別的效果略差。大部分大學(xué)生心理健康水平是正常的,檢出心理異常的學(xué)生主要集中在輕度水平,心理狀況偏重和嚴(yán)重的學(xué)生只占總?cè)藬?shù)的0.84%,因此,數(shù)據(jù)量過少是影響該模型識別心理健康偏重和嚴(yán)重級別效果的重要因素。 為了更客觀地觀察該模型在本研究的評級效果,研究者將測試集中數(shù)據(jù)的真實(shí)值和該模型所預(yù)測的預(yù)測值進(jìn)行比較和檢驗(yàn)。因本研究中測試數(shù)據(jù)量較大,不方便全部對比顯示,所以研究者從測試集的首尾各選取15組數(shù)據(jù),共30個(gè)數(shù)據(jù)對比繪制成表格。 由表3可知,在測試集的30個(gè)數(shù)據(jù)中,只有5個(gè)預(yù)測值與真實(shí)值不符,表示該模型的心理健康水平預(yù)測效果良好。 為了進(jìn)一步檢驗(yàn)基于GA+BP的大學(xué)生心理健康自動評級模型的性能,研究者選擇傳統(tǒng)的BP神經(jīng)網(wǎng)絡(luò)與基于GA+BP構(gòu)建的大學(xué)生心理健康自動評級模型進(jìn)行對比實(shí)驗(yàn),使其參數(shù)、迭代次數(shù)、神經(jīng)元個(gè)數(shù)、層數(shù)等設(shè)置與GA+BP模型保持一致,最后比較兩種模型在Accuracy、Precision、Recall與F1四個(gè)指標(biāo)上的差異,對比結(jié)果如表4所示。 表4 模型實(shí)驗(yàn)結(jié)果對比 由表4可知,相較于傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)模型,GA+BP模型在預(yù)測大學(xué)生心理健康水平的精確率、準(zhǔn)確率、召回率和F1值方面分別提升了1.78%、2.51%、1.78%和2.17%。這說明了GA+BP模型比傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)模型的收斂速度更快,準(zhǔn)確率更高,驗(yàn)證了基于GA+BP的大學(xué)生心理健康自動評級模型的可行性。 通過心理普測篩查有心理危機(jī)的學(xué)生是一項(xiàng)重要手段。然而,大部分高校的大學(xué)生心理健康測評方式比較傳統(tǒng),形式單一、效率低下,其科學(xué)性、時(shí)效性和個(gè)性化存在一些質(zhì)疑和挑戰(zhàn)。[13-14]隨著人工智能技術(shù)的發(fā)展,心理健康研究和計(jì)算機(jī)技術(shù)不斷結(jié)合。從建立心理健康教育網(wǎng)站到完善心理評測系統(tǒng),計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)在心理健康領(lǐng)域發(fā)揮著越來越重要的作用,智能化的心理測評手段應(yīng)運(yùn)而生。[15]本文提出的基于GA+BP的大學(xué)生心理健康自動評級模型,作為一種輔助手段,彌補(bǔ)了一些傳統(tǒng)測評的不足之處,對大學(xué)生心理健康水平有較好的預(yù)測效果,能夠在實(shí)際的心理測評中發(fā)揮有效的助力作用。五、結(jié)語