彭海霞 賀冰心 柴巧蓮
(湖南環(huán)境生物職業(yè)技術學院,湖南 衡陽 421000)
當前影響青少年心理健康的因素日漸增多,包括家庭、學習、工作等,青少年的心理健康異常逐漸成為相關學術界熱烈討論的話題[1]。在國內(nèi)經(jīng)濟及技術高速發(fā)展的大環(huán)境下,社會發(fā)展對新一代青少年體能和智力的要求越來越高,青少年需要面臨的學習強度和工作壓力越來越大,不可避免地會在心理上產(chǎn)生較大落差,進而使青少年的心理健康受到嚴重影響[2]。但往往青少年心理出現(xiàn)問題的時機是無法預知的,只有在產(chǎn)生某些影響后才會意識到問題的嚴重性,既耗費人力、物力,又會產(chǎn)生巨大的時間成本[3]。因此研究一種可獲取青少年心理健康情況的方式、方法尤為重要[4]。該文基于大數(shù)據(jù)技術研究青少年心理健康評測的動態(tài)模型,模型的構(gòu)建涉及心理健康數(shù)據(jù)采集與整理、確立動態(tài)模型評估指標、測算心理健康評測數(shù)據(jù)以及獲取心理健康評測結(jié)果,可使用不同算法將不同類型的心理健康數(shù)據(jù)進行分布計算,以數(shù)據(jù)信息的健康評測作為成果輸出,據(jù)此全面了解青少年的心理動態(tài),并進行更準確的心理健康預測。
當前采集大數(shù)據(jù)的常用工具主要有Flume、Logstash 和Kibana 等[5]。基于大數(shù)據(jù)多樣性的特點,使用特定的工具可將可靠性數(shù)據(jù)高速并發(fā)地進行采集、整合。大數(shù)據(jù)采集技術主要是完成對已收錄數(shù)據(jù)的分辨、篩選以及歸類等操作,解決數(shù)據(jù)來源參差不齊等關鍵問題。該文的研究將通過構(gòu)建大數(shù)據(jù)網(wǎng)絡流量資源聚合數(shù)學模型的方式進行數(shù)據(jù)采集。其中包括構(gòu)建大數(shù)據(jù)網(wǎng)絡流量資源池與青少年基本信息管理模塊,將大數(shù)據(jù)網(wǎng)絡流量作為數(shù)據(jù)整合平臺,供使用者自行選擇測試方向。在測試人員確定測試方式后,初始數(shù)據(jù)庫可將對應的測試題目展示給測評人員,令其可以自行選擇試題的呈現(xiàn)形式,完成答題后進行相應的評測結(jié)果分析,以此完成青少年心理健康評測。
數(shù)學模型的輸入量選擇的是圍繞場景分析的VIRE 計算方法,這種方法可將數(shù)據(jù)梳理過程全面優(yōu)化。VIRE 算法的核心思路是在擬定的數(shù)據(jù)采集范圍內(nèi)設置不同參考標簽進行計算,和其他實際參考標簽種類相比,其效用性和精準度更高。在指定范圍內(nèi)通過虛擬標簽檢索得出對應成果并輸出。此種定位算法可在更深的層面上增加數(shù)據(jù)采集的精確度。VIRE 算法能減少對數(shù)據(jù)檢索產(chǎn)生的資源浪費,可過濾重復的數(shù)據(jù)信息,此算法把數(shù)據(jù)池精細地規(guī)劃成n 個虛擬儲存網(wǎng)格,并將之前設定的虛擬標簽均勻分布在網(wǎng)格內(nèi),不同標簽的RSSI 值根據(jù)網(wǎng)格坐標軸的值通過線性插值進行計算,如公式(1)所示。
式中:xi第i 個采集的心理健康數(shù)據(jù);si第i 個對象中采集的特征數(shù)據(jù);m 為第i 個采集對象數(shù)據(jù)的控制參數(shù)。
根據(jù)公式計算出不同數(shù)據(jù)的RSSI 標簽值,實現(xiàn)基于多特征數(shù)據(jù)的信息并發(fā)性采集,以便將青少年心理健康狀況進行評價。
數(shù)據(jù)整理的目的是提升數(shù)據(jù)質(zhì)量與可用性[6]。通過VIRE算法收集數(shù)據(jù),采集到的多種類數(shù)據(jù)存儲、計算在一定程度上得到滿足后,如何進行數(shù)據(jù)整理與沉淀成了重要環(huán)節(jié)。為優(yōu)化數(shù)據(jù)管理,該文模型研究使用SNS 算法,這種算法可根據(jù)敏感識別對數(shù)據(jù)建立虛擬標簽,具體的整理流程如下:1)通過RSSI值收集數(shù)據(jù)并儲存。2)將采集的數(shù)據(jù)進行分類篩選,如果發(fā)現(xiàn)數(shù)據(jù)出現(xiàn)不一致的情況或存在修改痕跡,根據(jù)時間丟棄靠前的數(shù)據(jù)。3)當數(shù)據(jù)緩沖區(qū)達到闔值時,暫時關閉數(shù)據(jù)采集口,并將數(shù)據(jù)存入數(shù)據(jù)池,基于此算法闔值A可得公式(2)。
式中:e為最大權限經(jīng)過持續(xù)匹配數(shù)據(jù)后的條件;u為數(shù)據(jù)采集的標準;p為大數(shù)據(jù)資源在不同數(shù)據(jù)種類中的參數(shù)總量;max 為最大化的整理模式;t為數(shù)據(jù)采集的時間;f為數(shù)據(jù)不同種類標簽的平均值。
引入SNS 算法,對大數(shù)據(jù)采集資源進行全局式整理,利用匹配標簽確定闔值,計算出大數(shù)據(jù)下全局數(shù)據(jù)整理的最優(yōu)解,存入數(shù)據(jù)池等待計算。
將多類型數(shù)據(jù)以集合形式呈現(xiàn),擬定以集合U={U1,U2,...,Un}儲存采集的青少年心理健康數(shù)據(jù),n為不同心理健康評測數(shù)據(jù)的數(shù)量。將青少年對不同問題的回答所對應的心理健康評測評語設為集合Q={Q1,Q2,Q3,Q4},此處Q1、Q2、Q3和Q4分別代表心理健康的4 個量化狀態(tài),包括良好、正常、輕度異常和嚴重異常。采用目前廣泛使用的精神衛(wèi)生量表SCL-90 對心理健康評測因素集合U進行細化,對影響青少年心理健康的因素進行生活環(huán)境、工作類型、學習壓力和情感問題方面的劃分,以幾個子集合表示,可設為B={1,2,…,10},如公式(3)所示。
式中:i∈B0,Ubi=1,Ui=U,i≠0。
此類型的集合代表不同標簽下的數(shù)據(jù)測評子集。心理評測集合中,Ui里每個測評子集內(nèi)分配的權重是Ei={Ei1,Ei2,...,Eis},所有采集數(shù)據(jù)的種類符合。將所有數(shù)據(jù)測評標簽子集分別看作一種心理健康評測集合U,如公式(4)所示。
由此,心理健康數(shù)據(jù)測評的數(shù)據(jù)類型Csn所處的指標矩陣R如公式(5)所示。
設定將青少年心理健康評測數(shù)據(jù)集合U劃分為多個子集合Ui,不同數(shù)據(jù)池內(nèi)的數(shù)據(jù)種類由不同子集合呈現(xiàn),參照心理健康評測集合U中的不同數(shù)據(jù)特性,計算出心理健康評測數(shù)據(jù)權重值D,如公式(6)所示。
式中:d為不同數(shù)據(jù)類型的子集合。
通過公式(6)可計算能夠獲取心理健康測評數(shù)據(jù)的數(shù)據(jù)模型,如公式(7)所示。
獲取向量模型后,將不同的權重值d與心理健康測評因素相結(jié)合,完成青少年個人心理健康評測指標。
測算心理健康評測數(shù)據(jù)采用決策樹算法,這種算法具有可集成同步測算的特性,對某個典型青少年心理健康數(shù)據(jù)信息劃分子集合的方式,對一組集合內(nèi)的測評數(shù)據(jù)進行計算,得出一種以樹狀結(jié)構(gòu)呈現(xiàn)的計算結(jié)果。對此類算法得出的結(jié)果再次進行數(shù)據(jù)類型劃分,以算法的數(shù)據(jù)劃分結(jié)點作為數(shù)據(jù)計算起始點。計算方式為通過數(shù)據(jù)向下劃分的計算順序?qū)?shù)據(jù)池的標簽數(shù)據(jù)進行逐步分類計算。該文采用C4.7 決策樹算法,此算法可將不同數(shù)據(jù)劃分為多個數(shù)據(jù)大類并進行逐層篩選,以克服選取數(shù)據(jù)時由于數(shù)據(jù)存在多個標簽導致數(shù)據(jù)計算重復的問題。基于標簽確定計算數(shù)據(jù)G,如公式(8)所示。
式中:Ga(S,A)為標簽A的數(shù)據(jù)個例數(shù)據(jù);Sa(S,A)為在標簽A的基礎上對數(shù)據(jù)池S進行篩選的結(jié)果。
基于決策樹算法對心理健康數(shù)據(jù)進行分析計算,Sa(S,A)可由公式(9)計算得出。
式中:Si為第i個數(shù)據(jù)個例中處于典型標簽的數(shù)據(jù)。
使用決策樹算法的關鍵點在于如何確定所篩選的數(shù)據(jù)標簽,計算過程中要對比每個參與計算的數(shù)據(jù)的標簽信息,在計算過程中選擇標簽信息被檢索次數(shù)最大的標簽屬性作為主要劃分點。如果該標簽下可以繼續(xù)檢索篩選,將持續(xù)向下計算并劃分數(shù)據(jù)池數(shù)據(jù),獲得更多細化的子集合。劃分方法如下。
首先,對數(shù)據(jù)池中的數(shù)據(jù)標簽屬性A進行離散處理,根據(jù)字符進行排序,將MIN 和MAX 作為最大值和最小值的數(shù)據(jù)標簽,得出對應的標簽屬性集合{A1,A2,…,An}。
其次,將Ai放置于數(shù)據(jù)劃分節(jié)點的位置,設[MIN,MAX]為數(shù)據(jù)池中的數(shù)據(jù)集合,按順序計算出第i個數(shù)據(jù)劃分節(jié)點Ai,如公式(10)所示。
式中:i=1,2,…,N;N為集合中的分節(jié)點數(shù)量。
最后,分別計算經(jīng)Ai分出的2 個集合[MIN,Ai]及[Ai,MAX]中的數(shù)據(jù),將數(shù)據(jù)標簽值設定在對應子集合中,完成心理健康評測數(shù)據(jù)的測算。
心理健康測評結(jié)果模塊采用G-means 聚類算法,根據(jù)采集數(shù)據(jù)內(nèi)容的重復性,即青少年心理健康信息的相似性,相鄰的數(shù)據(jù)池會結(jié)合成一個數(shù)據(jù)組,以獨立的數(shù)據(jù)集合作為最終評測結(jié)果,數(shù)據(jù)集合由相鄰的數(shù)據(jù)組構(gòu)成。基于G-means可使用的聚類算法,并以算法中的計算函數(shù)對不同種類的數(shù)據(jù)結(jié)合進行計算并更新數(shù)據(jù)表,進而達到提高模型生成心理健康測評成果精度的目的,將結(jié)果以最優(yōu)解進行輸出。例如初始測評數(shù)據(jù)可將n個青少年用戶評測數(shù)據(jù)分成g組,數(shù)據(jù)內(nèi)含有n組青少年心理健康評價數(shù)據(jù),經(jīng)過計算得出g個評測結(jié)果。G-means 群集算法的具體工作流程如圖1 所示。
圖1 數(shù)據(jù)測算流程圖
根據(jù)圖1 處理G-means 聚類算法的具體方法如下:1)將從n個青少年采集到的心理健康測試數(shù)據(jù)收入數(shù)據(jù)池,將評價數(shù)量g同批次放置于數(shù)據(jù)池。2)從n個數(shù)據(jù)組中選取g個組數(shù)據(jù),將其作為樣本數(shù)據(jù)并進行數(shù)據(jù)初始化,再根據(jù)數(shù)據(jù)標簽劃分合并成集合,將剩余的測評數(shù)據(jù)劃分到標簽屬性相同的集合中。3)集成完所有的評測數(shù)據(jù)對象集合后,將相同集合的心理健康數(shù)據(jù)進行分布計算。4)根據(jù)相同標簽數(shù)據(jù)計算的結(jié)果,同步獲取對應的心理健康評價。5)輸出青少年心理健康的測評結(jié)果,完成心理健康的測評結(jié)果獲取。
該文試驗基于微軟Vsual Studio 2010 開發(fā),使用C++語言搭建了一個網(wǎng)頁頁面框架。將SQL 作為數(shù)據(jù)儲存服務數(shù)據(jù)庫,以實現(xiàn)測評數(shù)據(jù)可多批次錄入并保持數(shù)據(jù)完整性、確保數(shù)據(jù)的安全。試驗設備包括I5 級10 代處理器、GTX950 顯示卡、2T 機械硬盤和8G 運行內(nèi)存。青少年心理健康評測的網(wǎng)頁頁面以賬戶密碼登錄的方式打開,不同使用人員的評測數(shù)據(jù)通過不同的賬戶進行區(qū)分管理,可以讓使用人員自行選擇適合自身的評測內(nèi)容,即可支持多元化使用。
該文試驗邀請240 位青少年作為測試對象,將通過當前職業(yè)心理醫(yī)師測試成果與試驗模型得出的青少年心理健康結(jié)果做比較,以此來測試該文研究的模型是否可以達到對青少年進行心理健康測試的要求,測試結(jié)果由如圖2 所示。
圖2 測試結(jié)果柱狀圖
圖2 展示了經(jīng)過模型測試得出的心理健康數(shù)據(jù)的人員數(shù)量以及心理健康狀況,應用該文研究的心理健康測評模型對240 名青少年心理健康進行評測后,將4 個評測類型作為成果展示,分別如下:處于心理健康狀態(tài)嚴重異常的有20 人;處于心理健康狀態(tài)輕度異常的有40 人;處于心理健康狀態(tài)正常的有60 人;處于心理健康狀態(tài)良好的有120 人。4 種心理健康狀況的測評情況人員數(shù)量、結(jié)論與職業(yè)心理醫(yī)師測試結(jié)果基本一致,由此可見模型提供的測試結(jié)果具有較高的準確性和可信性。實際應用的結(jié)果具有一定參考意義,可為心理健康測試帶來較好的測試效果,值得在現(xiàn)實生活中廣泛推廣及應用。
考慮當前社會對青少年心理健康重視,該文研究了基于大數(shù)據(jù)下青少年心理健康評測動態(tài)模型,使用VIRE 算法收集青少年心理健康數(shù)據(jù)并使用SNS 算法進行數(shù)據(jù)整理。以數(shù)據(jù)集合的方式確立動態(tài)模型評估指標,將數(shù)據(jù)池內(nèi)的數(shù)據(jù)以子集合形式結(jié)合決策樹算法進行計算,以此測算心理健康評測數(shù)據(jù),計算出的評測數(shù)據(jù)后,使用G-means 聚類算法,通過聚類目標函數(shù)計算獲取心理健康評測結(jié)果,導入對應的心理健康評語,以此完成青少年心理健康智能測評。測試試驗結(jié)果表明,此模型能全面地幫助青少年以及家長了解青少年本身的心理健康狀態(tài),通過測試結(jié)果可及時發(fā)現(xiàn)問題并尋找調(diào)節(jié)心理的有效方式,為社會健康發(fā)展有重要意義。