基于數據挖掘的大學生心理問題分析
郭晶晶
(淮北職業(yè)技術學院 計算機科學技術系,安徽 淮北235000)
摘要:大學生群體面對的來自學習、社會環(huán)境、人際關系等方面的壓力很大,容易產生多種心理問題。本文在大學生心理健康綜合模糊判定系統(tǒng)基礎上,利用最大隸屬度原則,為有心理問題的壓力很大的學生尋找影響其心理健康的因素,為大學生心理健康工作提供技術支持。
關鍵詞:大學生;心理健康;模糊綜合判定;最大隸屬度原則
收稿日期:2015-03-27
作者簡介:郭晶晶(1984-)女,安徽淮北人,淮北職業(yè)技術學院計算機科學技術系助教,研究方向為計算機應用技術。
中圖分類號:G446
各高校都越來越關注大學生心理健康教育的問題。大部分專家學者是采用量表對心理健康問題進行研究。[1]為滿足高校需求,應開發(fā)一個心理健康評價系統(tǒng),按該測評系統(tǒng)指導高校心理健康決策者,對學生進行個性化的人才培養(yǎng)。同時這也有利于各企業(yè)客觀、可靠地識別、選拔和聘用人才。筆者采用模糊綜合評判方法,以期為我國大學生心理健康測評體系的構建提供技術支持。
1相關技術
1.1數據挖掘技術
隨著數據庫技術的成熟和信息化數據的普及應用,社會心理學研究所能利用的數據也隨之積累并迅速擴大,這使得在心理健康領域使用數據挖掘技術有了可能。當前使用的心理學領域的數據挖掘算法有兩個,一個是決策樹:該算法可以分析數據,預測心理問題和行為。二是關聯(lián)規(guī)則:可以通過其找出原因及其對造成某種心理現象的影響程度,確定屬性之間的關系為進一步的研究提供參考。[2]
1.2模糊綜合評判技術
美國自動控制專家扎德(L.A.Zadeh)于1965年發(fā)表了題為《Fuzzy Sets》的論文,宣告模糊數學的誕生。[3]模糊數學原理就是試圖用數學工具解決模糊事物方面的問題。而模糊綜合評價就是以此為基礎,將一些模糊、難以確定的因素定量化,多方面多角度綜合性地對被評價事物隸屬等級進行評價的一種方法。鑒于心理健康是一個模糊的概念,模糊綜合評價方法可以用來建立一個心理健康的模糊綜合評價模型,并給出一系列心理健康評估。
1.3最大隸屬度原則
1965年,美國控制論教授扎德(L.A Zadeh)發(fā)表了名為《模糊集》的論文。他在里面詳細闡述了模糊評價函數里的隸屬度概念。與此相關的,被評價事物對各等級模糊子集的隸屬度構成的評判向量所遵循的原則即為最大隸屬度原則。
2心理測評體系構建
2.1數據準備
筆者向本人所在學校的10個專業(yè)學生發(fā)放匿名調查問卷。問卷的第一部分為選擇填空題,大學生對自身心理健康狀況作出評價。第二部分為開放式問題,由大學生自由回答這部分提出的心理健康問題,不做限制。然后采用分層抽樣的方法抽取學生問卷,共收集到有效問卷410份。
2.2數據分析
通過分析問卷結果得出,大學生認為影響心理健康的因素分別是:壓力大(27.2%)、是否受挫折(15%)、人際關系好壞(12%)、家庭條件(9.5%)、戀情 (8.7%)、學習態(tài)度(8.2%)、順利程度(8.2%)、戀愛失敗(6.3%)、遭遇挫折(5.3%)、考試(5.1%)、成績優(yōu)異(5.1%)、做事是否成功(4%)、朋友多少 (4.0%)、睡眠狀況(2.7%)、學習氛圍(2.1%)等,這15個影響因素詞頻總數為587次。
心理健康所涉及的范疇包括學業(yè)問題(36%)、生活條件(27.%)、人際關系問題(21.%)、家庭情況(10.2%)以及身體狀況(4.%),大學生們選擇的這5個范疇詞頻總數為431次。
2.3模型定義
鑒于上述的調查結果以及心理學專家給出的數據采用加權平均的方法進行處理,我們定義模型如下:
(1) 它們構成的因素集為:U={人際關系,自我評價,社會適應,情緒,人格,意志}。
記為:={u1,u2,u3,u4,u5,u6}
評定論域為:V={ 社會環(huán)境,心理健康教育,學業(yè),家庭經濟情況,戀愛,就業(yè)}。
記為:V={v1,v2,v3,v4,v5,v6}
(1)用ai(i=1…6)表示ui(i=1…6)在大學生心理健康中的模糊權重,得到其模糊權向量為:A=ai=(0.17,0.16,0.17, 0.15,0.17,0.18).
公式①
(2)r1i(i=1,…,6)用來表示vi(i=1,…,6)對u1的影響量,其模糊權向量用R/u1表示;
(3)R/u1=(r11,r12,r13,r14,r15,r16)=(0.17,0.14,0.18,0.15,0.18,0.18)
公式②
(4)rij(i=2,…,6;j=1,…,6)用來表示vj(j=1,…,6)對ui(i=2,…,6)的影響量,其模糊權向量分別用R/u2,R/u3,R/u4,R/u5,R/u6表示,即:
R/u2=(r21,r22,r23,r24,r25,r26)=(0.16,0.13,0.19,0.19,0.15,0.18),
R/u3=(r31,r32,r33,r34,r35,r36)=(0.17,0.17,0.18,0.17,0.14,0.17),
R/u4=(r41,r42,r43,r44,r45,r46)=(0.17,0.16,0.19,0.15,0.16,0.17),
R/u5=(r51,r52,r53,r54,r55,r56)=(0.19,0.16,0.16,0.15,0.16,0.18),
R/u6=(r61,r62,r63,r64,r65,r66)=(0.18,0.16,0.16,0.17,0.14,0.19)。
進而得到其模糊關系矩陣為:
采用M(·,+)算子得到大學生心理健康的模糊綜合評價結果向量為:
b=(b1,b2,b3,b4,b5,b6)=A·R=(0.120,0.106,0.115,0.101,0.103,0.125 )。
其中(b1,b2,b3,b4,b5,b6)代表評定論域對大學生心理健康影響的大小,
j=1,2,3,4,5,6
(1)
然而,對于大學生心理健康的評判,直接應用以上得到的模糊綜合評價結果向量是不科學的。為了在此基礎上更方便的測試每位大學生的心理健康狀況,不妨用“1~6”依次表示)(v1,v2,v3,v4,v5,v6)的秩。利用加權平均原則,即
(2)
可得:Ak=2=(1×0.1202+2×0.1062+3×0.1152+4×0.1012+5×0.1032+6×0.1252)/(0.1202+0.1062+0.1152+0.1012+0.1032+0.1052)=3.50。
(3)
式(3)表明: 填寫此調查表的心理健康的大學生,按照本文的計算方法算出的最后得分應該是3.50附近的數值。
2.4模型精化
雖然通過計算已得到了心理健康的大學生填寫此調查表后得分的參考值點,但我們需要找到一個合理的評定區(qū)間,使此評判方法更為科學實用。為此,我們再次隨機從調查表中抽出200份,把它們平均分成20組,每組都按照上面的方法算出每一份調查表的最后得分,利用公式再求出每組調查表的最后得分的數學期望,結果分別是:
3.40,3.42,3.54,3.30,3.49,3.56,3.66,3.41,3.26,3.52,3.56,3.67,3.53,3.49,3.52,3.47,3.56,3.60,3.46,3.50.
可見,以上20個數學期望中有17個即85%,落入區(qū)間Q1=(3.50×0.97,3.50×1.03)=(3.325,3.605);有2個即10%,落入區(qū)間Q2=(3.56×0.95,3.56×1.05)=(3.325,3.675)。還有1個即5%落入區(qū)間Q3。因此,我們則可把Q1,Q2,Q3分別認為是心理健康、心理亞健康和心理不健康區(qū)間。
2.5預測模型定義
由于使用最大隸屬度原則是需要有一定條件的,所以對于其的有效性問題,則要再探討一下。
首先記:
再由β和γ定義β′和γ′,
則β′∈[0,1],γ′∈[0,1]
由上式知道,α越大,最大隸屬度原則有效性就越高。因此,就用α來度量最大隸屬度原則的有效性。結合探討結果,下面給出了用α對應最大隸屬度原則的有效性情況。
當α≥0.2時,我們就可以用最大隸屬度原則來尋找導致某同學心理健康處于該區(qū)間的原因。反之,若α<0.2時,最大隸屬度原則就不適用了。
3結語
筆者針對當前大學生心理健康狀況,以期為構建以模糊綜合評判為核心思想的大學生心理健康評價體系提供了更好的技術支持,同時也使高校開展心理健康教育工作測量結果更加科學化、客觀化。
參考文獻:
[1]蘭宏勇,化存才,楊俊.貧困大學生心理問題的模糊綜合評判模型[D].云南:云南大學,2008.
[2]劉同明,等.數據挖掘技術及其應用[M].北京:國防大學出版社,2001.
[3]張修文,王國俊,劉旺金,模糊數學引論[M].西安:西安交通大學出版社,1991.
責任編輯:萬方