摘" 要:在多樣的社會環(huán)境下,由于心理、生理、環(huán)境、學業(yè)、社會等多方面因素,導致學生壓力劇增。為了找到影響學生壓力的主要原因并解決學生壓力過大問題,文章選用了多方面因素影響學生壓力的數(shù)據(jù)集,利用Apriori算法研究了與學生壓力相關的多方面因素的影響情況,分析了不同因素與壓力的頻繁項集和關聯(lián)規(guī)則,發(fā)現(xiàn)了焦慮問題、睡眠問題、環(huán)境安全、霸凌等問題對學生壓力影響較大。研究結果顯示,減輕學業(yè)壓力、抵制霸凌和改善學生生活環(huán)境有助于降低學生的壓力。
關鍵詞:學生壓力;Apriori算法;多元因素;關聯(lián)規(guī)則
中圖分類號:TP391" 文獻標識碼:A" 文章編號:2096-4706(2024)23-0048-06
Mining and Analysis of Multiple Factors of Student Stress Based on Apriori Algorithm
SHEN Yue1, ZHANG Yihan1, WANG Wanwan2
(1.School of Artificial Intelligence and Big Data, Henan University of Technology, Zhengzhou" 450001, China;
2.iFLYTEK Co., Ltd., Hefei" 230088, China)
Abstract: In a variety of social environments, due to psychological, physiological, environmental, academic, social and other factors, the student stress has increased dramatically. In order to find the main causes of student stress and solve the problem of excessive student stress, this paper selects the dataset of multiple factors affecting student stress, uses the Apriori algorithm to research the influence situation of multiple factors related to student stress, and analyzes the frequent item sets and association rules of different factors and stress, then finds that anxiety problems, sleep problems, environmental safety, bullying and other problems have a great impact on student stress. Research results show that reducing academic stress, resisting bullying and improving the living environment of students can help reduce student stress.
Keywords: student stress; Apriori algorithm; multiple factors; association rule
0" 引" 言
在當今復雜多變的社會環(huán)境中,學生面臨著日益增長的壓力,這些壓力不僅來源于學業(yè)上的高要求和激烈的教育競爭,還包括來自家庭、同伴以及社會環(huán)境等多方面的挑戰(zhàn)。研究顯示,長期的心理壓力會影響睡眠、飲食等,極大降低學生對生活的積極性;同時,在高壓力狀態(tài)下,學生容易感到疲憊和焦慮,注意力和專注力會下降,影響學習效果[1]。因此,如何有效緩解學生群體中普遍存在的壓力問題,已經(jīng)成為當前教育科學研究及心理健康領域亟待解決的關鍵議題之一,探討影響學生壓力的多元因素已成為教育科學與心理健康領域的重要課題。
近年來,數(shù)據(jù)挖掘技術的發(fā)展為我們提供了強有力的工具,可用于深入分析和理解學生壓力的原因。Apriori算法作為一種廣泛應用于關聯(lián)規(guī)則學習領域的經(jīng)典方法,在探索不同變量間潛在聯(lián)系方面展現(xiàn)出了巨大優(yōu)勢。吳萌[2]利用Apriori算法進行監(jiān)獄警察心理健康調查得出:受工作內(nèi)容和工作環(huán)境影響,監(jiān)獄警察普遍存在“內(nèi)向、抑郁、焦慮、堅強”的心理特征;劉統(tǒng)青等人[3]利用Apriori算法挖掘出中小學生心理健康中隱藏的信息,對引導中小學生心理健康有著重要的警示與教育意義。實驗分析睡眠質量、欺凌行為、社會環(huán)境等關鍵變量,能夠揭示這些因素如何相互作用,便于全面理解影響學生壓力的內(nèi)在機制。實驗的研究成果將為教育工作者、心理健康專家和政策制定者提供有價值的參考,幫助他們采取更加有效的措施,為學生的心理健康和學業(yè)發(fā)展提供支持。
1" Apriori算法
關聯(lián)規(guī)則挖掘旨在發(fā)現(xiàn)海量數(shù)據(jù)集中項目之間的強有趣模式[4-5]。Apriori算法是一種迭代的逐層搜索方法,用于在數(shù)據(jù)庫中識別頻繁項集并生成關聯(lián)規(guī)則。首先,對數(shù)據(jù)庫進行一次掃描,通過設定的支持度閾值,篩選出支持度超過該閾值的單個項,形成頻繁1-項集L1。在第k次掃描(k>1)中,利用上一次得到的頻繁項集Lk-1生成候選k-項集Ck。然后,再次掃描數(shù)據(jù)庫計算候選項集Ck中每個項集的支持度,并篩選出滿足最低支持度閾值的項集,從而得到頻繁k-項集Lk。這個過程會重復進行,直到生成的候選項集Ck為空。最后,對于每一個頻繁項集,生成可能的規(guī)則形式,計算每個規(guī)則的置信度,并過濾出置信度大于或等于設定閾值的規(guī)則,最終得出強關聯(lián)規(guī)則。算法流程如圖1所示。
相關參數(shù)的支持度計算公式為:
(1)
其中,count(x)表示包含項集x的交易數(shù)量,n表示總交易數(shù)量。
置信度是指在包含項集A的交易中,同時也包含項集B的交易比例,計算公式為:
(2)
2" Apriori算法在學生壓力多元因素中的應用
2.1" 數(shù)據(jù)來源
本研究采用了1 000名學生的心理壓力數(shù)據(jù),數(shù)據(jù)主要分為五大類:心理因素、生理因素、環(huán)境因素、學術因素、社會因素。心理因素包括焦慮水平(AL)、自尊水平(SE)、心理健康病史(MH)、抑郁情況(DP);生理因素包括:頭痛問題(HA)、血壓問題(XY)、睡眠質量(SM)、呼吸問題(HX);環(huán)境因素包括:環(huán)境噪音情況(ZY)、居住條件(LC)、環(huán)境安全情況(SF)、基本需求滿足情況(BN);學術因素:學業(yè)表現(xiàn)(AP)、學業(yè)負擔(SL)、師生關系(TSR)、未來職業(yè)擔憂(FC);社會因素:社會支持(SS)、同輩壓力(PP)、課外活動(EA)、霸凌問題(BL),以及壓力水平(ST)屬性在內(nèi)的共21個屬性。圖2中展示了五種不同因素所包含的屬性及壓力水平的分布情況。
箱線圖是對數(shù)據(jù)進行“壓縮”以后得到的,可以看到數(shù)據(jù)分布的大致形狀,也可以收集一組數(shù)據(jù)的四分位數(shù)、范圍和異常值等信息。箱線圖除了可以看到數(shù)據(jù)分布的大致形狀,還可以收集一組數(shù)據(jù)的四分位數(shù)、范圍和異常值等信息。從圖2不同因素所含屬性的箱線圖中可以看出,各屬性的數(shù)據(jù)大致集中在中間區(qū)域,極少出現(xiàn)極端數(shù)據(jù),這體現(xiàn)了數(shù)據(jù)的合理性和可靠性。此外,通過對1 000名學生的壓力水平分布地剖析,可以發(fā)現(xiàn)這些數(shù)據(jù)呈現(xiàn)均勻分布的特征,表明了數(shù)據(jù)調查的廣泛性和普及性,反映了研究樣本的多樣性和全面性。抽取原始數(shù)據(jù)主要指標如表1所示。
2.2" 數(shù)據(jù)清洗與預處理
首先進行數(shù)據(jù)規(guī)范化處理依據(jù)癥狀自評量表SCL9[6]對心理測試的標準,本研究將部分屬性值按照區(qū)間劃分成五個類別,包括睡眠質量(SM)、呼吸問題(HX)、環(huán)境噪音情況(ZY)、居住條件(LC)、環(huán)境安全情況(SF)、基本需求滿足情況(BN)、學業(yè)表現(xiàn)(AP)、學業(yè)負擔(SL)、師生關系(TSR)、未來職業(yè)擔憂(FC)、社會支持(SS)、同輩壓力(PP)、課外活動(EA)、霸凌問題(BL)這14個屬性依照“0=從無”“1=很輕”“2=中等”“3和4=偏重”“5=嚴重”進行分類;焦慮水平(AL)依照“0~4=輕度”“5~10=中輕度”“11~15=中度”“16~20=中高度”“21=嚴重”進行分類;自尊水平(SE)依照“0~6=較低”“7~12=中低”“13~18=中等”“19~24=中高”“25~30=較高”進行劃分;心理健康病史(MH)依照“0=無”“1=有”進行劃分;抑郁情況(DP)依照“0~6=輕度”“7~12=中度”“13~18=中重度”“19~24=重度”“25~27=極重度”進行劃分;頭痛問題(HA)依照“0=從無”“1=輕微”“2和3=中度”“4=較頻繁”“5=嚴重”進行劃分;血壓問題(XY)依照“1=正常血壓”“2=輕度高血壓”“3=嚴重高血壓”進行劃分;壓力水平(ST)依照“0=低壓力”“1=中度壓力”“2=嚴重壓力”進行劃分。學生心理健康壓力調查表主要因素的描述如表2所示。
2.3" 數(shù)據(jù)的相關性
熱力圖是一種非常直觀且高效的可視化工具,用于展示相關系數(shù)矩陣中各變量之間的相關性強弱,它通過顏色的深淺變化來形象地表示相關性。具體來說,當相關系數(shù)大于0時,意味著兩個變量之間存在正相關關系,即一個變量的增加往往伴隨著另一個變量的增加;相反,如果相關系數(shù)小于0,則表明兩者之間存在負相關關系,即一個變量的增加通常會導致另一個變量的減少;而當相關系數(shù)等于0時,則說明這兩個變量之間沒有明顯的線性關系或者這種關系非常微弱。通過利用圖3相關性熱力分布圖,可以幫助我們理解和解釋復雜數(shù)據(jù)集中的多變量關系,而不局限于某些特定的變量組合。
從圖3中可以看出,壓力水平與焦慮水平、心理健康病史、抑郁情況、頭痛問題、環(huán)境噪音情況、未來職業(yè)擔憂、同輩壓力、課外活動、霸凌問題之間呈現(xiàn)正相關,且兩者之間的相關性高達0.65以上;壓力水平與自尊水平、睡眠質量、環(huán)境安全情況、基本需求滿足情況、居住條件、學業(yè)表現(xiàn)、師生關系呈現(xiàn)負相關,且負相關達到0.67以上。
通過對數(shù)據(jù)的分析,可以更好地理解心理健康問題的復雜性和多因素性質,有助于識別出那些可能面臨較高壓力水平的學生,而且還可以為制定針對性的干預措施提供依據(jù)。例如,通過改善居住條件、減輕學習負擔、提供社交支持等方式,可能有助于降低個體的壓力水平,進而改善其整體心理健康狀況[8]。
2.4" 挖掘頻繁項集
在測試的學生中,約34%為低壓力狀態(tài),32.5%為中度壓力狀態(tài),33.5%為嚴重壓力狀態(tài)。頻繁項集是指支持度大于等于最小支持度(min_sup)的集合。其中支持度是指某個集合在所有事務中出現(xiàn)的頻率。為更好地反映影響學生壓力的因素,利用Apriori算法找出和學生壓力水平有關的頻繁項集。利用Apriori算法找出頻繁項集,如表4所示。
從表4的頻繁項集中可以看出:
在心理因素方面,嚴重焦慮、有過心理健康病史和嚴重壓力同時出現(xiàn)的概率高達19.2%,有極高自尊水平、沒有過心理健康病史和低壓力水平往往同時出現(xiàn);在生理因素方面,輕微睡眠問題、輕度高血壓以及輕度高血壓、中度的呼吸問題和嚴重壓力往往同時出現(xiàn);在環(huán)境因素方面,中度的環(huán)境安全問題、較差的居住條件以及較低的基本需求滿足情況往往會出現(xiàn)嚴重壓力,良好的居住條件和低壓力往往同時出現(xiàn);在學業(yè)因素方面,學業(yè)負擔較重往往與嚴重壓力同時出現(xiàn)的概率高達28.5%,對未來不存在擔憂與無壓力往往同時出現(xiàn);在社會因素方面,社會支持較低、適度的課外活動與嚴重的壓力常常同時出現(xiàn),經(jīng)歷過偏重霸凌、社會支持度低與嚴重壓力往往同時出現(xiàn),輕度的霸凌問題與低心理壓力同時出現(xiàn)的概率較大。
通過頻繁項集,可以看出學生的心理壓力往往與心理焦慮、有過心理健康病史、睡眠問題、環(huán)境安全問題、基本需求滿足情況、對未來的擔憂、社會支持、霸凌問題等因素息息相關。
2.5" 挖掘關聯(lián)規(guī)則
關聯(lián)規(guī)則用來描述兩個或多個事物之間的關聯(lián)性,通過一件或多件事物來預測其他事物,可以從大量數(shù)據(jù)中獲取有價值的信息。一般地,給定一個數(shù)據(jù)庫,挖掘關聯(lián)規(guī)則的問題可以轉換為尋找滿足最小支持度和最小置信度閾值的強關聯(lián)規(guī)則過程[9]。利用頻繁項集得出主要關聯(lián)規(guī)則如表5所示。
表5中列舉了心理、生理、社會、環(huán)境和學術五個不同方面與學生壓力之間的關聯(lián)規(guī)則,通過上表分析可知,MH1(有心理健康病史)和AL3(重度焦慮)、XY2(嚴重高血壓)和 SM1(差的睡眠)、AP1(學業(yè)表現(xiàn)低)、BL3(較大霸凌)和SS1(社會支持輕微),以上各情形均會有90%以上的可能導致嚴重壓力,是造成學生壓力主要影響因素;XY2(嚴重高血壓)和HX3(嚴重呼吸問題)、BN1(基本需求滿足低)、LC1(差的居住條件)、SF1(不安全)、 EA3(課外活動較大)和SS1(社會支持輕微)等都有85%以上的可能導致ST2(嚴重壓力)。同時,XY0(正常血壓)和HA2(中度頭痛)、FC2(未來職業(yè)適度擔憂)分別有100%和約84%可能會引起ST1(中等壓力);此外,SE4(較高自尊水平)和MH0(無心理健康病史)、BL1(輕度的霸凌問題)與ST0(輕微壓力)具有強關聯(lián)性,且置信度高達90%以上。
3" 結果分析
通過上述研究結果可以得出:
1)有心理健康病史的學生往往存在較高的焦慮水平,這種焦慮反過來可能導致更大的壓力;具有較高自尊水平的人往往會在面對壓力時表現(xiàn)出更好的應對能力,而且這些個體通常沒有心理健康病史。為此,自尊心的提升可能是降低壓力和心理問題的重要方式;針對有心理健康病史和高焦慮水平的學生,可以設計心理干預治療方案,例如表揚、保證、鼓勵、合理化和重構[10],降低焦慮和壓力水平。
2)嚴重高血壓往往伴隨嚴重的健康問題,如呼吸困難和睡眠質量差,這種生理上的不適可能加劇個體的壓力感,形成惡性循環(huán),高血壓本身就可能導致身體機能的下降,進而影響心理狀態(tài)。建議提供心理健康教育和干預,以幫助學生應對壓力,尤其是在經(jīng)歷生理健康問題時。
3)居住環(huán)境的惡劣直接影響個體的心理狀態(tài):狹小、衛(wèi)生條件差或缺乏必要設施的居住環(huán)境,容易導致學生感到壓抑和不安,這會增加學生心理負擔;學生生活在高犯罪率或不安全的環(huán)境中,會造成持續(xù)的恐懼感和焦慮,這種不安全感會導致學生處于高壓狀態(tài)。相反,在良好的居住條件下,個體更容易感受到滿足和幸福,心理上更為穩(wěn)定,良好的環(huán)境能夠促進個體的健康心理狀態(tài),表現(xiàn)為無壓力的狀態(tài)。
4)當學生的成績低于預期時,可能會面臨來自家庭、學校和自身的巨大壓力;對未來職業(yè)的擔憂往往會使學生感受到壓力。相反,學生在學業(yè)上相對穩(wěn)定,并且對未來有一定的信心,極大地緩解了學生壓力,從而促進學習和發(fā)展。
5)課外活動雖然可以提升技能和自信,但過多的課外負擔或者缺少足夠的支持,反而會導致焦慮和壓力增加;霸凌使學生感到孤立無援,加上缺乏社會支持使得他們在面對這些困擾時更加無力,加重心理負擔。當在無霸凌和經(jīng)歷霸凌較輕的情況下,學生處于無壓力狀態(tài)。這表明在某些情況下,學生能夠較好地應對相對輕度的霸凌行為。由此,學校和家庭應該加強對學生的支持,提供情感上的關懷和實際的幫助,以應對課外活動和霸凌問題帶來的壓力。
4" 結" 論
降低學生壓力有利于維護學生的心理健康,提高學生對生活和學習的熱情,促進學生個性發(fā)展、全面發(fā)展。本文基于Apriori算法探究了包括學生壓力在內(nèi)的與學生壓力相關的多方面因素之間的關聯(lián)性,通過研究結果可以挖掘出導致學生沉重壓力的重要原因,對研究學生壓力的心理健康教育部門提供了有效的參考。
參考文獻:
[1] 徐晨欣.創(chuàng)造性應對方式對學業(yè)情緒和學業(yè)壓力的影響:機制探討與干預研究 [D].上海:華東師范大學,2023.
[2] 吳萌.一種Apriori算法在監(jiān)獄警察心理健康調查中的應用 [J].兵工自動化,2024,43(9):24-27.
[3] 劉統(tǒng)青.基于Apriori算法的中小學生心理問題數(shù)據(jù)挖掘研究 [D].濟南:齊魯工業(yè)大學,2023.
[4] WANG Z C ,XUE L X. A Fast Algorithm for Mining Association Rules in Image [C]//2014 IEEE 5th International Conference on Software Engineering and Service Science.Beijing:IEEE,2014:513-516.
[5] 付春璐.職高生負性生活事件與自我效能感的關系研究:數(shù)據(jù)挖掘技術的應用 [D].貴陽:貴州師范大學,2024.
[6] 孫洪濤,張明元.癥狀自評量表(SCL—90)測評結果的研究報告——黑河市第一人民醫(yī)院部分在職職工心理測評結果研究 [J].黑河學刊,2014(6):141-144.
[7] 孫偉平.決策樹技術在大學生心理健康測評中的應用研究 [D].鄭州:鄭州大學,2020.
[8] 榮利,劉彬,高發(fā)亮.新時代高校學生心理健康教育的難點與對策 [J].科教導刊,2024(10):140-142.
[9] 崔妍,包志強.關聯(lián)規(guī)則挖掘綜述 [J].計算機應用研究,2016,33(2):330-334.
[10] 張波,季鑫.基于支持性心理治療理論的學生疫情心理干預 [J].中學政治教學參考,2020(12):29-30.
作者簡介:申悅(2004—),女,漢族,河南南陽人,本科在讀,研究方向:數(shù)據(jù)科學與大數(shù)據(jù)技術;張一涵(2004—),女,漢族,河南周口人,本科在讀,研究方向:數(shù)據(jù)科學與大數(shù)據(jù)技術;王彎彎(1992—),女,漢族,河南鄭州人,高級工程師,講師,碩士,研究方向:數(shù)據(jù)挖掘、計算機視覺。