滕燕
·社會(huì)因素與健康·
聚類與判別分析在大學(xué)生SCL-90測(cè)試結(jié)果中的運(yùn)用
滕燕
目的分析探索SCL-90結(jié)果解釋中判別效果較好的聚類指標(biāo)。方法對(duì)某高校3 638名新生SCL-90測(cè)試結(jié)果進(jìn)行K-均值聚類及逐步判別分析。結(jié)果采用K-均值聚類的方法分類,將測(cè)試結(jié)果分成3組,各組之間差異具有統(tǒng)計(jì)學(xué)意義。其次,通過(guò)逐步判別分析,在11個(gè)聚類指標(biāo)中,選出8個(gè)有統(tǒng)計(jì)學(xué)意義的指標(biāo)構(gòu)建判別模型,用此模型對(duì)3 638個(gè)新生樣本作回顧性評(píng)價(jià),誤判率為2.9%。結(jié)論逐步判別分析發(fā)現(xiàn),通過(guò)SCL-90中的強(qiáng)迫癥狀、人際敏感、抑郁、敵對(duì)、恐怖、偏執(zhí)、精神病性7個(gè)因子分及總均分進(jìn)行聚類分析的判別效果較好。
大學(xué)生; SCL-90; 聚類分析; 判別分析
大學(xué)階段是青年學(xué)生心理發(fā)展的關(guān)鍵時(shí)期,在這一時(shí)期所面臨的環(huán)境改變及適應(yīng),使得大學(xué)生在原生家庭及其社會(huì)化過(guò)程中形成的一系列問(wèn)題突顯。為了解大學(xué)生心理健康狀況和特點(diǎn),有針對(duì)性地實(shí)施干預(yù)及教育,各高校通常在入校新生中開(kāi)展集體心理普查,建立學(xué)生心理檔案。心理健康狀況是一個(gè)動(dòng)態(tài)的過(guò)程,高校大學(xué)生的心理普測(cè)工作,不僅僅是為了衡量該群體的平均心理健康水平與全國(guó)大學(xué)生群體的差異,更是為了區(qū)分出重點(diǎn)關(guān)注人群和亞健康人群,并針對(duì)亞健康人群開(kāi)展相應(yīng)的宣傳教育工作,使亞健康人群逐步發(fā)展成為健康人群。因此,篩查不是為了比較,而如何運(yùn)用該量表的測(cè)試結(jié)果進(jìn)行干預(yù)、教育及跟蹤才更有意義。目前,國(guó)內(nèi)廣泛采用癥狀自評(píng)量表(SCL-90)篩查大學(xué)生心理衛(wèi)生問(wèn)題,本文通過(guò)判別分析探索SCL-90結(jié)果解釋中判別效果較好的聚類指標(biāo),為開(kāi)展大學(xué)生心理普查提供具有實(shí)效性的指標(biāo)體系。
1.1 研究對(duì)象
以某高校剛?cè)胄5囊荒昙?jí)本科學(xué)生為研究對(duì)象,進(jìn)行心理健康普查。共有4 138人接受測(cè)試,回收有效問(wèn)卷3 638份,其中女生2 099人,男生1 629人;有效回收率87.9%。
1.2 測(cè)量工具
運(yùn)用Derogatis等在20世紀(jì)70年代編制癥狀自評(píng)量表(SCL-90),該量表用于評(píng)定一個(gè)人是否具有某種心理癥狀,臨床上常用其作為精神科咨詢門(mén)診的篩查量表。但在實(shí)際使用中,該量表也有一定的限制。首先,SCL-90量表沒(méi)有分界值,對(duì)大學(xué)生SCL-90測(cè)試結(jié)果的評(píng)定,大多采用單一的評(píng)價(jià)標(biāo)準(zhǔn),僅可以篩選出考慮陽(yáng)性癥狀者,存在假陽(yáng)性率較高的問(wèn)題。其次,面對(duì)SCL-90測(cè)試結(jié)果假陽(yáng)性率較高的問(wèn)題,部分高校通常還會(huì)同時(shí)運(yùn)用其他量表權(quán)衡評(píng)價(jià)。而這樣的評(píng)價(jià)大多依據(jù)施測(cè)者的經(jīng)驗(yàn)開(kāi)展,如將單一的評(píng)價(jià)標(biāo)準(zhǔn)由2分提至3分,或其中幾個(gè)因子分都高于2分或3分以上者考慮篩查為陽(yáng)性,但各高校都沒(méi)有一個(gè)統(tǒng)一的標(biāo)準(zhǔn)。再次,大多數(shù)研究把SCL-90用來(lái)比較被試群體在常模中的相對(duì)位置,使SCL-90的測(cè)量性質(zhì)發(fā)生了變化,變成了常模的參照測(cè)驗(yàn)和診斷工具[1]。
1.3 評(píng)定標(biāo)準(zhǔn)
依據(jù)SCL-90傳統(tǒng)結(jié)果的解釋方法,以總分超過(guò)160分,或陽(yáng)性項(xiàng)目數(shù)超過(guò)43項(xiàng),或任意因子分超過(guò)2分,評(píng)定篩選為陽(yáng)性[2]。
1.4 研究方法
采用集體施測(cè)的方法,對(duì)大學(xué)生進(jìn)行SCL-90量表測(cè)試;運(yùn)用K-均值聚類的方法分類,通過(guò)判別分析SCL-90結(jié)果,解釋其中判別效果較好的聚類指標(biāo);采用統(tǒng)計(jì)軟件SPSS 17.0的K-均值聚類分析及逐步判別分析的方法對(duì)數(shù)據(jù)進(jìn)行處理。
2.1 單一指標(biāo)篩查結(jié)果
本次測(cè)試結(jié)果顯示,有1 528人SCL-90任意因子分大于2分,有617人總分超過(guò)160分,有1 161人陽(yáng)性項(xiàng)目數(shù)超過(guò)43項(xiàng)。見(jiàn)表1。
表1 SCL-90量表各單一標(biāo)準(zhǔn)評(píng)價(jià)的陽(yáng)性癥狀人數(shù)比例 n(%)
2.2 K-均值聚類結(jié)果
以3 638名大學(xué)生的SCL-90測(cè)試得分為基礎(chǔ),包括10個(gè)因子分及總均分(general symptomatic index,GSI)進(jìn)行K-均值的聚類,將被試者分成三類。當(dāng)面對(duì)大量零散數(shù)據(jù)的時(shí)候,聚類不需要事先根據(jù)每個(gè)樣本對(duì)象的特征去確定隸屬,而是自動(dòng)依據(jù)各個(gè)樣本對(duì)象的特征相似度值的大小去劃分簇類[3],因而各組之間沒(méi)有明確的劃界值。第一類學(xué)生各因子均值大于2分或接近2分,介于1.89~2.56分之間,稱為陽(yáng)性癥狀組,共326人,占總?cè)藬?shù)的9.0%;第二類學(xué)生各因子均值在1.48~2.01分之間,稱為亞健康組,共1 287人,占總?cè)藬?shù)的35.4%;第三類學(xué)生各因子均值在1.17~1.50分之間,稱為健康組,共2 025人,占總?cè)藬?shù)的55.6%;通過(guò)方差分析,三組分類之間差異具有統(tǒng)計(jì)學(xué)意義(P<0.01),但三組之間的各因子均值分?jǐn)?shù)有交叉,交叉數(shù)據(jù)主要表現(xiàn)在強(qiáng)迫癥狀這一因子分上,而強(qiáng)迫癥狀較其他因子分普遍較高,因而還需要通過(guò)逐步判別分析判別聚類的效果。見(jiàn)表2。
2.3 判別分析
2.3.1逐步判別分析結(jié)果利用聚類分析結(jié)果,將大學(xué)生SCL-90的10個(gè)因子得分及GSI共11個(gè)變量,按照陽(yáng)性癥狀組、亞健康組、健康組分成三類,組成3 638個(gè)訓(xùn)練樣本,應(yīng)用逐步判別分析方法,進(jìn)行變量的篩選、判別函數(shù)模型的構(gòu)建,并對(duì)模型作回顧性評(píng)價(jià)。最終結(jié)果進(jìn)入模型的變量有:強(qiáng)迫癥狀(X1)、人際敏感(X2)、憂郁(X3)、敵對(duì)(X4)、恐怖(X5)、偏執(zhí)(X6)、精神病性(X7)、總均分(X8),得到3個(gè)判別函數(shù):
Y1=-3.76X1-0.64X2-4.31X3+3.92X4+4.16X5+2.21X6-0.97X7+108.68X8-121.51(陽(yáng)性癥狀組)
Y2=-1.67X1-2.29X2-4.51X3+2.11X4+2.07X5+1.53X6+0.14X7+65.40X8-39.84(亞健康組)
Y3=-1.80X1-1.08X2-5.60X3+2.33X4+2.11X5+2.41X6-1.05X7+85.04X8-69.10(健康組)
指標(biāo)陽(yáng)性癥狀組[n=326(9%)]亞健康組[n=1287(35%)]健康組[n=2025(56%)]F值P值軀體化189±041148±027117±017159449<001強(qiáng)迫癥狀256±041201±029150±027248444<001人際敏感249±042185±029133±023325601<001抑郁221±041160±025120±017312309<001焦慮230±038173±025128±020324385<001敵對(duì)202±048152±032117±019160017<001恐怖214±051163±030119±022160831<001偏執(zhí)209±045164±030123±021189905<001精神病性212±040162±025126±019224139<001其他213±046163±031124±022174895<001總均分221±025167±013126±013750253<001
注:P值為雙側(cè)檢測(cè)
2.3.2回顧性判別效果評(píng)價(jià)將3 638名訓(xùn)練樣本做回代判別函數(shù)的檢驗(yàn),陽(yáng)性癥狀組共有326人,用判別函數(shù)回代分類,與實(shí)際相符的285人,錯(cuò)分到亞健康組41人,陽(yáng)性癥狀組分類的準(zhǔn)確率為87.4%;健康組共有2 025人,用判別函數(shù)回代分類,與實(shí)際相符的2 019人,錯(cuò)分到亞健康組6人,健康組分類的準(zhǔn)確率為99.7%;亞健康組共有1 287人,用判別函數(shù)回代分類,與實(shí)際相符的1 228人,錯(cuò)分到健康組57人,陽(yáng)性癥狀組2人,亞健康組分類的準(zhǔn)確率為95.4%。誤判率為2.9%(106/3 638)。見(jiàn)表3。
表3 SCL-90聚類分析的判別回代統(tǒng)計(jì)表
注:樣本劃分正確率為97.1%
3.1 單一篩查標(biāo)準(zhǔn)的陽(yáng)性癥狀檢出率較高
采用“任意因子分超過(guò)2分”的標(biāo)準(zhǔn),篩查為陽(yáng)性癥狀者占被試人數(shù)的42.0%,由于要排除的人群范圍過(guò)大,在一定程度上也降低了心理健康教育工作的實(shí)效性。其次,SCL-90量表的每一個(gè)因子反映被試某一方面癥狀的痛苦情況,且通常是評(píng)定一周以來(lái)的心理健康狀況。對(duì)于剛?cè)胄5拇髮W(xué)生而言,面臨新環(huán)境的適應(yīng),采用單一因子的評(píng)價(jià)標(biāo)準(zhǔn),更易造成對(duì)被試群體的誤判,這也是陽(yáng)性癥狀人數(shù)過(guò)高引起爭(zhēng)議的主要原因之一。
3.2 運(yùn)用K-均值聚類縮小了目標(biāo)人群的篩查范圍
國(guó)內(nèi)版SCL-90量表包括90個(gè)項(xiàng)目,主要有三個(gè)總體指標(biāo):第一,總癥狀指數(shù)分(GSI);第二,陽(yáng)性癥狀指標(biāo)(positive symptom distress index,PSDI);第三,陽(yáng)性癥狀(derogatis,1983)。其中,GSI是當(dāng)前癥狀水平最好的單一指標(biāo)[4]。盡管GSI是當(dāng)前癥狀水平的最好指標(biāo),但它仍是單一的評(píng)價(jià)指標(biāo)。其次,單茂洪[5]認(rèn)為,SCL-90對(duì)有心理癥狀的人有良好的區(qū)分能力,能較好地區(qū)分他們的心理健康水平。但它對(duì)沒(méi)有或有較少心理癥狀者的心理健康水平缺少區(qū)分能力。因此,對(duì)SCL-90的結(jié)果分析不能僅用單一的評(píng)價(jià)指標(biāo),并且除單個(gè)的因子分外,還應(yīng)引入GSI,即總均分這一指標(biāo)進(jìn)行評(píng)價(jià)。
比較表1及表2,運(yùn)用聚類分析的方法,所得的數(shù)據(jù)分布合理,且三組之間的差異具有統(tǒng)計(jì)學(xué)意義。運(yùn)用聚類分析可以方便地對(duì)數(shù)據(jù)進(jìn)行分析,從而達(dá)到理想的目的;同時(shí)也可作為特征和分類等算法的預(yù)處理步驟[6];識(shí)別觀測(cè)量中相類似的分組[7]。因此,通過(guò)聚類分析可以提高SCL-90量表對(duì)亞健康人群的區(qū)分能力,縮小篩查范圍,并有針對(duì)性地開(kāi)展宣傳教育工作。
3.3 軀體化、其他及焦慮3個(gè)因子分在進(jìn)行K-均值聚類時(shí)應(yīng)予以排除
判別分析是根據(jù)觀測(cè)到的某些指標(biāo)對(duì)所研究的對(duì)象進(jìn)行分類的一種分析方法,其中“逐步判別分析”可以在眾多指標(biāo)中挑選一些有顯著作用的指標(biāo)來(lái)建立一個(gè)判別函數(shù),使方程內(nèi)的指標(biāo)都有顯著的判別作用。而判別效果一般用誤判率來(lái)衡量,并要求判別函數(shù)的誤判率小于10%或20%才有應(yīng)用價(jià)值[8]。本文應(yīng)用逐步判別分析,對(duì)10個(gè)因子分及總均分進(jìn)行變量篩選,結(jié)果進(jìn)入模型的變量有:強(qiáng)迫癥狀、人際敏感、憂郁、敵對(duì)、恐怖、偏執(zhí)、精神病性、總均分。進(jìn)一步對(duì)3 638個(gè)樣本作回顧性的判別效果評(píng)價(jià),誤判率為2.9%,說(shuō)明判別分析可信。其次,運(yùn)用SCL-90中的強(qiáng)迫癥狀、人際敏感、憂郁、敵對(duì)、恐怖、偏執(zhí)、精神病性、總均分,通過(guò)判別函數(shù)的計(jì)算即可區(qū)分出某個(gè)體是否屬于陽(yáng)性癥狀組或亞健康,或是健康組。在逐步判別分析階段,軀體化、其他及焦慮3個(gè)因素因判別效果不顯著被排除,僅用強(qiáng)迫癥狀、人際敏感、憂郁、敵對(duì)、恐怖、偏執(zhí)、精神病性、總均分8個(gè)因素進(jìn)行聚類,在一定程度上提升了聚類的效果,減少了不同組別之間的數(shù)據(jù)交叉[9-10]。然而,判別函數(shù)是根據(jù)樣本信息得到的,故可能夸大了判別效果[11]。因此,在今后的研究及運(yùn)用中,還應(yīng)通過(guò)考核樣本作前瞻性判別效果的評(píng)價(jià),以說(shuō)明本研究構(gòu)建的判別模型的判別效果。
[1] 高旭,毛志雄,周忠革.臨床癥狀自評(píng)量表在心理健康評(píng)定中的誤區(qū)[J].中國(guó)心理衛(wèi)生雜志,2006,20(10):684-686.
[2] 雨帆.心理測(cè)試[M].北京:文匯出版社,2008.
[3] 孫卓.K-均值聚類算法及其應(yīng)用[J].農(nóng)業(yè)網(wǎng)絡(luò)信息,2013(7),41-44.
[4] 謝華,戴海崎.SCL-90量表評(píng)價(jià)[J].神經(jīng)疾病與精神衛(wèi)生,2006,6(2):156-157.
[5] 邊俊士,井西學(xué),莊娜.癥狀自評(píng)量表(SCL-90)在心理健康研究中應(yīng)用的爭(zhēng)議[J].中國(guó)健康心理學(xué)雜志,2008,16(2):231-233.
[6] 單茂洪.正確使用SCL-90、16 PF量表測(cè)查心理健康水平[J].中國(guó)心理衛(wèi)生雜志,1998,12(2):81-82.
[7] 彭學(xué)君.聚類分析在數(shù)據(jù)挖掘中的應(yīng)用探究[J].科教文匯,2007(9Z):216-216.
[8] 孫振球.醫(yī)學(xué)統(tǒng)計(jì)學(xué)[M].北京:人民衛(wèi)生出版社,2002.
[9] 賀穎,曾晶,袁權(quán)龍.大一新生SCL-90自評(píng)癥狀量表評(píng)定結(jié)果分析[J].教育文化論壇,2015(6):65-71.
[10] 趙曉燕.某后勤部隊(duì)162名戰(zhàn)士SCL-90自評(píng)結(jié)果分析[J].醫(yī)藥前沿,2014(8):137.
[11] 趙曉軍.基于SCL-90量表的大學(xué)生心理健康狀況調(diào)查研究[J].佳木斯職業(yè)學(xué)院學(xué)報(bào),2016(4):225.
TheApplicationofClusterAnalysisandDiscriminantAnalysisintheResultsofCollegeStudentsSCL-90Test
TENG Yan.
YunnanUniversityMentalHealthCounselingCenter,Kunming,650091,China
ObjectivesThrough cluster analysis of freshmen's cores from SCL-90,seeking some effective target variables in the data from cluster analysis.MethodsTo evaluate the psychology health of 3 638 freshmen by Cluster analysis and stepwise discriminant analysis.Results3 638 freshmen were divided into 3 groups by cluster analysis.In addition,a function on predicting was established by stepwise discriminant analysis,which included 8 target variables out of 11,which were from the scores of SCL-90.3 638 freshmen were evaluated retrospectively by the function with the error rate of 2.9%.ConclusionsTo evaluate the scores of SCL-90,compulsion,interpersonal sensitivity,depression,hostility,terror,paranoid,psychoticism factor and GSI of SCL-90 has larger discriminant significance to cluster analysis of SCL-90.
College students; SCL-90; Cluster analysis; Discriminant analysis
R395.6
A
10.3969/j.issn.1673-5625.2017.05.013
2016-11-03)(本文編輯 喬巖)
云南大學(xué)心理健康咨詢服務(wù)中心,云南 昆明,650091
中國(guó)社會(huì)醫(yī)學(xué)雜志2017年5期