陳宇 潘瑩瑩 王嫻 祖冠群 孫曉松 艾玉波
摘 要:文中利用SPSS軟件對(duì)統(tǒng)計(jì)專業(yè)學(xué)生的成績(jī)進(jìn)行聚類分析,將學(xué)生分為四類,分析了每類學(xué)生的能力傾向,并進(jìn)行了相應(yīng)的就業(yè)指導(dǎo)。
關(guān)鍵字:SPSS;聚類分析;能力傾向;就業(yè)指導(dǎo)
注:本文為江蘇省2013年大學(xué)生實(shí)踐創(chuàng)新項(xiàng)目論文。
1 聚類分析原理
聚類分析是統(tǒng)計(jì)學(xué)中研究“物以類聚”問(wèn)題的多元統(tǒng)計(jì)分析方法,它能夠?qū)⒁慌鷺颖荆ɑ蜃兞浚?shù)據(jù)根據(jù)其諸多特征,按照在性質(zhì)上的親疏程度在沒(méi)有先驗(yàn)知識(shí)的情況下進(jìn)行自動(dòng)分類,產(chǎn)生多個(gè)分類結(jié)果。類內(nèi)部個(gè)體特征具有相似性,不同類個(gè)體特征的差異性較大。
聚類分析中,個(gè)體之間的“親疏程度”是極為重要的,它將直接影響最終的聚類結(jié)果。對(duì)“親疏程度”的測(cè)度一般有兩個(gè)角度:第一,個(gè)體間的相似程度;第二,個(gè)體間的差異程度。衡量個(gè)體間的相似程度通??刹捎煤?jiǎn)單相關(guān)系數(shù)或等級(jí)相關(guān)系數(shù)等。個(gè)體間的差異程度通常通過(guò)某種距離來(lái)測(cè)度。
定義個(gè)體間距離的方法也有很多,比如:歐氏距離、平方歐氏距離、切比雪夫距離、Block距離、明考斯基距離等。
常見(jiàn)的聚類分析方法有層次聚類和K-Means聚類。
2 數(shù)據(jù)來(lái)源
本文選取了08級(jí)統(tǒng)計(jì)班31名學(xué)生的24門(mén)主干課程,分別為:思想道德修養(yǎng)與法律基礎(chǔ)、大學(xué)生體育、統(tǒng)計(jì)學(xué)原理、微積分、政治經(jīng)濟(jì)學(xué)、心理健康教育、線性代數(shù)、大學(xué)英語(yǔ)、應(yīng)用統(tǒng)計(jì)學(xué)、國(guó)民經(jīng)濟(jì)統(tǒng)計(jì)學(xué)、線性規(guī)劃、普通話口語(yǔ)、統(tǒng)計(jì)預(yù)測(cè)與決策、統(tǒng)計(jì)信息管理、管理信息系統(tǒng)、調(diào)查數(shù)據(jù)分析、統(tǒng)計(jì)實(shí)務(wù)、概率論與數(shù)理統(tǒng)計(jì)、運(yùn)籌學(xué)、抽樣技術(shù)、企業(yè)經(jīng)濟(jì)統(tǒng)計(jì)學(xué)、財(cái)務(wù)管理、SPSS在統(tǒng)計(jì)中的應(yīng)用、消費(fèi)者行為學(xué)。
將這24門(mén)課程的成績(jī)輸入SPSS19.0軟件對(duì)其進(jìn)行聚類分析。
3 實(shí)證檢驗(yàn)
本文采用層次聚類方法進(jìn)行聚類分析,那么,在衡量數(shù)據(jù)間的親疏程度時(shí)涉及兩個(gè)方面的問(wèn)題,一是度量個(gè)體間的親疏程度,本文采用平方歐氏距離;二是度量個(gè)體與小類之間、小類和小類之間的親疏程度,這方面的度量也是通過(guò)距離來(lái)測(cè)度的,并且,這里的距離是在個(gè)體間距離的基礎(chǔ)上定義的,常見(jiàn)的距離有最近鄰居距離、最遠(yuǎn)鄰居距離、組間平均鏈鎖、組內(nèi)平均鏈鎖、重心距離和離差平方和法。本文的類間距離采用平均組間鏈鎖距離。
并且,因?yàn)閿?shù)據(jù)不存在數(shù)量級(jí)上的差異,因此無(wú)須進(jìn)行標(biāo)準(zhǔn)化處理。
3.1 聚類分析樹(shù)形圖
聚類分析的樹(shù)形圖如圖1所示。
從樹(shù)形圖可以看出:全班31名同學(xué)可以分成四類,周利靜、朱瀟瀟、夏玉濤這三位同學(xué)為一類,郭勇一人為一類,夏正娟、楊歡為一類,剩余25位同學(xué)為一類。
3.2 各類別能力傾向分析
圖1 生成的聚類分析樹(shù)形圖
通過(guò)比較各類別的成績(jī),解釋各類別的學(xué)生能力傾向特點(diǎn)。
各類別的成績(jī)分布如表1所示。(考慮到頁(yè)面的限制,表1的課程只列舉了其中的一部分。)
從表1的成績(jī),可以得到如下的分析結(jié)果:
第一類:有周利靜、朱瀟瀟、夏玉濤三位同學(xué)。這三名學(xué)生各科成績(jī)都普遍不錯(cuò),有多門(mén)功課成績(jī)都是名列前茅,總平均成績(jī)也是全班的前三名。她們是各科普遍優(yōu)秀的典型代表,因此可以定義她們?yōu)椤皟?yōu)秀型學(xué)生”。
第二類:有陳佩佩等25位同學(xué),是最大的一個(gè)類別。從成績(jī)看,他們的各科成績(jī)比較平均?;旧蠜](méi)有特別好的也沒(méi)有特別差的,都維持在中游的水平,因此可以定義他們?yōu)椤傲己眯蛯W(xué)生”。
第三類:只有郭勇一位同學(xué)。他的成績(jī)沒(méi)有高分但也沒(méi)有不及格的,但是縱向比較可以看出,比如他的《大學(xué)英語(yǔ)》課程,考了68分,但是排在班級(jí)倒數(shù)第二,再比如說(shuō),《統(tǒng)計(jì)信息管理》課程,考了63分,全班倒數(shù)第一。因此,雖然他的總平均分也能達(dá)到75分,但他跟第二類的同學(xué)們顯然還是有差距的。因此,可以定義他為“合格型學(xué)生”。
第四類:有夏正娟和楊歡兩位同學(xué)。這兩位同學(xué)都存在著課程不及格現(xiàn)象,夏正娟的《應(yīng)用統(tǒng)計(jì)學(xué)》和《國(guó)民經(jīng)濟(jì)統(tǒng)計(jì)學(xué)》兩門(mén)課程不及格,楊歡《應(yīng)用統(tǒng)計(jì)學(xué)》和《統(tǒng)計(jì)實(shí)務(wù)》不及格,且不及格成績(jī)很低。他們都屬于統(tǒng)計(jì)學(xué)方面的應(yīng)用實(shí)務(wù)方面掌握得很差。因此可以定義她們?yōu)椤安患案駥W(xué)生”。
3.3 相應(yīng)就業(yè)指導(dǎo)
對(duì)于“優(yōu)秀型學(xué)生”,不論是理論、實(shí)踐還是技能操作,她們都能夠勝任。應(yīng)該努力培養(yǎng)她們成為統(tǒng)計(jì)工作崗位的骨干力量。
對(duì)于“良好型學(xué)生”,他們具備良好的統(tǒng)計(jì)知識(shí)和技能,只是學(xué)得不太精,這部分同學(xué)應(yīng)該根據(jù)自身愛(ài)好,發(fā)揮各自所長(zhǎng),培養(yǎng)成為統(tǒng)計(jì)工作崗位的技術(shù)能手。
對(duì)于“合格型學(xué)生”,他的統(tǒng)計(jì)專業(yè)素養(yǎng)不是很好,但他的統(tǒng)計(jì)軟件動(dòng)手操作能力不錯(cuò),建議在統(tǒng)計(jì)工作崗位中成長(zhǎng)為數(shù)據(jù)分析軟件能手。但要想走得遠(yuǎn),必須還要進(jìn)一步地重溫統(tǒng)計(jì)專業(yè)基礎(chǔ)知識(shí)。
對(duì)于“不合格學(xué)生”,她們的統(tǒng)計(jì)應(yīng)用型課程存在不及格,且其他課程成績(jī)一般,因此建議她們可以改選其他方面工作,不要拘泥在統(tǒng)計(jì)工作崗位上。
參考文獻(xiàn)
[1]薛薇.基于SPSS的數(shù)據(jù)分析[M].北京:中國(guó)人民大學(xué)出版社,2006.
[2]周蕾.聚類分析在學(xué)生成績(jī)分析中的應(yīng)用[J].農(nóng)業(yè)網(wǎng)絡(luò)信息,2010(5).
[3]林治.聚類分析在學(xué)生成績(jī)管理中的應(yīng)用探析[J].福建電腦,2009(12).
[4]王亮紅,宋代清,徐娜.聚類分析在學(xué)生成績(jī)分析中的應(yīng)用[J].東北電力大學(xué)學(xué)報(bào),2009(4).
[5]劉璐,楊景明,趙會(huì)仁,李丹丹,田玉民.主成分聚類分析在學(xué)生成績(jī)綜合評(píng)價(jià)中的應(yīng)用[J].遼寧工業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版),2012(3).
[6]羅家國(guó),羅浩,仲佳嘉.基于SPSS的學(xué)生能力傾向聚類分析研究[J].高等工程教育研究,2012(6).