崔 珺,潘 健
(黃山學院生命與環(huán)境科學學院,安徽 黃山 245041)
學生成績評價是高校教學管理的重要組成部分[1],對學生的成績進行分析有利于教師了解學生對課程的掌握情況,而成績評價體系對學生在校期間的獎懲、后期的深造和就業(yè)都有很大影響。早期的成績評價主要采用平均成績和學分績點評價等方式進行[2],隨著信息技術(shù)不斷革新,眾多學者將多元分析引入學生成績評價體系中[3,4],主要以因子分析[5,6]、主成分分析[7]和聚類分析[8,9]為主,亦有綜合兩種方式進行分析的案例[10,11]。采用統(tǒng)計的方法來進行成績評價可以將復(fù)雜的指標簡單化,解決定量或定性分析中存在的問題[12],便于進行成績評價。基于以上原因,結(jié)合園林專業(yè)課程特點和主成分分析法進行學生成績評價,以期為后期學生成績評價提供參考依據(jù)。
以黃山學院生命與環(huán)境科學學院園林專業(yè)2018屆、2019屆和2020屆3屆畢業(yè)生的基礎(chǔ)課和專業(yè)課課程成績?yōu)槔?,運用主成分分析法對學生的綜合學習效果和綜合能力進行評價。三屆學生人數(shù)不一致,每屆隨機抽取90 名共270 名學生的課程成績作為研究對象。園林專業(yè)開設(shè)課程較多,如表1 所示,經(jīng)過對培養(yǎng)方案的梳理研討初步遴選了20門課程作為變量。選擇的課程包括10門基礎(chǔ)課程A1-A10;10門專業(yè)課程B1-B10,以上20門課程對應(yīng)的成績分別用x1,x2,…,x20來表示,這樣即可得到一個270×20的數(shù)據(jù)矩陣,使用SPSS 22.0進行主成分分析。
表1 用于分析的課程及編號
主成分分析法的基本思想為對問題的原始指標做線性組合形成綜合指標,按方差大小進行排序,選取前幾個綜合指標,依次定義為第一、第二、第三主成分等。這些主成分間是線性無關(guān)的。這樣處理,既能降低問題的復(fù)雜度,又能從原始數(shù)據(jù)中進一步挖掘?qū)嶋H問題的某些新信息[13,14]。
在實際問題中,為了降低分析的難度,提高分析效率,通常不直接對原始指標(p個)構(gòu)成的隨機向量x=(x1,x2,…,xp)進行分析,而是先對向量做線性變換,把原來的隨機向量變換成新的綜合變量y1,y2,…,yp。變量y1,y2,…,yp之間相互獨立,并且其方差依次遞減。下面用兩個向量對問題進行說明,考慮通過線性變換,將x1和x2進行線性組合,得到兩個新的變量y1和y2。從幾何角度來看,就是將坐標系逆時針旋轉(zhuǎn)θ角度,得到新坐標軸y1和y2,具體坐標旋轉(zhuǎn)公式如下[15]:
式中,U為旋轉(zhuǎn)變換矩陣,由(1)可知它是正交陣,即滿足式(2):
從相關(guān)系數(shù)矩陣開始,求解主成分的步驟:
1.標準化各觀測變量數(shù)據(jù);
2.求各觀測變量標準化后的相關(guān)系數(shù)矩陣;
3.根據(jù)矩陣知識|ρ-λI|=0,求解相關(guān)系數(shù)矩陣的特征根;
4.求解各特征根對應(yīng)的特征向量ρμi=λiμi。
其中,第一主成分的系數(shù)向量為最大特征值對應(yīng)的特征向量;第二主成分的系數(shù)向量為第二大特征值對應(yīng)的特征向量,同理可以得到其他系數(shù)。
將270名學生的課程成績作為原始數(shù)據(jù)進行處理,首先將原始數(shù)據(jù)進行標準化并計算相關(guān)矩陣得到表2。由表2 可以看出,在被進行統(tǒng)計的20 門課程中,有5 門基礎(chǔ)課程,包括氣象學、繪畫1、繪畫2、園林設(shè)計初步和園林史,與10 門專業(yè)課程成績間呈極顯著正相關(guān),1 門基礎(chǔ)課程植物學與除園林規(guī)劃設(shè)計1 以外的9 門專業(yè)課程成績間呈極顯著正相關(guān),除少數(shù)課程間呈現(xiàn)負相關(guān)外,多數(shù)課程之間的相關(guān)系數(shù)都達到了顯著正相關(guān)或極顯著正相關(guān),這表示大多數(shù)課程成績具有較強的關(guān)聯(lián)性,即某門課程的成績的波動,可由另外一門課程成績分布規(guī)律來進行推斷。
表2 課程成績(變量)間相關(guān)系數(shù)
以花卉學和園林樹木栽培學為例,二者之間的相關(guān)系數(shù)最高,達到0.669,這表明花卉學掌握較好的同學,其園林植物栽培學掌握的也較好。此外,對于園林專業(yè)開設(shè)的基礎(chǔ)課程和專業(yè)課程進行相關(guān)性分析時,可以看出對氣象學、繪畫1、繪畫2、園林設(shè)計初步和園林史這5門基礎(chǔ)課程與園林專業(yè)開設(shè)的專業(yè)課程相關(guān)性均呈正顯著相關(guān),這充分說明園林專業(yè)基礎(chǔ)課程的設(shè)置對于園林專業(yè)學生學習專業(yè)課具有重要的影響。園林規(guī)劃設(shè)計2、園林建筑、園林植物造景、花卉學1和園林樹木栽培學與所有的專業(yè)基礎(chǔ)課均呈現(xiàn)顯著相關(guān),這5 門課程也是生物類專業(yè)重要的專業(yè)課程,這有力地驗證了學好基礎(chǔ)課程對專業(yè)知識的掌握至關(guān)重要。
由輸出結(jié)果公因子方差看出,表3 中最后一列的數(shù)據(jù)均在50%以上,表明提取的主成分對每個變量的解釋程度都較高。
表3 公因子方差分析
如表4 所示,由輸出結(jié)果圖的總方差可以看出前4 個主成分y1,y2,y3,y4的方差之和占總方差的比例達到了65.281%。所以,前4 個主成分就可以基本保留了原來指標的信息,這樣就由原來的12個減少為4 個新指標,從而起到了降維的作用。第一主成分的方差貢獻率為38.399%,即第一主成分可以反映原指標38.399%的信息量,表示第一主成分承載了學生成績的主要綜合信息。前4個主成分的累計方差貢獻率達到65.281%,若按照60%的判斷標準,只需選取前4 個主成分就可以代表原來20 個指標所包含信息量的65.281%。
表4 主成分的特征值、方差貢獻率和累計貢獻率
表5 給出了4 個主成分的特征向量和相應(yīng)的載荷值。第一主成分對應(yīng)的特征向量和載荷值均為正值,數(shù)值上也相差較小,即第一主成分可以反映學生的綜合學習成績。第一主成分在園林植物造景、園林樹木學2、花卉學1 和園林樹木學栽培學這4門專業(yè)課程上的載荷值較大,通過分析可知這4門課程在第一主成分中起作用較大,因此在專業(yè)學習中這幾門課程學的怎樣就直接影響學生的綜合專業(yè)素質(zhì)。第二、三、四主成分的方差貢獻率分別是12.084%、9.442%和5.356%,且在各門課程上的荷載值存在負值,在學生綜合成績評價上容易產(chǎn)生偏差,因此直接采用第一主成分對學生綜合成績進行評價更合理。
表5 4個主成分的特征向量和相應(yīng)的載荷值
由表5中成分得分系數(shù)矩陣可以得到主成分表達式。
第一主成分:
以此類推,還可以寫出其余3 個主成分的得分表達式。
第二主成分:
第三主成分:
第四主成分:
對于學習綜合成績的優(yōu)劣也可以通過綜合評價得分體現(xiàn),以4個主成分所對應(yīng)的特征值(見表4)占所提取主成分總的特征值之和的比例作為權(quán)重,計算主成分綜合模型,根據(jù)主成分綜合模型即可算出綜合主成分值。其表達式為:
其中λ1=7.680;λ2=2.417;λ3=1.888;λ4=1.071;
本研究中最終可以得到表達式為:
將學生的成績標準化后的數(shù)據(jù)代入Y1、Y2、Y3、Y4和Y的表達式中,就可以得到每個學生的主成分得分和綜合得分,再對隨機抽取的20名學生的課程成績進行綜合排名。從表6 中可以看出,第一主成分得分給出的排名與4個主成分的綜合成績得分提供的排名十分接近,平均分與主成分排名差距較小。從表5 中每個學生的綜合成績得分、總成績平均分以及4 個主成分方面的得分情況,可以進一步判斷學生在綜合素質(zhì)和學科上的優(yōu)劣。
表6 綜合排名(部分)
學生成績可以反映學生對課程的掌握情況以及教學中需要教師注意的部分,但是單純通過20門課程來評價學生課程掌握情況又是一個復(fù)雜的問題。研究采用主成分分析的思想與實際教學情況相結(jié)合,從枯燥的各科目成績中挖掘出很多信息,如各門課程成績之間具有較強的相關(guān)性,學好基礎(chǔ)課程對后期專業(yè)課程學習有很大的影響;園林植物造景、園林樹木學2、花卉學1、和園林樹木栽培學這幾門課程的掌握很大程度上影響學生對專業(yè)課程的學習以及綜合素質(zhì)的提高等。研究只是選擇基礎(chǔ)課和專業(yè)課進行統(tǒng)計分析,沒有考慮公共課和選修課對學生學習成績的影響,可能在分析綜合成績方面存在偏差。但是通過以上的數(shù)據(jù)分析,還是能發(fā)現(xiàn)教學的一些規(guī)律,旨在為園林專業(yè)教育教學改革提供科學的方法和理論依據(jù)。