王微
摘 要:考試對于學(xué)生來說可謂再尋常不過,小至隨堂測試,月考大至中考高考. 一名學(xué)生無論在哪個階段學(xué)習(xí)過程中,都會經(jīng)歷許許多多次測試,每一次測試都會有成績記錄,如若將這些數(shù)據(jù)搜集起來數(shù)量是驚人的.
關(guān)鍵詞:多元線性;分析;學(xué)生成績
學(xué)生接受教育是連續(xù)的,所以評價(jià)一名學(xué)生不能只依靠某次考試成績,要縱向地連續(xù)觀察學(xué)生在各階段情況做綜合評價(jià)。中考成績是衡量學(xué)生進(jìn)入高中之前學(xué)習(xí)情況的一項(xiàng)重要指標(biāo),所以選擇這兩個變量作為二模成績的解釋變量是含有一定的合理性。
圖3是學(xué)校類別x2,學(xué)生性別x3以及班級類別x4的直方圖,圖4表示的是二模成績y關(guān)于中考成績x1和一模成績x3的散點(diǎn)圖。通過觀察可以對新添加解釋變量的情況有初步了解。
R軟件對樣本數(shù)據(jù)做多元回歸得表4.可以得到多元線性回歸模型雖然已經(jīng)得到回歸方程,但還要對模型的合理性進(jìn)行檢驗(yàn)。由上文多元回歸模型的理論可知,首先要對回歸方程做顯著性檢驗(yàn),分析數(shù)據(jù)發(fā)現(xiàn)該檢驗(yàn)得到p值很小,與此同時相關(guān)系數(shù)R2為0.9298,說明建立的多元回歸模型比較合理,解釋變量能很好解釋因變量。
接下來還要對模型的解釋變量逐個進(jìn)行t檢驗(yàn),表4中顯示中考成績、一模成績的p值很小,說明二者對二模成績影響很顯著。
學(xué)生性別這個變量對二模成績影響的p值為0.0271也很顯著。人們通知認(rèn)為高中男生的學(xué)習(xí)能力要強(qiáng)于女生,但分析結(jié)果表明這種說法不是很正確。學(xué)生性別變量的回歸系數(shù)估計(jì)值為3.1393,表明女生成績普遍較好。高中階段的學(xué)習(xí),不僅要求接受新知識能力強(qiáng),而且要求有豐富的知識積累量??赡苁桥鷮W(xué)習(xí)態(tài)度較好,對知識掌握情況較好。
學(xué)校類別變量對因變量影響不是很顯著,也就是說學(xué)校水平對學(xué)生成績影響不大。樣本的五所學(xué)??梢苑譃閮蓚€水平:重點(diǎn)高中和普通高中。學(xué)校水平不同對學(xué)生二模影響的功能貢獻(xiàn)率不是很大,這個結(jié)果與只有去好學(xué)校才有優(yōu)異成績的想法不符。
二模成績與一模成績的散點(diǎn)圖說明一模成績可以很好的預(yù)測二模成績。圖中有很清晰的兩條直線,可能是由于學(xué)校所處水平不同引起的,重點(diǎn)高中學(xué)生成績整體上要比普通高中要好。圖5是多元回歸方程的殘差圖,圖中點(diǎn)散亂分布在y軸的兩側(cè),說明所選擇的中考成績,學(xué)生性別等5個解釋變量可以很好的解釋二模成績,也就是說建立的模型有一定的合理性上述多元回歸模型殘差平方和,對上文五個解釋變量做顯著分析時知,學(xué)生個人對二模成績影響很大,學(xué)生類別與班額對學(xué)生成績影響不是很顯著。殘差平方和的意義在于除了學(xué)生個人之外其他所有因素對因變量的影響,其中也包括學(xué)校的教學(xué)質(zhì)量。因此,我們就可以利用各自學(xué)校的殘差平方和去比較學(xué)校之間教學(xué)質(zhì)量差異。利用上式可以得到每所學(xué)校的學(xué)校對學(xué)生的影響程度表示為
利用樣本數(shù)據(jù)計(jì)算得到的結(jié)果見表6.
從表6可以看出,C、D兩所學(xué)校殘差平方和比較大,表明與其他幾所學(xué)校有明顯差異。從實(shí)際意義上看,說明這兩所學(xué)校在師資力量、辦學(xué)條件、生源質(zhì)量等方面與其他三所學(xué)校有很大不同。
模型拓展
本文之前的分析都是在樣本數(shù)據(jù)的基礎(chǔ)上,利用數(shù)據(jù)中包含比較直觀的信息(學(xué)生成績、性別等),從學(xué)生角度分析影響學(xué)生的二模成績因素。在樣本中沒有任何關(guān)于學(xué)校辦學(xué)條件,師資力量等代表學(xué)校教學(xué)質(zhì)量相關(guān)信息情況下,是否可以利用簡單線性回歸模型挖掘出潛藏在樣本中的信息,進(jìn)而估測學(xué)校的教學(xué)質(zhì)量的差異為學(xué)校排名。
其中表示來自第i所學(xué)校的第j學(xué)生的第二次模擬考試成績。
表示來自第i所學(xué)校的第j 學(xué)生的中考成績。由最小二乘法估計(jì)方法,我們有將樣本數(shù)據(jù)代入上式推導(dǎo)出的公式中,計(jì)算結(jié)果如表7所示。
數(shù)據(jù)分析之前,已經(jīng)大致了解學(xué)校的基本情況。其中學(xué)校編號為CDE的三所學(xué)校為省級示范高中,編號為AB的兩所學(xué)校為普通高中,實(shí)際學(xué)校排名情況與上表現(xiàn)是排名大體一致。
本文建立的多元回歸模型對三組學(xué)生成績分別從學(xué)生以及學(xué)校角度進(jìn)行分析,并結(jié)合統(tǒng)計(jì)學(xué)知識、R軟件對數(shù)據(jù)分析處理的結(jié)果進(jìn)行了有效的分析與合理解釋。
當(dāng)統(tǒng)計(jì)學(xué)與數(shù)據(jù)相遇總會有這樣那樣的火花,不一樣的風(fēng)景。樣本只包含幾次考試成績和關(guān)于學(xué)生自身的一些信息,沒有直接關(guān)聯(lián)教學(xué)質(zhì)量的信息。但是簡單的分析就可以挖掘到許多隱藏在數(shù)據(jù)背后的信息,這就是統(tǒng)計(jì)學(xué)的魅力所在。通過上述分析再一次驗(yàn)證了數(shù)據(jù)力量是巨大的,合理、高效地利用為教學(xué)服務(wù),將具有重大的意義。
參考文獻(xiàn):
[1] 朱姝帆. 湖北省農(nóng)村居民家庭人均收入影響因素分析——多元線性回歸分析[J]. 科技創(chuàng)業(yè)月刊. 2009(01).