郝翠萍
(榆林學院教育學院,陜西榆林 719600)
通過考試能夠考核和評價學生的學習情況,教師通過分析考試成績能夠精準了解學生對于知識掌握程度,從而調整教學方式與模式。所以,教師要客觀、正確的評價成績。有效、合理的成績評價能夠使教師反思課堂教學過程中的不足,還能夠使教師對學生學習狀態(tài)正確評估,避免出現負面影響,為后續(xù)課程的教學提供參考[1]。以此,文中針對考試的評價和預測,提出基于多元性回歸模型的創(chuàng)建策略。
文中收集了100 名學生基礎課程第一學期的考試成績和結業(yè)考試成績,數據中全部案例都根據學生的結業(yè)考試成績、第一學期考試成績和性別匯總。第一學期考試成績包括GRADE 值為60 分以下、60-65 分之間、65-75 分之間、75 分以上等4 個檔次。以此,創(chuàng)建交互組后構成匯總水平觀測案例,成績分組數據詳見表1。
表1 成績分組數據
表中GENDER 為0 指的是男生,1 指的是女生。第j組結業(yè)成績超過70 分比例表示為fj,第j組的觀測頻數用nj表示,第j組權數表示為wj[2]。
通過某案例中的數據創(chuàng)建分析單元,全部自變量指的是GEADE、GENDER 的值,每組都一樣。結業(yè)成績超過70 分的概率為pj,假設同一組中所有人的結業(yè)成績均超過70 分,用樣本結業(yè)成績大于70 分的比例或者結業(yè)成績大于70 分的相對頻數fj估計pj,并且假設:
式(1)中εj指殘差,fj的期望值表示為E(f)j=pj。在樣本規(guī)模比較大的時候,殘差就會比較小,并且fj和pj越來越接近。假如一個組中的觀測頻數比較大,就能夠計算相對頻數,將其作為事件概率估計。在樣本規(guī)模不斷增加的過程中,觀測相對頻數是指概率真值估計,連續(xù)變量使組內頻率得到增加[3]。
線性分析指的是對一個變量到另外一個變量相互關系的研究,并且研究變量相互間的關系緊密程度與性質。簡單來說,線性回歸分析的主要任務就是描述定量關系?;貧w分析能夠根據非確定變量關系確定函數的關系,對兩個變量回歸關系研究時,稱之為簡單回歸或一元回歸,對3 個或者以上變量回歸關系研究時,稱之為復回歸或多元回歸。線性回歸能夠對一個或者多個自變量和一個因變量線性關系進行分析,SPPS 提供5 種創(chuàng)建回歸方程方法和殘差分析、參數估計等方法[4]。
通過數據工具使實際問題得到解決的主要手段為數學建模,此方法有多種,多元線性回歸屬于多因素模型分析的常見方法,此方法比較方便簡單,并且預測效果能夠利用回歸擬合程度進行展現。但是在回歸分析中,如何利用多因素選擇合適因子影響模型分析結果。多元線性分析預測方法指的是利用兩個或者以上因變量、自變量相關分析創(chuàng)建預測模型,在因變量、自變量具備線性關系時,也就是多元線性回歸分析。自變量和因變量具備密切線性相關,并且自變量對于因變量具備互斥性,估計回歸系數數量不能超過樣本容量。
通過分組數據計算對數發(fā)生比,估計真實對數發(fā)生比,計算公式為:
假設對數發(fā)生比是指招生分數、類型的函數,從而創(chuàng)建以下回歸模型對此數據進行分析:
利用分組數據計算對數發(fā)生比,通過常規(guī)最小二乘法對回歸模型進行計算,根據自變量對個人數據進行分組,然后對每組時間概率pj進行估計,根據每組事件概率估計對數發(fā)生比,從而成為線性回歸模型因變量,線性回歸自變量屬于分類變量[5]。
式(3)的模型存在異方差性,由于每組殘差項和本組事件發(fā)生概率具有密切關系,并且關系著本組觀測頻率。那么,可以使用最小二乘法GLS 實現數據分析。該文采用最小二乘法模型,其中所有原始變量為常數項要求加權轉換,權數為殘差項標準誤差系數。由于殘差標準誤差依賴于fj,并且fj在不斷地改變,相關殘差項方差具有不同的假設條件。如果無法使這種異方差問題得到解決,相關參數估計顯著性建設是無效的。為了對異方差性進行修正,要在模型估計前對數據進行轉換。
該文列出和成績相關指標,分別為高考成績、平均成績、分級成績和期末卷面成績,通過Excel 得出影響因素和英語四級考試成績散點分布圖[6],詳見圖1~4。表2 為高考英語成績小于103 分的學生的四級成績表和高考英語成績大于等于103 分的學生的四級成績統計表。
表2 高考成績和四級成績統計表
圖1 分班成績散點分布圖
通過圖1 可知,分班成績?yōu)閷W生剛進入到學校的成績,也是對學生過完假期之后的英語水平。分班成績和四級考試成績線性關系優(yōu)于高考成績,關系點在線性曲線附近分布,并且存在個別關系點和線性關系距離比較遠的問題。由此可知,分班成績能夠成為對學生四級考試成績影響的主要因素[7]。
通過圖2 可知,英語平時成績和四級考試成績沒有線性關系,表示平時成績并不會影響到學生的四級考試成績,能夠將其剔除。
圖2 英語平時成績散點分布圖
通過圖3 可知,高考成績關系點在線性關系曲線附近分布,因為受其他因素影響,部分關系點距離線性關系曲線比較遠,但仍為線性關系[8]。
圖3 英語高考成績散點分布圖
通過圖4 可知,期末卷面成績和四級考試成績具有良好線性關系,關系點都處于關系曲線附近,表示期末卷面成績?yōu)橹饕绊懸蛩豙9]。
圖4 英語期末卷面成績散點分布圖
通過上述分析可知,四級考試成績和分班成績、高考成績與期末卷面成績具有良好線性關系,通過SPSS 軟件實現收集數據的回歸分析處理,能夠得出處理后的數據。表3 為模型系數分析(Sig.代表顯著性,B代表組間差異,T代表單樣本校驗),通過表3 可以看出期末卷面成績偏相關系數是最大的,也就是表示期末卷面成績對于四級考試成績影響最大[10]。
表3 模型系數分析
如何實現回歸方程顯著性校驗,假設:
式(4)中,假如接收H0,那么多元線性回歸模型無法滿足自變量關系需求。從而創(chuàng)建H0 校驗統計量,取合適的考試成績和人數,校驗統計量。表4 為方差分析數值表,可以看出,回歸方程顯著[11]。
表4 方差分析數值表
已知學生3 個學期期末考試成績,對數據進行初步處理。使用已經創(chuàng)建的模型對學生在英語四級考試中的成績進行預測[12]。首先,分析成績并且說明;另外,對成績合理可靠性進行分析;最后,對比四級成績考試預測成績和實際成績,圖5 為英語四級考試成績對比圖。通過圖5 可以看出來,兩條折線基本吻合[13]。部分學生預測過程中存在不在預測模型的情況,從而使學生成績出現偏差。觀察折線圖,對可校驗模型有效性進行對比分析,預測成績可靠合理[14-18]。
圖5 英語四級考試成績對比圖
該文研究表明,利用回歸分析模型能夠對考試成績進行評價,并且可合理預測成績。利用模型顯著性校驗能夠對模型合理性進行判斷,通過模型回歸系數顯著性校驗,能夠尋找到對因變量影響比較弱的自變量后剔除,從而簡化模型,便于模型的使用。在實際預測過程中,需考慮多因素的影響,最大程度地減小誤差。