彭和強 鄭浩
高考是對學生高中階段學習成果的終結(jié)評價?!陡呖荚u價體系》中,明確了“立德樹人、服務(wù)選材、導向教學”的核心價值和功能。其中“導向教學”意為:高考要為高中一線教學指明方向。
診斷考試是地方教育管理部門對學生高中特定時段學習效果的過程性評價。過程性評價對一線教學也有著極其重要的導向作用,但卻沒有特定標準可參照。如果診斷試題不能進行有效的考核評價和約束,試題的質(zhì)量難以得到有效保障,一線教學也就容易迷失方向,這將與高考評價體系中的“導向教學”理念背道而馳。
基于以上思考和分析,試圖找到能夠有效評價和考核診斷考試命題質(zhì)量的途徑。
一、研究對象和方式
研究對象為綿陽市某年級的93名學生,以歷次考試測試數(shù)據(jù)為基礎(chǔ)。
因每次考試均按照全市排名劃定A0、A優(yōu)、B優(yōu)分數(shù)線,且每次劃線人數(shù)基本相當,故參照上線情況進行統(tǒng)計分析,具有較強統(tǒng)計參照價值。通過上線人數(shù)、超線差值、置信度三方面進行統(tǒng)計分析,能夠較好檢驗診斷考試與高考之間的關(guān)聯(lián)度,從而檢驗診斷試題質(zhì)量。
二、診斷考試與高考的關(guān)聯(lián)度分析
1. 上線人數(shù)的關(guān)聯(lián)度
從歷次考試各層次上線人數(shù)看(表1),A0和A優(yōu)上線人數(shù)波動幅度較大;B優(yōu)上線情況除三診外,均穩(wěn)定保持在75~76人。
從歷次考試上線結(jié)構(gòu)來看,無論哪個層次的上線人數(shù),高考都與該年級的一診最為接近,說明二者關(guān)聯(lián)度最強;而三診測試結(jié)果與高考差異最明顯,B優(yōu)上線人數(shù)也產(chǎn)生較大差異,說明二者關(guān)聯(lián)度較差。
2. 超線差值的關(guān)聯(lián)度
學生考試成績與當次優(yōu)生線之間存在一定差值,可稱為超線差值ΔM。理論上,如果所有學生高考超線差值ΔM1與診斷考試超線差值ΔM2之間的差值ΔE(即ΔE=丨ΔM1-ΔM2丨)無限接近于0,則表明當次診斷考試關(guān)聯(lián)度越高。但客觀上講,因?qū)W生個體存在成績不定因素,做到無偏差自然不可能。但大量統(tǒng)計對分析診斷考試有效度也有積極意義。
表2以A優(yōu)線為參照,統(tǒng)計研究對象4次統(tǒng)考與高考之間ΔE值的大小分布情況。ΔE低值區(qū)分布人數(shù)越多,表明試題與高考關(guān)聯(lián)度越高。
通過表2數(shù)據(jù)分析可知,一診、二診考試ΔE≥15的人數(shù)相對較少,表明其關(guān)聯(lián)度較高。三診考試ΔE≥15的人數(shù)顯著偏多,其關(guān)聯(lián)度相對較差。
3. 置信度分析
置信度也可直觀分析出兩種數(shù)據(jù)之間的關(guān)聯(lián)度。將歷次診斷考試與高考上線情況進行疊加,并進行上線與未上線統(tǒng)計,得到各層次和各次考試之間的列聯(lián)表。運用卡方公式,得到隨機變量K?的觀測值k,再根據(jù)觀測值k對照表,得到診斷考試與高考之間的置信度。置信度越高,表明高考與當次診斷考試的關(guān)聯(lián)度越高。分A線和B線兩個層次進行置信度分析。
從A線分析來看(表3),二診、三診置信度較低,尤其是二診,置信度僅60%~75%,說明當次診斷考試是否上A線與高考是否上A線之間缺乏必要聯(lián)系,考試關(guān)聯(lián)度和有效性不足。一診置信度較高,達到95%~97.5%,即當年一診是否上A線很大程度上決定高考是否上A線,兩者之間關(guān)聯(lián)度較高。
從B線分析來看(表4),診斷考試和高考B線之間置信度整體較A線偏高,尤其一診考試達到99.9%,關(guān)聯(lián)度很高。但二診測試仍不足85%,關(guān)聯(lián)度偏低。
三、結(jié)論與建議
1.一診試題質(zhì)量較高
無論是A0、A線、B優(yōu)線,與高考之間的關(guān)聯(lián)度均最大。即學生在一診考試中是否上線,上什么層次的線,很大程度上決定學生在高考中的上線情況。表明當年一診試題質(zhì)量高,教學指引性較強,對各個層次學生復習指導價值較大。
2.二診、三診試題質(zhì)量較低
二診、三診僅在B線與高考有較大關(guān)聯(lián)度,而A0、A線與高考之間關(guān)聯(lián)度較小。說明這兩次診斷性考試對中后段學生的測試有效度較高,具有較強指導價值和意義,但是對中前段學生的測試有效度較低,指導意義不大。
3.加強命題管理的建議
(1)加大診斷試題命制投入
高考試題命制的人力、財力、時間投入,都比診斷考試多,因而試題更加嚴謹合理。診斷考試的命題者多為一線教師,且命題待遇偏低、時間不足,難以更高標準保障診斷試題質(zhì)量。
故加大診斷考試投入力度,能更高標準保障過程性檢測質(zhì)量,從而提高日常教學、高考復習的針對性、指導性,更有利學科人才培養(yǎng)。
(2)強化命題質(zhì)量監(jiān)督和管理
試題質(zhì)量不能僅從平均分、區(qū)分度、是否存在學科爭議、學科認知錯誤等方面評判。市級教育科學研究部門應(yīng)建立完善命題有效性追蹤制度,并合理運用測試所得大數(shù)據(jù),根據(jù)上線人數(shù)、越線分差、置信度等分析診斷試題的效度、方向指導性價值等,建立量化考核評價機制并進行倒追獎懲。
影響學生診斷成績和高考成績的因素還有教師教學風格、學生考試身心狀態(tài)等。本研究對象數(shù)量偏低,無法完全規(guī)避上述因素帶來的質(zhì)量評價差異。通過更大范圍數(shù)據(jù)統(tǒng)計和分析,建立量化考核評價機制,能更有效對試題質(zhì)量進行評價,是一種行之有效的命題質(zhì)量管理途徑和手段。