廣東省江門市五邑大學外國語學院 滕海區(qū) 關天萍
2016年廣州高考一模英語試卷質量分析
廣東省江門市五邑大學外國語學院 滕海區(qū) 關天萍
測試是檢測教學評價的重要手段之一,而試卷則是測試的重要工具之一。一份信度效度高的試卷能夠較好地檢驗教學效果,反映學生的學習能力,從而體現評價的科學性。本文通過實例,以廣東省某所國家示范性高中高三某班55位學生為樣本,采用SPSS 22.0對2016年廣州高考一模英語試卷進行難度、區(qū)分度、信度的分析,探討試卷是否反映英語學科課程標準的整體要求、是否符合考試大綱的要求、是否全面檢測學生對英語語言基礎知識和基本技能的掌握。
SPSS;難易度;區(qū)分度;信度
2016年廣州高考一模英語測試以《普通高中英語課程標準》、教育部考試中心《2016年普通高等學校招生全國統一英語考試大綱》和《2016年普通高等學校招生全國統一英語考試大綱的說明(英語)》為依據,并參考了全國卷(一)的試題及難度要求(廣州市教育研究院 2016)。按照往年的經驗,我們可以總結出廣州高考一模難度接近高考,但會稍稍高于高考,是省內最具參考意義的大型考試。2016年是廣東省第一年采用全國卷,因此對全國卷的命題思路、特點、風格、趨勢,以及我省自主命題與全國命題之間的銜接程度,將充分展示在一模和二模當中。本文擬用SPSS 22.0對2016 年廣東省某所國家示范性高中高三某班的學生在該測試中的試卷成績進行分析,了解學生對知識的掌握情況,以便為及時調控教學策略提供客觀真實的依據,從而科學指導教學,提高教學質量和高考備考效果,以幫助學生順利適應從廣東卷到全國卷的過渡。
1.1 考試情況分析
本次考試參與人數為55人,試卷有效份數55份。該測試的性質是關于能力方面的考試,主要目的是對學生前一階段學習情況進行檢查,并借此預測學生應對高考的能力,同時為下一階段的復習規(guī)劃提供有針對性的參考依據。該試卷的具體題型及分值分布如下:閱讀理解(30分)、七選五(10分)、完形填空(20分)、語法填空(10分)、短文改錯(10分),以及書面表達(25分),全卷合計120分。
1.2 基本數據分析
首先對總分進行描述統計分析,從分析的結果可知:本次考試最高分(Maximum)= 108.50分,最低分(Minimum)= 27分,全距(Range)= 81.50 分,平均分(Mean)=77.83分,標準差(Std. Deviation)=17.56分。標準差大表示本班學生的英語水平個體差距較大,兩極分化的情況比較嚴重。
其次,對總分進行頻數分析,即可得到各分數段學生分布圖。在大規(guī)模考試中,考生水平的分布一般是呈正態(tài)的,因此考生分數的分布也應當呈正態(tài)分布。根據數據分析,全體考生的成績呈正態(tài)分布,說明這份試卷的命題是合理的。
1.3 難度分析
試題的難度表示試題的難易程度,是指全體考生在該題的失分情況。公式為:P=X/W,P為難度值,X為均分值,W為該題滿分值。試題的難度值與試題實際的難易程度成反比,難度值越大表示正確解答該題的學生越多;數值越小則表示試題越難。一般情況下,難度適中的試題更能客觀地反映出學生的學習效果,大部分的試題難度分布在0.3~0.7之間,選拔性的考試P值為0.5左右為宜。通常以期末考試為目的做參照性的考試,P值可適當偏高,全卷的平均難度以0.7左右為宜,0.6~0.8 為正常(張玥 2013)。通過分析可知該試卷各題型的難度系數如下:閱讀理解為0.68,七選五為0.66,完形填空為0.63,語法填空為0.68,改錯為0.69,書面表達為0.74,基本集中在0.63~0.74之間。而整份試卷中的難度系數是0.65,難度適中,符合以上所提及的標準,在正常范圍內。
1.4 區(qū)分度分析
區(qū)分度一般是指試題對于被測試對象實際水平的鑒別能力,是將考生區(qū)別開來的統計量。比如有一道題,考試中水平好的考生都答對了,水平差的考生都答錯了,這道題的區(qū)分度就比較高。一般使用斯皮爾曼(Spearman)等級進行客觀題相關的分析;而主觀題是非等間距測度的連續(xù)變量,該次測試的樣本大于30,因此采用皮爾遜(Pearson)等級進行相關的分析(張玥 2013)。
通過分析的數據可知,各題型區(qū)分度分別為閱讀理解0.877,七選五0.590,完形填空0.843,語法填空0.845,短文改錯0.874,書面表達0.749。由此可以看出,閱讀理解的區(qū)分度最高是0.877,說明學生的成績在此題被顯著拉開。建議教師在日后的復習工作中,針對閱讀理解所涉及的解題技巧對學生進行重點訓練以及輔導,爭取在高考中提高分數。其余幾題的區(qū)分度較高,說明該份試卷可以區(qū)分出學生之間的實際水平差異。
1.5 信度分析
信度反映測試結果的可靠性、穩(wěn)定性以及一致性。信度越高表示測試結果越可靠、穩(wěn)定及一致。對于語言類考試的信度,其測試結果是指被測試者的表現的可信度。影響測試信度的因素較多,就試題本身來說,信度取決于測試范圍和題量;而評分的信度則取決于評分標準的客觀性以及準確性??蛇x用巴赫Alpha系數來計算測試中包含有非0~1記分的題目的一致性信度系數。
一般情況下大規(guī)模標準化考試的信度在0.9 以上,說明達到最好的標準化考試水平;當信度系數在0.7~0.9之間,說明試卷信度較高;當信度系數在0.5~0.7之間,說明部分試題需要改進;當信度系數小于0.5,則說明試卷信度存有一定的問題,考試基本是無效的(張玥 2013)。通過統計的數據可知本試卷各題型的信度在0.832~0.870之間,幅度基本一致,信度較高。另外,本次測試的巴赫Alpha系數為0.87,說明整體測試結果穩(wěn)定可靠。
通過SPSS 對一模試卷成績的統計分析,可以了解到試卷整體的難度適中,符合學生的實際情況,比較客觀地反映教師與學生“教”與“學”的水平與效果,符合教學大綱要求并能有效地考查學生的綜合語言應用能力與思維能力,真實地反映出學生知識掌握的實際水平,較好地檢測學生現有知識能力水平以及診斷學生知識能力的缺陷,符合對選拔類型考試進行相關預測的要求,對下一階段的備考有較大的指向作用。
在后階段的備考復習中,教師需要強化備好策略和規(guī)范的有效訓練,給予學生更多積極的反饋,讓學生在備考的過程中進一步鞏固語言知識,梳理文化背景知識,提高思維能力。以下是幾點備考建議:①分析學生的具體情況,整體規(guī)劃,提高后一階段復習備考指導的有效性與針對性;②精心設計備考內容,優(yōu)化復習過程,提高復習效率;③加強專題復習,指導做題策略和題目所需的能力要求。
廣州市教育研究院. 2016. 2016年廣州市普通高中畢業(yè)班綜合測試分析報告[R]. 廣州:廣東教育出版社.
張玥. 2013. SPSS軟件在英語試卷質量分析中的解析及應用[J].職校論壇(7):320-321,380.