王萌 宋岳禮
摘 要:英語教學和英語測試密不可分。本研究基于教育測量和統(tǒng)計分析理論,結(jié)合2011級農(nóng)學專業(yè)《大學英語4》期末考試情況,用SPSS軟件對試卷的難度、區(qū)分度、信度和效度進行定量分析。統(tǒng)計分析表明:本次測試較好地達到了測試的目的,基本反映了學生的實際水平,但信度有待進一步提高。從而為改進教學方法和完善大學英語試題庫提供科學依據(jù)。
關(guān)鍵詞:語言測試;信度;效度;難度;區(qū)分度
大學英語教學是高等教育的一個有機組成部分,大學英語是為非英語專業(yè)本科生開設的一門公共基礎課。而考試是考查和評價學生對所學知識掌握程度的一種有效手段,對教與學都有較大的影響。本文以我校2011級農(nóng)學專業(yè)本科生在2012—2013年度第二學期大學英語期末考試為例,用定量化的方法從試卷的難度、區(qū)分度、信度和效度四個方面對試卷進行分析評價。
一、研究設計
(一)研究對象
本文的研究對象為西北農(nóng)林科技大學農(nóng)學院2011級農(nóng)學專業(yè)1班和2班大學英語第四冊期末考試試卷,共50份。本次試卷總題目為86道,全卷滿分為100分。其中客觀題(快速閱讀、閱讀理解、詞匯語法、完型填空)為80道,分值為75分;主觀題(翻譯、寫作)為6道,分值為25分。
(二)研究方法
試卷的評判根據(jù)提前制定的評卷標準和標準答案,按照流水方式進行閱卷。數(shù)據(jù)處理:將50名學生每個人的總成績和每小題的答題情況輸入計算機,用SPSS18.0統(tǒng)計軟件包進行數(shù)據(jù)處理和統(tǒng)計分析。
三、研究結(jié)果與討論
(一)試卷的描述性統(tǒng)計分析
試卷滿分為100分,平均成績?yōu)?3.5分,標準差為8.5分,最高分為92.0分,最低分為43.5分,全距為48.5分,不及格率為4.0%。學生成績分布的直方圖顯示學生在各分數(shù)段的人數(shù)分布呈現(xiàn)中間多、兩頭小的趨勢,基本上符合正態(tài)分布。
(二)試卷質(zhì)量檢驗指標分析
衡量試卷質(zhì)量的主要檢驗指有難度、區(qū)分度、信度和效度。
1.難度
試題的難度是指題目的難易程度,指答對題目人數(shù)所占的比例,也叫“容易度”。難度一般用字母P表示,P越大表示題目越簡單,P越小表示題目越難。本次試卷難題和較難題所占的比例(40.5%)與容易題與較容易題所占的比例(42%)基本相當。
2.區(qū)分度
區(qū)分度是區(qū)分應試者能力水平高低的指標,用字母D表示。區(qū)分度高的試題能將不同水平的考生區(qū)分開來,即學業(yè)水平高的考生得分高,學業(yè)水平低的考生得分低。其中區(qū)分度很好和良好的題目共13道,分值占32%;區(qū)分度尚可的題目有17道,分值占20%;區(qū)分度較差和差的題目共56道,分值占48%。又對每大題的難度和區(qū)分度綜合分析,此次測試區(qū)分度D值為0.20,區(qū)分度尚可。區(qū)分度偏低,要作為競賽的試題應作適當?shù)男薷模鳛槠谀┛荚?,是對學生基礎知識的考察,能兼顧不同程度的學生,可以考慮采用。其中完型填空難度是0.67,區(qū)分度是0.03,屬于較難題,區(qū)分度差,此題出的不好。
3.信度
信度是測試結(jié)果的穩(wěn)定性和可靠性。在語言測試學中對試卷信度的檢驗一般采用內(nèi)在信度檢驗中的Cronbach Alpha系數(shù)檢驗。Cronbach Alpha系數(shù)介于0和1之間,系數(shù)越高,表明內(nèi)在一致性越強,測試的結(jié)果就越可靠。運用SPSS軟件對測試結(jié)果進行內(nèi)在信度檢驗,可知整個試卷的信度系數(shù)為0.512。根據(jù)測試學有關(guān)理論,Alpha達到0.80以上,則表明試卷的信度是理想的。此次考試整個試卷的信度系數(shù)為0.512,遠低于0.80的標準,說明本試卷的信度系數(shù)有待提高。
4.效度
測試的效度指測試是否考查了原定需要考查的內(nèi)容,考試的結(jié)果能不能用來評判預定要測試的語言能力。本次測試,測試的內(nèi)容與教學大綱、教學內(nèi)容基本保持一致??v觀全卷,可發(fā)現(xiàn)本試卷對讀、寫、譯的能力有充分的反映,而未涉及到聽和說的能力測試,故在這兩方面無有效性。試卷構(gòu)成共六大題,滿分100分,其中客觀題四道,占總分75%,主觀題兩道,占總分25%。從題型來看,主客觀相結(jié)合且比例恰當,既全面考查了學生各方面的能力,又保證了評分的客觀性。
四、研究結(jié)論
通過從各個角度對試卷分類分項分析,評析了試題質(zhì)量,分析結(jié)果表明:
(一)從整個試卷看,本次測試總體是可信的、有效的,基本反映了學生的實際水平。
(二)從試題的難度和區(qū)分度看,整套試卷難度居中,區(qū)分度尚可,能在一定程度上鑒別學生的學習能力;快速閱讀、詞匯語法、翻譯是比較簡單的題目,影響了試題的區(qū)分度。
(三)從試卷的信度和效度看,試題符合大綱要求,考點覆蓋教學內(nèi)容,主客觀題比例恰當,但試卷的信度不高。命題時應該注意避免太簡單的題目,完型填空命題要加強。
五、結(jié)語
總之,英語教學和測試密不可分,要充分發(fā)揮測試對英語教與學的正面反撥效應(positive washback)。教師要在提高教學效果和教學質(zhì)量上狠下工夫,不斷完善科學、規(guī)范的試題庫,使考試能真正反映學生對英語的全面掌握和實際運用情況。
參考文獻:
[1]魏紅梅.SPSS對語言測試題信度和效度的檢測分析[J].四川教育學院學報,2007(11).
[2]武尊民.英語測試的理論與實踐[M].北京:外語教學與研究出版社,2008.
作者簡介:王萌(1990–),女,河南焦作人,碩士研究生,研究方向:二語習得;宋岳禮(1965–),女,陜西戶縣人,副教授、碩士生導師,研究方向:二語習得。