【摘 要】本文以項目反應理論為依據(jù),運用BILOG-MG V3.0分析軟件對大學英語分級測試的試題(項目)進行了分析研究,通過標刻難度、區(qū)分度、能力參數(shù)等各項目參數(shù),為科學建立大學英語分級測試題庫提供數(shù)據(jù),奠定基礎。
【關鍵詞】大學英語;分級測試;項目反應理論;試題分析
一、引言
大學英語教學是高等教育的一個有機組成部分,大學英語課程是大學生的一門必修的基礎課程。大學英語實行分級教學不僅體現(xiàn)了《大學英語課程教學要求》“分類指導,因材施教”的原則,對于整體提高大學英語教學質(zhì)量也起到了積極促進作用。因此,大學英語試題建設顯得尤為重要。試題是題庫建設的最基本元素,它的優(yōu)劣直接影響大學英語試題題庫的質(zhì)量。所以,建立起對大學英語試題的科學完整的評價體系十分必要。
二、理論研究
客觀、準確地評價大學英語試題,科學的對其進行分析。其關鍵點在于要有科學的理論依據(jù)。在教育心理測量領域中,應用比較多的有經(jīng)典測驗理論和項目反應理論。經(jīng)典測驗理論(簡稱CTT)是最早的也是最實用的測驗理論。也稱為真分數(shù)理論,即被試的真分數(shù)是觀測分數(shù)(或說測量實得分數(shù))的數(shù)學期望值。真分數(shù)模型是以弱假設為基礎的,即這些假設很容易驗證并易被大多數(shù)測驗數(shù)據(jù)資料所滿足。經(jīng)典測驗理論的假設內(nèi)涵主要是以真實分數(shù)模式為理論架構(gòu),依據(jù)弱勢假設,使用簡單,可操作性強,應用較廣?;诮?jīng)典測驗理論統(tǒng)計分析得到的各項指標,依賴于特定的被試樣本,所求得的參數(shù)會受到不同樣本組能力水平的影響。經(jīng)典測驗理論無法建立考生得分與測驗題目參數(shù)之間的函數(shù)關系,即考生能力的估計會由于測驗的改變而改變。
項目反應理論(簡稱IRT)是建立在潛在特質(zhì)理論的基礎上的。其主要觀點是:在認知測驗中,潛在特質(zhì)指所要測的內(nèi)在能力。定量地估計個體在每一種特質(zhì)上的位置是心理測量的任務。反之,也可用所估計到的特質(zhì)的量去預測和解釋個體在相應情境中將會產(chǎn)生的行為反應。
項目反應理論的最大特點是它找到了一條題目特征曲線(簡稱ICC)并且以多種數(shù)學表達式(即數(shù)學模型)來描述它和逼近它。不同的數(shù)學模型對曲線有不同程度的逼近,也含有個數(shù)不同的參數(shù)。題目特征曲線的數(shù)學模型一般都包含兩方面的參數(shù):(1)對測驗題目的特征進行刻畫的題目參數(shù);(2)對考生的特征進行刻畫的潛在特質(zhì)或稱能力參數(shù)。
根據(jù)這些參數(shù)值,我們可以對題目質(zhì)量作出評價,可按需要選取高質(zhì)量的題目。又可以預言考生個體在任一測驗題目上的反應,從而估計出考生個體的各種潛在特質(zhì)的量數(shù),即考生完成測驗題目時所具有的能力或特質(zhì)。從理論上說,有效地解決了經(jīng)典測驗理論中無法建立考生得分與測驗題目參數(shù)之間的函數(shù)關系問題。
項目反應理論的優(yōu)勢表現(xiàn)在:題目難易度的估計不因樣本不同而不同。項目反應理論的題目參數(shù)估計是獨立于考生樣本組的。考生能力的估計不因測驗的改變而改變。項目反應理論在提供題目參數(shù)的同時,提供了每一個考生在完成題目時的能力參數(shù)。測量誤差的估計因考生程度不同而不同。為多種形式測驗的實施提供了更為完美的理論和方法。在題目分析和估計學生能力的同時,可以得到題目信息函數(shù)和測驗信息函數(shù)兩個統(tǒng)計量。所以,本文嘗試用項目反應理論來對大學英語分級測試試題進行分析研究,探討每個具體英語分級試題(項目)能否客觀準確地反應出學生的真實能力水平。進而發(fā)現(xiàn)命制英語分級試題的規(guī)律和標準,為更好地開展大學英語分級教學提供切實可行的方法。
三、實驗研究
本研究選取的實驗對象來源于某大學2010級的大學英語分級測試試題。研究人員運用BILOG-W分析軟件對試題進行項目反應分析。此分析內(nèi)容包括試題的難度、區(qū)分度、項目以及能力參數(shù)的估計,對試題的難度進行標定,分為難中易三個等級。參與實際測試的是2010級2534名學生參加的大學英語分級考試。我們從中隨機抽取樣本容量為200的被試者數(shù)據(jù)并通過項目反應理論中的BILOG-MG V3.0軟件對作答結(jié)果的分析來對分級考試中試題進行分析和分類。BILOG軟件運用期望后驗法(EAP)和貝葉斯(Bayes)估計法進行考生的能力估計。試題總?cè)萘繛?6,均采用0、1計分法。其中合格數(shù)為75,10道試題通過分析被列為不合格試題,75道試題的平均難度為6.16。本文對試題分為難、中、易三個程度。難度值區(qū)間為(0,10),從試題難度平均值來看難題較多,適合作為分級考試的試題。同時試題的平均區(qū)分度為0.5112,能夠較好的區(qū)分被試者的能力水平。所有項目都在相應的能力區(qū)域產(chǎn)生一定的信息量。
四、結(jié)論
以上研究結(jié)果表明只有經(jīng)過科學、客觀的分析和篩選的試題才能真正反映出學生的能力特征和能力差異,才能為下一步建立大學英語分級測試題庫奠定堅實的基礎,進而促進大學英語教學,使學生能力得到全面發(fā)展。
【參考文獻】
[1]何立新.英語語言測試理論與應用[M].北京:中國社會出版社,2005.12
[2]教育部高等教育司.大學英語課程教學要求[M].外語教學與研究出版社,2007:1
[3]于向英.教育測量與統(tǒng)計[M].鄭州:鄭州大學出版社,2004.1
[4]張權.語言測試中的項目分析與等值技術[M].北京:高等教育出版社,2004:2
[5]朱靖華.基于項目反應理論的計算機自適應考試系統(tǒng)的研究[D].長沙:湖南大學,2008