鄒麗華
(大連教育學院 學習質(zhì)量監(jiān)測中心,遼寧 大連116021)
難度和區(qū)分度是評價試題質(zhì)量的兩個重要統(tǒng)計指標。一般情況下,對于兼顧學業(yè)水平和選拔測試的中考,尤其是對于承載選拔進入重點高中或一般高中的難題和中等難度的試題,比較重視試題難度指標,容易忽視試題區(qū)分度指標。從題目得分率與總分關系,探究題目局部區(qū)分功能,其重要意義在于評價試題的“公平選拔”作用。
在經(jīng)典測量理論(CTT)框架下,難度指標通常以通過率或得分率表示,用難度系數(shù)(p)大小表示試題的難易程度。難度指標是一個反向指標,難度系數(shù)越小,試題就越難。區(qū)分度又稱為鑒別力,是指題目對不同水平考生的區(qū)分程度,用鑒別指數(shù)(D)或相關系數(shù)(r)的大小表示區(qū)分程度。從經(jīng)典教育測量與統(tǒng)計理論相關研究結果看,鑒別指數(shù)和題目難度不是彼此獨立的,中等難度水平的試題,D值可以最大。[1]表1是具有不同難度系數(shù)(p)的項目所對應的可能的最大D值;最大D值與難度系數(shù)(p)的關系之間呈倒U型關系,即接近0.5難度水平的題目的鑒別度值大于難度在兩端的題目。
表1 最大D值與項目難度的關系
區(qū)分度指標不僅會受到難度指標影響,同樣也會受到樣本容量和被試同質(zhì)性程度的影響。如果被試學業(yè)水平整體較好,試題難度相對要小些,鑒別指數(shù)D會??;如果被試學業(yè)水平整體上表現(xiàn)都不是很好,試題難度相對要大些,鑒別指數(shù)D也不會大。以選拔為目的的測驗,接近于0.5難度水平的各個試題更為可選,題目更能較精確區(qū)分考生間差異。
以大連市內(nèi)五區(qū)考生試卷為樣本,選取近四年來中考物理試題的全部126道題目,進行數(shù)據(jù)統(tǒng)計與分析,得到題目鑒別指數(shù)與難度系數(shù)之間的關系,見圖1。
圖1 中考物理試題鑒別指數(shù)與難度系數(shù)關系
圖1顯示,鑒別指數(shù)和難度系數(shù)關系基本上呈倒U型,即中等難度的題目可能產(chǎn)生最大的區(qū)分度,但并不意味著中等難度題目的D值一定大于簡單題或難題,即使p值小于0.4或大于0.7的題目也可能具有比較理想的D值;難度系數(shù)在0.9以上的題目D值普遍偏低。總之,盡管區(qū)分度與題目難度總體上符合倒U型數(shù)量關系,但并不存在著一一對應的關系。因此,在中考物理學科命題過程中,單憑通過控制試題難度難以實現(xiàn)對區(qū)分度的控制。
試題局部區(qū)分功能類型可以劃分為全程區(qū)分、高端區(qū)分、低端區(qū)分、中高段區(qū)分和中低段區(qū)分,區(qū)分程度可劃分為強區(qū)分、中度區(qū)分和弱區(qū)分。[2]由于難度和區(qū)分度指標的局限性,以及題目難度與區(qū)分度的實際關系并非呈倒U型關系,作為整體指標的難度與區(qū)分度很難反映題目的局部特征與功能。不同難度試題的局部區(qū)分功能存在差異,區(qū)分度和難度相同或相近的兩道試題的局部特征也存在著差異。
CTT理論框架下難度與區(qū)分度的估計對樣本的依賴性很大。計算題目的難度和區(qū)分度指標一般基于總體或總體的代表性樣本,以反映總體特征。以2010年中考物理試卷中具有相同的計算題型和測試能力的第24題和第25題為例,采用市內(nèi)五區(qū)考生試卷樣本數(shù)據(jù)進行統(tǒng)計分析,結果見表2。
表2 兩個題目統(tǒng)計結果
兩個題目通過率與總分的關系見圖2??梢钥闯觯瑑蓷l曲線并不重合,盡管兩題難度系數(shù)、區(qū)分度指標均接近,但考生通過率的變化趨勢不盡相同。難度系數(shù)和區(qū)分指標相同或接近的題目,同一考生群體的通過率卻存在著差別,即局部區(qū)分度功能存在差異。
圖2 題目24和題目25通過率隨總分變化曲線對比
通常,對兼顧學生水平測試和選拔兩種功能的中考命題來講,題目區(qū)分度不做要求。簡單題要求學生達到課標基本要求即可,但對承載選拔任務的中等試題和難題要有較好區(qū)分度及局部區(qū)分功能。因此,命題必須重視難題和中等難度試題的局部區(qū)分功能的設計及調(diào)整。
大連中考的區(qū)分功能表現(xiàn)在將適合升入示范高中和適合升入一般高中的學生區(qū)分開來。根據(jù)錄取率確定難度系數(shù)節(jié)點是構建合理難度分布模型的關鍵。近年來,大連示范和一般公辦高中錄取率分別穩(wěn)定在30%和55%左右,因此重點高中與一般高中的選拔難度系數(shù)節(jié)點為0.30和0.55。由于大連市中考試題難、中、易分值比為1:2:7,相應各部分試題的難度系數(shù)分別為[0.2,0.4]、(0.4,0.7]、(0.7,1.0]。[3]在此基礎上,結合近幾年中考物理試題難度分布,合理建構大連區(qū)域中考物理試題難度分布模型。[4]構建合理難度模型的目的是為中考水平測試和選拔服務。在選拔不同類型學校的節(jié)點處附近設置與能力水平相近的高區(qū)分度試題,才能更好地落實公正選拔,減低錄取誤差。
選拔測驗中相同難度試題,不論是簡單題還是難題,區(qū)分度越高越好。區(qū)分度越高,越能把不同能力水平的考生區(qū)分開來,越有利于選拔。對于難度系數(shù)在0.80~1.00,即屬于學業(yè)水平考試部分的試題,區(qū)分度低的試題也可以保留。
總分就是對所研究的能力、特質(zhì)或結構的一種初步、近似的測量結果。物理試題編制要求:一是承載“1”部分的難題必須設置在高能力水平處考查,這樣才能保證得分越高的考生,其能力水平也越高,避免用簡單題區(qū)分高能力水平的考生。二是難題必須在高端強區(qū)分,中等難度題至少在中高段中度區(qū)分。區(qū)分功能較強的試題,難度系數(shù)應設置在0.2~0.8為宜,保證鑒別指數(shù)在0.2以上。過難或過易的試題對測驗分數(shù)的變異性影響較小,對測驗信度和效度幾乎不起作用。
試卷難度分布影響考試結果的分數(shù)分布形態(tài),試卷的區(qū)分結構更多針對被試群體進行分層區(qū)分,難度分布和區(qū)分結構影響試卷區(qū)分功能。選取、編制難度合適,并具有一定區(qū)分功能的試題,有利于測量能力較高考生之間的個體差異,有利于公平、公正地選拔考生。試卷設計不僅要考慮試題難度分布狀況,還要通過調(diào)整區(qū)分結構來實現(xiàn)對某段考生的更高效的區(qū)分,如要對全體考生發(fā)揮均衡的區(qū)分作用,就要設計全程區(qū)分類型題目或均衡配置各種區(qū)分類型題目的比重。
大連市中考物理近四年承擔選拔功能的試題分布在選擇題、簡答題和綜合題三種題型。以2013年中考物理試卷中五道難題為例,題號、題型、考查內(nèi)容、滿分值、難度和區(qū)分度等內(nèi)容詳見表3所示。依據(jù)項目區(qū)分度評價標準確定這五道試題的相關程度。[2]
表3 五道題目難度系數(shù)和區(qū)分度
從表3選擇不同題型且D值相差較大的第14、29、32題,由實測原始分數(shù),繪制題目得分率隨物理總分變化的關系曲線,即題目難度曲線,見圖3。
圖3 三道題目難度曲線
由圖3可見,在選拔重點高中的節(jié)點難度系數(shù)0.3左右的這三道難題,整體上均對高分考生具有較好的區(qū)分,其中第29題和第32題兩題性能較好。第29題對考生具有較強的區(qū)分功能表現(xiàn)在高分段(70分~88分),對70分以下的考生無區(qū)分;第32題對考生的區(qū)分主要體現(xiàn)在中高分數(shù)段(50分~90分),對50分以下的考生弱區(qū)分;第14題是一道多選題,有一定的猜測度,該題只對80分以上的考生有較好的區(qū)分,在曲線低端和中段的得分率變化不是隨總分增加呈現(xiàn)上升的趨勢。換句話說,得分高的考生在該題上的得分不一定高,該題目區(qū)分不利于公正選拔考生。因此,區(qū)分度指標作為整體指標說明題目鑒別能力,很可能是有效的,但對題目局部區(qū)分功能的探討能很好地說明題目對哪一目標群體區(qū)分更有效。
總之,對于水平考試要更多地關注難度分布,局部區(qū)分功能設計主要是通過題目難度分布的調(diào)控來實現(xiàn)。對于兼顧學業(yè)水平測試和選拔功能的中考來講,首先要依據(jù)課標內(nèi)容要求命制合適難度的題目,同時也要考慮難題和中等難度試題的局部區(qū)分類型,確保達到公平公正合理選拔考生的測試目的。
[1]安妮·安納斯塔西,蘇珊娜·厄比納.20世紀心理學通覽—心理測驗[M].江蘇:浙江教育出版社,2008(8):243.
[2]鄒麗華.區(qū)分度在中考試題質(zhì)量分析中的應用[J].大連教育學院學報,2011(4):27-30.
[3]趙娟.中考試題命制應注意的幾個問題[J].大連教育學院學報,2013(1):43-44.
[4]鄒麗華.中考物理試題難度的設置與控制[J].物理通報,2013(3):107-109.