黃玉平
一、問題提出
檢驗(yàn)教學(xué)質(zhì)量,最常用也最有效的手段,是進(jìn)行測試。在當(dāng)今大數(shù)據(jù)廣泛應(yīng)用的時(shí)代,每次測試結(jié)束后,各種閱卷系統(tǒng)都能導(dǎo)出每個(gè)學(xué)生每道題的得分,如果能對(duì)這些得分情況進(jìn)行深入分析,能夠發(fā)現(xiàn)和提示教學(xué)中可能存在優(yōu)勢與不足,優(yōu)勢可以促進(jìn)管理者發(fā)現(xiàn)優(yōu)秀的教學(xué)經(jīng)驗(yàn),不足則提醒管理者尋找教學(xué)改進(jìn)的措施,從而不斷提高教學(xué)水平。
當(dāng)考完一套試題,許多教師會(huì)進(jìn)行試卷整體及各小題的得分率進(jìn)行分析,研究各個(gè)群體解得較理想的題,解得不理想的題,評(píng)判的標(biāo)準(zhǔn)就是一個(gè)問題。
本文將全市同一個(gè)年級(jí)的學(xué)生做為全體,將其中每個(gè)學(xué)校的學(xué)生或每個(gè)班級(jí)的學(xué)生做為群體。
一些分析軟件,將全體得分率超0.7以上的設(shè)為容易題,評(píng)價(jià)為解答較好的題;得分率在0.3與0.7之間的為中檔題,評(píng)價(jià)為解答一般的題;低于0.3的為難題,評(píng)價(jià)為解答較差的題。這種絕對(duì)標(biāo)準(zhǔn)的方式,適合對(duì)整套試題進(jìn)行難度分布的評(píng)價(jià),不適合對(duì)具體某個(gè)群體的解答情況進(jìn)行評(píng)價(jià)。例如,某次考試,某群體在第1小題得分率為0.8,如果按絕對(duì)標(biāo)準(zhǔn),屬解答較好的題,如果其它基礎(chǔ)更弱的群體很多都考了0.8以上,那么這個(gè)群體在第1小題的解答情況就不太理想了,反之,這個(gè)群體在第10小題得分率為0.2,按絕對(duì)標(biāo)準(zhǔn),屬解答很差的題,如果這是各群體中解答情況最好的,遠(yuǎn)遠(yuǎn)超過其它群體的得分率,那么第10小題反而是這個(gè)群體解答很好的題。
在一些學(xué)校,特別是初中和小學(xué),會(huì)將同一個(gè)年級(jí)的每個(gè)班的每個(gè)小題的得分進(jìn)行排序,這種方法在各班為平行班,基礎(chǔ)相近時(shí),可以起到一定評(píng)判的作用,例如全年級(jí)有24個(gè)班,A班全卷平均分排名全年級(jí)第4,第8小題平均得分排名全年級(jí)第23,可以提示A班第8小題解答相對(duì)較弱。這種用排名次對(duì)基礎(chǔ)不同的群體答題情況進(jìn)行評(píng)價(jià)的辦法,比較粗糙,例如:某班基礎(chǔ)最強(qiáng),全卷平均分和各小題得分均排名第1,無法評(píng)判這個(gè)班哪個(gè)小題解答較理想,哪個(gè)解答不理想。
試題研究中,難度系數(shù)是被廣泛應(yīng)用的一個(gè)概念,一道題的難度系數(shù)的簡單定義是:考試的全體人員在這道題上的平均分得分率,即全體人員在這題的得分之和與這道題滿分值與人數(shù)之積的比。
一個(gè)較容易的題,基礎(chǔ)較好的群體會(huì)解得很好,基礎(chǔ)較弱的群體則會(huì)水平低一些;一個(gè)較難的題,各群體的得分率都大幅下降,群體之間的差異很大,如果沒有與群體水平對(duì)應(yīng)的評(píng)判斷標(biāo)準(zhǔn),很難判斷各群體的答對(duì)情況是否正常,難以從中獲得反思,從而不能充分發(fā)揮考試的價(jià)值。
筆者發(fā)現(xiàn),某個(gè)群體對(duì)某個(gè)試題的實(shí)際得分率,主要受到兩個(gè)因素的影響:試題本身的因素,群體的水平高低。同樣的試題,水平高的群體,得分率相對(duì)較高。經(jīng)過對(duì)考試后統(tǒng)計(jì)出的各群體實(shí)際得分率表的長期觀察和思考,本文對(duì)試題難度的表示提出了一種新的模型:難度指數(shù)模型。
本文提出試題難度的指數(shù)模型,并給出一種評(píng)價(jià)標(biāo)準(zhǔn):用同樣的試題相對(duì)某個(gè)群體的難度指數(shù)與它相對(duì)全體人群的難度指數(shù)的差距,作為這個(gè)群體解答這個(gè)試題的評(píng)價(jià)標(biāo)準(zhǔn)。
二、解決方案
(一)將試題得分化為試題得分率
用得分率比直接用得分更科學(xué):得分率排除了試題滿分值對(duì)結(jié)果的干擾。例如A題滿分值為12分,實(shí)際得分6分,B題滿分值為10分,實(shí)際得分也是6分,表面上兩題得分相同,實(shí)際A題得分率為0.5,B題得分率為0.6。
群體A對(duì)試題N的得分率(或通過率):設(shè)群體 A 的人數(shù)為 ,群體A解答試題N的得分?jǐn)?shù)之和為M,試題N的滿分值為F,則群體A對(duì)試題N的得分率。
(二)將較難試題分解為若干環(huán)節(jié)
將試題看做由幾個(gè)環(huán)節(jié)串聯(lián)而成,環(huán)節(jié)可以理解為更小的試題。對(duì)同一個(gè)群體,不同試題的得分率由各題所包括的每個(gè)環(huán)節(jié)的得分率決定。較難的試題,一方面是環(huán)節(jié)越多,另一方面是這些環(huán)節(jié)中得分率低的也越多。上圖是試題N由三個(gè)環(huán)節(jié)構(gòu)成的示意圖,三個(gè)環(huán)節(jié)呈串聯(lián)狀態(tài),只有連續(xù)正確解答三個(gè)環(huán)節(jié),才能完成試題N的解答。
(三)定義“標(biāo)準(zhǔn)微環(huán)節(jié)”和“最簡單題”:若全體對(duì)某一批試題的得分率的平均值為0.85,由稱這批試題為全體的“最簡單題”,規(guī)定全體的“最簡單題得分率為0.85,同時(shí),稱全體得分率為0.85的環(huán)節(jié)為全體的“標(biāo)準(zhǔn)微環(huán)節(jié)”。計(jì)算每個(gè)群體在這批試題上的各題得分率平均值,得到每個(gè)群體的“最簡單題得分率”,稱同樣得分率的環(huán)節(jié)為該群體的“標(biāo)準(zhǔn)微環(huán)節(jié)”。筆者在實(shí)踐中觀察了近十年,在某個(gè)城市,由于各群體生源格局相對(duì)固定,每個(gè)群體這樣的“最簡單題得分率”相當(dāng)穩(wěn)定,例如,最好的群體各科都在0.95左右,居第二的群體則在0.92左右,最弱的群體則在0.6左右。
如果將一個(gè)試題分解為一些環(huán)節(jié)串聯(lián)而成,并且將每個(gè)環(huán)節(jié)都看作由一定數(shù)量的“標(biāo)準(zhǔn)微環(huán)節(jié)”串聯(lián)構(gòu)成,則可以認(rèn)為:每道試題由一定數(shù)量的標(biāo)準(zhǔn)微環(huán)節(jié)構(gòu)成,試題得分率與標(biāo)準(zhǔn)微環(huán)節(jié)的數(shù)量呈指數(shù)函數(shù)關(guān)系,即:標(biāo)準(zhǔn)微環(huán)節(jié)數(shù)量越多的題,得分率越低;對(duì)于某個(gè)群體來說,將一個(gè)試題分解為該群體的“標(biāo)準(zhǔn)微環(huán)節(jié)”,其數(shù)量與得分率呈指數(shù)函數(shù)關(guān)系,其底數(shù)為該群體“標(biāo)準(zhǔn)微環(huán)節(jié)”的得分率。
環(huán)節(jié)四:運(yùn)用不等式,求最值:
得分率預(yù)測:本題中,環(huán)節(jié)一相對(duì)簡單,由于有兩個(gè)知識(shí)點(diǎn),假設(shè)相當(dāng)于 2 個(gè)標(biāo)準(zhǔn)微環(huán)節(jié),環(huán)節(jié)二則比較復(fù)雜,假設(shè)相當(dāng)于 4 個(gè)標(biāo)準(zhǔn)微環(huán)節(jié),環(huán)節(jié)三有較復(fù)雜的計(jì)算,因此假設(shè)相當(dāng)于 5 個(gè)標(biāo)準(zhǔn)微環(huán)節(jié),環(huán)節(jié)四用到不等式,假設(shè)相當(dāng)于 4 個(gè)標(biāo)準(zhǔn)微環(huán)節(jié),這樣全部加起來,相當(dāng)于 15 個(gè)標(biāo)準(zhǔn)微環(huán)節(jié)。
假設(shè)群體A和群體 B 的“最簡單題得分率”分別為0.9,0.8,則群體A和群體B對(duì)此題估計(jì)得分率分別為:fT ( A) = 0.915 = 0.2, fT (B) = 0.815 = 0.03 。
真實(shí)的結(jié)果是,這道試題的得分率確實(shí)相當(dāng)?shù)停词故侨凶顝?qiáng)的學(xué)校,也僅有不到三分之一的學(xué)生能夠正確解答。
(四)難度指數(shù)定義:某個(gè)試題對(duì)全體的“標(biāo)準(zhǔn)微環(huán)節(jié)”數(shù)量,就是這個(gè)試題相對(duì)全體的難度指數(shù)。對(duì)于某個(gè)群體,某個(gè)試題的相對(duì)本群體的“標(biāo)準(zhǔn)微環(huán)節(jié)”數(shù)量,即這個(gè)試題相對(duì)本群體的難度指數(shù)。
難度指數(shù)計(jì)算方法:在一份試卷各題中,將全市得分率最高的一批試題按得分率由高到低排列,其中得分率在0.7至0.95之間的試題一般須占全卷小題數(shù)量的30%,即8個(gè)以上,若這批試題的全市得分率的平均值在0.85左右,則將它們表示為“全市最簡單題”。全市各群體在這批試題上的得分率,是它們的“最簡單題得分率”。實(shí)踐中,基礎(chǔ)最好的群體(學(xué)校)“最簡單題得分率”在 95%左右,基礎(chǔ)最弱的群體則在60%至80%之間。
如果整卷試卷過難,則將所有題按全體得分率由高到低排列,取前三分之一(至少八個(gè)試題)的得分率的平均值,通過折算的辦法,得到理想的全體最簡單題得分率:
與此同時(shí),將某群體對(duì)這批試題的得分率的平均值,同樣折算為理想的此群體最簡單題得分率,且。
(五)難度指數(shù)的計(jì)算方法:若某題N的全體得分率為,則此題全體的難度指數(shù)為(當(dāng)時(shí),改用計(jì)算)。若某題N的群體A得分率為,且群體A“最簡單題得分率”為,則此題對(duì)群體A的難度指數(shù)為(當(dāng)時(shí),改用)。
三、運(yùn)用舉例
例1.用“最簡單題得分率”衡量各群體基礎(chǔ)知識(shí)的教學(xué)質(zhì)量水平以及進(jìn)步情況。教學(xué)質(zhì)量越高的群體,最簡單題得分率越高。同一批對(duì)象,每一個(gè)群體的相鄰兩次考試的“最簡單題得分率”比較,可以分析出每個(gè)群體的基礎(chǔ)知識(shí)教學(xué)質(zhì)量是否提高。
例2.判斷某一次考試中,各群體在不同試題的優(yōu)劣情況。某一次考試,對(duì)于試卷中每一個(gè)試題,用試題對(duì)全體的難度指數(shù)與試題對(duì)某群體的難度指數(shù)之差,判斷某群體在哪些試題上解答優(yōu)于全體(差值為正數(shù)),哪些弱于全體(差值為負(fù)數(shù)),特別是差的絕對(duì)值較大的那些試題,應(yīng)特別注意。可以將試卷按知識(shí)板塊或考查的學(xué)科核心素養(yǎng)等類別將若干題合并為新的題,按以上方法計(jì)算,可以每個(gè)群體判斷這些板塊或相應(yīng)的學(xué)科核心素養(yǎng)解答是優(yōu),還是弱,從而判斷是否加強(qiáng)這些方面的教學(xué)。
例3.命題時(shí),除了預(yù)測每個(gè)試題的全體得分率外和整個(gè)試卷的全體平均分外,還可以預(yù)測每個(gè)試題的全體難度指數(shù),并根據(jù)每個(gè)群體的最簡單題得分率,預(yù)測每個(gè)群體每個(gè)試題的得分率,從而預(yù)測整個(gè)試卷每個(gè)群體的平均分,與目標(biāo)平均分對(duì)比,及時(shí)加以調(diào)整,更好地控制試卷的難度。
例4.預(yù)測各群體或個(gè)人的提升空間,提供明確的發(fā)展目標(biāo)。
在某份試卷中,當(dāng)群體的簡單題得分率由 0.8提升到 0.9時(shí),則此群體預(yù)測總分由59分提升到 90分,提高了31分;如果這個(gè)群體的簡單題得分率由0.9提高到0.95,則此群體預(yù)測總分可提升到114分,提高了24分。再如某個(gè)學(xué)生,如果最簡單題得分率為0.98,則這個(gè)學(xué)生的預(yù)測總分為134分。
四、思考
1.用試題“難度指數(shù)”替代“難度系數(shù)”來分析試題,能獲得對(duì)試題更準(zhǔn)確的認(rèn)識(shí)。試題的復(fù)雜程度和結(jié)構(gòu)特點(diǎn)決定它的客觀難度指數(shù)。不同的群體由于各自基礎(chǔ)掌握程度不同及知識(shí)面的寬窄不同,解答同一題的得分率差距非常大,因此不能用直接用各群體實(shí)際解答得分率高低來簡單評(píng)判它們解答某個(gè)試題的水平是否符合預(yù)期。本文用全體的難度指數(shù)做為評(píng)價(jià)標(biāo)準(zhǔn),數(shù)據(jù)比較穩(wěn)定,參考意義較大。
2.本文提出的總體“簡單題得分率”與各群體“簡單題得分率”,能夠揭示學(xué)生學(xué)習(xí)成效產(chǎn)生的根源??偡指叩?,其“簡單題得分率”也明顯地高,兩者呈高度相關(guān)的關(guān)系,大多數(shù)情況兩者的相關(guān)系數(shù)都在0.9 以上?!昂唵晤}得分率”的變高還是變低,直接反映了基礎(chǔ)知識(shí)教學(xué)的質(zhì)量變高還是變低,為評(píng)價(jià)基礎(chǔ)知識(shí)教學(xué)提供了可行的數(shù)據(jù)依據(jù)。
3.認(rèn)識(shí)到試題難度是個(gè)客觀的量,能得出結(jié)論:要提升群體的總分,必須提升群體解答各個(gè)簡單問題的得分率,并且在思想方法上不能有遺漏,必須在平時(shí)大力培養(yǎng)學(xué)生的學(xué)科核心素養(yǎng)。因此課堂教學(xué)必須切實(shí)突出教學(xué)重點(diǎn),解決學(xué)生理解知識(shí)產(chǎn)生與發(fā)展過程中存在的問題,大力提升知識(shí)的理解程度和運(yùn)用的能力,使學(xué)生的素養(yǎng)得到真正的改善。
4.用難度指數(shù)進(jìn)行各題與總分預(yù)測,也存在一定的偏差:簡單題得分率比較高的群體,在較難的題上得分預(yù)測往往偏高;簡單題得分率比較低的群體,在較難的題上得分預(yù)測往往偏低平。在實(shí)踐中往往要結(jié)合各群體最初的成績與本次考試的簡單題得分率進(jìn)行回歸分析,用回歸以后的簡單得分率期望值進(jìn)行各題與總分預(yù)測。
參考文獻(xiàn):
[1]鮑建生.中英兩國初中數(shù)學(xué)期望課程綜合難度的比較【J】.全球教育展望,2002 (9):48-52.