目的:為更好發(fā)揮考試的診斷作用,促進(jìn)學(xué)生全面發(fā)展,本研究編制了八年級(jí)數(shù)學(xué)診斷性測(cè)驗(yàn)。結(jié)果:分測(cè)驗(yàn)的難度分布在0.640~0.994之間;鑒別度平均指數(shù)在0.47~0.62之間??她埌秃炸幌禂?shù)在0.614 ~0.744之間;內(nèi)容效度,嚴(yán)格按照教學(xué)大綱及新課程標(biāo)準(zhǔn)編寫(xiě)。結(jié)構(gòu)效度通過(guò)因素分析來(lái)驗(yàn)證,分測(cè)驗(yàn)解釋測(cè)驗(yàn)的總變異都達(dá)到了50%以上。結(jié)論:本測(cè)驗(yàn)具有適宜的難度和良好的區(qū)分度,鑒別度優(yōu)良;信度檢驗(yàn)結(jié)果表明,內(nèi)部一致性高,測(cè)量標(biāo)準(zhǔn)誤較小;從內(nèi)容效度、結(jié)構(gòu)效度來(lái)看較理想,各測(cè)量指標(biāo)表明測(cè)驗(yàn)達(dá)到了測(cè)量學(xué)要求。
數(shù)學(xué)診斷性測(cè)驗(yàn)難度信度效度1引言
在基礎(chǔ)教育課程改革逐步完善的過(guò)程中,傳統(tǒng)測(cè)驗(yàn)的局限性在新課程改革中猶為凸顯。單一的分?jǐn)?shù)不能反映學(xué)生使用的認(rèn)知成分或技能,也不能診斷出學(xué)生答錯(cuò)題目的原因,更不能挖掘考試信息的深度。《基礎(chǔ)教育課程改革綱要(試行)》明確指出:“建立促進(jìn)學(xué)生全面發(fā)展的評(píng)價(jià)體系。評(píng)價(jià)不僅要關(guān)注學(xué)生的學(xué)業(yè)成績(jī),而且要發(fā)現(xiàn)和發(fā)展學(xué)生多方面的潛能,了解學(xué)生發(fā)展中的需求,幫助學(xué)生認(rèn)識(shí)自我,建立自信。發(fā)揮評(píng)價(jià)的教育功能,促進(jìn)學(xué)生在原有水平上的發(fā)展?!倍\斷性測(cè)驗(yàn)(diagnostic test)是診斷性評(píng)價(jià)使用的工具,是運(yùn)用測(cè)量手段,考查學(xué)生在學(xué)習(xí)上的困難而編制的一種測(cè)驗(yàn)。一般在學(xué)期末或?qū)W期前,即實(shí)施新的教學(xué)計(jì)劃之前進(jìn)行,目的是了解、評(píng)價(jià)、分析學(xué)生所具有的基礎(chǔ)知識(shí)基本技能掌握情況,以鑒別學(xué)生接受教學(xué)的能力并為補(bǔ)救教學(xué)提供參考。國(guó)內(nèi)外學(xué)者的研究為診斷測(cè)驗(yàn)的編制與開(kāi)發(fā)提供了許多理論與方法,從不同角度為診斷測(cè)驗(yàn)編制做出了努力,值得參考借鑒。但這些研究提出的理論比較局限,不夠精準(zhǔn),實(shí)踐性欠佳,因此未能被廣泛推廣應(yīng)用。
八年級(jí)數(shù)學(xué)是初中數(shù)學(xué)學(xué)習(xí)的關(guān)鍵,也是轉(zhuǎn)折點(diǎn)。這一階段學(xué)生知識(shí)掌握與否,直接影響他能否順利進(jìn)入高中階段學(xué)習(xí)。本研究以義務(wù)教育新課程標(biāo)準(zhǔn)為依據(jù),編制八年級(jí)數(shù)學(xué)診斷性測(cè)驗(yàn),目的在于了解學(xué)生知識(shí)水平掌握情況,以鑒別學(xué)生能否順利進(jìn)入九年級(jí)學(xué)習(xí)提供參考。同時(shí),教師通過(guò)數(shù)學(xué)診斷性測(cè)驗(yàn),全面了解學(xué)生數(shù)學(xué)知識(shí)、能力等方面的基礎(chǔ)和發(fā)展?fàn)顩r,以把握學(xué)生的學(xué)習(xí)起點(diǎn),恰當(dāng)?shù)卮_定教學(xué)目標(biāo),選擇教學(xué)策略,并通過(guò)診斷報(bào)告獲得有關(guān)學(xué)生數(shù)學(xué)學(xué)習(xí)情況的評(píng)價(jià)信息,掌握學(xué)生數(shù)學(xué)學(xué)習(xí)目標(biāo)的達(dá)成情況和他們?cè)跀?shù)學(xué)學(xué)習(xí)中出現(xiàn)的問(wèn)題和困難,以便有針對(duì)性地提出適應(yīng)整體和個(gè)別需要的教學(xué)策略和措施,達(dá)到因材施教的目的,改進(jìn)數(shù)學(xué)教學(xué),提高學(xué)生的學(xué)習(xí)效果,并為其它研究人員進(jìn)行更廣泛的診斷性教育研究提供測(cè)量工具和方法。
2研究方法
2.1測(cè)驗(yàn)的編制
2.1.1測(cè)驗(yàn)內(nèi)容的確定
本研究的內(nèi)容為八年級(jí)數(shù)學(xué)診斷性測(cè)驗(yàn),用團(tuán)體施測(cè)的紙筆測(cè)驗(yàn)形式。參考國(guó)內(nèi)外診斷性測(cè)驗(yàn)的樣本,本測(cè)驗(yàn)題型分為四選一的選擇題、填空題、計(jì)算題三大部分。以義務(wù)教育新課標(biāo)準(zhǔn)為依據(jù),并參照多位從事中學(xué)數(shù)學(xué)教學(xué)的一線教師經(jīng)驗(yàn)選擇初步編制題本,一級(jí)目標(biāo)10個(gè),二級(jí)子目標(biāo)63個(gè),題目總數(shù)204。學(xué)生知識(shí)能力掌握情況分為三種水平。尚未掌握:是指不具備或不完全具備學(xué)習(xí)新知識(shí)的條件;基本掌握:是指已基本具備了學(xué)習(xí)新知識(shí)的條件;完全掌握:是指完全具備了學(xué)習(xí)新知識(shí)的條件。每個(gè)子目標(biāo)的題目設(shè)置一般為三個(gè),少部分5個(gè)。標(biāo)準(zhǔn)定為:題目設(shè)置為3個(gè),3個(gè)全對(duì)則為完全掌握;2個(gè)全對(duì),基本掌握;對(duì)1個(gè)或0個(gè),則為尚未掌握。題目設(shè)置為5個(gè),5個(gè)全對(duì)則為完全掌握;4個(gè)或3個(gè)全對(duì),基本掌握;對(duì)2個(gè)或1個(gè)或0個(gè),則為尚未掌握。選擇、填空題答對(duì)則滿分,否則0分,計(jì)算題按參考答案酌情給分,完全答對(duì)計(jì)滿分。
2.2測(cè)驗(yàn)的實(shí)施
2.2.1預(yù)測(cè)
在贛州市信豐四中隨機(jī)選取了八年級(jí)一個(gè)班(60人)樣本,進(jìn)行當(dāng)堂施測(cè),每次90分鐘,分10個(gè)時(shí)間段完成全部測(cè)驗(yàn)?;厥沼行?wèn)卷60份。將難度系數(shù) 0.30以下和 0.95以上、區(qū)分度 0.19以下的試題刪除,并結(jié)合專(zhuān)家意見(jiàn)進(jìn)行修改、增刪。測(cè)試題的二級(jí)子目標(biāo)減少至53個(gè),題目總數(shù)減至176個(gè)。
2.2.2正式施測(cè)
選取贛州市信豐四中剛升入九年級(jí)的三個(gè)班學(xué)生。1班60人,2班58人,3班60人。剔除無(wú)效問(wèn)卷176份,回收有效問(wèn)卷總計(jì)1574份。16、17章施測(cè)各為45分鐘,其它每章施測(cè)為90分鐘。
2.2.3統(tǒng)計(jì)方法
對(duì)數(shù)據(jù)采用SPSS20.0進(jìn)行統(tǒng)計(jì)處理。
3結(jié)果
3.1難度分析
主觀題的難度用平均分除以滿分來(lái)表示。選擇題計(jì)算矯正難度系數(shù)CP。本研究把項(xiàng)目的難度分為五個(gè)等級(jí),分別是小于0.20、0.20~0.39、0.40~0.59、0.60~0.79、大于0.80,對(duì)應(yīng)的依次是最難、較難、中等、較易、最易。測(cè)驗(yàn)難度以百分比或通過(guò)率表示,是等級(jí)量表,因此轉(zhuǎn)化成等距量表,查出Z分?jǐn)?shù),Z分?jǐn)?shù)就視為該題的標(biāo)準(zhǔn)難度。各分測(cè)驗(yàn)的難度等級(jí)分布為:最難項(xiàng)目測(cè)驗(yàn)13有2個(gè),測(cè)驗(yàn)11、14、15、16、18、19各有1個(gè)。最易項(xiàng)目測(cè)驗(yàn)11、15、17各有2個(gè),測(cè)驗(yàn)13、16、18、19、20各有1個(gè),測(cè)驗(yàn)12有3個(gè),測(cè)驗(yàn)14有5個(gè)。1個(gè)分測(cè)驗(yàn)試題難度分布在0.2~0.39之間,7個(gè)分測(cè)驗(yàn)試題難度分布在0.4~0.59之間,分測(cè)驗(yàn)12,14試題難度分布在0.6~0.79之間。各分測(cè)驗(yàn)樣本難度分布在0.640~0.994之間。
3.2測(cè)驗(yàn)項(xiàng)目區(qū)分度分析
鑒別度指數(shù)分為四個(gè)等級(jí),小于0.20認(rèn)為區(qū)分度很差,區(qū)分度尚可:0.20~0.29,區(qū)分度較好:0.30~0.39,區(qū)分度很好:大于0.40。各分測(cè)驗(yàn)鑒別度指數(shù)分布0.47~0.62,即各分測(cè)驗(yàn)項(xiàng)目區(qū)分度很好。
采用相關(guān)法對(duì)項(xiàng)目的區(qū)分度進(jìn)行分析,分測(cè)驗(yàn)以及總分的相關(guān)區(qū)分度見(jiàn)表1。
表1表明,十個(gè)分測(cè)驗(yàn)與總分的相關(guān)在0.350~0.799之間,且均在0.01上顯著。與鑒別指數(shù)法所分析的各分測(cè)驗(yàn)的區(qū)分度結(jié)果一致。
3.3信效度分析
采用克龍巴赫ɑ系數(shù)方法來(lái)估計(jì)測(cè)驗(yàn)的內(nèi)部一致性系數(shù)。各分測(cè)驗(yàn)的α系數(shù)在0.614~0.744之間,各分測(cè)驗(yàn)間較同質(zhì)(表2)。
用測(cè)量標(biāo)準(zhǔn)誤對(duì)信度分析得到各分測(cè)驗(yàn)的測(cè)量標(biāo)準(zhǔn)誤在1.496~2.145分測(cè)驗(yàn)的測(cè)量標(biāo)準(zhǔn)誤均在三個(gè)標(biāo)準(zhǔn)差內(nèi),說(shuō)明測(cè)驗(yàn)信度較好。
本測(cè)驗(yàn)編制按照八年級(jí)數(shù)學(xué)教學(xué)大綱,以義務(wù)教育新課程標(biāo)準(zhǔn)為依據(jù),從大量試題集中精選有代表性的題目編制成測(cè)驗(yàn)試題,初步編制成題本后,還進(jìn)行了一次小樣本施測(cè),將難度系數(shù)0.30以下和0.95以上、區(qū)分度0.19以下的試題刪除。并請(qǐng)從事中學(xué)數(shù)學(xué)教學(xué)且有豐富教學(xué)經(jīng)驗(yàn)的一線教師和數(shù)學(xué)教研員,結(jié)合相關(guān)教材、測(cè)驗(yàn)?zāi)繕?biāo)、教學(xué)大綱,參考各教學(xué)單元時(shí)數(shù)的基礎(chǔ)就題本呈現(xiàn)的內(nèi)容、形式進(jìn)行調(diào)整。最后,測(cè)驗(yàn)的二級(jí)目標(biāo)減少至53個(gè),題目總數(shù)減至176。因此,整個(gè)過(guò)程保證了此測(cè)驗(yàn)具有良好的內(nèi)容效度。
并用探索性因素分析對(duì)測(cè)驗(yàn)結(jié)構(gòu)進(jìn)行了分析(表3)。
經(jīng)KMO統(tǒng)計(jì)量檢驗(yàn),各測(cè)驗(yàn)的KMO在0.607~0.860,Bartlett' s球形檢驗(yàn)結(jié)果在0.001水平顯著性。說(shuō)明各分測(cè)驗(yàn)適合用探索性因素分析。
以主成分法進(jìn)行初始分析,采用方差最大化正交旋轉(zhuǎn)法,進(jìn)行因素分析。測(cè)驗(yàn)十一能得到兩個(gè)大于1的特征根,能解釋總變異的75.918%;測(cè)驗(yàn)十二能得到兩個(gè)大于1的特征根,能解釋總變異的76.007%;測(cè)驗(yàn)十三能得到兩個(gè)大于1的特征根,能解釋總變異的68.626%;測(cè)驗(yàn)十四能得到兩個(gè)大于1的特征根,能解釋總變異的80.174%;測(cè)驗(yàn)十五能得到兩個(gè)大于1的特征根,能解釋總變異的81.758%;測(cè)驗(yàn)十六能得到一個(gè)大于1的特征根,能解釋總方差的67.006%;測(cè)驗(yàn)十七能得到一個(gè)大于1的特征根,能解釋總方差的63.540%;測(cè)驗(yàn)十八能得到兩個(gè)大于1的特征根能解釋總變異的73.181%;測(cè)驗(yàn)十九能得到兩個(gè)大于1的特征根,能解釋總變異的67.206%。;測(cè)驗(yàn)二十能得到兩個(gè)大于1的特征根能解釋總變異的64.008%。結(jié)果表明本測(cè)驗(yàn)符合構(gòu)想。
4討論
4.1測(cè)驗(yàn)的內(nèi)容
診斷性測(cè)驗(yàn)旨在運(yùn)用測(cè)量手段,考查學(xué)生基礎(chǔ)知識(shí)掌握情況,所以測(cè)驗(yàn)的編制必須配合學(xué)校的課程。本測(cè)驗(yàn)編制以全日制義務(wù)教育數(shù)學(xué)課程標(biāo)準(zhǔn)為依據(jù),參照中學(xué)數(shù)學(xué)實(shí)驗(yàn)教科書(shū)內(nèi)容編寫(xiě)。對(duì)新舊版本教材進(jìn)行比較研究。它們之間的內(nèi)容基本是相同的,主要是代數(shù)知識(shí)、幾何知識(shí),只是內(nèi)容呈現(xiàn)的先后順序稍有不一致,這也為編制測(cè)驗(yàn)時(shí)提供參考的依據(jù)。老版本的教材八年級(jí)才設(shè)置幾何知識(shí)教學(xué);新版本的幾何知識(shí)在七年級(jí)就以生活中常見(jiàn)的圖形向?qū)W生加以介紹,這樣不僅易于學(xué)習(xí),還能和實(shí)踐相結(jié)合。除此之外,新教材把統(tǒng)計(jì)和概率的初步知識(shí)以及推理知識(shí)也納入到課本中來(lái)。
本研究編制測(cè)驗(yàn)的目的是診斷學(xué)生的基本技能、知識(shí)掌握情況。編制的數(shù)學(xué)診斷性測(cè)驗(yàn)包括十個(gè)分測(cè)驗(yàn)。分式、反比例函數(shù)由于在數(shù)學(xué)課程標(biāo)準(zhǔn)中規(guī)定掌握的知識(shí)點(diǎn)很少,在測(cè)驗(yàn)中題量相對(duì)較少。實(shí)測(cè)時(shí),因條件限制,只在一所中學(xué)選取研究對(duì)象。就代表性來(lái)看,范圍應(yīng)該更廣泛些。從測(cè)驗(yàn)結(jié)果分析,總測(cè)驗(yàn)包含10個(gè)分測(cè)驗(yàn),每個(gè)分測(cè)驗(yàn)題目在總測(cè)驗(yàn)當(dāng)中的量不能太大,測(cè)驗(yàn)時(shí)間又有限制,題目代表性的問(wèn)題在后續(xù)研究中尚需完善。
4.2測(cè)驗(yàn)的項(xiàng)目分析
測(cè)驗(yàn)的項(xiàng)目分析從主要是對(duì)項(xiàng)目難度、區(qū)分度等進(jìn)行分析。理論上來(lái)說(shuō),項(xiàng)目難度值在0.5左右較好,但診斷性測(cè)驗(yàn)旨在測(cè)查學(xué)生基礎(chǔ)知識(shí)掌握情況,試題難度小,則說(shuō)明學(xué)生掌握良好,大則說(shuō)明大部分學(xué)生沒(méi)掌握,因此對(duì)難度系數(shù)要求不高。從各分測(cè)驗(yàn)結(jié)果來(lái)看,除了第20章平均難度系數(shù)為0.365,其它各章平均難度系數(shù)分布在0.509~0.804之間;從總測(cè)驗(yàn)題量分析,最難的題目占總題量的4.5%,較少。大部分題目難度系數(shù)落在0.4~0.79之間,總測(cè)驗(yàn)的難度系數(shù)為0.628??梢?jiàn)測(cè)驗(yàn)題目屬于中等偏易,試題難度分布符合測(cè)驗(yàn)要求。
項(xiàng)目區(qū)分度用鑒別指數(shù)法和相關(guān)法進(jìn)行了分析。各分測(cè)驗(yàn)的平均鑒別指數(shù)(D)在0.47~0.62之間,各分測(cè)驗(yàn)中項(xiàng)目鑒別指數(shù)大于0.4的項(xiàng)目均占最大比重。區(qū)分度小于0.2的項(xiàng)目占總題量的10.2%。采用相關(guān)法對(duì)項(xiàng)目的區(qū)分度進(jìn)行分析,區(qū)分度越高,越能將不同水平的被試區(qū)分開(kāi)來(lái)。用相關(guān)法計(jì)算分測(cè)驗(yàn)以及總分的相關(guān)區(qū)分度,十個(gè)分測(cè)驗(yàn)的區(qū)分度都達(dá)到了非常顯著水平,區(qū)分度較好。從測(cè)驗(yàn)區(qū)分度結(jié)果來(lái)看,試題總體達(dá)標(biāo)。
4.3測(cè)驗(yàn)的信效度分析
內(nèi)部一致性信度我們采用克龍巴赫ɑ系數(shù)。各分測(cè)驗(yàn)的α系數(shù)在0.614~0.744之間,可見(jiàn)所測(cè)內(nèi)容較為一致。各分測(cè)驗(yàn)的測(cè)量標(biāo)準(zhǔn)誤在1.496~2.145之間,總測(cè)驗(yàn)的測(cè)量標(biāo)準(zhǔn)誤為1.267,都在3個(gè)標(biāo)準(zhǔn)差以內(nèi),說(shuō)明測(cè)驗(yàn)分?jǐn)?shù)與真實(shí)分?jǐn)?shù)之間的誤差比較小。從這兩種信度估計(jì)的結(jié)果來(lái)看,本測(cè)驗(yàn)的信度系數(shù)比較高,測(cè)量標(biāo)準(zhǔn)誤比較小,符合測(cè)量學(xué)的計(jì)量標(biāo)準(zhǔn)。
在結(jié)構(gòu)效度考察上,采用探索性因素分析,根據(jù)所得各分測(cè)驗(yàn)的因素負(fù)荷矩陣,來(lái)評(píng)量問(wèn)卷的結(jié)構(gòu)是否符合。經(jīng)KMO統(tǒng)計(jì)量檢驗(yàn),各測(cè)驗(yàn)的KMO在0.607~0.860,Bartlett's球形檢驗(yàn)結(jié)果在0.001水平達(dá)到統(tǒng)計(jì)顯著性,說(shuō)明適合做探索性因素分析。其中8個(gè)測(cè)驗(yàn)都得到兩個(gè)大于1的特征根,2個(gè)測(cè)驗(yàn)得到一個(gè)大于1的特征根,且解釋測(cè)驗(yàn)的總變異都達(dá)到了50%以上。說(shuō)明本測(cè)驗(yàn)符合構(gòu)想。
參考文獻(xiàn):
[1]劉經(jīng)蘭,戴海琦.小學(xué)四年級(jí)數(shù)學(xué)診斷性測(cè)驗(yàn)的編制與研究[J].心理學(xué)探新,2003,(3).
[2]孟瑛如,蘇肖好,簡(jiǎn)吟文.澳門(mén)地區(qū)小學(xué)學(xué)生數(shù)學(xué)診斷測(cè)驗(yàn)之建置與發(fā)展[J].特教論壇,1997,6(4):56-68.
[3]楊曉輝,張?zhí)m英.診斷性測(cè)驗(yàn)在生物學(xué)概念教學(xué)中的應(yīng)用[J].生物學(xué)通報(bào),1992,(4).
[4]張瑜,胡慧海.關(guān)于中學(xué)數(shù)學(xué)研究性學(xué)習(xí)的反思[J].考試周刊,2011,(53).
[5]蔡艷,涂冬波,丁樹(shù)良.認(rèn)知診斷編制的理論及方法[J].考試研究,2010,(7):6-3.