● 劉學(xué)智 曹小旭
小學(xué)數(shù)學(xué)學(xué)業(yè)水平測(cè)試與課程標(biāo)準(zhǔn)一致性水平探究*
● 劉學(xué)智 曹小旭
借鑒韋伯模式,在分析縣域小學(xué)數(shù)學(xué)學(xué)業(yè)水平測(cè)試與課程標(biāo)準(zhǔn)的一致性狀況時(shí)發(fā)現(xiàn),小學(xué)數(shù)學(xué)三年級(jí)一致性水平呈現(xiàn)出數(shù)與代數(shù)領(lǐng)域一致性水平最好,空間與圖形領(lǐng)域次之,統(tǒng)計(jì)與概率領(lǐng)域一致性水平較差,而實(shí)踐與綜合運(yùn)用領(lǐng)域一致性水平最差的特征。這說明我國學(xué)業(yè)水平測(cè)試存在偏離課程標(biāo)準(zhǔn)的問題,因此應(yīng)采取有效策略,提高學(xué)業(yè)水平測(cè)試質(zhì)量。
小學(xué)數(shù)學(xué);學(xué)業(yè)水平測(cè)試;課程標(biāo)準(zhǔn);一致性
學(xué)業(yè)水平測(cè)試是各縣區(qū)教育行政部門監(jiān)測(cè)學(xué)業(yè)質(zhì)量的重要方法。課程改革的本質(zhì)在于基于課程標(biāo)準(zhǔn)的教育改革,如何讓學(xué)生學(xué)業(yè)成就評(píng)價(jià)建立在課程標(biāo)準(zhǔn)的基礎(chǔ)之上,是國家、地方或?qū)W校實(shí)施基于標(biāo)準(zhǔn)的學(xué)業(yè)成就評(píng)價(jià)過程中必須解決的關(guān)鍵問題。[1]在實(shí)踐中發(fā)現(xiàn),各縣區(qū)教育行政部門非常重視學(xué)生學(xué)業(yè)水平測(cè)試分?jǐn)?shù)的解釋,而忽視對(duì)學(xué)業(yè)水平測(cè)試是否反映課程標(biāo)準(zhǔn)要求的一致性推論,因而導(dǎo)致學(xué)業(yè)水平測(cè)試偏離課程標(biāo)準(zhǔn)的問題比較突山。本研究借鑒美國學(xué)者諾曼,韋伯(Norman.L.Webb)研制的學(xué)業(yè)評(píng)價(jià)與課程標(biāo)準(zhǔn)一致性的分析程序與方法(以下簡稱“一致性”),即韋伯模式,對(duì)某縣2010年小學(xué)3年級(jí)數(shù)學(xué)學(xué)業(yè)水平測(cè)試工具,即學(xué)業(yè)水平測(cè)試試卷進(jìn)行一致性分析,為縣區(qū)層面在實(shí)施學(xué)業(yè)質(zhì)量監(jiān)測(cè)過程中基于課程標(biāo)準(zhǔn)(以下簡稱“基于標(biāo)準(zhǔn)”)編制學(xué)業(yè)水平測(cè)試工具,提供必要的建議。
本研究以J省某縣2010小學(xué)三年級(jí)數(shù)學(xué)學(xué)業(yè)水平測(cè)試試卷為監(jiān)測(cè)對(duì)象。分析方法主要采用韋伯的一致性分析模式。韋伯分析模式是美國監(jiān)測(cè)學(xué)業(yè)水平測(cè)試工具質(zhì)量的重要方法。“近年來,韋伯模式已經(jīng)成為理解學(xué)業(yè)評(píng)價(jià)和課程標(biāo)準(zhǔn)之間關(guān)系的最重要、最具有創(chuàng)新性的模式,目前該模式已經(jīng)在美國24個(gè)州推廣和應(yīng)用。[2]本研究借鑒和改造韋伯一致性分析模式旨在對(duì)基于標(biāo)準(zhǔn)的小學(xué)數(shù)學(xué)學(xué)業(yè)水平測(cè)試質(zhì)量進(jìn)行監(jiān)測(cè)與分析,即依據(jù)韋伯構(gòu)建的一致性分析框架,從知識(shí)種類、知識(shí)深度、知識(shí)廣度和知識(shí)分布平衡性等四個(gè)維度[3],分析小學(xué)三年級(jí)數(shù)學(xué)一致性水平狀況。
本研究采用數(shù)學(xué)課標(biāo)中刻畫的數(shù)學(xué)知識(shí)技能的目標(biāo)動(dòng)詞為判定依據(jù),即把了解、理解、掌握和靈活運(yùn)用“四級(jí)”水平[4],作為一致性數(shù)據(jù)的編碼參照標(biāo)準(zhǔn)。
確定由課程專家、學(xué)科專家(小學(xué)數(shù)學(xué)骨干教師)、教研員三人組成編碼小組。在共同編碼過程中,不同類型的編碼者分工明確,課程專家負(fù)責(zé)對(duì)課程標(biāo)準(zhǔn)的具體目標(biāo)進(jìn)行分析與解讀,使編碼小組成員很好地理解課程標(biāo)準(zhǔn)內(nèi)容的難易程度。學(xué)科專家負(fù)責(zé)向編碼小組提供課程實(shí)施中的學(xué)業(yè)評(píng)價(jià)狀況,進(jìn)一步輔助編碼小組深刻理解評(píng)價(jià)項(xiàng)目。教研員集理論與實(shí)踐知識(shí)于一身,在共同編碼過程中,協(xié)調(diào)課程專家和學(xué)科專家在編碼討論過程中產(chǎn)生的分歧。本研究具體編碼過程如下:編碼小組依據(jù)了解、理解、掌握和靈活應(yīng)用“四級(jí)”水平,對(duì)課程標(biāo)準(zhǔn)下的具體目標(biāo)進(jìn)行“水平等級(jí)”分析,在此基礎(chǔ)上,對(duì)小學(xué)三年級(jí)數(shù)學(xué)學(xué)業(yè)水平測(cè)試的測(cè)驗(yàn)題目進(jìn)行獨(dú)立編碼。
采用描述統(tǒng)計(jì)的方法生成知識(shí)種類、知識(shí)深度、知識(shí)廣度和知識(shí)分布平衡性等“四維度”一致性可接受水平統(tǒng)計(jì)表。
表1 學(xué)業(yè)評(píng)價(jià)與課程標(biāo)準(zhǔn)一致性水平判斷標(biāo)準(zhǔn)[5]
1.知識(shí)種類的一致性可接受水平
知識(shí)種類一致性是指用來判斷評(píng)價(jià)項(xiàng)目涉及的學(xué)習(xí)內(nèi)容范圍與課程標(biāo)準(zhǔn)中描述的學(xué)習(xí)內(nèi)容范圍是否相一致。[6]表2顯示,小學(xué)三年級(jí)數(shù)學(xué)學(xué)業(yè)水平測(cè)試試卷中數(shù)與代數(shù)、空間與圖形、統(tǒng)計(jì)與概率、實(shí)踐與綜合應(yīng)用四大學(xué)習(xí)領(lǐng)域的測(cè)驗(yàn)題目平均數(shù)分別為13、9.33、6.33、 0.33。按照表 1“擊中領(lǐng)域目標(biāo)的測(cè)驗(yàn)題目的平均數(shù)大于或等于6個(gè)題目即可判定知識(shí)種類達(dá)到一致性可接受水平?!钡呐袛鄻?biāo)準(zhǔn),數(shù)與代數(shù)、空間與圖形、統(tǒng)計(jì)與概率三大學(xué)習(xí)領(lǐng)域其測(cè)驗(yàn)題目平均數(shù)均超過6個(gè),因此我們有理由判定該三大學(xué)習(xí)領(lǐng)域知識(shí)種類均到達(dá)一致性可接受水平;而實(shí)踐與綜合運(yùn)用領(lǐng)域擊中領(lǐng)域目標(biāo)的測(cè)驗(yàn)題目僅為0.33,其測(cè)驗(yàn)題目的平均數(shù)不足6個(gè)題目,由此可以判定該學(xué)習(xí)領(lǐng)域知識(shí)種類沒有達(dá)到一致性可接受水平。
表2 知識(shí)種類一致性可接受水平統(tǒng)計(jì)表
2.知識(shí)深度的一致性可接受水平
表3 知識(shí)深度一致性可接受水平統(tǒng)計(jì)表
知識(shí)深度一致性是指被用來判斷所評(píng)價(jià)的知識(shí)技能、認(rèn)知要求與課程標(biāo)準(zhǔn)中期望學(xué)生“應(yīng)該知道什么”和“應(yīng)當(dāng)做什么”目標(biāo)是否相一致。[7]表3顯示,小學(xué)三年級(jí)數(shù)學(xué)學(xué)業(yè)水平測(cè)試試卷中數(shù)與代數(shù)、空間與圖形、統(tǒng)計(jì)與概率、實(shí)踐與綜合應(yīng)用等四大學(xué)習(xí)領(lǐng)域符合具體目標(biāo)深度水平測(cè)驗(yàn)題目數(shù)百分比分別為64%、58%、62%、100%。按照表1“符合具體目標(biāo)深度水平測(cè)驗(yàn)題目平均數(shù)的百分比大于或等于50%即可判定知識(shí)深度具有一致性”的判斷標(biāo)準(zhǔn),四大學(xué)習(xí)領(lǐng)域符合具體目標(biāo)深度水平測(cè)驗(yàn)題目數(shù)的百分比均大于50%,因此我們有理由判定數(shù)與代數(shù)、空間與圖形、統(tǒng)計(jì)與概率、實(shí)踐與綜合應(yīng)用等四大學(xué)習(xí)領(lǐng)域知識(shí)深度都到達(dá)了一致性可接受水平。
3.知識(shí)廣度的一致性可接受水平
表4 知識(shí)廣度一致性可接受水平統(tǒng)計(jì)表
“知識(shí)廣度一致性是指被用來判斷課程標(biāo)準(zhǔn)中所涉及的概念、觀點(diǎn)與學(xué)生為了正確回答評(píng)價(jià)項(xiàng)目所需要的概念、觀點(diǎn)是否相一致?!盵8]表4顯示,數(shù)與代數(shù)、空間與圖形、統(tǒng)計(jì)與概率、實(shí)踐與綜合應(yīng)用等四大學(xué)習(xí)領(lǐng)域目標(biāo)擊中百分比分別為 58.1%、51.2%、38.8%、33.3%。按照表1“測(cè)驗(yàn)題目擊中水平下目標(biāo)數(shù)的平均數(shù)的百分比大于或等于50%即達(dá)到一致性可接受水平”的判斷標(biāo)準(zhǔn),四大學(xué)習(xí)領(lǐng)域僅有數(shù)與代數(shù)、空間幾何達(dá)到可接受的一致性水平,而統(tǒng)計(jì)與概率、實(shí)踐與綜合應(yīng)用等學(xué)習(xí)領(lǐng)域則難以達(dá)到知識(shí)廣度一致性可接受標(biāo)準(zhǔn)。
4.知識(shí)分布平衡性的一致性水平
表5 知識(shí)分布平衡性可接受水平統(tǒng)計(jì)表
“知識(shí)分布平衡性是指考察評(píng)價(jià)項(xiàng)目在各項(xiàng)具體目標(biāo)之間分布的均勻程度?!盵9]表5顯示,數(shù)與代數(shù)、間與圖形、統(tǒng)計(jì)與概率、實(shí)踐與綜合應(yīng)用等四大學(xué)習(xí)領(lǐng)域知識(shí)分布平衡性指數(shù)分別為 0.746、0.364、0.548、0.132。 按照表1當(dāng)“知識(shí)分布平衡性指數(shù)的平均數(shù)大于或等于0.7,即達(dá)到一致性可接受水平”的判斷標(biāo)準(zhǔn)”,該領(lǐng)域只有數(shù)與代數(shù)領(lǐng)域的知識(shí)分布平衡性達(dá)到了一致性可接受水平,其余各學(xué)習(xí)領(lǐng)域均未達(dá)到一致性可接受標(biāo)準(zhǔn)。
探究小學(xué)數(shù)學(xué)知識(shí)種類、知識(shí)深度、知識(shí)廣度和知識(shí)分布平衡性的一致性可接受水平狀況,我們發(fā)現(xiàn)小學(xué)三年級(jí)數(shù)學(xué)學(xué)業(yè)水平測(cè)試與課程標(biāo)準(zhǔn)一致性水平具有如下特征:
l.數(shù)與代數(shù)領(lǐng)域一致性水平最好
圖1 小學(xué)三年級(jí)數(shù)學(xué)(上)學(xué)業(yè)評(píng)價(jià)與課程標(biāo)準(zhǔn)一致性總體水平統(tǒng)計(jì)圖
從圖1發(fā)現(xiàn),在四大學(xué)習(xí)領(lǐng)域中,數(shù)與代數(shù)領(lǐng)域在四個(gè)維度上均達(dá)到指標(biāo)要求,可以得出其一致性水平最好的結(jié)論。在小學(xué)階段,數(shù)與代數(shù)是課程標(biāo)準(zhǔn)內(nèi)容目標(biāo)下的基本學(xué)習(xí)領(lǐng)域,是進(jìn)一步學(xué)習(xí)其他數(shù)學(xué)知識(shí)的載體,同時(shí),該領(lǐng)域在課程標(biāo)準(zhǔn)中所占內(nèi)容比例大,所涵蓋的知識(shí)點(diǎn)比較多,因而在編制試題時(shí)更傾向于數(shù)與代數(shù)領(lǐng)域,其一致性水平自然要好于其他領(lǐng)域。
2.空間與幾何領(lǐng)域一致性水平較好
從圖1發(fā)現(xiàn),空間與幾何領(lǐng)域前三個(gè)維度的一致性水平可以接受。該領(lǐng)域的測(cè)驗(yàn)題目直接體現(xiàn)了小學(xué)數(shù)學(xué)第一學(xué)段要求學(xué)生能夠認(rèn)識(shí)簡單幾何體以及平面圖形,初步感受平移、旋轉(zhuǎn)等現(xiàn)象,能夠運(yùn)用直尺等工具進(jìn)行簡單測(cè)量,與現(xiàn)實(shí)生活中兒童所接觸到的各種實(shí)物有著密切的聯(lián)系的內(nèi)容,反映了數(shù)學(xué)課程標(biāo)準(zhǔn)關(guān)注學(xué)生生活實(shí)際的理念,因而一致性程度較好。
3.統(tǒng)計(jì)與概率領(lǐng)域一致性水平較差
從圖1發(fā)現(xiàn),統(tǒng)計(jì)與概率領(lǐng)域僅在知識(shí)種類及知識(shí)深度兩個(gè)維度上的一致性水平可以接受,可見其一致性水平較低。數(shù)學(xué)課程標(biāo)準(zhǔn)中明確規(guī)定,統(tǒng)計(jì)與概率領(lǐng)域旨在幫助學(xué)生逐步建立起數(shù)據(jù)分析觀念,了解隨機(jī)現(xiàn)象及其發(fā)生概率以及可能性事件概念等,在現(xiàn)實(shí)社會(huì)中應(yīng)用廣泛。因此,從小學(xué)開始傳授統(tǒng)計(jì)與概率知識(shí)具有極強(qiáng)的現(xiàn)實(shí)性和必要性。但由于該領(lǐng)域首次出現(xiàn)在新課標(biāo)中,教師及試卷編制人員對(duì)其重視程度不高,進(jìn)而在試卷編制時(shí)受到人為因素、檢測(cè)時(shí)間、版面以及題型的影響及局限,很難把該領(lǐng)域更多的具體目標(biāo)編排到需要考察的范圍之內(nèi)。
4.實(shí)踐與綜合運(yùn)用領(lǐng)域一致性水平最差
從圖1發(fā)現(xiàn),實(shí)踐與綜合運(yùn)用領(lǐng)域僅有知識(shí)深度一致性水平可以接受。該領(lǐng)域在試卷中測(cè)驗(yàn)項(xiàng)目只有一個(gè)題目,知識(shí)深度一致率為100%,說明該學(xué)習(xí)領(lǐng)域知識(shí)深度達(dá)到好的一致性水平。但除知識(shí)深度以外,其余維度均未達(dá)標(biāo),這說明該學(xué)習(xí)領(lǐng)域一致性水平仍然極差。實(shí)踐活動(dòng)是小學(xué)數(shù)學(xué)第一學(xué)段呈現(xiàn)的主要形式,課程標(biāo)準(zhǔn)中關(guān)于數(shù)學(xué)實(shí)踐的目標(biāo)旨在讓學(xué)生在數(shù)學(xué)學(xué)習(xí)中經(jīng)歷觀察、操作、推理等活動(dòng),了解數(shù)學(xué)在日常生活中的簡單應(yīng)用。這一部分對(duì)紙筆測(cè)驗(yàn)的要求較高,不易把握,因而在實(shí)際教學(xué)中,教師對(duì)這一領(lǐng)域的學(xué)業(yè)評(píng)價(jià)主要放在了課堂教學(xué)和日常學(xué)習(xí)生活中,而未將其作為紙筆測(cè)驗(yàn)內(nèi)容??梢?,試卷編制者對(duì)這一領(lǐng)域的領(lǐng)悟還不夠深刻,未能很好的把握該領(lǐng)域的開放性、綜合性等要求。
本研究表明,J省某縣小學(xué)三年級(jí)數(shù)學(xué)學(xué)業(yè)水平測(cè)試試卷具有數(shù)與代數(shù)領(lǐng)域一致性水平好于其他領(lǐng)域,空間與圖形領(lǐng)域次之,統(tǒng)計(jì)與概率領(lǐng)域較差,而實(shí)踐與綜合運(yùn)用領(lǐng)域一致性水平最差等特征。這表明,小學(xué)數(shù)學(xué)學(xué)業(yè)水平測(cè)試試卷的編制人員對(duì)數(shù)與代數(shù)和空間與圖形領(lǐng)域的試卷內(nèi)容把握比較好,而對(duì)統(tǒng)計(jì)與概率、實(shí)踐與綜合應(yīng)用領(lǐng)域把握程度不夠,存在偏離課程標(biāo)準(zhǔn)內(nèi)容要求的問題。究其原因,在于我國數(shù)學(xué)課程標(biāo)準(zhǔn)中雖然明晰了內(nèi)容標(biāo)準(zhǔn),但卻未能制定出科學(xué)嚴(yán)謹(jǐn)?shù)膶W(xué)業(yè)評(píng)價(jià)標(biāo)準(zhǔn),導(dǎo)致試題編制者在編制試題時(shí)無學(xué)業(yè)評(píng)價(jià)標(biāo)準(zhǔn)可依據(jù)。同時(shí),以學(xué)業(yè)質(zhì)量檢測(cè)為目的的學(xué)業(yè)水平測(cè)試雖然具有一定的公平、公正性,但是避免不了會(huì)受到考試?yán)ο嚓P(guān)者的干預(yù),比如試題編制者在編制試卷時(shí)要綜合考慮來自學(xué)區(qū)或?qū)W校領(lǐng)導(dǎo)部門、教師以及家長的分?jǐn)?shù)期望。各級(jí)領(lǐng)導(dǎo)受來自社會(huì)各方面的壓力,不得不對(duì)課程編制施以權(quán)威影響;大多教師認(rèn)為學(xué)習(xí)哪些知識(shí)就應(yīng)該考察哪些知識(shí),因而對(duì)教材中未能凸顯,但在課程標(biāo)準(zhǔn)中卻有所強(qiáng)調(diào)的某些具體目標(biāo)不予理會(huì);家長和學(xué)生對(duì)考試成績的高期望,也會(huì)對(duì)試題的編制產(chǎn)生一定程度的影響,這些因素或多或少會(huì)導(dǎo)致試卷編制者在編制試卷內(nèi)容時(shí)偏離課程標(biāo)準(zhǔn)的傾向。同時(shí),各級(jí)教育部門過于重視對(duì)學(xué)生考試結(jié)果的監(jiān)測(cè)與分析,而忽視對(duì)于學(xué)生學(xué)業(yè)水平測(cè)試工具質(zhì)量的監(jiān)測(cè)的做法,也會(huì)造成學(xué)業(yè)水平測(cè)試質(zhì)量不高的問題,面對(duì)學(xué)業(yè)評(píng)價(jià)中的一系列問題,我們有必要借鑒韋伯等研究的一致性分析模式,創(chuàng)新具有本土化的學(xué)業(yè)水平測(cè)試質(zhì)量監(jiān)測(cè)方法,推動(dòng)各地忠實(shí)于課程標(biāo)準(zhǔn)編制學(xué)業(yè)水平測(cè)試工具。
[1]崔允漷,王少非,夏雪梅.基于標(biāo)準(zhǔn)的學(xué)生學(xué)業(yè)成就評(píng)價(jià)[M].上海:華東師范大學(xué)出版社,2008,16.
[2]Council of Chief State School Officer(2006)Aligning Assessment To Guide The Learning of All the Students,45.
[3]Norman L.Webb.A1ignment of science and mathematics standards[M].National lnstitute for Science Education University of WisconsinMadison,1999.11-18.
[4]中華人民共和國教育部.全日制義務(wù)教育數(shù)學(xué)課程標(biāo)準(zhǔn)(試驗(yàn)稿)[M].北京:北京師范大學(xué)出版社, 2002.3.
[5]劉學(xué)智.小學(xué)數(shù)學(xué)學(xué)業(yè)評(píng)價(jià)與課程標(biāo)準(zhǔn)一致性的研究[D].(博士論文).長春:東北師范大學(xué)教育科學(xué)學(xué)院,2008:64.
[6][7][8][9]劉學(xué)智.論評(píng)價(jià)與課程標(biāo)準(zhǔn)一致性的建構(gòu):美國的經(jīng)驗(yàn)[J].全球教育展望,2006(9):36,36,37,37.
*教育部人文社會(huì)科學(xué)項(xiàng)目《學(xué)業(yè)評(píng)價(jià)與課堂教學(xué)一致性研究》(課題編號(hào):09YJA880020)
劉學(xué)智/東北師范大學(xué)國際與比較教育研究所副教授,教育學(xué)博士,研究方向課程與教學(xué)論 曹小旭/東北師范大學(xué)國際與比較教育研究所碩士生,研究方向課程與教學(xué)論
(責(zé)任編輯:張 斌)