亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        考試評價在教學(xué)診斷中的應(yīng)用探索

        2024-01-04 07:56:54丁秀濤
        考試研究 2023年5期

        丁秀濤

        [摘要]“加強考試評價研究,挖掘考試數(shù)據(jù)中蘊藏的教育教學(xué)信息”是實現(xiàn)高考引導(dǎo)基礎(chǔ)教育教學(xué)的一個重要途徑。實踐中,模型簡單、淺顯易懂的經(jīng)典測量理論在群體教學(xué)診斷方面具有明顯優(yōu)勢?;诔DΩ呖几鲗W(xué)科試卷進行知識、能力、素養(yǎng)等多維度的結(jié)構(gòu)分析,通過分層分類分析法對考試數(shù)據(jù)進行深入挖掘,用考試數(shù)據(jù)進行區(qū)域教學(xué)診斷,能夠發(fā)現(xiàn)不同區(qū)域、不同考生群體的學(xué)科優(yōu)勢與不足,引導(dǎo)教師更加關(guān)注學(xué)生的學(xué)科知識掌握情況、能力發(fā)展情況、素養(yǎng)形成情況,有利于破除唯分?jǐn)?shù)、唯升學(xué)的弊端。未來需要進一步加強對考試數(shù)據(jù)挖掘分析方法的研究;進行“無錨”等值技術(shù)和方法的研究;將結(jié)果性考試數(shù)據(jù)與學(xué)校過程性考試數(shù)據(jù)相結(jié)合,進行教學(xué)綜合診斷。

        [關(guān)鍵詞]高考;考試數(shù)據(jù)分析;考試評價;教學(xué)診斷

        [中圖分類號]G424.74[文獻標(biāo)識碼]A

        [文章編號]1673—1654(2023)05—041—009

        基金項目北京市教育科學(xué)“十三五”規(guī)劃2019年度優(yōu)先關(guān)注課題“高考綜合改革背景下的考試評價研究與實踐”(CDEA19057)。

        有什么樣的評價指揮棒,就有什么樣的辦學(xué)導(dǎo)向。為深入貫徹落實習(xí)近平總書記關(guān)于教育的重要論述和全國教育大會精神,2020年10月,中共中央、國務(wù)院印發(fā)《深化新時代教育評價改革總體方案》,提出“堅持科學(xué)有效,改進結(jié)果評價,強化過程評價,探索增值評價,健全綜合評價”。旨在破除“唯分?jǐn)?shù)、唯升學(xué)、唯文憑、唯論文、唯帽子”的痼疾,扭轉(zhuǎn)不科學(xué)的教育評價導(dǎo)向[1]。

        高考是連接基礎(chǔ)教育和高等教育的重要樞紐,對基礎(chǔ)教育發(fā)揮著“指揮棒”作用。《中國高考評價體系》將高考的核心功能確定為“立德樹人、服務(wù)選才、引導(dǎo)教學(xué)”[2]??梢?,正在推進實施的新一輪高考改革特別注重高考對基礎(chǔ)教育教學(xué)的引導(dǎo)。如何讓考試正確引導(dǎo)教育教學(xué)?一個重要途徑就是加強考試評價研究,通過分析考試數(shù)據(jù),挖掘考試數(shù)據(jù)中蘊藏的教育教學(xué)信息,反饋指導(dǎo)教育教學(xué),充分發(fā)揮考試數(shù)據(jù)在教學(xué)評價與診斷中的作用。

        有研究者基于中國知網(wǎng)2010-2019年的文獻,對近10年來普通高考考試數(shù)據(jù)的研究現(xiàn)狀進行了計量分析,發(fā)現(xiàn):高考數(shù)據(jù)在使用量方面極其有限,基于高考考試數(shù)據(jù)研究的期刊論文數(shù)量偏少,只占高考研究文獻的1%;而且研究中所挖掘的數(shù)據(jù)量有限,很多文獻僅是基于當(dāng)年某個學(xué)?;蚰硞€地區(qū)的數(shù)據(jù)進行挖掘,數(shù)據(jù)樣本很小,基于全國、全省級行政區(qū)的高考數(shù)據(jù)分析十分有限[3]。

        作為大規(guī)模教育考試,高考不僅能夠完成公平評價、選拔新生的任務(wù),而且其考試數(shù)據(jù)中蘊藏著豐富的教育教學(xué)信息,如果只將高考作為高校錄取的工具,是一種巨大的資源浪費。應(yīng)當(dāng)以問題為導(dǎo)向,以改進教學(xué)為目的,充分挖掘、分析考試數(shù)據(jù),發(fā)揮考試數(shù)據(jù)診斷、引導(dǎo)教學(xué)的功能。

        本著在我國現(xiàn)階段可操作、可推廣的原則,本文提出一些能夠運用于反饋、診斷實際教學(xué)的考試數(shù)據(jù)分析方法,以期為挖掘、利用考試數(shù)據(jù),促進教、學(xué)、考、招協(xié)同共進提供借鑒與參考。

        一、研究方法

        (一)測量理論的選擇

        從利用考試數(shù)據(jù)反饋、診斷、指導(dǎo)教育教學(xué)的角度而言,考試評價研究的客體是教育教學(xué)情況,媒介是各學(xué)科試卷(測試工具)與考試數(shù)據(jù),考試評價研究的最終目的是改進教育教學(xué)。2019年6月,國務(wù)院辦公廳印發(fā)《關(guān)于新時代推進普通高中育人方式改革的指導(dǎo)意見》(以下簡稱《意見》),提出:減少高中統(tǒng)考統(tǒng)測和日??荚嚕訌娍荚嚁?shù)據(jù)分析,認(rèn)真做好反饋,引導(dǎo)改進教學(xué)[4]。文件明確了對于考試及考試數(shù)據(jù)分析利用的要求。減少考試與統(tǒng)測次數(shù),就需要更加充分地分析利用考試數(shù)據(jù),更加充分地發(fā)揮每一次考試的功能,利用考試數(shù)據(jù)診斷教學(xué)效果,利用考試數(shù)據(jù)反饋、改進教學(xué)。

        在教育考試評價領(lǐng)域里,經(jīng)典測量理論(Classical Testing Theory,CTT)與項目反應(yīng)理論(Item Response Theory,IRT)是目前被廣泛使用的兩種測驗理論,二者各有優(yōu)勢[5]。近年來,項目反應(yīng)理論得到業(yè)內(nèi)的廣泛重視,這對考試評價領(lǐng)域來說是一大進步。項目反應(yīng)理論在測驗等值、題庫建設(shè)、量表開發(fā)等方面明顯優(yōu)于經(jīng)典測量理論,但項目反應(yīng)理論卻不能替代經(jīng)典測量理論,尤其在我國現(xiàn)階段,對于廣大一線教育工作者來說,項目反應(yīng)理論專業(yè)性較強,需要一定的專業(yè)背景方能理解與使用,在短時間內(nèi)很難大范圍運用于分析、診斷教學(xué)。

        從廣泛理解與接受度來說,模型簡單、淺顯易懂的經(jīng)典測量理論具有明顯優(yōu)勢。因此,選用更容易被普遍理解和接受的經(jīng)典測量理論與方法展開相關(guān)研究。

        (二)研究假設(shè)

        基于考試數(shù)據(jù)進行教學(xué)診斷的前提是各學(xué)科試題能夠考查出考生的真實水平,達到應(yīng)有的信度、效度、區(qū)分度等測量學(xué)指標(biāo)。為驗證這一點,北京市每年在高考各學(xué)科考后都會第一時間召開各區(qū)教研員、教師代表參加的考后座談會;進行試卷質(zhì)量的無記名問卷調(diào)查;出成績后進行相應(yīng)測量學(xué)指標(biāo)的檢驗。多年來,無論是定性調(diào)研還是定量檢驗,都證明北京市各學(xué)科高考試題達到了包括信度、效度、區(qū)分度等在內(nèi)的相關(guān)測量學(xué)要求。

        因此,提出以下三點假設(shè)作為研究的前提:(1)考生的各學(xué)科考試成績能夠反映考生各學(xué)科知識、能力的水平;(2)考生群體的各學(xué)科成績能夠反映相應(yīng)考生群體的學(xué)科知識、能力的水平;(3)不同考生群體的學(xué)科知識、能力水平可以反映一個區(qū)域的教育教學(xué)情況。

        (三)評價依據(jù)

        一直以來,《普通高中課程標(biāo)準(zhǔn)》和《高考考試大綱》是課程教學(xué)和高考命題的依據(jù),也是考試評價的依據(jù)。2018年1月,教育部發(fā)布《普通高中課程方案和課程標(biāo)準(zhǔn)(2017年版)》,首次基于學(xué)科本質(zhì)凝練了各學(xué)科的核心素養(yǎng),研制了各學(xué)科的學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn),明確了學(xué)生完成各學(xué)科學(xué)習(xí)任務(wù)后,學(xué)科核心素養(yǎng)應(yīng)達到的水平,應(yīng)達成的正確價值觀念、必備品格和關(guān)鍵能力、關(guān)鍵表現(xiàn)。明確要求“校內(nèi)評價或考試、學(xué)業(yè)水平考試、普通高等學(xué)校招生全國統(tǒng)一考試均應(yīng)以本課程方案、課程標(biāo)準(zhǔn)和國家相關(guān)教學(xué)文件為依據(jù)”[6]。同時,國務(wù)院辦公廳在《意見》中也明確提出:學(xué)業(yè)水平選擇性考試與高等學(xué)校招生全國統(tǒng)一考試命題要以普通高中課程標(biāo)準(zhǔn)和高校人才選拔要求為依據(jù),實施普通高中新課程的省份不再制定考試大綱[4]。因此,在高考綜合改革背景下,《普通高中課程方案和課程標(biāo)準(zhǔn)》既是課程教學(xué)的依據(jù),也是考試命題的依據(jù),更是考試評價的標(biāo)準(zhǔn)與尺度。在考試評價研究中,遵循《普通高中課程方案和課程標(biāo)準(zhǔn)》,是保證評價結(jié)果科學(xué)性的前提與基礎(chǔ)。

        (四)在定量分析的基礎(chǔ)上進行質(zhì)性研究

        20世紀(jì)80年代,以庫巴(Egong Guba)和林肯(Y. S.Lincoln)等為代表創(chuàng)立了“第四代教育評價理論”。第四代評價理論在實證的基礎(chǔ)上,引進了質(zhì)性研究方法,注意了評價過程中評價雙方的互動作用及動態(tài)分析。他們提倡在評價中充分聽取不同方面的意見,并把評價看作是一個由評價者不斷協(xié)調(diào)各種價值標(biāo)準(zhǔn)間的分歧、縮短不同意見間的距離、最后形成公認(rèn)的一致看法的過程。這是在將基于考試數(shù)據(jù)的考試評價應(yīng)用于診斷、指導(dǎo)教育教學(xué)中可以借鑒的。

        為此,北京高考考試評價將定量分析與質(zhì)性研究相結(jié)合,在對考試數(shù)據(jù)量化研究的基礎(chǔ)上進一步采用質(zhì)性評價方法。量化評價使用測量手段,用統(tǒng)計分析方法和數(shù)學(xué)量來評價教育現(xiàn)象;質(zhì)性評價通過觀察和實踐,用定性的分析辯證地認(rèn)識教育現(xiàn)象。質(zhì)性評價既是量化評價的基礎(chǔ),也使量化數(shù)據(jù)分析得以深入,對問題間的交互影響和因果關(guān)系的分析具有獨到的優(yōu)勢。把統(tǒng)計數(shù)據(jù)和評價者的經(jīng)驗、對教學(xué)現(xiàn)狀的把握結(jié)合在一起,在評價中與中學(xué)教師互動,就是力求將學(xué)生的學(xué)習(xí)過程和教學(xué)過程體現(xiàn)在評價中。

        二、基于診斷教學(xué)的考試數(shù)據(jù)分析方法

        (一)分層分類分析法

        我國幅員遼闊,各省市基礎(chǔ)教育發(fā)展存在較大差異,而對于一個省市來說,不同地區(qū)基礎(chǔ)教育發(fā)展也不均衡。這種差異、不均衡與當(dāng)?shù)氐慕?jīng)濟發(fā)展、生源、師資、學(xué)校軟硬件、學(xué)生家庭背景等條件密切相關(guān)。如果忽視這些不同條件,只用一個標(biāo)準(zhǔn)來衡量不同區(qū)域、不同學(xué)校學(xué)生的學(xué)業(yè)水平是不科學(xué)的。因此,在利用考試數(shù)據(jù)分析、診斷教育教學(xué)時,有必要對各地區(qū)、各學(xué)校進行分層和分類,不同區(qū)域、不同類別學(xué)校用更適合各自的尺度來衡量,這樣才能夠準(zhǔn)確診斷不同區(qū)域、不同學(xué)校的教育教學(xué)情況。

        與全國多數(shù)省市相比,北京市總體基礎(chǔ)教育規(guī)模較小且相對均衡,即便如此,就北京市基礎(chǔ)教育內(nèi)部來說,仍然存在發(fā)展不均衡問題。例如,城區(qū)與郊區(qū)基礎(chǔ)教育之間存在較大差異,加上初中升高中,使郊區(qū)優(yōu)質(zhì)生源向城區(qū)的流動、優(yōu)秀教師從郊區(qū)向城區(qū)的流動,進一步加大了城郊之間高中教育的差距。同樣,在一個區(qū)的不同學(xué)校之間,也存在相似情況。因此,必須進行分層分類分析。同時,為了避免片面的唯高考成績論英雄評價各個學(xué)校,與各區(qū)約定:不進行單個學(xué)??荚嚁?shù)據(jù)分析,請各區(qū)根據(jù)本區(qū)教育教學(xué)實際情況將高中學(xué)校分為三至四類(同一類別學(xué)校的基本情況大致相同或相近)。根據(jù)各區(qū)劃分的學(xué)校類別,對各區(qū)高考數(shù)據(jù)進行多層次分析,形成各區(qū)的高考數(shù)據(jù)分析報告。各區(qū)的數(shù)據(jù)報告包括北京市整體、城區(qū)、郊區(qū)、本區(qū)整體、本區(qū)各類別學(xué)校5個層次。

        (二)常模參照、相對比較法

        高考的高利害性使得基于錨人、錨題等測驗等值的測量技術(shù)難以實現(xiàn)。這就使得直接利用高考數(shù)據(jù)進行教學(xué)診斷分析帶有局限性。為此,提出常模參照、相對比較法。

        常模是一種供比較的標(biāo)準(zhǔn)量數(shù),由標(biāo)準(zhǔn)化樣本測試結(jié)果計算而來,即某一標(biāo)準(zhǔn)化樣本的平均數(shù)和標(biāo)準(zhǔn)差,它是用于比較和解釋測驗結(jié)果時的參照分?jǐn)?shù)標(biāo)準(zhǔn)??杉毞譃榻M間常模、組內(nèi)常模。

        北京采取的是全樣本分析,首先將市整體、城區(qū)、郊區(qū)的全樣本作為三個組間常模群體。為了便于各區(qū)優(yōu)勢類別學(xué)校找到合適的參照目標(biāo),另從原來的市級示范校與區(qū)級示范校中分別抽取10所學(xué)校,形成示范校一、示范校二作為示范校抽樣的組間常模。

        為了更精準(zhǔn)地分析一個群體內(nèi)不同層次考生的特點及其相應(yīng)的教育教學(xué)情況,進一步按照各考生群體的學(xué)科總分從低到高平均分成10個學(xué)科能力水平組,形成該考生群體的10個組內(nèi)常模群體G1—G10。

        這樣,提供給各區(qū)用于診斷教學(xué)的高考數(shù)據(jù),除了該區(qū)考試數(shù)據(jù),還有北京市整體、城區(qū)、郊區(qū)、示范校一、示范校二5個組間常模數(shù)據(jù),各區(qū)數(shù)據(jù)與各組間常模數(shù)據(jù)又都包括10個組內(nèi)常模數(shù)據(jù),供各區(qū)對區(qū)整體以及各類學(xué)校、各能力水平組學(xué)生進行學(xué)習(xí)情況的對比研究和分析。

        三、多維度挖掘,讓考試數(shù)據(jù)發(fā)揮獨有價值

        考試數(shù)據(jù)中蘊藏著豐富的教育教學(xué)信息,只有結(jié)合學(xué)科特點,依據(jù)學(xué)科課程標(biāo)準(zhǔn),進行多維度深入分析,才能發(fā)現(xiàn)考試數(shù)據(jù)獨有的價值。

        (一)維度劃分

        北京在高考評價中,對每一類別的考生群體數(shù)據(jù)進行了分學(xué)科、多維度的挖掘分析。以某年度高考語文學(xué)科為例,分析維度包括:總分分析、題型分析、各內(nèi)容組塊分析、各能力組塊分析、各專題分析以及各大題、各小題、各選項分析,等等。其中內(nèi)容組塊包括:多文本閱讀、文言文閱讀、古代詩歌閱讀、文學(xué)作品閱讀、微寫作與大作文;能力組塊包括:識記、理解、運用、分析綜合、鑒賞評價與綜合表達;專題分析包括:文言文文本內(nèi)容的理解、文言文文本內(nèi)容的歸納概括、古典詩歌內(nèi)容的理解和作者情感的體察、古詩文名句名篇的識記理解和運用、現(xiàn)代文中信息的篩選整合、現(xiàn)代文作者思想感情觀點態(tài)度的理解分析等。

        (二)客觀、科學(xué)解讀,賦予考試數(shù)據(jù)實踐價值

        經(jīng)過對各學(xué)科的每一個能夠?qū)虒W(xué)診斷作為證據(jù)的維度進行統(tǒng)計分析,完成各學(xué)科的考試數(shù)據(jù)分析報告,只是完成了對各學(xué)科考試數(shù)據(jù)的定量研究,更加重要的是對這些數(shù)據(jù)報告進行客觀、科學(xué)的解讀,對考試數(shù)據(jù)進行質(zhì)性分析,賦予考試數(shù)據(jù)實踐價值。這時,需要各學(xué)科的評價專家在聽取各區(qū)教師、教研員對各學(xué)科試卷的意見以及一線教師與考生反饋的基礎(chǔ)上,對照《普通高中課程方案和課程標(biāo)準(zhǔn)》,運用自己的教學(xué)經(jīng)驗和對教學(xué)現(xiàn)狀的客觀把握,分析數(shù)據(jù)統(tǒng)計結(jié)果、考生的學(xué)科知識掌握情況、學(xué)科能力發(fā)展水平以及學(xué)科素養(yǎng)形成情況,研究所映射出的學(xué)科教育教學(xué)情況,探究影響教學(xué)的各種因素,進行歸因分析,提出教學(xué)改進建議。

        (三)案例分析

        從《某年度北京市高考語文學(xué)科考生水平評價及教學(xué)建議》中選取一個案例,介紹高考評價在教學(xué)診斷中的具體應(yīng)用方法。

        評價研究組將當(dāng)年語文學(xué)科試卷按照考查內(nèi)容分為多文本閱讀、文言文閱讀、古代詩歌閱讀、文學(xué)作品閱讀、微寫作、大作文6個組塊。全市考生在各組塊的整體表現(xiàn)如表1所示:

        從表1可以看出,各內(nèi)容組塊考生得分率由高到低依次為多文本閱讀、作文、微寫作、文學(xué)作品閱讀、古代詩歌閱讀、文言文閱讀,考生得分率最低的是古詩文閱讀。結(jié)合標(biāo)準(zhǔn)差和差異系數(shù)看,考生成績在古代詩歌閱讀和文言文閱讀兩個組塊離散程度最大。為了解不同能力水平學(xué)生的特點,將考生按照語文學(xué)科總分從低到高平均分為10組(G1-G10),根據(jù)各組考生在各知識組塊的得分率做出該年度高考語文各內(nèi)容組塊分組得分率曲線圖。

        從圖1可以明顯看出,各內(nèi)容組塊高分組與低分組水平差距由大到小依次為古代詩歌閱讀、文言文閱讀、文學(xué)作品閱讀、多文本閱讀、作文、微寫作。可以說,古詩文閱讀是拉開考生差距的關(guān)鍵組塊。對于古代詩歌閱讀,全市前20%的優(yōu)秀學(xué)生得分率能夠達到0.7以上,而后20%的學(xué)生得分率低于0.4。對于文言文閱讀,無論哪個層次的考生,表現(xiàn)都不令人滿意,全市前10%的優(yōu)秀學(xué)生得分率也未能達到0.8,全市中等生(G3-G7)得分率在0.5左右,而后20%的學(xué)生得分率僅在0.3左右。這固然有命題難度的原因,但也暴露出學(xué)生在古詩文閱讀方面的薄弱之處[7]。

        進一步從當(dāng)年古詩文閱讀組塊中選取第12題進行分析。

        第12題考查了傳統(tǒng)文化經(jīng)典《論語》的閱讀。其中,第12_1題需要考生在理解文意的基礎(chǔ)上把握孔子的思想,第12_2題則要求考生能夠準(zhǔn)確解說不同學(xué)者對同一句子的解讀,既考查獨立閱讀文言文的能力,又考查對孔子思想的把握。

        結(jié)合表2相關(guān)數(shù)據(jù)及圖2可知,第12題得分率為0.41,考生整體表現(xiàn)不理想。G10組考生優(yōu)勢較明顯,平均得分率為0.72,G1-G3組得分率均在0.30之下,其中G1組得分率只有0.14。

        評價專家認(rèn)為,客觀地說,在本屆學(xué)生的教學(xué)過程中,廣大一線教師對《論語》的閱讀非常重視,在內(nèi)容整合、專題教學(xué)、策略優(yōu)化等方面付出了許多努力,但從第12題考生的表現(xiàn)看,成效還有待提升。文化經(jīng)典論著教學(xué)面臨著諸多挑戰(zhàn):閱讀時有較大的文字障礙,基礎(chǔ)薄弱的學(xué)生讀懂尤其困難;內(nèi)涵豐厚,博大精深,對學(xué)生的認(rèn)識水平、思維能力要求較高。但是,無論是弘揚中華民族優(yōu)秀的傳統(tǒng)文化,還是為各學(xué)科閱讀古代文獻提供助力,都需要切實提高學(xué)生的古文閱讀能力。因此,建議教學(xué)中進一步加大古文閱讀量的積累,且注重“面”(不同文體)的拓展,在此基礎(chǔ)之上,將古文當(dāng)作現(xiàn)代文來教,培養(yǎng)閱讀理解能力,尤其是讀懂文意的能力[7]。

        四、基于考試數(shù)據(jù)進行區(qū)域教學(xué)診斷

        (一)參照常模群體的選擇確定

        測驗分?jǐn)?shù)必須與某種標(biāo)準(zhǔn)比較,才能顯示出它所代表的意義。選擇參照常模群體就是為所研究的考生群體尋找一個參照標(biāo)準(zhǔn)。如果參照標(biāo)準(zhǔn)過高,將會直接影響研究對象改進的積極性與自信心,認(rèn)為自己無論怎樣努力也趕不上目標(biāo);而參照標(biāo)準(zhǔn)過低又會使研究對象認(rèn)為自己已經(jīng)達標(biāo)而缺少繼續(xù)改進的動力。因此,選擇參照常模群體的原則是“跳一跳,夠得著”,選擇略高于研究對象水平的常模群體作為參照標(biāo)準(zhǔn)。

        當(dāng)利用高考考試數(shù)據(jù)進行某研究區(qū)域各學(xué)科教學(xué)情況分析時,可以通過對各群體總分的分析,找到略高于該區(qū)域總分得分率、分?jǐn)?shù)分布相近的組內(nèi)常模群體作為參照常模群體。為便于進行連續(xù)追蹤研究,參照常模群體選定后應(yīng)穩(wěn)定一個時期。進入新一輪高考綜合改革后,高中學(xué)業(yè)水平選擇性考試(即等級考)等級轉(zhuǎn)換分的加入使得高考總分的教學(xué)診斷意義降低。但是,由于各組間常模群體的整體水平是相對穩(wěn)定的,故仍可使用改革前的高考總分來確定參照常模群體,這樣,也有利于進行改革前后的對比研究。

        因高考數(shù)據(jù)的敏感性,不便選用近兩年的數(shù)據(jù)。因此,下面以改革前某區(qū)某年理科數(shù)據(jù)為例,演示如何選擇確定參照常模群體。

        從表3可以看出:該區(qū)理科考生整體水平介于城區(qū)與全市平均水平之間,其中,一類校學(xué)生最為均衡,水平略低于示范校二,離散程度接近;二類校水平與北京市整體接近,但學(xué)生差異明顯小于全市整體;三類校是該區(qū)教學(xué)的薄弱點,考生間差異最大,不僅與一、二類校有較大差距,而且水平遠低于郊區(qū)平均水平。因此,選定城區(qū)作為該區(qū)整體的參照常模群體,選擇示范校二作為該區(qū)一類校的參照常模群體,選擇市整體作為該區(qū)二類校的參照常模群體,選擇郊區(qū)作為該區(qū)三類校的參照常模群體,進行各學(xué)科橫向與縱向的對比分析,以找到各類學(xué)校教育教學(xué)中的優(yōu)勢與不足。

        (二)各學(xué)科考試數(shù)據(jù)的具體分析方法

        1.確定差異基準(zhǔn)

        基準(zhǔn)是在測量工作中用作起始尺度的標(biāo)準(zhǔn)。差異基準(zhǔn)是指研究對象與參照常模群體高考成績的整體差異,用R表示。

        如上所述,在進行某區(qū)域?qū)W科分析之前,首先要確定該區(qū)域各群體的組間參照常模群體。確定組間參照常模之后,計算研究對象的總分得分率與參照常模的差異,該差異即可作為研究對象與參照目標(biāo)的差異基準(zhǔn)R。

        2.學(xué)科教學(xué)分析:計算學(xué)科差異,診斷優(yōu)勢與不足

        有了差異基準(zhǔn)R,再逐一計算該區(qū)域各學(xué)科的得分率與參照常模群體得分率的學(xué)科差異D;用學(xué)科差異D減去差異基準(zhǔn)R,即可得到學(xué)科水平L;當(dāng)L大于0時,說明相對參照常模,該學(xué)科為優(yōu)勢學(xué)科,當(dāng)L小于0時,說明相對參照常模,該學(xué)科為劣勢學(xué)科。

        為避免一次考試的局限性,無論是在尋找參照常模群體時,還是在分析優(yōu)勢、劣勢學(xué)科時,應(yīng)采用同樣的方法對比連續(xù)1-3年的歷史數(shù)據(jù)。

        下面仍以改革前的一組數(shù)據(jù)為例說明具體分析方法。假設(shè)某區(qū)某年理科考生各學(xué)科得分率如表4所示:

        從表4可知,在各學(xué)科中,得分率最高的是數(shù)學(xué)(理)0.74,得分率最低的是語文0.67,如果按照以往不考慮各學(xué)科試題難度、直接用各學(xué)科平均成績來衡量各學(xué)科的教學(xué)情況,無疑是數(shù)學(xué)成績最好,語文成績最低。

        事實果然如此嗎?假設(shè)通過總分分析,已經(jīng)確定城區(qū)作為該區(qū)的參照常模群體。利用前面介紹的計算方法得出差異基準(zhǔn)R,以及各學(xué)科的學(xué)科差異D和學(xué)科水平L,匯總形成表5:

        由表5可知,對比該區(qū)與參照常模群體城區(qū),他們之間的差異基準(zhǔn)R=-0.01。該區(qū)理科考生的語文、英語兩科得分率與城區(qū)持平,其他學(xué)科都比城區(qū)平均水平低0.01。用學(xué)科差異D減去差異基準(zhǔn)R,得到各學(xué)科水平L,語文、英語學(xué)科的學(xué)科水平L為0.01,其他學(xué)科為0,說明該區(qū)語文、英語為優(yōu)勢學(xué)科。用同樣的方法追溯往年數(shù)據(jù),發(fā)現(xiàn)該區(qū)理科學(xué)生的語文、英語的學(xué)科水平L一直大于0,兩科成績與參照常模城區(qū)的差距一直小于理綜、數(shù)學(xué)與城區(qū)的差距。因此判斷,該區(qū)理科的優(yōu)勢學(xué)科是語文與英語,弱勢學(xué)科是理綜與數(shù)學(xué)。如果想改進提升教學(xué),達到城區(qū)平均水平,應(yīng)在數(shù)學(xué)與理綜各科上多下功夫。

        3.學(xué)科內(nèi)部知識、能力、素養(yǎng)教學(xué)分析:確定學(xué)科差異基準(zhǔn)r,計算組塊差異d,診斷教學(xué)不足

        要診斷、改進教學(xué),只分析到學(xué)科層面是不夠的,還需要深入到學(xué)科內(nèi)部進行考生學(xué)科知識掌握情況、學(xué)科能力發(fā)展情況以及學(xué)科素養(yǎng)形成情況的分析。前面的分析方法同樣可以適用到學(xué)科內(nèi)部的各組塊、各個題目。

        當(dāng)進行學(xué)科內(nèi)部知識、能力、素養(yǎng)分析時,將某區(qū)域某學(xué)科得分率與參照常模得分率的學(xué)科差異D作為學(xué)科差異基準(zhǔn)r,然后計算該學(xué)科各知識、能力、素養(yǎng)組塊的得分率與參照常模相應(yīng)組塊得分率的差異d;用學(xué)科組塊差異d減去學(xué)科差異基準(zhǔn)r,得到學(xué)科各知識(能力、素養(yǎng))水平l;當(dāng)l大于0時,說明在該學(xué)科中,本區(qū)域考生的某知識掌握情況(或能力發(fā)展水平、素養(yǎng)形成情況)較好;當(dāng)l小于0時,說明在該學(xué)科中,本區(qū)域考生的某知識掌握情況(或能力發(fā)展水平、素養(yǎng)形成情況)較弱。

        通過對學(xué)科內(nèi)部知識、能力、素養(yǎng)的分析,就可以更加精準(zhǔn)地找到學(xué)科教學(xué)中存在的問題與不足,再結(jié)合區(qū)域、學(xué)校的教育教學(xué)實際,進行具體的歸因分析,就可以對癥下藥,找到解決問題、彌補不足的方法,從而提升學(xué)科教學(xué)水平。

        這種選擇確定參照常模群體進行相對比較的解讀考試數(shù)據(jù)方法,在一定程度上彌補了因缺少測驗等值給考試數(shù)據(jù)分析帶來的局限與誤差。

        五、適應(yīng)綜合改革需要,強化考試評價研究

        隨著高考綜合改革逐步向縱深推進,教、考、招構(gòu)成嚴(yán)謹(jǐn)?shù)膹婑詈舷到y(tǒng),任何一個環(huán)節(jié)的改革都必須放在這個全鏈條中進行考慮,以增強改革推進的系統(tǒng)性[8]。其中,高考內(nèi)容改革是各項改革的一個重要樞紐。由于高考的高利害性和保密性,能得到并使用高考原始數(shù)據(jù)的研究人員極其有限。因此,專業(yè)化教育考試機構(gòu)不僅需要研究構(gòu)建引導(dǎo)學(xué)生德智體美勞全面發(fā)展的考試內(nèi)容體系,而且需要加強考試數(shù)據(jù)的分析,以服務(wù)教學(xué)為目的,強化考試評價研究。

        基于高考數(shù)據(jù)進行教學(xué)診斷的考試評價研究,會不會更加強化高考分?jǐn)?shù)的作用,強化唯分?jǐn)?shù)、唯升學(xué)?筆者認(rèn)為恰恰相反。原因有三:

        (一)考試評價研究有利于克服唯總分、唯升學(xué)的簡單排隊

        破除唯分?jǐn)?shù)、唯升學(xué),并非不要分?jǐn)?shù)、不要升學(xué),而是要改變只重視高考總分、只看高考錄取率的痼疾?;诟呖紨?shù)據(jù)進行學(xué)科教學(xué)診斷,能夠引導(dǎo)學(xué)校、教師更加關(guān)注教學(xué)過程,在一定程度上淡化高考總分、學(xué)科總分、錄取率的影響,克服唯總分、唯升學(xué)的簡單排隊,減輕唯分?jǐn)?shù)、唯升學(xué)對教師的壓力。

        (二)考試評價研究有利于引導(dǎo)“從育分走向育人”

        基于高考數(shù)據(jù),通過分層分類、常模參照、相對比較法進行教學(xué)診斷,能夠讓高考數(shù)據(jù)發(fā)揮獨有的價值,發(fā)現(xiàn)不同區(qū)域、不同考生群體的學(xué)科優(yōu)勢與不足,引導(dǎo)區(qū)縣、學(xué)校更加重視對學(xué)科教學(xué)效果的分析,引導(dǎo)教師更加關(guān)注學(xué)生的學(xué)科知識掌握情況、能力發(fā)展情況、素養(yǎng)形成情況,引導(dǎo)基礎(chǔ)教育“從育分走向育人”。

        (三)考試評價研究可以為教育督導(dǎo)、教育管理以及教育教學(xué)決策提供科學(xué)依據(jù)

        作為國家教育考試,高考、學(xué)業(yè)水平考試具有很高的權(quán)威性、科學(xué)性,各學(xué)科考生水平評價及教學(xué)質(zhì)量分析報告的反饋,讓教育督導(dǎo)部門、管理部門、教研部門能夠及時了解學(xué)生學(xué)科知識掌握、學(xué)科能力發(fā)展、學(xué)科素養(yǎng)形成情況,為教育督導(dǎo)、教育管理和教學(xué)決策提供科學(xué)依據(jù)。

        大規(guī)模教育考試形成、積累了海量的考試數(shù)據(jù),其中蘊藏著許多非常珍貴的教育教學(xué)信息。為了適應(yīng)改革需要,更好地挖掘利用考試數(shù)據(jù)反饋、診斷、指導(dǎo)教育教學(xué),建議專家、學(xué)者加強以下方面研究:一是運用項目反應(yīng)理論、認(rèn)知診斷理論等進一步加強對考試數(shù)據(jù)挖掘、分析方法的研究,開展對考生個體的評價;二是進行基于無錨題、無錨人條件下的“無錨”等值技術(shù)、方法的研究,以實現(xiàn)對考試數(shù)據(jù)的縱向?qū)Ρ确治?;三是將高考、學(xué)業(yè)水平考試等結(jié)果性考試數(shù)據(jù)與學(xué)校過程性考試數(shù)據(jù)相結(jié)合,進行教學(xué)的綜合分析診斷。

        考試評價研究的目的是改進,發(fā)現(xiàn)每個區(qū)域、每個群體、每個考生的優(yōu)勢與不足,讓每個區(qū)域、每個群體、每個考生都能取得進步。只有這樣,考試才能與教學(xué)形成良性互動,助力素質(zhì)教育發(fā)展,助力學(xué)生全面而有個性的成長。

        參考文獻:

        [1]中共中央國務(wù)院.深化新時代教育評價改革總體方案[EB/ OL].(2020-10-13)[2021-02-10].http://www.moe.gov.cn/jyb_xxgk/moe_ 1777/moe_1778/202010/t20201013_494381.html.

        [2]教育部考試中心.中國高考評價體系[M].北京:人民教育出版社,2019:12.

        [3]朱文琪.近十年來普通高考考試數(shù)據(jù)研究的現(xiàn)狀與思考——基于中國知網(wǎng)2010-2019年的文獻計量分析[J].教育理論與實踐,2021,41(7):17-24.

        [4]國務(wù)院辦公廳.關(guān)于新時代推進普通高中育人方式改革的指導(dǎo)意見[EB/OL].(2019-06-19)[2021-2-10].http://www.gov.cn/zhengce/ content/2019-06/19/content_5401568.htm.

        [5]張敏強,梁正妍.新高考改革背景下的教育考試數(shù)據(jù)評價[J].中國考試,2020,(1):22-25.

        [6]教育部.普通高中課程方案(2017年版)[M].北京:人民教育出版社,2018:3.

        [7]北京教育考試院.北京市高考考生水平評價報告[M].北京:開明出版社,2019:12.

        [8]孫海波.把握新時代改革方法論,以系統(tǒng)觀念全面協(xié)調(diào)推進高考改革[J].中國考試,2021,(7):1-6.

        Research on the Application of Examination Evaluation in Teaching Diagnosis

        Ding Xiutao

        Beijing Education Examinations Authority,Beijing,100083

        Abstract:The new round of college entrance examination reform pays special attention to the guidance of elementary education and teaching.The important way to realize it is to strengthen the research of examination evaluation through the analysis of examination data,excavating the education and teaching information contained in the data,and guiding education and teaching. In practice,the classical measurement theory has obvious advantages in group teaching diagnosis.Based on the norm,this paper analyzes the knowledge,ability,literacy and other multi-dimensional structure of the college entrance examination data.Through the hierarchical classification analysis method,this paper deeply excavates the test data,and uses the test data for regional teaching diagnosis,which can find the subject advantages of different regions and different candidate groups.It can guide teachers to pay more attention to studentsmastery of subject knowledge,ability development and quality formation.This evaluation help to breaking the disadvantages of score only and entering a higher school only,and promoting the formation of benign interaction between examination and teaching.In the future,the research can be strengthened in three aspects. Firstly,the research could further strengthen the research on the test data mining analysis methods and carry out the evaluation of individuals. Secondly,the research could study the technology and method of“anchor-free”equivalence,so as to realize the vertical comparative analysis of test data.Thirdly,the research could combine the result test data of collage entrance examination and academic level test with the school process test data to carry out comprehensive analysis and diagnosis of teaching.

        Key words:College Entrance Examination,Examination Data Analysis,Examination Evaluation,Teaching Diagnosis

        (責(zé)任編輯:吳茳)

        亚洲熟少妇在线播放999| 草逼视频免费观看网站| 一区二区三区精品少妇| 久久成人影院精品777| 色一情一乱一伦一区二区三欧美| 黄色大片一区二区中文字幕| 一区二区三区亚洲免费| 欧洲成人一区二区三区| 亚洲成av人片在线观看无码| 正在播放淫亚洲| 国产熟女露脸大叫高潮| 无套内谢孕妇毛片免费看| 久久国产劲暴∨内射| 国产精品流白浆喷水| 久草视频在线播放免费| 偷拍综合在线视频二区| 亚洲av日韩综合一区在线观看| 亚州无线国产2021| 看大陆男女真人草逼视频| 尹人香蕉久久99天天拍| 日韩精品一区二区三区免费视频| 久久国产乱子伦精品免费强| 亚洲激情一区二区三区视频| 久久久久久av无码免费网站下载| 激情五月开心五月av| 精品久久久久久综合日本| 最新高清无码专区| 国产亚洲精品自在久久77| 亚洲av免费看一区二区三区| 国产高清乱码又大又圆| 国产一卡2卡3卡四卡国色天香 | 97久久婷婷五月综合色d啪蜜芽| 中文字幕在线观看亚洲日韩| 国产福利酱国产一区二区| 亚洲中文字幕第一第二页| av一区二区三区在线| 双腿张开被9个男人调教| 国产精品亚洲一区二区杨幂| 手机av在线观看视频| 国产精品一区二区三区卡| 免费国产黄网站在线观看可以下载 |