江 漂, 張維忠
(浙江師范大學 教師教育學院,浙江 金華 321004)
2014年,教育部印發(fā)《關(guān)于全面深化課程改革落實立德樹人根本任務的意見》,指出“研究制定學生發(fā)展核心素養(yǎng)體系和學業(yè)質(zhì)量標準”。[1]2017年,我國新修訂的《普通高中課程標準》首次研制了學科學業(yè)質(zhì)量標準,并將學科核心素養(yǎng)各個水平進行劃分,為有效落實核心素養(yǎng)建立起新的學業(yè)測評體系。學科核心素養(yǎng)是發(fā)展學生核心素養(yǎng)的有效途徑,學科核心素養(yǎng)評價能夠直接反饋學科核心素養(yǎng)具體實施情況,有助于教師及時調(diào)整課堂教學,以精準培養(yǎng)學生核心素養(yǎng)。2020年,國務院印發(fā)《深化新時代教育評價改革總體方案》,提出“改進結(jié)果評價,強化過程評價,探索增值評價,健全綜合評價”。表明教育評價從結(jié)果導向過渡到過程導向,也表明教育評價在推動教育改革發(fā)展中發(fā)揮著重要作用。[2]教育測量是對教育客體屬性進行量化或質(zhì)性描述,教育評價是在某種標準下對教育對象的價值或者屬性進行評判。[3]核心素養(yǎng)測評是一種更關(guān)注學生的復雜思維、問題解決能力以及如何將所學的新知識遷移到新情境的評價方式,而不是僅僅停留在傳統(tǒng)的紙筆測試工具對學生的知識和技能的評價。因此改變長期以來過分關(guān)注碎片化知識和標準答案的考試評價,制定出科學、合理、操作性強的促進學生核心素養(yǎng)發(fā)展的評價體系刻不容緩。本文通過對國內(nèi)關(guān)于學科核心素養(yǎng)測評文獻的梳理與分析,以期為我國基于核心素養(yǎng)的新課程實施與評價提供些許借鑒。
具有價值的研究主要存在于研究領(lǐng)域的核心期刊中,因此對中文期刊收集,首先在中國知網(wǎng)(CNKI)全文數(shù)據(jù)庫中以篇名“核心素養(yǎng)測評”和“核心素養(yǎng)評價”,發(fā)表時間限定為2013年到2020年11月,并選擇北大核心和CSSCI期刊進行檢索,發(fā)現(xiàn)目標文獻過少,僅有11篇。為了避免遺漏與測評相關(guān)的文獻,將篇名調(diào)整為以主題為“核心素養(yǎng)測評”和“核心素養(yǎng)評價”進行檢索(檢索時間為2020年12月2日),獲取111篇相關(guān)文獻,再手動剔除與主題無關(guān)文獻或會議文章共9篇,最終得到102篇文獻,并選擇以RefWorks格式導出。
先利用CiteSpace對目標文獻進行作者共現(xiàn)分析(即作者合作圖譜)、機構(gòu)合作圖譜分析、關(guān)鍵詞共現(xiàn)圖譜分析,初步得出已有研究在學科核心素養(yǎng)測評方面的特點。再對核心素養(yǎng)測評的論文采用質(zhì)性文本主題分析法,對目標文獻的內(nèi)容進行詳細分析,梳理文獻脈絡(luò)。通過兩種方法分析,力求對核心素養(yǎng)測評研究現(xiàn)狀做出科學的回顧與梳理。
通過對國內(nèi)近年來發(fā)表的核心素養(yǎng)測評文獻進行統(tǒng)計,具體發(fā)文情況如圖1所示。
圖1 核心素養(yǎng)測評文獻每年發(fā)文情況(2016—2020)
自2013年起核心素養(yǎng)逐漸受到學界的關(guān)注,對核心素養(yǎng)測評的研究熱情持續(xù)高漲,但關(guān)于核心素養(yǎng)測評的研究較核心素養(yǎng)研究起步晚。由圖1可知,2016年核心素養(yǎng)測評嶄露頭角,2017年是核心素養(yǎng)測評研究飛速增長期,發(fā)文數(shù)為32篇,屬于目前發(fā)文量最多的一年(2020年知網(wǎng)上的發(fā)文量只統(tǒng)計到11月),且2017年的發(fā)文量從1月份開始每月均有2篇文獻發(fā)表。2017年發(fā)文數(shù)量多與當時新頒布的高中新課程標準首次提出學業(yè)質(zhì)量評價的背景有關(guān)?!镀胀ǜ咧袛?shù)學課程標準(2017年版)》提出:“學業(yè)質(zhì)量是學生自主學習與評價、教師教學活動與評價、教材編寫的指導性要求?!盵4]可見從2016年起國內(nèi)研究者也逐步從對核心素養(yǎng)內(nèi)涵界定、構(gòu)成要素分析的研究過渡到對核心素養(yǎng)測量與評價上,表明核心素養(yǎng)在教育改革中不斷走向?qū)嵺`場域,核心素養(yǎng)的教學、評價得到學者及教育工作者的關(guān)注。
通過對研究機構(gòu)與發(fā)文的作者進行分析,以探析研究機構(gòu)和團隊的情況,便于持續(xù)關(guān)注研究趨勢。從表1作者發(fā)文量及圖2利用軟件繪制的作者合作圖譜看,發(fā)現(xiàn)朱立明在2019年發(fā)表了關(guān)于核心素養(yǎng)測評的文章,之后連續(xù)發(fā)表了3篇相關(guān)文章,其發(fā)文量最多。從最初關(guān)注教師專業(yè)素養(yǎng)測評到對數(shù)學學科核心素養(yǎng)的深度研究,表明其對核心素養(yǎng)評價高度關(guān)注。劉堅和張翰在2016年發(fā)表了3篇核心素養(yǎng)測評文章,說明兩位學者對核心素養(yǎng)的評價關(guān)注較早。通過對作者合作圖譜分析,發(fā)現(xiàn)獨立作者居多,作者合作并不普遍;形成了以劉堅為主的研究者群,肖廣德和魏雄鷹等合作相對緊密。從機構(gòu)合作情況來看,對核心素養(yǎng)測評的機構(gòu)主要是高等院校,其次是省考試院,但不同高等院校之間的合作較少,來自一線的教學實踐研究人員相對匱乏。即使存在少量的研究機構(gòu)合作,但更多集中在權(quán)威研究機構(gòu)不同部門之間的合作。因此,應加大不同級別的研究機構(gòu)、部門以及更多的中小學教師的研究合作。
表1 作者發(fā)文情況
圖2 作者合作圖譜
關(guān)鍵詞能顯示文獻的核心內(nèi)容及研究熱點,因此借助CiteSpace軟件,Node Types選擇“keyword”,選擇每個切片中前20個,繪制出關(guān)鍵詞圖譜以及關(guān)鍵詞頻次表。具體內(nèi)容如表2和圖3所示。
表2 關(guān)鍵詞頻次表
圖3 關(guān)鍵詞共現(xiàn)圖譜
通過對圖表進行分析可知,聚類模塊值(Q值)大于0.3(一般認為Q值大于0.3意味著聚類結(jié)構(gòu)顯著),聚類平均輪廓值(S值)為0.92(一般認為S大于0.5聚類即為合理,若大于0.7意味著聚類是令人信服的)。關(guān)鍵詞中核心素養(yǎng)和測評的中心性分別為0.87、0.15(中心性大于0.1即為關(guān)鍵節(jié)點)。核心素養(yǎng)頻次(49次)最高,其次是測評(頻次為8),學科核心素養(yǎng)作為頻次較高的關(guān)鍵詞,說明研究者開始從具體學科角度對素養(yǎng)評價進行研究,探析與學科核心素養(yǎng)相關(guān)的測評研究。測評框架、評價、關(guān)鍵能力作為核心素養(yǎng)測評主要關(guān)鍵詞,說明這些是學科核心素養(yǎng)測評研究的熱點。
為體現(xiàn)學生發(fā)展核心素養(yǎng)的層級化和銜接性,需要以學科為腳手架,在彰顯學科育人價值的基礎(chǔ)上落實學科核心素養(yǎng)。學科及其教學是為學生素養(yǎng)服務的,而不是為學科而教。[5]鑒于目前我國中小學課程主要是分科課程,核心素養(yǎng)的落實必須依托各學科,學科核心素養(yǎng)的出現(xiàn)屬于必然的應對。[6]通過文獻梳理,發(fā)現(xiàn)大部分研究者從學科角度對核心素養(yǎng)測評進行探析。為落實立德樹人,發(fā)展學生的核心素養(yǎng),不能片面地“去學科化”,而要滲透于各個具體學科之中,形成學科核心素養(yǎng),利用學科核心素養(yǎng)合力的教育價值,發(fā)展學生核心素養(yǎng)。[7]因此,學科核心素養(yǎng)評價是落實學生核心素養(yǎng)的有效途徑。通過對核心素養(yǎng)測評研究的文獻梳理,發(fā)現(xiàn)研究者從學科的角度進行核心素養(yǎng)評價探討的高達62篇。其中從數(shù)學學科角度進行探討的有21篇文獻,科學(國外直接從科學學科進行探討)包括物理、化學、生物的文獻有20篇,政治學科有8篇,語文和體育學科均為4篇,關(guān)于信息技術(shù)學科的測評研究有2篇,地理與歷史最少,僅1篇。其中無學科(指不局限于某一學科)的論文有37篇,其他學段即學前與高等教育有3篇。研究者從以下幾方面展開學科核心素養(yǎng)測評研究。
21世紀教育目標即核心素養(yǎng)的實現(xiàn)需課程、教學與評價共同保持良好的一致性。在現(xiàn)有的學科考試中融入對21世紀素養(yǎng)的測評,也成為各國規(guī)劃素養(yǎng)測評方案時的一種有效選擇。國外立足學業(yè)測評,如新西蘭將核心素養(yǎng)監(jiān)測融入到學生學業(yè)成就國家監(jiān)測研究中,且融入到現(xiàn)有各學科的不同類型的題目中,從而實現(xiàn)對核心素養(yǎng)的測評。澳大利亞在考查特定學段學生的讀寫、計算能力、信息交流技術(shù)等通用能力時也借助國家考試項目實施。[8]我國教育部考試中心于2019年發(fā)布《中國高考評價體系》,明確指出高考評價體系要基于素質(zhì)教育理論和考試評價規(guī)律,創(chuàng)造性地將素質(zhì)教育目標與考查內(nèi)容對接,體現(xiàn)對學生學科核心素養(yǎng)的考查。[9]研究者結(jié)合我國高考對核心素養(yǎng)測評進行了探析,如從數(shù)學學科核心素養(yǎng)的要素對2018年高考試題進行剖析,[10]抑或?qū)?shù)學核心素養(yǎng)按其結(jié)構(gòu)特征分為思維素養(yǎng)、方法素養(yǎng)、工具素養(yǎng),以2019年高考全國Ⅲ卷為例,剖析素養(yǎng)的測評情況。[11]從學科核心素養(yǎng)出發(fā),構(gòu)建生物、政治等相關(guān)學科的命題框架,擬完善測評體系,加快學科核心素養(yǎng)測評體系的構(gòu)建。[12-15]目前學科核心素養(yǎng)測評以學業(yè)質(zhì)量考試為抓手是一種有效的實施途徑。
各學科課程標準新增了學業(yè)質(zhì)量標準并對學科核心素養(yǎng)水平進行了劃分,這為學科核心素養(yǎng)測評提供了評價依據(jù)。有研究以課標為切入點,利用理論思辨與實證分析,對高中生數(shù)學學科核心素養(yǎng)測評指標體系進行初步構(gòu)建,得到18個測評指標及其操作描述,并采用層次分析法對六大數(shù)學學科核心素養(yǎng)與測評指標進行權(quán)重值確定和一致性檢驗,最終得到數(shù)學學科核心素養(yǎng)表達式。[16]有研究將信息技術(shù)這一學科的核心素養(yǎng)及其等級水平進行描述,選擇恰當?shù)脑u價內(nèi)容,制定合理的評價標準和可行的評價方式,并命制有效的學科核心素養(yǎng)測評試題。[17]有研究基于課標中對化學學科核心素養(yǎng)水平進行劃分,構(gòu)建命題框架,開發(fā)針對“宏觀辨識與微觀探析”素養(yǎng)的測評工具,并對6所高中的高二學生進行了相關(guān)素養(yǎng)水平的調(diào)查,探討了化學學科核心素養(yǎng)測評的研究價值。[18]由此可見,研究者立足本學科核心素養(yǎng)特色,以課標中學科核心素養(yǎng)水平的劃分為依據(jù),積極探究學科核心素養(yǎng)測評框架。
我國學者通過質(zhì)性研究或量化研究抑或?qū)烧呓Y(jié)合的研究范式,從不同的理論視角積極研制學科核心素養(yǎng)測評框架。如朱立明借鑒教材難易度模型、學生課業(yè)負擔測評模型、數(shù)學符號意識測評模型、學校特色發(fā)展測評模型等人文社科領(lǐng)域多種測評模型構(gòu)建的基本思路,進行三次專家咨詢,借助層次分析法確定數(shù)學學科核心素養(yǎng)及其測評指標的權(quán)重。[19]武小鵬基于心理學視角提出核心素養(yǎng)的認知診斷測評體系建構(gòu)。[20]喻平指出核心素養(yǎng)產(chǎn)生于知識,并結(jié)合數(shù)學核心素養(yǎng)的六要素,參照布盧姆模型、PISA模型和SOLO模型,從知識的三種形態(tài)研制了評價數(shù)學核心素養(yǎng)的框架。[21]通過對情境問題的研究,[22]打通了“必備知識—關(guān)鍵能力—情境活動”三者的關(guān)系,構(gòu)建出三位一體的歷史學科核心素養(yǎng)測評三維模型。有學者通過實踐研究自制核心素養(yǎng)量表,提出創(chuàng)客教育有助于培養(yǎng)學生核心素養(yǎng)的機制模型,并建立框架為我國學生發(fā)展核心素養(yǎng)提供了理論支持和實施路徑。[23]亦有研究者從思辨的角度,對高中核心素養(yǎng)的內(nèi)涵和可操作性維度進行分析,從知識的準確性、方向的正確性、方法的合理性和推理的有效性等四個維度進行分析和闡述,構(gòu)建關(guān)于核心素養(yǎng)的三維立體框架。[24]
介紹國外素養(yǎng)測評工具的論文有21篇,說明對核心素養(yǎng)測評研究,我國尚處于對國外素養(yǎng)測評研究的借鑒和起步階段。對國際上素養(yǎng)測評經(jīng)驗的評介主要集中在經(jīng)濟及教育發(fā)達的國家,如芬蘭、新加坡、英國、美國、德國、加拿大等。明確提到對美國21世紀學習能力測評借鑒的論文有5篇。國外對21世紀能力的測評更傾向采用表現(xiàn)性評價。表現(xiàn)性評價是西方國家主流教育評價方式,它將學生的復雜思維與高階認知能力的評價過程進行“可視化”。國外的表現(xiàn)性評價的實施已具備較成熟的方法,并提出核心步驟:明確評估目標、界定學生的表現(xiàn)期望、設(shè)計能讓學生發(fā)生這些行為的任務。[25]國外對核心素養(yǎng)測評時,提到需要采用多樣化的評價方式,如變革或新增標準化測試、編制跨學科素養(yǎng)評價工具、采用資格證書等。[26]有研究者指出美國、德國、芬蘭和新加坡采用形成性評價,發(fā)揮評價診斷教學的功能,并基于四國素養(yǎng)測評,給出數(shù)學學科數(shù)學交流與數(shù)學情感的測評工具與方法。[27]有研究借鑒國外學科能力體系,提出我國大規(guī)模的生物學科能力測評框架。[28]有研究者將PISA和TIMSS兩者進行框架比較,[29]也有研究者采用內(nèi)容分析法對PISA的框架進行分析,[30]或以PISA框架理念為依托,分析我國某一學科具體知識內(nèi)容。[31]總之,國際上的素養(yǎng)測評注重過程性評價,我國學科核心素養(yǎng)測評也應改變傳統(tǒng)性測評,借鑒過程性評價。
學科核心素養(yǎng)是指通過某學科的學習而逐步形成的關(guān)鍵能力、必備品格和價值觀念,[32]也指通過學習某學科的知識與技能、思想與方法而習得的重要觀念、關(guān)鍵能力與必備品格。[33]一言以蔽之,學科核心素養(yǎng)指向?qū)W生高階能力,即學科核心素養(yǎng)測評的突破口應圍繞學生高階能力的測評。目前有9篇論文研究了核心素養(yǎng)中的高階能力,涉及合作問題解決能力、自主學習能力、批判思維、跨學科能力。研究者深入分析數(shù)學學科核心素養(yǎng)要素,通過實證研究建構(gòu)學生數(shù)學問題解決能力的測評框架對我國學生的問題解決能力進行測量與評價。[34]自主學習能力作為核心素養(yǎng)的核心與本質(zhì),有研究以其作為切入點構(gòu)建我國本土化的核心素養(yǎng)。[35]借助國際對合作問題解決能力的測評經(jīng)驗,有研究對我國教育測評提出運用信息技術(shù)以及加強高階能力測評的新思考。[36]有研究者立足于落實學習質(zhì)量評價的要求,提出了由能力維度、水平維度、內(nèi)容維度三個維度構(gòu)成的數(shù)學關(guān)鍵能力評價模型,該模型能分析試題考查哪個關(guān)鍵能力以及處于何種水平。[37]學科核心素養(yǎng)有學科特質(zhì),即要求從學科角度踐行學生發(fā)展核心素養(yǎng);同時各學科核心素養(yǎng)又有其共同性,即要求從整體的角度落實學生必備的、共同的、關(guān)鍵的能力。高階能力培養(yǎng)有利于發(fā)展學生核心素養(yǎng),對高階能力的測評既是以學科的知識與能力為邏輯起點,又是對各學科核心素養(yǎng)指向的深層次共同能力的提煉與融合,體現(xiàn)了跨學科能力的評價。
通過對上述文獻分析,發(fā)現(xiàn)從借鑒國際核心素養(yǎng)測評經(jīng)驗到努力構(gòu)建本土化的測評框架,學界對學科核心素養(yǎng)測評研究已開始。教育評價關(guān)乎教育發(fā)展方向,對課程改革起著決定性作用。目前學界開始關(guān)注核心素養(yǎng)測評,且近些年來發(fā)展迅速,取得了些許進展,但是仍然處于研究初級階段,后期關(guān)于核心素養(yǎng)測評研究值得進一步深入關(guān)注。
通過對作者合作圖譜分析,研究者相對比較分散,獨立作者較多,研究者的身份大多是高等院校學者。不同研究機構(gòu)的研究合作也十分少,來自高校研究者、一線教師、教研員組成的研究團體更少,但只有來自不同群體的成員組成學科核心素養(yǎng)測評團體,才能落實核心素養(yǎng)評價從理論場域走向?qū)嵺`場域。芬蘭十分強調(diào)教師在測評中的主導作用,賦予教師更多的權(quán)利。學科核心素養(yǎng)測評的目的不再是傳統(tǒng)的篩選作用,而是診斷和促進學生的學習、改善和調(diào)整課堂教學。教師唯有積極參與測評研究,擔任評價的使命,了解學生的知識水平與思維,構(gòu)建有效的教學及評價環(huán)境才能讓測評得以真正奏效。
學科核心素養(yǎng)測評是教育界的焦點,是當前學科核心素養(yǎng)研究中迫切需要解決的現(xiàn)實問題。核心素養(yǎng)是高度抽象且復雜的知識、能力、情感態(tài)度等的綜合表現(xiàn),具有情境性、整體性等特征,[38]傳統(tǒng)的紙筆評價方式與測評框架局限于對學生認知知識的檢測,不能滿足當前教育評價的需求。不少研究將核心素養(yǎng)測評放置在真實問題情境中,強調(diào)跨學科的融合,評價改革需要調(diào)整觀念、合理確定評價依據(jù),注重信息技術(shù)在評價中的作用。[39-40]PISA對數(shù)學素養(yǎng)的評價也是注重學生在不同情境下解決現(xiàn)實問題的表現(xiàn)。21世紀的知識情境性日益增強,培養(yǎng)、評價學科核心素養(yǎng)均與情境具有密不可分的關(guān)系。[41]美國針對科學教育測評頒布的相關(guān)文件,以大概念為核心設(shè)計測評體系,開發(fā)系列測評任務,實現(xiàn)了測評工具按學習進階逐層提升。[42]測評體系需要科學的評價方法或模型、評價策略。國際上的測評經(jīng)驗均表明,首先建立指向核心素養(yǎng)的表現(xiàn)性評價,再根據(jù)核心素養(yǎng)的要素,將抽象的素養(yǎng)轉(zhuǎn)化為測評核心概念并設(shè)計表現(xiàn)性任務,[43]該表現(xiàn)性任務具有真實的情境性。測評體系要摒棄以往單維度,轉(zhuǎn)向評價學生的整體學習能力,要根據(jù)學生的不同進階能力制定進階評價方案。評估任務的確定既要注重遷移性,也要突出學科核心素養(yǎng)的特色。設(shè)計科學合理的評分標準并建構(gòu)描述性評價量表,改變因評分的主觀性導致整體測評結(jié)果的信度和效度不高的結(jié)果。因此,學科核心素養(yǎng)測評應突出各學科的特色,即測評框架的建立需圍繞本學科素養(yǎng)設(shè)置合理的真實的情境。
國際教育發(fā)展趨勢更強調(diào)對學生高階能力的培養(yǎng)與評價。如經(jīng)濟合作與發(fā)展組織開展的國際學生評估項目(PISA),在測評框架中提出“問題解決能力”“協(xié)作性問題解決能力”“全球勝任力”以及“創(chuàng)新能力”。這體現(xiàn)了國際社會對21世紀可遷移的跨學科素養(yǎng)測試的重視。我國作為考試大國,雖然多次在PISA測試中取得令人矚目的成績,但面對21世紀對創(chuàng)新型人才的需求,我國對高階能力的培養(yǎng)與測評需要重新審視教育測評理念。國內(nèi)已有研究者[44]對高階能力進行了關(guān)注,但還處于對國際經(jīng)驗的介紹和探索階段。核心素養(yǎng)要求關(guān)注學生的跨學科能力的測評,不能只關(guān)注那些容易測量的傳統(tǒng)學科領(lǐng)域,更應聚焦高階能力,但時下分科素養(yǎng)測評與核心素養(yǎng)測評理念存在矛盾。我國應重視對協(xié)作問題解決能力等核心能力評價的診斷功能,改變測評內(nèi)容多為記憶性知識、低層次認知能力的測試現(xiàn)狀,突出對學生高階能力的測評,以及在真實情境中問題解決時的態(tài)度、情感和價值觀等非認知因素的評價。有學者指出核心素養(yǎng)是一類高度抽象、結(jié)構(gòu)復雜的高階能力,超越了知識和一般能力的范疇,[16]研制高階能力操作性測評框架,有利于推進我國核心素養(yǎng)評價體系的發(fā)展。
信息技術(shù)、大數(shù)據(jù)和人工智能不僅改變了人們的生活方式,也給教育的發(fā)展以及核心素養(yǎng)測評帶來了契機。利用信息技術(shù)工具可以實現(xiàn)動態(tài)的、交互性的測評環(huán)境,設(shè)置復雜的真實的情境任務。大數(shù)據(jù)能讓全球的測評數(shù)據(jù)形成一個大的數(shù)據(jù)庫,提供從家庭、學校等各方面分析測評結(jié)果的資源。雖然將表現(xiàn)性評價運用到核心素養(yǎng)測評具有價值,但表現(xiàn)性評價存在缺少非紙筆形式的表現(xiàn)性任務、真實情境難以設(shè)置、評分細則操作性低、評分成本耗費大的困境。[45]學科核心素養(yǎng)測評所依托的真實情境創(chuàng)建僅依靠物理的現(xiàn)實真實環(huán)境是不現(xiàn)實的,需要利用先進的信息技術(shù)模擬出真實環(huán)境,為學習者搭建身臨其境的測評環(huán)境。信息技術(shù)能動態(tài)采集學習者測評過程的數(shù)據(jù),借助評分算法提取學科核心素養(yǎng)的指標并進行科學賦值,從而實現(xiàn)對學習者關(guān)鍵能力的研究。近年來國際上的大型測評項目,已轉(zhuǎn)向利用計算機技術(shù)構(gòu)建復雜的任務情境來測量學生的高階能力,這預示著未來教育測評的發(fā)展趨勢。我國作為教育大國,核心素養(yǎng)測評更應緊跟教育評價改革的步伐,研發(fā)適合學生發(fā)展核心素養(yǎng)測評的信息技術(shù),建立具有我國特色的測評任務數(shù)據(jù)庫。我國教育改革處于關(guān)鍵期,測評對教育改革具有導向功能,先進的評價理念與滯后的評價技術(shù)存在矛盾。因此,亟須開發(fā)與教育測評理念相匹配的技術(shù),完善測評的診斷和改進教學的功能,提高我國的教學質(zhì)量,為培養(yǎng)創(chuàng)新型人才服務。
研究范式是一個研究群體所持有的研究視角,是建立在一系列共享的假設(shè)、概念、價值觀和實踐基礎(chǔ)上的。[46]我國研究者對學科核心素養(yǎng)測評也取得了一定的成果,推動了學科核心素養(yǎng)測評研究的發(fā)展。通過對已有研究的梳理,其中屬于思辨研究的論文有81篇,實證研究的論文有6篇,16篇論文既有思辨又結(jié)合了實證。說明我國目前對核心素養(yǎng)測評主要采用經(jīng)驗介紹、分析的評價范式為主。此種研究范式在某種程度上能為我國核心素養(yǎng)測評研究起到借鑒與啟示的作用。但國際上的測評方式并非完全適用我國的教育評價,若要構(gòu)建本土化核心素養(yǎng)測評框架,需要結(jié)合國情對我國核心素養(yǎng)的關(guān)鍵能力、情境任務設(shè)置、測評量表指標、測試題設(shè)計等進行調(diào)查,在實證研究的基礎(chǔ)上進行測評設(shè)計。學科核心素養(yǎng)測評之所以遇到困境主要是傳統(tǒng)的教育測量范式遇到瓶頸,考試和心理量表均不能有效、準確地測出學生的核心素養(yǎng)水平。因此,學科核心素養(yǎng)測評框架的研制仍需對我國核心素養(yǎng)測評進行大量的實證研究,以期建立一套在維度劃分、指標體系、評分標準、情境任務上科學合理且具有普適性的核心素養(yǎng)測評體系。