周九詩(shī) 鮑建生
近年來(lái),隨著基礎(chǔ)教育改革不斷發(fā)展,教育評(píng)價(jià)研究領(lǐng)域成果不斷完善,教育過(guò)程質(zhì)量的重要性得到普遍關(guān)注。教學(xué)評(píng)價(jià)理念已由單一診斷功能,逐步向改善性和導(dǎo)向功能轉(zhuǎn)變。如何科學(xué)系統(tǒng)評(píng)價(jià)教師教學(xué)質(zhì)量,利用評(píng)價(jià)過(guò)程和結(jié)果促進(jìn)教師專(zhuān)業(yè)發(fā)展、提升教師教學(xué)質(zhì)量是新一代教學(xué)質(zhì)量評(píng)估系統(tǒng)的根本訴求。2019年6月,中共中央辦公廳、國(guó)務(wù)院辦公廳印發(fā)了《關(guān)于深化教育教學(xué)改革全面提高義務(wù)教育質(zhì)量的意見(jiàn)》,明確提出健全教育教學(xué)質(zhì)量評(píng)價(jià)監(jiān)測(cè)體系的要求。
國(guó)際上對(duì)課堂教學(xué)質(zhì)量的評(píng)估始于Hiller、Fisher和Kaess在1969年所做的研究,之后課堂教學(xué)評(píng)價(jià)體系一直處于不斷探索和發(fā)展的過(guò)程。自20世紀(jì)80年代,我國(guó)教育測(cè)量學(xué)和統(tǒng)計(jì)學(xué)開(kāi)始逐漸恢復(fù)和發(fā)展,中小學(xué)開(kāi)始出現(xiàn)各種課堂教學(xué)評(píng)價(jià)量表,以期對(duì)課堂教學(xué)質(zhì)量、教師教學(xué)水平作出公正、客觀、科學(xué)的評(píng)估。①安桂清, 李樹(shù)培.課堂教學(xué)評(píng)價(jià): 描述取向[J].教育發(fā)展研究, 2011(02): 48-52.但長(zhǎng)期以來(lái),我國(guó)尚未形成一套完善的教學(xué)質(zhì)量評(píng)價(jià)標(biāo)準(zhǔn),依然存在評(píng)估工具操作性不強(qiáng)、指標(biāo)結(jié)構(gòu)層次混亂,無(wú)法深刻準(zhǔn)確反映課堂教學(xué)活動(dòng)本質(zhì)等問(wèn)題。
我國(guó)現(xiàn)有的教學(xué)質(zhì)量評(píng)估系統(tǒng)多數(shù)不具有學(xué)科特色,如陳佑清和陶濤從教學(xué)目標(biāo)、教學(xué)內(nèi)容、教學(xué)方法、教學(xué)手段和教學(xué)效果五個(gè)維度評(píng)價(jià)教師課堂教學(xué)的評(píng)價(jià)指標(biāo)體系,其中每個(gè)維度又分為2至5個(gè)要素。②陳佑清, 陶濤.“以學(xué)評(píng)教”的課堂教學(xué)評(píng)價(jià)指標(biāo)設(shè)計(jì)[J].課程?教材?教法, 2016, 36(01):45-52.孫亞玲從教學(xué)目標(biāo)、教學(xué)活動(dòng)、教學(xué)能力、教學(xué)反饋和教學(xué)組織與管理五個(gè)方面評(píng)價(jià)課堂教學(xué)質(zhì)量。③孫亞玲.課堂教學(xué)有效性標(biāo)準(zhǔn)研究[M].北京: 教育科學(xué)出版社, 2008:150.周建華認(rèn)為高效的課堂評(píng)價(jià)指標(biāo)有六個(gè)維度,分別為教師素質(zhì)、教學(xué)過(guò)程、教學(xué)目標(biāo)、學(xué)習(xí)環(huán)境、教學(xué)方法和學(xué)生發(fā)展。④周建華.中學(xué)高效課堂評(píng)價(jià)標(biāo)準(zhǔn)實(shí)證研究??以數(shù)學(xué)教師和數(shù)學(xué)課堂為例[J].課程?教材?教法, 2013, 33(08): 47-52.類(lèi)似的評(píng)估框架看似覆蓋了課堂教學(xué)的方方面面,卻沒(méi)有抓住有意義教學(xué)的本質(zhì)特點(diǎn),導(dǎo)致評(píng)價(jià)工具看似學(xué)科普遍性很高,適用范圍很廣,實(shí)則難以把握學(xué)科特有的育人價(jià)值和核心能力培養(yǎng),削減了評(píng)估結(jié)果的專(zhuān)業(yè)化價(jià)值。西方教學(xué)評(píng)價(jià)框架更關(guān)注課堂中的師生互動(dòng),側(cè)重于教師的指導(dǎo)性和學(xué)生的主體性,如Danielson(2013)團(tuán)隊(duì)開(kāi)發(fā)的教學(xué)評(píng)價(jià)框架(A Framework for Teaching,簡(jiǎn)稱(chēng)FfT)中課堂教學(xué)評(píng)價(jià)部分包括教學(xué)環(huán)境和教學(xué)指導(dǎo)兩部分,教學(xué)環(huán)境評(píng)估教師能否布置適于學(xué)生學(xué)習(xí)的物理環(huán)境、創(chuàng)建積極融洽的學(xué)習(xí)文化、良好掌控課堂節(jié)奏和合理應(yīng)對(duì)學(xué)生表現(xiàn),教學(xué)指導(dǎo)主要評(píng)估教師的提問(wèn)和組織討論技巧,形成性測(cè)試的科學(xué)運(yùn)用和師生交流互動(dòng)的掌握情況。⑤Danielson Group. The Framework for teaching[EB/OL].[2020-10-12]. https://danielsongroup.org/framework/.
美國(guó)在課堂教學(xué)質(zhì)量評(píng)價(jià)方面一直走在國(guó)際研究前列,美國(guó)匹茲堡大學(xué)開(kāi)發(fā)研制的教學(xué)質(zhì)量評(píng)估系統(tǒng)(Instructional Quality Assessment,簡(jiǎn)稱(chēng)IQA)適用多個(gè)州和地區(qū),涵蓋多個(gè)學(xué)科領(lǐng)域,針對(duì)不同學(xué)科都有與之相對(duì)應(yīng)的評(píng)價(jià)內(nèi)容和評(píng)估標(biāo)準(zhǔn)。IQA評(píng)估系統(tǒng)具有良好信效度、較強(qiáng)可操作性,研究表明IQA評(píng)估結(jié)果與學(xué)生學(xué)業(yè)成就呈正相關(guān)。⑥Boston, M. D., Colby, G. Identifying meaningful aspects of mathematics instruction[R]. Paper presented at the annual meeting of the American Education Research Association, New Orleans, 2011: 18-27.美國(guó)中等數(shù)學(xué)教學(xué)機(jī)構(gòu)項(xiàng)目(The Middle School Mathematics and the Institutional Setting of Teaching,簡(jiǎn)稱(chēng)MIST)采用IQA為研究工具,調(diào)查4座城市共計(jì)114節(jié)數(shù)學(xué)課,發(fā)現(xiàn)課堂教學(xué)質(zhì)量與教師教齡、課程標(biāo)準(zhǔn)使用時(shí)間、教師專(zhuān)業(yè)發(fā)展支持均呈正相關(guān)。⑦M(jìn)elissa D. Boston, Anne Garrison Wilhelm. Middle School Mathematics Instruction in Instructionally Focused Urban Districts[J].Urban Education, 2017(52): 829-861.不少研究者以IQA作為教師專(zhuān)業(yè)發(fā)展監(jiān)控框架,通過(guò)IQA指標(biāo)判斷教師專(zhuān)業(yè)技能變化趨勢(shì),以此評(píng)估教師專(zhuān)業(yè)培訓(xùn)效果。①Boston, M. D., Smith, M. S. A ‘task-centric approach’to professional development: Enhancing and sustaining mathematics teachers’ ability to implement cognitively challenging mathematical tasks[J].ZDM: International Journal of Mathematics Teacher Education, 2011(43): 965-977.②Candela, A. G. Mathematics teachers’ perspectives on professional development around implementing high cognitive demand tasks. In: C. Martin, D. Polly (Eds.). Handbook of research on teacher education and professional development[M].Hershey, PA:IGI Global, 2017:538-560.③Sztajn, P., Wilson, P. H., Edgington, C., Confrey, J. Learning trajectories and key instructional practices. L.R. Wiest, T.d.Lamberg (Eds). Proceedings of the 33rd annual meeting for the North American Chapter for the Psychology of Mathematics Education[M]. Reno: Nevada, 2011: 434-442.坎德?tīng)枺–andela)和波士頓(Boston)等人的研究均表明,IQA框架本身可用于指導(dǎo)教師專(zhuān)業(yè)發(fā)展,教師在理解IQA評(píng)價(jià)理念、評(píng)價(jià)內(nèi)容和評(píng)價(jià)標(biāo)準(zhǔn)后,通過(guò)相應(yīng)的實(shí)踐培訓(xùn),教學(xué)能力得到顯著提升。④Candela, A. G. Using the Instructional Quality Assessment observation tool in a professional development capacity. M.B.Wood,E.E.Turner, M Civil, J.A.Eli (Eds). Proceedings of the 38th annual meeting for the North American Chapter for the Psychology of Mathematics Education[M].Tucson: AZ, 2016: 418.⑤Melissa D. Boston, Amber G. Candela. The Instructional Quality Assessment as a tool for reflecting on instructional practice[J].ZDM: International Journal of Mathematics Teacher Education, 2018(50):427-444.本文詳細(xì)介紹IQA的研發(fā)基礎(chǔ)、系統(tǒng)結(jié)構(gòu)和特點(diǎn),探討教學(xué)質(zhì)量評(píng)估系統(tǒng)對(duì)我國(guó)課堂教學(xué)研究和教師專(zhuān)業(yè)發(fā)展的借鑒意義。
20世紀(jì)80年代初,美國(guó)國(guó)家卓越教育委員會(huì)(National Committee on Excellence in Education)頒布《國(guó)家危機(jī)》(A Nation at Risk)法案,強(qiáng)調(diào)制定學(xué)生學(xué)業(yè)成就和教師教學(xué)質(zhì)量評(píng)價(jià)標(biāo)準(zhǔn)的迫切性和重要性,正式拉開(kāi)美國(guó)基于標(biāo)準(zhǔn)(Standards-based)的教育改革運(yùn)動(dòng)序幕。隨后,美國(guó)聯(lián)邦政府出臺(tái)的《美國(guó)教育:2000年目標(biāo)》(Goals 2000:Educate America)、《不讓一個(gè)孩子掉隊(duì)》(No Child Left Behind)法案中均明確指出,教師教學(xué)質(zhì)量是學(xué)生能力發(fā)展和知識(shí)獲得的關(guān)鍵因素,需要進(jìn)一步加強(qiáng)和完善教師專(zhuān)業(yè)發(fā)展和教學(xué)質(zhì)量評(píng)價(jià)工作。奧巴馬政府十分關(guān)注教師教學(xué)效能,制定了《力爭(zhēng)上游》(Race To The Top,簡(jiǎn)稱(chēng)RTTP)、《教師激勵(lì)基金》(Teacher Incentive Fund,簡(jiǎn)稱(chēng)TIF)等一系列以教師教學(xué)評(píng)價(jià)為主體的政策法案,鼓勵(lì)高校和科研機(jī)構(gòu)研制開(kāi)發(fā)教學(xué)質(zhì)量評(píng)估系統(tǒng),并對(duì)各州教師評(píng)價(jià)和教師專(zhuān)業(yè)發(fā)展項(xiàng)目提供大量財(cái)政撥款。美國(guó)國(guó)家研究協(xié)會(huì) (National Research Council,簡(jiǎn)稱(chēng)NRC)認(rèn)為,不能僅通過(guò)某一段時(shí)間內(nèi)學(xué)生學(xué)業(yè)成就上的變化考察教師的教學(xué)質(zhì)量,一些有效的教學(xué)指導(dǎo)可能無(wú)法體現(xiàn)在標(biāo)準(zhǔn)化測(cè)試中,效能高的教師能夠?qū)W(xué)生學(xué)習(xí)能力的提升產(chǎn)生深遠(yuǎn)影響。⑥National Research Council. Incentives and test-based accountability in public education [M].Washington, DC: National Academies Press, 2011: 58-60.與此同時(shí),以學(xué)生學(xué)業(yè)成就為導(dǎo)向的教學(xué)質(zhì)量評(píng)估模式,由于無(wú)法直接解釋和改進(jìn)教學(xué)中的不足,開(kāi)始受到教育界的廣泛質(zhì)疑,⑦Pianta, R. C., Hamre, B. K. Conceptualization, measurement, and improvement of classroom processes: Standardized observations can leverage capacity. Educational Researcher[J], 2009(38):109–119.以課堂觀察為基礎(chǔ)的評(píng)估系統(tǒng)成為評(píng)價(jià)教師教學(xué)質(zhì)量和提高教師專(zhuān)業(yè)能力發(fā)展的重要方式,①Stein, M. K., Matsumura, L. C. Measuring instruction for teacher learning[M]. CA: Sage, 2008: 179-205.IQA在這個(gè)大背景下快速發(fā)展。
IQA研發(fā)者在研制系統(tǒng)框架時(shí),以美國(guó)國(guó)家研究協(xié)會(huì)最新發(fā)布的研究報(bào)告《人如何學(xué)習(xí):大腦、思維、經(jīng)歷和學(xué)?!罚℉ow People Learn: Brain, Mind, Experience, and School)為準(zhǔn)則,②Bransford, J. D., Brown L., Cocking, R. R., (Eds). How people learn: Brain, mind, experience, and school[R]. Washington, DC:The National Academics Press, 2000: 1-374.并參考前沿的教育教學(xué)理論,提出“四個(gè)中心”研制基礎(chǔ),分別是“學(xué)習(xí)者中心(Learner-Centered)”“知識(shí)中心(Knowledge-Centered)”“任務(wù)中心(Assessment-Centered)”和“共同體中心(Community-Centered)”。學(xué)習(xí)者中心指教師清楚了解學(xué)生已有認(rèn)知,幫助學(xué)生架構(gòu)新舊知識(shí)間的聯(lián)系,有意識(shí)地將元認(rèn)知教學(xué)融入課程,培養(yǎng)學(xué)生自我監(jiān)控和自我決策能力。知識(shí)中心要求教師深入全面理解所教學(xué)科的內(nèi)容知識(shí),在教學(xué)過(guò)程中提供足夠?qū)嵗龓椭鷮W(xué)生掌握學(xué)科核心概念和解決復(fù)雜問(wèn)題。任務(wù)中心指教師需要幫助學(xué)生明確教學(xué)目標(biāo),讓學(xué)生清楚知道自己應(yīng)該掌握和能夠習(xí)得的內(nèi)容,布置的任務(wù)和作業(yè)不能僅停留“識(shí)記”層面,要注重考查學(xué)生問(wèn)題理解和解決能力,任務(wù)設(shè)計(jì)滿(mǎn)足學(xué)生高認(rèn)知水平要求。共同體中心要求教師在教學(xué)過(guò)程中營(yíng)造學(xué)生積極探討和思考的學(xué)習(xí)氛圍,建立互幫互助、共同進(jìn)步的學(xué)生學(xué)習(xí)共同體,學(xué)生在共同體中充分表達(dá)、傾聽(tīng)、交流想法意見(jiàn),鍛煉協(xié)同合作與交流能力。在“四個(gè)中心”理論基礎(chǔ)上,IQA梳理總結(jié)前人的課堂觀察和教學(xué)評(píng)估工具,形成評(píng)估系統(tǒng)框架和評(píng)估要點(diǎn)。IQA主要借鑒由美國(guó)匹茲堡大學(xué)主持的一項(xiàng)國(guó)家層面的教育改革項(xiàng)目“定量理解:提高學(xué)生學(xué)業(yè)成就和推理能力(Quantitative Understanding: Amplifying Student Achievement and Reasoning,簡(jiǎn)稱(chēng)QUASAR)”。③Melissa Boston. Assessing Instructional Quality in Mathematics[J].The Elementary School Journal, 2012 (01):76-104.QUASAR可以被認(rèn)為是當(dāng)時(shí)最有實(shí)證基礎(chǔ)的評(píng)價(jià)體系,具有學(xué)科針對(duì)性,采用以量化為主的方式記錄分析課堂活動(dòng),分維度評(píng)估課堂教學(xué)質(zhì)量,④Johansson S, Myrberg E. Teacher specialization and student perceived instructional quality: what are the relationships to student reading achievement?[J]. Educational Assessment, Evaluation and Accountability, 2019 (04): 28-41.但仍存在兩方面的不足:(1)QUASAR側(cè)重于對(duì)任務(wù)本身設(shè)計(jì)與實(shí)施的評(píng)估,沒(méi)有充分體現(xiàn)學(xué)習(xí)共同體的形成和發(fā)展;(2)QUASAR的教學(xué)觀偏向以教師為中心的課堂,缺少學(xué)生自我監(jiān)控、決策等能夠體現(xiàn)學(xué)生自主能動(dòng)性的評(píng)估指標(biāo)。因此,IQA研究者刪除QUASAR中理念陳舊的觀測(cè)點(diǎn),補(bǔ)充有關(guān)學(xué)生自主能動(dòng)性和學(xué)習(xí)共同體的條目,形成IQA課堂觀察評(píng)估工具。同時(shí),IQA還增加師生訪談和教學(xué)資料的收集,作為教師課堂觀察的補(bǔ)充材料,共同作用評(píng)估教師教學(xué)質(zhì)量。
IQA教學(xué)質(zhì)量評(píng)估框架主要用于評(píng)估者現(xiàn)場(chǎng)聽(tīng)課和對(duì)教師提交資料的評(píng)價(jià)。不同于教學(xué)視頻錄像可供研究者多次反復(fù)觀看,現(xiàn)場(chǎng)聽(tīng)課具有較強(qiáng)的信息及時(shí)性,需要評(píng)估者快速準(zhǔn)確捕捉評(píng)估要點(diǎn),因此IQA具有較少的評(píng)估維度和子維度,且每個(gè)子維度的水平區(qū)分十分清晰,便于打分者快速作出恰當(dāng)判斷,提高工具的信效度。IQA評(píng)估要點(diǎn)分為三個(gè)維度:任務(wù)認(rèn)知需求(Cognitive Demand of Task)、解釋性話語(yǔ)(Accountable Talk)和教師期望(Teacher Expectations),每個(gè)維度包含2–5個(gè)子維度作為評(píng)分要點(diǎn)。表1①Overview of the Instructional Quality Assessment[EB/OL]. [2020-06-12]. http://d-scholarship.pitt.edu/26 209/.以數(shù)學(xué)學(xué)科為例,列出IQA的評(píng)估維度、子維度和各個(gè)子維度的評(píng)估要點(diǎn),包括對(duì)現(xiàn)場(chǎng)課堂教學(xué)和教師提交材料的評(píng)估,其中解釋性話語(yǔ)維度只用于評(píng)估教師現(xiàn)場(chǎng)課堂教學(xué)。
表1 IQA評(píng)估維度及現(xiàn)場(chǎng)課堂教學(xué)和教師提交材料評(píng)估要點(diǎn)
IQA以量化評(píng)分方式為主,結(jié)合質(zhì)性評(píng)分依據(jù),通過(guò)多種教學(xué)質(zhì)量相關(guān)材料的收集,采用課堂觀察、問(wèn)卷、訪談和作品分析的方法,確保評(píng)估者能夠準(zhǔn)確、高效地進(jìn)行教學(xué)質(zhì)量評(píng)價(jià)。評(píng)估任務(wù)主要包括三項(xiàng):教師教學(xué)現(xiàn)場(chǎng)觀察、師生訪談和教師提交資料。其中教師訪談發(fā)生在課后,學(xué)生訪談發(fā)生在課堂進(jìn)行中,訪談的目的是幫助評(píng)估者更好理解課堂活動(dòng),這部分內(nèi)容將作為依據(jù)補(bǔ)充,使評(píng)估者能夠更為合理地對(duì)現(xiàn)場(chǎng)教學(xué)進(jìn)行評(píng)估。
任務(wù)一:教學(xué)現(xiàn)場(chǎng)觀察。每位評(píng)估者需要觀察參評(píng)教師連續(xù)兩節(jié)課(每節(jié)課約45分鐘)的現(xiàn)場(chǎng)教學(xué)。參評(píng)教師在每節(jié)課被觀察之前,需要完成一份問(wèn)卷,簡(jiǎn)要描述教學(xué)目標(biāo)、教學(xué)活動(dòng)和班里學(xué)生情況,幫助評(píng)估者對(duì)教學(xué)任務(wù)設(shè)計(jì)進(jìn)行初步判斷。在正式觀察過(guò)程中,評(píng)估者利用IQA現(xiàn)場(chǎng)教學(xué)評(píng)估框架對(duì)全部的10個(gè)要點(diǎn)進(jìn)行打分。每個(gè)觀測(cè)點(diǎn)分為四個(gè)水平,由低到高分別對(duì)應(yīng)1-4分:水平1為最低水平,表示在該子維度教學(xué)表現(xiàn)最不符合評(píng)分標(biāo)準(zhǔn),水平2表示教學(xué)在該子維度表現(xiàn)基本合格,水平3表示該子維度教學(xué)表現(xiàn)良好,水平4代表在該子維度上教學(xué)應(yīng)該呈現(xiàn)的理想狀態(tài)。如果課堂中某個(gè)子維度觀測(cè)點(diǎn)未出現(xiàn)或無(wú)法判斷,則用N/A(Not Applicable)表示“不適用”或N/K(Not Known)表示“不確定”。評(píng)估者除了對(duì)教學(xué)質(zhì)量量化打分外,還需要在觀測(cè)要點(diǎn)旁邊簡(jiǎn)要記錄打分依據(jù)。
任務(wù)二:師生訪談。教師訪談:評(píng)估者在課后馬上對(duì)教師作一個(gè)簡(jiǎn)短訪談,主要是獲取教學(xué)設(shè)計(jì)和實(shí)施的背景信息,了解教師出于何種原因設(shè)計(jì)教學(xué)目標(biāo)和教學(xué)過(guò)程,教學(xué)設(shè)計(jì)和實(shí)施間是否存在差異,存在差異的原因是什么。以此幫助評(píng)估者更深入了解教師的課堂教學(xué),給出最為合理正確的評(píng)估分?jǐn)?shù)。學(xué)生訪談:評(píng)估者在上課過(guò)程中(一般在學(xué)生處理教師布置的教學(xué)任務(wù)時(shí))對(duì)學(xué)生進(jìn)行3-5分鐘的訪談,主要考察學(xué)生學(xué)習(xí)管控能力和是否清楚了解教師所布置的任務(wù)中對(duì)學(xué)生完成情況的期望水平。訪談問(wèn)題包括“你覺(jué)得你現(xiàn)在完成的任務(wù)還能夠進(jìn)一步完善么”“如果我是班里新來(lái)的一個(gè)學(xué)生,你能告訴我如何順利解決老師提出的這個(gè)問(wèn)題么”等。師生訪談結(jié)束后,評(píng)估者給出教師現(xiàn)場(chǎng)教學(xué)的最終得分。
任務(wù)三:教師提交資料。每位被評(píng)估教師提供4份學(xué)生作業(yè),其中兩份是教師認(rèn)為對(duì)學(xué)生有特殊挑戰(zhàn)性的(Especially Challenging)作業(yè),另外兩份為學(xué)生近期完成的作業(yè)。教師將每份作業(yè)裝訂成冊(cè),并撰寫(xiě)封面,封面包括留該份作業(yè)的目的和評(píng)分標(biāo)準(zhǔn),作業(yè)對(duì)今后的教學(xué)有什么幫助,學(xué)生完成該作業(yè)過(guò)程中能夠獲得怎樣的自我學(xué)習(xí)審視機(jī)會(huì),對(duì)學(xué)生自我決策能力和思維發(fā)展有怎樣的提高。教師還需要提供學(xué)生作業(yè)中低、中、高三個(gè)不同水平的典型案例各兩份。評(píng)估者采用IQA教師提交材料維度框架對(duì)此打分,評(píng)估子維度為現(xiàn)場(chǎng)教學(xué)評(píng)價(jià)框架10個(gè)子維度中的5個(gè),評(píng)估要點(diǎn)的具體內(nèi)容表述與現(xiàn)場(chǎng)教學(xué)版相比稍有不同。
IQA教學(xué)質(zhì)量評(píng)估系統(tǒng)在使用過(guò)程中需要遵循四個(gè)原則:(1)評(píng)估不僅考核教師教學(xué)質(zhì)量,還要以提高教師教學(xué)能力為根本目的;(2)評(píng)價(jià)要緊密?chē)@“四個(gè)中心”,設(shè)計(jì)能夠滿(mǎn)足學(xué)生認(rèn)知需求的教學(xué)任務(wù),并有效實(shí)施,關(guān)注學(xué)生思維能力的發(fā)展,培養(yǎng)學(xué)生合作交流和批判創(chuàng)新能力;(3)被評(píng)估教師能夠通過(guò)評(píng)估框架、評(píng)估過(guò)程與結(jié)果清楚了解自身教學(xué)存在的優(yōu)勢(shì)和不足,明確提升的目標(biāo)與方向;(4)評(píng)估工具需要具備良好的信效度。
IQA教學(xué)評(píng)估系統(tǒng)具有一定的主觀性,為了保證評(píng)估效果的合理性,研究者設(shè)置如下保障機(jī)制:多種方法相結(jié)合的數(shù)據(jù)收集方式、系統(tǒng)的評(píng)分者培訓(xùn)模式、標(biāo)準(zhǔn)化的評(píng)估體系和詳細(xì)的評(píng)分示例。其中第一種效果保障機(jī)制已在前文論述,此處主要介紹后三個(gè)方面。
1. 評(píng)分者的選擇與培訓(xùn)
IQA的評(píng)分者可以是中小學(xué)一線教師、教研員、教學(xué)督導(dǎo)或大學(xué)教師,但要求對(duì)所評(píng)估學(xué)科的本體性知識(shí)有一定了解,除此之外對(duì)評(píng)分者教學(xué)年限、職稱(chēng)、學(xué)歷、培訓(xùn)經(jīng)驗(yàn)等并無(wú)嚴(yán)格要求。IQA評(píng)分者要參加為期4天左右的資格培訓(xùn),具體培訓(xùn)流程如下:首先,培訓(xùn)專(zhuān)家組織評(píng)分者學(xué)習(xí)IQA開(kāi)發(fā)背景和評(píng)估理念,了解IQA評(píng)估框架、維度與相應(yīng)評(píng)估要點(diǎn);接著,培訓(xùn)專(zhuān)家通過(guò)課堂和作業(yè)實(shí)例分析各評(píng)估要點(diǎn)的得分表現(xiàn),對(duì)水平接近 (如水平3和水平4)的實(shí)例進(jìn)行重點(diǎn)分析,解讀異同;之后,評(píng)分者分以小組為單位觀看教學(xué)視頻,分析教師提交的資料,在組內(nèi)討論其得分表現(xiàn),小組成員討論后存在異議的地方征詢(xún)培訓(xùn)專(zhuān)家意見(jiàn),直至組內(nèi)所有成員意見(jiàn)達(dá)成一致;最后,以個(gè)人為單位單獨(dú)對(duì)教學(xué)視頻和文本材料打分,同一組材料由3人或以上進(jìn)行評(píng)估,對(duì)于組內(nèi)評(píng)分不一致的維度,若集體討論后仍無(wú)法說(shuō)服對(duì)方,則須由培訓(xùn)專(zhuān)家一起參與討論。在此過(guò)程中,受訓(xùn)者的評(píng)分依據(jù)由最初的模糊變得逐步清晰,如一位評(píng)分者在培訓(xùn)之初評(píng)估“教師引導(dǎo)”時(shí),給出的依據(jù)既不清晰又缺乏自信,“呃,教師應(yīng)該是在學(xué)生討論前說(shuō)了些什么……來(lái)引導(dǎo)學(xué)生討論,就在教師讀完課文的時(shí)候”,而在培訓(xùn)快結(jié)束時(shí),該評(píng)分者可以給出十分具體有說(shuō)服力的評(píng)分依據(jù):“教師一直鼓勵(lì)并追問(wèn)學(xué)生‘你是怎么想的?能給我們一個(gè)具體例子來(lái)說(shuō)明你的理解么?’以此來(lái)引導(dǎo)學(xué)生表達(dá)論述自己的觀點(diǎn)。 ”①Amy C. Crosson, Melissa Boston, Allison Levison, Lindsay Clare Matsumura, Lauren B. Resnick, and Mikyung Kim Wolf.Beyond Summative Evaluation: The Instructional Quality Assessment as a Professional Development Tool[R]. Annual Meeting of the American Educational Research Association Meeting, San Diego, CA, 2004: 11-12.評(píng)分者在反復(fù)實(shí)例操練討論過(guò)程中熟悉評(píng)分標(biāo)準(zhǔn),掌握區(qū)分評(píng)估要點(diǎn)中不同水平的行為表現(xiàn),在獲得培訓(xùn)專(zhuān)家認(rèn)可后,正式擁有IQA評(píng)分資格。
2. 標(biāo)準(zhǔn)化的評(píng)估體系
為了最大限度提高IQA的信度和效度,IQA使用手冊(cè)中詳細(xì)描述每個(gè)評(píng)估要點(diǎn)概念,多數(shù)評(píng)估要點(diǎn)的不同水平表現(xiàn)都有數(shù)字化指標(biāo)加以區(qū)分,幫助評(píng)估者快速準(zhǔn)確判斷教學(xué)質(zhì)量在某個(gè)子維度所處的相應(yīng)水平,具有較強(qiáng)的可操作性和客觀性。以“解釋性話語(yǔ)”維度中的觀察要點(diǎn)“學(xué)生反饋”為例,其四個(gè)水平的標(biāo)準(zhǔn)如下:
水平4(4分):班里有3個(gè)或以上的學(xué)生能夠解釋和論證自己的觀點(diǎn),且具有較強(qiáng)的邏輯性。
水平3(3分):班里有1-2個(gè)學(xué)生能夠解釋和論證自己的觀點(diǎn),且具有較強(qiáng)的邏輯性。
水平2(2分):學(xué)生嘗試解釋和論證自己的觀點(diǎn),但表述不恰當(dāng)且邏輯性不強(qiáng)。
水平1(1分):學(xué)生只能給出某些想法,但無(wú)法解釋論證自己的觀點(diǎn)。
3. 詳細(xì)的評(píng)分示例
為了便于評(píng)分者準(zhǔn)確理解和使用評(píng)分標(biāo)準(zhǔn),IQA手冊(cè)中詳細(xì)列舉了不同水平的表現(xiàn)行為,用實(shí)例描述的方式具體解釋每個(gè)評(píng)分要點(diǎn)不同水平間的區(qū)別。以數(shù)學(xué)學(xué)科“任務(wù)需求”維度中的觀察要點(diǎn)“任務(wù)潛能”為例,其四個(gè)水平的詳細(xì)示例如下:
水平4(4分):設(shè)計(jì)的任務(wù)能夠幫助學(xué)生理解和探索數(shù)學(xué)概念、程序和關(guān)系的本質(zhì),譬如做數(shù)學(xué)(Doing Mathematics)和程序間建立聯(lián)系(Procedures with Connections)。做數(shù)學(xué)指運(yùn)用復(fù)雜的非算術(shù)思想解決非常規(guī)問(wèn)題,程序間建立聯(lián)系指將一般方法應(yīng)用于具體問(wèn)題解決。任務(wù)中有能明確促進(jìn)學(xué)生理解和思考的表述或指示,如要求學(xué)生解釋為什么選用某個(gè)方法解題;圖形找規(guī)律并證明規(guī)律一般化;用數(shù)學(xué)語(yǔ)言建立并證明表征、策略與數(shù)學(xué)概念或程序間的聯(lián)系等。
水平3(3分):設(shè)計(jì)的任務(wù)能夠引發(fā)學(xué)生深層次思考,形成建立數(shù)學(xué)概念、程序間聯(lián)系的意識(shí),然而該潛在任務(wù)沒(méi)有達(dá)到水平4是由于:任務(wù)中沒(méi)有明確促進(jìn)學(xué)生理解或思考的表述或指示;任務(wù)雖然要求學(xué)生做數(shù)學(xué)或建立數(shù)學(xué)程序間的聯(lián)系,但是任務(wù)中的數(shù)學(xué)內(nèi)容不適合所教學(xué)生的學(xué)情(如對(duì)學(xué)生而言太簡(jiǎn)單或者太困難的題目都無(wú)法促進(jìn)學(xué)生高認(rèn)知水平發(fā)展);要求學(xué)生找圖形規(guī)律,但并未要求學(xué)生證明或推廣規(guī)律至一般化;要求學(xué)生用多種策略或表征解決問(wèn)題,但并未明確要求學(xué)生建立所用策略或表征間的聯(lián)系;只要求學(xué)生猜想推測(cè),并未要求學(xué)生給出數(shù)學(xué)解釋或理由。
水平2(2分):潛在任務(wù)中沒(méi)有要求學(xué)生建立數(shù)學(xué)概念或數(shù)學(xué)解題思想間的聯(lián)系,任務(wù)僅聚焦于正確答案的獲得(如解決常規(guī)問(wèn)題、重復(fù)練習(xí)計(jì)算等),而非學(xué)生數(shù)學(xué)思想的形成與發(fā)展,或者任務(wù)中的數(shù)學(xué)內(nèi)容低于學(xué)生現(xiàn)階段能力要求兩個(gè)年級(jí)以上。
水平1(1分):潛在任務(wù)幾乎無(wú)法促進(jìn)學(xué)生對(duì)于數(shù)學(xué)概念、公式、規(guī)則和性質(zhì)的識(shí)記和理解。任務(wù)不要求學(xué)生建立概念、公式、規(guī)則和性質(zhì)間的聯(lián)系。
例如題目:下圖中每個(gè)圖形均由邊長(zhǎng)為1的正六邊形拼成,計(jì)算前四個(gè)圖形的周長(zhǎng),不畫(huà)圖推斷第5個(gè)圖形和第10個(gè)圖形的周長(zhǎng)。
分析:該任務(wù)要求學(xué)生根據(jù)圖形找規(guī)律,依舊停留在對(duì)學(xué)生具體形象思維的要求階段,并未要求學(xué)生證明或推廣規(guī)律至一般化,也未要求學(xué)生給出數(shù)學(xué)解釋或理由,因此處于“任務(wù)潛能”指標(biāo)的水平3。若題目要求學(xué)生給出第N個(gè)圖形的周長(zhǎng),并給以證明,加強(qiáng)對(duì)學(xué)生抽象思維的培養(yǎng)和拓展,則此任務(wù)在“任務(wù)潛能”方面能達(dá)到水平4。
IQA采用科學(xué)嚴(yán)格的評(píng)分者培訓(xùn)流程和標(biāo)準(zhǔn)化的評(píng)估體系,并詳細(xì)列舉不同水平的行為表現(xiàn)和相近水平的區(qū)別,使評(píng)分者充分理解其評(píng)估維度與要點(diǎn),保證教學(xué)質(zhì)量評(píng)估過(guò)程中的可信度和有效性。已有研究表明,IQA在使用過(guò)程中具有良好的內(nèi)部一致性,能夠反映被測(cè)評(píng)教師教學(xué)的水平。①Lindsay Clare Matsumura, Sharon Cadman Slater, Mikyung Kim Wolf, Amy Crosson, Allison Levison, Maureen Peterson,Lauren Resnick. Using the Instructional Quality Assessment Toolkit to Investigate the Quality of Reading Comprehension Assignments and Student Work[R]. National Center for Research on Evaluation, Standards, and Student Testing (CRESST), Los Angeles, CA.2006: 1-57.②Anne Garrison Wilhelm, Sungyeun Kim. Generalizing From Observations of Mathematics Teachers’ Instructional Practice Using the Instructional Quality Assessment[J]. Journal for Research in Mathematics Education, 2015, 46(3): 270-279.
美國(guó)IQA教學(xué)質(zhì)量評(píng)估系統(tǒng)以“四個(gè)中心”為基礎(chǔ),從任務(wù)認(rèn)知需求、解釋性話語(yǔ)和教師期望三個(gè)維度(包括10個(gè)觀測(cè)點(diǎn))出發(fā)評(píng)價(jià)教師教學(xué)質(zhì)量,聚焦影響教學(xué)質(zhì)量的關(guān)鍵屬性。教學(xué)發(fā)生場(chǎng)所為課堂,包括教師講授、師生互動(dòng)、生生互動(dòng)等多種行為表現(xiàn),具有復(fù)雜的情境性和社會(huì)性,包羅要素繁雜。IQA評(píng)估框架注重教學(xué)實(shí)質(zhì),剔除形式化的教學(xué)表現(xiàn)(如是否使用多媒體技術(shù)、是否組織小組活動(dòng))為評(píng)估切入點(diǎn),弱化無(wú)法直接體現(xiàn)學(xué)生思維發(fā)展和知識(shí)獲得的觀測(cè)點(diǎn),以學(xué)生產(chǎn)出為導(dǎo)向,聚焦少數(shù)起決定因素的關(guān)鍵評(píng)估要點(diǎn)?!吧俣钡脑u(píng)估要點(diǎn)能夠幫助評(píng)估者更為準(zhǔn)確掌握評(píng)價(jià)標(biāo)準(zhǔn),在稍縱即逝的課堂教學(xué)活動(dòng)中快速判斷教學(xué)水平,提高評(píng)估工具的信效度。同時(shí),也能夠幫助教師更好理解教學(xué)意義,提升學(xué)生能力發(fā)展水平。
美國(guó)IQA教學(xué)評(píng)估是一個(gè)“分科化”的評(píng)價(jià)系統(tǒng),它針對(duì)不同學(xué)科分別研制相應(yīng)的評(píng)分標(biāo)準(zhǔn),每個(gè)學(xué)科教學(xué)質(zhì)量的評(píng)估都擁有其獨(dú)有的“學(xué)科性”特質(zhì),使評(píng)估能夠更為準(zhǔn)確、科學(xué)地反映不同學(xué)科教師在各自學(xué)科的教學(xué)情況。IQA評(píng)分者要求具有一定的相關(guān)學(xué)科背景知識(shí),經(jīng)過(guò)嚴(yán)格的培訓(xùn)和資格認(rèn)定后才能正式成為IQA評(píng)估者。IQA手冊(cè)含有豐富詳細(xì)的評(píng)估實(shí)例,用于描述每個(gè)水平的表現(xiàn)形式和觀測(cè)依據(jù)、解釋相近水平的差異特征。在IQA正式投入使用前,共有124名學(xué)科專(zhuān)家對(duì)評(píng)估框架的合理性和有效性進(jìn)行審核;超過(guò)200名教師作為預(yù)研究對(duì)象,研究結(jié)果顯示IQA具有良好的評(píng)分者內(nèi)部一致性,并且能夠真實(shí)客觀反映所評(píng)估學(xué)科的教學(xué)質(zhì)量。③Brian Junker, Yanna Weisberg, Lindsay Clare Matsumura, Amy Crosson, Mikyung Kim Wolf, Allison Levison, Lauren Resnick.Overview of the Instructional Quality Assessment[R]. The Regents of the University of California, 2006: 14-29.專(zhuān)業(yè)化的評(píng)估工具和科學(xué)嚴(yán)謹(jǐn)?shù)氖褂昧鞒瘫WC了評(píng)分系統(tǒng)的信效度,加強(qiáng)了評(píng)價(jià)效果的科學(xué)性與權(quán)威性。
評(píng)估系統(tǒng)將課堂觀察、訪談、問(wèn)卷和作品分析等方法相結(jié)合,利用“三角互證”的思想搜集評(píng)估證據(jù),力求保證評(píng)估信息的全面真實(shí)性。研究表明,教師在被隨機(jī)抽取的某一節(jié)課中的表現(xiàn),往往難以全方位展現(xiàn)其真正的教學(xué)水平,被評(píng)估的課越多,教師的教學(xué)表現(xiàn)越趨于穩(wěn)定,但若增加其他相關(guān)資料加以輔助評(píng)估,則可在一定程度上降低評(píng)估的課時(shí)數(shù)。①Clare, L., Aschbacher, P. Exploring the technical quality of using assignments and student work as indicators of classroom practice[J]. Educational Assessment, 2001 (07): 39-59.IQA評(píng)估參評(píng)教師的連續(xù)兩節(jié)課,同時(shí)通過(guò)問(wèn)卷、師生訪談等方式更好了解教學(xué)目標(biāo)、教學(xué)任務(wù)和教學(xué)效果,幫助評(píng)估者快速準(zhǔn)確掌握教學(xué)活動(dòng)目的與表現(xiàn),了解更為真實(shí)的課堂。教師提交的學(xué)生作業(yè)能夠進(jìn)一步反映學(xué)生的思維發(fā)展和知識(shí)獲得,是對(duì)教學(xué)效果的深層次檢驗(yàn)。教師提交學(xué)生作業(yè)低、中、高三個(gè)不同水平的典型案例各兩份,能夠反映教師自身對(duì)任務(wù)所能達(dá)到的不同認(rèn)知需求的理解,了解教師所認(rèn)為的高水平思維表現(xiàn)。多元化的評(píng)估方式,多角度的證據(jù)累積,能夠提高教學(xué)質(zhì)量評(píng)估的真實(shí)度與可靠性。
IQA評(píng)估系統(tǒng)研發(fā)的初衷便是為了解決教育評(píng)價(jià)界中存在的工具單一診斷性目的,而面向評(píng)估系統(tǒng)帶來(lái)的改善性和導(dǎo)向性功能。IQA使用原則中要求評(píng)估不僅是對(duì)教師教學(xué)質(zhì)量的考核,應(yīng)主要基于提高教師教學(xué)能力的發(fā)展性目的,被評(píng)估教師能夠通過(guò)評(píng)估框架、評(píng)估過(guò)程與結(jié)果清楚了解自身教學(xué)存在的優(yōu)勢(shì)和不足,明確提升的目標(biāo)與方向。教師可通過(guò)IQA評(píng)估要點(diǎn)了解優(yōu)秀課堂教學(xué)的行為表現(xiàn),利用豐富的不同維度水平的實(shí)例學(xué)習(xí),尋找自身教學(xué)中存在的差距,例如一位語(yǔ)文教師在提問(wèn)學(xué)生回答時(shí)總會(huì)說(shuō) “你的答案是什么”,在學(xué)生給出答案后便不再追問(wèn),在學(xué)習(xí)IQA評(píng)估手冊(cè)后,他發(fā)現(xiàn)可以利用進(jìn)一步的追問(wèn)如 “你為什么這么說(shuō)”或“關(guān)于這個(gè)問(wèn)題還能夠多說(shuō)一些你的想法么”等,來(lái)鼓勵(lì)學(xué)生充分闡釋答案背后的想法與思考,鍛煉學(xué)生科學(xué)化與邏輯性思維。IQA能夠幫助教師明確教學(xué)手段和策略,使有效的教學(xué)方式成為一種有意識(shí)的教學(xué)行為。研究表明,IQA評(píng)估系統(tǒng)在幫助教師自我測(cè)評(píng),提升專(zhuān)業(yè)能力發(fā)展方面效果顯著。②Dole, J. A. Professional development in reading comprehension instruction. A.P. Sweet, C.E. Snow (Eds.), Rethinking reading comprehension[M]. New York: Guilford Press, 2003: 145-150.
當(dāng)然,任何評(píng)估系統(tǒng)都會(huì)存在自身的局限性,IQA評(píng)估系統(tǒng)在擁有上述優(yōu)勢(shì)的同時(shí),也存在一些不足,主要體現(xiàn)在:(1)IQA采用課堂教學(xué)現(xiàn)場(chǎng)觀察方式進(jìn)行評(píng)估,與視頻錄像相比,雖然前者能夠大幅降低設(shè)備費(fèi)用、后期分析成本、保護(hù)被評(píng)測(cè)教師隱私等,但無(wú)法用于某些教學(xué)片段的反復(fù)推敲,較為依賴(lài)評(píng)估者對(duì)關(guān)鍵信息的捕捉能力;(2)目前已有版本適用科目有限,IQA具有學(xué)科針對(duì)性,不同學(xué)科的系統(tǒng)維度和評(píng)估要點(diǎn)具有一致性,但是一些評(píng)估要點(diǎn)的水平描述會(huì)體現(xiàn)其學(xué)科屬性,IQA評(píng)估學(xué)科的廣泛性還需進(jìn)一步拓展;(3)IQA采用與學(xué)生學(xué)習(xí)表現(xiàn)直接相關(guān)的維度作為評(píng)估指標(biāo),精要的評(píng)估指標(biāo)提高了該工具的信度和可操作性,但是難以對(duì)教學(xué)細(xì)節(jié)做到準(zhǔn)確的呈現(xiàn)與刻畫(huà),如教師語(yǔ)言是否存在科學(xué)性錯(cuò)誤、教師板書(shū)呈現(xiàn)是否合理、教師提問(wèn)是否清晰明確等;(4)IQA需要研究者觀察參評(píng)被評(píng)估教師連續(xù)至少兩節(jié)課(每節(jié)課約45分鐘)的現(xiàn)場(chǎng)教學(xué),再結(jié)合訪談、問(wèn)卷、作品分析等多元化相關(guān)資料,呈現(xiàn)被評(píng)估教師教學(xué)質(zhì)量的具體分析報(bào)告。這導(dǎo)致該評(píng)估工具難以適用于教學(xué)時(shí)長(zhǎng)較短(一般介于15-45分鐘)的教師技能大賽,在一定程度下限制了IQA評(píng)估工具的實(shí)際推廣度。
教學(xué)質(zhì)量評(píng)估應(yīng)聚焦于能夠反映教學(xué)實(shí)質(zhì)的維度和指標(biāo),剔除形式化非本質(zhì)的行為觀測(cè)。評(píng)估要點(diǎn)“少而精”的優(yōu)勢(shì)在于,一方面幫助評(píng)估者快速精準(zhǔn)把握課堂教學(xué)質(zhì)量,提高評(píng)估信效度;另一方面幫助被評(píng)測(cè)教師有針對(duì)性地了解自身教學(xué)表現(xiàn),理解“什么是一堂好課”的本質(zhì),將評(píng)估要點(diǎn)貫穿于教學(xué)設(shè)計(jì)、教學(xué)實(shí)施和反思之中。心理學(xué)研究表明,繁瑣復(fù)雜的評(píng)估指標(biāo)不利于人類(lèi)記憶和使用,會(huì)在一定程度上降低其推廣性和使用成效。①Alan H. Schoenfeld, Robert Floden, Fady El Chidiac, Dennis Gillingham, Heather Fink, Sihua Hu, Alyssa Sayavedra, Anna Weltman, Anna Zarkh. On Classroom Observations[J]. Journal for STEM Education Research, 2018, (01): 34-59.目前我國(guó)的教學(xué)評(píng)估系統(tǒng)正處于快速發(fā)展中,評(píng)估指標(biāo)依然存在如下問(wèn)題:一是評(píng)價(jià)維度基本是對(duì)教學(xué)過(guò)程要素的分解,將“教學(xué)目標(biāo)”“教學(xué)內(nèi)容”“教學(xué)方法”“教學(xué)過(guò)程”等評(píng)價(jià)指標(biāo)簡(jiǎn)單羅列,看似覆蓋了課堂教學(xué)的方方面面,但是卻沒(méi)有抓住有意義教學(xué)的本質(zhì)特點(diǎn),不能很好揭示各個(gè)指標(biāo)間的內(nèi)在聯(lián)系,難以體現(xiàn)教學(xué)的整體效果;二是評(píng)價(jià)子維度過(guò)多且繁雜,有的評(píng)估系統(tǒng)甚至包含50個(gè)以上評(píng)估要點(diǎn),②陳佑清, 陶濤.“以學(xué)評(píng)教”的課堂教學(xué)評(píng)價(jià)指標(biāo)設(shè)計(jì)[J].課程?教材?教法, 2016, 36(01): 45-52.③郝志軍. 中小學(xué)課堂教學(xué)評(píng)價(jià)的反思與建構(gòu)[J].教育研究, 2015(02): 110-115.容易造成評(píng)分者脫離評(píng)分具體指標(biāo),依靠原有經(jīng)驗(yàn)打分,失去評(píng)分指標(biāo)體系的意義和價(jià)值。我國(guó)可以借鑒IQA教學(xué)質(zhì)量評(píng)估系統(tǒng)的指標(biāo)設(shè)計(jì),縮減精華評(píng)估指標(biāo),抓住教學(xué)本質(zhì),突出教學(xué)有效性,提高評(píng)估系統(tǒng)的可操作性和應(yīng)用價(jià)值。
不同學(xué)科的優(yōu)質(zhì)課堂教學(xué)存在一定共性,如鼓勵(lì)激發(fā)學(xué)生深層次思考,培養(yǎng)學(xué)生表達(dá)交流能力等,但也都具有其學(xué)科的獨(dú)特屬性和核心素養(yǎng),如數(shù)學(xué)能夠鍛煉學(xué)生運(yùn)算能力,語(yǔ)文則需要培養(yǎng)學(xué)生的文化傳承與理解。分科化的評(píng)估工具能夠更為精準(zhǔn)地把握所評(píng)估學(xué)科的教學(xué)質(zhì)量,通過(guò)對(duì)評(píng)估要點(diǎn)不同水平的具體學(xué)科表現(xiàn)描述,使評(píng)估具有更強(qiáng)的專(zhuān)業(yè)性和可操作性。我國(guó)現(xiàn)有的教學(xué)質(zhì)量評(píng)估系統(tǒng)多數(shù)不具有學(xué)科特色,④韓繼偉, 張曉霞. 美國(guó)教師教育專(zhuān)業(yè)認(rèn)證及啟示[J].數(shù)學(xué)教育學(xué)報(bào), 2018, 27(02): 3-9.這就使得評(píng)價(jià)工具看似學(xué)科普遍性很高,適用范圍很廣,實(shí)則難以把握學(xué)科特有育人價(jià)值和核心能力培養(yǎng),削減評(píng)估結(jié)果的專(zhuān)業(yè)化價(jià)值。除此之外,我國(guó)教學(xué)水平評(píng)價(jià)者存在學(xué)科專(zhuān)業(yè)化程度不高的現(xiàn)象。正如沒(méi)有人能夠教自己不熟悉的知識(shí)一樣,也沒(méi)有人能評(píng)價(jià)自己不了解的學(xué)科。①黃曉, 孫麗偉. 小學(xué)科學(xué)教學(xué)設(shè)計(jì)的規(guī)范化和學(xué)科化[J]. 全球教育展望, 2014(04): 111-120.因此,需要具有所評(píng)學(xué)科專(zhuān)業(yè)背景的人員,在經(jīng)過(guò)嚴(yán)格的評(píng)估培訓(xùn)、對(duì)學(xué)科知識(shí)有深層次把握后,方可合理使用分科化的評(píng)估工具,保障評(píng)估結(jié)果的專(zhuān)業(yè)性和權(quán)威性。
我國(guó)目前對(duì)課堂教學(xué)質(zhì)量的評(píng)估方式主要有以下四種:以學(xué)生學(xué)業(yè)成就為導(dǎo)向的結(jié)果性評(píng)價(jià)、教師教學(xué)能力水平紙筆測(cè)試、學(xué)生對(duì)教師教學(xué)評(píng)價(jià)的問(wèn)卷測(cè)量和課堂教學(xué)觀察。②趙軒. 基于多元化理論的中小學(xué)教師資格考試數(shù)學(xué)學(xué)科試卷質(zhì)量分析[J]. 數(shù)學(xué)教育學(xué)報(bào), 2018, 27(02): 38-40.學(xué)業(yè)成就的結(jié)果性評(píng)價(jià)無(wú)法反映教學(xué)發(fā)生的真實(shí)過(guò)程,難以對(duì)教師教學(xué)提供有效反饋和指導(dǎo),且容易讓教師為了提高學(xué)生分?jǐn)?shù)而采用“應(yīng)試”教學(xué),不利于學(xué)生素養(yǎng)的全面發(fā)展;教學(xué)能力水平紙筆測(cè)試則更多考察知識(shí)點(diǎn)和結(jié)論性?xún)?nèi)容,教師對(duì)學(xué)科內(nèi)容的熟練掌握和教學(xué)理論的清晰解讀,與其課堂教學(xué)實(shí)施能力有時(shí)并不具有一致性。課堂教學(xué)考察的是教師在實(shí)際情境中,對(duì)學(xué)科內(nèi)容知識(shí)、教學(xué)法知識(shí)、學(xué)習(xí)者知識(shí)等的綜合運(yùn)用能力,無(wú)法脫離真實(shí)教學(xué)場(chǎng)景的存在;單一學(xué)生視角的問(wèn)卷測(cè)評(píng),由于受限于學(xué)生自身知識(shí)水平、學(xué)習(xí)經(jīng)驗(yàn)和主觀感受等因素,難以保證對(duì)教師教學(xué)水平的真實(shí)呈現(xiàn)。以課堂觀察為基礎(chǔ)進(jìn)行教學(xué)評(píng)估,輔以專(zhuān)業(yè)的評(píng)估團(tuán)隊(duì),采用多元化的評(píng)價(jià)方法,才能保證教師教學(xué)水平的真實(shí)展現(xiàn),維持評(píng)價(jià)的內(nèi)在價(jià)值。可以考慮借鑒IQA的評(píng)估模式,以課堂觀察為主體,同時(shí)采用訪談、問(wèn)卷、作品分析等多元化的方式,從不同角度搜集評(píng)估證據(jù),幫助評(píng)估者了解更為真實(shí)的課堂行為,包括行為背后的原因、行為效果等,結(jié)合評(píng)估框架對(duì)教師教學(xué)表現(xiàn)給出準(zhǔn)確合理判斷。
美國(guó)IQA教學(xué)質(zhì)量評(píng)估系統(tǒng)著重于提升教師課堂教學(xué)實(shí)踐能力的發(fā)展性評(píng)價(jià)。近年來(lái),教育測(cè)評(píng)的評(píng)估理念逐漸由“對(duì)學(xué)習(xí)的評(píng)價(jià)(Assessment of Learning)”,轉(zhuǎn)變?yōu)?“促進(jìn)學(xué)習(xí)的評(píng)價(jià)(Assessment for Learning)”③Assessment Reform Group. Assessment for Learning: 10 Principles-research-based Principles to Guide Classroom Practice[EB/OL]. [2020-02-18]. http://k1.ioe.ac.uk/tlrp/arg/CIE3.和“評(píng)價(jià)即學(xué)習(xí)(Assessment is Learning)”。④Alonso-Tapia, Jesus, Garrido-Hernansaiz, Helena. Assessment for Learning: Assessment of Non-Written Sources Understanding[J].Electronic Journal of Research in Educational Psychology, 2017, 15(01): 168-182.教學(xué)評(píng)價(jià)不再僅是教師評(píng)比、晉升的手段,研究者普遍意識(shí)到其改善發(fā)展性功能,使之成為教師專(zhuān)業(yè)成長(zhǎng)的必要助力。⑤鐘啟泉. 課堂評(píng)價(jià)的挑戰(zhàn)[J].全球教育展望, 2012(01): 10-16.課堂教學(xué)評(píng)價(jià)標(biāo)準(zhǔn)構(gòu)建的合理性標(biāo)準(zhǔn)在于對(duì)課堂教學(xué)實(shí)踐具有很強(qiáng)的解釋力和指導(dǎo)力。⑥裴娣娜. 論我國(guó)課堂教學(xué)質(zhì)量評(píng)價(jià)觀的重要轉(zhuǎn)換[J].教育研究, 2018(01): 17-29.我國(guó)在開(kāi)發(fā)研制教學(xué)質(zhì)量評(píng)估系統(tǒng)時(shí)應(yīng)始終貫穿“以評(píng)促教,評(píng)價(jià)即學(xué)習(xí)”的理念,將提高教師專(zhuān)業(yè)發(fā)展作為評(píng)價(jià)的首要目標(biāo)。首先,評(píng)價(jià)指標(biāo)要去形式化,注重教學(xué)質(zhì)量本質(zhì),加強(qiáng)對(duì)教師專(zhuān)業(yè)發(fā)展的導(dǎo)向性;其次,評(píng)估要點(diǎn)的不同水平要包含豐富詳細(xì)的實(shí)例,在幫助教師利用評(píng)估系統(tǒng)進(jìn)行合理自評(píng)的同時(shí),指明更高水平的行為表現(xiàn),作為教師教學(xué)改進(jìn)方向和指導(dǎo)依據(jù);最后,參評(píng)教師要在評(píng)估者的幫助下理解評(píng)估理念與目的,避免“作秀式”課堂,充分利用評(píng)價(jià)過(guò)程剖析自身教學(xué)上的優(yōu)勢(shì)與不足,進(jìn)行深度教學(xué)反思,提升教師專(zhuān)業(yè)發(fā)展。