摘? ?要?評價量表的出現(xiàn)源自于表現(xiàn)性評價的興起,是一種基于學(xué)生能力表現(xiàn)的評價工具。國外對評價量表的研究已有二三十年的歷史,形成了數(shù)量可觀的研究成果,并在教學(xué)實踐中被大量運用;在國內(nèi),評價量表是隨著信息化教育改革的浪潮和新一輪基礎(chǔ)教育課程改革的號角在世紀(jì)之交進(jìn)入到教育研究視野的,時至今日雖已過去十多年的時間,但對其研究和使用依然沒有太大起色,其在教學(xué)評價中的獨特功能并未得到充分彰顯,為此有必要重新審視和關(guān)注它。
關(guān)鍵詞 評價量表? 表現(xiàn)性評價? 能力表現(xiàn)? 評價工具
評價量表的英文譯為“Rubric”,原意為“紅土”“紅壤(土壤)”,在中世紀(jì)是指用紅墨水寫在各種手稿中的標(biāo)志,在禮拜儀式的文檔中,紅色標(biāo)記可以指明贊美詩該如何唱或者宗教儀式該如何進(jìn)行。后在法律公文中,紅色的文字通常表示一部法典的標(biāo)題,由此“Rubric”開始意指任何簡要、權(quán)威的規(guī)則[1]。引入到教育領(lǐng)域后,其被賦予了特殊的評價內(nèi)涵——權(quán)威性的規(guī)則,在實際應(yīng)用中主要是以二維矩形表格的形式出現(xiàn)。
一、評價量表產(chǎn)生的背景與內(nèi)涵
1.評價量表產(chǎn)生的背景
20世紀(jì)70年代以來,隨著對課程改革運動的深入反思,傳統(tǒng)的評價方式在美國受到了猛烈的攻擊,標(biāo)準(zhǔn)化的測試也被廣為詬病,具體表現(xiàn)在:只重視事實性等低級知識的測量,而在學(xué)生高級知識比如批判性思維和解決問題能力等方面顯得無能為力;無法測量出學(xué)生在主題性、綜合性、探究性、復(fù)雜性等活動中的學(xué)習(xí)經(jīng)驗;只重視學(xué)生學(xué)習(xí)結(jié)果的測量而忽視學(xué)習(xí)過程和學(xué)習(xí)進(jìn)步的測量,只重視教師對學(xué)生的評價而缺乏學(xué)生的自評和互評;只呈現(xiàn)評價結(jié)果,而不能呈現(xiàn)學(xué)習(xí)的優(yōu)點和不足,學(xué)生難以得到有效的反饋,不利于今后的學(xué)習(xí)改進(jìn)[2]。這種“為測試而教學(xué)”的評價觀最終被建構(gòu)的教育評價觀所取代,這就是美國評價專家古巴(E.G.Guba)和林肯(Y.S.Lincoln)所說的“第四代評價”。
20世紀(jì)80年代以來,在建構(gòu)替代標(biāo)準(zhǔn)化測試評價方式的過程中出現(xiàn)了諸如替代性評價(alternative assessment)、表現(xiàn)性評價(performance assessment)、真實性評價(authentic assessment)等一些新的評價方法。盡管其稱謂各不相同,強調(diào)的側(cè)重點也各有差異,但它們都“試圖從固定反應(yīng)、機(jī)器評分的測驗,轉(zhuǎn)向使用要求學(xué)生構(gòu)建某種反應(yīng)、通過人的主觀判斷進(jìn)行評分的任務(wù)”[3]。新的評價方式需要新的評價工具來承載落實,評價量表應(yīng)運而生。
在國內(nèi),評價量表真正進(jìn)入到研究者的視野是在世紀(jì)之交。20世紀(jì)90年代以來,信息化浪潮席卷全球,以教育信息化帶動教育現(xiàn)代化成為我國面向21世紀(jì)教育改革發(fā)展的重要抉擇。以現(xiàn)代教育技術(shù)為基礎(chǔ)的信息化教育帶來了教育領(lǐng)域全方位的深刻變革,教學(xué)中強調(diào)“以生為本”“以學(xué)為中心”,注重培養(yǎng)學(xué)生的綜合實踐能力和創(chuàng)新精神。面對新的教學(xué)情境,傳統(tǒng)的評價方式已經(jīng)無法勝任,迫切需要與信息化教學(xué)設(shè)計相適應(yīng)的新的評價方式。新一輪基礎(chǔ)教育課程改革也在《基礎(chǔ)教育課程改革綱要(試行)》中明確提出“改變課程評價過分強調(diào)甄別與選拔的功能,發(fā)揮評價促進(jìn)學(xué)生發(fā)展、教師提高和改進(jìn)教學(xué)實踐的功能”,評價理念和評價方式的轉(zhuǎn)變促成了評價量表在教育領(lǐng)域中的興起。
2.評價量表的內(nèi)涵
關(guān)于評價量表的內(nèi)涵,國內(nèi)外的研究者給出了諸多不同的解釋。例如“評價量表是一個評估工具,使用明確規(guī)定的評價標(biāo)準(zhǔn)和熟練水平來衡量學(xué)生在這些標(biāo)準(zhǔn)上的學(xué)業(yè)成就。根據(jù)學(xué)生能夠做什么,描述了學(xué)生在每一個水平上的表現(xiàn)。評價量表幫助教師測量學(xué)生學(xué)習(xí)的成果、進(jìn)步和過程。同時,清楚地和學(xué)生交流各領(lǐng)域?qū)W術(shù)成就的標(biāo)準(zhǔn)”[4]。再例如,“評價量表是一種評分工具,描述的是對某項任務(wù)的具體期望。評價量表將任務(wù)分成多個組成部分,并對每個部分合格或不合格的表現(xiàn)進(jìn)行了詳細(xì)的描述。評價量表可用于多種任務(wù),包括研究論文、書評、討論、實驗報告、檔案、小組活動、口頭陳述等”[5]。從中可以得出評價量表是一種評價工具或評分指南,用于評判學(xué)生學(xué)習(xí)作品、學(xué)習(xí)過程和學(xué)習(xí)成就等方面的學(xué)習(xí)表現(xiàn),特別適用于表現(xiàn)性評價。評價量表是一種結(jié)構(gòu)化的等級評價,具體描述了學(xué)生在不同水平上的實際表現(xiàn),一般由評價指標(biāo)、等級水平和表現(xiàn)描述以及具體樣例等部分構(gòu)成。
二、評價量表的特點和類型
1.評價量表的特點
評價量表是繼黑板發(fā)明之后最方便的教具之一,與其他的評價工具相比具有鮮明的特點,具體表現(xiàn)在:
從教師的角度來看,通過制定評價量表,可以幫助自己更加明確教學(xué)的目標(biāo)和任務(wù),進(jìn)一步優(yōu)化教學(xué)設(shè)計,提高教學(xué)質(zhì)量;在與其他教師協(xié)作開發(fā)評價量表的過程中,通過協(xié)商交流,觀點碰撞,可以分享各自經(jīng)驗心得,促進(jìn)專業(yè)發(fā)展;通過運用評價量表,能夠保證評價結(jié)果的前后一致性,評價標(biāo)準(zhǔn)的公開化也能確保評價過程的客觀、公正,避免“暗箱操作”;運用評價量表可以減輕教師的負(fù)擔(dān)和壓力,避免了簡單打分的模糊性和編寫評語的繁瑣性,能夠提供及時反饋,提高工作效率。
從學(xué)生的角度來說,評價量表的出現(xiàn)能夠幫助其明確學(xué)習(xí)任務(wù),聚焦學(xué)習(xí)目標(biāo);學(xué)生可以對自己的學(xué)習(xí)有更為詳細(xì)的了解,清楚自己的優(yōu)缺點和努力方向;在結(jié)合評價量表反觀自己的學(xué)習(xí)狀況時,能夠激發(fā)自我反思和自我完善的動力,并能提高自我評價能力;學(xué)生參與或部分參與評價量表的制定和完善工作,有助于發(fā)揮其在評價活動中的主體性,提高其在評價過程中的主人翁意識,增強學(xué)習(xí)的干勁。
從評價本身來說,評價量表以評價標(biāo)準(zhǔn)為核心,以教學(xué)目標(biāo)為導(dǎo)向,有利于促進(jìn)基于標(biāo)準(zhǔn)的教學(xué)實施;評價的主體由以前教師單一主導(dǎo)變成現(xiàn)在教師評價、學(xué)生自評、同伴互評等多元評價相互參照;評價的方式由單一的紙筆測試變成紙筆測試和“觀察資料(observations)”“表現(xiàn)樣本(performance sample)等多種評價方式相結(jié)合;同時,評價量表淡化了評價的甄別與選拔功能,強化對學(xué)習(xí)的促進(jìn)和反饋功能。
總之,“評價量表的核心是一次重大的權(quán)力再分配,也是學(xué)術(shù)界對教育方式的一次重要界定和指導(dǎo)。這種權(quán)力再分配始于課堂,其中教師使用評價量表賦予學(xué)生訪問的權(quán)力,讓他們更好地了解教師的期望,并讓他們進(jìn)一步參與自身學(xué)習(xí)以實現(xiàn)這些期望。從個人層面上看,這種再分配也能幫助教師記錄自身的進(jìn)步”[5]。
2.評價量表的類型
評價量表大致可以分為整體型評價量表和分析型評價量表兩種。整體型評價量表(holistic rubric)是把學(xué)生的學(xué)習(xí)表現(xiàn)或成果的重要因素綜合起來,給出一個整體的評價。其優(yōu)勢是評價簡單的成果或表現(xiàn),快速獲得對總體水平或整體成績的評定,對成果或表現(xiàn)給出“印象分”;缺點是缺乏對成果或表現(xiàn)的詳細(xì)分析,起不到診斷與反饋作用,不能很好地區(qū)分學(xué)生的能力差別。其基本樣式見表1[6]。
分析型評價量表(analytic rubric)是把學(xué)生的學(xué)習(xí)成果或表現(xiàn)分解成基本的要素或維度,對它們分別做出評價。分析型評價量表特別適用于評價復(fù)雜的任務(wù)表現(xiàn),能提供更有針對性的反饋信息,便于更好地改進(jìn);缺點是所需的時間比較長,評價的效率和可信度難以保證。其基本樣式見表2[7]。
整體型評價量表與分析型評價量表各有優(yōu)缺點,在具體的使用過程可以根據(jù)實際需要,靈活選用,充分發(fā)揮各自在評價中的優(yōu)勢。
三、評價量表的適用條件和具體開發(fā)
1.評價量表的適用條件
評價量表源于表現(xiàn)性評價的興起,所謂表現(xiàn)性評價“就是讓學(xué)生參與一些活動,要求他們實際表現(xiàn)出某種特定的表現(xiàn)性技能,或者創(chuàng)建出符合某種標(biāo)準(zhǔn)的成果或作品。簡言之,就是我們在學(xué)生執(zhí)行具體的操作時直接觀察和評價他們的表現(xiàn)”[8]。表現(xiàn)性評價的優(yōu)勢非常明顯:可以對涉及校內(nèi)外自然情境中復(fù)雜表現(xiàn)的教學(xué)目標(biāo)的實現(xiàn)情況進(jìn)行評價;可以測量用其他方法無法測量的復(fù)雜的學(xué)習(xí)結(jié)果;不僅能評價完成任務(wù)的結(jié)果,還能評價任務(wù)完成的過程;體現(xiàn)了現(xiàn)代學(xué)習(xí)理論,把學(xué)生看作是意義建構(gòu)的積極參與者,而非分散知識的接受者[3]。當(dāng)然表現(xiàn)性評價也存在明顯的局限性,集中體現(xiàn)在評價結(jié)果的不一致上,因此需要制定明確的評價標(biāo)準(zhǔn)來確保評價結(jié)果的客觀、公正,于是評價量表便成為表現(xiàn)性評價的重要組成部分,也是表現(xiàn)性評價設(shè)計中的關(guān)鍵一環(huán)。
由此可見,評價量表主要適用于學(xué)生的能力表現(xiàn)評價,這里的能力更多的是一種高水平的、復(fù)雜的、綜合性的思維能力以及思考問題、解決問題的實踐能力。在紙筆測試中,主要體現(xiàn)在建構(gòu)反應(yīng)題型上,題目的答案往往是開放性的,用以考查學(xué)生的思維過程和結(jié)果,反映其認(rèn)知水平的差異和特點;另外還體現(xiàn)在“觀察資料(observations)”和“表現(xiàn)樣本(performance sample)”等其他評價方式中。
2.評價量表的具體開發(fā)
評價量表的開發(fā)大致有兩條路徑:一條是對現(xiàn)有的評價量表進(jìn)行借鑒和改造,使其為我所用;另一條是根據(jù)評價目標(biāo)和任務(wù),結(jié)合評價量表的特點開發(fā)新的量表。目前網(wǎng)絡(luò)上有許多專業(yè)的評價量表網(wǎng)站,其中有各種形式的評價量表,可以根據(jù)需要有選擇地借鑒使用。如果沒有合適的評價量表,就需要自己或者與同事包括學(xué)生共同開發(fā)了。
評價量表的開發(fā)主要有兩種基本模式:自上而下式和自下而上式。所謂自上而下式就是從評價的目標(biāo)和任務(wù)出發(fā),采用演繹的思維方式,從抽象到具體。具體的內(nèi)容和環(huán)節(jié)包括:確定評價的任務(wù);明確任務(wù)中的要素;確定出各要素的特征;描述出代表各要素的不同水平;選擇評價量表的類型;制訂、修改評價量表。所謂自下而上式是指從分析學(xué)生的具體表現(xiàn)或作品入手,采用歸納的思維方式,由具體到抽象。具體的內(nèi)容和環(huán)節(jié)包括:收集并分析學(xué)生的作品;分類不同作品;明確分類的依據(jù)和要素;確定不同的水平;選擇評價量表的類型;制訂和修改評價量表[9]。當(dāng)然在實際的開發(fā)過程中,并沒有嚴(yán)格的規(guī)定限制,也不必拘泥于某種固定的程序,一切以目標(biāo)要求和實際需要為依據(jù),必要時可以將兩種模式結(jié)合起來使用。
在開發(fā)評價量表時,需要注意以下事項:
(1)對標(biāo)準(zhǔn)的描述要具體、明確、易懂,避免使用模糊、籠統(tǒng)的語句,既不利于學(xué)習(xí)指導(dǎo),也不利于評價判別。
(2)水平等級的劃分不宜過多,一般3~5個層次即可,否則過多的層級劃分,難以保證有效的區(qū)分度;在進(jìn)行水平等級的劃分時,首先確定最高等級和最低等級的表現(xiàn)特征,然后再確定中間等級水平的描述,可以試著采用“是”“是,但是”“不,但是”“不”的邏輯思路來進(jìn)行定級描述。
(3)評價指標(biāo)不宜過多,過多的評價指標(biāo)容易造成等級劃分的復(fù)雜性,操作起來比較麻煩,同時也難以保證評價量表的針對性和有效性。
(4)避免使用消極、否定的語言,總體上要用積極、肯定的語句對各等級的水平表現(xiàn)進(jìn)行描述,這既有利于鼓勵學(xué)生以積極的心態(tài)投入到學(xué)習(xí)中去,也能體現(xiàn)表現(xiàn)性評價的真正內(nèi)涵。
參考文獻(xiàn)
[1] Edward P.Asmus.(1999).Rubrics:Definition,Benefits,History and Types https://www.music.miami.edu/assessment/rubricsDef.html,2016-05-03.
[2] 邵朝友.評分規(guī)則開發(fā)與應(yīng)用研究[D].上海:華東師范大學(xué),2007.
[3] Robert L.Linn & Norman E.Gronlund.教學(xué)中的測驗與評價[M].國家基礎(chǔ)教育課程改革“促進(jìn)教師發(fā)展與學(xué)生成長的評價研究”項目組,譯.北京:中國輕工業(yè)出版社,2003.
[4] Montgomery K.Classroom rubrics: Systematizing what teachers do naturally[J].The Clearing House, 2000,73(06).
[5] Dannelle D.Stevens,Antonia J.Levi.評價量表:快捷有效的教學(xué)評價工具:第2版[M].陳定剛,譯.廣州:華南師范大學(xué)出版社,2014.
[6] 李桂琴.信息化教學(xué)評價量規(guī)的設(shè)計及應(yīng)用研究[D].南京:南京師范大學(xué),2005.
[7] 閆寒冰.信息化教學(xué)評價——實用量規(guī)工具[M].北京:高等教育出版社,2003.
[8] RichardJ.Stiggins.促進(jìn)學(xué)習(xí)的學(xué)生參與式課堂評價:第四版[M].國家基礎(chǔ)教育課程改革“促進(jìn)教師發(fā)展與學(xué)生成長的評價研究”項目組,譯.北京:中國輕工業(yè)出版社,2005.
[9] 崔允漷,王少非,夏雪梅.基于標(biāo)準(zhǔn)的學(xué)生學(xué)業(yè)成就評價[M].上海:華東師范大學(xué)出版社,2008.
[作者:張所帥(1978-),男,山東青島人,海南師范大學(xué)文學(xué)院副教授。]
【責(zé)任編輯? ?楊? 子】