“表現(xiàn)評價”是相對于心理與教育測驗的主流——正式評價(即標準化正式測驗)的一種評價方式,它針對“正式評價”的偏失而設計,與其他如變通性評價(alternative assessment)、真實評價(authentic assessment)、檔案評價(portfolio assessment)等被統(tǒng)稱為“另類評價”或“非正式評價”,其英文為performance assessment。
所謂表現(xiàn)評價就是在學生完成一系列任務(如實驗、辯論、調查等)的過程中,通過觀察、記錄和分析學生在各項學習活動中的表現(xiàn),對學生的參與意識、合作精神、實驗操作技能、探究能力、分析問題的思路、知識的理解和應用水平以及表達交流技能等進行多方位評價的一種評價方法[1]。
表現(xiàn)評價有七方面的特點:1.評價問題情境的真實性。2.評價內容的開放性、綜合性、多層面性。3.評價標準的預先公開性。4.評價的主觀性。5.評價的互助性。6.評價目的多樣性。7.評價主體多元化。
一、表現(xiàn)評價的程式及應用
表現(xiàn)評價因其評價內容的間接測量性、開放性及學習行為的多元性(智力的、思維的、技能的……)而不可能像標準化測驗一樣有一個嚴格的實施方法、步驟,筆者將結合現(xiàn)已取得成功的澳大利亞維多利亞州高考表現(xiàn)性評價的運用對其基本程式進行概括。
澳大利亞維多利亞州高中實行畢業(yè)證書制度,和我國的高中教育有所不同的是學生可在43個學習領域和科目中自由選擇六門并用后兩年時間修完。大部分科目分為四個單元,每單元用一個學期,高校根據(jù)這些科目成績自主錄取學生,主要依據(jù)兩方面:一方面是教師在平時教學過程中實行的校本評價項目,測量學生運用先前所獲得的知識解決新異問題或完成特定任務的能力,一般由教師在平時的教學中根據(jù)維多利亞州課程評估委員會頒布的標準對科目的第三、第四單元進行評價并以50%的比重計入高考總分,其形式主要包括書面報告、作文、演說、操作、實驗、口頭報告、討論等;另一方面是終結性畢業(yè)統(tǒng)考,和我國高考制度相似,占50%權重?,F(xiàn)以英語為例,簡要介紹其具體實施方法。
英語分四個單元,后兩個單元進行校本評價并計入高考總分,每個單元分兩個項目,僅以第三單元項目一為例詳細說明:
內容:要求學生完成本單元后能論述三篇及以上當前澳大利亞大眾媒體文章涵蓋的思想觀點、體驗和問題。文章可由教師或學生在國家、州或地方電臺、電視節(jié)目、印刷體或電子版報紙、雜志等范圍內進行選擇。學生需完成以下兩項任務:
任務一:對某個問題進行書面分析并提出自己的觀點。任務應在兩個星期內用240~300分鐘完成,字數(shù)為1000~1400字,方式不限。如,學生可呈現(xiàn)200~300字的媒體文章分析和一篇400~500字的簡明觀點論述,也可對三篇媒體文章進行400~500字的整體分析和一篇600~800字的觀點論證文章。評價標準:(1)對所選文章主體內容的了解與運用;(2)對文章思想觀點進行適當有效的探索;(3)文章組織結構的連貫性與有效性;(4)對英語習俗的運用。
任務二:用分析和說明的方式對所選一篇原文進行拓展性書面解釋,或對所選的一篇或以上原文進行有創(chuàng)造性的書面回答,或對所選的兩篇或以上文章涉及的問題進行比較。任務應在一個星期內用120~150分鐘時間完成,字數(shù)為600~800字。評價標準同任務一[2]。
由以上實例可將表現(xiàn)評價的基本程式總結如下:
首先,設計合適的評價任務。要考慮到評價內容的特點、學生的文化背景等因素,設計適當?shù)那榫?,采用適當?shù)娜蝿胀瓿尚问剑缈陬^表述、創(chuàng)作作品、做實驗或調查等。實例中澳大利亞是英語國家,學生英語水平較好,英語學科屬應用性、工具性學科,所以設計為不限情境的創(chuàng)作作品的形式。
其次,確定教學目標及評估標準。根據(jù)教學需要達到的效果及涉及的多元性學習行為(如實例中涉及學生智力的、思維的、檢索能力、有效選擇能力等的活動),制定都能有所反映的評價標準并公開。值得注意的是,制定評價標準時應考慮幾個方面的因素:一是要保持評價時學生處于平常學習的真實情境;二是要考慮各方面可能造成的不公平因素,如學生的語言、文化背景、家庭經(jīng)濟背景、個人不同的學習方式等,盡可能做到公平;三是評價的目的不僅是要甄別學生或評比,更重要的是在評價過程中培養(yǎng)學生的創(chuàng)造、實踐能力、不同的思維方式等科學精神及健康的情感、積極的態(tài)度、科學的價值觀等人文精神;四是制定出來的標準必須具有可操作性和可行性,但不宜過分細化,否則易造成學生機械針對標準而采取相應的“對策”,難以達到預期評價效果。
第三,進行表現(xiàn)評價。按照已經(jīng)確定的目標和標準進行表現(xiàn)評價,最主要的工作是盡量全面地搜集信息,根據(jù)信息對學生作出評價并搜集學生的自評和互評結果。在這個過程中需要注意的是:1、搜集信息的全面性。搜集的信息要全面,甚至包括沒有涉及操作目標的其他信息,因為表現(xiàn)評價的資料應能夠表明學生完成所有操作目標的過程且可到最后分析的時候對評價目標進行支持。沒有足夠的評價信息,教師對學生的評價易出現(xiàn)錯誤或偏差;2、在評價過程中教師應避免選擇使用過多過細的標準,如前所述,這會導致僵化的評價而不能真實反映學生多方面的學習情況;3、教師要避免對學生的偏見及各種心理效應,盡量做到客觀、公平、公正。
二、對表現(xiàn)評價的評析
任何一個評價方法在發(fā)揮自身長處的同時都存在著局限性,正如標準化測驗一直被教育界詬病但仍因其優(yōu)勢被廣泛使用一樣,表現(xiàn)評價雖能在標準化測驗的不足方面充分展現(xiàn)優(yōu)勢,但也不可避免地在其他方面存在劣勢,我們不能要求它是一個完美的評價方式,但我們可以在客觀地認識它的優(yōu)勢和不足的情況下在應用中揚長避短。
1.評價標準
教學評價是一種測量活動,根據(jù)教育測量學的理論,判斷評價方式的優(yōu)劣所依據(jù)的標準應有四項:信度、效度、可操作性和“不偏倚”(absence-of-bias)。
信度指評價結果的可靠程度。如:同一個人用同一種評價方法去評價同一教學現(xiàn)象,每次所得的結果應基本相同,可通過時間、內容和人來測定其可靠性。
效度是指評價的有效程度,即真實性和準確性程度,是某一評價實際上能夠評出所想要評價東西的程度。
可操作性是指評價實施時操作上的難易和時間、空間等的限制程度。一個好的評價方式應有較少的時間、空間等條件限制且易于操作。
“不偏倚”是指評價結果不因被評價者性別、民族、語言、文化背景、家庭經(jīng)濟背景、學習方式等的不同而有所偏差,也就是公平問題。好的評價方式應該讓被評價者和評價者都感到公平。一般在論及教學評價方式時,大多用前三者,很少將“不偏倚”也作為標準來考慮。現(xiàn)代社會是一個多元社會,在經(jīng)濟、政治、文化層面上都表現(xiàn)出多元化趨勢,在各種因素影響下必然會存在很多在教育中處境不利的學生,在教學評價時應盡量減少對他們的生活和健全發(fā)展上的負面影響[3]。
2.評析
(1)信度。由于表現(xiàn)評價關注的主要是學生推理能力的發(fā)展、完成任務時知識技能及情感的運用過程等多層面的包含大量非智力因素的內容,這些內容大多具有間接測量性,表現(xiàn)評價又不能像心理研究時那樣控制各種條件因素進行實驗,而要放在真實的情境中,加上評價本身標準設定不容易一致、評價人員不可避免的主觀因素影響,相對于標準化測驗來說表現(xiàn)評價的信度不易保證。但這些具有高度不確定性的主觀因素可以盡量控制。如通過多人同時觀察和增加觀察次數(shù)來降低評價人員的主觀影響;通過事先預測評商定一個統(tǒng)一的評價標準;將表現(xiàn)評價與標準化測驗結合起來評價。
(2)效度。表現(xiàn)評價的評價環(huán)境屬于真實情境,允許家長、教師、同學之間互相提建議和給予支持,所以不存在作弊等標準化測驗中不真實的情況,但在測驗學生客觀知識和操作技能掌握程度等方面存在不準確的缺陷,所以雖然表現(xiàn)評價支持學生之間、學校之間甚至地區(qū)之間的評比和甄別學生,這方面的應用卻仍以標準化測驗為主流,難以直接測量的評價內容在評價時可能受其他未知外在因素影響而影響效度。靈活多樣的形式和評分方法雖然使教師可以根據(jù)具體評價內容自主選擇,但若選擇不恰當則會使整個評價偏離既定目標。
可以看到,表現(xiàn)評價的這些相對于標準化測驗的“特色”和優(yōu)勢,一不小心就會成為自身的“絆腳石”,具有“不穩(wěn)定性”。
(3)可操作性。由于表現(xiàn)評價所評價的是具有時間、空間跨度的完成一定任務的過程,所以比較費時費力,在實施上要比標準化測驗難度大,因此美國學者Osterhof指出表現(xiàn)評價適合單個人或小組評定,而不適合人數(shù)過多的學生評定;又由前所述,表現(xiàn)評價的效度具有“不穩(wěn)定性”,教師作為評價者在其中有決定性作用,所以對教師的要求很高,如:必須正確選擇評價方式、設定合適的評價標準、盡量客觀地評價學生等,這些都使得表現(xiàn)評價的可操作性大大降低,這可能也是其提出以來雖一直受教育界推崇卻仍不能如標準化測驗般成為主流評價方法最重要的原因。
(4)偏倚度。Garcia和Pearson在1994年提出了在多元文化情況下要避免在教學評價上偏倚的做法,必須面對的8個問題[4],其中涉及教學評價方法本身的有3個問題,我們以這三個問題為基點對表現(xiàn)評價進行評析。
①評價方式對于在文化、語言上,甚至家庭經(jīng)濟條件上處境不利或具有不同背景的學生是否真能有所助益?
單從理論出發(fā),答案是肯定的。
可以說這個要求是任何一個評價方式的最終目標,表現(xiàn)評價并不例外。表現(xiàn)評價的評價方式是動態(tài)化的。在標準化測驗中,學生必須單獨完成測驗,表現(xiàn)評價允許學生在完成任務時獲得其他外界環(huán)境的意見和支持,以學生完成工作為目的,評價過程即是教學過程,學生不僅為評價而評價,而且在評價過程中學到更多知識,通過解釋自己的表現(xiàn)經(jīng)驗,省思自己的思考過程而獲益良多,間接培養(yǎng)學生的團隊合作精神和協(xié)作學習的能力,這樣的做法對每個學生都有實質性助益。
②評價方式對于在文化、語言上,甚至家庭經(jīng)濟條件上處境不利或具有不同背景的學生是否真的公平?
從理論上說,可以達到。
首先,表現(xiàn)評價的評價方式多樣變化,學生能在比較多元的機會中展現(xiàn)自己的學習過程,這樣即使文化、語言、家庭經(jīng)濟條件上處境不利或不同背景的學生也一樣具有多方面接受評價的機會,不會像標準化測驗中,非主流文化群體的學生會吃虧。
其次,表現(xiàn)評價著重學生整體表現(xiàn),不會使非主流文化背景的學生因“起點”較“低”,無法盡快接受并完成較“高”層次的學習任務而難有較好的表現(xiàn)。表現(xiàn)評價不分學生“起點”的“高”、“低”,皆以真實的、統(tǒng)整的、表現(xiàn)的功課,讓學生結合自己所學作出整體表現(xiàn),避免學生習得零碎的知識和能力,使原本“起點”較“低”的學生也有充分的表現(xiàn)機會。
第三,評價情境真實、靈活、多樣,學生可按照自己的習慣,自己設定完成任務的情境和方法,如可獨自學習也可組對學習或討論學習等,這對來自不同背景的學生也更加公平。
第四,由于表現(xiàn)評價題目、方式、標準都提前公開,教師和學生都事先知道并做好準備,這對于程度較低的學生、來自非主流文化、語言、弱勢經(jīng)濟群體的學生也比較公平。
需要注意的是,以上都是在理論上的論述,真正實施表現(xiàn)評價時,在選取教材、設計評價項目、設定評價標準等時讓不同文化、語言、經(jīng)濟背景的人士共同參與是很有必要的,評價者也應包含具有這些背景的老師,這樣才能保證不會因為設計者和評價者本身站在主流社會文化的角度而使評價標準偏倚。
③單一的評價方式甚至單一的評價制度是否符合多種對象或多元學習的需求?
表現(xiàn)評價在評價方法、評價情境、評價內容等方面的多元化特點,使它在一定程度上可以說就是一個多元化的、動態(tài)的評價方式,這正是表現(xiàn)評價相對于標準化測驗最大優(yōu)勢所在。
總之,表現(xiàn)評價是一個給評價者很大發(fā)展空間的評價模式,它彌補了現(xiàn)今主流評價方式的不足,其本身也因發(fā)展不夠成熟而存在很多缺陷,兩種評價方式各有所長,可以在實際的教學評價中綜合應用,各取所長,使我們的教學評價更加完善。
參考文獻
[1] 王翠芳.探究學習中實施活動表現(xiàn)評價的研究.山東:山東師范大學,2006(9).
[2] 熊麗萍等.澳大利亞維多利亞州高考表現(xiàn)性評價的運用和啟示.教育科學研究,2006(11).
[3] 單文經(jīng).教學引論.上海:上??萍冀逃霭嫔纾玻埃埃常?/p>
[4] Garcia G E,Pearson P D,1994.Assessment and diversity.In:Darling-Hammond Led.Review of Research in Education;20:337-391.
(責任編輯付一靜)