梅含辛
長期以來,人們一提及教育評價,想到的就是標準化考試及其測量結果,這種以數(shù)字表征的結果所代表的客觀性和科學性成為標準化考試得以服人的重要原因。因此,在綜合素質(zhì)評價實施之初,人們不自覺地去追求這一標準。而人是非常復雜、豐富的統(tǒng)一體。簡單地以定量的方式很難對人的綜合素質(zhì)進行整體全面的評價,而且,量化的評價把復雜的教育現(xiàn)象僵化、簡單化和表面化,往往失去了教育中最有意義、最根本的內(nèi)容,無法反映真實的教育性。
所以,就需要定性評價的參與。這就涉及到一個問題:如何處理定性評價和定量評價的關系?本期,就“如何處理定性評價和定量評價的關系”進行討論。
泰勒在《課程與教學的基本原理》一書中闡述課程評價的基本觀點時指出,教育評價是判斷課程和教學計劃在多大程度上實現(xiàn)教育目標的過程,也就是判斷學生行為模式發(fā)生了多大程度的改變。當然,這里的行為是廣義的,既指看得見的行為,還指內(nèi)在的思維、情緒過程;這里的變化也不僅僅是指短暫的變化,更是指一種深刻持久的變化,或者說是模式的變化。
評價的本質(zhì)就是引出或闡發(fā)價值。課程中的學生評價是對學生學習和學力的評價,其根本目的是為學生的學習和發(fā)展提供有針對性的、切實的指導和建議。
一、教育評價是一種有限準確的手段
泰勒認為,教育評價是一種有限準確的手段。首先,實現(xiàn)教育目標的那一些經(jīng)驗(知識、能力和態(tài)度等等)雖然經(jīng)過評估,不過,它們是與情境分離的、高度抽象的,只適用于一般性原則,而不是一種具體、復雜而又高度精確的陳述。其次,任何一組學習經(jīng)驗都包括很多標準,而其中每一種標準都只是近似的,因為我們只能在大體上或者以某種有限的準確性來預測這些學習經(jīng)驗是否會真的產(chǎn)生這樣的效果。最后,學生個體的復雜性和學習情境的多樣性,也是造成評價有限準確的外部原因。
2013年暑假,江蘇省綜合實踐活動課程的省培活動中,筆者參加了一次《問卷調(diào)查設計指導》的課堂觀摩活動。因為這一次觀摩課由許多教師扮演學生來模擬課堂教學,要從教與學的雙重角度去參與和評價,所以印象特別深刻。其中有一個環(huán)節(jié)是一項關于教師職業(yè)生活幸福指數(shù)的調(diào)查。針對執(zhí)教者的這個問卷設計,有教師提出了質(zhì)疑:“我對于問卷調(diào)查中關于幸福指數(shù)的量化指標的答案選項,始終無法接受ABcD或者類似的一種僵化分割。”
確實,對于人類情緒的強弱程度、感受能力的大小、思維的敏捷程度等抽象而又復雜的東西,調(diào)查問卷技術性的測試和評估表現(xiàn)了一種模糊準確的智慧。與此類似,教育評價是一種相對準確的判斷。
定性評價多采用描述性的語言來決定評價對象水平的高低,所以相對來說全面、深入,不過客觀性不強。定性評價更多的是關于對象的價值、性質(zhì)和水平的描述。
定量評價以按照一定比例的數(shù)據(jù)為常模的量化技術,通過給出數(shù)值來展開評價,主要用數(shù)量表示評價標準、描述現(xiàn)象、分析狀態(tài)、表示評價結果等等。雖然數(shù)值的形式比較單一,但在清楚明確的評價指標下,采取合理的評價技術,能夠獲得相對客觀的結果。定量評價側重體現(xiàn)了評價的區(qū)別功能。
基于人類行為的復雜性和評價情境的復雜性,所以在學生評價中需要通過定性評價和定量評價相結合的方式來突破評價的局限性,提高其準確度。
二、區(qū)分兩種評價,發(fā)展促進學生學習和成長的評價
評價的本質(zhì)不僅僅是區(qū)別,更是為了引出價值,而作為考試的評價強化了區(qū)別的手段功能,使得教育目的及其過程無形之中被異化了。
由于長期推行應試教育,中高考成績已經(jīng)成為評價學校教育的主要指標,這樣導致了課程評價的單一和嚴重滯后,從而阻礙甚至誤導學生的發(fā)展。這些已經(jīng)成為我國新課程改革中亟待解決的突出問題。多爾在《后現(xiàn)代課程觀》一書中指出,美國“在現(xiàn)代主義框架中,評價基本用于區(qū)別勝利者和失敗者。這就是州和全國的考試,以及各類專業(yè)考試所做的——它們旨在區(qū)分等級”,“考試幾乎普遍地作為區(qū)分手段而不是對話的起點”。
這里需要區(qū)分的是兩種評價,一種是對學習的評價,也是作為選拔的評價;另外一種是為了促進學習(甚至是終身學習)的評價,而在教學之中更多應該采用這一種評價。讓課程評價回歸到推動學生個體智力和社會能力發(fā)展的教育本位和發(fā)展本位,這是課程評價改革的應有之義。
三、在清晰和細化的評價目標基礎上,合理運用定量評價,既作為教育活動的反饋,又為學生的發(fā)展提供有價值的建議
泰勒認為,人類行為的評估是一個非常復雜而又系統(tǒng)的分析性過程,不應該是單一的分數(shù)總結。得知甲97分,乙64分,對于改進課程和幫助個體并沒有太多的積極意義,而更加有用的是,在清晰和細化的評價目標下,表明優(yōu)點和弱點的總結。根據(jù)學科關鍵能力、核心概念,采取多種目標的分類評價和分類評分,通過澄清打分細則來提高評價的客觀性,這種表明了特定優(yōu)點和缺點的分析性總結在改進課程、促進學生的自我調(diào)整方面是很有價值的。
反對應試,并非單純反對考試,而是合理發(fā)揮定量評價的作用。多爾指出,“從本質(zhì)上說,評價應該成為共同背景之中以轉變?yōu)槟康牡膮f(xié)調(diào)過程?!瓚獙⑵洌ㄔu價)作為一種反饋,作為‘做——批——評——做——批——評這一循環(huán)過程的組成部分。這種個人做、公眾批評的回歸過程——是杜威批評性反思或科學方法的核心——是經(jīng)驗轉變的關鍵?!F(xiàn)在的重點在于旨在幫助個體的社區(qū),通過批評和對話發(fā)展個體的智力和社會能力”。
從立足社會的建構主義學習觀出發(fā),學習是個體圍繞與自我、環(huán)境和他人的三重對話,而促進學習發(fā)展的評價同樣體現(xiàn)了三重對話,有利于多重關系的建立。評價不是學習的終結,而是學習的新起點,其目的是推動反思,促進學生在學習中生成主動的意識。作為促進學習的評價,應該貫穿在整個活動過程中。
四、綜合學習的表現(xiàn)性評價以真實和自主的定性評價,促進學生主動發(fā)展,建構意義
20世紀60年代初,美國盛行行為目標的概念,其實際用意是將所有指導性目標轉化為能被觀察的行為方式。內(nèi)爾·諾丁斯在《當學校改革走入誤區(qū)》一書指出,使用“標準”一詞的用意是傳遞統(tǒng)一和高質(zhì)量的概念,但是它導致了非常復雜的標準——關于內(nèi)容的紛繁復雜的表格,由于太過繁瑣,而無法適用于所有學生。諾丁斯批評說,過于強調(diào)這樣的細化行為目標,會窄化學習,學科之間的聯(lián)系也被忽視,使學習和成長變得無趣,等等。因為個體的性向(個人特征的綜合,包括智力、能力和傾向性)是獨特而又豐富的,而面對個體的教育及其評價也應該因境施評、因?qū)W施評和因材施評。
綜合實踐活動課程以促進學生養(yǎng)成健康人格、發(fā)展個性、培養(yǎng)學生的創(chuàng)新能力為核心目標,這門課程的最大優(yōu)勢正是課程內(nèi)容的不確定性,因為其課程內(nèi)容極其廣泛,足以針對不同學生開展個性化的課程和評價。
綜合實踐活動課程更多采取表現(xiàn)性評價手段。表現(xiàn)性評價是指對真實情境中完成任務程度的價值判斷,表現(xiàn)為多樣化的實踐活動,是真實情境之中具體實際的、非抽象的任務活動?;顒拥摹罢鎸嵭浴北WC了評價的真實性,使得學生在真實情境之中接觸了更多的信息和困難,當然,因為其本身來自生活,所以更加容易激發(fā)學生挑戰(zhàn)的動機。不過,要解決這樣的綜合問題和任務,往往需要綜合深刻的理解力和多方面的能力。表現(xiàn)性評價往往運用定性評價,通過開發(fā)評價量規(guī),采用描述表現(xiàn)、判斷性質(zhì)的定性評價手段達到評價的目的。
筆者了解到這樣的案例:某個四星高中理科基地班有一名成績比較優(yōu)秀的女生,她在綜合活動課程的《雷雨》話劇表演之后,毅然決定棄理從文。在這個案例中,綜合課程通過活動豐富了學生的體驗,而表現(xiàn)性評價通過評價引導學生自我反思,實現(xiàn)了積極的自我探索和自我決策。
需要指出的是,定量評價和定性評價處于課程評價的測量技術層面,與課程經(jīng)營管理、課程評價文化等的其它側面有著千絲萬縷的聯(lián)系。所謂牽一發(fā)而動全身,課程評價改革絕不是單純技術或效率的問題,它牽涉到教育思想和哲學、課程模式和方法等的改造,因此不可能畢其功于一役。