教育評價對教育的導向作用十分重要,項目學習的評價改革成為推進項目學習有效開展的重要舉措。2013年頒布的《教育部關(guān)于推進中小學教育質(zhì)量綜合評價改革的意見》從多角度闡釋了推進評價改革的重要性,并指出要建立健全中小學教育質(zhì)量綜合評價體系。《國家中長期教育改革和發(fā)展規(guī)劃綱要(2010~2020年)》中也提出:“要改革教育質(zhì)量評價和人才評價制度,改進教育教學評價,根據(jù)培養(yǎng)目標和人才理念建立科學、多樣的評價標準?!?/p>
現(xiàn)行評價體系存在什么弊端?項目學習應采用何種評價方式?是否可以為教育評價治痛?探討這些問題有助于我們完善對項目學習的認識。
一、教育評價之痛分析
(一)評價目的異化于評價實施之中。
作為行政管理手段的評價的目的是什么?評價手段能否滿足現(xiàn)實的需要?評價手段是否指向并有效地服務于真實目的?評價結(jié)果在多大程度上實現(xiàn)了真實目的?所有這些問題不是被忽略就是被扭曲了。在教育評價中,人們總是有意無意地將教育視為取得良好評價結(jié)果進而獲得物質(zhì)利益、社會地位的手段,這使得評價倒置為目的,教育倒置為手段,造就了“為了評價的教育”。
在評價實踐中,為了獲得一組可使用的行為目標,評價人員需要選擇并研制評價目標。由于評價實施上的限制,評價目標必須明確、細化。對目標進行選擇和規(guī)范是評價人員的任務之一。在目標選擇的起始階段,應該從學習及發(fā)展心理學的理論出發(fā),將目標中最為重要的部分加以明確,并選擇合適的行為動詞將其表示出來,再將較為模糊不清的一般目標具體化為可測量的行為目標,這是確定評價目標的核心步驟。但我們注意到,用行為詞語來表示評價目標存在一些缺陷,行為動詞只能刻畫認知領(lǐng)域的教育目標,或者是能夠外化為行為動作、能夠被觀察和測量的目標。僅僅如此是不夠的,這些目標多局限于教育評價的較低層次要求,那些諸如綜合運用、問題解決、決策和創(chuàng)造能力等較高層次的目標往往不容易被外顯化、行為化,因而在教育評價實施過程中常被忽略。所以評價常常淪為對初級目標的評價,或者只是對表述出的目標進行評價,而忽略了更多有價值的東西。
(二)崇尚數(shù)字的評價觀念成為主流。
西方的教育評價與測量理論體系傳入我國后,我國的評價技術(shù)逐漸完成了科學化改造,西方的評價理論中的工具理性也隨之被移植過來,逐漸根植于評價思想的深處。在這樣的思想影響下,不少學者認為教育評價的本質(zhì)是教育測量,是用測驗的方式來測定學生對知識的記憶狀況或某項特質(zhì)。隨著各種統(tǒng)計方法和測量技術(shù)的發(fā)展,教育學家和心理學家傾向于將技術(shù)運用于評價領(lǐng)域,并取得了一些成果。各種智力測驗、學力測驗和人格測驗被大量開發(fā),這影響著教育評價向定量化方向發(fā)展。教育評價強調(diào)客觀化和標準化,并在數(shù)理科學指導下表現(xiàn)出純量化的趨勢。
大多數(shù)國家都在實行大規(guī)模的標準化考試,不僅注重終結(jié)性評價的客觀性和數(shù)據(jù)的準確性,還要求評價數(shù)據(jù)具有可比性和較高的信效度,以便推進評價者對被評價者的有效管理和篩選。但是,標準化測試存在著隱患:一方面,標準化測試很難考察學生對方法和思想的理解,它過多地關(guān)注技能的掌握,讓學生強行記憶和再認的成分較多,導致教師的教學側(cè)重點偏移,學生的思考能力下降,更難以從測試中挖掘出學生的創(chuàng)造性思維過程;另一方面,標準化測試使學生誤認為問題的答案正確了就是學會了,或認為問題有唯一正確的解法。
采用實證方法進行評價雖然看似價值中立,但對其過分強調(diào)會導致評價在一定程度上走向數(shù)字被濫用的極端。若一味以量化評價排擠質(zhì)性評價,則會陷入確定性研究范式的泥沼,而難以深入解釋分析教育領(lǐng)域內(nèi)的復雜的不確定現(xiàn)象。
(三)甄別性評價與反饋缺失相矛盾。
教育選拔理念認為教育評價可以甄別、篩選出適合接受更高級別教育的兒童,教育評價重在對兒童學力水平的鑒定和測量,目的在于篩選優(yōu)秀兒童,淘汰學力水平較低的兒童。測驗更擅長于甄別學生的紙筆作答能力,忽略了對其綜合能力的考察。更甚者,在高考等考試中,利害與風險高度集中,為學生增加了過重的負擔。這些都是評價過度強調(diào)甄別功能導致的結(jié)果。
對于評價功能的認識常常基于一個錯誤的假設:如果學生能夠在課堂上或考試中解決書面演算的問題,自然也能夠解決現(xiàn)實生活中的問題。然而,這種遷移真的是自然而然的嗎?實際情況并不樂觀。在選拔理念中測查出的高分學生卻未必能夠?qū)⒅R應用于實際生活中,TIMSS國際測試發(fā)現(xiàn)很少有學生能高質(zhì)量地運用知識解決實際生活中遇到的問題。在教室里,學生似乎理解了他們所學的東西,因為他們能夠記住相關(guān)的知識,但一旦他們需要運用所學概念、技能來處理新的問題時,就未必能學以致用了。
對評價功能的另一個錯誤的假設是,學生在評價中得到正確答案就意味著他們理解了該問題考察的知識。其實,紙筆測驗只能快速、高效地檢測學生對于知識的理解,但難以考察學生對知識的深層次理解,也很難暴露學生的思維過程,其信息反饋量是不夠的。
我們可以從下面的案例中探尋現(xiàn)行教育評價手段到底能提供多少信息量。
問題:從數(shù)字1至5中隨機抽取一個數(shù)a,再隨機抽取一個數(shù)b,如果a、b兩數(shù)的乘積是奇數(shù),那么小王贏,如果兩數(shù)的乘積是偶數(shù),那么小李贏。請問游戲公平嗎?
A. 公平 B. 不公平 C. 不確定
這類問題在紙筆測試中常以選擇題的形式出現(xiàn)。如果學生回答“不公平”,那么是否表示他已經(jīng)解決這個問題了?未必。通過和學生的訪談交流,研究者發(fā)現(xiàn)學生得出“不公平”的判斷有以下幾種理由。
(1)因為
奇數(shù)×奇數(shù)=奇數(shù)
奇數(shù)×偶數(shù)=偶數(shù)
偶數(shù)×偶數(shù)=偶數(shù)
很明顯偶數(shù)的可能性多于奇數(shù)的,所以不公平。而且我知道一定是小李贏。
(2)因為1~5中有三個奇數(shù),那么抽到奇數(shù)的可能性大,所以積是奇數(shù)的可能性也大。
(3)因為抽a的時候有5種可能,抽b的時候也有5種可能,一共是25種可能,25是奇數(shù),最后的兩種情況出現(xiàn)的可能性一定不相等,所以一定不公平。
(4)列出所有的情況之后可以算出各種結(jié)果出現(xiàn)的數(shù)量,乘積是奇數(shù)的可能有9種,乘積是偶數(shù)的可能有16種,所以不公平,小王贏的可能性小。
從上述分析可以發(fā)現(xiàn),結(jié)果性評價難以反映學生的全部思維過程。這就折射出評價體系的一個矛盾:甄別功能被過分強調(diào),但同時現(xiàn)行評價又很難考察學生的深層思考,有時還會出現(xiàn)判斷失察。這種矛盾必然導致教育參與者無法建立健全的評價觀念。
以上討論既是全球課程改革背景之下教育評價亟待完善的地方,也是教育評價理論未來發(fā)展的風向標。我們呼喚的項目學習評價應當是一種定位于學生發(fā)展的評價,凸現(xiàn)過程性,多種手段并行的活動。
二、項目學習評價治痛之道
有學者指出,對教育評價現(xiàn)狀絕不能“無奈”。在項目學習推進過程中,反思教育評價現(xiàn)狀,變革項目學習評價方式,塑造合理健康的項目學習環(huán)境是必然的選擇。
(一)面向?qū)W生發(fā)展的評價目的。
項目學習的評價不能僅僅滿足于方法層面的改革,更重要的是要重新認識評價的價值取向,重新認識個人發(fā)展在教育評價中的重要地位,重新認識教育評價的價值基礎(chǔ),思考如何評價學生才能有效促進學生的發(fā)展,以實現(xiàn)項目學習的真正目的。
項目學習的評價要關(guān)注人的發(fā)展,關(guān)注人在社會中的價值和作用。有了這樣的認識就有助于形成新的評價觀。要評價學生已有的能力和素養(yǎng),也要評價學生在學習過程中的表現(xiàn),還要評價學生發(fā)展性目標的落實和達成。此外,教育評價強調(diào)的是學生的原有認知與其發(fā)展現(xiàn)狀之間的比較,對學生的任何進步和成就都要予以肯定。
從評價的導向功能分析,要克服多年來教育中重記憶輕理解的傾向,關(guān)注學生解決問題的能力、實踐能力和創(chuàng)新能力。從評價的診斷功能分析,不僅要正確估計學生在多大程度上實現(xiàn)了學習理解,還要在一定程度上解釋理解障礙產(chǎn)生的原因或問題的癥結(jié)所在。從評價的激勵功能分析,項目學習的評價要充分激發(fā)學生的學習積極性,喚起他們的內(nèi)在發(fā)展動力,促進其不斷進步。從評價的反思功能分析,在評價前組織學生對評價標準進行討論可以促使學生進行反思;在評價中學生的任務分析與策略選擇也是反思的有機組成部分;在評價后組織學生間相互交流并進行原因分析等活動都推進了學生的反思,提高了他們的自我認識能力,在自覺內(nèi)省與反思中認真總結(jié)前期行為,并思考下一步計劃,形成良好的反思與總結(jié)習慣。正如斯塔弗爾比姆所說:“評價最重要的意圖不是為了證明(prove),而是為了改進(improve)。”其實在英文構(gòu)詞法上已經(jīng)體現(xiàn)了“證明”和“改進”的遞進關(guān)系,證明了結(jié)論絕不是完結(jié),重要的是將結(jié)論應用于改進和提高,以促進學生的發(fā)展。
(二)崇尚過程的評價指向。
項目學習的評價不能僅僅用數(shù)字來評定學生。美國學者格朗蘭德提出:評價是為了確定學生達到教學目標的程度,收集、分析和解釋信息的系統(tǒng)過程;評價包括對學生的定量描述(測量)和定性描述(非測量)兩個方面。一個完整的評價計劃將包含測量和非測量兩種方法,用公式表示為:
評價=測量(定量描述)+非測量(定性描述)+價值判斷
在項目學習背景下,學生評價生成了新的內(nèi)涵和外延,評價的關(guān)注點聚焦在促進學生的發(fā)展上。傳統(tǒng)的紙筆測驗需要改革,測量形式的評價和非測量形式的評價必須融合并存。
其中,非測量形式評價的主要載體是學生成長檔案。成長檔案屬于表現(xiàn)性評價方式,獲得資料的方式包括學生個人記錄、小組互評、教師觀察、談話等。其內(nèi)容包括學生在學習歷程中的過程性感悟,階段性小結(jié),階段性成果的制作經(jīng)歷、成果評價,終結(jié)性成果的制作經(jīng)歷、成果評價,展示評價等內(nèi)容。
無論項目學習評價的方式如何,其目的都是希望通過學生從事的學習活動獲知他們的學習能力。這是一種“在學習中”的評價,而不是像傳統(tǒng)的評價那樣,是一種“關(guān)于學習”的評價?!霸趯W習中”的評價更指向過程,使學生清楚自己前行的目標;“關(guān)于學習”的評價更指向結(jié)果,學生首先獲知的是自己的表現(xiàn)是否達標、自己的排名是否提升?!霸趯W習中”的評價讓教學過程和評價過程融為一體,真正實現(xiàn)“以評促教”。
(三)多元化的評價維度。
傳統(tǒng)的評價將視線放在學生的學習成績上,關(guān)注的是教學效果在分數(shù)上的表現(xiàn),忽視了教學對學習潛力的影響和對學生發(fā)展的改變,很容易打擊學生的學習積極性,也無助于教師對教學進程的真切了解。項目學習評價應著眼于學生的素養(yǎng)和學習能力,不僅要關(guān)注學生參與學習活動的積極性和全面性,還要關(guān)注學生是否具備勇于表達的愿望和清晰表達的能力,要關(guān)注學生的學習習慣、學習態(tài)度、自信心和合作交流意識等各方面。
Curriki在線課程中提供的“數(shù)學項目學習評價表”(見附表)從八個方面對學生的數(shù)學項目學習進行評價,很好地體現(xiàn)了評價維度多元化。
教育評價方法紛繁多樣,只要是具備相應理論基礎(chǔ)并經(jīng)過一段時間實踐論證的評價方法,都有其價值和意義,在其適用范圍內(nèi)都可以發(fā)揮一定的作用。項目學習要突破傳統(tǒng)教育評價之痛,評價方式的確立則應當遵循過程性、開放性和多元性的原則,將定量評價和質(zhì)性評價結(jié)合起來,將形成性評價和終結(jié)性評價結(jié)合起來,將外部評價和自我評價結(jié)合起來,發(fā)揮各種評價方式的作用,建立完善的評價體系。