● 邵朝友
評(píng)價(jià)是課程的基本要素,形成性評(píng)價(jià)是促進(jìn)學(xué)生學(xué)習(xí)的重要評(píng)價(jià)手段。然而形成性評(píng)價(jià)難以實(shí)施的事實(shí)中外皆然,實(shí)施的困境值得深究。在升學(xué)主義重壓下,選拔與甄別是我國(guó)中小學(xué)過去評(píng)價(jià)的主要功能,2001年政府公布第八輪課程改革政策后,評(píng)價(jià)的發(fā)展性功能得到大力提倡。但歷經(jīng)十多載,中小學(xué)的評(píng)價(jià)現(xiàn)實(shí)似乎巍然不變,那么,形成性評(píng)價(jià)的困境為何?本文將采用活動(dòng)理論,針對(duì)A校形成性評(píng)價(jià)的困境展開分析。
形成性評(píng)價(jià)正式提出可追溯至上世紀(jì)六十年代。1967年,斯立克文(M.Scriven)區(qū)分了課程評(píng)鑒的兩種形式,即總結(jié)性評(píng)鑒(summative evaluation)與形成性評(píng)鑒 (formative evaluation)。1969年,布盧姆(B.Bloom)及其同事建議在學(xué)生學(xué)習(xí)評(píng)價(jià)領(lǐng)域借鑒這兩種課程評(píng)鑒形式,此處的學(xué)生學(xué)習(xí)評(píng)價(jià)就是所謂的學(xué)業(yè)評(píng)價(jià)(assessment)。[1]此后,形成性評(píng)價(jià)與總結(jié)性評(píng)價(jià)逐漸被人們接受,但形成性評(píng)價(jià)受關(guān)注程度遠(yuǎn)遠(yuǎn)低于總結(jié)性評(píng)價(jià),許多人認(rèn)為它對(duì)于日常學(xué)校教育沒有多少實(shí)踐意義。[2]這種格局一直延續(xù)至1998年才有所徹底改變。
1998年,英國(guó)學(xué)者布萊克與威廉(P.Black&D.Wiliam)在綜合了250篇文章的研究結(jié)果基礎(chǔ)上,得到一個(gè)令人驚訝又激動(dòng)的結(jié)論:形成性評(píng)價(jià)能極大提高學(xué)生學(xué)業(yè)成就,對(duì)學(xué)生學(xué)業(yè)成就的效值(effect sizes)高達(dá)0.4-0.7。[3]事隔多年后,合作者之一威廉認(rèn)為這樣的發(fā)現(xiàn)之所以令人振奮,是因?yàn)檠芯拷Y(jié)論乃基于證據(jù)。為了進(jìn)一步用數(shù)據(jù)來說明形成性評(píng)價(jià)的巨大作用,威廉重新分析當(dāng)今被認(rèn)為能有效提高學(xué)業(yè)成就的四種因素——教師專業(yè)發(fā)展、教師學(xué)習(xí)風(fēng)格、神經(jīng)科學(xué)、學(xué)科內(nèi)容知識(shí),并比較它們與形成性評(píng)價(jià)對(duì)學(xué)業(yè)成就的實(shí)際影響,最終結(jié)論是,前四者要不缺乏證據(jù),要不效值小于形成性評(píng)價(jià)。[4]
英國(guó)評(píng)價(jià)變革小組深受布萊克與威廉的發(fā)現(xiàn)所鼓舞,認(rèn)為國(guó)家課程評(píng)價(jià)應(yīng)大力提倡形成性評(píng)價(jià)。實(shí)質(zhì)上,布萊克與威廉的核心發(fā)現(xiàn)是形成性評(píng)價(jià)對(duì)學(xué)業(yè)成就的巨大作用,高達(dá)0.4-0.7效值是目前所有教育方案對(duì)學(xué)業(yè)成就作用能達(dá)到的最高值。在教育政策制定者眼里,形成性評(píng)價(jià)如此巨大的作用,意味著能提高學(xué)生分?jǐn)?shù)與成績(jī),將成為各國(guó)教育競(jìng)爭(zhēng)的勝負(fù)手。因此,除英國(guó)外,其他國(guó)家與學(xué)者也紛紛關(guān)注形成性評(píng)價(jià)。以美國(guó)為例,早在1992年,在美國(guó)督導(dǎo)與課程發(fā)展協(xié)會(huì)(Association for Superision and Curriculum Development,ASCD)年會(huì)上,詹姆斯(M.James)就引介形成性評(píng)價(jià)。此后更多推進(jìn)工作被采取,如2005年,斯蒂金斯(R.Stiggins)大力普及形成性評(píng)價(jià)的思想。[5]至目前為止,形成性評(píng)價(jià),已成為美國(guó)教育系統(tǒng)的重要一員。
形成性評(píng)價(jià)作用的發(fā)現(xiàn)并不意味著,我們能輕而易舉地開展形成性評(píng)價(jià)。恰恰相反,形成性評(píng)價(jià)在實(shí)踐中幾乎舉步維艱。深入分析個(gè)中原因,教師評(píng)價(jià)素養(yǎng)、校外考試制度等是重要因素,只是這些分析大多以單個(gè)維度來進(jìn)行,缺乏整體關(guān)懷。而形成性評(píng)價(jià)涉及方方面面,需要做整體的分析。
分析形成性評(píng)價(jià)的困境,情境脈絡(luò)的處理是不可忽略的選擇。注重情境的理論是本文選擇理論架構(gòu)的首要考量。活動(dòng)理論(activity theory,AT)是當(dāng)前情境處理的一種重要理論與方法。
活動(dòng)理論又名為文化—?dú)v史活動(dòng)理論,理論的核心前提是中介。中介概念在恩格斯托姆(Y.Engestrom)延伸的理論中進(jìn)一步彰顯:活動(dòng)理論以三角形為分析架構(gòu)(見圖1)凸顯活動(dòng)的多重復(fù)雜中介結(jié)構(gòu)。[6]
主體(subject)為活動(dòng)中的成員,透過工具的中介來接近目標(biāo),因此三角形的上層有一個(gè)工具中介組件。此外,單一主體并非孤立于世、而是社群的一部分,因此上三角形拓展到下層。下層有兩個(gè)較為隱諱的社會(huì)中介工具:規(guī)則與分工。主體是透過規(guī)則的中介與社群建立關(guān)系,社群通過分工的中介與目標(biāo)建立關(guān)系。規(guī)則包括外顯與內(nèi)隱,例如該社群的成文法則與既定俗成的運(yùn)作規(guī)則等。分工指的是活動(dòng)如何分散在社群各成員間,包括各成員在活動(dòng)中扮演的角色、各自行使的權(quán)力、所負(fù)責(zé)的任務(wù)等。中介具有雙向性的本質(zhì)(圖各組件之間的雙向箭頭),意指社群中的工具、分工、規(guī)則這些中介工具也會(huì)反向影響生活其中的主體。圖1右側(cè)組件目標(biāo)之外,還有一個(gè)結(jié)果,即是凸顯目標(biāo)具有某種程度的理想性,在實(shí)踐中歷經(jīng)轉(zhuǎn)化的過程,涌現(xiàn)的結(jié)果通常不同于目標(biāo)。
圖1 活動(dòng)體系的中介結(jié)構(gòu)
個(gè)案A校為某課程改革試驗(yàn)區(qū)初中學(xué)校,有9個(gè)教學(xué)班。為提高課堂成效,該校近年來一直致力于有關(guān)形成性評(píng)價(jià)研究。但從相關(guān)信息看,該校在實(shí)施形成性評(píng)價(jià)并不順利,尤其是校長(zhǎng)調(diào)換后,形成性評(píng)價(jià)陷入低谷。
經(jīng)聯(lián)系與協(xié)商后,兩位教師同意筆者的采訪,下面先對(duì)三位教師做一簡(jiǎn)介。
教師K:任教初中語文,教齡為16年,已獲得中學(xué)高級(jí)職稱,長(zhǎng)期從事教育科研,在學(xué)區(qū)科研論文評(píng)比中多次獲獎(jiǎng)。在訪談開始,教師K就表現(xiàn)出坦誠(chéng)、豪邁性格。
教師T:任教初中科學(xué),教齡6年,已獲得中學(xué)一級(jí)職稱,喜歡教育科研,參與過省市骨干教師培訓(xùn),富有新課程理念,注重課堂評(píng)價(jià)。訪談開始階段略顯拘束。
教師M:任教初中科學(xué),教齡14年,中學(xué)高級(jí)職稱、特級(jí)教師后選人,是T教師所在學(xué)校的主管教學(xué)業(yè)務(wù)的副校長(zhǎng)。能很好地融合新課程理念于教學(xué)實(shí)踐,深受學(xué)生喜歡。訪談過程始終表現(xiàn)得比較穩(wěn)重,堅(jiān)持自己想法,對(duì)自己的行動(dòng)有信心。
上述受訪者的選擇采取了關(guān)鍵個(gè)性抽樣,關(guān)鍵個(gè)性抽樣選擇那些可以對(duì)事情產(chǎn)生定性影響的個(gè)案進(jìn)行研究,目的是將從這些個(gè)案中獲得的結(jié)果邏輯地推論至其他個(gè)案。推論的邏輯是:“如果這個(gè)事情在這里發(fā)生了,那么它也就一定在其他地方發(fā)生?!边@類個(gè)案通常代表一種“理想”的好狀態(tài),如本研究的三位受訪者及其所在學(xué)校具有開展形成性評(píng)價(jià)的較好條件,如果連這樣的個(gè)案都不能實(shí)施某種行為,那么其他個(gè)案一般也是無法實(shí)施這種行為的。
形成性評(píng)價(jià)是種學(xué)習(xí)活動(dòng),如果把它置于活動(dòng)理論之下來考察,我們更能明白形成性評(píng)價(jià)促進(jìn)學(xué)習(xí)的內(nèi)在機(jī)制。下圖中,要促進(jìn)學(xué)生學(xué)習(xí)(目標(biāo)),教師與學(xué)生開展各種有效形成性評(píng)價(jià)實(shí)踐。實(shí)踐過程中,教師與學(xué)生、學(xué)生與學(xué)生存在合作與分工關(guān)系,他們不斷加深、調(diào)整自己在評(píng)價(jià)中身份理解。同時(shí),實(shí)踐過程中,教師與學(xué)生受隱性或顯性的學(xué)習(xí)觀點(diǎn)(規(guī)則)及所在班級(jí)、學(xué)校、社區(qū)的影響與制約。上述分析僅僅從主體出發(fā),實(shí)際情況更為復(fù)雜,下圖中任何一個(gè)元素都直接或間接作用著其他元素。
圖2 作為活動(dòng)體系的形成性評(píng)價(jià)
雖然訪談具有較大的靈活變化特點(diǎn),一些事先準(zhǔn)備的問題可能在訪談過程不會(huì)得到運(yùn)用,但做好事先準(zhǔn)備還是必要的。為此,本研究設(shè)計(jì)了如下大致提綱。
表1 訪談提綱
通過整理錄音,整理出三次訪談內(nèi)容?,F(xiàn)用下表統(tǒng)一呈現(xiàn)相關(guān)內(nèi)容,由于訪談過程及細(xì)節(jié)有所不同,故呈現(xiàn)的每次訪談問題或細(xì)節(jié)都不一樣。
表2 訪談內(nèi)容(節(jié)選)
尋找訪談意義需要通過對(duì)內(nèi)容進(jìn)行登錄。登錄是資料分析中最基本一項(xiàng)工作,是一個(gè)將資料打散賦予概念和意義,然后再以新的方式重新組合在一起的操作化過程。[7]例如對(duì)于下述訪談內(nèi)容,登錄時(shí)可開始建立碼號(hào):
(注:碼號(hào)翻譯——1=理念吸引人;2=不會(huì)評(píng)學(xué)生;3=需要耐心;4=教師考核制度)
建立碼號(hào)后,我們可以將所有碼號(hào)匯集起來,組成一個(gè)編碼本。這是一個(gè)將所有碼號(hào)按照一定分類標(biāo)準(zhǔn)組合起來的系統(tǒng),反映了資料濃縮以后的意義分布和相互關(guān)系。編碼本有兩個(gè)主要作用:將碼號(hào)系統(tǒng)地排列出來,使得我們了解現(xiàn)有碼號(hào)的數(shù)量、類型以及碼號(hào)所代表的意義之間之聯(lián)系,由此而決定現(xiàn)有的碼號(hào)是否合理、是否需要增加或減少新的碼號(hào)、是否需要改進(jìn)碼號(hào)系統(tǒng)的整體結(jié)構(gòu);為我們今后查找碼號(hào)提供方便。[8]完成編碼本后,還需要對(duì)所有資料進(jìn)行歸類,最終得到4個(gè)主題。
表3 主題化訪談內(nèi)容
1.工具層面:教師評(píng)價(jià)素養(yǎng)不足。工具中介是主體與目標(biāo),主體通過中介接近目標(biāo),目標(biāo)落實(shí)過程也可能因工具的中介效果而影響主體,主體于是在一次次工具中介下,可能受到影響而改變動(dòng)機(jī)或目標(biāo)。
主體達(dá)到目標(biāo)的外顯工具是各種形成性評(píng)價(jià)實(shí)踐,但問題是教師雖然知道形成性評(píng)價(jià)非常有用,卻沒有相應(yīng)評(píng)價(jià)知能。
Y(研究者):就您的了解,貴校流行開展形成性評(píng)價(jià)嗎?
T:上屆校長(zhǎng)比較注重教科研,號(hào)召大家盡量少點(diǎn)考試,多從學(xué)生角度出發(fā),把評(píng)價(jià)作為促進(jìn)學(xué)生學(xué)習(xí)的手段。開始大家還是積極的。
Y:這么積極的原因是什么?
T:其實(shí)大家也都覺得考試太多了,學(xué)生學(xué)得好辛苦,也有一些人開始認(rèn)識(shí)到要好好改變考試的性質(zhì)。只是真正行動(dòng)起來的,也只有那兩三個(gè)教研組。
Y:為什么會(huì)這樣?
T:很慚愧,不少老師在實(shí)施時(shí)不知道到底該怎么做,雖然總覺得到處可做形成性評(píng)價(jià),但就連怎么寫作業(yè)評(píng)語都不知道怎么操作比較合適,加上也沒有得到專家引領(lǐng),最后還是不了了之。
2.規(guī)則層面:教師形成性評(píng)價(jià)制度缺位。規(guī)則中介是主體與社群的關(guān)系。社群通過規(guī)則來約束主體,主體也可以沖撞規(guī)則來轉(zhuǎn)化社群。教師和學(xué)生之間通過規(guī)則制度,或關(guān)于學(xué)習(xí)的觀點(diǎn)(隱性或顯性)來顯現(xiàn)。
有關(guān)教師關(guān)于形成性評(píng)價(jià)的觀點(diǎn)與看法在社群里流行,它們對(duì)形成性評(píng)價(jià)的影響巨大,尤其是學(xué)校內(nèi)教師的評(píng)價(jià)制度。
Y:要開展形成性評(píng)價(jià),您有何建議?
M:我個(gè)人認(rèn)為,首先要學(xué)校層面做出行動(dòng),如果學(xué)校本身不重視,教師是不會(huì)積極參與的,只能是一些自發(fā)性行為。
Y:學(xué)校怎么行動(dòng)比較好?
M:不說別的,一個(gè)重要條件是,提供制度保障。就是說,學(xué)校要在教師考核里加入形成性評(píng)價(jià),只有這樣,大家才能放心去做,否則還不如讓學(xué)生多做題目。
3.分工層面:學(xué)生缺學(xué)習(xí)主動(dòng)性。分工中介是社群與目標(biāo)。社群通過分工來接近目標(biāo),同樣目標(biāo)可能打亂原有的分工來轉(zhuǎn)化社群。
教師與學(xué)生、學(xué)生與學(xué)生之間的合作與分工,是社群分工主要構(gòu)成。就其本質(zhì),無論是合作還是分工都建立在學(xué)生學(xué)習(xí)積極性上,而實(shí)際顯示學(xué)生學(xué)習(xí)積極性非常匱乏。
Y:您認(rèn)為形成性評(píng)價(jià)存在哪些主要困難?
K:這個(gè)原因很多,嗯,從學(xué)生角度看,形成性評(píng)價(jià)最終就是讓學(xué)生負(fù)責(zé)起自己的學(xué)習(xí)責(zé)任,因此,學(xué)生要有學(xué)習(xí)積極性。
Y:從評(píng)價(jià)角度看,學(xué)習(xí)積極性怎么體現(xiàn)?
K:我看,一是能自我評(píng)價(jià),就是對(duì)自己的作業(yè)或作品進(jìn)行評(píng)價(jià):二是對(duì)同學(xué)的作品與作業(yè)進(jìn)行評(píng)價(jià)。
4.社群層面:學(xué)校和社會(huì)缺配合。學(xué)校是個(gè)小社會(huì),學(xué)校氛圍對(duì)形成性評(píng)價(jià)有著重大影響,而傳統(tǒng)上考試文化也滲透于學(xué)校評(píng)價(jià)實(shí)踐。此外,校外一些條件,如教師教育課程設(shè)置也是影響形成性評(píng)價(jià)重要因素。
Y:開展形成性評(píng)價(jià)過程,您遇到哪些挑戰(zhàn)?
M:這方面的挑戰(zhàn)有校內(nèi)的氛圍,作為主管教務(wù)的副校長(zhǎng),據(jù)我觀察,學(xué)校目前還沒有達(dá)成形成性評(píng)價(jià)的共識(shí),大家都是走著瞧態(tài)度。實(shí)事求是地說,就那么幾個(gè)老師在做,不過我覺得已經(jīng)很不錯(cuò)了。
Y:還有其他什么因素嗎?
M:另外一個(gè)挑戰(zhàn)是我不大想說的,因?yàn)闊o法改變。不過說說也無妨,這個(gè)挑戰(zhàn)就是我們老祖宗留給我們的考試文化,你說這個(gè)我們有能力改變嗎?
Y:呵呵,您還有什么補(bǔ)充沒有?
M:我還是認(rèn)為,教師的個(gè)人專業(yè)素養(yǎng)和評(píng)價(jià)素養(yǎng)是第一位的,但是現(xiàn)在師范畢業(yè)生在這兩方面都不過硬。因此,我建議師范院校要加大學(xué)科內(nèi)容的培養(yǎng),以及開設(shè)評(píng)價(jià)專業(yè)課程。
本文以活動(dòng)理論來分析一所初中形成性評(píng)價(jià)的實(shí)施困境,基于上文分析,從中得到如下相關(guān)結(jié)論:
在工具層面教師評(píng)價(jià)素養(yǎng)不足,在規(guī)則層面教師評(píng)價(jià)制度缺位,在分工層面學(xué)生缺乏學(xué)習(xí)主動(dòng)性,在社群層面學(xué)校和社會(huì)缺乏配合。
由于本研究訪談問題設(shè)計(jì)中,設(shè)計(jì)的問題可能略少,不能充分了解被訪談?wù)叩娜肯敕?,或者遺漏一些其他制約形成性評(píng)價(jià)的因素。
此外,由于研究并沒有收集其他方面的證據(jù)以便開展三角驗(yàn)證,因此還有待做更深入、全面的調(diào)查來檢驗(yàn)研究結(jié)論。
[1]Wiliam,D. (2006).Formative assessment:Getting the focus right.Educational Assessment,11(3&4),283.
[2]Popham,W.J. (2008).Transformative assessment.Association for Supervision and Curriculum Development,p4.
[3]Black,P.,& Wiliam,D. (1998). Assessment and classroom learning.Assessment in Education:Principles,Policy and Practice,5(1),7-73.
[4]Wiliam,D. (2011).Embedded formative assessment.US,Solution Tree Press,pp27-33.
[5]Bennett,R.E. (2009).A critical look at the meaning and basis of formative assessment.Princeton,NJ:Educational Testing Service.
[6]Marsh,C.J. (2007).A critical analysis of the use of formative assessment in schools.Educational Research for Policy and Practice,6,25-29.
[7][8]陳向明.質(zhì)的研究方法與社會(huì)科學(xué)研究[M].北京:教育科學(xué)出版社,2000:279、286.