[摘 要] 美國加州標(biāo)準(zhǔn)化測驗與報告項目針對全州、學(xué)區(qū)和學(xué)校,報告學(xué)生在加州基于課程標(biāo)準(zhǔn)的學(xué)業(yè)成就。以案例形式研究其信息處理的框架和具體的處理與利用過程,能為我國基于標(biāo)準(zhǔn)的評價實踐提供有益的啟示。
[關(guān)鍵詞] 課程標(biāo)準(zhǔn) 基于標(biāo)準(zhǔn)的評價 標(biāo)準(zhǔn)化測驗與報告項目
數(shù)據(jù)本身不會說話,數(shù)據(jù)之所以能告訴人們他們能明白的和需要的證據(jù),就在于人們對數(shù)據(jù)的分析。我國實施的基于課程標(biāo)準(zhǔn)的學(xué)業(yè)成就測驗很多是終結(jié)性的測驗,按照我們的習(xí)慣思維,那最后的結(jié)果就是每個學(xué)生得到多少分,平均分是多少,然后是擴大到學(xué)校、學(xué)區(qū)、縣、省等層面。這樣的信息處理和交流不但不能告訴我們關(guān)于測驗的有效信息,而且還會造成人們的不正確印象——測驗就是看看學(xué)生分?jǐn)?shù)的高低名次,判斷教育質(zhì)量的高低也是如此。根據(jù)對基于課程標(biāo)準(zhǔn)的學(xué)業(yè)成就測驗特征的分析以及命題的規(guī)范分析,我們認(rèn)為,基于標(biāo)準(zhǔn)的評價信息處理與報告要告訴大家測驗分?jǐn)?shù)背后代表的東西——達(dá)到了課程標(biāo)準(zhǔn)的要求了嗎?哪些達(dá)到了,哪些沒有?達(dá)到要求的程度怎樣?然而,在國內(nèi)這方面的實踐比較欠缺,缺少直觀的案例,美國加州標(biāo)準(zhǔn)化測驗與報告項目(Standardized Testing and Reporting Program,STAR)可以為我們提供相應(yīng)的參照與借鑒。
一、STAR項目的信息處理框架
STAR項目是美國加州州教育部在2007年以網(wǎng)絡(luò)版的形式開發(fā)的,對全州、學(xué)區(qū)和學(xué)校報告學(xué)生在加州基于課程標(biāo)準(zhǔn)的學(xué)業(yè)成就。它以加州標(biāo)準(zhǔn)測驗(California Standards Tests,CSTs)和加州替代性表現(xiàn)評價(California Alternate Performance Assessment,CAPA)這兩種以州課程內(nèi)容標(biāo)準(zhǔn)為基礎(chǔ)的測驗為主體;同時,為確保教育的公平,還輔之以加州成就測驗(常模參照測驗)和以西班牙語印刷的基于標(biāo)準(zhǔn)的測驗。①(注:STAR項目介紹可以參看美國加州州教育部網(wǎng)址:http://star.cde.ca.gov)STAR項目首先總體規(guī)劃各種學(xué)業(yè)成就測驗的內(nèi)容安排和年級安排,然后制訂出各個年級的成績水平分?jǐn)?shù)線等,詳見表1、2和3。
二、STAR項目測驗信息的報告和利用
1. STAR項目測驗信息的報告
加州學(xué)業(yè)成就測驗結(jié)果的報告,有一個事先制訂的嚴(yán)格而又明確的時間表(見表4)。按照學(xué)生所得的分?jǐn)?shù)以及標(biāo)準(zhǔn)當(dāng)中規(guī)定的成就水平,沿著既定的時間表,采用新聞發(fā)布、網(wǎng)上公布等方式向公眾、學(xué)校和學(xué)生報告測驗結(jié)果。某一個學(xué)生或者總的一項測驗的結(jié)果報告是以州教育董事會認(rèn)證的成績水平來劃分的,即按照優(yōu)異、良好、合格、接近合格和遠(yuǎn)低于合格五個水平匯總,在具體的應(yīng)用中也會用150~600之間的分?jǐn)?shù)來說明測驗結(jié)果(見表3)。就理想而言,加州希望所有的學(xué)生都能達(dá)到良好以上的水平。
2. 對學(xué)業(yè)成就測驗結(jié)果的利用
最主要的運用場合是對學(xué)校的評價和問責(zé),結(jié)合STAR的分?jǐn)?shù)表現(xiàn)、輟學(xué)率、出席率等計算學(xué)校的年度表現(xiàn),將學(xué)校和學(xué)區(qū)加以分類。就學(xué)校和學(xué)區(qū)而言,其結(jié)果分為模范、受認(rèn)可、成就可接受和成就不被接受四個層次。同時,測驗的結(jié)果也是學(xué)??冃ж?zé)任報告卡的重要內(nèi)容。學(xué)??冃ж?zé)任報告卡包括學(xué)區(qū)任務(wù)與宗旨、學(xué)生成就資料、學(xué)生出席率、教師評價等15個方面的信息??此坪荦嬰s,但是版面設(shè)計和內(nèi)容陳述都很簡潔,易于大家理解和接受,從而能夠接受這些信息對學(xué)校教育做出改進(jìn)②(注:The California Department of Education,Explaining 2007 STAR Internet Reports to the Public. August 2007:5)。就問責(zé)而言,除了對達(dá)到較高水平的學(xué)校、教師和學(xué)生進(jìn)行獎勵,如增加辦學(xué)經(jīng)費、提供帶薪學(xué)術(shù)休假、各種榮譽稱號等之外,對成績不達(dá)標(biāo)的學(xué)校施以警告,對連續(xù)三年不合格的學(xué)校,州教育部甚至可以將學(xué)校解散重組。
另外,STAR主要報告的是學(xué)生在特定年級和州內(nèi)容標(biāo)準(zhǔn)上的表現(xiàn),隨著總結(jié)性結(jié)果的上傳,隨之而來會有各種研究報告——主要是根據(jù)參加的具體年級和水平的考試人數(shù)、平均分?jǐn)?shù)、在各個表現(xiàn)水平上的學(xué)生人數(shù)、學(xué)生的經(jīng)濟(jì)背景和語言程度,對學(xué)生的測驗結(jié)果做出分析,尤其是體現(xiàn)在學(xué)生個人的成績報告卡上,其報告形式的一部分參見表5,人們可以一目了然地了解學(xué)生的具體情況。
三、評論
1. 評價信息處理的根本目的在于促進(jìn)學(xué)習(xí)
在教育領(lǐng)域中,學(xué)業(yè)成就測驗一直受到心理測量學(xué)范式的影響,主張學(xué)生接受的測驗應(yīng)該是不受教學(xué)影響的,追求絕對客觀、科學(xué)化的結(jié)論。測驗與教育教學(xué)沒什么關(guān)系。然而,在教育中,學(xué)業(yè)成就的評價核心就是判斷學(xué)生經(jīng)過特定的教育和教學(xué)經(jīng)歷后所達(dá)到的狀態(tài),我們更希望的是能夠?qū)⒖荚嚭蜏y驗結(jié)果與教育實踐結(jié)合起來,為教和學(xué)提供幫助。如同查普斯(Stephen Chappuis)等人指出的:“自20世紀(jì)中葉開始,美國的教育界就標(biāo)準(zhǔn)化測驗的作用及效果一直沒有達(dá)成共識。具體地說,在評價什么、為何評價、怎樣評價及如何使用評價結(jié)果來支持學(xué)習(xí)這些問題上,我們并沒有達(dá)成一致的看法。截至2005年,幾乎沒有證據(jù)表明這60多年來所使用的標(biāo)準(zhǔn)化測驗對教育體系有什么重大的改進(jìn)作用,這說明我們在處理評價與教學(xué)改進(jìn)的關(guān)系上是失敗的?!?注:① Stephen Chappuis,Richard Stiggins,Juth Arter & Jan Chappuis(2005). Assessment for Learning:An Action Guide for School Leaders. Asseisment Training Instit