李雄鷹,張瑞寧
在國家提出“分類考試、綜合評價、多元錄取”的高考改革導向之后,高考評價便成為高考改革的新趨勢與新內容。高考評價既是一個實踐問題,也是教育考試研究中的理論問題。改革要推行,理論需同行。對高考這項高競爭、高利害、高風險、大規(guī)模的考試進行改革,必然會受到各方面的廣泛關注,產(chǎn)生重大影響。因而在積極部署、大膽實踐的同時,還需從理論視角深化認識,加強對基本問題的思考。本文從教育評價理論發(fā)展的視角分析當前我國高考評價改革的現(xiàn)狀與缺失,以期為改革的順利進行和化解改革難題提供借鑒思路。
回顧教育評價理論的發(fā)展,多將其劃分為四個時期,即“測量時期”“描述時期”“判斷時期”和強調“心理建構”的時期。
測量時期(19世紀末至20世紀30年代)的教育評價以“測量”理論的形成以及測驗技術廣泛運用為標志,教育評價被等同于“測量”,以測量為手段了解學生知識掌握及相關情況,追求評價的客觀化。流行于這一時期的科學管理運動影響了學校教育及教育評價,學校被視為工廠,教師被視為產(chǎn)品加工者,學生被視為學校教育的產(chǎn)品。“凡是存在的東西都有數(shù)量”“凡是有數(shù)量的東西都是可以測量的”[1]14,認為教師教的如何、學生學得如何以及學校教育成功與否都是可以測量的。這一時期的教育測驗,內容上由單科向綜合發(fā)展,范圍上由小學向其他學校延伸,教育測量的客觀化、標準化得到加強,[2]27從工具制作、測量對象選擇、測量實施以及分數(shù)解釋都有一套規(guī)范的程序要求。但由于測量等同于評價,因而,這一時期的教育評價內容多以認知類、記憶性知識為主,而對于非認知類的興趣、動機等方面的評價受限。
描述時期(20世紀30-50年代)的教育評價以泰勒(R.W.Tyler)提出的以教育目標為核心的教育評價原理即泰勒原理為標志。泰勒指出:“教育評價的歷程在本質上是一種測定教育目標在課程和教學方案中究竟被實現(xiàn)多少的歷程”。[3]119教育評價分為八個步驟,即擬定教育目的和目標,把目的和目標進行分類,將目的、目標轉換為適合課程實施的形式,塑造可以使具體目標達成的情景,選擇和編制客觀性、可靠度、有效性較高的測驗,收集學生行為表現(xiàn)的資料,把學生的行為表現(xiàn)與既定目標進行比較,根據(jù)評價結果修改教育方案。泰勒的教育評價理論具有評價結構嚴謹、操作性強、評價效率高以及優(yōu)化了教育評價的功能的優(yōu)勢。但他的教育評價模式是一種看重結果的總結性評價,沒能突出對教育過程的關注;過于強調目標化的評價活動,對一些非預期的教育目標無法評價;過于強調客觀性評價,對于無法量化的教育目標難以評價。
判斷時期(20世紀50-70年代)的教育評價強調價值判斷,基于對泰勒模式的質疑與超越而形成。這一時期的教育評價研究專家克隆巴赫(L.J.Cronbach)、斯塔弗爾比姆(D.L.Stufflebeam)、斯克里文(M.Scriven)等紛紛發(fā)表對教育評價的觀點,認為教育評價是指作出關于教育方案的決策,收集和使用信息;評價不應局限于評判者所確定的教育目標預期效果的達到程度,而應收集有關教育方案實施的全過程及其成果資料,評價應為決策提供信息;教學過程中的評價目的是形成適合于教育對象的形成性評價;提出了旨在評價非預期教育目標的目標游離評價模式。[4]1977年,畢比(C.E.Beeby)將評價定義為“系統(tǒng)的收集和解釋證據(jù),并以此作為評價過程的一部分,進而以行動為取向進行價值判斷”[5]613。這一階段的教育評價的特點是將評價視為價值判斷的過程,提出了評價為決策服務的思想,重視過程評價,關照到教育過程中的變化。但這一時期的教育評價將評價對象及相關人員排除在外,評價主體不夠多元。過于強調科學實證主義方法,忽視了其他方法的應用,形成了嚴格、固定的評價程序,缺乏必要的靈活性與彈性,評價方案的適應性較弱。[6]35-36
建構時期(20世紀70年代以后)的教育評價強調評價是一種“心理建構”過程,被稱為第四代評價理論。20世紀70年代初,前三代教育評價受到猛烈攻擊,認為傳統(tǒng)教育評價中心理實驗或心理測驗占絕對優(yōu)勢,但這類方法應用范圍狹窄,已無法解決教育評價中的復雜問題。[7]60-61建構時期的教育評價強調評價的多元化,評價應根據(jù)情景而定,應打破量化評價一統(tǒng)天下的局面,讓質的方法占有一席之地。該時期教育評價的兩種基本方法是回應性聚焦法和建構性探究法。但是,建構時期的教育評價也存在一些不足。一是強調知識和認識的相對性,看輕客觀性和絕對性,使評價容易陷入相對主義和主觀唯心主義的認識論誤區(qū);[8]二是建構時期的教育評價方法和流程復雜,對評價者和評價對象有較高要求,實踐中的阻力較大;三是建構時期教育評價既強調價值多元,又重申達成共識,使所獲評價信息資料的整合以及得出評價結論都陷入兩難。
縱觀教育評價的四個發(fā)展階段可以看出,評價的目的從以決策為中心向以人為中心轉變。評價的功能從依憑測量來增選適合教育的學生發(fā)展到評價教育活動是否達到教育目標,再發(fā)展到通過評價優(yōu)化教育決策,提高教育質量,促進學生發(fā)展。教育評價的方法從單一的教育測量到全面收集信息、定量與定性方法相結合,從靜態(tài)的終結性評價到動態(tài)的形成性評價。評價內容則從以課程內容為中心發(fā)展到關注學生全面發(fā)展的綜合評價。評價主體由單一向多元演變,學生逐漸成為不容忽視的評價主體。
進入新世紀以來,基于人才發(fā)展的個性化差異,滿足高校對多樣化人才的選拔需求,觀照不同地域教育發(fā)展不均衡、促進教育公平的社會訴求,在統(tǒng)一高考制度框架下,高考評價改革的多元化趨勢日益明朗。隨著基礎教育新課改的深入實施,以文化科目為主要指標的高考評價體系的局限性日漸顯露,如何多元、綜合、個性化地考查考生的素質與能力拷問著現(xiàn)行的評價體系。
1.高中學業(yè)水平考試與高考評價改革
2004年高中新課改推行后,高中學業(yè)水平考試逐步取代會考,成為衡量學生高中學業(yè)的水平性考試,率先進入新課改的廣東、山東、海南、寧夏同時宣布實行高中學業(yè)水平考試。一些國家重點建設的高水平大學開始探索自主選拔錄取改革,在選拔綜合素質高、有創(chuàng)新精神和潛質的人才方面,試行高考、高中學業(yè)水平考試和綜合素質評價與學校測試相結合的多元化評價選拔辦法。2014年《教育部關于普通高中學業(yè)水平考試的實施意見》對學業(yè)水平考試科目、內容、對象、時間、成績呈現(xiàn)和組織保障均做了詳細規(guī)定。[9]由此,高中學業(yè)水平考試與高考被捆綁在一起,成為高考成績、高中學業(yè)水平考試和綜合素質評價“三位一體”的高考評價體系的組成部分。
實踐中,各省市區(qū)新課改后的高考方案都以“分類考試、綜合評價、多元錄取”為綱領,構建新的高考評價體系,其中不乏學業(yè)水平考試的影子。2017年上海市啟動高考綜合改革,將高中學業(yè)水平考試分合格性考試和等級性考試科目,規(guī)定在合格性考試的基礎上將等級性考試的成績納入高考總分。浙江省則繼續(xù)將考生的高中學業(yè)水平考試成績同統(tǒng)一高考成績和綜合素質評價結果合成綜合成績作為通過“三位一體”途徑入學考生的選拔依據(jù)。
2.高中綜合素質評價與高考評價改革
配合新課改的推行,實施高中新課改的廣東、山東、海南和寧夏推出高中新課程一攬子方案,其中就包括綜合素質評價。隨后進入新課改的省市區(qū)也都積極探索建立了符合本地實際的綜合素質評價制度。2008年,教育部在《關于普通高中新課程省份深化高校招生考試改革的指導意見》中首次對綜合素質評價進行清晰定位,明確提出將其與高考評價相結合。2010年,《國家中長期教育改革和發(fā)展規(guī)劃綱要(2010-2020年)》要求“全面實施高中學業(yè)水平考試和綜合素質評價”,“改革教育質量評價和人才評價制度。做好學生成長記錄,完善綜合組織評價”,“普通高等學校本科招生以統(tǒng)一入學考試為基本方式,結合學業(yè)水平考試和綜合素質評價”。
實踐中,進入新課改的省市區(qū)相繼出臺新的高考實施方案和高中學生綜合素質評價實施方案,并將綜合素質評價納入高考評價,作為高校評價選拔新生的參考。由于綜合素質評價多以描述性、定性方式呈現(xiàn)結果,因而不量化、不計入高考總分,其與高考的關系多為“軟掛鉤”。[10]從綜合素質評價與高考評價體系關系的視角,受“分類考試、綜合評價、多元錄取”的改革導向驅動,北京、浙江、云南、廣東、江蘇等省市區(qū)都提出了“統(tǒng)一考試+高中學業(yè)水平考試+綜合素質評價”三位一體的新的高考評價體系,綜合素質評價在高考評價中的角色與功能是提供參照、作為評價選拔的依據(jù)。
1.高考評價實踐遠遠落后于理論發(fā)展
回顧歷史,教育評價作為現(xiàn)代教育活動中的重要手段,在早期發(fā)展階段曾經(jīng)歷了“測量=評價”的時期,二者混為一起,功能尚且沒有分化。隨后,測量與評價進入分化發(fā)展階段,各成體系。測量與評價的不同之處在于測量是反映學生水平的一種方式,所收集的信息有限,評價則通過包括測量在內的多種途徑收集信息,能夠對學生進行全方位的了解與評價。反觀目前的高考評價,仍有明顯的“測量=評價”時期的烙印,以考查記憶性、客觀性內容為主,評價方法單一,以分數(shù)為唯一取舍依據(jù)。由此可見,教育的評價理論已經(jīng)從最早的“測量=評價”,測、評功能不分的初始階段發(fā)展到測量與評價各自成為獨立的教育活動、發(fā)展出豐富的理論方法體系的今天,高考評價卻依然以最早的評價理論為根基,停留于測評不分的水平。由此可見,高考評價實踐遠遠落后于理論發(fā)展,最新理論成果在高考改革中的應用十分欠缺。這一事實與測評理論的發(fā)展優(yōu)化不相符合,與高考利益相關方對高考評價的改革期待相差甚遠。
2.對高考評價理論的應用脫離我國教育實際
布盧姆(Bloom)的認知目標理論是我國教育目標、考試目標劃分的主要理論依據(jù)之一,一段時間內我國高考評價目標體系建構完全照搬該理論。這其中的問題是,布盧姆的理論是從一般意義上的教育目標劃分,而我國長期具有按照學科劃分教育目標的傳統(tǒng)。曾經(jīng)所有學科都是照搬識記、領會、應用、分析、綜合、評價六個層級的目標,沒有體現(xiàn)出學科目標特點。這一問題同樣存在于高考評價目標的劃分上。高考也是按照科目考查學生能力,理論上理想的高考評價目標應是先有國家目標,將國家目標分解到科目目標、內容模塊目標、題目目標。其中,不同科目、不同知識內容模塊、具體到不同題目分別承擔不同的考查目標。所有考查目標關系清晰、層次分明、職責明確,共同支撐總體考查目標。
但目前的高考評價目標較為混亂,一是沒有處理好高考評價目標與高中課程目標的關系,高考評價目標與高中課程目標的關系不夠明確。如新課改后高考語文的考查目標是識記、理解、分析綜合、鑒賞評價、表達應用、探究六個層級,高中新課改后語文課程目標是積累整合、感受鑒賞、思考領悟、應用拓展、發(fā)現(xiàn)創(chuàng)新五個層級,二者之間有部分重疊,也有不同之處,關系若隱若現(xiàn),不夠明確。二是沒有處理好高考不同科目目標間的關系?;诟呖家钥偡诌x拔人才的現(xiàn)實,高考不同科目承擔不同考查任務,不同科目的考查目標應該是對總體考查目標的分解細化。但就目前實際來看,各個科目的考查目標各自為陣,以學科知識體系及特點為出發(fā)點設置考查目標,各個科目之間的目標互不關聯(lián),沒有形成合力。以文科考試科目為例,考查目標的表述體例不一,詳略不一,能力劃分標準不一。沒有形成邏輯清晰、分工合理、表述清晰的渾然一體、易于操作的高考評價目標體系。缺乏合力作用,不利于高考全面、綜合地評價學生。
審視教育評價理論的發(fā)展,最新理論成果已不滿足于對學生記憶性、客觀性知識的了解,不單純以數(shù)量化方式反映學生的水平,而是希望深入其內部認知過程,揭示學生應答題目時的知識運用、思維方式、邏輯推理、概念關系等認知過程,通過此方式深層反映學生所掌握的知識、具備的能力和潛力。由考試向評價的轉變,其實質是要改變以考試為唯一評價學生的手段,改變考試所反映的學生信息有限的狀況,引進更多評價方式,多途徑、全方位地考查學生。目前,高考評價距離這一理想圖景尚遠。但在由考轉評的改革呼聲下,高考的研究者和實踐者已向這一目標進發(fā)。其一,是將高考改革寫進規(guī)劃綱要,提出了“分類考試、綜合評價、多元錄取”的改革導向,重視發(fā)揮高考的評價功能。其二,高考的相關研究開始增多。成立了國家層面的考試指導委員會,研究、指導高考改革。教育評價的理論研究受到重視,大量介紹引進西方評價理論及最新成果。并努力將其中國化,為教育評價理論研究開闊了視野,奠定了基礎。教育評價理論的研究也逐步受到關注,系統(tǒng)的研究逐步出現(xiàn)。其三,在新的教育評價指導下的高考綜合改革實踐不斷涌現(xiàn)。各省市區(qū)研究新的高校招生錄取機制,將國考三科和省考三科進行組合,貼合學生的興趣特長和未來的職業(yè)走向。[11]同時自主招生考試評價改革和三位一體綜合評價改革亦日趨成熟。
高考評價目標對高考實踐發(fā)揮指導、規(guī)范、準則的作用,是高考評價體系建立、考試內容與形式選擇、高考命題以及分數(shù)解釋應用的前提基礎。高考標準化改革之前,高考評價基本處于經(jīng)驗的、傳統(tǒng)的、封閉的狀態(tài),考試內容與形式選擇、高考命題等以高中課本及教學內容為依據(jù),考試評價目標以選拔“德智體全面發(fā)展”的人才為主要內容,教育評價理論在高考評價中幾乎沒有體現(xiàn),尚未形成體系化的高考評價目標體系。[12]366隨著國外的教育評價理論被大量翻譯介紹進來,國內學者一邊研究理論,一邊試圖應用于指導考試實踐。尤以布盧姆教育目標分類理論為主要依據(jù),研究并實踐建立高考考試目標體系。通過幾年的實驗,人們日益認識到考試目標體系的重要性,認為考試目標體系應從人的全面發(fā)展的總體要求出發(fā),兼顧德智體美各方面以及知情意各個領域,注重學科本身特點,詳細編制每個學科的考試目標。[12]3691990年后,教育部根據(jù)布盧姆教育目標分類理論的認知領域,基于高中教學大綱目標與內容,開始編制每個學科的考試說明,并將考試目標寫進其中,改變了過去“以綱為綱,以本為本”的局面,使考生和命題者有了明確的復習目標和命題準則,提高了命題的科學性、試題難易度的穩(wěn)定性。[13]298-2992001年啟動的新課改中,布盧姆教育目標分類理論依然是高中課程目標和高考評價目標的理論依據(jù),高中課程目標和高考評價目標的建立都參照了教育目標分類理論。
自從20世紀80年代高考評價目標開始受到關注,布盧姆教育目標分類學理論一直是指導高考評價目標建立的理論基礎。目前,已經(jīng)形成了從國家目標到學科目標的高考評價目標體系。雖然該目標體系問題重重,但其對完善我國高考評價目標體系建構所起的作用不容小覷。
在“實現(xiàn)從考試到評價的躍升”的改革背景下,為了較好地體現(xiàn)高中新課改的反撥作用,實現(xiàn)為高等學校選拔優(yōu)秀人才的考試目標,高考命題不斷深化考試內容和形式改革,從實踐中總結命題規(guī)律,能力立意的命題呼聲日漸高漲。[14]作為對考試質量具有決定性意義的高考命題面臨種種改革壓力。2017年,包括福建、四川、廣東在內的八個省市不再自主命題,所有科目由教育部統(tǒng)一命題,全國只有北京、天津、上海、浙江、江蘇五省市仍采取自主命題,其余省市全部采用全國統(tǒng)一命題。即便省市自主命題范圍逐漸縮小,但絕不會消失,其命題思路將延續(xù)下來,繼續(xù)發(fā)揮優(yōu)勢。
新課改強調高考命題要以能力立意,科學命題。實現(xiàn)以能力立意的命題思路,體現(xiàn)新課程的理念和要求,促進“知識與技能、過程與方法、情感態(tài)度與價值觀”三維培養(yǎng)目標的實現(xiàn),則需注重考查考生獨立思考、分析問題和解決問題的能力,重視對知識的綜合應用能力和知識遷移能力的考查,重視對實踐能力和探究能力的考查。命題素材應力求貼近社會發(fā)展實際,貼近生活,創(chuàng)設具有鮮明時代特征的試題情境,從而引導學生關注社會、經(jīng)濟、科技和文化的發(fā)展。要實現(xiàn)以上命題目標,從命題技術角度,需依靠先進的計算機信息技術,進行題庫建設與完善,并利用教育測量技術,檢測試題的信度、效度、難度和區(qū)分度,以實現(xiàn)選題嚴謹、內容完整、結構合理、評分科學的標準化試題。而教育評價理論中測試理論的發(fā)展為命題的科學性提供了較好的理論支撐。