劉振天 羅晶
摘要: 教育評價是一把“雙刃劍”,既有認知、說明、比較、激勵、改進、提升等正向功用,也有導致工具化和功利化、加劇趨同化和分化等消極影響??茖W用好教育評價這根指揮棒,對于促進教育事業(yè)健康發(fā)展、加快教育強國建設具有十分重要的意義?!吨泄仓醒?、國務院關于深化新時代教育評價改革總體方案》對教育評價改革做了全面系統(tǒng)設計和戰(zhàn)略安排,為今后的教育評價改革指明了方向。以此為基礎,扎實推進高等教育評價改革,有效發(fā)揮其正向功能,克服負面作用,一是要破除“五唯”,復歸高等教育評價本來目的;二是要強化分類評價,促進高校多樣發(fā)展和特色發(fā)展;三是要穩(wěn)中求進,探索新的評價方式;四是要強調多元主體評價,推進評價治理現(xiàn)代化。
關鍵詞:高等教育;教育評價;“五唯”;“雙刃劍”;分類評價;多元主體評價
中圖分類號:G640 文獻標識碼:A 文章編號:1672-0717(2021)01-0004-09
2020年10月,中共中央、國務院印發(fā)《深化新時代教育評價改革總體方案》(以下簡稱《總體方案》),以新時代我國面臨的新形勢新任務新使命為出發(fā)點,以立德樹人為主線,以破“五唯”為導向,以建立中國特色、世界水平的教育體系為目標,對教育評價改革做了全面系統(tǒng)設計和戰(zhàn)略安排。《總體方案》一經發(fā)布,便引起高教戰(zhàn)線以及社會各界廣泛關注和熱烈討論。如何破除“五唯”,興利除弊,科學用好教育評價這根指揮棒,促進教育事業(yè)積極健康發(fā)展,是一項值得深入研究的重大理論和實踐課題。本文僅就切實推進高等教育評價改革,發(fā)揮評價正向功能,有效克服其負面作用談幾點認識。
一、高等教育評價與質量保障:一場方興未艾的運動
高等教育評價是一項歷史悠久的教育活動,幾乎與高等教育同時出現(xiàn),相伴而生。但它作為一項規(guī)范化、制度化和專門化的教育活動,卻還是晚近的事,尤其是進入20世紀之后,它才得到迅速發(fā)展。這主要緣于以下幾個方面:一是現(xiàn)代工商業(yè)活動中日益強化產品和服務質量,強化成本核算、質量控制和質量評價,并形成了較為系統(tǒng)成型的質量管理、質量控制和質量評價的理論與模式,由此迅速影響到社會其他生活領域,從而有力地促進了教育評價實踐與探索;二是隨著世界生產、經濟和技術不斷發(fā)展,相應地,高等教育規(guī)模不斷擴大,日益成為一項龐大的事業(yè)和產業(yè),也越來越需要源源不斷的公共資源投入保障,而作為資源的供給方以及產品的需求方,政府、社會及公眾開始關注高等教育質量,并不斷加強對高等教育質量的評價與問責。尤其是20世紀70年代后期,一些發(fā)達國家出現(xiàn)了財政危機,教育投入逐漸下滑,進一步刺激了政府和社會基于高校資金使用效益和教育質量評價的撥款行為;三是國際、區(qū)域以及高等教育機構之間的教育質量競爭與合作,顯著拓展了高等教育評價范圍,提升了高等教育評價影響力。當代高等教育評價已不再是一項簡單的活動或工作,而變成了長期性、穩(wěn)定性與規(guī)范性的制度體系。有資料顯示,目前世界上200多個國家和地區(qū)中,有180個以上建立了本國或本地區(qū)的高等教育評價制度及其質量保障體系,開展經常性周期性的質量評價活動[1]。美國國內有6大區(qū)域高等教育質量認證機構,負責對全國4 000余所高校的教育質量進行評價,同時還有近60家專業(yè)認證機構對全國高校專業(yè)進行質量認證,從20世紀初期至今已經開展了一個多世紀的高等教育質量評價活動;英國的大學基金會(UFC)和高等教育質量保障署(QAA)是兩大著名的評價機構,對英國高校的科研、學科以及教學質量進行評價。法國、德國、澳大利亞所建立的高等教育質量保障和評價體系在世界上也有較大影響。在亞洲,日本、韓國、印度、馬來西亞、菲律賓以及我國香港、臺灣地區(qū)也建立了規(guī)范系統(tǒng)的高等教育質量評價制度,日本、印度等國每五年進行一次高等教育質量評價,菲律賓大學評價已實施了八個輪次。20世紀80年代開始,世界范圍內掀起了高等教育質量保障的評價運動。受其影響,雙邊、多邊性區(qū)域的以至國際的高等教育質量評價聯(lián)合組織紛紛建立,開展國際的或區(qū)域的高等教育質量互認與評價,如旨在促進歐洲高等教育質量一體化的博洛尼亞進程(Bologna Process)。此外,像都柏林協(xié)議(Dublin Accord)、悉尼協(xié)議(Sydney Accord)、華盛頓協(xié)議(Washington Accord)以及國際高等教育質量保障機構聯(lián)盟(INQAAHE)、亞太高等教育質量保障聯(lián)盟(APQN)等,也都是公認的跨國性高等教育質量評價組織,在高等教育評價和質量保障中發(fā)揮著獨特的作用。
就我國而言,高等教育評價晚于其他國家,基本上是從20世紀80年代開始起步的,但起點較高,發(fā)展較快。改革開放后,我們加強了對世界高等教育的認識和了解,有目的地介紹高等教育評價和質量保障,少數(shù)高校開設了教育評價學專題研究,在師范大學本科教育和綜合大學研究生教育中增加了教育評價學課程及其學科方向,成立了教育評估學研究團體,出版了相應刊物。尤其是1985年,在我國教育發(fā)展史上具有劃時代意義的重要文件《中共中央關于教育體制改革的決定》首次提出“政府要組織知識界和社會界對高等學校辦學水平和教育質量進行評估”,拉開了教育評價理論和實踐之大幕。隨后,原國家教委在部分理工科院校開展了工科專業(yè)教學及課程評估,總計約有500個專業(yè)和課程點參與其中,積累了重要的經驗。以此為基礎,1990年,原國家教委出臺了我國高等教育史上第一部高等教育評估法規(guī),即《普通高等學校本科教育評估暫行管理辦法》,對高等教育評估目的、意義、原則、內容、組織程序、方法、結論及其使用等作出了一系列規(guī)定。國家教育行政主管部門于1994年開始對改革開放后新建院校本科教學工作進行了合格評估,1996年開始對擬申請國家“211工程”重點建設高校的本科教學工作進行了優(yōu)秀評估,1999年開始對其他類型的高校本科教學工作進行了隨機性水平評估,總計有254所高校接受了此三類評估。2002年,教育部將三類評估統(tǒng)整為一種類型,即普通高等學校本科教學工作水平評估,并于2003年至2008年間,對全國589所高校本科教學工作進行了首輪評估。2011年,國家對高校本科教學水平評估方案進行了重新調整,實施新一輪的合格評估和審核評估,到2019年底,有240余所新建院校和650所老本科院校分別接受了合格評估和審核評估。
在對高校本科教學工作進行整體性評估的同時,我國還致力于本科專業(yè)認證和研究生與學位教育評估(一級學科評估)。專業(yè)認證同樣始于20世紀80年代中期,起初從建筑類專業(yè)試點先行,90年代擴展到所有工程專業(yè)和醫(yī)學專業(yè),2018年開始師范類專業(yè)認證,期間先后約有3 000個專業(yè)接受了認證。2016年,中國工程專業(yè)認證協(xié)會成功加入華盛頓協(xié)議,成為其第18個會員單位,標志著中國工程專業(yè)教育質量獲得了世界認可。我國研究生與學位評估始于2004年,至今已開展了4個輪次。本著自愿申請參加的原則,越來越多的高校參加到學科評估中來,使該項評估成為目前國內影響最大、聲譽最高和結論最可靠的評估類型。此外,高等職業(yè)教育人才培養(yǎng)水平評估以及適應社會能力評估也同步進行。該評估由國家統(tǒng)一標準,由各省具體組織實施,先后進行了三個輪次評價,所有的高職高專院校均接受了評估。
無論是本科教學評估、專業(yè)認證,還是學科評估和職業(yè)教育評估,都是政府直接組織或委托具有官方背景的事業(yè)單位實施的。除此以外,還有一類評價,就是社會第三方機構,如新聞媒體、基金會、校友會、高校、研究院所等實施的,主要是基于公開數(shù)據(jù)的各類大學排名,包括綜合排名和專項排名。目前,比較有影響的國際大學排名有美國新聞與世界報道(US-News)、泰晤士高等教育(THE)、湯森路透(QS)和上海軟科(UR),各高等教育大國都有不少大學排名機構。我國現(xiàn)有高校排名機構近40家,每年都發(fā)布排名。
美國學者E·格威狄·博格教授說,21世紀是教育質量及其評價的世紀[2]。只要有高等教育的地方,就少不了評價、排名,想繞過評價和排名幾乎是不可能的。由此可見,高等教育評價不僅僅是客觀存在,而且種類、形式越來越多,活動也越發(fā)密集頻繁,呈現(xiàn)出生機勃勃的勢頭。
二、高等教育評價“雙刃劍”的正向價值及其功用
如前所述,教育評價之所以方興未艾,之所以成為世界高等教育質量保障運動的重要形態(tài),主要取決于高等教育評價的價值與功用。這種功用或價值,既可以訴諸主觀的情感表達,也可以訴諸客觀的事實;既可能是基于當下現(xiàn)實的,也可能是基于未來期待的。但無論如何,高等教育活動需要科學合理的評價,現(xiàn)代高等教育更是無法離開評價。其一,評價為高等教育活動提供了辨識、反思、調整和改進修正的機會。人類的教育是有目的的活動,從一開始便深深打上了意識的印記,接受人的意識支配。正如馬克思所說,蜜蜂建筑蜂房的本領讓人間許多建筑師感到慚愧,但是,再蹩腳的工程師也比蜜蜂高明的地方,在于他在建筑房子之前,勞動的成果便在他的頭腦中以觀念的形態(tài)存在著[3]。這是人的活動與動物本能之間的根本區(qū)別所在。杜威認為:“在所有深思熟慮的、有計劃的人類行動中,無一不受對欲達目的之價值鑒定的左右。”[4]所以,評價是人的目的性活動的能動反映,它貫穿于活動過程始終,進而將人自身的教育活動時時拉回到它的原點,辨識其出發(fā)點,反思教育活動與目標原點或出發(fā)點的一致性。這不僅有益于考察活動過程是否符合或達成預期目的,還可及時發(fā)現(xiàn)活動與目標原點之間的差距及其偏離狀況,使活動能夠按照既定的目的順利推進,并能在目標與行動之間相互檢驗和修正,增強活動的方向性、清晰性和有效性??梢哉f,正是由于有了教育評價,人們才能不斷認識教育自身、不斷交流學習、不斷修正錯誤、不斷增進經驗,進而促使教育發(fā)展進步。其二,教育評價具有重要的激勵價值。教育評價(Educational evaluation)是對教育目標及實現(xiàn)目標的教育活動進行分析和價值判斷的過程。這種判斷過程有兩個方面,一方面是縱向回溯式的,著眼于與自身過去效果的比較,從而看活動發(fā)展進步的程度;另一方面是橫向開放式的,著眼于與自身之外他人相應活動的比較,看活動過程效率、效果與效益。無論與自身比較,還是與他人比較,在比較中其結果無論是進步的或是退步的,都能夠產生正向激發(fā)動力的功用,從而進一步增強活動的效能。教育之所以不斷發(fā)展,就是源于通過自我評價與相互評價,產生競爭力?,F(xiàn)代社會,教育評價往往是資源分配和獲得的重要手段,也是科學地開展教育實踐活動和提升教育質量的重要抓手。
上面討論的是一般的理性認識。從實踐看,高等教育評價之于高等教育活動的發(fā)展就更為直觀而顯著。這就是人們通常所說的,評價是高等教育發(fā)展的指揮棒、方向盤,是促進高等教育發(fā)展的強力杠桿,是檢驗高等教育活動效果的測量儀。其具體表現(xiàn)就是通過以評促建、以評促改、以評促管、以評促強,能起到促進高等教育發(fā)展不斷走向卓越和提升品質的效用。以我國為例,它不僅鮮明地反映在高校本科教學評估工作中,也鮮明地反映在專業(yè)認證、學科評估和各類大學排名活動中。
我們先以本科教學評估為例加以說明。本科教學評估是我國政府實施和推動的旨在重視和加強本科教育與人才培養(yǎng)的評價工作。這項活動始于20世紀80年代,90年代開始擴大評估范圍,進入新世紀,建立起了周期性的本科教學評估制度,所有高校的本科教學工作都需要接受政府組織的評估。本科教學評估從開始至今30余年時間,先后經歷了評估試測試點、水平評估、審核評估三個輪次,近千所高校接受了評估。無論是合格評估、水平評估還是審核評估,都對促進本科教學發(fā)揮了重要作用。就近期實施的合格評估而言,它為高校提供了辦好合格本科教育的目標方向以及基本遵循,即如人們普遍反映的,合格評估倡導的“三個基本”(教學條件基本達標、教學管理基本規(guī)范、教學質量基本保證)、“兩個突出”(突出為地方經濟社會服務、突出培養(yǎng)應用型專門人才)和“一個導向”(內部質量保障體系)及其具體評估指標體系,之于新建本科院校,無疑提供了教科書般的標準。由于合格評估是政府組織實施的,具有極大的權威性和動員力,因此,其引導和促進建設的作用也極為顯著。有資料表明,參加合格評估的所有新建本科院校,均將自身定位為地方性應用型。80%以上的新建高校通過努力,在經費投入、生師比、辦學條件、專業(yè)與課程、產教結合、實踐教學等方面,基本達到了合格評估要求的標準,尤其是評建之年,各項指標明顯高于平常水平。就審核評估來看,總數(shù)超過600所的高校評估實際狀況顯示,參評高校普遍實現(xiàn)了審核評估提倡的“一個堅持”(堅持以評促建、以評促改、以評促管)、“兩個突出”(突出內涵發(fā)展、突出特色發(fā)展)、“三個強化”(強化辦學合理定位、教學中心地位、質量保障體系建設)的目的,更加符合審核評估主張的“五個度”標準,辦學定位更加注重對國家和社會需要的適應度,辦學條件和教學管理更加強調保障度和有效度,教育教學過程追求達成度和社會滿意度。
一般認為,作為整體性的高校教學評估,是高校教育教學質量建設的最先一公里,而作為專門性的專業(yè)認證工作,則被視為高校質量發(fā)展的最后一公里。專業(yè)認證深入到每一個具體的專業(yè)建設、課程建設、教材建設和師資隊伍建設,深入到每一位教師的教學工作。專業(yè)認證倡導“學生中心、成果導向、持續(xù)改進”的現(xiàn)代理念,在具體教學評價中,進一步將學校辦學定位細化為培養(yǎng)目標,進而再細化到專業(yè)目標、畢業(yè)要求、課程體系、教學策略、教學組織、教學方法和教學評價過程中,使其每一環(huán)節(jié)自上而下實現(xiàn)層層落實、壓實和轉換,自下而上實現(xiàn)層層支撐和目標達成;專業(yè)管理者和每一位教師都應該清晰自己的工作與專業(yè)教學目標各方面、各環(huán)節(jié)之間的關聯(lián)程度、實現(xiàn)程度,做到會教、會講、會導、會研,從而大大提升教學過程的針對性和有效性,有利于大面積提高教學質量。通過專業(yè)認證的高校,其教學的科學性合理性、教師及管理者教學理念的先進性系統(tǒng)性、教學實際效果等,都顯著優(yōu)于那些未接受過專業(yè)認證的高校。
學科評估主要以學位和研究生教育一級學科進行評價與排名,分為人才培養(yǎng)、師資水平、科學研究、知識轉化和國際化辦學等指標。評估結果分為A、B、C三個不同等級,第一等級內部再具體分為三個層級,如A+、A、A-等,依此類推,一共分為九個層級,實際上相當于以學術活動及其成果為標準,將不同高校分為不同的等級。換言之,學科評估是高校學術水平上下高低的排名榜。這對于高校學科建設、學術研究和人才培養(yǎng),起到了巨大的推動作用。高校為了實現(xiàn)學科突破和水平提升,不斷加大學科建設力度、人才引進力度、學科整合力度和質量管理力度,加大了科研獎勵力度,整體上有力地促進了高校學科建設和水平提升。
大學排行榜是典型的社會評價,以公開發(fā)布的公共數(shù)據(jù)為基礎,通過一定的指標體系結構賦值,將不同高校的整體辦學或者學科專業(yè)單項狀況,以直觀的得分形態(tài)呈現(xiàn)出來。大學排行榜在社會上影響很大,往往成為學生及其家長升學擇校、社會選人用人的重要依據(jù)和參照。一些高校十分重視大學排行榜的作用,通過分析其內容結構、側重點、發(fā)展趨勢以及社會公眾態(tài)度等,甚至以排行榜指標來調整學校的辦學方向和修正辦學策略,以爭取更好的位置,提升學校的名望和聲譽。在我國,國際上四個著名排名榜對一流大學的影響巨大,尤其是排行榜中師資力量、科研成果、知識轉化、課題獎項等,往往成為大學競相追逐的風向標,在某種程度上發(fā)揮了激勵大學不斷力爭上游的重要作用。
學術界一直認可和盛行的論文、課題、影響因子、成果獲獎、人才稱號等所謂“四唯”或者“五唯”評價現(xiàn)象,實際上是高校教師職務晉升、資源分配、榮譽獎勵等的重要依據(jù),深受教師重視。實事求是地說,這些評價指標和標準,在很大程度上激發(fā)和促進著高校教師知識生產與再生產的熱情和干勁,中國科技事業(yè)因此而突飛猛進,迎來了高速發(fā)展的黃金時期。統(tǒng)計顯示,2016年,我國發(fā)表的學術論文42.6萬篇,首次超過美國(40.9萬),躍居全球第一;發(fā)表的SCI論文數(shù)自2008年以來連續(xù)12年排名世界第二位[5]。這些成績的取得,不能不歸功于“四唯”或“五唯”評價因素,正是它們極大地提高了學術界知識生產的數(shù)量和效率。
三、高等教育評價“雙刃劍”的負向作用及其成因
任何事物都有兩面性,教育評價也像一把鋒利的“雙刃劍”,在表現(xiàn)并發(fā)揮其正向價值和功用的同時,呈現(xiàn)出負面作用。人們之所以提出改進評價工作、破除“五唯”等一系列要求,原因就在于評價工具、評價制度和評價工作本身出現(xiàn)了不合理的導向,給教育實踐帶來了消極影響。其主要表現(xiàn)在以下幾個方面:
一是教育評價會進一步強化外部行政權力,使高校辦學、教育教學受到外部力量左右,進而侵蝕和降低高校辦學自主權以及學術自由。如前所述,教育評價對教育活動具有鑒定、證明、引導、激勵和改進的作用,即通常所說的以評促建、以評促改、以評促管、以評促強。教育評價所以如此,足以說明評價是一種權力。教育評價的主體,來自不同的利益相關方,既可以是政府,也可以是社會中介機構,還可以是社會用人部門、公眾、媒體、學生以及家長,當然也包括高校自身。從實際情況看,中外高等教育評價主要是由政府或者經政府許可的、代表政府和社會對高等教育行使評價與問責的第三方機構組織實施的,因此體現(xiàn)了政府和社會的意志。按照美國著名教育家、加州大學總校校長克拉克·科爾的觀點,政府、高校與社會是一種呈三角形關系域的不同力量,形成了不同的治理結構。強化任何一方力量及其關系,都可能會導致另兩方力量與關系的削弱。不過,不同的國家,三角形的結構及其力量有所不同。在西方,長期以來,受新自由主義思想影響,高等教育奉行著學術自由、大學自治和教授治校,政府對高等學校的影響力較為薄弱,但20世紀80年代金融危機之后,政府對高等教育開始加以干預,行政權力有所抬頭。20世紀80年代開始的世界范圍內的高等教育質量保障運動,在一定意義上可以看作是政府及社會綜合發(fā)力的產物。政府借助于教育評價和質量保障,將外部標準自然而巧妙地轉化為大學的辦學質量標準和行動規(guī)范,評價對高校產生了思想和行為規(guī)制效用。當然,這也引起了高教界和知識界的警惕和憂慮,不少學者明確提出評價是新干預主義、行政主義和管理主義,反對評價對學術自由和大學自治的限制。
我國高等教育長期以來實行的是政府集中統(tǒng)一領導和管理的制度。這種制度有其客觀歷史必然性,也確實有其優(yōu)勢,但同時也有不少缺點和問題,主要是政府管得過多、過細、過死,高校缺少辦學自主權,缺乏主動面向社會辦學的意識和能力,高等教育生機活力不足,特色不顯,辦學模式趨同,質量和效益不高。因此,改革開放之后,高等教育體制改革中重點解決的就是理順政府與高校的關系,政府簡政放權,擴大高校辦學自主權,政府職能由過去計劃經濟時代的過程管理轉變?yōu)楹暧^管理和服務。這種宏觀管理的手段,就是從以往過分依靠行政許可與審批的方式手段,過渡到主要依靠法律的、信息的、經濟的、行政的、評價的等綜合方法。然而,政府在轉變職能過程中,我們看到,前置性的許可與審批確實明顯減少,但對高校辦學過程與結果的評價、評估、審計等卻不斷加強,以致于來自政府的評價、評估、評審、評比越來越多,重復評價評估現(xiàn)象較為嚴重,不同的評價、評估相互之間存在矛盾,影響和干擾高校正常辦學和教育教學秩序,高校受累于評價評估。如此,教育評價評估非但未能減輕高校負擔,反而進一步增強了政府的行政權力,弱化了高校的辦學自主權。換言之,計劃經濟時代政府行政權力在于起始的審批和許可環(huán)節(jié),但當前政府的行政權力卻來自過程與結果評價,簡化后的審批和許可權力變相轉移到過程和結果評價之中,政府熱衷于設置評價標準并運用評價手段指導、干預和管控高校,從而形成了評價規(guī)制與評價霸權,教育評價進而走到高等教育管理體制改革方向的反面。教育評價成為管理主義的代名詞,成了高校發(fā)展新的“緊箍咒”。
二是教育評價導致高等教育活動目標外在化、片面化和功利化。教育評價本身是行為主義的產物,也就是說,任何事物在評價那里或者對于評價而言,均需要將其轉化為可觀察、可測量、可操作的對象,將內在轉化為外在、內隱轉化為公開、定性轉化為定量、整體分化為部分,最后用一種相對確定的數(shù)據(jù)、數(shù)字或者可描述的語句,還原出整體的狀況。無論是學科評估、教學評估、專業(yè)認證中各級指標體系,還是林林總總的大學綜合排名與專項排名標準體系,無不如此。由于事物原本是不可分割的整體,但為了評價、為了說明、為了驗證,必須把事物進行逐層分析,在思想和行為上分解為不同的部分與方面,尤其是分解為那些可以用來觀察和測量的部分,這樣就必然會丟失某些部分,特別是失去那些無法用數(shù)量反映的內在成分。而事實上,這部分對事物本質的認識和揭示更為重要。如此一來,便不能從根本上完整準確地說明和反映事物的全貌,就必然導致評價失真。評價結果所還原出來的整體,已經不再是事物原本的整體,它不是遠離事物本體,便是背離事物的本體。建立在數(shù)據(jù)、定量、行為等可測量指標基礎上的教育評價,一定程度上是對事物的一種片面反映和說明。這一點,可以從近幾輪次政府開展的教學評估、學科評估以及大學學術排名、教師職稱評審等方面得到集中體現(xiàn)。例如,高校學科本來是人才培養(yǎng)、科學研究、學術交流、成果轉化以及知識生產與再生產的主體,但長期以來,學科評估對人才培養(yǎng)重視不夠,學科評估中雖然也有人才培養(yǎng)質量指標,但僅僅是少數(shù)幾個標志性數(shù)字,如高校生師比、國家級教學成果獎數(shù)量、國家級精品課程數(shù)量、專業(yè)教學實驗室數(shù)量等。很顯然,完整豐富復雜的、富有價值與情感因素的、反映人與人關系本質的教學活動,最后只是簡化為這幾個數(shù)字,這樣的教學還有什么生命力、想像力和豐富力可言?這些數(shù)字表達出來的教學,能夠被認同和還原為實際教學質量嗎?同樣,教師的學術水平僅僅用文章發(fā)表、科研課題、到賬經費、文章影響因子來評價,會造成許多問題甚至出現(xiàn)笑柄。最近,國際一知名大學排行榜將山東某兩所省屬高校數(shù)學學科分別排列為亞洲第一和第五,遠遠高于被公認為一流水平的北京大學等高校,原因就出自簡單化的只計文章數(shù)量和高被引率,不計論文質量。而論文引用是可以人為操作的,這是內外夾攻的片面化和表面化。
與片面化表面化相應的,教育評價還容易造成功利化。由于評價總是與質量、聲譽、資源分配、能力或水平等聯(lián)系在一起,所以評價往往被行政部門、高校、教師甚至社會異常重視并利用。人們追求好的評價結果,希望通過評價提高聲譽、獲得資源和改變命運,故而在評價評估評審中,不可避免地出現(xiàn)使評價有利于自身利益的動機和行為,甚至出現(xiàn)弄虛作假、夸大其辭、不良公關等現(xiàn)象。這不僅與評價初衷相違背,更與教育活動價值與本質目的相背離。教育評價在一定程度上助長和強化了辦學過程以及學術活動的功利主義傾向,無論是本科教學評估、專業(yè)認證、學科評估,還是大學排名中,這一傾向都有相當程度的存在。這些評價、評估和排名,都設置很多標準與指標,而標準和指標卻是高度概括甚至是劃一雷同的。但高校為了取得好的評價結果,往往機械照抄、迎合標準和指標要求,按圖索驥、對號入座甚至削足適履,唯恐遺漏、偏失對自身不利,在劃一的教育評價標準面前,高??桃鈱⒆陨韺嶋H、差異與個性掩蓋或掩藏起來,這是功利性最明顯的表現(xiàn),也是最不良的表現(xiàn)。同樣,學術評價中過分強調論文數(shù)量、影響因子、獲獎以及科研項目,使高校教師和科研人員圍繞數(shù)量指標運轉,忘記和扭曲了學術研究的本質與價值。在那里,論文發(fā)表、文章數(shù)量、影響因子、科研項目和經費成了目的,嚴重影響和制約了學術活動的純度和深度,為發(fā)表而發(fā)表,以致學術不端、投機取巧、急功近利和浮躁之風較為嚴重,且不是個別現(xiàn)象。這種異化,正如荷裔學者格特·比斯塔所言,評價已經從工具僭越成為教育的核心、評價結果成為決定教育政策的主要參照、教育也從促進生命成長的活動變成了僵化的管理行為,如果任其發(fā)展,將會導致教育價值和目的的失語[6]。
三是教育評價會使教育活動加劇分化,造成事實上的教育不平等。從宏觀結構上來看,高等教育有類型、階段之分,也有區(qū)域之別;從外部因素來看,經濟收入、政治環(huán)境、文化風俗、歷史傳統(tǒng)各異,影響高等教育發(fā)展水平與習性;從內部因素來看,學生生源素質、個性特長以及學校校風校紀、特色優(yōu)勢不盡相同,在諸多因素的形塑之下,教育呈現(xiàn)出多樣化狀態(tài)。在這種情景之下,即使評價指標再精細,也無法顧及其方方面面。然而,問題恰恰就產生在這里:為了評價客觀、準確和高效,評價者往往采用相同的標準來評價不同高校、院系以至教師和學生。這樣做,不僅會導致這些不同主體與活動被動符合與適應外在客觀標準,沿著相同目標和方向運行,造成思路與模式趨同,而且更嚴重的是,在同一路徑之下將不同活動主體與活動效果區(qū)分為不同等級,并以此標識出不同的地位和資源獲得能力,會人為地造成新的不公平。在績效主義之下,其后果就是“強者愈強、弱者愈弱”,加劇了高校之間和個體之間在政治資本、經濟資本、社會資本和文化資本占有上的失衡,馬太效應日益明顯,教育不公平問題非但未能消除,反而會導致其不斷擴大與加深趨勢。這與新時代人民群眾對“更加公平更有質量”的教育之需求相背。
四、正本清源:高等教育評價興利除弊的路徑
高等教育評價的發(fā)展歷程,實際上是不斷總結經驗、發(fā)現(xiàn)問題,增進和累積正向價值,減少和克服負面效應的過程。當負面效應發(fā)展到一定程度,特別是導致違背教育規(guī)律,遠離教育價值,無助于教育目標使命時,就必須對其進行改革。這正是中共中央、國務院出臺《總體方案》的重要原因。
(一)破除“五唯”,復歸高等教育評價本來目的
《總體方案》開宗明義地指出,要改革教育評價這根指揮棒,系統(tǒng)構建體現(xiàn)黨的教育方針、社會主義辦學方向,符合教育規(guī)律、評價規(guī)律和人才成長規(guī)律的科學的教育評價體系,堅決破除唯分數(shù)、唯升學、唯文憑、唯論文、唯帽子的頑瘴痼疾。破“五唯”不是不要這些標準和指標,它們是評價教育質量、學術水平和能力的重要因素與條件,然而,如果將其推向極端化,那么教育評價標準便只有“一維”了,必將導致評價的外在化和功利化,形成不良的教育觀、人才觀和評價觀。教育評價要破除“五唯”,必須堅持科學發(fā)展、內涵發(fā)展、特色發(fā)展和創(chuàng)新發(fā)展道路。要回歸教育本質,喚起教育教學和學術生活內在的生命力,恢復人們對學習知識和發(fā)現(xiàn)真理本身的虔誠,防止形式主義和功利主義至上。
“五唯”之所以成為頑癥,并非一時興起的現(xiàn)象,而是長期積累和發(fā)展的結果,其中既有深刻的歷史、文化和心理等原因,也有直接的社會現(xiàn)實原因。一千多年的科舉制、知識分子讀書作官的心態(tài)是“五唯”問題產生的重要因素;新中國成立以來,尤其是改革開放以來實施的經濟、科技和文化全面趕超型發(fā)展戰(zhàn)略,也是教育評價和學術評價重結果輕過程、重外在輕內在、重短期輕長遠的直接因素,加劇了教育和學術評價的短期化功利化。經過幾十年建設和發(fā)展,我國已全面進入新時代,經濟總量躍居世界第二位,科技發(fā)展中許多領域已經擺脫了對發(fā)達國家嚴重依附的局面,個別領域取得了相對優(yōu)勢,整體上從以往的跟跑向并跑甚至領跑轉變。在這種情況下,我們不僅有了更加足夠的條件,也應該有足夠的自信和從容,真正去發(fā)展科學、發(fā)展教育,回歸教育和學術本心、回歸知識本位。在努力實現(xiàn)教育、學術、教學、辦學回歸初心的同時,我們也要清醒地認識到,單靠功利型追趕式科技和教育不是長久之計,根本路徑還是要靠基礎領域的重要創(chuàng)新。高等教育評價破“五唯”,就是堅守學術和教育本質、體現(xiàn)教育規(guī)律的一項功在當代、利在千秋的大業(yè)。
(二)強化分類評價,促進高校多樣發(fā)展和特色發(fā)展
“五唯”之所以是不良好的評價觀和指揮棒,其實質就在于將評價的多維變成了一維,即無視被評價對象的差異性而強行用統(tǒng)一的分數(shù)、升學率或者論文數(shù)量來衡量水平或質量,抹煞了事物的多樣性本質。
我國高等學??倲?shù)3 000余所,可謂千差萬別。不同的高校既有不同層次水平、不同科類和培養(yǎng)目標、不同服務面向,又有不同歷史傳統(tǒng)、辦學條件、社會期待等等,而同一高校內部各學院、學科和專業(yè)之間也有較大差異,客觀上來說不能用同一尺度和標準進行評價。但長期以來,由于評價中盛行的管理主義、技術和效率至上,高等教育評價中存在簡單化、標準統(tǒng)一化等現(xiàn)象,以致出現(xiàn)許多問題。如前面指出的高校工作中存在重科研輕教學問題,科研工作中重數(shù)量輕質量、重外在形式等級輕內在實質貢獻問題,等等,高校圍繞單一標準辦學,模式趨同缺乏特色。因此,必須對評價進行系統(tǒng)改革和系統(tǒng)設計。要根據(jù)高校不同發(fā)展目標定位、服務面向、發(fā)展階段、科類層次等,分別制定不同的評價標準,引導高校多樣化發(fā)展、特色化辦學。《總體方案》提出,要改進高等學校評價,推進高校分類評價,引導不同類型高校科學定位,辦出特色和水平。在本科教學評估中,要突出思想政治教育、教授為本科生上課、生師比、特色優(yōu)勢專業(yè)、用人滿意度等指標;在學科評估中要強化人才培養(yǎng)中心地位,淡化論文數(shù)、引用率、獲獎數(shù)等量化指標,突出學科特色、質量和貢獻。新的本科教育教學審核評估方案,已經分別按照一流大學、地方本科高校和新建本科院校進行了分類設計。其中,針對一流大學,側重評價其內部質量保障制度與機制運行狀況,使用質量保障體系評價方案;地方本科高校則使用教育教學工作方案,但方案根據(jù)不同高校學術性與應用性,進一步提供了可選擇的項目,高??筛鶕?jù)自身實際情況,進行相應選擇。新的學科評估方案,去除了論文數(shù)量、刊物級別、人才帽子等,突出了代表作及其評價,強化學術同行評價,重在學術水平和貢獻。這些都是重要的進步,代表了改革的方向??梢灶A見,新的分類評價對高??茖W辦學和特色辦學將產生積極影響和推動作用。
(三)堅持穩(wěn)中求進,探索新的評價方式
《總體方案》指出,教育評價要堅持科學有效的原則,改進結果評價,強化過程評價,探索增值評價,健全綜合評價,充分利用信息技術,提高評價的科學性、專業(yè)性和客觀性。實際上,它提出了新的更加科學有效的評價方式。
一是要改進結果評價。高等教育是有目的的活動,追求好的教育教學效果,包括教學、科研和服務效果,是必然的,也是必需的。但是,教育教學活動的結果是多方面的而不是單一的,不能將結果片面理解為學業(yè)分數(shù)、論文數(shù)、獲獎數(shù)、經費數(shù)、項目數(shù)等,培養(yǎng)德智體美勞全面發(fā)展的社會主義建設者和接班人,是教育的最終目的,也是最終結果。因此,一定要從全面的結果而不是片面單一的結果來理解教育結果評價。要堅持教育結果評價的全面性,還要堅持結果評價的科學性。如何評價學生品德?不能簡單地局限于一兩次好人好事,或者課程考試成績,而應該對學生的理想信念、思想認識、道德情操、意志品質和行為習慣等進行全面考核,以此作出全面的評價。
二是要強化過程評價。對他人以及對自身的認識與評價,不可能一時一地和一次性完成。結果的評價是在長期反復的認識和交往過程中獲得的,越是注重過程評價,結果評價就越是全面客觀。對大學教師的評價,也不能僅僅看其文章數(shù)量,而要看他們發(fā)展的一貫過程及表現(xiàn)。對一項學術成果水平的認定,不能只看刊物級別或者獲獎級別,還要看成果在學界的反應以及持續(xù)影響力。對學生評價,不能僅憑一兩次考試分數(shù)或者獲獎情況,要注重考察學生平時學習和生活中的各方面表現(xiàn)。
三是要探索增值評價。所謂增值評價,是一種相對評價,即相對于學校自身、教師和學生自身發(fā)展所開展的評價。增值評價不是組織之間或者個體之間的橫向比較,而是注重自我縱向發(fā)展與努力進步的程度,因此這是一種發(fā)展性的、過程性的、用自己的尺子衡量自己的評價。學術和教育的目的,不只是簡單比較誰高誰低,不只是培養(yǎng)少數(shù)尖子學生或者精英學者,還在于促進每一學生和學者的發(fā)展與進步,喚起每一個體的生命價值和生命活力。這是一種符合人的發(fā)展、人性發(fā)展的和諧發(fā)展觀與學術評價觀。長期以來,我們的教育和學術存在相當大的誤區(qū),就是過分重視橫向比較,過分強化競爭,這不僅導致高校師生負擔過重,更造成了畸形的人格、畸形的教育和畸形的學術。除了少數(shù)所謂成功者,絕大多數(shù)人成為學習和學術道路上的“失敗者”,無助于人的成長,無助于學術發(fā)展。因此,必須強化增值評價觀,使每一群體或個體都能體驗到進步的程度和進步的快樂。
四是要完善綜合評價。馬克思指出,人的本質不是單個人的抽象物,在現(xiàn)實性上,人是一切社會關系的總和。所謂總和,即人的活動總是涉及物質的、精神的,生產的、交往的、文化的、社會的、歷史的多方面內容,人的身心發(fā)展也必然受到其所在的經濟社會、歷史文化、風土人情等各方面因素的影響與制約。因而,對人的評價,包括對學生發(fā)展過程及其結果也需要從多方面進行綜合分析和評價,只有這樣,才能獲得對人對事的全面而完整的認識。過去評價學生或教師,總是單一標準,奉行學習成績與分數(shù)至上,或者唯論文唯文憑,三好、五好,歸根到底是一好,即學習成績好或科研成績好。這樣的評價既不公平又不合理,割裂了人的發(fā)展中政治與業(yè)務、知識與能力、品行與才智、做人與做事之間的統(tǒng)一關系,導致教育過程中出現(xiàn)許多問題。綜合評價,不僅是評價德智體美勞等多方面內容表現(xiàn),也在于運用多種方法和手段??荚嚒?、分數(shù)只是其中一個方面,日常生活考察、行為記錄、同行評價、自我評價等都是重要的評價形式,特別是借助于互聯(lián)網和信息技術,建立組織與個人發(fā)展大數(shù)據(jù),對個人品行、知識、能力、責任心和創(chuàng)新精神等進行經常性和連續(xù)性監(jiān)測,更有利于作出全面客觀的評價。
(四)強調多主體評價,推進評價治理現(xiàn)代化
改變評價標準單一、主體單一、方式單一情況,是教育評價改革的目標和方向。之所以強調和推進評價主體多樣化,原因就在于以往的評價一直由政府直接組織,政府作為高等學校的舉辦者和管理者,直接組織評價工作,管辦評不分,不能很好地體現(xiàn)評價的客觀性、公正性和專業(yè)性,不能有效反映不同利益方的利益需要,尤其是政府的權威性以及政策引導,往往導致評價目的性和功利性過強,評價手段與目的錯位。因此,需要改變政府單一評價和治理格局,構建多方評價主體共同參與、共同評價的新體系。一方面要轉變政府職能,推進管辦評分離和放管服結合,政府在制定評價政策和方針過程中,要聽取并反映不同利益方的意見和要求,增強高等教育發(fā)展和改革的針對性與適應性,積極充分相信、依靠和扶持發(fā)展社會中介組織機構,加強對中介組織機構的指導和規(guī)范,支持其獨立自主地開展高等教育評價工作,合理使用第三方評價結果。另一方面,社會中介組織機構要加強規(guī)范化和專業(yè)化建設,提升評價質量和水平,為政府、高校和社會提供高質量服務,促進高等教育科學發(fā)展和內涵發(fā)展。
多主體評價不是形式,而是建設現(xiàn)代高等教育治理體系的需要。除發(fā)展社會中介組織之外,還要依靠和充分發(fā)揮學術共同體、高校學術委員會、教授會在學術評價中的作用,大力推進同行評議制度建設,改變行政評價超越學術評價的狀況,制定學術同行評議規(guī)程,闡明其性質、地位、結構、功能以及活動方式,保證評價結果公平和程序正義,提升學術評價、同行評議的聲譽與質量。
參考文獻
[1] 劉振天.系統(tǒng)·剛性·常態(tài):高等教育內部質量保障體系建設三個關鍵詞[J].中國高教研究,2016(09):12.
[2] [美]E·格威狄·博格,等.高等教育中的質量與問責[M].毛亞慶,劉冷馨,譯.北京:北京師范大學出版社,2008:1.
[3] 中共中央馬克思、恩格斯、列寧、斯大林著作編譯局.馬克思恩格斯全集(第23卷)[M].北京:人民出版社,1972:202.
[4] [美]約翰·杜威.評價理論[M].馮平,余澤娜,等譯.上海:上海譯文出版社,2007:4.
[5] 佚名.2019年1月1日至2019年12月31日各國家和地區(qū)發(fā)表的SCI論文數(shù)量[EB/OL]. (2019-12-31)[2020-11- 06].https://tieba.baidu.com/p/6421616005.
[6] [荷]格特·比斯塔.測量時代的好教育[M].張立平,韓亞菲,譯.北京:北京師范大學出版集團,2019:4.
The Double-edged Sword Effects of Higher Education Evaluation: How to Seek Advantages and Avoid Disadvantages
LIU Zhen-tian LUO Jing
Abstract: Educational evaluation is like a "double-edged sword", which not only has positive functions such as cognition, explanation, comparison, motivation, improvement and promotion, but also has negative effects such as instrumentalization, utilitarianization, assimilation and differentiation. Scientific use of the baton of education evaluation is of great significance for the development of education and the construction of a strong educational country. The Overall Plan for Deepening Educational Evaluation Reform in the New Era makes a comprehensive and systematic design and strategic arrangement for the reform of educational evaluation, and points out the direction for future reform of educational evaluation. Based on the plan, four aspects are needed to promote the reform of higher education evaluation so as to maximize its positive functions and overcome its negative effects: firstly, we must resolve the deep-rooted problem of“five-only”and return to the original purpose of higher educational evaluation; secondly, we should strengthen classified evaluation to promote diversity and characteristics of colleges and universities; thirdly, new evaluation methods are needed to seek improvement while maintaining stability; fourthly, multiple-subjects evaluation is key to the modernization of educational evaluation and governance.
Key words: higher education; education evaluation; "five-only"; "double-edged sword"; classified evaluation; multiple-subjects evaluation
(責任編輯 李震聲)