常桐善
(1.加州大學(xué) 校長辦公室,美國加州 奧克蘭 94598; 2.華中科技大學(xué) 教育科學(xué)研究院,湖北 武漢 430074)
評估是高等教育運行的核心部分之一,也是保障教育質(zhì)量、踐行社會問責(zé)的關(guān)鍵。但如何確保評估的有效性,尤其是完成以評促改之初心,仍然是當(dāng)前教育管理部門以及高校面臨的艱巨挑戰(zhàn)。美國高等教育評估已有一個多世紀(jì)的歷史,為美國高等教育發(fā)展,尤其是高質(zhì)量大學(xué)群體的形成發(fā)揮了巨大作用,但評估效果仍然有與時俱進的提升空間。中國從21世紀(jì)初開始對高校本科辦學(xué)質(zhì)量和學(xué)科進行評估,經(jīng)過二十多年的發(fā)展建設(shè),已初步形成了反映中國高等教育辦學(xué)特色的模式,但成就、成效與困境并存。就中美高等教育評估而言,建設(shè)具有凝聚力的評估文化是改進評估效果、擺脫困境的關(guān)鍵所在。如理查德·賀士(Richard Hersh)和理查德·克靈(Richard Keeling)所強調(diào)的,營造校園評估文化是提升評估效果的關(guān)鍵……大學(xué)必須通過重構(gòu)評估文化凸顯大學(xué)教育和學(xué)習(xí)的優(yōu)先地位[1]。翟亞軍和王戰(zhàn)軍也指出:“重塑評估制度、重構(gòu)評估倫理和重塑評估文化,營造優(yōu)質(zhì)高等教育評估軟環(huán)境,已成為提升高等教育評估質(zhì)量的迫切需要?!盵2]
首先,美國常用的與評估活動相關(guān)的術(shù)語包括“evaluation”“assessment”“accreditation”“review”“appraisal”等。這些術(shù)語翻譯成中文時常用“評價”“評估”“認(rèn)證”“審核”等。除了“appraisal”通常是指教職員工的績效評價外,其他幾個術(shù)語雖然有各自特定的意思,如“assessment”常指學(xué)生學(xué)習(xí)成果評估,“accreditation”則特指認(rèn)證,“review”是專業(yè)/學(xué)科評價,但這些活動包含的內(nèi)容都與中國目前開展的本科教育質(zhì)量和學(xué)科評價相似。本文通用“評估”主要是與中國教育部高等教育教學(xué)評估中心名稱中使用的“評估”和學(xué)科評估中的“評估”保持一致,以便讀者理解相關(guān)內(nèi)容。所以,除了特別強調(diào)外,本文所闡述的評估文化建設(shè)均適應(yīng)于所有相關(guān)的評估活動。
其次,文化是一個非常復(fù)雜的概念,是人類社會發(fā)展過程中所創(chuàng)造的物質(zhì)財富和精神財富,也常常反映了特定群體在特定時期形成的對某一事物的習(xí)慣和信仰。高等教育評估文化就是在高等教育質(zhì)量領(lǐng)域形成的共識和大家共同遵循的習(xí)慣。艾莫斯·萊考斯(Amos Lakos)和雪萊·菲普斯(Shelley Phipps) 將其界定為:“評估文化(a culture of assessment)是組織基于事實、研究和分析制定政策的組織環(huán)境,并以此規(guī)劃學(xué)校提供的各項服務(wù),優(yōu)化教育成果,影響服務(wù)對象?!盵3]溫迪·威娜(Wendy Weiner)從高校的教育目標(biāo)、評估概念、教師參與、評估技能培訓(xùn)、評估計劃、學(xué)習(xí)成果評估、學(xué)科評估、大學(xué)效能、信息共享、改進行動等15個領(lǐng)域闡述了評估文化的塑造[4]。中國學(xué)者在評估文化方面的研究還不多。用“評估文化”和“評價文化”這兩個關(guān)鍵詞在中國知網(wǎng)查看相關(guān)研究論文,共查到42篇文章,而且只有一部分文章與本文闡述的高等教育評估文化有關(guān)。其中,張繼平從評估生態(tài)性角度對評估文化的界定比較完整。他強調(diào),評估文化是“促成評估主客體的思想、行為、動機、價值觀等和諧統(tǒng)一的氛圍與環(huán)境,在這樣的氛圍與環(huán)境中,參評高校能以平常的心態(tài)看待評估,以原始的狀態(tài)對待評估,以真實的‘面貌’示人,以形成客觀的評估結(jié)果”[5]。 顯然,評估文化涵蓋的維度非常廣泛。本文從評估組織管理、質(zhì)量標(biāo)準(zhǔn)、證據(jù)、參與、改進等五個方面簡單介紹美國評估文化的建設(shè)路徑。
組織管理是評估文化建設(shè)的基礎(chǔ),包括管理機構(gòu)、職責(zé)職能、人力資源等諸多方面的建設(shè)。美國高等教育評估的組織管理可以粗略分為三個層面:一是政府層面,包括聯(lián)邦政府與州政府,主要發(fā)揮政策導(dǎo)向作用,同時通過審批第三方評估機構(gòu)、經(jīng)費支持、貧困學(xué)生資助、問責(zé)、審計、績效評價等手段管理評估活動,并營造政府負(fù)責(zé)的評估法治文化氛圍;二是社會層面,包括第三方評估機構(gòu)、咨詢機構(gòu)和勞動力市場的默契配合,共同構(gòu)建有利于高等教育評估的社會文化環(huán)境;三是大學(xué)內(nèi)部的評估機構(gòu),這是三個層面中最重要的組織機構(gòu),形成了包括評估專家、教師、行政管理人員、學(xué)生在內(nèi)的評估委員會、學(xué)校層面的評估管理辦公室、學(xué)科/學(xué)院評估協(xié)調(diào)人員、提供數(shù)據(jù)分析的院校研究辦公室等網(wǎng)絡(luò)狀組織管理結(jié)構(gòu),是實施評估工作的主體,并在營造校園評估文化中擔(dān)負(fù)重要職責(zé)。當(dāng)然,這三個層面之間也通過各種評估實施工作、培訓(xùn)、數(shù)據(jù)交換、咨詢、問責(zé)、結(jié)果公開等形式開展密切合作,構(gòu)建彼此信任、信息透明的評估組織管理文化氛圍。
除了政府層面的管理機構(gòu)外,社會層面和學(xué)校層面的評估機構(gòu)都有強大的專業(yè)評估團隊。美國很多高校的高等教育學(xué)研究生專業(yè)設(shè)置評估、測量等方向,為美國高等教育評估培養(yǎng)了大批集高等教育管理、教學(xué)及評估理論和實踐技能相結(jié)合的評估學(xué)術(shù)研究和實踐人員。另外,美國高校的評估委員會通常是學(xué)術(shù)委員會的一個分委員會,或者是由教務(wù)長與學(xué)術(shù)委員會共同領(lǐng)導(dǎo)的由各學(xué)科教師和各領(lǐng)域行政管理人員組成的常設(shè)機構(gòu),為學(xué)校層面的評估工作提供專業(yè)指導(dǎo)。所以,學(xué)校層面的評估人力資源構(gòu)成不僅包括從事學(xué)術(shù)工作的專業(yè)人員,也包括從事評估的職業(yè)管理人員,形成了濃厚的職業(yè)與專業(yè)緊密結(jié)合、理論與實踐相輔相成的評估組織管理文化氛圍。
質(zhì)量標(biāo)準(zhǔn)是高等教育辦學(xué)的準(zhǔn)則,是評估賴以有效實施的前提。美國高等教育評估起源于20世紀(jì)初美國大學(xué)學(xué)會(Association of American Universities, 簡稱AAU)制定的以提升博士教育質(zhì)量為目的的博士專業(yè)質(zhì)量標(biāo)準(zhǔn),后來延伸為美國博士專業(yè)的學(xué)科評估標(biāo)準(zhǔn)。幾乎在同一時間,AAU也開發(fā)了本科教育認(rèn)證標(biāo)準(zhǔn)。后來區(qū)域認(rèn)證機構(gòu)相繼成立后,AAU終止認(rèn)證工作。但AAU通過規(guī)范大學(xué)辦學(xué)標(biāo)準(zhǔn)提升大學(xué)辦學(xué)質(zhì)量的行動開創(chuàng)了美國高等教育規(guī)范質(zhì)量標(biāo)準(zhǔn)的先河,對美國評估質(zhì)量標(biāo)準(zhǔn)共識文化的建設(shè)奠定了基礎(chǔ)。一百多年的認(rèn)證實踐也證明,質(zhì)量標(biāo)準(zhǔn)在評估中所展示的堅韌剛強作用是有效踐行評估工作的前提。
當(dāng)然,隨著高等教育體系的完善和穩(wěn)定,美國以問題為導(dǎo)向的評估日漸盛行。其中學(xué)校內(nèi)部開展的學(xué)科評估更加聚焦于解決學(xué)科發(fā)展的問題。例如,加州大學(xué)伯克利分校開展的學(xué)科評估就是圍繞一百多個問題診斷和分析學(xué)科發(fā)展面臨的困境,并有針對性地提供學(xué)科愿景發(fā)展策略。但學(xué)科評估仍然不能完全脫離與對標(biāo)高校的比較,也就是與行業(yè)質(zhì)量標(biāo)準(zhǔn)的比較,亦稱之為標(biāo)桿比較(benchmarking)。另外,過去二十多年來,美國高校實施的學(xué)生就讀經(jīng)歷(learning experience)、學(xué)習(xí)成果(learning outcomes)和增值(value-added)等評估為認(rèn)證、學(xué)科評估注入了新鮮的評估血液,使美國高等教育質(zhì)量從“輸入-輸出”(input-output)評估邁入了聚焦教育成果的“輸入-成果”(input-outcomes)的評估發(fā)展歷程。而后者,也更加關(guān)注質(zhì)量標(biāo)準(zhǔn),形成了“知己知彼”,共同提升的質(zhì)量評估文化。全國性學(xué)習(xí)投入調(diào)研(National Survey of Student Engagement, NSSE)[6]和研究型大學(xué)就讀經(jīng)歷調(diào)研(Student Experience in the Research University, SERU)[7]堪稱本科教育質(zhì)量標(biāo)準(zhǔn)共識文化建設(shè)的典范項目。
簡單地說,評估就是回答諸如教師教了什么、學(xué)生學(xué)到了什么、學(xué)生畢業(yè)后能做什么、如何改進辦學(xué)績效等問題的過程。顯然,證據(jù)是回答這些問題唯一令人信服的理由;沒有證據(jù)便無法衡量教學(xué)是否達(dá)到了質(zhì)量標(biāo)準(zhǔn),評估的有效性也便會受到質(zhì)疑。為此,大學(xué)必須構(gòu)建評估的循證文化,養(yǎng)成基于事實、研究和分析開展評估的組織環(huán)境和校園文化氛圍。事實上,評估的循證文化也是科學(xué)決策和質(zhì)量文化的重要組成部分??茖W(xué)決策模式的奠基人赫伯特·西蒙(Hebert Simon)提出的“信息收集-方案設(shè)計-方案選擇”的科學(xué)決策三步驟[8],以及羅素·艾可夫(Russell Alcoff)提出的“數(shù)據(jù)-信息-知識-智慧”(data-information-knowledge-wisdom)的金字塔決策模式[9]都非常清晰地闡述了循證決策文化的重要性和實踐路徑。這些模式也可用于詮釋和設(shè)計評估的循證文化建設(shè)路徑。
在循證文化建設(shè)的具體操作中,美國高校的經(jīng)驗是加強院校研究工作。美國高校的院校研究是20世紀(jì)50年代興起的,其初心是大學(xué)自查,后來拓展為通過數(shù)據(jù)收集、分析、報告,支持大學(xué)決策過程的組織機構(gòu)。事實上,院校研究興起的時期也幾乎與科學(xué)決策模式和計算機決策支持工具誕生處于同一時期,其發(fā)展與“商業(yè)智能”(business intelligence)所涵蓋的大數(shù)據(jù)建設(shè)、信息挖掘、網(wǎng)絡(luò)報告等領(lǐng)域的發(fā)展幾乎是同步的。在這樣的發(fā)展環(huán)境中,受信息時代信息文化的影響,院校研究也形成了別具特色、服務(wù)大學(xué)決策的高等教育院校研究文化。這種文化不僅在高校內(nèi)部根深蒂固,也得到了社會各界的廣泛認(rèn)可。更重要的是,大學(xué)賦予院校研究數(shù)據(jù)治理的重要職責(zé),自然就承擔(dān)評估數(shù)據(jù)的收集與分析。所以,院校研究文化為評估循證文化建設(shè)奠定了物質(zhì)基礎(chǔ),提供了文化養(yǎng)料。
帕特·哈欽斯(Pat Hutchings)曾強調(diào),教師參與評估是保證評估效果和教學(xué)質(zhì)量的“黃金準(zhǔn)則”,因為教師參與評估是評估結(jié)果能在課堂上產(chǎn)生影響的關(guān)鍵因素[10]。但目前的高等教育領(lǐng)域有一種非常奇怪的現(xiàn)象,那就是我們都在呼吁學(xué)生要積極參與學(xué)習(xí)等各類活動,但教職員工卻沒有積極參與能夠提升教學(xué)質(zhì)量的所有活動,評估活動就是其中之一。雖然部分教職工也參與了大學(xué)認(rèn)證、學(xué)科評估等活動,但并沒有把評估這項活動有效地與自己的教學(xué)、服務(wù)工作緊密結(jié)合起來。也就是說,目前的很多教學(xué)和服務(wù)活動是忽視質(zhì)量標(biāo)準(zhǔn)的。教師沒有把有利于提升教學(xué)質(zhì)量的有效設(shè)計嵌入到課程教學(xué)中,行政服務(wù)人員也沒有把改進教學(xué)質(zhì)量的有效理念融入到自己的行政管理決策之中。最為典型的例子就是“碎片化”教學(xué)、“碎片化”評估學(xué)生的學(xué)習(xí)成果。本文闡述的評估參與文化所強調(diào)的是將“評估”融入到日常教學(xué)活動中,形成按照質(zhì)量標(biāo)準(zhǔn)“吾日三省吾教”的習(xí)慣。但是要形成這樣的參與文化認(rèn)知,仍然是“路漫漫其修遠(yuǎn)兮”。
為此,美國高校的教務(wù)長于2009年就呼吁,更多的教師參與評估已成為提升評估效果的首要任務(wù)[11]。帕特·哈欽斯也提出了為教師參與評估敞開大門的六項建議:一是圍繞日常教學(xué)工作建立評估體系,將評估理念融入到課程設(shè)置和課堂教學(xué)設(shè)計中,包括教學(xué)計劃、課堂活動和課后學(xué)習(xí)任務(wù)的開發(fā)和考核體系;二是將評估培訓(xùn)嵌入到教師職業(yè)發(fā)展之中,提升教師的評估技能;三是將評估納入博士研究生的培養(yǎng)中,為他們未來從事教學(xué)工作和參與評估打好基礎(chǔ),美國密歇根大學(xué)、威斯康星大學(xué)已經(jīng)開始這樣的嘗試;四是同等對待教師的評估工作與學(xué)術(shù)研究,為教師積極參與評估活動、實踐評估理論創(chuàng)造激勵環(huán)境;五是構(gòu)建教師之間的評估對話機制和校園評估文化,為不同高校相同學(xué)科教師之間的評估交流提供機會和支持;六是為學(xué)生提供自我評估機會和工具(如學(xué)習(xí)進展電子檔案袋等),鼓勵學(xué)生參與評估是促使更多教師參與評估的有效途徑。
克斯頓·福勒切(Keston Fulcher)等把基于證據(jù)改進質(zhì)量的模式稱之為“評估、干預(yù)、再評估”,而且將其形象地比喻為“稱豬、喂豬、再稱豬”的過程[12]。他們所說的“干預(yù)”或“稱豬”實際上就是基于評估結(jié)果的質(zhì)量改進過程。他們強調(diào)“評估”本身不能改進質(zhì)量,如同“稱豬”本身不會給豬增膘;只有通過合理的教學(xué)“干預(yù)”才能改進教學(xué)質(zhì)量。而這種合理的“干預(yù)”必須是基于“評估”結(jié)果而制定的;而要了解“干預(yù)”效果,就必須“再評估”。這個過程循環(huán)往復(fù),常態(tài)化后,便形成了評估的質(zhì)量改進文化。
美國高校評估質(zhì)量改進文化的建設(shè)至少包括五個方面:一是政府通過法律手段強制大學(xué)進行質(zhì)量改進,對公立大學(xué)來說更是如此。例如,從1979年起,先后有25個州采納基于績效的撥款模式(performance-based funding model),將學(xué)生的畢業(yè)率、就業(yè)率、完成的學(xué)分等指標(biāo)納入州政府給高校的預(yù)算制定方案中[13]。州政府出臺的其他督促高校改進的法案更是枚不勝舉。二是在制定評估計劃時提前作好質(zhì)量閉環(huán)分析(closed-loop analysis)和改進監(jiān)測(progress monitoring)設(shè)計,也就是“干預(yù)”計劃。目前由第三方評估機構(gòu)承擔(dān)的認(rèn)證評估有非常詳細(xì)的回訪計劃,也就是要求高校在評估周期內(nèi)提交質(zhì)量改進進展報告。學(xué)校內(nèi)部開展的問題導(dǎo)向的學(xué)科評估更是如此,尤其是針對評估中發(fā)現(xiàn)的問題所開展的再評估對質(zhì)量改進起到了非常重要的督促作用。三是提升評估數(shù)據(jù)的透明度。雖然美國評估機構(gòu)和高校并沒有特別公布評估結(jié)果及其相關(guān)數(shù)據(jù),但政府、各類高等教育學(xué)會及高校利用現(xiàn)代網(wǎng)絡(luò)技術(shù)已經(jīng)最大化地公布了高校辦學(xué)績效方面的數(shù)據(jù)[14]。這樣的行動不僅有利于大學(xué)有效利用評估數(shù)據(jù)制定改進計劃,也為社會監(jiān)督大學(xué)提供了證據(jù)。四是高校成立特別委員會(task force)深入研究評估中發(fā)現(xiàn)的問題,啟動針對質(zhì)量問題的改進項目(initiatives)。五是在“后評估”“再評估”中重點審核對上一輪評估發(fā)現(xiàn)問題的改進情況。
評估文化的建設(shè)是一個長期的過程,需要一點一滴的積累和塑造。美國高等教育評估經(jīng)過一百多年的發(fā)展,雖然有待繼續(xù)改進,但其范式也彰顯了很多優(yōu)秀的評估文化特征,也為世界高等教育評估方法和實踐貢獻(xiàn)了豐富的經(jīng)驗和教訓(xùn)。中國的高等教育評估歷史還較短,雖然取得了很好的成績,但從評估文化建設(shè)的角度來說,目前還沒有合理的組織架構(gòu),尤其是高校內(nèi)部的評估組織還比較薄弱;還沒有形成穩(wěn)定的、普遍認(rèn)可的評價制度和質(zhì)量標(biāo)準(zhǔn);高校的評估內(nèi)動力和教職工參與評估的主動性有待提升;高校的院校研究還非常薄弱,相關(guān)人員缺乏信息素養(yǎng),支撐評估的數(shù)據(jù)系統(tǒng)也需要加強。當(dāng)然,美國積累的評估文化經(jīng)驗不一定完全適合中國的國情,更何況美國的評估文化也有很多需要深化建設(shè)的地方,所以,如何構(gòu)建中國高等教育評估文化,需要中國學(xué)者和評估實踐人員結(jié)合中國的國情及中國高等教育當(dāng)前所處的普及化發(fā)展階段的特征進行深入思考,總結(jié)過去評估的經(jīng)驗教訓(xùn),建立穩(wěn)定的評估模式。只有這樣才有可能形成評估文化氛圍,為中國高等教育質(zhì)量改進把脈獻(xiàn)策,也為世界高等教育評估的發(fā)展貢獻(xiàn)知識和經(jīng)驗。