桂慶平
從價值的角度來審視西方教育評估理論的變遷,可以發(fā)現三個明顯的階段性特征:評估實踐活動從價值無涉到價值關聯;評估主體由單一主體向多元主體轉換;評估范式由實證主義范式轉向建構主義/人文主義范式。評估理論的價值生成既是西方社會工業(yè)化、科學化浪潮的產物,也是西方民主化、人文化發(fā)展的助推器。梳理和分析西方教育評估理論的發(fā)展,可以從中吸取有益的部分,為推動我國高等教育評估實踐活動走向科學化、民主化發(fā)揮有益作用。
19世紀末20世紀初,隨著西方工業(yè)文明的迅猛發(fā)展,科技進步和經濟發(fā)展促使社會生產和生活領域急速轉型,社會結構和道德觀念也發(fā)生了很大變化。這些轉變主要表現為城市化、工業(yè)化和民主化特征。社會的發(fā)展和轉型反映在教育領域,表現為教育需求的擴大化和教育機會公平等問題。社會的發(fā)展推動了教育的改革,而教育的每一次改革又都促進了評估理論的發(fā)展。縱觀西方教育評估發(fā)展史,可以清晰地看到,每一次評估理論的發(fā)展都是為了適應教育改革的需要。泰勒目標模式的提出就是為了適應擴大就學機會的需要;CIPP模式的提出就是為了提供科學的教育決策;建構主義評估模式強調的正是不同利益主體對教育的訴求,它所關注的是教育機會公平問題。評估理論的發(fā)展除了社會的外在需要,還有來自內部的動因。如何對學生的發(fā)展進行科學的、合理的、公正的評估一直是教育研究者的重要課題,從早期的用筆試方式代替口試方式,在當時而言被視為教育評估的進步,因為筆試的方式更為公平和客觀。而隨著民主意識的覺醒,教育的個性化發(fā)展需求凸現,完全依靠紙筆的評估方式不能滿足人們的需要,因此,人們開始探索新的評估方式。可以說,西方的評估理論發(fā)展是教育改革的重要助推器,一部評估理論發(fā)展史就是一部教育改革發(fā)展史。
19世紀下半葉實證主義的研究方法開始興起。法國社會學家奧古斯特·孔德首次提出“實證精神”的概念,“真正的實證精神在于為了預測而觀察,根據自然規(guī)律不變的普遍信條,研究現狀以便推測未來”。[1]實證主義者強調有用的知識是關于現象范圍之內的東西的知識,至于造成這些現象背后的原因是什么?現象背后的本質是什么?這些都不屬于實證知識的研究范圍。他們宣稱實證科學的根本任務就是要“精確地發(fā)現”“自然規(guī)律”。[2]實證主義研究范式對社會科學其后的發(fā)展產生了深遠的影響。
實證主義的主要特征就是客觀性和必然性。要使科學研究保持其客觀性,就要堅持價值中立的立場,這種思維方式影響到教育評估領域就是教育評估的測量和描述階段。教育評估在測量和描述階段一直堅持著價值無涉的研究立場,因為測量并不賦予對象價值,就像對客體物質屬性的測量,比如長度和硬度,就不會包含有任何的價值判斷,僅僅是對物體屬性的了解。與之類似,在行為主義影響下,學習者的心理特征諸如焦慮、學習態(tài)度、抑郁等方面的測量也不會體現出價值特點。實證主義研究范式強調用觀察、實驗和統計、測量的方法研究教育現象,取代傳統的思辨方法,教育評估變成了回答“是什么”的事實判斷活動,并對這些教育事實用量化的自然科學的方法進行處理。教育評估完成了科學祛魅的過程。實證主義者篤信根據實證方法得出的知識必然是最客觀、最真實、最有用的知識,這也就使實證知識具有了不可抗拒的權威性,正是基于這種理論背景,早期的教育評估都帶有一種管理主義傾向。
但是,隨著現代自然科學的發(fā)展和科學哲學的興起,人們逐漸意識到實證哲學所追求的價值中立的前提是值得商榷的。美國科學哲學家和科學史學家托馬斯·庫恩通過對科技史進行歷史主義的研究發(fā)現:“科學在其發(fā)展和演進的過程中,科學以外的因素也發(fā)揮了重要的作用,諸如社會因素、科學家的心理因素、科學家集團的要求和心理狀態(tài)等”。[3]他提出的范式的概念就是指“一個特定共同體的成員所共有的信念、價值和技術等構成的整體”。[4]一旦科學進入到范式建立的階段,它所要研究的問題,研究方法和對問題的解釋也就隨之確立了??茖W發(fā)展的過程也不是認識的深化,而是心理上的變化或稱之為格式塔式的轉換。換句話說,“范式改變了,科學家們所約定的世界也跟著改變了”。[5]科學哲學讓我們看到了一個不一樣的科學世界:實證科學強烈反對研究者的價值滲入,認為科學研究的過程是理性的過程,而科學哲學認為科學在發(fā)展的過程中,科學家的非理性因素也發(fā)揮了重要的作用,某種程度上它比理性的角色更重要。
如果說科學哲學只是從方法上動搖了實證科學范式的合理性,那么自19世紀以來所興起的解釋學方法從根本上動搖了實證科學的合法性。19 世紀中期,自然科學研究方法以及客觀性、普遍性特征大行其道,面對自然科學對人文社會科學的侵襲,德國的文化哲學家狄爾泰、歷史學家文德爾班等發(fā)起了為人文社會科學爭取獨立地位的斗爭。他們認為,人文社會科學與自然科學在研究方法上有著本質性區(qū)別,自然科學研究自然界物體之間普遍的、必然的因果聯系,堅持一種價值中立的態(tài)度和立場;而人文社會科學面對的恰恰是含有意義的人類事件和社會活動,它無法排除個別性、意義和價值,人文科學的研究需要的正是對前人或往事或當下的價值思考和關懷。正如李凱爾特認為的那樣,自然科學和文化科學的區(qū)別不僅僅是研究對象的區(qū)別,更有研究方法上的本質區(qū)別。文化科學遵循的是價值聯系原則,一個歷史事件,一個歷史人物,要想具有研究意義,首先要和研究者的價值選擇有關。這與科學研究的方法正好相抵牾,科學遵循的是價值無涉的客觀原則,在研究中研究者本人不可帶有任何價值色彩。面對這兩個完全不同的研究領域,完全移植和運用自然科學的方法論去研究人文社會科學顯然是不合理的。那么人文科學有沒有自身的研究路徑呢?狄爾泰認為“理解”作為與科學主義的“描述”截然不同的概念而成為人文社會科學方法論的基礎。對于有意義的事情及人與人之間的關系,只能通過理解、體驗和溝通才能夠得到完整的認識。到了海德格爾、伽達默爾“解釋學”階段,理解不僅被當作一種思維方式,而且作為人的一種存在方式,是人存在的本質,這樣理解就由方法論提升到本體論的高度。理解的解釋學作為一種認識論和方法論的哲學基礎,強調“理解”不只是對文本的理解,而且具有普遍性。海德格爾強調,“僅就我們‘賦予’世界以價值而言,世界才是有價值的。因此,為了我們所選擇的價值,世界變得可操縱了?!?在他看來,世界萬物只有為我所用才有意義,一切事物只有在為我們所用時才同我們發(fā)生關系,否則,世界將沒有任何意義。
解釋學的方法強調從人的存在出發(fā)去研究教育現象和教育現象中的人。這種研究范式認為,教育活動是人有目的、有意識的人為活動,具有主觀性和價值性。“教育研究的目的,不只是要從客觀量化的研究中來了解事實,它更重要的在于了解和解釋這些事實背后的意義,以此作為批判、改進和超越不合理的教育現象的基礎”。[6]從方法論的角度,理解的研究范式反對實證主義把整體的教育現象加以肢解、分析的方法,而強調把教育作為一個整體看待,把教育現象中人的行為和事件同所處的各種關系結合起來加以考察,以揭示教育行為背后所蘊藏的價值和意義。由科學教育學走向反思教育學,批判教育學。
評估主體多元化是現代教育評估的一個主要特征,是教育價值多元化的必然結果。傳統評估主體往往是單一性的他人評估,主要是學校管理人員或教育行政部門。此時的評估活動主要在于對學生的個體特征進行鑒別。比如早期的教育測量階段,評估主體主要是學校老師和管理人員,通過測量量表就可以得到被評對象的諸如智力、性格、心理素質等等方面的信息。斯塔克把這種評估方式稱之為“預設式評估”——評估的目標是給定的,評估的主體是單一的,評估的方法是客觀的。這種單一評估主體是受主體——客體關系認識模式的影響,把教育評估過程當成是教育本質和規(guī)律的發(fā)現過程。例如泰勒的目標評估模式就是受行為主義的影響,把個體的成長當成是外部“刺激——反應”的結果,通過對個體行為表現的測量來揭示個體的發(fā)展程度。評估者是一個客觀的“測量員”,如同檢測產品一般,對學生的成長進行判斷。這種評估方式在某種程度上也適應了當時社會對人才培養(yǎng)的需要。西方社會進入工業(yè)化階段,工業(yè)文明的主要特征就是標準化。企業(yè)生產和管理的每一個環(huán)節(jié)都建立了相應的標準,企業(yè)的這種標準化思想反映到教育領域就是對人才培養(yǎng)的標準化。以泰勒為代表的描述階段的評估模式都以預定的目標為標準,來衡量學生的表現。
隨著社會的發(fā)展和評估認識的深入,尤其是在冷戰(zhàn)時期蘇聯衛(wèi)星上天事件震驚了整個西方世界,以美國為首的西方國家開始意識到提高教育質量的緊迫性。1965年通過的《中小學教育法案》給學校提供大量經費,以此來提高教育的質量。為了保障這筆資金被有效的使用,該法案要求接受資金資助的學校和項目必須遞交正式的評估報告。這一要求客觀上促進了評估組織和機構的興起,由于中小學普遍沒有能力組織評估活動,不得不向大學和社會評估機構尋求幫助。很多大學建立了教育評估中心,比如斯坦福評估協會、伊利諾伊斯大學的教育研究和課程評估中心、西密執(zhí)安大學評估中心等,有一些大學還開設了教育評估課程。
西方高等教育教學評估的主體,均由官方和非官方的多重主體組合而成。其中,特別強調民間學術團體的作用,同時特別重視專業(yè)人員在評估中的作用。這種寬泛、有機的復合主體代表了高等教育多重利益需要,形成了多樣的評估活動形式,因而體現出較大的合理性。如在美國,高等教育評估通常由地區(qū)性、全國性、專業(yè)性認證機構等多種主體機構組成,采用不同的方法對大學教學進行評估:地區(qū)性或全國性認可機構主要負責從整體上對一所學校進行全面鑒定,以保證必須具備合格的辦學條件和教學標準;專業(yè)認可機構對大學的專業(yè)院系和獨立的專門學院進行鑒定認可,以保證專業(yè)質量的水準;另外,社會專門組織和新聞媒體組織的對大學的排名評級也是一種重要的評估形式。在西歐國家,傳統的質量保障機制主要有兩種類型:一種是國家嚴密控制,即國家通過規(guī)章制度、行政、財政等手段對高校進行評估督察,另一種是學術行業(yè)自治,由學術行業(yè)負責對大學的鑒定和評估。自上個世紀 80年代以來,西歐各國出現了一個共同趨勢,即正在形成一個在國家政策主導下、由獨立機構負責、學術界和社會共同參與的高等教育評估體制。在各國的評估實踐中,特別注重吸收社會各界人士,尤其是政府代表、工商業(yè)界代表和畢業(yè)生代表參加評估,已成為非常普遍的現象。
從方法上來說,早前的教育評估研究多遵循的是科學實證主義范式。范式是一種世界觀,一種普遍的視角,一種打破現實世界復雜性的方式。實證主義范式是建立在現代物理學和數學發(fā)展基礎上的科學研究模式。實證主義者認為存在一種客觀的存在物,它們不以人的意志為轉移,其實在遵循著亙古不變的永恒自然法則??茖W的職責就是去揭示這些法則。一旦掌握了這些法則我們便可以了解和控制客體的發(fā)展規(guī)律。為了要揭示這一規(guī)律,研究者必須將自己站在研究對象之外,這樣才不會受研究對象的影響,避免觀察結果的偏差。我們必須注意到很多現象是錯綜復雜的,只有在混亂無序中排除干擾因素,才能得到必然的因果關系。因此,不管是在實驗室、在統計過程中還是在大多數人文研究中,調查者必須對出現的現象進行嚴格的控制,放棄控制就會產生錯誤結果的危險。所以,實證主義范式的本體論基礎是客觀實在論,認識論基礎是價值無涉,方法論基礎是試驗控制法。
以泰勒的目標模式為例,泰勒的“八年研究”實際上是在7所大學和30多所中學間進行的試驗研究,本質上他所使用的就是實驗設計方法。在這種方法中,評估者會把接受了新的教育教學措施的處理組和接受傳統的控制組進行學習成績上的對比。通過這種學習效果的對比試圖回答現實的社會問題;大量失業(yè)青年涌入中學,他們能否通過改革后的課程適應大學的教育?課程改革后是否會降低中等教育的質量進而影響到高等教育的質量?要回答這些問題,只能通過對實驗組和控制組之間的實際效果來驗證。
實證主義評估范式在實踐中的運用效果得到了廣泛認同和肯定,其擁護者們不斷地進行研究設計和創(chuàng)新,涌現出一大批實證主義擁躉,這其中就包括沙迪什、坎貝爾、庫克和斯坦利等。他們在教育評估領域頗有建樹,紛紛提出自己的方法和主張。沙迪什、庫克和坎貝爾合著的《試驗和準試驗設計為了廣義的因果推理》[7](Experimental and Quasi-experimental Designs for Generalized Causal Inference)一書中提出了實驗設計和準試驗設計的概念,并區(qū)分了三種真實驗設計和兩類主要的準試驗設計。在書中他們還介紹了哪些因素會威脅到因果推論的正確性,并提醒社會和行為科學研究者在實驗設計和準試驗設計中要注意兩個效度:內部效度和外部效度。內部效度是指研究者有多大把握把某一研究或實驗的結果歸結為處理的影響。外部效度是指能把研究或實驗結果推廣到其他情景和場所的程度。
實證主義的評估范式在理論設計上不斷發(fā)展和成熟,但是這種方法自身也有局限性。首先,實證主義的方法在條件上比較苛刻。因為實驗設計的方法往往都是在理想狀態(tài)下的存在,而現實的情景是多樣的、復雜的,有些因素還帶有一定的不可預測性。其次,價值中立的立場使調查結果遭遇“價值悖論”。眾所周知,價值中立是所有標榜科學的研究者的立場,但是在沒有價值標準的情況下也就無法做出價值判斷。實證主義評估者總是喜歡用事實數據,實際上,他們所呈現是事實數據和價值數據的統一體,因為收集哪些數據和如何解釋這些數據就是包含有價值的過程。
除了上述現實層面的原因,實證主義評估范式的式微還有更為嚴重的哲學層面的原因。(1)觀察性語言和理論性語言區(qū)分的不確定性。傳統的實證主義科學研究者宣稱他們能夠客觀的、沒有任何偏見地觀察和描述事實。這個宣稱其實是建立在完全區(qū)分觀察性語言和理論性語言基礎之上的。但是,科學哲學家們認為:分別建立觀察性語言和理論性語言的努力注定是要失敗的。在他們看來,只有在某種理論架構下,事實才會是事實。[8](2)評估的價值滲入。實證主義的評估范式排斥價值。他們主張要站在中立的立場上來進行評估活動。但是,評估過程是價值滲入的。價值影響著評估的諸多環(huán)節(jié),例如,選擇被研究問題和被研究對象本身就面臨著價值選擇;對研究方法的選擇也是價值選擇;對要做出的解釋和結論的選擇等等。(3)主體—客體認知模式的不確定性。實證主義范式有一個前提,即它假設調查主體能夠對被調查客體保持一種客觀的態(tài)度。有了這種態(tài)度,就能夠把客體的本質研究清楚。但是這種主體—客體對立的認知模式遭到了現代科學的強烈反對。海森堡著名的測不準原理認為任何物體的一些成對的性質,比如位置和動量,兩者不可能同時精密測定。簡單說來就是如果你能精密測定位置,那物體的動量必然測得不準確。如果你能精密測定動量,那么物體的位置必然測得不準確。同時期的波爾提出了補充性原則,認為任何研究的結果都依賴于調查者和客體之間的相互作用。正如這些科學家所言,實證主義科學范式的方法論前提遭到了質疑。不存在純粹客觀的觀察,也就不存在純粹客觀的知識,所謂知識其實就是人與人之間、人與非人的物體之間的相互作用的產物。如果純粹的知識不可能實現,那么知識只能是人與人建構的建構。所以,絕對的、客觀的真理是不存在的。
正是在實證主義范式備受質疑的情況下,有研究者提出了在教育評估中使用人種學的自然主義/質性范式。這種范式強調要在實地的自然情景中去研究現象,不是像實證主義那樣做實驗室里的研究。古巴和林肯在《自然主義的調查》一書中指出自然主義范式在五個方面不同于實證主義范式:[9](1)存在多元的現實;(2)不能把研究者和研究對象完全分開;(3)只能針對多元現實中的某種現實設立假設;(4)不可能把因果關系完全分開,因為原因和結果能同時產生相互作用;(5)研究是有價值取向的。顯然,在自然主義設計中,研究者或評估者是會把主觀認識帶入到研究中的。
在隨后出版的著作《第四代評估》中,古巴和林肯將自然主義/質性范式改名為建構主義評估,主要是因為自然主義的概念容易引起誤解。實質上建構主義評估包含了一系列反映人和社會條件下的種種要素之間的互動過程,評估的核心在于協商。評估的過程中所有的利益主體都應該參與進來,在這個過程中所有參與者的尊嚴、隱私都應該得到保護和尊重??偠灾嬛髁x范式的理論基石是:根據利益相關者的情況決定需要評估什么問題,以及收集什么信息。
與此類似,科羅拉多大學教授歐內斯特·豪斯從民主政治的角度提出協商式民主的觀點,[10]他指出協商民主評估有三個要求:評估必須要包容性、對話性和協商性,明確地贊成民主的價值,在清晰的民主框架下組織評估活動,評估者有責任去支持這些價值。評估者的目標就是使用程序聯合局內人和局外人的觀點;傾聽被邊緣化和被排擠者的聲音;在審議中運用合理的標準;與評估中重要的受眾和利益相關者進行對話性的交往。豪斯的目的是為判斷評估提供一個全面的框架,以促發(fā)其民主商討的潛能。
教育評估的本質是基于事實判斷基礎上的價值判斷活動,所以,教育評估是有價值參與的。價值的出現使原本單一的評估方式變得復雜多樣起來。從價值的視角來看,西方教育評估理論發(fā)展呈現了三個階段性特征:一是對評估實踐活動的理解從價值無涉走向價值關聯;評估主體由單一主體向多元主體轉換;評估范式由實證主義范式轉向建構主義/人文主義范式。反觀我國的高等教育教育評估實踐,我們要想在教育中實現人的發(fā)展的任務,就必須深刻認識教育價值取向上的偏差,要讓個體發(fā)展問題、人的價值問題在教育理論和實踐中獲得應有的地位。人的發(fā)展才是教育發(fā)展的根本動力,也是任何一項教育評價最終的價值追求。正如世界銀行報告中指出的:“高等教育關注的是人——制度是用來開發(fā)而不是阻礙人的潛能的”。[11]高校作為一種實體“物”,其本身既是一種客觀存在,同時是實現人的發(fā)展的一種工具與途徑,學生個體的發(fā)展才是高等教育的根本的目的。
注釋:
[1][法]奧古斯特·孔德 .論實證精神[M].黃建華,譯.北京:商務印書館, 2001:12.
[2]劉放桐.現代西方哲學[M]. 北京:人民出版社 . 1990:40.
[3][4][5][美]托馬斯·庫恩 .科學革命的結構[M].金吾倫、胡新和,譯.北京:北京大學出版社,2003:157.
[6]馮建軍. 教育研究范式——從二元對立到多元整合[J]. 教育理論與實踐, 2003,(10):9-12.
[7]Shadish,W.R.,Cook,T.D,&Cambell,D.T. Exerimental and Quasi-exerimental Designs for Generalized Causal inference[M].Boston:Houghton Mifflin, 2002.
[8][美]古巴·林肯.第四代評估[M].秦燕,蔣燕玲,等譯. 北京:中國人民大學出版社,2008:14-15.
[9]Lincoln.Y.,Guba.E. Naturalistic Inquiry.Sage[M].Newburyark,California,1985.
[10]Ernest R.House &Kenneth R.Howe.Values in Evaluation and Social Research [M].1999:4-6.
[11]Elaine El-khaawas. Reform,Autonomy and Accountability[M].2003.