陸一 林珊 陳嘉
摘 要:過去對本科教學質(zhì)量的評價注重教學設(shè)計、教學模擬與課程建設(shè),對實際教學過程中的師生互動與學生的學情關(guān)注不足,屬于偏重靜態(tài)的評價。本文提出了大學教學質(zhì)量的動態(tài)評價觀念與方法,基于大規(guī)模數(shù)據(jù)的學生反饋和教育學專業(yè)性編碼轉(zhuǎn)譯,為每門課程提供教學“體檢報告”,賦能教師改進教學,提升學習效果,促進形成全校合力重視教學的氛圍。
關(guān)鍵詞:教學評價;教學診斷;高能課;學習投入
提升大學課程質(zhì)量取決于兩個層面的努力,一是課程建設(shè),二是教學實施過程。過去,不論是政府主導(dǎo)的外部評估,還是院校內(nèi)部的自我評估,對課程質(zhì)量的評價均側(cè)重課程建設(shè),只關(guān)注課程設(shè)計以及教師對這套設(shè)計的貫徹能力,而不考慮教學過程中學生的參與。然而,教師教學不是單向的講授,學生在課程教學中不僅僅是在場的觀眾,而是足以影響教學實施過程、決定教學效果的重要參與方,應(yīng)該被理解為能動的群體。
近五年來,我們團隊先后在復(fù)旦大學、北京大學、清華大學、武漢大學、中國海洋大學、北京航空航天大學等高校開展了通識核心課程、大類基礎(chǔ)課程、思政課程的教學質(zhì)量監(jiān)測、診斷與評估的研究。本文圍繞教學質(zhì)量評價問題,首先分析幾種既有測量評價手段的不足與偏差,進而明晰教學各方恰如其分的權(quán)責關(guān)系,提出了符合中國大學實際情況的課程教學質(zhì)量評價方法。
一、現(xiàn)行評教的缺陷與誤用
1.學生評教的失效與反效果
目前大學教學質(zhì)量的評價手段包括學生評教、領(lǐng)導(dǎo)評價、教師自評、同行評價等。學生評教因其便捷有效,且學生是教學的主要接受者而被廣泛使用[1]。學生評教是指學生對教師課堂教學進行打分,分數(shù)的平均值和排名代表著教學質(zhì)量和效果。管理部門基于這些數(shù)據(jù)認定教師教學工作業(yè)績,并實施獎懲。
學生評教方式已經(jīng)暴露出越來越多的問題。首先,大多數(shù)學生評教問卷缺乏測量的科學性、專業(yè)性和針對性,無法適應(yīng)當前教學方式和師生關(guān)系的新變化。問卷設(shè)計的缺陷導(dǎo)致學生敷衍填答,缺少區(qū)分度[2]。其次,問卷存在問題過于籠統(tǒng)、概觀、指向不明和過于注重滿意度等主觀感受的缺陷[3],學生的判斷能力存在局限[4]。在課程教學過程中,學生無法做到統(tǒng)攬全局,不論其滿意還是不滿意,都不能等同于教學質(zhì)量的優(yōu)劣。師生關(guān)系不是服務(wù)員與消費者的關(guān)系,應(yīng)用滿意度模型工具相當于借管理之權(quán)威異化師生關(guān)系。再者,學生評教只起到了警告或懲罰排序在末位5%左右的教師的作用,缺少激勵措施,更無法幫助和支持大部分教師優(yōu)化教學。大多數(shù)教師不知道學生具體的學習感受和學習收獲——“不知道”導(dǎo)致無從改進。管理層無法通過學生評教分數(shù)了解教師的具體教學情況,導(dǎo)致教學管理工作只能局限于粗糙的形式和武斷的裁決。
有學者調(diào)查發(fā)現(xiàn),高校學生評教顯著受學生背景因素的影響而不能很好地反映教學情況,男生與女生、農(nóng)村學生與城市學生、高年級生與低年級生、學生群眾與學生干部之間具有明顯的評教行為偏差[5]。從心理學角度看,由于評教過程中存在愛屋及烏、禮尚往來、感知平移等心理困境,學生評教的有效性大打折扣,可能帶來降低學業(yè)要求、課堂教學膚淺化和娛樂化等負面影響[6]。
外國學者通過構(gòu)建教師和學生的效用函數(shù),發(fā)現(xiàn)適度使用學生評教可同時提高老師教學投入和學生學習投入與收獲,但過度使用學生評教會導(dǎo)致分數(shù)膨脹[7]。教師和學生有可能發(fā)生“共謀”,即教師放松學術(shù)要求,給學生打高分,以換取學生在評教中的好評價,從而使教與學的關(guān)系異化成“教學相‘漲”的尷尬局面[8]。根據(jù)最近一項對我國高水平大學教師調(diào)查的實證分析發(fā)現(xiàn),學生評教對教師投入熱情具有顯著的負面影響[9]。這意味著,即使在師生認知能力都相對較高的高水平大學,學生評教不僅不能支持和促進教學提升,還消耗了教師可貴的教學熱情。
2.同行聽評課的局限與文化約束
除了學生評教,目前常用的另一項課程質(zhì)量管理手段是同行聽評課。國際上比較提倡由教師同行而非管理者、政府等角色來評價教學和研究[10]。因此,同行聽課能夠為全面的課程教學評價提供一個無可代替的專家視角。但實踐中仍存在一些局限。例如,同行聽評課所能投入的時間精力有限,聽課只能截取片段,無法把握課程教學全貌。同行聽評課的視角是以“教”為中心,比較能夠把握教師教授的方法和內(nèi)容,卻難以了解學生學習情況。聽評課的同行可能富有相關(guān)教學經(jīng)驗,但未必是教學專家,難以將個人教學經(jīng)驗上升到更普遍的教學規(guī)律。同行之間在教學上更多的是切磋關(guān)系,而不是評價權(quán)威與被評價者的關(guān)系。同時,由于知識專門化程度正在不斷加深,管理層要在校內(nèi)組織起一批真正的同行來充分實現(xiàn)這項工作并不容易,而“外行評教”的結(jié)果難免引起爭議。除此之外,教師在心理上排斥教學同行評價,塑造著不干涉、不參與的消極慣習,抑制了教師在教學同行評價場域中活動的深度與廣度[11]。
總體而言,同行聽評課的成本高昂,收效較小。作為科學、全面評價課程教學的一個環(huán)節(jié),同行聽評課應(yīng)該被納入到評價系統(tǒng)中一個恰當?shù)奈恢茫蛊湫в米畲蠡?,并減少副作用。
3.新技術(shù)在教學測量方面尚無實質(zhì)性進步
近年來,依托信息化、視頻監(jiān)控與物聯(lián)網(wǎng)等技術(shù)的大幅進展,在大學校園內(nèi)外涌現(xiàn)出許多教學測量評價方面的新技術(shù)。
首先,以視頻監(jiān)控攝像和人臉識別為代表,對教與學的行為舉動進行編碼分析。這類技術(shù)的賣點在于使教學過程這個“黑箱”得到很大程度的透明化、客觀化和數(shù)量化。但恰恰是這種信息化,誘使教學過程偏離其本質(zhì)。理想的課程教學不僅在于可見的人際互動,更在于思想的碰撞、內(nèi)在的共鳴。如果僅依靠視頻監(jiān)控技術(shù)開展教學評價,將不可避免地把管理上的注意力引向“外在化測量”,鼓勵教師開展表演型教學和學生的“表面化聽課”。這是對教育價值與意義認知的簡單化,其評價模型刻意忽略對學生作為人的發(fā)展內(nèi)在性、唯一性與完整性的關(guān)照,加劇了教育的功利性和工具化[12]。目前的人臉識別技術(shù)已經(jīng)能夠捕捉人類的主要表情,但還遠遠達不到精細地識別其深層心理活動、思維活動的程度。換言之,新技術(shù)在沒有發(fā)展到能夠深入“人的內(nèi)在”去測量之前,這類自動測評所獲得的只能是初步、表面化的,甚至引起誤解的數(shù)據(jù)。
此外,由于中國大學較大的生師比,相對于需求而言教學供給并不充裕,教學組織安排也對課程教學質(zhì)量有明顯影響,比如選課規(guī)則設(shè)計、排課方式等,教師和學生都受此制約。因此,在中國大學課程教學質(zhì)量的全局視野下,教務(wù)管理部門也應(yīng)當作為影響質(zhì)量的相關(guān)方納入考慮,是“教與學”雙中心之外的第三責任方。
既要傾聽學生反饋,又不能將學生置于評價教學的凌駕性位置上。因此,我們需要一個中介角色來使教師和學生在教學關(guān)系中各歸其位。于是,適合作為教學評價者的中介角色將是第四方。理論上,這個第四方應(yīng)當兼具學科專業(yè)性和教育教學專業(yè)性,并且了解院校的實際情況。他們需要采取綜合的全景視角,分析歸因,并且有能力與各方開展良好溝通。目前,很少有大學擁有現(xiàn)成的這種團隊,引入外部專家是一種辦法,但仍離不開院校內(nèi)部人士的傾心投入。
四、“高能課”教學質(zhì)量測評系統(tǒng)的設(shè)計理念
1.高能:教學質(zhì)量的動態(tài)標準
為了凸顯教學實施過程質(zhì)量的重要性,基于良好的課程建設(shè)與設(shè)計,我們用“高能課”來界定優(yōu)秀的教學實施過程。如果說“金課”這個名稱反映了對課程內(nèi)容含金量的關(guān)注,側(cè)重于教學設(shè)計,屬于靜態(tài)質(zhì)量,那么,“高能課”的命名是為了提倡教師和學生在課程教學中的主體性行動?!案吣堋币馕吨咝艿慕膛c學,并且以激活學習潛能為理想教學結(jié)果的標志,屬于動態(tài)教學質(zhì)量。
什么是教學質(zhì)量的動態(tài)標準?“高效能”和“激活”等表述均避免了關(guān)于工作量、任務(wù)強度或取得“正確”知識的描述。高等教育與基礎(chǔ)教育中教學與知識的關(guān)系存在質(zhì)的差異。對基礎(chǔ)教育而言,“知識”是個名詞,是學習的固有對象。大學的教學目標不是傳授固有的知識,而要使學生能夠像學者那樣思辨地看待知識、駕馭和運用知識、研究拓展和更新知識,不再是像中學生那樣對待知識。對高等教育而言,“知識”不僅是名詞,更是個動詞,是一套理性求知的方法門徑,包括學習態(tài)度與動機、特定專業(yè)對問題的思考架構(gòu)、自我拓展學習的方法和對學問的判斷力與品位等。大學教師要通過嚴謹?shù)挠柧毰c師生互動,將學生領(lǐng)上學問的正途,有嚴格的“家法”卻無絕對的權(quán)威。因此,對大學教學而言,“課好”“教得好”都不是第一性的,促使學生進入真正的主動學習狀態(tài)才是最重要的。
因此,為了更好地把握大學教學的卓越特征,我們尤其強調(diào)這種高等教育特有的教學觀念,側(cè)重動態(tài)教學質(zhì)量的評價,采用“高能課”來定義優(yōu)秀的大學課程教學。
2.測量:以可見行動為依據(jù)
根據(jù)我們對高等教育教學質(zhì)量的動態(tài)化理解,測量評價的對象便具象化為教與學的投入行為。數(shù)據(jù)要刻畫真實的學習環(huán)境、課程學習過程表現(xiàn)和具體學習體驗,并考慮學生的起點水平,以增值性作為評價標準,問卷的問題設(shè)計切中課程學習痛點,能夠與學生共情。
表1列出了“高能課”教學質(zhì)量測評系統(tǒng)的主要指標體系。一級指標的教學質(zhì)量、學習投入等反映教與學過程的投入行為,即教師做了什么、學生做了什么。一級指標的學習收獲則反映了對課程預(yù)設(shè)教學目標的達成度,以及這種收獲的認知質(zhì)量。二級指標則是一級指標的具體化操作。
3.診斷:區(qū)分評價與反饋
“高能課”教學質(zhì)量測評系統(tǒng)的診斷理念是;課程質(zhì)量需要師生共同承擔責任。在表1中,評價指標兼顧了教與學兩個方面。學生的反饋數(shù)據(jù)是了解教學過程的一把鑰匙,得到了反饋數(shù)據(jù)后還需要透過數(shù)據(jù)發(fā)現(xiàn)學生學習的本質(zhì),了解影響質(zhì)量的原因,這便是診斷環(huán)節(jié)的主要任務(wù)。在清理數(shù)據(jù)后,充分結(jié)合教育教學規(guī)律對數(shù)據(jù)進行分析,充分考慮教與學雙方的相互作用,不僅僅把原因歸于教師或?qū)W生的任何一方,也要將院校背景、教學管理機制等其他因素考慮進來。
基于前述大學教學評價的結(jié)構(gòu)性原則,我們進一步將二級指標分列為評價指標與反饋指標。也就是說,存在一些確實影響著教學質(zhì)量,但并非教師和學生的責任所致的因素。對希望改進教學的教師而言,他們有必要獲知這些因素的存在,比如內(nèi)容難度設(shè)置、課堂規(guī)模設(shè)置、學生客觀上的學業(yè)準備等。因此,我們既要獲取這些數(shù)據(jù),又不用于評價,而作為要素信息反饋給教師。
前面我們已經(jīng)指出,教學關(guān)系并非商業(yè)服務(wù)關(guān)系,滿意度模型不適用于教學評價。但學生的學習體驗和主觀情意面向的因素仍舊是影響學習的重要因素,因而我們創(chuàng)造性地做出兩點轉(zhuǎn)換。一是將滿意度指標歸為反饋指標,通過消除其評價效力來使其合理反映學情。二是將學生對自己學習投入質(zhì)量、學習收獲的滿意程度納入二級指標,使學生在參與這項調(diào)查時更全面地意識到自己的責任,也使師生關(guān)系在這個指標結(jié)構(gòu)中擺脫評價者與被評價者、服務(wù)者與消費者的桎梏,恢復(fù)本來的正常關(guān)系。
4.效用:賦能教師與支持管理
診斷環(huán)節(jié)過后,教師將獲取關(guān)于其課程教學質(zhì)量的分析報告。教師基于報告數(shù)據(jù)和初步診斷結(jié)果,進行進一步的自我診斷。例如,針對報告中提出的課堂優(yōu)勢與短板,教師可以針對性地調(diào)整教學環(huán)節(jié)。通過縱向比較多個學期的數(shù)據(jù),教師就能清晰地看出教學手段和環(huán)節(jié)的效果及變換過程,發(fā)現(xiàn)問題的根源所在,找到解決問題的抓手,了解問題解決的程度。
對于教學管理部門而言,“高能課”教學質(zhì)量測評系統(tǒng)提供縱觀全局的視野,能夠在一張至少四維的可視化圖表中清晰地看到所有課程的動態(tài)分布情況。同時,為了破除學生評教殘留的一維評價誤區(qū),我們反對“課程排序”,支持折中的辦法,即根據(jù)診斷分析提供“課程歸類”。歸類的明確度能滿足管理所需要識別功能,比如哪些是“水課”、哪些是“高能課”等,便于行政上的有效作為,也能避免排名帶來的混淆與誤導(dǎo)。
五、“高能課”測評系統(tǒng)的應(yīng)用
在確定了測評理念和基本指標后,我們參考國內(nèi)外的權(quán)威評教系統(tǒng),結(jié)合大量現(xiàn)場聽課的經(jīng)驗,針對指標內(nèi)容設(shè)計出通俗易懂、問題指向明確的問卷。為了保證問卷的信效度,我們團隊先在個別課堂進行了小范圍的預(yù)測量,根據(jù)回收得到的數(shù)據(jù),找出問卷中存在的問題,并有針對性地進行調(diào)整。同時,邀請部分學生與教師進行訪談,進一步優(yōu)化問卷的內(nèi)容與表述。經(jīng)過多次反復(fù)修改與討論,確保問卷能夠引起學生的評教熱情,真實地反映課堂問題。問卷成型后并非一成不變。隨著核心課程結(jié)構(gòu)的不斷調(diào)整、教學形式與手段的革新,教學專家對測評指標及時優(yōu)化更新。
自2015年起,我們團隊應(yīng)用“高能課”測評系統(tǒng),對復(fù)旦大學、北京大學、武漢大學、清華大學等一流大學的數(shù)千門次課程進行了測評,其結(jié)果得到了教師和管理方的認可,并逐步嵌入大學整體的質(zhì)量保障系統(tǒng)。
對于每位授課教師,在學期結(jié)束時得到一份有針對性的“課程體檢”報告。根據(jù)“課程體檢”報告中的各項指標高低,教師能夠從總體上把握課程教學互動情況,特別是對學生的學習情況更加心中有數(shù)。
對于上述學校的教學管理部門,我們提出了構(gòu)建課程質(zhì)量保障閉環(huán)的建議。授課教師設(shè)計構(gòu)建課程,進而實施教學,隨后在恰當?shù)钠陂g,在專業(yè)團隊支持下合理地落實學生調(diào)查,得到學生反饋。教學學術(shù)專家團隊根據(jù)學生反饋以及綜合定量和質(zhì)性數(shù)據(jù)分析,給出總體診斷報告和每一門課的“課程體檢”報告。教學管理部門將“課程體檢”報告分發(fā)到教師,同時根據(jù)診斷報告中顯示的特征進行分類管理與支持,對特定課程開展同行聽評課或課堂觀察,從而不斷積累翔實的課程教學檔案。教師可以根據(jù)“課程體檢”報告中顯示的問題修訂優(yōu)化課程設(shè)計,開始新一輪教學。
我們認為,管理評價只是提升質(zhì)量的手段,并不是目的。單純的“評教”更不足以概括這項工作。課程教學設(shè)計的質(zhì)量主要取決于教師個人及其學科專業(yè)共同體的水平,而教學實施過程的質(zhì)量更有賴于教師、學生、學校三方合力。中國大學的課程教學質(zhì)量不僅僅是教師的責任,雖然教師在其中負有不小的責任。基于這樣的認識,在幾年的實踐中我們意識到,教師的教學積極性居于整項工作的核心位置,評價不能妨礙教師發(fā)揮教學積極性[25]。比起“評價”,我們更樂意將這些工作描述為“尊重并解讀學生反饋”與“為教師提供專業(yè)支持”。我們希望通過一套專業(yè)性方法來取得大規(guī)模的教學質(zhì)量評價及提升,并使這種提升可觀察、可把握,最終在大學內(nèi)部構(gòu)建人人關(guān)心教學、認真討論教學、合力提升教學的氛圍。
參考文獻:
[1]Renaud R D , Murray H G . Factorial Validity of Student Ratings of Instruction[J]. Research in Higher Education, 2005, 46(8):929-953.
[2]李楠. 高校教師績效考核中學生評教存在的問題及對策分析[J]. 首都經(jīng)濟貿(mào)易大學學報,2009,11(4):96-99.
[3]王瑛. 關(guān)于高?!皩W生評教”中若干問題的探
討[J]. 中國大學教學,2006(7):46-47.
[4]Uttl B , White C A , Gonzalez D W . Meta-analysis of faculty\"s teaching effectiveness: Student evaluation of teaching ratings and student learning are not related[J]. Studies in Educational Evaluation, 2016:S0191491X16300323.
[5]周繼良,秦雍. 高校學生評教行為偏差基本類型及其與學生相關(guān)背景特征的關(guān)系[J]. 復(fù)旦教育論壇,2018,16(6):65-73.
[6]吳洪富. 學生評教的心理困境干預(yù)[J]. 高教發(fā)展與評估,2019,35(3):39-46+111.
[7]Weinberg B A , Fleisher B M , Hashimoto M. Evaluating Methods for Evaluating Instruction: The Case of Higher Education[M]. Social Science Electronic Publishing, 2007.
[8]哈巍,趙穎. 教學相“漲”:高校學生成績和評教分數(shù)雙重膨脹研究[J]. 社會學研究,2019,34(1):84-105+243-244.
[9]閻光才. 高水平大學教師本科教學投入及其影響因素分析[J]. 中國高教研究,2018,303(11):26-31.
[10]Atkinson R . Academic Freedom and the Research University[J]. Proceedings of the American Philosophical Society, 2004, 148(2):195-204.
[11]周玉容,沈紅. 大學教學同行評價:優(yōu)勢、困境與出路[J].復(fù)旦教育論壇,2015,13(3):47-52.
[12]金生鈜. 大數(shù)據(jù)教育測評的規(guī)訓隱憂——對教育工具化的哲學審視[J]. 教育研究,2019(8).
[13]梅萍, 賈月. 近十年我國高校學生評教有效性問題研究述評[J]. 現(xiàn)代大學教育,2013(4):29-34.
[14]白逸仙. 走向”以學生為中心”的評估模式——以中國《本科教學質(zhì)量報告》與美國NSSE為比較對象[J]. 中國高教研究,2014(11):64-68.
[15]Taylor Terry. A value-added student assessment model Northeast Missouri state university[J]. Assessment & Evaluation in Higher Education, 1985, 10(3):190-202.
[16]涂冬波,史靜寰,郭芳芳. 中國大學生學習性投入調(diào)查問卷的測量學研究[J]. 復(fù)旦教育論壇,2013,11(1):55-62.
[17]郭卉,韓婷. 大學生科研學習投入對學習收獲影響的實證研究[J]. 教育研究,2018,39,461(6):62-71.
[18]陳佑清. 論有效教學的分析模型[J]. 課程·教材·教法,2012(11):3-9.
[19]Lizzio A , Wilson K , Simons R . University Students' Perceptions of the Learning Environment and Academic Outcomes: Implications for Theory and Practice[J]. Studies in Higher Education, 2002, 27:27-52.
[20]Astin A W . Four critical years[M]. San Francisco: The Jossey-Bass series in higher education, 1977.
[21][英]約翰·亨利·紐曼.大學的理想[M].徐輝,譯. 杭州:浙江教育出版社,2001.
[22]郝曉玲. 關(guān)于大學教師課堂教學能力現(xiàn)狀的調(diào)查與分析[J]. 中國大學教學,2011(2):84-85+6.
[23]王建中,劉暢,吳瑞林. 學生評教何去何從——基于美國、歐洲、澳洲4所大學的分析[J]. 中國高教研究,2018(10):87-92.
[24]趙炬明. 打開黑箱:學習與發(fā)展的科學基礎(chǔ)(下)——美國“以學生為中心”的本科教學改革研究之二[J]. 高等工程教育研究,2017(4):35-51.
[25]徐全忠. 回歸教師發(fā)展本位的綜合教學評價研究[J]. 中國大學教學,2018(10):79-82.
[基金項目:國家社會科學基金“十三五”規(guī)劃課題“中國大學通識教育建設(shè)成效分類評估研究”(CIA190274)]
[責任編輯:夏魯惠]