董梅生,楊德才
(1.安徽工業(yè)大學 商學院,安徽 馬鞍山243002;2.南京大學 商學院,江蘇 南京210093)
《國家中長期教育改革和發(fā)展規(guī)劃綱要(2010~2020年)》把“提高質量作為教育改革發(fā)展的核心任務”。為提高教育質量,構建具有長效機制的教學質量監(jiān)評體系,全國高校都建立了各項評估制度,包括各種評學及評教制度。其初衷是通過教學雙方的互評,從根本上提高教學效果,加強教學互動,提升教學質量。目前高校課堂評價手段較多,有督導制度、聽課制度、學生評教制度等。隨著信息技術的發(fā)展,網(wǎng)上評教成為高校管理教學質量的主要方式。網(wǎng)上評教的理念是“以學生為主體”,它確實能夠彌補“專家評教”和“同行評教”的不足,使得整個評價體系更加真實、可靠,對教師的教學工作起到一定的監(jiān)督作用。但是,教育是個互動的過程,因此高校也開展了老師對學生的評價活動。教師評學是涵蓋考試成績、學習動機、學習品德、課堂參與、自主學習、能力培養(yǎng)等綜合性、開放性的綜合評價體系,以創(chuàng)新精神和實踐能力培養(yǎng)為根本價值取向。實際上,“網(wǎng)上評教”和“教師評學”是教學質量監(jiān)控的兩個重要手段,教師和學生分別作為兩個評價過程中的評價主體和被評價主體,在教學質量的形成過程中既相互依賴,又在教學監(jiān)控中相互督促其行為,是一個有機的二元組合。[1]在這二元互相評價里,學生與教師對兩種評價的認識程度,對待的態(tài)度以及評價制度的設計不僅影響著評價結果的有效性,也對教學質量產(chǎn)生影響。
而在實踐中,網(wǎng)上評教與教師評學是否對等地發(fā)揮了監(jiān)控和保障教學質量的作用?教師和學生從各自角度出發(fā),對兩種評價的看法及態(tài)度是否一致?評價實踐中存在的具體問題,又是如何影響評價的實施效果?這些問題,還未引起學者注意。筆者基于這些問題的思考,通過對M大學的實證分析,找出現(xiàn)行評價中的深層問題并探討其原因,從而為進一步改進評價、優(yōu)化教學質量保障機制提供決策參考。
目前學者對網(wǎng)上評教研究頗多,大致可以歸為以下幾類:第一,網(wǎng)上評教系統(tǒng)的構建與完善。孫朝云、張羽基于B/S結構設計了網(wǎng)上評教系統(tǒng)。[2]劉麗員、楊昔陽設計了變權的網(wǎng)上評價系統(tǒng)。[3]萬榮澤、莫洪武、覃衛(wèi)東基于UML和ASP.NET技術,設計了網(wǎng)上評教系統(tǒng)。[4]還有其他學者對網(wǎng)上評教系統(tǒng)的構建從不同方位進行了探討。[5-6]第二,網(wǎng)上評教的有效性分析。韓磊磊、周耀旭、黃曉兵基于廣州大學學生網(wǎng)上評教數(shù)據(jù),對高校評價體系的效度和信度進行了分析。[7]涂平榮和甘麗、王會剛、梁庭貴對網(wǎng)上評教的可行性和實效性進行了考察。[8-9]第三,網(wǎng)上評教的影響因素分析。秦娟、唐振軍對影響高校網(wǎng)上評教效度的主要因素進行了分析。[10]劉克忠、羅俠運用問卷調查法,對影響新建本科院校學生網(wǎng)上評教活動的評教態(tài)度、評教心理等因素進行了調查。[11]王鳳、易松芝探討了影響網(wǎng)上評教有效性的因素。[12]閆志明、張光旭、張立新利用魯東大學2005~2006學年第二學期網(wǎng)上評教數(shù)據(jù),對影響高校學生網(wǎng)上評教的因素進行了研究。[13]
文獻檢索發(fā)現(xiàn),教師評學還未引起學者足夠重視,研究這方面的文獻還不多。楊曉忠、周恒忠采用整群抽樣的方法,對某高等職業(yè)院校某學期教師對學生學習的評價結果進行了分析。[14]梁蓓蓓等采用隨機抽樣的方法對某醫(yī)學院2004、2005、2006三個年級的本科和本碩學生理論課及實驗課學習情況進行了評價和結果分析。[15]這幾篇文章也僅是局限于對教師評學數(shù)據(jù)的現(xiàn)狀分析,并沒有進行深入挖掘。所以目前學者對網(wǎng)上評教關注較多,對教師評學研究很少,把兩者結合起來研究的文獻就更少。因此,本文把這兩種教學評價制度結合起來分析,具有一定的新穎性。
M大學是以工科為主,文科為輔的安徽省重點建設的綜合性大學?!笆濉睍r期,M大學定位于建設高水平教學研究型大學,可見教學與科研處于同等重要地位。為此學校成立了專門的教學質量監(jiān)控中心,對教學過程的質量監(jiān)控也是常抓不懈,所以本文選取該大學考察“網(wǎng)上評教”與“教師評學”的效果具有一定的代表性。
1.網(wǎng)上評教。網(wǎng)上評教問卷來自該校的正方教務系統(tǒng),有10個題目,每題10分,依次為:遵紀守時,為人師表;教書育人,對學生嚴格要求;教學時情緒飽滿,有自信心;教學內容充實,基本觀點突出、正確;對教師授課條理性、邏輯性的評價;注意引發(fā)學生興趣,避免單調乏味;注意培養(yǎng)學生分析和解決問題的能力;指定參考資料和布置作業(yè)情況;鼓勵學生發(fā)表看法或意見并能正確引導;課堂收獲情況。教務處對學生打分進行平均得到某老師某門課的網(wǎng)上評教分值。再結合“專家評教”和“同行評教”獲得某老師某門課的網(wǎng)上評教加權分值。
2.教師評學。教師評學問卷來自該校教務處自行設計的問卷調查表,設計的主要內容有:教學效果自評;出勤情況;預、復習情況;課堂紀律;上課聽講情況;課堂參與情況;課堂精神風貌;課堂效果;作業(yè)完成質量;參加答疑情況;有教材情況;與教師交流情況;學風總體評價;與上屆相比;對學生管理部門服務的滿意度;對教學管理部門服務的滿意度。每項采用4分制,其中1指好,2指較好,3指一般,4指較差。教務處統(tǒng)計后,對這些評價項目進行平均獲得教師評學的結果。
3.數(shù)據(jù)收集方法。數(shù)據(jù)均來自該校教務處,其中2011~2012第1、2學期網(wǎng)上評教記錄分別為1 994條和1 761條;教師評學記錄分別為608條和511條。然后采取教師姓名、工號、課程名稱匹配的方法,把網(wǎng)上評教數(shù)據(jù)和教師評學數(shù)據(jù)整合起來,扣除數(shù)據(jù)不全的記錄,最后得到2011~2012學年共787個樣本。
1.樣本分布情況考察。M大學的14個學院均包括在內,因此樣本包含的范圍廣,內容全。只是基礎課學院的課程偏多(外國語103門課;數(shù)理103門課),工科學院課程偏少(冶金21門課;計算機25門課;電氣26門課),這和實際情況是相一致的。
授課教師是以講師(56%)為主,副教授(30%)其次,助教(7%)和教授(7%)所占比例較小。這與每年新引入教師較少,教授帶本科課程較少,帶研究生課程較多情況相符。
M大學實行學分選課制,這既可以滿足學生不同的個性需求和發(fā)展愿望,激發(fā)學生的自主學習精神,還可以適應不同學生的學習進度,學習能力強的學生還可以提前畢業(yè),既減輕了家庭經(jīng)濟負擔,又能夠早日走上工作崗位。787門課程里,課程性質以必修課為主(82%),選修課為輔(18%),這與M大學各專業(yè)教學計劃設置的課程性質比例吻合。
高等教育為社會發(fā)展培養(yǎng)和輸送各種人才,因此高校都很重視引進人才的水平。M大學以培養(yǎng)“求知、創(chuàng)新”的優(yōu)秀人才為目標,因此在人才引進時非常重視學歷水平。但是相對于“211”或者“985”高校而言,M大學由于地理位置偏遠,授課教師的學歷層次還相對較低,絕大部分是碩士(690人),本科(63人)和博士學歷(34人)較少。
課程類別是以公共基礎課居多,專業(yè)課較少。其中專業(yè)課(42門)、學科基礎課(186門)、公共選修課(230門)、公共基礎課(329門)依次增加,這與該高校課程設置的特點相符。
隨著計算機技術的迅速發(fā)展和普及,多媒體教學已逐步取代了以往的傳統(tǒng)教學模式。M大學很重視教學設施硬件建設,幾乎每個教室都配備了功能齊全的多媒體,因此教師95%的授課方式是多媒體教學,其他方式僅占5%。
2.基本統(tǒng)計量描述。
表1 學生評教和教師評學基本統(tǒng)計量和信度檢驗
表1顯示,學生對教師評分為91.89分,加權平均分是91.87分,說明學生對教師授課認可度很高。同時,教師也認為學生學習情況較好,平均分為1.74,介于好和較好之間。平均選課人數(shù)為129.61人,參評人數(shù)為98.24人,計分人數(shù)為88.47人,說明M大學是以大班授課為主,學生參評率達到了76%(=98.24/129.61×100%)。
因為要保證測量結果是可信且有效的,針對這批數(shù)據(jù)的各種實證分析才有意義,所以我們首先采用SAS里的proc corr alpha過程進行信度檢驗;在信度檢驗基礎上,再使用KMO抽樣適當性檢驗和Bartlett球形檢驗方法進行效度檢驗。
信度是指問卷的穩(wěn)定性和可靠性,是指同一個測驗對同一組人員測試兩次或多次,所得結果的一致性程度。[16]主要有重復信度、內部信度和觀察者之間的信度。由于文中考察的是一個學年的調查數(shù)據(jù),所以無法做重復信度檢驗;而不同觀察者并不能做到完全獨立的對相同對象進行評價(如存在同學之間評價時互相參考,甚至替他人評價等等情況),因此我們也不考慮觀察者之間的信度檢驗,僅考察內部信度檢驗,通常用Cronbach’s Alpha系數(shù)測量,結果見表1。
從表1看,標準化之后的Cronbach’s Alpha各指標值均超過了0.8,說明內部一致性極好,也表明M大學評價指標體系設置很合理。
效度是指測量的有效程度或測量的正確性,它比信度更為重要。信度是效度的必要條件,效度高的測驗,信度必定高;但信度高的測驗,效度則未必高。通常用KMO and Bartlett test進行檢驗,結果見表1。由于網(wǎng)上評教和教師評學的KMO值均大于0.5,Bartlett test的P值均小于0.05,說明該問卷的結構效度很好。因此信度檢驗和效度檢驗表明,M大學的這批數(shù)據(jù)測量結果是可信且有效的,做實證分析是有意義的。
先采用SAS9.1.3軟件里的glm過程進行方差分析,再對方差分析有均值差異的數(shù)據(jù)進行多重總體均值檢驗(受篇幅性質,Bonferroni T檢驗結果沒有列出),以探索隱藏其中的規(guī)律,結果見表2。
因此,學院不同,學生對教師評分、對教師加權評分、選課人數(shù)、參評人數(shù)和計分人數(shù)存在明顯差異,這是由于各個學院招生規(guī)模不同,師資力量配備不同,教學內容和課程難易程度不同,學風也不同,導致學生評教存在差異。但是教師評學不受學院影響。
職稱不是影響網(wǎng)上評教的因素。但是,職稱不同的教師對評學不同,其中助教(1.80)、講師(1.79)、副教授(1.65)、教授(1.65)評價依次上升,這可能是由于職稱高的老師教學經(jīng)驗豐富,調動學生的積極性和活躍課堂氣氛較好,所以教師評學打分較高,而年輕教師課堂掌控能力相對較弱,從而主觀感受學生課堂狀況較差所致。
課程性質是影響學生評教的因素,其中必修課的學生對教師評分、對教師加權評分、選課人數(shù)、參評人數(shù)和計分人數(shù)均顯著高于選修課,可能是學生認為必修課更重要,所以學生網(wǎng)上評教也帶有一定的功利性。相反,教師評學不受課程性質影響,這也說明無論課程性質咋樣,教師為“站好三尺講臺”付出的汗水是相同的,因而感受相似。
與高校重視人才引進時的學歷層次不同,學歷既不影響網(wǎng)上評教,也不影響教師評學。這表明真正走上講臺之后,學生并不關注教師的學歷水平,只注重教師的教學水平,并不存在學歷高教學水平就高的現(xiàn)象;教師也并不依據(jù)自身學歷層次的差異,而對學生學習要求區(qū)別對待。
課程類別不影響網(wǎng)上評教,也不影響教師評學,這可能是學生和教師均不了解課程分類所致。
多媒體既影響網(wǎng)上評教,也影響教師評學。其中其他授課方式的學生對教師評分、對教師加權評分均高于多媒體教學方式,選課人數(shù)、參評人數(shù)、計分人數(shù)均小于采用多媒體教學。這既表明學生更喜歡其他的教學方式,也說明學生更喜歡小班授課。有意思的是,與網(wǎng)上評教不同,教師更喜歡多媒體教學方式,這是因為多媒體美觀、生動、信息量大,同時教師板書耗費精力少,因而教師成就感很好,所以評學打分較高。
綜合以上分析,網(wǎng)上評教和教師評學除了在學歷、課程類別上評價沒有差異外,其他地方均存在錯位現(xiàn)象。因而網(wǎng)上評教與教師評學對監(jiān)控和保障教學質量并沒有發(fā)揮對等的作用,教師和學生從各自角度出發(fā)對兩種評價的看法及態(tài)度并不一致。甚至可以說,網(wǎng)上評教和教師評學均存在失效的情況。這對教學質量監(jiān)控部門如何管控教學質量提出了挑戰(zhàn),我們必須對其原因進行剖析,以解決其中的矛盾。
M大學的評教系統(tǒng)與選課系統(tǒng)均隸屬于該校的教務管理系統(tǒng),據(jù)學校有關規(guī)定,所有學生必須進行網(wǎng)上評教,學生未完成本學期的網(wǎng)上評教將限制其參加后續(xù)的教學活動,如選課、考試查詢、成績查詢等,所以網(wǎng)上評教帶有強迫的成分。但是,即使是在這種強制制度下,根據(jù)表1,學生參評率也只有76%,說明學生參與評教的意愿并不高。原因一,網(wǎng)上評教的時間是安排在各學期的中后期,此時大部分課程即將結課或者已經(jīng)結課,學生面臨期末緊張復習,短期內對幾門甚至十幾門課程進行評價,容易出現(xiàn)倉促應付心理,隨意濫評甚至找人代評,降低了評教結果的有效性。原因二,網(wǎng)上評教采取實名制,由于課程還未考試,或者考試了成績還沒有上網(wǎng),學生擔心教師會用成績卡自己,從而產(chǎn)生顧慮,為和老師搞好關系,因此打分很高。根據(jù)表1和圖1網(wǎng)上評教平均分為91.89分,標準差為1.09分,最大值為94分(占比0.5%),最小值為86.67分,90分以下僅占5.72%,幾乎每個老師都是優(yōu)秀,說明網(wǎng)上評教存在分數(shù)膨脹情況,網(wǎng)上評教失效。原因三,以評促教并未落到實處。網(wǎng)上評教的目的是使得教師獲得大量反饋信息,及時了解自己教學中的優(yōu)勢和不足,調整自己的教學觀、學生觀,傾聽學生對教學的需要和要求,不斷優(yōu)化教學過程,提高教學質量。但是由于網(wǎng)上評教的時間是學期的中后期,此時教師既不會調整自己的教學模式,也不會促使教務處更換有問題的老師,所以學生認為評教是流于形式,走過場而已,索性給老師一個好評,說不定老師試卷會出的容易點,從而考個好成績拿個獎學金。
圖1 學生評分分布圖
圖2 教師評學分布圖
M大學教師評學一般都安排在期中教學檢查時進行,要求每個老師根據(jù)自己授課班級的學生表現(xiàn)情況進行打分,以督促和評價學生的學習狀況,引導學生向著積極的方向前進。在實際操作中,表1和圖2顯示,教師評學的平均分為1.74,最大值為1(占比27.70%),最小值為4(占比0.25%),評分≥3的僅占1.53%,標準差為0.48,說明教師評學同樣存在等級膨脹的情況,教師評學同樣失效。原因一,教師評學的主動性不夠。教師評學是M大學期中教學檢查常規(guī)內容,是必須完成的差事。通常是各系召集所有教師發(fā)放調查表隨即就收調查表,各教師沒有時間充分思考匆匆填完了事,甚至有借鑒他人打分的情況,因而教師評學失效。原因二,制度導向出現(xiàn)偏差。一方面,學校課酬低,大多數(shù)教師并沒有動力在教學上投入過多精力。另一方面,雖然學校重視教學質量,但是對教師的各種考核指標卻主要是科研論文和課題。制度導向的偏差導致教師愿意搞科研而不注重教學。相反,網(wǎng)上評教結果直接與教師的職稱晉升、年終考核、各種申報材料息息相關,教師為了和學生搞好關系,獲得好的網(wǎng)上評教結果,就會同時出現(xiàn)教師評價等級膨脹和成績膨脹的現(xiàn)象。原因三,教師評學結果主要用于學生先進班集體的評選,是優(yōu)秀輔導員和優(yōu)秀班主任評選的重要考核指標,既不直接與學生個人利益掛鉤,也不直接與任課教師績效掛鉤,甚至有“為他人做嫁衣”的嫌疑,因此缺少教師評學的主觀能動性,教師評學失效也是情理之中的事情。
在信度和效度檢驗通過的情況下,網(wǎng)上評教和教師評學在學院、職稱、課程性質、多媒體屬性指標上均存在錯位現(xiàn)象。網(wǎng)上評教與教師評學不但沒有對監(jiān)控和保障教學質量發(fā)揮對等的作用,而且同時存在網(wǎng)上評教分數(shù)膨脹和教師評學等級膨脹的現(xiàn)象。因此,網(wǎng)上評教和教師評學均是失效的。
1.提升教師評學的主觀能動性。教師評學的設計既要側重于培養(yǎng)學生的自主學習能力和創(chuàng)新能力,也要激發(fā)教師的參評意愿,為此需要設置相應的激勵機制。學校要改變偏重科研的考核制度,大幅提高教學課酬,加大對優(yōu)秀教師的獎勵程度,以激發(fā)教師教學的積極性,提升教師評學的主動性。
2.及時進行評價信息的反饋。網(wǎng)上評教和教師評學不僅是完成常規(guī)的教學質量檢查工作,其最終目的是要實現(xiàn)“以評促教”、“以評促學”,因此評價信息的及時反饋是評價工作的最大價值所在。教務管理部門針對學生和教師提出的意見和建議,在做好保密工作的時候,也要維護參評者與被評者雙方利益,及時與當事教師或主管領導進行溝通反饋,以提升和改進教學質量,還可以提高學生和教師參與互評的意愿,擯棄教師和學生認為評價是流于形式的片面認識。
[1]高杰欣.基于師生視角的“學生評教”、“教師評學”的調查分析[J].內蒙古師范大學學報 (教育科學版),2011(9):38-66.
[2]孫朝云,張羽.基于B/S結構網(wǎng)上評教系統(tǒng)設計與實現(xiàn)[J].計算機應用與軟件,2012(3):183-186.
[3]劉麗員,楊昔陽.基于合理變權的網(wǎng)上評教系統(tǒng)的實現(xiàn)[J].宿州學院學報,2012(1):52-55.
[4]萬榮澤,莫洪武,覃衛(wèi)東.基于UML和ASP.NET技術網(wǎng)上評教管理系統(tǒng)的設計與實現(xiàn)[J].軟件導刊,2009(7):186-189.
[5]趙碩.網(wǎng)上評教系統(tǒng)的設計與實現(xiàn)[J].新課程研究(職業(yè)教育),2008(20):138-139.
[6]陳勝紅.基于高校網(wǎng)上評教系統(tǒng)的設計研究[J].電腦知識與技術,2011(12):2768-2775.
[7]韓磊磊,周耀旭,黃曉兵.高校學生評教指標體系的信度與效度分析——基于廣州大學學生網(wǎng)上評教的實踐研究[J].教育導刊,2012(3):57-61.
[8]涂平榮.高校學生網(wǎng)上評教的可行性與實效性探討[J].北京電子科技學院學報,2010(1):83-85.
[9]甘麗,王會剛,梁庭.唐山學院網(wǎng)上評教可行性研究[J].赤峰學院學報(漢文哲學社會科學版),2009(2):182-183.
[10]秦娟,唐振軍.高校網(wǎng)上評教的效度影響因素分析及對策[J].高教論壇,2011(10):93-98.
[11]劉克忠,羅俠.新建本科院校學生網(wǎng)上評教活動影響因素研究[J].滁州學院學報,2012(1):85-87.
[12]王鳳,易松芝.影響高校學生網(wǎng)上評教有效性的因素及其控制[J].消費導刊,2008(3):174-175.
[13]閆志明,張光旭,張立新.影響高校學生網(wǎng)上評教的因素研究[J].中國電化教育,2007(3):45-47.
[14]楊曉忠,周恒忠.對某高職院校教師評學結果的調查分析[J].衛(wèi)生職業(yè)教育,2006(22):118-120.
[15]梁蓓蓓,侯華新,黃超,梁磊,農(nóng)兆豐.醫(yī)學院校教師評學情況的分析及探討[J].中國高等醫(yī)學教育,2008(2):68-84.
[16]馬文軍,潘波.問卷的信度和效度以及如何用SAS軟件分析[J].中國衛(wèi)生統(tǒng)計,2000(12):263-365.