張艷莉 王肖竹
摘要:語言測評素養(yǎng)是語言教師合理認識、設(shè)計測評活動和運用測評結(jié)果所必需的專業(yè)素養(yǎng)?;谡Z言測評知識、實踐和反思的角度調(diào)查國際中文教師語言測評素養(yǎng),發(fā)現(xiàn):國際中文教師的語言測評知識處于中等水平,教師對語言測評相關(guān)的概念和原則有一定了解,但存在理解不充分以及誤解的情況,參加測評培訓(xùn)對語言測評知識水平有提升作用;教師在教學(xué)實踐中注重形成性評價,也存在一定的高風(fēng)險測試導(dǎo)向;教學(xué)經(jīng)驗和測評培訓(xùn)因素均對教師語言測評素養(yǎng)自評和提升需求產(chǎn)生積極影響,教師對語言測評素養(yǎng)的提升持積極態(tài)度,需要語言測評相關(guān)培訓(xùn)提供具體實踐性的指導(dǎo)。
關(guān)鍵詞:語言測評素養(yǎng);國際中文教師;語言測評知識;教師專業(yè)發(fā)展
DOI: 10.13734/j.cnki.1000-5315.2023.02.017
收稿日期:2022-10-09
基金項目:本文系漢考國際科研基金重點項目“漢語水平考試認知效度研究”(CTI2021A01)的階段性研究成果。
作者簡介:張艷莉,女,山東曲阜人,上海外國語大學(xué)國際文化交流學(xué)院教授,E-mail: zhangyanli@shisu.edu.cn;
王肖竹,女,山東威海人,北京語言大學(xué)國際學(xué)生教育政策與評價研究院博士研究生。
一引言
測試與評價是語言學(xué)習(xí)中不可缺少的一部分,要判斷測評是否有效地反映學(xué)生的語言水平和學(xué)習(xí)情況,解讀測評信息以指導(dǎo)教學(xué)或決策,需要與測評相關(guān)的各方(學(xué)生、教師、學(xué)校管理者等)具有一定的語言測評素養(yǎng)。在語言測試領(lǐng)域,對測試相關(guān)方語言測評素養(yǎng)的關(guān)注度持續(xù)提升。其中,語言教師的測評素養(yǎng)最受關(guān)注,因其承擔(dān)著課堂測評活動設(shè)計和實施者的角色,語言測評素養(yǎng)對教師測評活動的開展及教、學(xué)、評一體化發(fā)展有重要作用。因此,語言測評素養(yǎng)也是教師專業(yè)發(fā)展的一環(huán),缺乏測評素養(yǎng)意味著專業(yè)性的喪失。
在國內(nèi),國際中文教師主要對來華留學(xué)生進行漢語作為第二語言的教學(xué),其語言測評素養(yǎng)較少受到關(guān)注。一般而言,教師的測評理念和方式與其所接受的教育十分相關(guān),這種“沿襲”的做法不利于測評的創(chuàng)新和發(fā)展。國際中文教師面對的學(xué)生來自不同的教育文化環(huán)境,其語言測評素養(yǎng)需要兼顧高風(fēng)險考試和課堂測評,并用學(xué)生可以接受的方式設(shè)計和實施測評活動。目前,對國際中文教師能力的認定標(biāo)準(zhǔn)均涉及測評素養(yǎng),如從“測試與評估”、“學(xué)習(xí)評估和反饋”方面對教師所具備的測評能力提出要求,相關(guān)的教師培訓(xùn)項目應(yīng)當(dāng)包含語言測評課程。現(xiàn)有的針對國際中文教師的語言測評課程效果如何?教師對學(xué)生的測評是怎樣進行的?目前尚缺乏對這些問題的探討。
作為教學(xué)與測試的語言能力水平依據(jù),《國際中文教育中文水平等級標(biāo)準(zhǔn)》(以下簡稱《等級標(biāo)準(zhǔn)》)的發(fā)布和使用要求教師據(jù)此評估和追蹤學(xué)生語言發(fā)展。此外,自受新冠疫情影響以來,在線教學(xué)模式得到了全面深入發(fā)展,語言測評的開展形式也發(fā)生了相應(yīng)變化。無論是指導(dǎo)標(biāo)準(zhǔn)的規(guī)范化還是語言測評形式的轉(zhuǎn)變,都對國際中文教師的語言測評素養(yǎng)提出了更為具體的要求,教師需要對語言測評的原則和方法有系統(tǒng)的知識基礎(chǔ),并在此指導(dǎo)下選擇、改編或設(shè)計適合課程教學(xué)目標(biāo)的測評活動和考試來促進教學(xué)和學(xué)習(xí)。在此背景下,本研究嘗試從知識、實踐和反思的角度對國際中文教師的語言測評素養(yǎng)進行調(diào)查,并探索提升的方向。
二文獻回顧
(一)語言測評素養(yǎng)內(nèi)涵與模型
測評素養(yǎng)是一個多層面的概念,最初由教育學(xué)界提出,由于教育問責(zé)制(Accountability)以及促學(xué)評價理念(Assessment for learning)的發(fā)展,要求教師及其他測評相關(guān)方具有正確使用測評結(jié)果的能力。在國際上,語言測試作為測量語言能力水平的工具,與移民和留學(xué)等政策息息相關(guān),其應(yīng)用得到擴展,影響力也在增大。隨著語言測試專業(yè)化發(fā)展和學(xué)科知識體系的形成,語言測評素養(yǎng)作為測評素養(yǎng)的子集被提出,其構(gòu)念(Construct)和內(nèi)容融合了測評素養(yǎng)的基本內(nèi)涵和語言測試學(xué)科的特點。為了探尋語言測評素養(yǎng)所涉及的內(nèi)容,學(xué)者對語言測試指導(dǎo)性書籍進行了分析,對以提升語言測評素養(yǎng)為目的的培訓(xùn)課程進行了調(diào)研,并了解了教師學(xué)習(xí)語言測評知識的需求。在具體內(nèi)容的基礎(chǔ)上,形成了“技能+知識+原則”、“目的+內(nèi)容+方式”、“環(huán)境+原則+實踐”等語言測評素養(yǎng)的結(jié)構(gòu)模型。在已有研究基礎(chǔ)上,金艷根據(jù)我國外語教育領(lǐng)域的主要測評活動分類(大規(guī)??荚?、學(xué)業(yè)測試和課堂評價),提出了外語教師測評素養(yǎng)的模型,包含環(huán)境、原則、實踐三個層面,以及外語教師在不同類型測評活動中語言測評素養(yǎng)的要求。綜合已有的定義,本研究將教師語言測評素養(yǎng)的概念界定為:語言教師對于大規(guī)模標(biāo)準(zhǔn)化考試和課堂測評的基本概念和指導(dǎo)原則的了解以及設(shè)計、實施和利用測評活動的知識、技能和能力,并能從社會文化和政策環(huán)境的角度理解測試的性質(zhì)及其影響。
近年來的研究多從社會文化角度對語言測評素養(yǎng)進行解讀。如Xu & Brown在回顧百篇測評素養(yǎng)研究文獻的基礎(chǔ)上,提出了實踐中的教師測評素養(yǎng)模型(Teacher Assessment Literacy in Practice, TALiP),包含“知識基礎(chǔ)”、“教師測評觀念”、“體制和社會文化環(huán)境”、“實踐中的測評素養(yǎng)”、“教師學(xué)習(xí)”、“教師測評者身份”六個部分。該模型反映了測評素養(yǎng)積累、實踐、反思的動態(tài)過程,并強調(diào)測評知識基礎(chǔ)并不能直接成為測評素養(yǎng),需要通過教師理解、實踐、進一步學(xué)習(xí)和反思才能完成知識到素養(yǎng)的轉(zhuǎn)化,且教師的測評實踐通常是在多種因素的影響和權(quán)衡下實現(xiàn)的。Pastore & Andrade通過專家咨詢法歸納了包含“概念知識”、“行動”和“社會情感”三個維度的測評素養(yǎng)模型。潘鳴威通過專家訪談更新的語言測評素養(yǎng)模型也將教師情感和態(tài)度作為一個外延。綜合以上框架內(nèi)容可以看出,教師需要一定的語言測評知識基礎(chǔ),其內(nèi)容來源于語言測試學(xué)科范圍,并與社會文化、教育政策與教學(xué)環(huán)境相協(xié)調(diào),從而在實踐中具備相應(yīng)的技能和素質(zhì)。
(二)教師語言測評素養(yǎng)研究現(xiàn)狀
已有的教師語言測評素養(yǎng)研究內(nèi)容和方法主要集中于以下五個方面:(1)調(diào)查工具的開發(fā)和驗證,形式有基于內(nèi)容的選擇題項 、自評量表、判斷題項、選擇題+自評量表等;(2)量化評估教師測評素養(yǎng)的不足和培訓(xùn)需求,涉及群體包括國內(nèi)中小學(xué)教師、歐洲外語教師、高校英語教師等,并探討了影響測評素養(yǎng)水平及發(fā)展的關(guān)鍵因素,如測評培訓(xùn)、教學(xué)經(jīng)驗、環(huán)境因素等;(3)教師與專家對語言測評素養(yǎng)理解的差異,認為語言測評素養(yǎng)培訓(xùn)中應(yīng)考慮到教師的理解特點和實踐需求;(4)教師的語言測評實踐,通過分析測評活動設(shè)計、命題質(zhì)量 、課堂觀察、訪談等內(nèi)容總結(jié)出教師在實踐中體現(xiàn)出的語言測評素養(yǎng);(5)教師觀念、反思等社會文化要素,通過混合研究方法反映教師對語言測評活動的認識與態(tài)度,理解教師觀念對于相關(guān)政策和培訓(xùn)課程的實施有重要意義,教師反思則是發(fā)揮教師能動性、在現(xiàn)有實踐基礎(chǔ)上尋求提升的有效方式。
目前以國際中文教師為對象的語言測評素養(yǎng)研究較少,鑒于研究環(huán)境的差異性及研究內(nèi)容對國際中文教師發(fā)展的意義,有必要探討高校國際中文教師語言測評素養(yǎng)的現(xiàn)狀,以更好地在教師職前培養(yǎng)階段和專業(yè)發(fā)展上提供幫助?;谝陨险Z言測評素養(yǎng)的理論模型和實證研究,本研究希望回答以下問題:(1)國際中文教師語言測評知識水平如何?(2)國際中文教師的語言測評實踐有何特點?(3)從自評和提升需求的角度看,國際中文教師對其語言測評素養(yǎng)的反思情況如何?
三研究設(shè)計
(一)研究對象
本研究的對象為在高校從事國際中文教學(xué)工作的教師,通過便利抽樣發(fā)放問卷,共得到有效答卷119份。高校所在地分布于上海、山東、遼寧、甘肅、吉林、北京、浙江、廣東等16個省市,教師的教齡分布為0-2年(32.77%),3-10年(32.77%),10年以上(34.45%)。本研究將教齡為0-2年界定為新手教師(39人),大多為正在接受或剛剛完成漢語國際教育碩士項目的學(xué)習(xí);教齡為3-10年的教師與10年以上的教師分別為熟練型(39人)、專家型教師(41人),一般為高校在職教師,教學(xué)經(jīng)驗比較豐富。74名(62.18%)教師參加過測評培訓(xùn),其中近三年參加過的有52人(46.22%),另外45人(37.82%)未參加過測評培訓(xùn)。共有8名教師參加了后續(xù)訪談,其中新手教師4人,熟練型教師1人,專家型教師3人。
(二)研究框架及工具
為了從多元的角度反映教師語言測評素養(yǎng),本研究采用Xu & Brown的TALiP模型作為融合理論知識與教師實踐的宏觀理論框架。研究主要圍繞國際中文教師的“語言測評知識”、“語言測評實踐”、“語言測評反思”三方面進行探討。
本研究的分析和解釋框架如圖1,通過問卷調(diào)查和訪談的方法收集數(shù)據(jù),共使用“語言測評知識問卷”和“語言測評素養(yǎng)評價量表”兩份問卷。在制定“語言測評知識問卷”時,首先通過篩選和整合已有文獻中語言測評素養(yǎng)包含的內(nèi)容、教師課堂測評標(biāo)準(zhǔn),并考慮本研究環(huán)境,確定問卷的內(nèi)容結(jié)構(gòu),然后參考已有的測量工具的問題設(shè)置進行改編,主要從情境和語言方面對問題進行修改,使問題情境符合漢語作為第二語言教學(xué)的實際情況,考慮文化差異因素,并結(jié)合課程評價體系、線上測試的實施情況進行情境設(shè)定;在測評的語言對象上,考慮漢語的語言標(biāo)準(zhǔn)、語言要素、語言技能和語言使用等對內(nèi)容進行調(diào)整,例如在環(huán)境層面,主要考查教師對漢語教學(xué)大綱在教學(xué)中的指導(dǎo)作用及對《等級標(biāo)準(zhǔn)》發(fā)布背景和意義的了解,但對語言測評基本概念和原則相關(guān)的題目基本不作改變。制定好的問卷題目及答案經(jīng)過3名具有語言測試專業(yè)知識的專家審核和修改,此后經(jīng)過小范圍試測確認問卷達到滿意的信度,并根據(jù)試測結(jié)果修訂了問卷。最終問卷涵蓋環(huán)境、原則、實踐3個層面,包含19個主題的內(nèi)容(見表2),由26個選擇題構(gòu)成,以0-1計分(對多個答案的題目每個選項單獨計分),共得到77個計分項用于描述性統(tǒng)計和方差分析?!罢Z言測評素養(yǎng)評價量表”包含自評量表和提升需求量表,根據(jù)DeLuca等課堂測評方法調(diào)查問卷(ACAI) 進行改編,為Likert五度量表,共24個題項(見表3、4)。在問卷發(fā)放之后,對部分教師進行了半結(jié)構(gòu)化訪談,訪談內(nèi)容主要包括教師對語言測評活動的認識和態(tài)度等,教師所接觸和實施的語言測評活動(課程評估體系、具體測評方式和實施情況等),以及對語言測評進行的反思,包括語言測評素養(yǎng)的發(fā)展與提升需求等。
(三)數(shù)據(jù)收集和分析
本研究的數(shù)據(jù)包括定量和定性兩部分。定量數(shù)據(jù)通過問卷網(wǎng)發(fā)放,使用SPSS 23.0對結(jié)果進行統(tǒng)計分析,兩份問卷整卷Cronbachs α系數(shù)為0.893。其中,“語言測評知識問卷”總體Cronbachs α系數(shù)為0.86,其中環(huán)境部分為0.65,原則部分0.70,實踐部分0.80,KMO取值為0.838,Bartletts球形檢驗顯著(p <0.000),說明問卷有較好的信度和結(jié)構(gòu)效度;量表部分整體Cronbachs α系數(shù)為0.926,“語言測評素養(yǎng)自評量表” Cronbachs α系數(shù)為0.922,KMO取值為0.909,Bartletts球形檢驗顯著(p <0.000),通過探索性因子分析,使用主成分分析法,根據(jù)最大方差法旋轉(zhuǎn)后得到的兩個因子,分別被命名為“測評設(shè)計及質(zhì)量”、“測評準(zhǔn)備及反饋”,因子載荷分別為33.217%,30.050%,內(nèi)部一致性信度分別為0.89,0.85;“語言測評素養(yǎng)提升需求量表” Cronbachs α系數(shù)為0.904,KMO取值為0.869,Bartletts球形檢驗顯著(p <0.001),用同樣的方法進行探索性因子分析,得到“測評設(shè)計與實施”、“語言測評與反饋”、“測評結(jié)果利用”三個因子,因子載荷分別為26.239%,22.993%,20.235%,內(nèi)部一致性信度分別為0.86,0.83,0.80。為了探究教學(xué)經(jīng)驗(新手教師、熟練型教師、專家型教師)與測評培訓(xùn)因素(參加過測評培訓(xùn)、未參加過測評培訓(xùn))對兩份問卷得分產(chǎn)生的影響,進行3(3組)×2(2組)的混合設(shè)計的方差分析。
定性數(shù)據(jù)通過半結(jié)構(gòu)化訪談進行收集,其中2名教師的訪談在線下當(dāng)面進行,另外6名教師通過電話訪談,訪談時間設(shè)定為20-30分鐘。訪談內(nèi)容經(jīng)過文字轉(zhuǎn)寫后使用Nvivo 12.0進行編碼與分析,內(nèi)容主題包括教師語言測評觀念、語言測評實踐和語言測評素養(yǎng)的發(fā)展三個方面。
四結(jié)果與討論
(一)研究結(jié)果
1.語言測評知識
語言測評知識問卷的結(jié)果顯示國際中文教師平均正確作答62.63%的選項(M=48.23,SD=10.30,SE=0.94,Min=20,Max=74),分?jǐn)?shù)分布見圖2。其中環(huán)境層面59.91%,原則層面64.48%,實踐層面62.90%。多項選擇題和單項選擇題的作答情況分別如表5、6,其中單項選擇題正確比例平均為53.32%,說明對教師來說題目難度較大,多項選擇題全部選對的比例平均為20.76%,部分選對的比例為48.34%,多數(shù)教師僅部分掌握題目內(nèi)容(少選)。綜合以上結(jié)果可以看出,國際中文教師具有中等水平的語言測評知識,即對于問卷中涉及的語言測評概念和原則,教師有一定的了解,但了解不充分且存在誤解的情況。
教學(xué)經(jīng)驗對語言測評知識問卷總分和各層面上沒有產(chǎn)生顯著影響,F(xiàn)(2, 116)=0.406,p=0.667,ηp2=0.007;測評培訓(xùn)因素對語言測評知識問卷的得分有顯著影響,F(xiàn)(1, 117)=6.344,p=0.013,ηp2=0.053。主要體現(xiàn)在環(huán)境層面F(1, 117)=6.640,p=0.011,ηp2=0.055,和實踐層面F(1, 117)=5.049,p=0.027,ηp2=0.043。關(guān)于教學(xué)經(jīng)驗與測評培訓(xùn)兩個因素的分析表明,就語言測評知識而言,測評培訓(xùn)對此有提高作用,而教學(xué)經(jīng)驗并不是顯著影響因素,這一情況可能與當(dāng)下新手教師的專業(yè)學(xué)習(xí)和訓(xùn)練時間較近而在職教師培訓(xùn)有所缺失有關(guān)。從調(diào)查對象參與測評培訓(xùn)的結(jié)果來看,三年內(nèi)參加過測評培訓(xùn)的人數(shù)在新手教師中占51.28%,在熟練型教師中占46.34%,在專家型教師中占31.71%,即使是在新手教師中,測評培訓(xùn)的普及程度也僅在一半左右,說明職前培訓(xùn)和在職培訓(xùn)中關(guān)于語言測評的學(xué)習(xí)均需要加強。
2.語言測評實踐
教師的語言測評實踐中,課程成績一般由“課堂表現(xiàn)”、“課堂小測”、“課后練習(xí)”、“階段測試”、“期末考試”組成。就課堂表現(xiàn)而言,教師認為根據(jù)課堂互動情況對學(xué)生進行評價,對考試成績有一定預(yù)測性,比較可靠。形成性評價在總成績中比期中、期末考試等終結(jié)性評價所占比重更大,教師同時認為期末學(xué)業(yè)考試是必要的,規(guī)定無論學(xué)期中學(xué)生是否達到及格成績,都需要參加期末考試。
教師從事的語言測評相關(guān)工作主要包括“考試設(shè)計與命題”、“幫助學(xué)生備考”、“評分”、“交流反饋”。在命題方面,與Stiggins的觀點契合,教師認為教學(xué)資源中已有的練習(xí)或測試題一定程度上減少了自主命題的需要。在備考方面,學(xué)校開設(shè)HSK輔導(dǎo)課,在綜合課及各技能課上教師也會讓學(xué)生練習(xí)HSK的題型,反映了一定的高風(fēng)險測試導(dǎo)向性。在評分和反饋方面,教師關(guān)注到考試效度和分?jǐn)?shù)意義的解釋,例如發(fā)揮考試的診斷作用,為寫作、課堂報告等主觀試題制定評分標(biāo)準(zhǔn)等。
關(guān)于線上的語言測評實踐,教師使用多種線上會議平臺、漢語學(xué)習(xí)以及數(shù)據(jù)收集平臺進行教學(xué)與測評,形式轉(zhuǎn)變促使教師對于測評方式和效果進行思考和調(diào)整。傳統(tǒng)的紙筆測試、課堂出勤率等評價方式需要完成模式的轉(zhuǎn)變,例如教師使用問卷星等工具收集測試結(jié)果,在直播課上要求學(xué)生積極有效互動以確認課堂表現(xiàn)情況。作答方式需要適應(yīng)線上測評,例如高年級寫作任務(wù)通過打字完成。評分標(biāo)準(zhǔn)發(fā)生一定變化,例如學(xué)生的課堂報告在線上與線下兩種模態(tài)的評分維度會發(fā)生變化??傊?,線上測試雖然在監(jiān)督、實施等方面遇到問題,但也有其優(yōu)勢,例如學(xué)生學(xué)習(xí)數(shù)據(jù)的記錄、測試批改和反饋等方面更加智能化,發(fā)揮了計算機輔助學(xué)習(xí)的作用。為了保證線上考試公平有效,面對學(xué)生地區(qū)時差的問題,起初是通過調(diào)整在線考試的形式來解決,后來通過完善編班和考試系統(tǒng),保證考生可以在同一時間作答,為監(jiān)考提供了可行條件。
實踐背后是觀念的指導(dǎo),根據(jù)訪談中教師表達的對于語言測評的觀念,絕大多數(shù)教師認同語言測評活動的重要性,并持有積極態(tài)度,認為測評的功能是檢驗水平或?qū)W習(xí)成果,監(jiān)督、規(guī)范學(xué)生學(xué)習(xí),并針對性地改善教學(xué)。也有部分教師認為正式測試的目的是統(tǒng)計學(xué)生群體水平的量化信息,而在教師對學(xué)生的語言水平足夠了解的情況下,測試成績信息對教師來說是輔助性而不是必需的,甚至可能與教學(xué)關(guān)聯(lián)較弱。此外,測評還與一些決策和風(fēng)險相關(guān),如分班、獎學(xué)金評審等。與Brown提出的四條測評觀念假設(shè)對比,國際中文教師對語言測評的觀念較為符合“測評對教學(xué)有促進作用”、“測評反映學(xué)生學(xué)習(xí)情況”,某些情況下“測評與教學(xué)無關(guān)”。
3.語言測評反思
教師語言測評素養(yǎng)自評量表得分(M=47.43/79.38%,SD=7.36)和提升需求量表得分(M=48.06/80.1%,SD=7.56),均處于較高水平(各組量表評分的描述性數(shù)據(jù)見表8、9)。教學(xué)經(jīng)驗對語言測評素養(yǎng)自評量表F(2, 116)=21.089, p=0.000, ηp2=0.272和提升需求量表F(2, 116)=7.227, p=0.001, ηp2=0.113結(jié)果的提升作用顯著,與Deluca等結(jié)果相似;對于自評量表評分,三個教齡段之間均有顯著差異;對于提升需求量表評分,教學(xué)經(jīng)驗的顯著性影響體現(xiàn)在新手教師和專家型教師之間。測評培訓(xùn)因素對量表分?jǐn)?shù)也有顯著影響,自評量表F(1,117)=5.191, p=0.025, ηp2=0.044,提升需求量表F(1,117)=4.275, p=0.041, ηp2=0.036。教學(xué)經(jīng)驗和測評培訓(xùn)兩個因素之間的交互作用不顯著。雖然均有顯著積極影響,教學(xué)經(jīng)驗對自評量表得分的效應(yīng)量(0.272)明顯大于測評培訓(xùn)因素(0.044),參加測評培訓(xùn)使教師的自我評價提升幅度較小,Deluca等則發(fā)現(xiàn)未參加測評課程的教師自我評價比參加過的更高,認為這可能因為參加過測評培訓(xùn)的教師對相關(guān)概念復(fù)雜度的理解比未參加過的教師更深刻,因此對自身的評價趨于保守。
在教師對語言測評素養(yǎng)發(fā)展的看法中,教師認為教學(xué)經(jīng)驗對于課堂測評中把握學(xué)生語言水平、學(xué)習(xí)重難點方面的能力提升有較大作用,有利于設(shè)計測評任務(wù)和命題,而與更加專業(yè)的測量理論和量化分析技能的提高不直接相關(guān),后者需要通過專門的學(xué)習(xí)和運用來實現(xiàn),在測試方面較為專業(yè)的知識和技能通常是為教學(xué)研究所用。參加與測試相關(guān)的工作為教師提供了思考和學(xué)習(xí)的契機,例如教師認為為學(xué)生提供HSK備考的輔導(dǎo)使其對語言測試有了更多的了解。
教師認為自身的語言測評素養(yǎng)有待提升,且接受過測評相關(guān)培訓(xùn)的教師在教學(xué)工作中會發(fā)現(xiàn)其他教師缺乏語言測評素養(yǎng)的一些做法。與已有研究相似,國際中文教師對語言測評素養(yǎng)的提升需要具體可行的實踐指導(dǎo),包括測試原則(標(biāo)準(zhǔn)參照、常模參照測試等)、測試命題指導(dǎo)(如何利用大綱、如何提升效度和信度等)、提供學(xué)習(xí)建議(能力、知識診斷等)等方面。
(二)討論
基于以上研究結(jié)果的分析,本研究主要的發(fā)現(xiàn)和解釋如下。
1.國際中文教師對語言測評知識的掌握程度為中等(62.63%),對客觀知識的掌握并不充足,這點與已有研究結(jié)果相似,語言測評素養(yǎng)自評量表和提升需求量表的結(jié)果較高(79.38%,80.1%),說明國際中文教師對語言測評素養(yǎng)的評價可能存在“不實際的樂觀態(tài)度” 。
2.從影響因素來看,參加測評培訓(xùn)對于語言測評知識得分有積極影響,說明現(xiàn)有的測評培訓(xùn)對于普及語言測評知識有一定效果,主要體現(xiàn)在環(huán)境(指導(dǎo)性標(biāo)準(zhǔn)和大綱等)和實踐(測評活動中的具體做法)方面。Mertler使用“課堂測評素養(yǎng)問卷(CALI)”測量教師測評素養(yǎng),發(fā)現(xiàn)課堂教學(xué)經(jīng)驗對于提升語言測評素養(yǎng)在多個方面都有顯著作用,而本研究發(fā)現(xiàn)教學(xué)經(jīng)驗對語言測評知識得分基本沒有產(chǎn)生顯著影響,但教學(xué)經(jīng)驗對自評和提升需求量表的結(jié)果有顯著影響,結(jié)果反映出語言測評“經(jīng)驗豐富而非專家”的現(xiàn)象。從訪談結(jié)果看,語言測評素養(yǎng)對于國際中文教師是一個尚未普及的概念,誠然,教學(xué)經(jīng)驗可以使教師更加準(zhǔn)確地診斷學(xué)生能力,但在沒有專業(yè)知識的指導(dǎo)下依然存在很多教師測評理念并不合理的情況,不能正確處理測試公平性、有效性的問題。
3.國際中文教師的語言測評實踐注重形成性評價,也存在一定的高風(fēng)險測試導(dǎo)向。教師對語言測評活動的看法整體是積極的,也存在認為教學(xué)經(jīng)驗可以代替正式測試的觀點,對于教師來說,測評依然是國際中文教學(xué)中的邊緣成分,更多與教學(xué)結(jié)合而不具有獨立的專業(yè)性。部分教師認為正式的語言測試與測評專業(yè)知識的重要性不強,此觀點可以解釋問卷結(jié)果中語言測評知識方面教學(xué)經(jīng)驗不是顯著影響因素(因為教師在教學(xué)過程中沒有足夠的動力學(xué)習(xí)這方面知識),也反映出對于國際中文教師來說,促進教學(xué)的評價與標(biāo)準(zhǔn)化測試兩方面的能力是相對獨立的,前者更加受到教師重視。
4.國際中文教師對語言測評素養(yǎng)的提升持積極態(tài)度,認為有必要提升測評培訓(xùn)質(zhì)量,更新在職學(xué)習(xí)內(nèi)容。教學(xué)經(jīng)驗豐富的教師對語言測評素養(yǎng)的自我評價更高,對提升需求的評分也較高,參加測評培訓(xùn)也使提升需求更高。與Deluca等使用“課堂測評方法調(diào)查問卷(ACAI)”調(diào)查結(jié)果相比,教學(xué)經(jīng)驗因素在提升需求量表上表現(xiàn)出更強的促進作用,強調(diào)了持續(xù)性、與工作結(jié)合的測評學(xué)習(xí)的重要性。教師認為對語言測評素養(yǎng)的提升可以從職前培訓(xùn)、實踐和研究指導(dǎo)等方面有針對性地幫助提高教師語言測評素養(yǎng)和相關(guān)研究興趣。教師語言測評素養(yǎng)的提升需要政策環(huán)境支持,對于語言測評素養(yǎng)在實踐中的鞏固和提升,以及創(chuàng)新性測評模式的運用,學(xué)?;驒C構(gòu)需要提供支持條件,以減少如年輕教師沒有話語權(quán)、測評上的創(chuàng)新做法受到管理條件制約等問題。
五總結(jié)與建議
本研究反映了國際中文教師多維度、多層面的語言測評素養(yǎng),研究結(jié)果可以為國際中文教師的師資培養(yǎng)和教師專業(yè)發(fā)展提供參考。研究使用了選擇題和量表兩種問卷方式調(diào)查語言測評素養(yǎng),二者反映的結(jié)果可以對比和互補?!罢Z言測評知識問卷”內(nèi)容以點狀呈現(xiàn),通過知識的樣本來反映教師對語言測試概念和原則的理解以及特定情境下的選擇;而“語言測評素養(yǎng)評價量表”的內(nèi)容以能力描述來呈現(xiàn),讓教師評價自身所具備的語言測評相關(guān)能力和提升需求。兩份問卷的結(jié)合可以從不同視角解釋信息,彌補單一調(diào)查工具的不足。本研究的訪談包含教師對日常語言測評活動和相關(guān)工作的描述,也包含教師對語言測評素養(yǎng)概念的理解和現(xiàn)狀反思。整體來說,本研究的開展遵循認識到反思的順序,研究框架體現(xiàn)了Xu & Brown實踐中的教師測評素養(yǎng)的發(fā)展循環(huán)。
語言測評素養(yǎng)是理論知識、實踐能力和價值態(tài)度等多方面融合的表現(xiàn),對于素養(yǎng)的水平不能僅以“有無”描述,我們從知識、實踐和反思三方面來嘗試解讀國際中文教師的語言測評素養(yǎng)。知識方面,國際中文教師的專業(yè)學(xué)習(xí)、職前培訓(xùn)等經(jīng)歷保證了一定的知識基礎(chǔ),但是問卷與訪談結(jié)果顯示,具有系統(tǒng)的語言測評知識體系的教師較少,且教師對相關(guān)概念(信度、效度等)的理解比較淺顯,難以對實踐有指導(dǎo)作用。在實踐方面,教學(xué)經(jīng)驗的作用得以突顯,有經(jīng)驗的教師比較重視以評促學(xué)的理念,對學(xué)生實施多元化、追蹤性的評價。然而語言測評實踐的情況隨教師個人、教學(xué)環(huán)境變化較大,很多新手教師由于工作內(nèi)容有限,設(shè)計整體測評方案和實施測評活動的需求較少。而且,無論對于新手教師還是經(jīng)驗教師,在測評上花費精力有時被視為負擔(dān)。在反思方面,教師大多認同測評對于教學(xué)的影響力以及語言測評素養(yǎng)的重要性,且指出參與本研究也是一個反思語言測評的機會,將語言測評的實踐納入教學(xué)反思中有利于教師更有意識地調(diào)整和完善語言測評方面的工作。
針對語言測評素養(yǎng)在這三個方面的表現(xiàn),我們提出以下提升模式與建議。(1)對語言測評培訓(xùn)課程的目標(biāo)進行重新定位。根據(jù)教師語言測評素養(yǎng)的特點以及需求分析,改進已有的測評課程,在新手教師的培養(yǎng)階段,要打好測評原理和原則的理論知識基礎(chǔ),并提供實踐指導(dǎo)。要為在職教師提供適應(yīng)具體測評環(huán)境和實踐需求的學(xué)習(xí)機會。例如,課堂測評是教師語言測評工作的重要陣地,在測評培訓(xùn)中可以加入更多前沿的課堂測評方式及其成績報告和反饋的應(yīng)用等。又如在線上教學(xué)資源豐富的情況下,教師需要懂得如何評估、選擇和整合現(xiàn)有的測試和練習(xí)資源。(2)將測評融入教研工作中,通過學(xué)徒、合作等方式在實踐中發(fā)展測評素養(yǎng)。強調(diào)測評工作的規(guī)范和科學(xué)性,如通過教師合作命題等方式調(diào)動其思考和學(xué)習(xí)測評方式的積極性。對于高校在職中文教師,可以鼓勵其將教學(xué)與科研相結(jié)合學(xué)習(xí)語言測評相關(guān)知識,并應(yīng)用一些創(chuàng)新的測評方式促進教學(xué)。
本研究尚存在不足之處。在研究對象上,樣本數(shù)量可以更大,對于教師的教學(xué)經(jīng)驗和培訓(xùn)經(jīng)歷分組可以更加清晰合理。在研究方法上,本研究問卷所包含的問題和答案并沒有在真實教學(xué)情況中進行檢驗,因此問卷雖一定程度上可以反映教師在語言測評專業(yè)方面的知識和素養(yǎng)情況,但與具體教學(xué)環(huán)境的契合程度有待進一步考察。訪談結(jié)果基于教師的自我報告,可能與具體實踐情況有偏差,因此可以采取觀察課堂或測評培訓(xùn)課程中教師的實際操作的方式來對語言測評素養(yǎng)的表現(xiàn)有更深入的理解。
今后有關(guān)國際中文教師語言測評素養(yǎng)的研究可以從以下幾方面來進行拓展:(1)通過課堂觀察、案例研究等方式更加深入地了解教師在具體實踐中的語言測評素養(yǎng);(2)結(jié)合現(xiàn)狀與教師反映的需求,設(shè)計開展相應(yīng)的培訓(xùn)項目,并據(jù)此探索與驗證語言測評素養(yǎng)的發(fā)展方式;(3)在整合語言測評素養(yǎng)內(nèi)涵的基礎(chǔ)上,制定國際中文教師語言測評素養(yǎng)的測量工具并進行有效性驗證和完善。
Investigating the Language Assessment Literacy of College Teachers of Chinese as a Second Language: Knowledge, Practice, and Reflection of Language Assessment
Zhang Yanli1, Wang Xiaozhu2
1. School of Chinese Studies and Exchange, Shanghai International Studies University, Shanghai 200083, China
2. Institute of Educational Policy and Evaluation of International Students, Beijing Language and Culture University, Beijing 100083, China
Abstract: Language assessment literacy (LAL) is an essential professional competence for language teachers to effectively design, interpret, and implement language assessments. This study examines the LAL of Chinese as a Second Language (CSL) college teachers by exploring their knowledge, practice, and reflection regarding language assessment. The findings reveal that CSL teachers possess an intermediate level of language assessment knowledge, displaying a grasp of fundamental concepts and principles, but also exhibiting knowledge gaps and misunderstandings. The study shows that participation in assessment training programs significantly enhances language assessment knowledge. In practice, CSL teachers recognize the importance of formative assessment, yet also demonstrate a tendency to align with high-stakes tests. Both teaching experience and assessment training positively influence teachers perceived level of LAL and learning need. Teachers express a positive attitude towards improving their LAL, emphasizing the need for practical guidance offered by language assessment training.
Key words: language assessment literacy; teachers of Chinese as a Second Language; language assessment knowledge; teachers professional development
[責(zé)任編輯:唐普]