甘 凌 夏紀梅
(1.中南財經(jīng)政法大學(xué) 外國語學(xué)院, 武漢 430073; 2.中山大學(xué) 大學(xué)外語教學(xué)中心, 廣州 510275)
?
語言測試倫理問題研究:回顧與啟示
甘凌1夏紀梅2
(1.中南財經(jīng)政法大學(xué)外國語學(xué)院, 武漢430073; 2.中山大學(xué)大學(xué)外語教學(xué)中心, 廣州510275)
摘要:語言測試是一項利益相關(guān)性很高的活動,牽涉到個人和社會的方方面面,不可避免地存在倫理問題,但國內(nèi)語言測試學(xué)界對測試倫理問題重視不夠?;跍y試倫理和效度的關(guān)系,對語言測試者倫理問題(測試者責任、專業(yè)化、道德準則和行為準則)和語言測試環(huán)節(jié)倫理問題兩大方面進行回顧,在此基礎(chǔ)上闡釋了倫理問題對中國語言測試研究的啟示,希望喚起語言測試界對該問題的重視,確保測試的科學(xué)性和公平性。
關(guān)鍵詞:語言測試; 倫理問題; 回顧與啟示
一、引言
“倫理”一詞源自于哲學(xué),指的是道德上的是非、善惡、平等非平等、公正不公正等。在語言測試領(lǐng)域,倫理主要指的是語言測試者、測試使用者等測試利益相關(guān)者實施良好行為所要遵守的準則和規(guī)范。語言測試倫理問題長期以來都是在測試效度和信度的框架之下進行研究(Spolsky,1997;Kunnan,1999;Taylor,2013:1)。這和Bachman(2000:23)的觀點不謀而合。他認為,語言測試一方面要避免盲目追求構(gòu)念,另一方面要堅定倫理信念。因此,語言測試倫理研究既要包含傳統(tǒng)的信度和效度指標,又要考慮測試使用的后果和倫理問題。國際語言測試期刊LanguageTesting(1997)和LanguageAssessmentQuarterly(2004)以及語言測試學(xué)術(shù)研究大會(LTRC, 1997)均以“語言測試倫理”為主題進行熱烈討論。該主題已成為語言測試領(lǐng)域公認的必不可少的研究問題之一,而且仍將不斷從倫理學(xué)和道德哲學(xué)等領(lǐng)域得到擴展(Kunnan, 2008)。正如Davies(2014:33)所說,效度,或者說倫理,將繼續(xù)在語言測試研究中占據(jù)重要地位。但在我國,語言測試倫理問題并未得到很多關(guān)注,只有少數(shù)人的研究涉及到語言測試倫理問題(梅昳,等,2009;詹先君,等,2010;徐世紅,2012;陳曉扣,等,2013)。
二、語言測試倫理問題研究述評
隨著效度研究范疇和界限的擴展,倫理道德研究越來越受到關(guān)注,已經(jīng)成為效度研究不可或缺的一個維度(陳曉扣,等,2013)。鑒于此,本文根據(jù)現(xiàn)有文獻從兩個方面討論語言測試界對語言測試倫理問題研究:一是與測試者有關(guān)的倫理問題。語言測試者指所有參與到測試決策活動中使測試行為得以實現(xiàn)的人(Shohamy, 2001:145),包括測試設(shè)計者、撰寫者、數(shù)據(jù)統(tǒng)計者、研究者、決策者等,這些人都承擔著一定的社會責任;二是與測試本身有關(guān)的倫理問題。與測試本身有關(guān)的環(huán)節(jié)包括測試開發(fā)、實施、使用、評分、分數(shù)報道解釋等。
(一)測試者倫理問題探討
1.語言測試者責任
語言測試者的倫理問題首先是他們需承擔的責任問題。語言測試由設(shè)計、開發(fā)、實施到使用都會對測試利益相關(guān)者以及相關(guān)的社會機構(gòu)產(chǎn)生或正面或負面的影響。測試工作者必須從倫理上對考試的影響及其使用負責(Hamp-Lyons, 1989)。語言測試者究竟承擔什么責任,目前尚未達成共識。梅昳等(2009)認為測試者責任可能涉及到四個方面:問責、反撥、社會影響以及測試使用倫理。問責制指向語言測試設(shè)計者或開發(fā)者,他們必須負責解釋測試本身的質(zhì)量、測試結(jié)果的使用和分數(shù)報道和使用的解釋等,如果測試結(jié)果被誤用或曲解,他們必須承擔一定的社會責任(Hamp-Lyons, 2000)。反撥以及社會影響是指測試對語言教學(xué)和社會所產(chǎn)生的影響,測試者的責任就是要盡可能使測試產(chǎn)生積極反撥作用。測試使用倫理是指語言測試者必須確保他們開發(fā)的測試符合倫理道德,測試使用恰當,以確??荚囀褂霉?,避免考試潛在的誤用(Bachman, 2000)。相比反撥作用,測試倫理走得更遠,不僅考慮測試產(chǎn)生的影響,還考慮開發(fā)或使用測試在道義上適當與否。
對于語言測試者的擔責討論主要有三種觀點:一種觀點認為語言測試者必須承擔所有的責任。Hamp-Lyons(1989, 1997b, 2000)認為,語言測試者必須為所有能意識到的預(yù)期或非預(yù)期的測試后果承擔責任,因此,必須建立一個包含多種因素的倫理框架,加強對語言測試后效的研究(Hamp-Lyons, 1997b);第二種觀點是語言測試者只需承擔部分責任。Davies(1997a, 1997b)堅稱,作為測試專業(yè)成員的測試者不應(yīng)該也不可能承擔所有的社會后果,測試者責任只能限于合理的范圍之內(nèi),即只能負責有限的、可預(yù)測的社會后果;第三種觀點是責任分擔。Shohamy(2001:148)認為,測試者必須承認他們的知識有限,不可能提供解決所有測試問題的答案。他們必須與受試者、使用者一起共同合作,構(gòu)建解決測試問題的知識,通過民主化方式將測試利益相關(guān)者參與到測試決策中,共同承擔決策后果。Fulcher、Davidson(2012:157) 對此表示贊同。持相同觀點的還有Bachman、Palmer(2010)。他們提出,測試責任應(yīng)該由測試開發(fā)者和測試使用者即測試決策者共同分擔,但兩者在測試不同階段所承擔的責任側(cè)重點不同。在測試開發(fā)和使用階段,測試開發(fā)者的主要責任是測試設(shè)計、測試可操作化和試測,而測試決策者在測試計劃和測試使用階段承擔主要責任。在依據(jù)AUA(Assessment Use Argument)進行舉證階段,測試開發(fā)者必須了解和意識到測試使用的預(yù)期后果以及決策者所做的決定,但他的主要責任在于確保測試結(jié)果具有一致性,基于測試結(jié)果的解釋是有意義的、公正的、可概括的、相關(guān)的和充分的,而測試決策者的主要責任則是要說服其他利益相關(guān)者,他們所做的決定具有價值敏感性和平等性,測試后果具有獲益性。
語言測試領(lǐng)域?qū)y試者所承擔的責任雖然沒有達成一致意見,但可以肯定的是,語言測試者首先必須對測試本身問責,即保證測試質(zhì)量,同時向測試相關(guān)各方,如測試使用者、受試者、測試開發(fā)者或社會機構(gòu)負責說明測試從開發(fā)、設(shè)計、實施、使用、分數(shù)報道到分數(shù)解釋的過程。測試開發(fā)者和測試使用者都必須為測試的使用(決策和后果)對測試利益相關(guān)者負有責任。
2.語言測試專業(yè)化
在過去的十幾年間,測試專業(yè)化一直與測試者倫理責任和社會責任的討論分不開(Spolsky, 2008)。Hamp-Lyons(2000)認為,解決測試者責任承擔程度的辦法之一就是要考慮到語言測試者是作為測試行業(yè)的從業(yè)人員以及是具有道德意識的個體。Standsfield(1993)將專業(yè)化與倫理聯(lián)系起來討論,認為測試專業(yè)化就是“語言測試者在執(zhí)行其行業(yè)職責時所實施的道德行為”。從個人層面看,道德行為是展現(xiàn)專業(yè)化的方式之一;從整體層面看,專業(yè)倫理準則、語言測試開發(fā)及實施標準可以為測試者個人解決倫理問題提供指導(dǎo)。Davies(1997b)指出,語言測試既是一門社會科學(xué),又是一門實踐活動,應(yīng)該建立在行業(yè)道德之上。他提出要建立“倫理環(huán)境”,通過兩方面來實現(xiàn):一是成為專業(yè)語言測試者的要求,二是語言測試專業(yè)領(lǐng)域“良好”行為的標準。在總結(jié)Standfield和Davies的研究基礎(chǔ)上,Bachman(2000)提出,語言測試專業(yè)化有兩個要點:語言測試專業(yè)化培訓(xùn)和行為標準及其執(zhí)行機制的制定。但是語言測試專業(yè)化培訓(xùn)仍有很長的路要走,因為很多專業(yè)化培訓(xùn)都沒有專門針對語言測試的專業(yè)課程或是實訓(xùn)課程,結(jié)果很多開發(fā)和使用測試的從業(yè)者并沒有或很少得到專業(yè)培訓(xùn)(Bachman, 2000:19; Jin, 2010)。為此,Bachman(2000)倡議,為提高語言測試專業(yè)培訓(xùn)質(zhì)量,我們不僅需要制定測試專業(yè)能力標準,而且要將這些標準納入到培訓(xùn)標準以及語言教師執(zhí)教資格當中。
目前為止,該行業(yè)已經(jīng)成立了一些國際的、國家的或地區(qū)的專業(yè)機構(gòu),如,國際語言測試協(xié)會(ILTA)、歐洲語言測試者協(xié)會(ALTE)、歐洲語言測試與評估協(xié)會(EALTA)、日本語言測試協(xié)會(JALT)以及旨在推動亞洲地區(qū)語言測試與評估發(fā)展的亞洲語言測試協(xié)會(AALA)。這些機構(gòu)為在語言測試領(lǐng)域建立倫理價值、實施專業(yè)行為做出了巨大貢獻。在我國,還沒有諸如ILTA 或ALTE這樣的會員制組織,但國內(nèi)的外語期刊卻為更多的語言測試專家、研究者和愛好者提供了學(xué)習(xí)交流的平臺,凝聚了越來越多語言測試從業(yè)者。
3.語言測試的道德準則和行為準則
語言測試成為一個行業(yè),就意味著如同法律、醫(yī)療行業(yè)一樣也需要建立一定的行業(yè)標準和準則,對從業(yè)者的職業(yè)道德及行為進行規(guī)范和約束(陳建林,2014)。Davies(2008:433)指出,道德準則和/或行為準則有助于創(chuàng)建“倫理環(huán)境”。道德準則可以在測試專業(yè)成員(測試開發(fā)者)和測試客戶(測試使用者)之間建立直接聯(lián)系。只有實施道德準則、發(fā)布行業(yè)行為標準、認可測試相關(guān)方的權(quán)利,語言測試的專業(yè)化才得以真正體現(xiàn)(Davies, 2008:433; Hamp-Lyons, 2000)。ILTA于2000年公布了《道德準則》,這是語言測試倫理研究發(fā)展史上的一個重要里程碑?!兜赖聹蕜t》共有9條基本原則,每一原則都有一系列詳細的注釋,規(guī)定了ILTA成員應(yīng)該做什么和不該做什么以及成為ILTA成員具備的條件,以及違反規(guī)則將要受到的懲罰。
Hamp-Lyons(1998)提出,“語言測試必須像其他行業(yè)一樣,為其從業(yè)者制定行為規(guī)則,包括測試備考行為和測試教材編制行為?!币驗榈赖聹蕜t只是關(guān)于行業(yè)道德規(guī)范,行為準則才是對專業(yè)不當行為和不專業(yè)行為的具體說明以及對測試行為的最低要求,是道德準則的具體示例(Boyd, et al, 2002; Davies, 2008: 433)。因此,有必要單獨制定一個《行為準則》,對從業(yè)者的實踐行為進行規(guī)范和要求。2005年,ILTA頒布了《行為準則草稿》,2007年才最終確認了作為《道德準則》具體實踐的《行為方針》。
除了ILTA,ALTE早在1994年就頒布了歐洲語言測試者協(xié)會行為準則(ALTE Code of Practice),主要應(yīng)用于考試開發(fā),考試結(jié)果的解釋,向考生傳遞信息等。2006年,EALTA頒布歐洲語言測試和評估協(xié)會良好測試和評估行為準則(EALTA Guidelines of Good Practice in Language Testing & Assessment),規(guī)定了課堂測試與評估行為準則、教師培訓(xùn)行為準則和大型考試機構(gòu)的開發(fā)行為準則。此外,美國ETS的質(zhì)量和公平標準(ETS Standards of Quality and Fairness),對考試的開發(fā)、實施、使用等環(huán)節(jié)進行嚴格的質(zhì)量控制,從而確保整個考試流程和環(huán)節(jié)公平、公正和科學(xué)。
(二)與測試環(huán)節(jié)有關(guān)的倫理問題探討
除了探討語言測試者責任、測試專業(yè)化以及行業(yè)標準制定之外,研究者還探討從測試設(shè)計、開發(fā)、實施到使用一系列環(huán)節(jié)的實踐是否符合倫理道德。
Shohamy(1997)從語言測試方法和測試后果兩方面討論語言測試是否符合倫理、是否具有公平性。她認為,測試方法例如測試類型、風(fēng)格或測試任務(wù)對測試分數(shù)有影響,從而對某些受試者產(chǎn)生偏差。也就說,測試方法對所有受試者并不完全公平,這樣的測試不符合倫理。同樣,如果測試結(jié)果被用來控制和操控測試相關(guān)方,而不是提供有關(guān)語言水平信息,這樣的測試也不道德。最后,Shohamy(1997)提出,測試者要隨時注意確保測試方法和測試使用不能偏頗。
研究者還探討分數(shù)解釋和使用的倫理問題。例如O’Loughlin (2011)以測試使用者(行政人員和學(xué)術(shù)員工)為對象,研究IELTS分數(shù)作為選擇國際留學(xué)生的衡量標準,其分數(shù)解釋和使用在多大程度上符合倫理。研究結(jié)果表明,由于沒有對IELTS最低錄取分數(shù)做理論上的規(guī)定,沒有對學(xué)生后續(xù)學(xué)習(xí)進行追蹤,根據(jù)申請者測試分數(shù)是否錄用的決定也沒有被充分告知受試者,這樣的決定是無效且不道德的。有關(guān)分數(shù)使用和評分的倫理研究在我國始于梅昳(2008)。她通過追蹤2007年某省高考英語寫作評卷過程,考察影響評卷人員評分公平性的因素,并調(diào)查高考寫作評分對個人、機構(gòu)及全社會的影響,試圖提出一套符合現(xiàn)實情況的高考評卷人員道德行為規(guī)范,以期提高高考評分人員的職業(yè)道德意識,并使高考英語這樣的高風(fēng)險語言測試評分更加科學(xué)公正。
關(guān)于測試專業(yè)倫理,Spolsky(1997)和Bachman(2000)認為,測試相關(guān)各方參與到語言測試當中有助于改善測試的倫理性。但Mathew(2004)卻對此提出了質(zhì)疑。她以印度兩種測試為研究對象,試圖回答:測試相關(guān)方的參與是否有助于,且多大程度上有助于改進測試倫理性。結(jié)果表明,測試相關(guān)方的參與使得一種測試顯得不符合倫理道德,在另一測試中卻提升了測試的倫理性。Mathew認為,由于很難認定利益相關(guān)方在語言測試中的作用,以上問題仍是未解之謎。
測試倫理研究還涉及測試使用倫理。Reed 和Stanfield(2004)從5個倫理問題檢測使用現(xiàn)代語言學(xué)能測試(Modern Language Aptitude Test,MLAT)來診斷學(xué)生外語學(xué)習(xí)不足是否符合倫理道德。他們的結(jié)論是,如果測試保護措施到位,且得到專業(yè)指導(dǎo),MLAT用來診斷個人學(xué)習(xí)不足是符合倫理的。
終上所述,國內(nèi)外學(xué)者從實踐上、理論上都認可測試專業(yè)化或行業(yè)化。盡管大家對語言測試者應(yīng)該承擔多少責任沒有形成一致,但作為測試者個人或是測試機構(gòu)的成員,其最重要的職責就是依據(jù)道德準則和行為標準,對測試行為做出專業(yè)判斷,盡可能保證測試的公平性和科學(xué)性。測試倫理問題十分復(fù)雜,國內(nèi)外研究只是討論什么是符合倫理的測試行為或?qū)I(yè)行為,并提供了《道德準則》和《行為準則》等指導(dǎo)綱領(lǐng)。但目前,將道德準則和行為標準運用到對具體測試行為進行檢驗的實證研究卻很少(O’Loughlin,2011;梅昳,2008)。一項測試,尤其是高風(fēng)險、大規(guī)模測試從測試命題、設(shè)計、方法、類型、測試實施、使用、評分、分數(shù)解釋和報道各個方面是否符合道德準則和行為準則,都有待于語言測試者進行更多的實證研究。
三、對中國語言測試研究的啟示
(一)制定并實踐語言測試標準及測試人員的道德準則和行為準則
由于各國歷史文化的差異,ILTA的《道德準則》和《行為綱領(lǐng)》并不是放之四海而皆準的真理。因此,我們必須根據(jù)具體的語言測試情況,制定語言測試標準和符合中國語言國情的道德準則和行為準則,使中國的語言測試行為有理可依,有法可據(jù)。楊惠中和桂詩春(2007)提出,由相關(guān)部門制定“教育測量與心理測量標準”并頒布執(zhí)行,制定“語言能力等級統(tǒng)一量表”等。為此,劉建達等(2015)進行了“中國學(xué)生英語能力等級量表”制定研究,分別包括聽力、口語、寫作、翻譯、語用能力量表。能力量表的制定有利于制定科學(xué)合理的考試目標和能力要求,有利于促進外語考試的科學(xué)性和標準化。范勁松(2011)對中國英語考試行為準則的制定做了一項探索性研究。他提出制定語言測試標準的基本模型,并運用這一模型起草制定了具有教育性、啟發(fā)性而非強制性的《行為準則》。此類研究在國內(nèi)語言測試界尚屬首次,具有積極的啟示意義。盡管中國在標準和準則的制定方面已經(jīng)取得開拓性的成就,但還未看到將標準和準則用于指導(dǎo)和評估測試實踐的研究。
(二)語言測試人員專業(yè)化
語言測試標準、道德準則和行為準則的制定和實施,需要有一支專業(yè)的語言測試隊伍。盡管有些高校已經(jīng)開設(shè)了語言測試與評估的課程,但現(xiàn)有的教師隊伍中具備一定語言測試專業(yè)知識的教師并不多(梅昳,等,2009:94;Jin,2010)。中國現(xiàn)行的大多數(shù)外語測試,在命題、施考、評卷等環(huán)節(jié)都是隨機抽調(diào)人員,這些人員語言測試知識參差不齊,造成測試環(huán)節(jié)出現(xiàn)各種問題,嚴重損害考生利益。所以,有必要對語言教師進行語言測試專業(yè)培訓(xùn),推廣語言測試知識,推進測試專業(yè)認證,提高師資隊伍測評素養(yǎng)。語言測試專業(yè)化的實現(xiàn)可以有兩個途徑:一是語言測試專業(yè)機構(gòu)或組織的建立。楊惠中和桂詩春(2007)指出,由政府部門組織成立相關(guān)專家學(xué)者組成的語言政策咨詢委員會,將有利于推動語言測試專業(yè)化進程。剛剛成立的中國外語測評中心就是這樣的組織。二是語言測試教師培訓(xùn)。培訓(xùn)形式包括職前開設(shè)語言測評課程,在職教師可以參加工作坊、講座、項目培訓(xùn)等,學(xué)習(xí)語言測試理論知識,比如測試命題設(shè)計、分數(shù)報道和解釋、評分等,并進行動手實踐操作。在教師語言測試培訓(xùn)中,明確作為測試者應(yīng)該承擔的責任和義務(wù),避免對語言測試做出專業(yè)的不良行為以及不專業(yè)行為。
(三)以批判角度重新審視語言測試倫理問題
Lynch(2001)從批判角度構(gòu)建了一個測試倫理和效度框架,認為要重新考慮用更民主的方式進行測試。即通過測試之外的多種方式收集考生測試行為的相關(guān)信息并進行評估,包括觀察、訪談、個人陳述、參與課堂活動、建立學(xué)生個人檔案等。這樣的民主測評實際上是將形成性評估和終結(jié)性評估結(jié)合起來,真實全面地考核學(xué)生的語言能力。但在中國這樣一個長期用單一測試作為評價方式的國家,推行以多種手段考查學(xué)生語言能力的方式還存在一定困難,可以由點及面地逐步展開。
從批判角度審視語言測試倫理問題更不能忽視測試的公平性研究。正如Shohamy(2000:340)提到的:“采用對所有受試者不公平測試方法的一切測試都是不符合倫理的。”盡管倫理和公平性在研究范疇上不完全重合,但語言測試者能注意到測試倫理問題,就會更加關(guān)注他們所做的測試決策對測試利益相關(guān)方的影響,其中就包括對不同受試群體的影響,而這正是語言測試公平性要研究的問題(Xi, 2010)。中國的語言測試往往規(guī)模巨大、考生人數(shù)眾多、生源覆蓋面廣、語言學(xué)習(xí)背景多樣,測試的公平性研究更有必要。
四、結(jié)語
隨著效度理論的不斷發(fā)展,人們越來越關(guān)注語言測試作為權(quán)力和社會控制工具所引起的倫理問題。倫理不僅僅體現(xiàn)在語言測試的各個環(huán)節(jié),而且要求語言測試者承擔責任,符合行業(yè)標準,遵守行業(yè)規(guī)則、道德準則和行為規(guī)范。但該問題并沒有在中國語言測試領(lǐng)域引起足夠的重視。未來在中國的語言測試環(huán)境下,可以從各個角度通過不同方法對倫理問題進行更深入的研究,例如符合中國國情的語言測試標準、道德準則、行為準則制定的探索性研究和應(yīng)用研究,各級語言教師測試專業(yè)化培訓(xùn)需求及模式研究,語言教師測評能力標準的制定及應(yīng)用研究,大規(guī)??荚嚬叫匝芯康取V挥胁粩嗉訌娬Z言教師對語言測試的了解,才能真正解決語言測試的倫理問題,實現(xiàn)測試的科學(xué)性和公平性。
參考文獻:
陳建林.2014.語言測試社會屬性研究綜述[J].外語測試與教學(xué)(2):1-11.
陳曉扣,李紹山.2013.倫理道德語言測試效度研究——一個不可或缺的維數(shù)[J].外語測試與教學(xué)(3):1-7,47.
范勁松.2011. 中國英語考試行為準則制訂:一項探索性研究[D].上海:上海交通大學(xué).
劉建達,金艷,等. 2015.Developing Scales for Chinese EFL Learners[C]∥語言測試與評價國際研討會論文集.廣州:廣東外語外貿(mào)大學(xué).
梅昳.2008. 高考英語寫作評分倫理問題研究[D].太原:山西大學(xué).
梅昳,聶建中.2009. 語言測試倫理問題研究述評[J].外語界(4):91-96.
徐世紅.2011.大規(guī)模語言測試的道德問題[J].南通大學(xué)學(xué)報(社會科學(xué)版)(4):2-7.
楊惠中,桂詩春.2007.語言測試的社會性思考[J].現(xiàn)代外語(4):368-374.
詹先君,王后雄.2010.中國外語考試的倫理期待與制度改革[J].中國教育導(dǎo)刊(5):23 -26.
BACHMAN L F.2000.Modern Language Testing at the Turn of the Century: Assuring that What We Count Counts[J].Language Testing,17(1):1-42.
BACHMAN L F,PALMER A S.2010.Language Assessment in Practice[M].Oxford UK: Oxford University Press.
BAILEY A L,BUTLER F A.2004. Ethical Considerations in the Assessment of the Language and Content Knowledge of US School-age English Learners[J].Language Assessment Quarterly,1(2/3):177-193.
BOYD K,DAVIES A.2002.Doctors’ Orders for Language Testers: the Origin and Purpose of Ethical Codes[J].Language Testing,19(3):296-322.
DAVIES A.1997a.Introduction the Limits of Ethics in Language Testing[J].Language Testing, 14(3):235-241.
DAVIES A.1997b.Demands of Being Professional in Language Testing[J].Language Testing,14(3):328-339.
DAVIES A.2004. Introduction: Language Testing and the Golden Rule[J].Language Assessment Quarterly,1(2/3):97-107.
DAVIES A.2008.Ethics, Professionalism, Rights and Codes[C]∥SHOHAMY E,HORNBERGER N(eds.).Encyclopedia of Language and Education—Language Testing and Assessment (Volume 7).New York:Springer Science Business Media LLC:429-443.
DAVIES A.2014. Fifty Years of Language Assessment[C]∥KUNNAN A(eds.).The Companion to Language Assessment.New York:John Wiley & Sons:1-19.
FULCHER G.2009.Test Use and Political Philosophy[J].Annual Review of Applied Linguistics(29):3-20.
FULCHER G,DAVIDSON F.2012.The Routledge Handbook of Language Testing[M].London & New York:Routledge.
GREEN A.2014.Exploring Language Assessment and Testing: Language in Action[M].London & New York:Routledge.
HAMP-LYONS L.1989.Language Testing and Ethics[J].Prospect(5):7-15.
HAMP-LYONS L.1997a.Ethics in Language Testing[C]∥CLAPHAM C,CORSON D (eds.).Encyclopedia of Language and Education (Volume 7):Language Testing and Assessment.Dordrecht:Kluwer Academic.
HAMP-LYONS L.1997b.Washback, Impact and Validity: Ethical Concerns[J].Language Testing,14(3):295-303.
HAMP-LYONS L.1998.Ethical Test Preparation Practice: The Case of the TOEFL[J].TESOL Quarterly,32(2):329-337.
HAMP-LYONS L.2000.Social, Professional and Individual Responsibility in Language Testing[J].System(28):579 -591.
HAMP-LYONS L.2001.Ethics, Fairness(es), and Development in Language Testing[C]∥ELDER C,et al (eds.).Experimenting with Uncertainty: Essays in Honor of Alan Davies.Cambridge: Cambridge University Press:211-221.
JIN YAN.2010.The Place of Language Testing and Assessment in the Professional Preparation of Foreign Language Teachers in China[J].Language Testing,27(4):555-584.
KANE M.2012.Validating Score Interpretation and Uses: Messick Lecture, Language Testing Research Colloquium, Cambridge, April 2010[J].Language Testing,29(1):3-17.
KUNNAN A.1999.Recent Development in Language Testing[J].Annual Review of Applied Linguistics(19):235-253.
KUNNAN A.2008. Towards a Model of Test Evaluation: Using the Test Fairness and Test Context Frameworks[C]∥TAYLOR L,WEIR C J(eds.).Multilingualism and Assessment: Achieving Transparency, Assuring Quality, Sustaining Diversity—Proceedings of the ALTE Berlin Conference, May 2005.Cambridge:UCLES and Cambridge University Press.
LYNCH B.1997.In Search of the Ethical Test[J].Language Testing,14(3):328-339.
LYNCH B.2001.Rethinking Assessment from a Critical Perspective[J].Language Testing,18(4): 351-372.
MATHEW R.2004.Stakeholder Involvement in Language Assessment: Does it Improve Ethicality?[J].Language Assessment Quarterly,1(2/3):123-135.
MCNAMARA T,ROOVER C.2006.Language Testing: The Social Dimension[M].Oxford: Blackwell.
O’LOUGHLIN K.2011.The Interpretation and Use of Proficiency Test Scores in University Selection: How Valid and Ethical Are They?[J].Language Assessment Quarterly,8(2):146-160.
REED D,STANSFIELD C.2004.Using the Modern Language Aptitude Test to Identify a Foreign Language Learning Disability: Is It Ethical?[J].Language Assessment Quarterly,1(2/3):161-176.
SHOHAMY E.1997.Testing Methods,Testing Consequences: Are They Ethical? Are They Fair?[J].Language Testing,14(3):340-349.
SHOHAMY E.2000. Fairness in Language Testing[C]∥KUNNAN A J (eds.).Fairness and Validation in Language Assessment.Cambridge:Cambridge University Press.
SHOHAMY E.2001.The Power of Tests: A Critical Perspective on the Use of Language Tests[M].Harlow,England:Longman.
SPOLSKY B.1997.The Ethics of Gatekeeping Tests: What Have We Learned in One Hundred Years?[J].Language Testing,14(3):242 -247.
SPOLSKY B.2008.Introduction——Language Testing at 25: Maturity and Responsibility?[J].Language Testing,25(3):297-305.
STANSFIELD C.1993.Ethics, Standards and Professionalism in Language Testing[J].Issues in Applied Linguistics,4(2):15-30.
TAYLOR L.2013.Ethics in Language Assessment[C]∥CHAPELLE C A (eds.).The Encyclopedia of Applied Linguistics.Dordrecht:Blackwell Publishing Ltd:2008-2014.
Xi X.2010.How Do We Go about Investigating Test Fairness?[J].Language Testing,27(2): 147-170.
[責任編輯:許蓮華]
Ethics in Language Testing: Review and Implication
GAN Ling1XIA Jimei2
(1.SchoolofForeignLanguages,ZhongnanUniversityofEconomicsandLaw,Wuhan430073;2.ForeignLanguagesTeachingCenter,SunYat-senUniversity,Guangzhou510275,China)
Abstract:Language testing is usually high-stake, for it involves such various stakeholders as test users and test takers who make decisions or are made decisions based on the scores of the tests. Henceforth, the decisive role of language testing on individual’s lives must involve issues about ethicality. This article presents and discusses the existing researches concerning ethics in language testing from two aspects: testers and tests. In view of the discussion, it elucidates the implications for researches on ethics in Chinese language testing.
Key words:language testing; ethics; review and implication
收稿日期:2015-09-01
基金項目:中央高?;究蒲袠I(yè)務(wù)費專項資金項目“語言測試倫理問題研究——以大學(xué)英語四、六級為例”(31541410209)。
作者簡介:甘凌(1980-),女,廣西賓陽人,碩士,中南財經(jīng)政法大學(xué)外國語學(xué)院講師,研究方向為語言測試與外語教學(xué)。夏紀梅(1950-),女,中山大學(xué)大學(xué)外語教學(xué)中心教授,華中農(nóng)業(yè)大學(xué)“楚天學(xué)者”主講教授,研究方向為外語教育。
中圖分類號:H08
文獻標識碼:A
文章編號:1672-0962(2016)02-0058-07