陳雪翎
(上海立信會(huì)計(jì)學(xué)院,上海201103)
近年來(lái),商務(wù)英語(yǔ)證書(shū)(如Business English Certificate,BEC)考試在中國(guó)的考生人數(shù)每年成千上萬(wàn)地增加,已成為在我國(guó)舉行的規(guī)模最大的海外英語(yǔ)考試之一。O’Sullivan對(duì)比目前國(guó)際上幾個(gè)主要商務(wù)英語(yǔ)考試項(xiàng)目之后,認(rèn)為可以從以下9個(gè)方面來(lái)看待其理論與實(shí)踐問(wèn)題:考試介紹、考試描述、考試的基本框架、測(cè)試方法、考試包含的技能、測(cè)試質(zhì)量、特殊性/真實(shí)性的程度、非語(yǔ)言因素的作用和考試成績(jī)的報(bào)道(O’Sullivan 2006:175)。本文從商務(wù)英語(yǔ)考試產(chǎn)生的歷史背景出發(fā),探索其中的理論問(wèn)題。
商務(wù)英語(yǔ)屬于特殊用途英語(yǔ)(English for Specific Purposes,ESP)。對(duì)ESP領(lǐng)域的集中研究大約開(kāi)始于上世紀(jì)80年代(Swales 1984),主要涉及特殊環(huán)境下語(yǔ)言運(yùn)用的獨(dú)特性(Johns 1980)、教學(xué)材料的真實(shí)性(Carver 1983)和特殊用途語(yǔ)言學(xué)習(xí)者的需求分析等。有些關(guān)于ESP的問(wèn)題,直到今天還在討論。
語(yǔ)言教學(xué)理論的變化促使特殊用途英語(yǔ)教學(xué)方法的發(fā)展,使人們意識(shí)到有必要建立一套清楚合理的測(cè)試程序(Hawkey 2004)。在商務(wù)英語(yǔ)領(lǐng)域首先出現(xiàn)的標(biāo)準(zhǔn)化國(guó)際考試是美國(guó)教育考試服務(wù)中1979年推出的TOEIC考試,采用的是心理測(cè)量-結(jié)構(gòu)主義模式(Spolsky 1995)。在TOEIC考試?yán)碚摬粩嗤晟茣r(shí),英國(guó)開(kāi)發(fā)的商務(wù)英語(yǔ)類(lèi)考試開(kāi)始更加注重語(yǔ)言交際。這對(duì)語(yǔ)言學(xué)習(xí)與教學(xué)產(chǎn)生了深遠(yuǎn)影響,促使心理測(cè)量-結(jié)構(gòu)主義模式向心理語(yǔ)言學(xué)-社會(huì)語(yǔ)言學(xué)時(shí)代轉(zhuǎn)變,也就是在語(yǔ)言教學(xué)測(cè)試上由分散個(gè)體向集合整體轉(zhuǎn)變。語(yǔ)言教學(xué)重點(diǎn)由語(yǔ)言知識(shí)向語(yǔ)言應(yīng)用轉(zhuǎn)變,并為測(cè)試方法的改變鋪平了道路。隨之而來(lái)的ESP類(lèi)考試,如皇家文學(xué)社團(tuán)考試委員會(huì)開(kāi)發(fā)的CEFLS(Certificate in English as a Foreign Language for Secretaries)及其后來(lái)的CEIBT(Certificate in English for International Business and Trade)、倫敦工商會(huì)考試局的商務(wù)英語(yǔ)考試、倫敦城市行業(yè)協(xié)會(huì)開(kāi)發(fā)的Pitman英語(yǔ)考試等。
隨著商務(wù)活動(dòng)的國(guó)際化需要,操不同語(yǔ)言的公司人員相互之間有更多的互動(dòng),因此對(duì)ESP領(lǐng)域中商務(wù)外語(yǔ)考試的重視程度越來(lái)越高。上世紀(jì)90年代,劍橋大學(xué)考試委員會(huì)推出BEC和BULATS考試。其他語(yǔ)種的商務(wù)語(yǔ)言考試也開(kāi)始問(wèn)世,如日語(yǔ)的JETRO,法語(yǔ)的TFI,意大利語(yǔ)的CIC以及法語(yǔ)、德語(yǔ)、西班牙語(yǔ)版的BULATS.這些考試基本上都以語(yǔ)言應(yīng)用為導(dǎo)向,重點(diǎn)放在任務(wù)場(chǎng)景化和商務(wù)環(huán)境下預(yù)計(jì)的語(yǔ)言反應(yīng),而且都反映出商務(wù)語(yǔ)言的考試體裁。
Douglas試圖為特殊用途語(yǔ)言(Language for Specific Purposes,LSP)的考試建立一個(gè)理論框架(Douglas 2000)。這個(gè)理論框架建立在兩個(gè)理論基礎(chǔ)之上。其一,語(yǔ)言運(yùn)用是隨著運(yùn)用環(huán)境改變而變化的。這種假想受到社會(huì)語(yǔ)言學(xué)、第二語(yǔ)言習(xí)得和語(yǔ)言測(cè)試研究的支持,同時(shí)也與人們對(duì)語(yǔ)言測(cè)試開(kāi)發(fā)的社會(huì)認(rèn)知方法的重視一致,因?yàn)檎Z(yǔ)言運(yùn)用環(huán)境與任務(wù)完成的認(rèn)知過(guò)程有互相依賴(lài)關(guān)系。其二,特殊用途語(yǔ)言測(cè)試“準(zhǔn)確”,因?yàn)槠湓~匯、語(yǔ)義、句法、音系特征有別于普通用途環(huán)境。在具體定義特殊用途語(yǔ)言測(cè)試時(shí),Douglas將這兩個(gè)基礎(chǔ)合為一個(gè)概念:真實(shí)性(authenticity)。他認(rèn)為特殊用途英語(yǔ)測(cè)試的目的是:“測(cè)試內(nèi)容和方法來(lái)自于對(duì)特殊用途目標(biāo)語(yǔ)言使用情景的分析,以至于測(cè)試任務(wù)和內(nèi)容真實(shí)代表目標(biāo)情景中的任務(wù),允許考生的語(yǔ)言能力及特殊用途知識(shí)與測(cè)試任務(wù)之間存在互動(dòng)。這種測(cè)試使我們能夠推斷出考生在特殊用途領(lǐng)域內(nèi)運(yùn)用語(yǔ)言的能力”(Douglas 2000:19)。真實(shí)性是特殊用途語(yǔ)言測(cè)試的核心,它并不是在考試上下文中復(fù)制一些特殊用途英語(yǔ)的任務(wù),而是從以下兩個(gè)方面考察的結(jié)果:(1)情景真實(shí)性,之所以說(shuō)其真實(shí),是因?yàn)榭荚嚾蝿?wù)來(lái)自于與之關(guān)聯(lián)的語(yǔ)言應(yīng)用領(lǐng)域的分析;(2)互動(dòng)真實(shí)性,與任務(wù)行為中的實(shí)際處理過(guò)程有關(guān)。從真實(shí)性的兩個(gè)方面來(lái)看,他的理論站得住腳:考試基于語(yǔ)言運(yùn)用因特殊環(huán)境,這些特殊環(huán)境的語(yǔ)言精確,與其他領(lǐng)域語(yǔ)言使用環(huán)境有區(qū)別。
當(dāng)然,這些觀(guān)點(diǎn)并非沒(méi)有受到質(zhì)疑。對(duì)此,Elder提出:(1)“特殊用途”環(huán)境明顯存在可區(qū)別性,因此須要考察如何與通用語(yǔ)言能力區(qū)別;(2)真實(shí)性,什么因素可以組成考試方案,在一個(gè)人工考試環(huán)境中喚起考生;(3)非語(yǔ)言因素的影響和相互作用,是否能夠或者是否應(yīng)該與考試中的語(yǔ)言材料分開(kāi),單獨(dú)評(píng)價(jià)(Elder 2001:149)。
將特殊用途語(yǔ)言與通用語(yǔ)言區(qū)別開(kāi)來(lái)是否可能?是否可行?在商務(wù)英語(yǔ)方面,倫敦工商局(LCCI)在世界范圍內(nèi)提供商務(wù)相關(guān)課程考試多年后,1972年對(duì)600家企業(yè)的11,500名雇員的外語(yǔ)使用情況進(jìn)行了一次調(diào)查;1982年至1985年間,在法國(guó)、希臘、西班牙和當(dāng)時(shí)的聯(lián)邦德國(guó)也進(jìn)行了類(lèi)似調(diào)查。分析調(diào)查結(jié)果對(duì)英國(guó)語(yǔ)言教學(xué)和考試產(chǎn)生了影響(O’Sullivan 2006:5)。Clapham深入研究IELTS考試成績(jī)之后發(fā)現(xiàn),考生的專(zhuān)業(yè)學(xué)習(xí)背景和工作背景在考試中十分重要,會(huì)影響考試成績(jī)(Clapham 1996)。在語(yǔ)言水平基本相同的情況下,某些考生考試時(shí)碰到其工作領(lǐng)域之外的內(nèi)容時(shí),表現(xiàn)一般略差(Alderson&Urquhart 1988)。然而,特殊用途英語(yǔ)環(huán)境界限的劃定是一大難題。人們雖然能夠看出某些語(yǔ)言材料(如詞匯、句法、修辭等)運(yùn)用到某個(gè)特殊環(huán)境中,但不能說(shuō)出它們使用的確切限度,因?yàn)檫@里沒(méi)有所謂的“確切限度”。商務(wù)英語(yǔ)存在并相互作用于通用英語(yǔ)領(lǐng)域。
商務(wù)英語(yǔ)考試是否能做到同時(shí)具有情景和互動(dòng)的真實(shí)性?情景真實(shí)性是語(yǔ)言應(yīng)用領(lǐng)域中的實(shí)際情景在考試方案中的精確反映,體現(xiàn)為考試中的文章和任務(wù)要求。測(cè)試情景與商務(wù)領(lǐng)域可以非常相像。在目前實(shí)施的考試中,任務(wù)(特別是體現(xiàn)接受性技能的任務(wù))一般只具有情景真實(shí)性。建立考試任務(wù)的情景真實(shí)性相對(duì)來(lái)說(shuō)比較直接,而互動(dòng)真實(shí)性的建立只能通過(guò)探索考試經(jīng)驗(yàn)來(lái)證實(shí),因?yàn)槠浯_定性程度要差一點(diǎn),概念化程度和可操作性都較低。盡管人們都認(rèn)為考試應(yīng)該帶來(lái)任務(wù)和相關(guān)語(yǔ)言能力的相互作用,但對(duì)其可操作性(基于環(huán)境的效度要素和基于理論的加工處理)還沒(méi)有很好結(jié)合??荚囬_(kāi)發(fā)和研究工作者往往依賴(lài)于某些含逸事趣聞的例證或?qū)<乙庖?jiàn)來(lái)決定某個(gè)考試任務(wù)的互動(dòng)真實(shí)性(O’Sullivan 2006:7)。這樣,任務(wù)完成情況就會(huì)受任務(wù)參與者(考生)影響,往往在任務(wù)設(shè)計(jì)者(命題者)可控范圍之外??梢允谷蝿?wù)在特定操作條件下體現(xiàn)互動(dòng)真實(shí)性,但如果期待考試在所有條件下展示則不現(xiàn)實(shí)。假定一個(gè)優(yōu)秀考生完成了任務(wù),展示了交際能力和特殊領(lǐng)域語(yǔ)言運(yùn)用特點(diǎn)的互動(dòng),那么這個(gè)任務(wù)具有互動(dòng)真實(shí)性,但這個(gè)過(guò)程對(duì)其他考生不一定精確。
綜觀(guān) BEC,BULATS,TOEIC,LCCIEB,CEIBT 等考試,可以發(fā)現(xiàn),這些考試都冠以商務(wù)英語(yǔ)稱(chēng)謂,屬于特殊用途英語(yǔ)范疇,但內(nèi)容很多,不宜僅僅視為“特殊”領(lǐng)域的考試。事實(shí)上,所有的考試都有其特殊性。因此,最好把所有英語(yǔ)考試都置于特殊性連續(xù)體(specificity continuum)中的某一位置。專(zhuān)業(yè)性強(qiáng)的考試在大眾化方面較弱,反之也如此。如果一項(xiàng)考試不靠近這個(gè)連續(xù)體的兩端,那么總會(huì)具備通用英語(yǔ)的特征??梢韵胂?,如果說(shuō)一個(gè)英語(yǔ)考試任務(wù)“特殊”,是因?yàn)樗恢糜诼殬I(yè)/工作(或者我們稱(chēng)為商務(wù))環(huán)境中,而語(yǔ)言使用還是屬于通用型的。其測(cè)試重點(diǎn)可能還是非特殊用途語(yǔ)言,并不像一個(gè)很專(zhuān)業(yè)化的任務(wù),須要激發(fā)一個(gè)認(rèn)知過(guò)程。
如果一項(xiàng)考試靠近連續(xù)體的特殊用途一端,情景真實(shí)性的焦點(diǎn)就會(huì)改變。也就是說(shuō),考試用途的特殊性強(qiáng),就會(huì)最大程度地反映真實(shí)世界的情景,焦點(diǎn)會(huì)落到事件而非事件語(yǔ)言上;通用性強(qiáng)、特殊性弱的考試,情況則相反。特殊用途英語(yǔ)考試的目的是考察一個(gè)考生在某一特殊領(lǐng)域的英語(yǔ)應(yīng)用能力。因此,考試任務(wù)涉及考生潛在的語(yǔ)言資源和處理語(yǔ)言能力的程度同該特殊環(huán)境要求的程度相同,能夠說(shuō)明該考試的互動(dòng)真實(shí)性。
非語(yǔ)言因素對(duì)考生考試成績(jī)影響的程度反映考試的特殊性程度。因此,在特殊性較強(qiáng)的考試中不大可能將語(yǔ)言與事件分開(kāi)。有這種要求的考試(專(zhuān)業(yè)性特強(qiáng)的考試),其設(shè)計(jì)方案中必須認(rèn)可這一點(diǎn),評(píng)判考生的語(yǔ)言應(yīng)用能力就得看其在事件中的表現(xiàn)(Jacoby&McNamara 1999)。
綜上所述,在定性任何一項(xiàng)特殊用途語(yǔ)言考試時(shí),特殊性程度總是重要的,它取決于考試處于特殊性連續(xù)體中的位置。如果我們把特殊性連續(xù)體延伸到其自然的結(jié)論,那兩個(gè)方向都是無(wú)限的。顯然,理論上有可能存在某個(gè)末端概念,而末端的實(shí)際運(yùn)用不可能。語(yǔ)言中有時(shí)雖然有獨(dú)特性或精確性一面,但非精確性語(yǔ)言總是存在的。特殊性的程度和整個(gè)構(gòu)架有聯(lián)系,一方的變化會(huì)影響到另一方。
可以認(rèn)為,考試任務(wù)的完成情況和這個(gè)任務(wù)的特殊性程度相關(guān)。本文中的考試特殊性程度實(shí)際上指考試的內(nèi)容環(huán)境,它們由任務(wù)和文章的要求組成的框架表示。在通用英語(yǔ)考試中,把某些特定任務(wù)放在其中,是為了要引出語(yǔ)言樣本,可以讓考官評(píng)分,只是這個(gè)任務(wù)的完成可能與某種用途有關(guān)。例如,寫(xiě)作考試時(shí),讓考生完成一份求職申請(qǐng),已經(jīng)超出通用英語(yǔ)運(yùn)用的邊緣。在商務(wù)英語(yǔ)考試中,完成任務(wù)的意念占據(jù)中心位置。考官顯然帶著事先制定好的相關(guān)語(yǔ)言標(biāo)準(zhǔn)來(lái)評(píng)判考生是否充分完成某項(xiàng)任務(wù)。這體現(xiàn)了Elder的“不可分離性”觀(guān)點(diǎn)(Elder 2001:159)。語(yǔ)言反應(yīng)的相關(guān)性和充分性是每一個(gè)考試項(xiàng)目都具備的要點(diǎn)。通用英語(yǔ)考試任務(wù)的基本目的是取得語(yǔ)言樣本,評(píng)價(jià)其語(yǔ)言程度,而相關(guān)性和充分性是社會(huì)語(yǔ)言和語(yǔ)用能力的特征。因此,商務(wù)英語(yǔ)考試要考察在語(yǔ)言使用環(huán)境中,除了語(yǔ)言程度外,相關(guān)性和充分性在完成任務(wù)過(guò)程中的程度。
如果所有考試都處于特殊性連續(xù)體中的某一位置,那么從現(xiàn)有商務(wù)英語(yǔ)考試來(lái)看,可能過(guò)于簡(jiǎn)單了一點(diǎn)。實(shí)際上,幾個(gè)要素結(jié)合在一起會(huì)影響考試的特殊性程度。除真實(shí)性外,還有通用化程度和區(qū)別程度。在任何一個(gè)情景中,都會(huì)有特殊用途核心語(yǔ)言(core language),可能是語(yǔ)言的某種特殊用法或某個(gè)特殊詞匯,例如,Ball用語(yǔ)料庫(kù)方式建立的BEC系列詞匯表(Ball 2002)。這種核心語(yǔ)言與通用語(yǔ)言的使用域并不一定有明確界限,而是有一個(gè)共享的緩沖地帶??梢钥吹?,特殊性程度意念會(huì)帶來(lái)通用化程度和情景真實(shí)性意念。當(dāng)一項(xiàng)考試位于連續(xù)體中特殊性末端時(shí),通用化程度在超出特殊情景之外的考試中就會(huì)降低。很難想象這種位于連續(xù)體特殊性末端的考試會(huì)只集中使用極其有限的核心語(yǔ)言。同樣,假如這項(xiàng)考試接近于特殊性末端,其情景真實(shí)性更強(qiáng)。但如果特殊用途英語(yǔ)的考試集中使用特殊用途領(lǐng)域的專(zhuān)用語(yǔ)言,測(cè)試內(nèi)容局限在該領(lǐng)域內(nèi),考試表現(xiàn)也只跟該領(lǐng)域有關(guān)?,F(xiàn)實(shí)中,一旦我們的語(yǔ)言活動(dòng)超出可區(qū)別的核心范圍,我們就進(jìn)入通用語(yǔ)言運(yùn)用領(lǐng)域,這一部分領(lǐng)域的代表性?xún)?nèi)容在考試中只占一部分。當(dāng)一項(xiàng)考試特殊性強(qiáng)的時(shí)候,核心的重要性就更強(qiáng);當(dāng)一項(xiàng)考試通用性強(qiáng)的時(shí)候,核心部分的作用就會(huì)降低。
商務(wù)英語(yǔ)考試最重要的特點(diǎn)是商務(wù)特殊性比較強(qiáng)時(shí)所帶來(lái)的明顯影響,這時(shí)很難把被試的能力要素清楚區(qū)別開(kāi)來(lái)??忌谋憩F(xiàn)可能更易受非語(yǔ)言因素影響,而且影響來(lái)源不止一個(gè),不僅僅是商務(wù)活動(dòng)能力或商務(wù)知識(shí),還與任務(wù)本身和評(píng)判任務(wù)的方式有關(guān)??荚嚨奶厥庑栽綇?qiáng),其非語(yǔ)言因素的影響就越大(O’Sullivan 2006)。特殊性程度意念并不適用于整個(gè)考試,只是聽(tīng)、說(shuō)、讀、寫(xiě)4項(xiàng)中的某(些)項(xiàng),甚至是某一項(xiàng)中的某(些)部分被特意加工成特殊性的集中點(diǎn),造成非語(yǔ)言因素在一門(mén)考試中的影響程度也不同。
考試特殊性程度可以表示為這些要求的操作與某個(gè)特殊用途語(yǔ)言運(yùn)用領(lǐng)域的相關(guān)程度,實(shí)際上也是就這些要求的每個(gè)方面判斷連續(xù)體上的特殊性程度。這似乎太主觀(guān)而不可行,但一個(gè)練習(xí)的真正價(jià)值在于練習(xí)的廣度。特殊性程度在一項(xiàng)考試中是多維的,評(píng)價(jià)至少也是系統(tǒng)性的??荚囂厥庑猿潭扰c情景真實(shí)性密切關(guān)聯(lián)。但像BEC或?qū)I(yè)性更強(qiáng)的其他考試,其真實(shí)性都是模擬的。
現(xiàn)有的商務(wù)英語(yǔ)考試不一定具有高度特殊性,因?yàn)樗鼈冏⒅靥囟ōh(huán)境中的語(yǔ)言運(yùn)用,而不一定是商務(wù)活動(dòng)任務(wù)的執(zhí)行情況。特殊性連續(xù)體的存在使得不同的考試在特殊性程度上各不相同,并且情景真實(shí)性、互動(dòng)真實(shí)性和非語(yǔ)言因素對(duì)所測(cè)能力的影響也不同。
如果特殊性對(duì)考試開(kāi)發(fā)者有實(shí)用意義,就得談到考試效度,比如Weir研究的聽(tīng)、說(shuō)、讀、寫(xiě)4項(xiàng)技能的系列框架(Weir 2004)。在該框架中,效度從社會(huì)認(rèn)知角度去認(rèn)識(shí);有幾個(gè)要素應(yīng)該由考試開(kāi)發(fā)者注意;對(duì)考生可以進(jìn)行特征描述(物理/生理的、心理和經(jīng)驗(yàn)型的),對(duì)考試可以從其環(huán)境效度和成功的潛力描述,以求適當(dāng)處理考試任務(wù)。同時(shí),理論效度形成考試和考生之間的聯(lián)系。
理論效度在考試任務(wù)完成中是一個(gè)認(rèn)知過(guò)程,涉及考試情景的處理反映語(yǔ)言運(yùn)用領(lǐng)域的程度(Weir 2004)??荚噧?nèi)容和理論效度之間的關(guān)系體現(xiàn)于環(huán)境效度要素對(duì)考生認(rèn)知過(guò)程的影響。如果考試任務(wù)完成過(guò)程能實(shí)現(xiàn)原設(shè)計(jì)意圖,反映商務(wù)英語(yǔ)語(yǔ)言運(yùn)用領(lǐng)域的認(rèn)知過(guò)程,那么就可以認(rèn)為考試任務(wù)體現(xiàn)了互動(dòng)真實(shí)性。這樣的考試與通用英語(yǔ)考試在內(nèi)部處理過(guò)程中有許多不同之處,可以驗(yàn)證語(yǔ)言運(yùn)用領(lǐng)域的可區(qū)別性,就像Bachman&Palmer所說(shuō),真實(shí)性是“某項(xiàng)語(yǔ)言考試與目標(biāo)語(yǔ)言運(yùn)用任務(wù)(target language use)特點(diǎn)的對(duì)應(yīng)程度”(Bachman&Palmer 1999:23)。這意味著除了內(nèi)容效度和情景真實(shí)性之外,需要在互動(dòng)真實(shí)性中包含職場(chǎng)工作方面。有時(shí),我們覺(jué)得確定語(yǔ)言水平和應(yīng)用時(shí)有難度,實(shí)際上難在一個(gè)環(huán)境效度的界限問(wèn)題,即不可分離性(Elder 2001:159):是否應(yīng)該或者是否做得到在考試樣本中單單測(cè)試其內(nèi)容環(huán)境特性,將其與語(yǔ)言特性分開(kāi)。
信度問(wèn)題對(duì)所有考試開(kāi)發(fā)者都有著重要意義。人們可能覺(jué)得考試的內(nèi)部一致性的估量方法在考生群體變異時(shí)會(huì)有問(wèn)題,而對(duì)寫(xiě)作、口語(yǔ)這些主觀(guān)性考試題目來(lái)說(shuō),信度的估量方法也會(huì)有問(wèn)題。對(duì)此,Luoma指出,應(yīng)該把標(biāo)準(zhǔn)誤差測(cè)量(standard error of measurement)作為一項(xiàng)管用的質(zhì)量檢測(cè)手段(Luoma 2004)。在答案具有唯一性的客觀(guān)性試題(0,1)記分法中,標(biāo)準(zhǔn)誤差測(cè)量不失為一項(xiàng)實(shí)用手段。但標(biāo)準(zhǔn)誤差測(cè)量的前提是要能夠準(zhǔn)確估量?jī)?nèi)部一致性,這要用到口語(yǔ)、寫(xiě)作考試上就有相當(dāng)難度,因?yàn)槌S玫南嚓P(guān)性統(tǒng)計(jì)只能看出評(píng)分員評(píng)分模式之間的聯(lián)系,看不出他們一致性的程度。
Weir的效度框架構(gòu)成中的“評(píng)分效度”替代“信度”。Bachman認(rèn)為,考試分?jǐn)?shù)受幾個(gè)因素影響:考生的語(yǔ)言交際能力、考試方法、考生個(gè)人或群體的特性以及不可預(yù)見(jiàn)和無(wú)系統(tǒng)性的隨機(jī)因素(Bachman 1999:165)。考試信度概念若是包括這幾個(gè)方面,則肯定可以提高。Weir認(rèn)為,在閱讀理解考試中,評(píng)分效度應(yīng)該包含題目分析、內(nèi)部一致性、信度、穩(wěn)定性、誤差測(cè)量、評(píng)分員信度等(Weir 2004)。但在口語(yǔ)考試中,內(nèi)容就復(fù)雜得多了:評(píng)分標(biāo)準(zhǔn)、評(píng)分過(guò)程、評(píng)分員選拔、評(píng)分員培訓(xùn)、定標(biāo)/鑒定、評(píng)分決定、適度、一致性、給分等。實(shí)際操作過(guò)程中,培訓(xùn)效果、標(biāo)準(zhǔn)化價(jià)值、評(píng)分員在打分時(shí)的想法都有講究。這里值得研究的是對(duì)考生特性的描繪、各種變量與考試本身之間的相互作用??忌匦詴?huì)影響考試任務(wù)的完成。同樣,考官特性也會(huì)影響他們對(duì)考生任務(wù)完成情況的打分,甚至有時(shí)會(huì)出現(xiàn)考生同樣的表現(xiàn)卻得到很不一樣的分?jǐn)?shù)??梢钥闯觯虅?wù)英語(yǔ)考試的實(shí)際操作性在某些方面不平衡。
相對(duì)通用英語(yǔ)考試來(lái)說(shuō),商務(wù)英語(yǔ)考試是比較新的領(lǐng)域。如果市場(chǎng)趨勢(shì)傾向于通用性而不是特殊性強(qiáng)的考試,傾向于專(zhuān)業(yè)方向型而不是專(zhuān)業(yè)集中型的考試,那么其實(shí)用性就會(huì)強(qiáng)于理論性,就會(huì)體現(xiàn)行業(yè)英語(yǔ)考試的趨勢(shì),因?yàn)榇笠?guī)模的國(guó)際化考試往往受到市場(chǎng)驅(qū)動(dòng),須要滿(mǎn)足市場(chǎng)需要。
Alderson,J.C.& Urquhart,A.H.This Test is Unfair:I’m not an Economist[A].In Carrell,P.,Devine,J.& Eskey,D.(eds.).Interactive Approaches to Second Language Reading[C].Cambridge:Cambridge University Press,1988.
Bachman,L.F.Fundamental Considerations in Language Testing[M].上海:上海外語(yǔ)教育出版社,1999.
Bachman,L.F.& Palmer,A.S.Language Testing in Practice[M].上海:上海外語(yǔ)教育出版社,1999.
Ball,F(xiàn).Developing Wordlists for BEC [J].Research Notes,2002(8).
Carver,D.Some Propositions about ESP[J].ESP Journal,1983(2).
Clapham,C.M.The Development of IELTS:A Study of the Effects of Background Knowledge on Reading Comprehension[M].Cambridge:Cambridge University Press,1996.
Douglas,D.Assessing Languages for Specific Purposes[M].Cambridge:Cambridge University Press,2000.
Elder,C.Assessing the Language Proficiency of Teachers:Are There any Border Controls?[J].Language Testing,2001(2).
Hawkey,R.The Development of CELS:A Modular Approach to Testing English Language Skills[M].Cambridge:University of Cambridge Local Examinations Syndicate and Cambridge University Press,2004.
Jacoby,S.& McNamara,T.F.Locating Competence[J].English for Specific Purposes,1999(3).
Johns,A.Cohesion in Written Business Discourse:Some Contrasts[J].ESP Journal,1980(1).
Luoma,S.Assessing Speaking[M].Cambridge:Cambridge University Press,2004.
O’Sullivan,B.Issues in Testing Business English[M].Cambridge:Cambridge University Press,2006.
Spolsky,B.Measured Words[M].Oxford:Oxford University Press,1995.
Swales,J.ESP Comes of Age?— 21 Years after“Some Measurable Characteristics of Modern Scientific Prose”[J].UNESCO Alsed — LSP Newsletter,1984(2).
Weir,C.J.Language Testing and Validity Evidence[M].Oxford:Palgrave,2004.