摘 要:回顧近二十年來語言測(cè)試研究的六大新動(dòng)向,并在此基礎(chǔ)上討論了語言測(cè)試領(lǐng)域內(nèi)一些值得關(guān)注的問題,以及發(fā)展中必須面對(duì)的挑戰(zhàn)。
關(guān)鍵詞:第二語言 語言測(cè)試研究 新動(dòng)向
中圖分類號(hào):G4 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1673-9795(2014)01(a)-0056-04
韓寶成[1]認(rèn)為語言測(cè)試的發(fā)展大致經(jīng)歷了,以教什么就測(cè)什么為特征的前科學(xué)語言測(cè)試階段;強(qiáng)調(diào)標(biāo)準(zhǔn)化和客觀化的心理測(cè)量學(xué)—結(jié)構(gòu)主義階段[13];強(qiáng)調(diào)單一語言能力和提倡綜合測(cè)試法的社會(huì)語言學(xué)階段[14];以及80年代以后流行的以測(cè)試語言運(yùn)用能力為目標(biāo)的交際語言測(cè)試階段(Carroll 1980;Bachman 1990;BachmanPalmer 1996)。
1990年被認(rèn)為是語言測(cè)試發(fā)展的一個(gè)分水嶺[15],因?yàn)樵谶@一年,語言測(cè)試領(lǐng)域發(fā)生了幾件重大的事件。首先,第12屆國際語言測(cè)試研討會(huì)在美國舊金山召開,會(huì)議的主題是“語言測(cè)試新的10年:協(xié)作與合作”。其次,在新加坡召開了主題為“語言測(cè)試和項(xiàng)目評(píng)估”的研討會(huì),會(huì)上許多學(xué)者就80年代語言測(cè)試的發(fā)展與存在的問題展開了討論。這兩次會(huì)議還討論了成立國際語言測(cè)試協(xié)會(huì)(International Language Testing Association)的問題。這一年還出版了一些很重要的關(guān)于語言測(cè)試的學(xué)術(shù)論著,其中包括Bachman的《語言測(cè)試要略》(Fundamental Consideration in Language Testing),Davies的《語言測(cè)試原理》(Principle of Language Testing),以及Weir的《交際語言測(cè)試》(Communicative Language Testing),這些論著對(duì)后來的語言測(cè)試研究和發(fā)展起了非常重要的作用。
ChapelleDouglas[16]于1990年預(yù)測(cè)語言測(cè)試研究在90年代可能會(huì)集中在以下一些方面:交際能力與語言測(cè)試之間的關(guān)系;語言測(cè)試自然和倫理方面的研究;對(duì)考試分?jǐn)?shù)的解釋;對(duì)考試的效度的研究。
楊滿珍[2]在對(duì)1990年至1999年間的語言測(cè)試研討會(huì)和公開發(fā)表或出版的有關(guān)語言測(cè)試的論文或論著進(jìn)行了統(tǒng)計(jì)和總結(jié)后,談道:20世紀(jì)最后10年國外語言測(cè)試的研究主要集中在以下一些方面:(1)交際語言測(cè)試;(2)信度和效度;(3)語言測(cè)試的社會(huì)作用;(4)影響考生發(fā)揮的因素;(5)做事測(cè)試(performance test);(6)計(jì)算機(jī)化測(cè)試;(7)與二語習(xí)得的關(guān)系。
此后的幾年里,語言測(cè)試的動(dòng)向是否像ChapelleDouglas所預(yù)測(cè)的那樣,還是延續(xù)了楊滿珍所總結(jié)的七大研究焦點(diǎn)。哪些方面依然是焦點(diǎn),又有什么新的研究熱點(diǎn)出現(xiàn),這是廣大研究者所關(guān)注的。
1 語言測(cè)試新動(dòng)向
根據(jù)近二十年來國內(nèi)外語言測(cè)試研究者(以國內(nèi)為主)在理論和實(shí)踐方面的新的嘗試,總結(jié)了下面的六大動(dòng)向。
1.1 計(jì)算機(jī)化自適應(yīng)性語言測(cè)試(Computerized Adaptive Language Test)(下稱CALT)
計(jì)算機(jī)化自適應(yīng)性語言測(cè)試源于計(jì)算機(jī)化自適應(yīng)性測(cè)試(Computerized Adaptive Test)(下稱CAT),又譯為計(jì)算機(jī)化調(diào)適性測(cè)試,是一種技術(shù)上受計(jì)算機(jī)終端和PC管理的先進(jìn)的測(cè)試語言能力的方法。從題庫中選取符合受測(cè)者語言水平的題目進(jìn)行測(cè)試,迅速準(zhǔn)確地估計(jì)受測(cè)者的語言能力,直到達(dá)到預(yù)定的測(cè)試精度(即標(biāo)準(zhǔn)誤)要求,即可結(jié)束考試。
陳冰冰[3]在《引領(lǐng)外語測(cè)試新方向—— 計(jì)算機(jī)化調(diào)適性語言測(cè)試》一文中提到,計(jì)算機(jī)技術(shù)的發(fā)展不僅影響了外語教與學(xué)的整個(gè)過程,而且也使得語言測(cè)試的技術(shù)手段和載體發(fā)生了革命性的變化。2001年在美國舉行的第23屆國際語言測(cè)試研討會(huì)的主題就是“語言測(cè)試與技術(shù)”,基于計(jì)算機(jī)技術(shù)所構(gòu)建的測(cè)試新方法—計(jì)算機(jī)化調(diào)適性語言測(cè)試,成了此次會(huì)議的主要議題。計(jì)算機(jī)化調(diào)適性語言測(cè)試由于其因材施測(cè)、能精確估計(jì)考生能力及節(jié)省施測(cè)時(shí)間等顯著的優(yōu)點(diǎn),正逐步滲透到各類外語測(cè)試中去,引領(lǐng)著外語測(cè)試發(fā)展的新方向。
CALT是現(xiàn)代化教育技術(shù)改變測(cè)試手段的新方向,世界上許多很有影響的國際性英語考試也正在全面推行CALT。1998年以來,GRE普通測(cè)試由傳統(tǒng)的紙筆測(cè)試全面改為CALT;東軟在線凱思考試(Compute
rized Assessment System for English Communication)結(jié)合日本頂級(jí)教育產(chǎn)品和服務(wù)提供商旺文社(OBUNSHA)教育集團(tuán)的經(jīng)驗(yàn)開發(fā)的CALT系統(tǒng)已經(jīng)廣泛應(yīng)用于企業(yè)、學(xué)校和政府,成為評(píng)價(jià)國際職業(yè)英語能力的標(biāo)準(zhǔn)。
目前,對(duì)于計(jì)算機(jī)化自適應(yīng)性語言測(cè)試的研究正朝著縱深方向發(fā)展,研究者們各辟蹊徑,跨學(xué)科研究引起越來越多的研究者的關(guān)注。
(1)基于Web的自適應(yīng)性考試。
鄭珂,申瑞民[4]在《基于Web的自適應(yīng)考試系統(tǒng)》一文中介紹了計(jì)算機(jī)化自適應(yīng)考試(Computerized Adaptive Test)的基本理論和過程,更重要的是提出了一個(gè)基于Web自適應(yīng)考試系統(tǒng)的框架。計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)的發(fā)展和自適應(yīng)考試?yán)碚摰娜諠u成熟使得基于Web的自適應(yīng)考試系統(tǒng)成為現(xiàn)實(shí)。
王路江[5]在世界漢語大會(huì)上介紹了中國漢語水平考試的改革與發(fā)展。為了提高考試和閱卷的效率,北京語言大學(xué)漢語水平考試中心正籌備開發(fā)基于項(xiàng)目反應(yīng)理論的計(jì)算機(jī)自適應(yīng)考試;為了提高主觀閱卷的效率,還將開發(fā)網(wǎng)上閱卷和計(jì)算機(jī)自動(dòng)閱卷程序;提高HSK的服務(wù)水平,加強(qiáng)考試的安全性,建立漢語水平考試的“網(wǎng)絡(luò)平臺(tái)”勢(shì)在必行。因?yàn)樗淖饔貌粌H在于推廣,更重要的是使測(cè)試依靠現(xiàn)代技術(shù)和理念支持,通過方便快捷的網(wǎng)絡(luò)平臺(tái)的搭建,能更直接地服務(wù)于考生。
(2)認(rèn)知計(jì)算機(jī)適應(yīng)性考試模型。
何蓮珍[6]在研究認(rèn)知科學(xué)與語言測(cè)試的關(guān)系及各種CAT模型的基礎(chǔ)上,運(yùn)用項(xiàng)目反映的雙參數(shù)模型設(shè)計(jì)了一個(gè)包括閱讀、詞匯語法、完形填空的雙階認(rèn)知計(jì)算機(jī)適應(yīng)性考試模型(CCAT),并作了實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果顯示:這種測(cè)試方式不僅提高了測(cè)試的效率,而且提高了測(cè)試的精確度,與傳統(tǒng)的紙筆測(cè)試相比有無可比擬的優(yōu)越性。這是國內(nèi)語言測(cè)試研究者將認(rèn)知科學(xué)與語言測(cè)試相結(jié)合的一次有益的嘗試,為我們的語言測(cè)試研究提供了一個(gè)新的視角。
(3)個(gè)性化自適應(yīng)性考試模型。
曾用強(qiáng)[7]根據(jù)自信心與測(cè)試行為之間關(guān)系的研究成果,提出了一個(gè)個(gè)性化自適應(yīng)性測(cè)試模式,并與適應(yīng)性測(cè)試和自適應(yīng)性測(cè)試作了對(duì)比分析。結(jié)果表明:①個(gè)性化的自適應(yīng)性測(cè)試模式由于引入自信心作為調(diào)整項(xiàng)目難度的指標(biāo),可以進(jìn)一步提高測(cè)試的適應(yīng)性程度;②其能力估算方法比項(xiàng)目反應(yīng)理論中的極大似然值估算法更先進(jìn);③使語言測(cè)試不僅在項(xiàng)目難度上,而且在認(rèn)知心理上適應(yīng)于受試的個(gè)性特征,使語言測(cè)試過程更具個(gè)性。該文把語言測(cè)試與二語習(xí)得研究結(jié)合起來,探索一種機(jī)助的個(gè)性化測(cè)試模式,以引起研究者對(duì)語言測(cè)試的個(gè)性化和適應(yīng)性的關(guān)注。
1.2 基于計(jì)算機(jī)語料庫的語言測(cè)試
肖依虎、潘翠瓊[8]立足于語料庫與語言測(cè)試的內(nèi)涵,闡述了語料庫應(yīng)用于語言測(cè)試的理性認(rèn)識(shí),分析了基于計(jì)算機(jī)的語料庫應(yīng)用于語言測(cè)試的必要性,可能性,其利用過程中的優(yōu)勢(shì)和局限性,以及語料庫在語言測(cè)試上應(yīng)用的前景。
TOEFL和GRE就是語料庫應(yīng)用于語言測(cè)試的最典型、最成功的例證。這兩種測(cè)試在實(shí)踐上說明了語料庫用于語言測(cè)試的可能性。
語料庫在語言測(cè)試中的應(yīng)用,也為保證語言測(cè)試的真實(shí)性提供了技術(shù)支持。
1.3 語言測(cè)試的真實(shí)性
20世紀(jì)70年代,隨著交際教學(xué)法的出現(xiàn),Widdowson[17]提出了語言教學(xué)的真實(shí)性問題。80和90年代,隨著語言交際測(cè)試法的出現(xiàn),Morrow[19]和Bachman[18]等人提出了語言測(cè)試的真實(shí)性問題。此后真實(shí)性問題成為語言測(cè)試的一個(gè)熱門話題,語言教學(xué)和測(cè)試界的學(xué)人為此進(jìn)行了廣泛探討。語言測(cè)試方面的權(quán)威學(xué)術(shù)期刊《語言測(cè)試》專門出了一期特刊(1985/6)來討論這個(gè)問題。Morrow[19]認(rèn)為“真實(shí)性問題是語言測(cè)試的一個(gè)重要方面”。Wood[20]認(rèn)為,“語言測(cè)試的兩個(gè)主要問題,效度與信度,可以歸結(jié)為真實(shí)與不真實(shí)一個(gè)問題”;BachmanPalmer[21]認(rèn)為真實(shí)性是語言測(cè)試的一個(gè)重要特征。
黃大勇[9]從文本的真實(shí)性、任務(wù)的真實(shí)性、輸出的真實(shí)性和情景的真實(shí)性等四個(gè)方面對(duì)語言測(cè)試的真實(shí)性概念進(jìn)行解析,并指出真實(shí)性的兩個(gè)重要特征:真實(shí)性的主觀性和相對(duì)性。為語言測(cè)試的設(shè)計(jì)開發(fā)者科學(xué)地把握真實(shí)性提供了一定的依據(jù)。
目前國內(nèi)外有影響的語言測(cè)試,由于語料庫技術(shù)的支持,在文本的真實(shí)性方面基本能保證,但其他三方面的真實(shí)性體現(xiàn)的水平則參差不齊。四、六級(jí)考試與托福的聽力題類似,基本上全是多項(xiàng)選擇的形式,正確答案實(shí)際上已經(jīng)給出,考生要做的只是把這個(gè)正確答案挑出來。這樣的考題是脫離現(xiàn)實(shí)的,因?yàn)樵谌粘I钪腥藗兟爠e人講話并試圖理解其話語的意思的時(shí)候,不可能給你A、B、C、D以供選擇呢?比如有人打電話來讓,要找的人不在,你得記留言,你要做的就是用筆記錄下來這個(gè)號(hào)碼和信息,而不可能是在幾個(gè)現(xiàn)成的選項(xiàng)中進(jìn)行選擇。而雅思(IEL TS)的試題較貼近真實(shí)的生活場(chǎng)景。盡管雅思也有一部分聽力題是多項(xiàng)選擇的形式,但其比例不大,既不是惟一題型,也不是主流題型;應(yīng)對(duì)雅思聽力考試,考生要做的除了圈定自己認(rèn)為正確的答案外,還要拼寫出自己認(rèn)為正確的答案,聽考題和答題是同時(shí)進(jìn)行的,只有拼寫出正確的英文單詞和答案,才能拿到高分。
當(dāng)前,國內(nèi)語言測(cè)試界需要下大力氣研究的是任務(wù)的真實(shí)性,而這一點(diǎn)可以借鑒當(dāng)前的另一熱點(diǎn),即任務(wù)型語言測(cè)試的研究成果。
1.4 任務(wù)型語言測(cè)試(Task-based Language Assessment,以下簡(jiǎn)稱TBLA)
近十年來語言教學(xué)研究的熱點(diǎn)是任務(wù)型教學(xué),相關(guān)的教材和教學(xué)模式方面的研究成果層出不窮,相比之下,測(cè)試領(lǐng)域的研究有些滯后,但也逐漸成為測(cè)試領(lǐng)域的研究熱點(diǎn)。2000年在加拿大溫哥華召開的第22屆國際語言測(cè)試研討會(huì),其中一個(gè)主題就是“Putting tasks to the test”。Language Testing于2002年第4期出??懻摶谌蝿?wù)的語言測(cè)試,這足以說明TBLA受到關(guān)切的程度。
韓寶成[1]在《語言測(cè)試的新進(jìn)展:基于任務(wù)的語言測(cè)試》一文中,介紹了基于任務(wù)的語言測(cè)試的發(fā)展情況,對(duì)TBLA出現(xiàn)的背景及其面臨的基本問題進(jìn)行了分析和探討。并指出與以語言形式或技能為重點(diǎn)的傳統(tǒng)語言測(cè)試不同的是,基于任務(wù)的語言測(cè)試是以任務(wù)為核心,測(cè)試所要評(píng)定的是應(yīng)試者完成任務(wù)的表現(xiàn)。在重交際、重表達(dá)教學(xué)思想影響下發(fā)展起來的“直接測(cè)試”或稱“行為測(cè)試(performance test)”,通常是由經(jīng)過培訓(xùn)的考官直接觀察應(yīng)試者完成任務(wù)的行為,采用整體評(píng)估方式,按照一個(gè)綜合語言水平量表給應(yīng)試者確定級(jí)別。與此不同,在基于任務(wù)的教學(xué)基礎(chǔ)上發(fā)展起來的測(cè)試,既不考核應(yīng)試者對(duì)語言知識(shí)的掌握程度,亦不對(duì)其語言水平評(píng)定等級(jí),而是考察他們能否使用語言完成目標(biāo)任務(wù)。
在測(cè)試與評(píng)估的環(huán)節(jié)上,任務(wù)型教學(xué)途徑秉承了交際教學(xué)思想的原則,通過考察學(xué)生完成任務(wù)的過程來測(cè)試和評(píng)估學(xué)生實(shí)際的語言運(yùn)用能力。Ellis[22]認(rèn)為,任務(wù)型測(cè)試和評(píng)估的設(shè)計(jì)應(yīng)該能夠誘導(dǎo)和評(píng)價(jià)學(xué)習(xí)者在以意義為中心、并有明確交際目的的語言使用環(huán)境下的交際行為。與傳統(tǒng)測(cè)試相比,任務(wù)型測(cè)試與評(píng)估呈現(xiàn)出以下幾個(gè)變化:一是測(cè)試內(nèi)容的變化;二是測(cè)試形式的變化;三是測(cè)試目的的變化;四是測(cè)試結(jié)果的變化。
Ellis[22]區(qū)分了傳統(tǒng)測(cè)試與任務(wù)型測(cè)試中的“任務(wù)”,認(rèn)為任務(wù)型測(cè)試中的“任務(wù)”特指“能夠用來誘導(dǎo)和評(píng)價(jià)學(xué)習(xí)者在意義至上、目標(biāo)明確的語境中交際操作行為的設(shè)計(jì)”。Ellis還對(duì)測(cè)試結(jié)果的評(píng)估提出三種形式,即直接評(píng)價(jià)法、篇章分析法和客觀等級(jí)法。
1.5 測(cè)試的內(nèi)容和形式的改革
分離式測(cè)試(Discrete Tests),這一代表心理測(cè)量-結(jié)構(gòu)主義階段的特征的測(cè)試方式,是過去幾十年來各大語言測(cè)試的主要測(cè)試方式,也曾引領(lǐng)語言測(cè)試走上了科學(xué)化的道路。分離式測(cè)試考查的是受試者孤立的語言知識(shí)和語言技能(包括聽、說、讀、寫)。并認(rèn)為,各考查項(xiàng)之和就是對(duì)受試者語言能力的全面評(píng)價(jià)。分離式測(cè)試注重微觀的語言知識(shí)和語言技能,一般采用多項(xiàng)選擇的題型,所以它具有可隨機(jī)采樣,量大面廣,評(píng)分客觀,可解釋得分等提高測(cè)試信度的優(yōu)點(diǎn)。但是,它自身也有缺陷,那就是,分離的語言知識(shí)不等于語言運(yùn)用的能力,不能真實(shí)地反映出語言交際的能力,即得高分者其語用能力不一定高,也就是測(cè)試的內(nèi)容效度較低。由于對(duì)分離式測(cè)試的批評(píng)越來越多,國內(nèi)外的許多有影響力的考試都開始重新采用部分綜合性試題,來彌補(bǔ)單一的分離式測(cè)試的不足,以此來追求信度和效度的最佳平衡,正應(yīng)證了一句古語“分久必合”。
客觀多項(xiàng)選擇題型是語言測(cè)試史上第二階段的產(chǎn)物,雖然曾經(jīng)風(fēng)靡全球,但也存在不少弊端。測(cè)試專家Alderson[23]說:“有證據(jù)表明,參加多項(xiàng)選擇考試的學(xué)生能夠?qū)W會(huì)一些應(yīng)試技巧,如猜測(cè)正確答案、排除毫無意義的干擾項(xiàng)、避免選擇兩個(gè)意義相近的選擇項(xiàng)等,使自己的分?jǐn)?shù)‘人工地’提高許多”。另一位測(cè)試專家Hughes[24]給多項(xiàng)選擇題型列了六大弊端:(1)只考識(shí)別能力,所以不能準(zhǔn)確測(cè)量應(yīng)試者的水平;(2)分?jǐn)?shù)中的猜測(cè)成分可以很大而且不好確定;(3)嚴(yán)重限制了什么能考、什么不能考;(4)設(shè)計(jì)出好的項(xiàng)目極為困難;(5)反撥作用往往不好—— 準(zhǔn)備這種考試不是提高語言水平的最佳途徑;(6)考生作弊容易。現(xiàn)在仍使用多項(xiàng)選擇題型的所謂標(biāo)準(zhǔn)化測(cè)試還很多,例如美國著名的TOEFL(托福)和國內(nèi)的大學(xué)英語四、六級(jí)考試但也已開始進(jìn)行改革,在逐步加大主觀性試題的比例。
2006年5月登陸中國的新托福由四部分組成,分別是閱讀(Reading)、聽力(Listening)、
口試(Speaking)、寫作(Writing)。新托福考察更加全面,各項(xiàng)技能相互滲透,并且題量明顯增加。說到考察更加全面,我們知道舊托??荚囍豢悸牶妥x,說由TSE考,寫由TWE考??谡ZTSE考試,在過去的考試?yán)锩嬉恢睂儆诳梢赃x擇性的考試,而現(xiàn)在的新托福里面進(jìn)入了必考內(nèi)容。再有一點(diǎn),客觀題走向了主觀題的趨勢(shì),如語法取消了,語法很大程度代表了客觀題的選擇。還有我們講到各項(xiàng)技能相互滲透方面,從出題的形式上更加靈活了,口語寫作都是各個(gè)技能互相滲透的,比如口語部分,它先讓你閱讀,然后再聽、然后再說,寫作也是這樣的,讓你閱讀、聽、寫。這樣的話,讀、聽、說和讀、聽、寫相互滲透,更加接近生活,更加接近北美大學(xué)的生活。
大學(xué)英語四、六級(jí)改革則是近幾年國內(nèi)語言測(cè)試界的熱門話題。1996年以前,四級(jí)考試中客觀題占85%,六級(jí)占75%左右。為了改變客觀題比重過大的問題,考試委員會(huì)于1995年和1996年兩次公布了擬采用的新題型,適當(dāng)增加了主觀題的比例,1999年開始舉行口語考試。從2005年起,大學(xué)英語四、六級(jí)考試加大了聽力理解部分的題量和比例,增加快速閱讀理解測(cè)試,增加非選擇性試題的比例。試點(diǎn)階段的四、六級(jí)考試由四部分構(gòu)成:聽力理解、閱讀理解、綜合測(cè)試和寫作測(cè)試。聽力理解部分的比例提高到35%,其中聽力對(duì)話占15%,聽力短文占20%。聽力對(duì)話部分包括短對(duì)話和長對(duì)話的聽力理解;聽力短文部分包括短文聽寫和選擇題型的短文理解;聽力題材選用對(duì)話、講座、廣播電視節(jié)目等更具真實(shí)性的材料。閱讀理解部分比例調(diào)整為35%,其中仔細(xì)閱讀部分(careful reading)占25%,快速閱讀部分(fast reading)占10%。仔細(xì)閱讀部分除測(cè)試篇章閱讀理解外,還包括對(duì)篇章語境中的詞匯理解的測(cè)試;快速閱讀部分測(cè)試各種快速閱讀技能。綜合測(cè)試比例為15%,由兩部分構(gòu)成。第一部分為完型填空或改錯(cuò),占10%;第二部分為短句問答或翻譯,占5%。寫作能力測(cè)試部分比例為15%,體裁包括議論文、說明文、應(yīng)用文等。
沒有口語考試的語言水平或能力考試算不上全面的語言測(cè)試,其效度難以保證,語言如果不用說來測(cè),那么這將是一種語言測(cè)試最大的遺憾。
1.6 評(píng)分制度的改革
評(píng)分制度的改革也是語言測(cè)試發(fā)展的一個(gè)新亮點(diǎn)。科學(xué)的評(píng)分制度和分?jǐn)?shù)報(bào)告體制對(duì)正確地理解和解釋分?jǐn)?shù)以及科學(xué)地決策至關(guān)重要。
新托福網(wǎng)考(IBT)總分?jǐn)?shù)為120分,每部分為30分。美國各名校對(duì)托福考試最低分?jǐn)?shù)的要求由550改為80分。以下是ETS官方網(wǎng)站公布的新舊分?jǐn)?shù)換算表(見表1)。
四、六級(jí)改革所采取的另一重要舉措也是改革計(jì)分體制和成績(jī)報(bào)道方式。改革前的英語四、六級(jí)考試分為合格和不合格,只有合格者才能拿到合格證書。自2005年6月考試起,四、六級(jí)考試成績(jī)將采用滿分為710分的計(jì)分體制,考試成績(jī)?cè)?90~710分之間,呈正態(tài)分布,均值是500分,一個(gè)標(biāo)準(zhǔn)差在70分,成績(jī)低可以到290分,高可以到710分。不設(shè)及格線,成績(jī)報(bào)道方式由考試合格證書改為成績(jī)報(bào)告單,即考后向每位考生發(fā)放成績(jī)報(bào)告單,報(bào)道內(nèi)容包括:總分、單項(xiàng)分等。為使學(xué)校理解考試分?jǐn)?shù)的含義并根據(jù)各校的實(shí)際情況合理使用考試測(cè)量的結(jié)果,四、六級(jí)考試委員會(huì)將向?qū)W校提供四、六級(jí)考試分?jǐn)?shù)的解釋。
2 結(jié)語
在發(fā)展的道路上,機(jī)遇與挑戰(zhàn)同在,許多問題還有待進(jìn)一步探討和研究:
(1)CALT考試在國內(nèi)要推廣,對(duì)考點(diǎn)的軟硬件有要求,題庫的安全要有保障,考生對(duì)新考試還需要一個(gè)適應(yīng)期,CALT的信效度方面的實(shí)證研究還不夠多,CALT會(huì)產(chǎn)生什么樣的后效,我們都要預(yù)見到。
(2)測(cè)試的內(nèi)容和形式如何結(jié)合,才能最大限度地發(fā)揮它的作用,即測(cè)到我們想測(cè)的語言能力。用技能分離式還是綜合式?還是二者結(jié)合?是分多還是合多?客觀的多項(xiàng)選擇題,是否能適用于最新的交際語言測(cè)試或任務(wù)型語言測(cè)試。主客觀題在測(cè)試中所占的比例應(yīng)該多大,才能使測(cè)試的信效度達(dá)到最佳結(jié)合點(diǎn)。我們的大學(xué)英語四、六級(jí)和漢語水平考試是否也應(yīng)該學(xué)習(xí)雅思和新托福,考試包括聽說讀寫四項(xiàng)技能的綜合考察。每一項(xiàng)的技能的考察又不是孤立的,同時(shí)考察其他技能。
(3)語言測(cè)試應(yīng)該走在語言教學(xué)的前面還是后面?是走在前面引導(dǎo)教學(xué),會(huì)不會(huì)又導(dǎo)致應(yīng)試教學(xué)?走在教學(xué)后面,是該緊跟教學(xué)的步伐還是保持適當(dāng)?shù)木嚯x?教學(xué)前進(jìn)的步伐非??欤瑴y(cè)試的發(fā)展是否能跟得上?
(4)國內(nèi)語言測(cè)試的研究,或許應(yīng)該在追隨國外測(cè)試發(fā)展潮流的同時(shí),開始建立自己的與國內(nèi)教育體制相適應(yīng)的測(cè)試?yán)碚摵湍J健?/p>
參考文獻(xiàn)
[1]韓寶成.語言測(cè)試的新進(jìn)展:基于任務(wù)的語言測(cè)試[J].外語教學(xué)與研究,2003(5):352-358,401.
[2]楊滿珍.20世紀(jì)90年代國外語言測(cè)試的發(fā)展[J].外語教學(xué),2002(5):39-47.
[3]陳冰冰.引領(lǐng)外語測(cè)試新方向—計(jì)算機(jī)化調(diào)適性語言測(cè)試[J].外語電化教學(xué),2005(4).
[4]鄭珂,申瑞民.基于Web的自適應(yīng)考試系統(tǒng)[J].微型電腦應(yīng)用,2000(1):3-6.
[5]王路江.中國漢語水平考試(HSK)的改革與發(fā)展[J].世界漢語教學(xué),2005(3).
[6]何蓮珍.認(rèn)知計(jì)算機(jī)適應(yīng)性考試模型的設(shè)計(jì)[J].現(xiàn)代外語,1999(2):172-183.
[7]曾用強(qiáng).個(gè)性化自適應(yīng)性測(cè)試探索[J].外語教學(xué)與研究,2002(4):278-282,320.
[8]肖依虎,潘翠瓊,陶特.語料庫在語言測(cè)試中的應(yīng)用[J].外語教學(xué),2002(6):93-96.
[9]黃大勇.語言測(cè)試中的真實(shí)性概念[J].語言教學(xué)與研究,2004(2):77-80.
[10]張新元.大學(xué)英語測(cè)試質(zhì)疑述評(píng)[J].外語界,2004(2):65-69.
[11]潘之欣.語言測(cè)試中的多項(xiàng)選擇題型[J].外語界,2001(4):67-74.
[12] 韓寶成.語言測(cè)試:理論、實(shí)踐與發(fā)展[J].外語教學(xué)與研究,2000(1):47-52.
[13]Lado,R.Language Testing[M].New York:McGraw-Hill,1961.
[14]Oller,J.W.J r.Language Tests at School[M].London:Longman,1979.
[15]Douglas,D.Developments in language testing[J].Annual Review of Applied Linguistics,1995(15):167-187.
[16]Chapelle,C. D.Douglas.Foundations and directions for a new decade of language Testing[C]//In Douglas,D. and C.Chapelle (Eds.).A New Decade of Language Testing Research.Stermling,Virginia:Teachers of English to Speakers of Other Languages,Inc,1993:1-22.
[17]Widdowson,H.G.Teaching Language as Communication[M].Oxford:Oxford University Press,1978.
[18]Bachman,L.Fundamental Considerations in Language Testing[M].Oxford:Oxford University Press,1990.
[19]Morrow,K.Evaluating Communicative Tests,In Anivan,S.,editor,Current Developments in Language Testing[J].Singapore:SEAMEO Regional Language Centre,1991:111-18.
[20]Wood,R.Assessment and testing[M].Cambridge:Cambridge University Press,1993.
[21]Bachman,L.and Palmer,A.Language Testing in Practice[M].Oxford:Oxford University Press,1996.
[22]Ellis,R.Task-based Language Learning and Teaching[M].Oxford:Oxford University Press,2003.
[23]Alderson J et al.Language Test Construction and Evaluation[M].Beijing:Foreign Language Teaching and Research Press,2000.
[24]Hughes A.Testing f or Language Teachers[M].Cambridge:Cambridge University Press,2000.