摘要:熟人因素和測(cè)試環(huán)境等因素在口頭語言測(cè)量中不可忽視。通過對(duì)LanguageTesting刊載學(xué)術(shù)文章的解讀和分析,探討了口頭語言測(cè)試中,如何控制熟人因素和測(cè)試環(huán)境等因素。
關(guān)鍵詞:口頭語言;測(cè)量;因素
中圖分類號(hào):G623.31 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1000-8136(2009)26-0091-02
為了研究口頭語言測(cè)量的方法,我們?cè)陂喿x相應(yīng)文獻(xiàn)基礎(chǔ)上作出以下綜述。所選文獻(xiàn)為1999年-2004年之間發(fā)表在Language Testing期刊上的7篇文章。所涉文章涵蓋了測(cè)試難度,例如Elder(2002),F(xiàn)ulcher和Reiter(2003)等;影響測(cè)試難度和表現(xiàn)的因素,例如Jennings(1999),Kormos(1999),O’Loughlin(2002),O’Sullivan(2002)和Vermeer(2000)等。為便于比較,表1總結(jié)了這些文章探討的話題。
1 影響測(cè)試題目難度的因素
設(shè)計(jì)測(cè)試時(shí),無論是為了研究還是一般教學(xué)而進(jìn)行的測(cè)試,我們都需要關(guān)注其難度。Fuleher(2003)和Elder(2002)為研究測(cè)試任務(wù)的難度提供了參考。
Fuleher(2003)評(píng)析了當(dāng)前人們對(duì)測(cè)試任務(wù)難度的認(rèn)識(shí)。Fulcher(2002)稱,盡管Bachman(1990)提出了一套測(cè)試方法體系,但是并沒有被用于研究任務(wù)難度。Skehan(1998,cited inFuleher 2003)也提出了影響測(cè)試表現(xiàn)的種種語言心理學(xué)范疇。Fuleher(2003)則提出了從測(cè)試任務(wù)的語用學(xué)特征和說話人的母語文化背景之間的相互關(guān)系來研究測(cè)試難度的方法。Fuleher(2003)發(fā)現(xiàn)社會(huì)權(quán)力和強(qiáng)加感(imposition)兩個(gè)因素在某些母語文化背景的語言學(xué)生中間產(chǎn)生明顯的影響。從設(shè)計(jì)測(cè)試任務(wù)的角度,我們從中可以了解到在某些極端的條件下,如社會(huì)地位懸殊時(shí)或明顯存在強(qiáng)加感的時(shí)候,相應(yīng)的測(cè)試任務(wù)難度就會(huì)加大。所以在設(shè)計(jì)測(cè)試任務(wù)時(shí),應(yīng)該避免這類極端條件,減少社會(huì)權(quán)力差異或強(qiáng)加感對(duì)口語發(fā)揮的影響。
與Fuleher(2003)不同,Elder(2002)研究不同的口語測(cè)試環(huán)境對(duì)人們感覺到的測(cè)試難度有什么影口向。Eldeff2002)引用了Robinson(2001)提出的兩類影響測(cè)試難度的因素。
有趣的是Elder(2002)也討論過Skehan(1998)的觀點(diǎn),引用了Skehan(1998)提出的認(rèn)知復(fù)雜性理論(cognitive complexityframework)。盡管Elder(2002)試圖運(yùn)用Skehan(1998)的理論,但是其研究結(jié)果并不支持Skehan(1998)。Elder(2002)發(fā)現(xiàn),人們往往認(rèn)為不同的測(cè)試方法會(huì)有不同的難度,但是研究結(jié)果表明,測(cè)試參加者對(duì)任務(wù)難度的理解和設(shè)計(jì)人員對(duì)相應(yīng)條件下任務(wù)難度的設(shè)想往往不吻合。也就是說,設(shè)計(jì)測(cè)試任務(wù)時(shí)完全可以設(shè)計(jì)多種任務(wù),并且能夠保證難度均勻。
從以上兩項(xiàng)研究看,測(cè)試任務(wù)的難度似乎是個(gè)不可捉摸的東西,可以受許多因素的影響。人們已知的影響因素往往在實(shí)驗(yàn)中并沒有明顯的表現(xiàn),而且難以求得它們各自的權(quán)重。將來的數(shù)據(jù)搜集中不可避免地要面對(duì)測(cè)試難度的問題,并須從中確定主要的影響因素,盡量減小其影響。正如Elder(2002)總結(jié):“難度受多個(gè)復(fù)雜而不穩(wěn)定的因素影響,既包括測(cè)試任務(wù)的種種特性,又包括測(cè)試參加者各自的特點(diǎn)?!?/p>
2 影響測(cè)試表現(xiàn)的因素
2.1 Jennings(1 999)開篇就提到了測(cè)試的話題對(duì)于測(cè)試參加者的影響
該研究的主要研究問題是“確定測(cè)試話題可選與否對(duì)口語測(cè)試表現(xiàn)有無影響”。Jennings(1999)文中,這兩種測(cè)試環(huán)境并沒有發(fā)現(xiàn)明顯的不同;然而,可選話題一組的測(cè)試者平均分高于參照組。該研究針對(duì)測(cè)試參加者的調(diào)查問卷也顯示,參加者認(rèn)為提供可選話題與否是一項(xiàng)重要的因素。
基于測(cè)試參加者的書面反饋,Jennings(1999)提出,測(cè)試參加者們能否選出最適合發(fā)揮自己水平的題目。也就是說,設(shè)計(jì)測(cè)試任務(wù)時(shí)須認(rèn)識(shí)到,一方面,提供可選題目能夠減少話題效應(yīng),另一方面,還應(yīng)該考慮到測(cè)試參加者能否作出最有利的選擇。
2.2Kormos(1999)通過話語分析的方法比較了角色扮演和訪談兩種測(cè)試方法
該研究比較兩種測(cè)試環(huán)境下測(cè)試參加者和測(cè)試人員提出和認(rèn)可的話題數(shù)目,以及他們各自的開始會(huì)話、結(jié)束會(huì)話等會(huì)話行為。研究結(jié)果表明,在角色扮演測(cè)試環(huán)境下,如果測(cè)試參加者和測(cè)試員提出幾乎相同數(shù)目的話題,也就是說,角色扮演測(cè)試環(huán)境比訪談更像日常對(duì)話;同時(shí),在角色扮演中,測(cè)試參加者能更有效地打斷對(duì)方,也能更有效地掌握話輪。
Kormos(1999)認(rèn)為,在訪談型測(cè)試中,測(cè)試參加者和測(cè)試員的地位并不平等;而在角色扮演測(cè)試中,測(cè)試與被測(cè)人員雙方的地位則相對(duì)平等,而且交流也更平衡,有利于測(cè)量測(cè)試參加者的會(huì)話能力。
我們?cè)O(shè)計(jì)二語習(xí)得的口語測(cè)量工具時(shí)可以參考Kormos(1999):盡量將測(cè)試和被測(cè)雙方置于平等的地位,減少地位差別或懸殊對(duì)口語測(cè)試的影響。Kormos(1999)中還揭示了,在為了測(cè)量某些因素而進(jìn)行的訪談中,參加者如果意識(shí)到測(cè)試的目的,可能取悅測(cè)試人員(mtbjeot expectancy)等人為因素。
2.3 關(guān)于性別差異對(duì)語言產(chǎn)出和測(cè)評(píng)可能產(chǎn)生的影響。O’Loughlin(2002)進(jìn)行了研究
O'Loughlin(2002)發(fā)現(xiàn)先前的研究都認(rèn)為:性別差異在話語交談中有明顯的表現(xiàn)。人們認(rèn)為,典型的女性會(huì)話風(fēng)格是合作、趨同、話語雙方地位平等;而男性的會(huì)話風(fēng)格是控制欲,話語雙方地位不平等。然而,研究結(jié)果并不支持這些的傳統(tǒng)觀念,O’Loughlin(2002)認(rèn)為性別可能與說話人的社會(huì)地位、角色以及交談的環(huán)境共同起作用。
O’Loughlin(2002)在結(jié)論部分說因性別而產(chǎn)生的產(chǎn)出和測(cè)評(píng)差別并非不可避免。這也就是說,我們?cè)O(shè)計(jì)測(cè)試時(shí)能夠并且應(yīng)該盡量減少因性別產(chǎn)生的影響。
O’Loughlln(2002)的數(shù)據(jù)搜集活動(dòng)中,無論是測(cè)試參加者還是測(cè)試人員,他們?cè)陂_始測(cè)試前的組織方式有利于各自放松,正常發(fā)揮:測(cè)試要求他們做自我介紹,交流各自興趣;另外,測(cè)試參加者還可以選擇測(cè)試題目的話題。這種組織方式盡量減少了測(cè)試參加人員的情感因素。
2.4 O’Sullivan(2002)研究口語小組測(cè)試中的熟人因素
在實(shí)驗(yàn)中,O’Sullivan(2002)相應(yīng)地將32名日本學(xué)生分別進(jìn)行了3項(xiàng)測(cè)試,個(gè)人信息交流、故事簡(jiǎn)述、商討決策等。這3項(xiàng)測(cè)試都是先分別與自己的朋友成對(duì)完成,然后與陌生人成對(duì)完成。所有的表現(xiàn)都有錄像記錄,由有經(jīng)驗(yàn)的測(cè)試員打分,最后轉(zhuǎn)寫為文字以便分析。研究結(jié)果表明,與朋友成對(duì)完成任務(wù)的測(cè)試參加者得分較高。然而,分析了他們的語言產(chǎn)出后作者發(fā)現(xiàn)語言的語法復(fù)雜程度似乎沒有受到影響。另外,研究還發(fā)現(xiàn)性別也會(huì)影響測(cè)試的表現(xiàn)。
該研究中作者使用了多種測(cè)試任務(wù),如Skehan(1998)稱,不同的測(cè)試任務(wù)可能產(chǎn)生不同的測(cè)試表現(xiàn),因而作者認(rèn)為3項(xiàng)不同的測(cè)試任務(wù)獲得的數(shù)據(jù)要比單純依賴一種測(cè)試任務(wù)更有說服力。
2.5 Vermeer(2000)研究的是自發(fā)口語產(chǎn)出(spontaneousspeech)中的詞匯豐富性問題
該文章對(duì)型符比(Type/Token Ratio,簡(jiǎn)寫作TTR)用于測(cè)量詞匯豐富性的效度和信度進(jìn)行了研究,并提到型符比(TrR)是廣泛運(yùn)用于第一、第二語言習(xí)得中的研究手段(Vermeer,2000)。作者的研究發(fā)現(xiàn)在語言習(xí)得的初期,型符比(TTR)能夠較好地測(cè)量學(xué)習(xí)者口語詞匯的豐富性;但在語言習(xí)得的后期,型符比(TTR)就不再能夠反映學(xué)習(xí)者知道懂得哪些詞匯了,型符比(ITR)只是一個(gè)比率。
相反,Vermeer(2002)指出我們可以用學(xué)習(xí)者口語輸出詞匯的難度來衡量他們語言的詞匯豐富性??谡Z輸出詞匯的難度可以用這些詞匯在學(xué)習(xí)者口語語料庫中的頻率來計(jì)算。Vermeer的觀點(diǎn)對(duì)于我們測(cè)量學(xué)習(xí)者的口語產(chǎn)出水平,特別是二語習(xí)得研究中口語數(shù)據(jù)搜集,有參考意義:可以求得其口語詞匯的豐富性。并據(jù)此區(qū)分學(xué)習(xí)者的目標(biāo)語學(xué)能力。
3 結(jié)論
本文綜述的文章都對(duì)研究工具和測(cè)試方法本身進(jìn)行了批判性分析。探討的話題被Baclunan(1990)劃定為頑癥(persistentproblems)。Bachman(1990)在書中把這些因素籠而統(tǒng)之放入個(gè)人特點(diǎn)中,或者歸入測(cè)試方法之下。然而我們作為研究者,無論是進(jìn)行測(cè)試設(shè)計(jì)還是進(jìn)行搜集二語語料,都須研究這些問題,借鑒論文的研究成果,盡量控制其中的無關(guān)因素。