陸蕓
(南京工業(yè)大學(xué),江蘇 南京 210009)
使用不同詞表檢驗詞匯復(fù)雜度測量方法信度和效度之比較
陸蕓
(南京工業(yè)大學(xué),江蘇 南京 210009)
本文比較了使用N ation詞表后檢驗詞匯復(fù)雜度三種測量方法信度效度的結(jié)果是否與以往使用大綱詞表檢驗結(jié)果一致,從而比較N ation詞表和大綱詞表的差異,發(fā)現(xiàn)N ation詞表區(qū)分度更大,更適于研究二語學(xué)習(xí)者產(chǎn)出性文本。
詞匯復(fù)雜度;N ation詞表;大綱詞表
詞匯復(fù)雜度是詞匯豐富程度的一個重要指標,詞匯復(fù)雜度從某種程度上可以反映詞匯量的大小。測量詞匯復(fù)雜度以Nation(1995)的詞頻分布(LFP)和Meara(2001)的泊松擬合法影響最為廣泛,國內(nèi)外學(xué)者對詞匯的研究多會借助Nation等開發(fā)的Range軟件和Meara等開發(fā)的P_Lex(如Espinosa 2005,鮑貴2010);也有專門研究詞匯復(fù)雜度測量方法的如(Nation 1995,Meara 2001,鮑貴2011,陸蕓2012)。研究表明如何控制文本長度對詞匯復(fù)雜度的影響是詞匯復(fù)雜度測量的一大難題,LFP用截取等長度的方法來控制文本長度的影響,但是這容易造成因低頻詞聚集于某一段文本而使測量結(jié)果發(fā)生偏差的情況,P_Lex因計算概率較好地控制文本長度對詞匯復(fù)雜度的影響,但P_Lex沒有解決將段落內(nèi)重復(fù)低頻詞視為不同低頻詞類的問題。因此陸蕓等(2013)提出隨機取樣方法即隨機截取相同長度文本n次,取平均值以減小誤差,并將傳統(tǒng)的類符型符比方法,隨機取樣方法和改進的P_Lex方法(解決了將段落內(nèi)重復(fù)低頻詞視為不同低頻詞類的問題)集成在一起,開發(fā)了中國的詞匯復(fù)雜度測量軟件,使用根據(jù)大學(xué)英語大綱要求制定的詞表驗證其信度和效度。驗證發(fā)現(xiàn)隨機取樣方法和改進的P_Lex方法更有信度和效度,尤其是隨機取樣方法可以針對較短的文本和比較不同長度的文本,更適用于測量二語學(xué)習(xí)者的產(chǎn)出性文本。使用大綱詞表是考慮到使用的數(shù)據(jù)來源是中國二語學(xué)習(xí)者,中國詞表可能更符合中國學(xué)生的學(xué)習(xí)規(guī)律。然而Range和P_Lex使用的詞表都是Nation根據(jù)BNC語料庫開發(fā)的詞表。利用不同的詞表是否具有相同的驗證結(jié)果以及大綱詞表和Nation詞表有何差異成為本研究想要解決的問題。
2.1 研究問題
本研究將Nation的詞表按照自行開發(fā)的軟件的要求進行編輯,并將之導(dǎo)入軟件,計算使用Nation詞表后三種方法的詞匯復(fù)雜度值,并將其與以往使用大綱詞表所得出的對應(yīng)值進行比較,主要解決以下問題。
1)使用Nation詞表檢驗信度,結(jié)果與使用大綱詞表是否具有一致性?
2)使用Nation詞表檢驗效度,結(jié)果與使用大綱詞表是否具有一致性?
3)Nation詞表和大綱詞表有何差異?
2.2 數(shù)據(jù)收集和處理
為了便于比較兩種詞表的差異,本文所使用的數(shù)據(jù)與以往使用大綱詞表檢驗詞匯復(fù)雜度測量方法信度和效度是同一批數(shù)據(jù)。檢驗信度使用新概念英語第二冊和第三冊奇數(shù)編號的文本,共78篇。檢驗效度使用的是《英語專業(yè)語料庫》(上海外語教育出版社,2008年版)2004年的英語專業(yè)八級作文,經(jīng)過處理,96篇作文被用于研究。這些作文按照其分數(shù)分成高低作文水平組,經(jīng)非參數(shù)檢驗,兩組作文分數(shù)存在顯著差異。
數(shù)據(jù)處理經(jīng)過去標注、削尾(即將動詞的屈折變化形式還原成動詞原形)、文本清理和詞匯復(fù)雜度測量幾個階段。
研究中使用了去標注軟件(DetaggingTool)、線削尾處理軟件(CST's Lemmatiser)、自行開發(fā)的詞匯復(fù)雜度測量軟件(LexicalSophistication)和統(tǒng)計軟件SPSS13.0。
3.1 信度一致性問題
信度一致性問題是通過78篇新概念英語文本進行折半信度分析來探討的。78篇新概念英語的文本被依次重新編號,并根據(jù)新的編號分為奇數(shù)組和偶數(shù)組兩組。這兩組文本使用不同的詞匯復(fù)雜度測量方法測量,其平均值如下。可以發(fā)現(xiàn)使用Nation詞表測量后,兩組詞匯復(fù)雜度平均值沒有太大差異,這和使用大綱詞表的情況接近。但是使用Nation詞表后,詞匯復(fù)雜度值比使用大綱詞表得到的對應(yīng)值都要相對更高。
表1 使用Nation詞表和大綱詞表兩組詞匯復(fù)雜度均值
使用Nation詞表后,Guttman折半系數(shù)分別為.781,.842和.655,分別大大高于使用大綱詞表的系數(shù).614,.699和.606。說明使用Nation詞表后發(fā)現(xiàn)新概念英語兩組文本間信度很高,兩組文本來自同一個整體,也反映了三種測量方法是有信度的。從三種詞匯復(fù)雜度測量方法比較來看,使用隨機取樣方法時折半系數(shù)最高,說明隨機取樣方法是較為可靠的方法。這些結(jié)果都和之前使用大綱詞表得出的結(jié)果一致。
從兩種詞表比較來看,使用Nation詞表后得出的值都要比使用大綱詞表得出的相應(yīng)值高。這是因為我們對低頻詞的不同操作定義造成的。使用大綱詞表時,我們將不在中學(xué)詞表中的詞定義為低頻詞,而使用Nation詞表時,將不在最常用的2000詞詞表中的詞定義為低頻詞,測量軟件就會取出不同低頻詞個數(shù)。從結(jié)果看,大綱詞表中學(xué)詞表中的一部分詞已超出Nation的最常用和次常用詞的范圍。而既然使用Nation詞表后信度更高,顯然Nation詞表中的常用詞范圍較為合理。
3.2 效度一致性問題
效度問題是通過將語料庫中96篇專八作文的詞匯復(fù)雜度值與其對應(yīng)的作文分數(shù)進行相關(guān)分析來檢驗的。使用Nation詞表后,使用三種詞匯復(fù)雜度測量方法發(fā)現(xiàn)詞匯復(fù)雜度和作文分數(shù)呈現(xiàn)低相關(guān),詞匯復(fù)雜度值可以區(qū)分高低作文水平組。這和許多研究者的發(fā)現(xiàn)都比較一致(如Engber1995,鮑貴2011)。而使用隨機取樣法得出的相關(guān)系數(shù)最高,使用傳統(tǒng)方法相關(guān)系數(shù)最低,再一次證明了隨機取樣法的優(yōu)勢。這些都說明了以往使用大綱詞表對三種方法信度效度檢驗的結(jié)論是具有普遍性的。
值得注意的是,以往使用大綱詞表時,各種方法的相關(guān)系數(shù)和t值比較接近,區(qū)分度不高,而使用Nation詞表后,相關(guān)系數(shù)和t值差異較明顯,區(qū)分度較高。這說明將中學(xué)詞表以外的詞定義為低頻詞的標準對研究二語學(xué)習(xí)者產(chǎn)出性文本有些高了。
表2 使用不同詞表詞匯復(fù)雜度值與作文分數(shù)呈低相關(guān)
表3 使用不同詞表高低作文水平組平均詞匯復(fù)雜度值差異顯著
3.3 Nation詞表和大綱詞表比較
Range的詞表是Nation根據(jù)BNC語料庫制定的,其中第一個基礎(chǔ)詞表包括最常用的約1,000個英語詞簇(wordfamily),第二個基礎(chǔ)詞表包括次常用的約1,000個英語詞簇。Nation(1997)認為,雖然一種語言的詞匯是一個無限量,但并非所有的詞都同樣重要。衡量一個詞的重要性,目前主要依據(jù)詞在書面和口語文本中出現(xiàn)的頻率,即詞頻。大學(xué)英語教學(xué)大綱(修訂本)制定的詞匯表規(guī)定了各級詞表。鄧昭春(2004)認為大綱詞表規(guī)定了要求各級領(lǐng)會式掌握的單詞數(shù)量和具體單詞,相反,對復(fù)用式詞匯只有數(shù)量上的要求。這無形中將大綱詞表定位在對接受性詞匯的掌握,降低了對共核詞匯的復(fù)用要求。因此她建議編寫出對我國大學(xué)生最具有復(fù)用意義的分類詞族表。從這些學(xué)者的觀點看,Nation的詞表從制表原則上來講要比大綱詞表更具科學(xué)性和實際意義。
從實證研究看,使用Nation詞表詞匯復(fù)雜度值更高,區(qū)分度更大,說明Nation的分級詞表在研究中更具有可操作性,更能反映英語學(xué)習(xí)者詞匯產(chǎn)出的特點,英語學(xué)習(xí)者總是最容易掌握那些最重要,最高頻的詞匯。而大綱詞匯規(guī)定的中學(xué)詞匯表領(lǐng)會式掌握單詞的數(shù)量超過了最常用2000詞的數(shù)量,實際上對二語學(xué)習(xí)者產(chǎn)出性詞匯量來講要求偏高。因此使用大綱詞表,將大綱詞表中學(xué)詞表以外的詞定義為低頻詞來研究低水平英語學(xué)習(xí)者詞匯掌握情況并不適合。也許借鑒國外詞簇詞頻研究成果,結(jié)合我國英語教學(xué)實際,編寫出對我國大學(xué)生最具有復(fù)用意義的分類詞族表對我國英語教學(xué)和詞匯研究將更有意義。
本文使用Nation詞表對詞匯復(fù)雜度測量方法信度和效度進行檢驗,發(fā)現(xiàn)其結(jié)果與以往使用大綱詞表檢驗具有一致性。而使用Nation詞表后,區(qū)分度更大。說明Nation詞表和大綱詞表相比更適合研究二語學(xué)習(xí)者產(chǎn)出性文本。也許今后可以借鑒國外詞表制表原則,制定出更符合中國英語學(xué)習(xí)者學(xué)習(xí)特點的英語詞表,更好地為國內(nèi)英語教學(xué)和研究服務(wù)。
[1]Laufer,B.&Nation,P.Vocabulary size and use:lexi cal richness in L2 written production.[J].Applied Linguistics,1995,16:307-322.
[2]Meara,P.&Bell.H.P_Lex:A simple and effective way of describing the lexical characteristics of short L2texts.[J].Prospect,2001,16(3):323-337.
[3]Moreno Espinosa,S.,Fernandez Fontecha,A.and A gustin Llach,M.P.Can P_Lex accurately measure lex ical richness in the written production of young learners of EFL?[J]Porta Linguarum:Revista Internacional de Didactica de las Lenguas Extranjeras,2005,4:7-21.
[4]鮑貴.英語學(xué)習(xí)者語言復(fù)雜性變化對比研究[J].現(xiàn)代外語,2010,(2):166-176.
[5]鮑貴.英語學(xué)習(xí)者詞匯復(fù)雜度的最新測量及驗證[J],山東外語教學(xué),2011,(6):44-52.
[6]陸蕓.詞匯豐富性測量方法及計算機程序開發(fā):回顧與展望[J].南京工業(yè)大學(xué)學(xué)報,2012,(2):104-108.
[7]Engber,C.A.The relationship of lexical proficiency to the quality of L2 compositions[J].Journal of Second Language Writing,1995,4:139-155.
[8]鄧昭春.《大綱》詞表的局限性與分類詞族表的教學(xué)意義[J].中國大學(xué)教學(xué),2004,(9):45-48.
[9]Nation,P.&R.Waring.1997.Vocabulary size,textcoverage and word lists[A].Vocabulary:Description, Acquisition and Pedagogy[C].Schmitt,N.&M.McCarthy (Eds.),NewYork:Cambridge University Press.http: //www.132.208.224.131/ResearchWeb.
責(zé)任編輯:周哲良
H 313
A
1672-2094(2013)06-0066-03
2013-10-18
陸蕓(1978-),女,江蘇太倉人,南京工業(yè)大學(xué)講師,碩士。研究方向:應(yīng)用語言學(xué)。