韓冬嬌
(黑龍江大學(xué) 黑龍江 哈爾濱 150086)
詞匯豐富性是二語(yǔ)詞匯研究的重要領(lǐng)域,涉及詞匯變化性、詞匯密度、詞匯復(fù)雜性和詞匯錯(cuò)誤數(shù)量四個(gè)維度,英語(yǔ)新聞詞匯的豐富性直接影響著新聞質(zhì)量。本研究選取主流媒體人民網(wǎng)的英文版作為觀察語(yǔ)料,將CNN原生新聞作為參照語(yǔ)料,自建兩個(gè)小型語(yǔ)料庫(kù),并借助軟件wordsmith 6.0、Range 32和Antconc 3.4.4,對(duì)國(guó)內(nèi)媒體英語(yǔ)新聞詞匯豐富性展開分析。
20世紀(jì)80年代以來(lái),二語(yǔ)詞匯研究備受國(guó)內(nèi)外專家學(xué)者的關(guān)注,研究領(lǐng)域主要為詞匯廣度和詞匯深度。
詞匯豐富性是反映二語(yǔ)寫作水平的一個(gè)重要指標(biāo)。Laufer&Nation指出,詞匯豐富性主要由四個(gè)維度構(gòu)成,分別是密度、變化性、復(fù)雜性及新穎性。[1]Engber在前者的研究基礎(chǔ)上,將詞匯錯(cuò)誤作為詞匯測(cè)量的另一個(gè)重要維度納入其中,指出詞匯豐富性的考察必須將有錯(cuò)誤的詞匯變化性、無(wú)錯(cuò)誤的詞匯變化性、錯(cuò)詞比例等考慮在內(nèi)。[2]Read指出,一篇好文章應(yīng)具備以下詞匯特征:詞匯豐富,非重復(fù)使用有限的單詞;使用符合話題和文體的低頻詞;相對(duì)高比例的實(shí)詞和較少的詞匯錯(cuò)誤。[3]這幾個(gè)特點(diǎn)被定義為評(píng)估詞匯豐富性的四個(gè)要素,即詞匯多樣性、詞匯復(fù)雜性、詞匯密度和詞匯錯(cuò)誤的數(shù)量。
有關(guān)國(guó)內(nèi)媒體英語(yǔ)新聞的研究多集中于新聞標(biāo)題、導(dǎo)語(yǔ)、詞匯、文體特征等方面,對(duì)詞匯豐富性的研究較少,而英語(yǔ)新聞的詞匯豐富性直接影響著新聞質(zhì)量。本研究基于Read的理論,將詞匯豐富性的維度界定為詞匯多樣性、詞匯密度、詞匯復(fù)雜性和詞匯錯(cuò)誤數(shù)量,通過自建語(yǔ)料庫(kù),對(duì)國(guó)內(nèi)媒體英語(yǔ)新聞的詞匯豐富性進(jìn)行研究。
本研究選取國(guó)內(nèi)主流媒體人民網(wǎng)的英文版作為觀察語(yǔ)料,將CNN原生新聞作為參照語(yǔ)料,自建兩個(gè)小型語(yǔ)料庫(kù);其中觀察語(yǔ)料庫(kù)7237詞,參照語(yǔ)料庫(kù)7178詞,新聞內(nèi)容主要涉及政治、經(jīng)濟(jì)、文化三個(gè)方面。
本研究借助語(yǔ)料庫(kù)分析工具,分析人民網(wǎng)英文版新聞的詞匯豐富性,并將其與CNN英語(yǔ)原生新聞進(jìn)行對(duì)比,發(fā)現(xiàn)國(guó)內(nèi)媒體英語(yǔ)新聞與原生英語(yǔ)新聞之間在詞匯使用上差距較大。由于本研究選取的人民網(wǎng)英語(yǔ)新聞是國(guó)內(nèi)主流媒體,文章質(zhì)量較高,因此詞匯錯(cuò)誤數(shù)量不作為本文的研究?jī)?nèi)容。本研究主要從以下三個(gè)方面展開討論:詞匯多樣性、詞匯復(fù)雜度和詞匯密度。
本研究借助wordsmith 6.0,通過計(jì)算標(biāo)準(zhǔn)類符和形符比(STTR)測(cè)量語(yǔ)料庫(kù)的詞匯多樣性;將《英語(yǔ)通用詞表》作為詞匯頻率檔案,運(yùn)行Range 32測(cè)量詞匯的復(fù)雜度;通過軟件Antconc3.4.4檢索語(yǔ)料庫(kù)中實(shí)義詞數(shù),計(jì)算詞匯密度。
1.詞匯多樣性
詞匯多樣性可看作詞匯的廣度,是詞匯豐富性的多維特征之一。詞匯多樣性傳統(tǒng)上采用類符和形符比(type token ratio,TTR),但該方法受文本長(zhǎng)度影響較大。因此,一般采用標(biāo)準(zhǔn)化類符/形符比(standardized type/ token ratio,STTR)作為衡量標(biāo)準(zhǔn),以減少文本中功能詞詞頻過高造成的誤差。[4]因此本研究借助wordsmith 6.0,采用Scott(2008)介紹的標(biāo)準(zhǔn)化類符和形符比(STTR)來(lái)測(cè)量國(guó)內(nèi)媒體英語(yǔ)新聞詞匯多樣性,測(cè)量結(jié)果更穩(wěn)定。STTR值越高,說(shuō)明文章中使用的類符數(shù)越多。兩個(gè)語(yǔ)料庫(kù)的類符數(shù)和形符數(shù),以及標(biāo)準(zhǔn)類符和形符比見表1。
表1 人民網(wǎng)語(yǔ)料庫(kù)和 CNN 語(yǔ)料庫(kù)標(biāo)準(zhǔn)化類符、形符比
表1顯示,人民網(wǎng)語(yǔ)料庫(kù)的TTR值為27.36,而CNN語(yǔ)料庫(kù)為31.66;從穩(wěn)定性更強(qiáng)的STTR值看,人民網(wǎng)語(yǔ)料庫(kù)是44.21,CNN語(yǔ)料庫(kù)為48.14,兩組數(shù)值均說(shuō)明國(guó)內(nèi)媒體英語(yǔ)新聞的詞匯多樣性低于原生英語(yǔ)新聞。
2.詞匯復(fù)雜度
詞匯復(fù)雜度是評(píng)估詞匯豐富性的指標(biāo)之一,所謂復(fù)雜度指的是文本中能夠適當(dāng)使用與主題、文體相關(guān)的低頻詞,而非只使用常用的高頻詞。[5]本研究通過運(yùn)行Range 32測(cè)量詞匯的復(fù)雜度[6],所用詞匯頻率檔案是《英語(yǔ)通用詞表》(GLW),其中最常用1000詞和次常用1000詞為高頻詞,學(xué)術(shù)詞匯和表外詞為低頻詞。[7-8]低頻詞比例越高,說(shuō)明語(yǔ)料庫(kù)詞匯復(fù)雜度越高。兩個(gè)語(yǔ)料庫(kù)的詞匯復(fù)雜度見表2。
表2 人民網(wǎng)語(yǔ)料庫(kù)和 CNN語(yǔ)料庫(kù)詞匯復(fù)雜度
詞匯復(fù)雜度指標(biāo)主要看的是低頻詞,即學(xué)術(shù)詞匯和表外詞。表2顯示,對(duì)于學(xué)術(shù)詞匯,人民網(wǎng)為14.94%,CNN為12.19%,人民網(wǎng)高于CNN;對(duì)于表外詞,人民網(wǎng)為28.86%,CNN為33.54%,人民網(wǎng)低于CNN。低頻詞指的是學(xué)術(shù)詞匯與表外詞匯,人民網(wǎng)的學(xué)術(shù)詞匯與表外詞之和為43.80%,CNN為45.73%,人民網(wǎng)低于CNN,說(shuō)明人民網(wǎng)的詞匯復(fù)雜度低于CNN。
3.詞匯密度Read(2000)認(rèn)為,詞匯密度是詞匯豐富性的一個(gè)重要參數(shù)。在詞匯密度測(cè)量上,本研究計(jì)算的文本中實(shí)詞數(shù)與總詞數(shù)之比[8-9],其計(jì)算公式為:
本研究借助Antconc3.4.4檢索兩個(gè)自建語(yǔ)料庫(kù)的實(shí)義詞數(shù)。通過以上公式,分別計(jì)算人民網(wǎng)語(yǔ)料庫(kù)和CNN語(yǔ)料庫(kù)中實(shí)詞總數(shù)與總詞量的比例,從而得出兩個(gè)語(yǔ)料庫(kù)的詞匯密度。該比值越高,說(shuō)明語(yǔ)料庫(kù)詞匯密度越大。兩個(gè)語(yǔ)料庫(kù)的詞匯密度見表3。
表3 人民網(wǎng)語(yǔ)料庫(kù)和 CNN語(yǔ)料庫(kù)詞匯密度
表3顯示,兩個(gè)語(yǔ)料庫(kù)的詞匯總數(shù)相近,人民網(wǎng)語(yǔ)料庫(kù)的詞匯密度為59.66%,CNN語(yǔ)料庫(kù)的詞匯密度為57.59%,人民網(wǎng)語(yǔ)料庫(kù)的詞匯密度高于CNN語(yǔ)料庫(kù)。
人民網(wǎng)語(yǔ)料庫(kù)和CNN語(yǔ)料庫(kù)詞匯豐富性的相關(guān)數(shù)據(jù)表明,人民網(wǎng)英文版的詞匯多樣性和詞匯復(fù)雜度均低于CNN原生新聞;但人民網(wǎng)的詞匯密度高于CNN,說(shuō)明國(guó)內(nèi)媒體英語(yǔ)新聞重復(fù)使用相同詞匯處多,詞匯的廣度和復(fù)雜度較低。這與表2兩個(gè)語(yǔ)料庫(kù)中高頻詞匯的使用情況相吻合:對(duì)于《英語(yǔ)通用詞表》中最常用1000詞,人民網(wǎng)語(yǔ)料庫(kù)為45.79%,CNN語(yǔ)料庫(kù)為43.79%,人民網(wǎng)高于CNN;對(duì)于次常用1000詞,人民網(wǎng)語(yǔ)料庫(kù)為10.40%,CNN語(yǔ)料庫(kù)為10.48%,兩個(gè)語(yǔ)料庫(kù)相差不大,即國(guó)內(nèi)媒體英語(yǔ)新聞更多地使用高頻詞。
本研究通過自建語(yǔ)料庫(kù)分析了國(guó)內(nèi)媒體英語(yǔ)新聞的詞匯豐富性,并與原生新聞進(jìn)行對(duì)比,結(jié)果顯示:國(guó)內(nèi)媒體英語(yǔ)新聞的詞匯多樣性和詞匯復(fù)雜度均低于原生新聞;但詞匯密度較高,說(shuō)明國(guó)內(nèi)媒體英語(yǔ)新聞多處重復(fù)使用高頻詞匯。為提高我國(guó)新聞外宣能力,國(guó)內(nèi)媒體應(yīng)提高英語(yǔ)新聞的詞匯多樣性和復(fù)雜度,注重低頻詞匯的運(yùn)用,以提高英語(yǔ)新聞的文本質(zhì)量。本研究只是對(duì)國(guó)內(nèi)媒體英語(yǔ)新聞的詞匯豐富性進(jìn)行初步分析,雖然在一定程度上揭示了國(guó)內(nèi)媒體英語(yǔ)新聞與原生新聞之間詞匯使用差距,但仍有不足之處,如選取的語(yǔ)料范圍較小、語(yǔ)料庫(kù)規(guī)模有限。因此,今后需建立更大庫(kù)容的語(yǔ)料庫(kù),開展更加深入且全面的研究。