鄧倩
摘要:本文通過分析中國日報(bào)網(wǎng)發(fā)布的習(xí)近平建黨百年的講話,運(yùn)用語料庫和計(jì)量的方法分析其詞匯的詞頻、詞長、詞匯密度以及型例比使用特征。研究表明,源語料型例比(8.92)、詞匯密度(30.95%)均低于譯語料的型例比(11.63)、詞匯密度(52.96%),源語料的詞匯豐富程度較低;詞頻和詞長分布分析發(fā)現(xiàn)兩個語料中排名前10的高頻詞有部分英漢對應(yīng)的詞語出現(xiàn),表明其主題比較集中;源語料的平均詞長1.45,譯語料的平均詞長3.58,表明源語料的文本難度相對較低而譯語料的長詞較多,文本較復(fù)雜。筆者認(rèn)為翻譯策略的差異以及受眾不同可能會產(chǎn)生這些詞匯特征。
關(guān)鍵詞:語料庫;計(jì)量;詞匯特征;建黨百年
1.引言
2021年是我們黨成立百年的日子,對我國有著重大的歷史意義。詞匯不僅要傳達(dá)其表層含義更要讓受眾領(lǐng)會到其更深層次的含義。有著不同文化背景的讀者對文本有著大不相同的理解,如果只是簡單的詞與詞相互對應(yīng),則會出現(xiàn)不同程度的誤解,這種現(xiàn)象在政治話語中尤為突出。
在已有的詞匯研究中,國內(nèi)學(xué)者進(jìn)行了相應(yīng)的詞匯研究主要從以下兩方面進(jìn)行:一是教學(xué)詞匯方面的研究(夏靜 2021);二是文學(xué)作品中的詞匯研究(曾江江 2020)。還有少部分從新聞?wù)Z篇以及法律語篇等著手。從已有的研究來看部分學(xué)者基于語料庫分析政治話語;部分學(xué)者通過分析譯本的用詞風(fēng)格來探討其差異;只有少部分學(xué)者基于語料庫并使用計(jì)量語言學(xué)的相關(guān)計(jì)量指標(biāo)如型例比、詞長等,還有相關(guān)計(jì)量軟件等對政治話語的詞匯系統(tǒng)進(jìn)行分析。因此,本文選取習(xí)近平總書記在今年七月一號《在慶祝中國共產(chǎn)黨成立100周年大會上的講話》為研究語料,英漢兩個版本的語料均從中國日報(bào)網(wǎng)下載并自建平行語料庫;為便于區(qū)分,漢語版本的語料料庫稱為源語料,英語版本的語料稱為譯語料;源語料共有7321個詞語,譯語料共有5574個詞。2021年正值建黨一百周年的偉大時間點(diǎn),分析構(gòu)架最高領(lǐng)導(dǎo)人的重要講話具有一定的現(xiàn)實(shí)意義,能夠讓讀者充分了解國家領(lǐng)導(dǎo)人對人民、對青年、對國家、對社會的殷切希望和美好愿景;在應(yīng)用方面,本文通過自建平行語料庫,運(yùn)用計(jì)量語言學(xué)的相關(guān)計(jì)量指標(biāo)如平均詞長、詞頻來分析語料中詞長特征;通過型例比、詞匯密度來分析文本的豐富程度以及可讀性等;通過高頻詞分析文本在使用詞性方面的差異對文本中的詞匯進(jìn)行計(jì)量研究,為政治話語的詞匯系統(tǒng)分析提供了可行路徑。本文通過自建平行語料庫,運(yùn)用計(jì)量的方法和軟件對習(xí)近平同志在建黨百年大會中的講話對其中英詞匯進(jìn)行定性和定量的分析,旨在回答以下問題:一是源語料和譯語料各自的詞匯特征是什么?二是通過對比,分析產(chǎn)生該結(jié)果的原因是什么?
2.研究方法和計(jì)量指標(biāo)
計(jì)量語言學(xué)是以語言文本為研究對象,以定量方法為主,但注重定性和定量的方法結(jié)合,在研究中使用多種計(jì)量指標(biāo)對文本屬性進(jìn)行量化統(tǒng)計(jì)是計(jì)量語言學(xué)和傳統(tǒng)語言學(xué)研究的顯著區(qū)別之一(韋愛云 2019)。下文將詳細(xì)介紹分析語料的相關(guān)研究方法以及計(jì)量指標(biāo)。
2.1計(jì)量指標(biāo)
2.1.1型例比
型例比(Type-token ratio)是語料庫語言學(xué)最常用的術(shù)語,也是計(jì)量語言學(xué)最常用語言文本計(jì)量指標(biāo)之一。這個比率與文本作者使用語言詞語熟練程度有關(guān)。其中型即詞型,指的是一個文本中不重復(fù)的詞的數(shù)量;例即詞例,指的是一個文本中詞的總數(shù),反映文本的長度規(guī)模(韋愛云 2019)。其計(jì)算公式為型例比=型符/例符。
2.1.2詞長和詞頻
在研究詞匯的基本屬性中最常見的則是詞頻和詞長。詞長是指某個詞匯的長度,比如某個單詞是單音節(jié)詞匯它的詞長就相對較短;而如果一個單詞是三音節(jié)詞匯它的詞長則較長,因此這一特征在一定程度上表明了文本的難易程度、文本的文體風(fēng)格以及可讀性。詞頻則是指某個單詞在該語料中出現(xiàn)的次數(shù),它也在一定程度上體現(xiàn)利潤該文本的文本風(fēng)格。
2.1.3詞匯密度
詞匯密度是某個特定文本中出現(xiàn)的實(shí)義詞數(shù)量與全文總詞匯的比例。當(dāng)文本中出現(xiàn)的實(shí)義詞較多則表明該文本的詞匯密度較大。在英語中,一個單詞可以蘊(yùn)含多種語義即即可當(dāng)名詞也可作動詞等,因此當(dāng)文本中出現(xiàn)多種實(shí)義詞類,文本的復(fù)雜度和難度則相對較高,因此該文本則包含了更多的內(nèi)容,帶給讀者相對大的難度,并且對讀者閱讀理解能力有一定的要求。
2.2研究方法
文章采用定性和定量的方法,以2021年七月一號習(xí)近平總書記在中國共產(chǎn)黨建立一百周年大會上的講話的英漢版本自建平行語料庫,使用相關(guān)軟件如詞性標(biāo)注軟件Tree tagger,檢索軟件Antconc以及文本計(jì)量指標(biāo)的分析工具QUITA。首先,在中國日報(bào)網(wǎng)下載習(xí)近平總書記建黨百年講話的中英文版本,轉(zhuǎn)存為文本文件。其次,使用軟件Tree tagger等軟件對中英文版本進(jìn)行詞性標(biāo)注。然后利用語言分析軟件對語料進(jìn)行分析如詞匯密度、詞頻、平均詞長等并探討講話中英漢版本的詞匯特征。
3.英漢語料詞匯特征
以下內(nèi)容將從型例比,詞長等方面對創(chuàng)建的語料庫從探討講話中英漢語料的詞匯特征,進(jìn)而對比分析他們之前存在的差異以及原因。
3.1詞匯密度
測量詞匯密度常見的方式有兩種,一是語料庫語言學(xué)中常用的型例比,但這種方法也有一定的缺陷,因?yàn)樗慕y(tǒng)計(jì)結(jié)果不能很好地反映該文本最根本的特征。表3-1是通過文本計(jì)量軟件QUITA統(tǒng)計(jì)的兩個語料庫中型符數(shù)、例符數(shù)以及型例比。
從表3-1可以看出,源語料的型符數(shù)為775,譯語料的型符數(shù)為1262;源語料的例符數(shù)為8685,譯語料的例符數(shù)為10854;源語料的型例比為8.92,低于譯語料的型例比11.63,通過以上數(shù)據(jù)基本可以清晰譯語料中的詞匯比源語料中的詞匯更加豐富且重復(fù)詞匯較少,源語料詞匯變化相對少一些并且譯語料的文本明顯擴(kuò)大,由此反映出譯語料的閱讀難度比源語料的閱讀難度高。第二種方式是二是根據(jù)詞匯密度詞來衡量語篇的信息量大小和文本難度。本文統(tǒng)計(jì)了動詞、形容詞等實(shí)義詞的詞頻從而更加全面的分析兩個語料庫的詞匯特征。
由圖表可知源語料中四類實(shí)詞的詞頻均低于譯語料中的相應(yīng)詞頻;但源語料的總字詞數(shù)明顯高于譯語料的總字詞數(shù);譯語料的詞匯密度明顯高于源語料的詞匯密度。前文提到文本密度與文本的語言風(fēng)格、閱讀難度有關(guān),因此該結(jié)果表明譯語料的文本難度相對較大,文中的用詞也相對比較復(fù)雜。以上兩個表格呈現(xiàn)的結(jié)果,筆者認(rèn)為有以下兩個原因,一是漢英語言的差異以及不同的譯者使用了不同的翻譯方法。如例(1)中包含了名詞(中國等)、動詞(需要等)、形容詞(新的);而在例(2)中不僅出現(xiàn)了名詞、動詞、形容詞,還出現(xiàn)了介詞(in)和限定詞(a)。
(1)中國迫切需要新的思想運(yùn)動、革命力量。(源文)
(2)China was in urgent need of new ideas and a new revolutionary forces.(譯文)
二是源語料的受眾是全國人民,其內(nèi)容應(yīng)該通俗易懂,并且整篇文章從“兩個一百年”奮斗目標(biāo)交匯的歷史方位出發(fā),深刻表達(dá)了慶祝建黨100周年的主題主線;而且“七一”重要講話的語言凸顯真理真事真情,通過排比句凸顯力量,對仗結(jié)構(gòu)貫穿全篇,感嘆句多達(dá)五十個,每一處排比、對仗、感嘆都讓人內(nèi)心深處形成強(qiáng)烈思想共振、情感共鳴。而譯語料的受眾則多數(shù)為外國友人,其用語也應(yīng)符合英語遣詞造句的規(guī)則。在源語料中出現(xiàn)了很多中國特色的詞匯如“小康社會”等,這些特色詞匯是專屬于中國的,在國外是找不到相應(yīng)的詞匯來表達(dá),因此譯者就要針對這類詞根據(jù)中國相關(guān)政策法規(guī)做出最通俗易懂的解釋,所以就需要用更多的詞匯,因此出現(xiàn)譯語料實(shí)詞數(shù)量多于源語料實(shí)詞也是情有可原的。前文提到由于該講話的行文結(jié)構(gòu)重復(fù)使用了排比句等句式,從而達(dá)到振奮人心的效果,而在翻譯過程中,英語多省略和抽象,而漢語傾向于重復(fù)和具體。在并列結(jié)構(gòu)中英語常常省略重復(fù)的詞語如例(3)中三次重復(fù)使用“這是”和“偉大光榮”,而例(4)中將重復(fù)部分省略,而在其后面用三個介詞短語表示其對象,顯得更加精煉。
(3)這是中華民族的偉大光榮!這是中國人民的偉大光榮!這是中國共產(chǎn)黨的偉大光榮?。ㄔ次模?/p>
(4)This is a great and glorious accomplishment for...(譯文)
3.2詞頻
一般來說,功能詞的數(shù)量在很大程度上反映文本的規(guī)范程度與可讀程度。詞頻在語料庫中可以有效地反映文章的主題,通過軟件檢索高頻詞,選取排名前十的高頻詞進(jìn)行分析解讀。
結(jié)果顯示,源語料的高頻詞為“的(221)、中國(116)、人民(69)、偉大(53)、和(53)、共產(chǎn)黨(48)、中華民族(44)、了(41)、是(38)、新(37)”;譯語料的高頻詞為“the(456)、and(311)、of(209)、to(149)、Party(98)、in(96)、a(91)、Chinese(86)、people(81)、China(53)”,(注:括號的熟悉為詞匯出現(xiàn)的頻次)。兩個語料中的高頻詞都包含“中國China”“人民people”“我們we”“黨Party”“偉大great”“和and”“為for”“在in”,表明兩個語料的主題十分集中都是以“人民、黨、中國”為主旋律。由表可知連接詞在譯語料中出現(xiàn)的次數(shù)極高,這也驗(yàn)證了英語語言的結(jié)果是重形合,如果沒有相應(yīng)的連接詞連接,該文本則就像一盤散沙沒有條理性;中文中一句可出現(xiàn)多個動詞并不需要多個連接進(jìn)行連接,而英語不行,一個句子中只能出現(xiàn)一個動詞。從詞性來看,源語料中的高頻詞主要為名詞,如中國、偉大、人民等詞和動詞如堅(jiān)持、發(fā)展、實(shí)現(xiàn);而譯語料中的高頻詞主要為功能詞以及名詞等,而且相同意義的內(nèi)容用不同語種表達(dá)出來時,所使用的高頻詞匯也不相同。并且在譯語料中詞頻排名前五中有四個屬于功能詞;在英語文本中,馮慶華(2008)認(rèn)為the和of的使用頻率可以反映文本的語體正式程度,當(dāng)這兩個詞在文本中出現(xiàn)的頻率不高,則說明文本的語言體裁不那么正式,反之亦然。party一詞出現(xiàn)頻率排名第五,也再次說明此次主題與中國共產(chǎn)黨建立一百周年的偉大事件相契合。高頻詞中人稱詞如“we、我們”都屬于第一人稱,說明習(xí)近平總書記是站在全國人民、代表我們偉大的中國共產(chǎn)黨講話,因此更加具有感召力。除此之外,譯語料中的高頻動詞is出現(xiàn)了37詞,用一般現(xiàn)在時來客觀地陳述中國乃至中國共產(chǎn)黨的光輝歷史,也從側(cè)面表明在此次重要講話中的事件都是真實(shí)存在的,表明在建黨前后以及現(xiàn)在中國的繁榮富強(qiáng)的狀態(tài)都是一直存在的,盡管一路走來出現(xiàn)過大大小小的問題,但中國共產(chǎn)黨都是客觀對待并對自己的問題進(jìn)行批評與自我批評。
3.3詞長
文本中使用的詞匯長度對文本的理解難度有一定的影響。而平均詞長則是文本中不重復(fù)詞的數(shù)量的平均長度,如果文本中平均詞長越長就說明文本中長詞比較多,就如中文中兩個相同意思的詞語,但一個是兩個字一個是四個字則四個字的詞語可讀性更難。源語料和譯語料的平均詞長數(shù)據(jù)如表3-4所示。
從表3-4看出,譯語料的平均詞長明顯高于源語料的平均詞長,與型例比的結(jié)果相一致。數(shù)據(jù)表明源語料的可讀性高于譯語料的可讀性。該現(xiàn)象的產(chǎn)生也有一部分歸因于英語可以通過詞性的不同來變換使用單詞,因此譯語料的型符數(shù)遠(yuǎn)遠(yuǎn)高于源語料的型符數(shù)。
4.總結(jié)
本文基于真實(shí)的語料,采用語料庫驅(qū)動的計(jì)量語言學(xué)研究方法,選取習(xí)近平總書記在2021年7月1號建立中國共產(chǎn)一百周年大會上的講話的中英文版本為研究語料,對其進(jìn)行定量和定性分析,從詞匯層面研究建黨百年大會上的講話中的英漢詞匯特征,并分析其原因。研究表明,在詞匯豐富程度方面,本文通過對比源語料和譯語料的型例比和詞匯密度來進(jìn)行分析:源語料的型例比為8.92,譯語料的型例比為11.63,源語料的型例比明顯低于譯語料的型例比;繼而統(tǒng)計(jì)了語料庫中的實(shí)義詞的出現(xiàn)次數(shù)討論其詞匯密度。筆者認(rèn)為有以下原因:一是漢英語言的差異和譯者在漢譯英過程中使用的翻譯策不同;觀察得出,源語料中出現(xiàn)大量排比句、感嘆句等,其目的是為了引起共鳴,讓人內(nèi)心深處形成強(qiáng)烈的思想共振,因此會出現(xiàn)相當(dāng)多的重復(fù),而在英語翻譯策略中,相同的句式或詞匯都會選擇省略;二是此次講話的受眾不同,源語料的受眾是全國人民各個階層、不同年齡段的人們,其內(nèi)容應(yīng)該通俗易懂,而閱讀譯語料的大部分是外國人,大量具有中國特色的詞匯在英文中無明確的對應(yīng)詞,譯者需要用受眾能懂的語言進(jìn)行分析解讀,因此源語料的型例比和詞匯密度均低于譯語料的詞匯密度。在詞長詞頻方面,譯語料的平均詞長明顯高于源語料的平均詞長,存在的原因可能為漢語的詞語可以翻譯為英語中同義但不同詞性的詞;通過分析,兩個語料庫的高頻詞中都出現(xiàn)了部分相互對應(yīng)的中英詞,表明其主題集中度高。對國家領(lǐng)導(dǎo)人在重大時間點(diǎn)的講話進(jìn)行分析有利于幫助讀者解讀,為政治話語的詞匯研究提供新思路。
參考文獻(xiàn)
[1] 馮慶華. 母語文化下的譯者風(fēng)格[M]. 上海: 上海外語教育出版社, 2008.
[2] 韋愛云. 壯語詞匯系統(tǒng)的計(jì)量研究[D]. 浙江大學(xué), 2019.
[3] 夏靜. 基于語料庫的英語教材詞匯研究[D]. 天津師范大學(xué), 2021.
[4] 曾江江. 基于語料庫的《浮生六記》英譯本詞匯特征研究[D]. 華僑大學(xué), 2020.