王銘玉,劉子夜
?
詞頻分析與中俄政治文獻翻譯——以2013-2014年中國政府工作報告俄文版與俄羅斯國情咨文對比為個案
王銘玉,劉子夜
(天津外國語大學,天津300204)
在我國譯界,政治文獻外譯凸顯重要。文章以2013-2014年中國政府工作報告俄文版和俄羅斯國情咨文為語料,借助詞頻統(tǒng)計手段對其進行了量化分析與對比研究,發(fā)現(xiàn)俄羅斯國情咨文用詞的頻率整體略高于中國政府工作報告俄文版用詞。文章還探究了詞頻對比過程中的用詞差異現(xiàn)象,從量化角度對我國政治文獻漢譯俄問題提出了對策性建議。
政治文獻;翻譯;詞頻統(tǒng)計;量化分析
1 政治文獻的定義
我國的政治文獻主要指馬克思主義經典著作、黨和國家重要文獻及領導人著作。馬克思主義經典著作包括馬克思、恩格斯、列寧和斯大林關于馬克思主義的相關著作;黨和國家重要文獻包括中共中央、全國人大、國務院和全國政協(xié)的決議、決定、會議公報、頒發(fā)的法律、法規(guī)及中央領導人的重要報告、講話、文稿和國務院新聞辦公室發(fā)布的白皮書等;領導人 著作指中共中央、國家機構、全國政協(xié)主要領導人的著作。
2 詞頻統(tǒng)計對語言學研究的作用
辛克萊爾(Sinclair,1991:30)任何人在研究一個文本時都需要知道每個不同單詞的形式在其中的出現(xiàn)頻率”。語言研究者不僅要明確語言中存在哪些單位和結構,更要了解這些單位和結構在語言中的出現(xiàn)頻率,在定性研究的基礎上進一步回答“有多少”的問題。隨著“互聯(lián)網+”與“大數(shù)據”時代的到來,語言學研究開始主動“吸收”包括統(tǒng)計在內的定量研究方法。詞頻統(tǒng)計是語言學計量研究的基礎手段,研究者可籍此確定作者的寫作風格,甄別偽作;衡量不同語言的相似度;比較不同時期語言的發(fā)展特征等(韋曉琴,1985:82-86)。此外,詞頻統(tǒng)計在外語教學和詞典編纂領域也具有廣闊應用前景??傊?,詞頻統(tǒng)計的簡約性、解釋性、實踐性和可驗證性(李劍沖,2003:104-105)使其成為語言學研究由定性向定量飛躍的“助推器”。
3 詞頻對比分析對政治文獻翻譯的意義
詞頻對比分析對政治文獻翻譯具有重要意義。首先,對國外政治文獻進行詞頻統(tǒng)計,可量化國外政治文獻的常用詞匯,為我國翻譯同類政治文獻提供詞匯參考,使譯文更貼近目標語,增強譯文可讀性;其次,對比不同時期政治文獻高頻詞的變化,可分析特定國家相關政策的變化;再次,對同一領導人的相關著作、講話進行詞頻統(tǒng)計,可在詞匯方面對領導人的語言特點進行量化分析,有助于譯文更準確地再現(xiàn)領導人的語言風格。此外,將詞頻統(tǒng)計、句長統(tǒng)計、句頻統(tǒng)計、標點統(tǒng)計綜合運用,能為政治文獻翻譯實踐和評價提供多方位、立體化的參考標準。
1 研究對象
中國政府工作報告俄文版(Докладо Работе Правительства)與俄羅斯國情咨文(Отчёт Правительства о результатах работы)每年由中、俄兩國中央政府發(fā)布,以2013-2014年發(fā)布的中國政府工作報告俄文版和俄羅斯國情咨文為對象,對其進行詞頻對比研究。
2 研究方法
2.1 確立對比標準
中俄在地緣環(huán)境、歷史傳統(tǒng)、意識形態(tài)等方面存在巨大差異,不能直接對比兩國政治文獻的用詞。本文以《俄語國家語料庫》(Национальный корпус русского языка)提供的詞頻表為“中介”,將中國政府工作報告俄文版和俄羅斯國情咨文的詞頻統(tǒng)計結果與詞頻表比對,從而間接對比、分析中國政府工作報告俄文版和俄羅斯國情咨文的詞頻差異。
2.2 控制變量
控制變量是比較研究的前提。影響詞頻統(tǒng)計的因素主要有:文本創(chuàng)作時間、字數(shù)、體裁和內容。本研究的主要對象是政治文獻,故在體裁上首先得到了控制。下面確定的是其余3個變量:文本創(chuàng)作時間、字數(shù)和內容。
(1)控制發(fā)布時間。十二屆全國人大一次會議、二次會議政府工作報告俄文版分別發(fā)布于2013年3月19日和2014年3月18日;2012-2013年俄羅斯國情咨文分別發(fā)布于2013年4月17日和2014年4月22日。兩國政府工作報告的發(fā)布時間相差約1個月,對語言的影響忽略不計。
(2)控制內容。內容上,兩國政府工作報告同屬一個領域;語體上,兩國政府工作報告均屬政論語體。
(3)控制字數(shù)。十二屆全國人大一次會議、二次會議政府工作報告俄文版共用俄語詞21 671個(包括標點、數(shù)字),含6 271個單詞及變形;2012年和2013年俄羅斯國情咨文共用俄語詞20 655個(包括標點、數(shù)字),含5 749個單詞及變形。為控制詞量,筆者從中國政府工作報告俄文版和俄羅斯國情咨文中分別抽取出現(xiàn)頻率最高的5 500個詞及其變形進行研究。
3 研究路徑
搜集文本→確立標準→控制變量→統(tǒng)計詞頻→對比結果→挖掘數(shù)據
4 統(tǒng)計結果
筆者將《俄語國家語料庫》的詞頻表按頻率高低劃分出30個頻段,起始頻段包含10 000個單詞及變形,其余各頻段包含20 000個單詞及變形。將2013- 2014年中國政府工作報告俄文版和俄羅斯國情咨文出現(xiàn)頻率最高的5 500個單詞及變形與《俄語國家語料庫》詞頻表進行對比,該5 500個單詞及變形在詞頻表不同頻段出現(xiàn)的個數(shù)、個數(shù)差及差值比(差值比=差值/5 500)如下:
表1 中國政府工作報告和俄羅斯國情咨文單詞出現(xiàn)個數(shù)、個數(shù)差及差值比
續(xù)表
頻段俄國中國差值差值比頻段俄國中國差值差值比 90 001-110 0004 6824 3663165.75%390 001-410 0005 2825 1191632.96% 110 001-130 0004 7894 5092805.09%410 001-430 0005 2945 1281663.02% 130 001-150 0004 8754 6002755.00%430 001-450 0005 3035 1441592.89% 150 001-170 0004 9474 6962514.56%450 001-470 0005 3135 1561572.85% 170 001-190 0004 9984 7492494.53%470 001-490 0005 3215 1691522.76% 190 001-210 0005 0454 7992464.47%490 001-510 0005 3295 1791502.73% 210 001-230 0005 0854 8702153.91%510 001-530 0005 3385 1871512.75% 230 001-250 0005 1184 9182003.64%530 001-550 0005 3485 2091392.53% 250 001-270 0005 1414 9521893.44%550 001-570 0005 3525 2131392.53% 270 001-290 0005 1654 9901753.18%570 001-590 0005 3615 2211402.55%
如上表所示,在這30個頻段中,中國政府工作報告俄文版的詞匯出現(xiàn)量均少于俄羅斯國情咨文。在最常用的30 000個俄語詞中,中國政府工作報告俄文版與俄羅斯國情咨文的單詞出現(xiàn)量相差436個,約占總詞數(shù)的7.93%。在最常用的370 000個俄語詞中,兩國政府報告用詞量的差距縮小至3%。如統(tǒng)計范圍擴大到最常用的590 000個俄語詞,則囊括我國政府工作報告俄文版中的5 221個單詞和俄羅斯國情咨文中的5 361個單詞。持續(xù)擴大統(tǒng)計范圍,兩國政府工作報告用詞量的差距趨于0。
綜上所述,俄羅斯國情咨文用詞的頻率整體略高于中國政府工作報告俄文版用詞。
分析兩國政府工作報告的詞頻統(tǒng)計結果,有兩類現(xiàn)象值得關注與研究:(1)一些單詞在一國政府工作報告中反復被使用,但未出現(xiàn)在另一國政府工作報告中;(2)相同含義在兩國政府工作報告中的表述方法不同。筆者運用數(shù)據挖掘技術在眾多差異性結果中,根據差異大小挑選出以下8個例子進行論述。
1 конечно(當然)和безусловно(毫無疑問)
конечно和безусловно是常見俄語詞,在2013- 2014年俄羅斯國情咨文中分別出現(xiàn)了84次和3次,但在同年中國政府工作報告俄文版中兩詞均未出現(xiàn)。конечно作為插入語或語氣詞時可譯為“當然,自然,無疑”;безусловно作插入語或副詞時可譯為“毫無疑問,當然”(大俄漢詞典,2001:84)。但在我國2013- 2014年政府工作報告漢語版中,根本未使用副詞“當然”、“自然”、“無疑”。因此,政府工作報告俄文版中未出現(xiàn)конечно和безусловно不足為奇。該現(xiàn)象是由兩國政治話語體系不同所致,我國政府工作報告要體現(xiàn)“政治自信”,要從語氣上表明“準確無誤”,一切“似是而非”和“含糊”情況均要堅決避免。
2 относительно(相對地)
在2013-2014年中國政府工作報告俄文版中,относительно使用了19次,但在同年俄羅斯國情咨文中,該詞未出現(xiàn)。中國政府工作報告俄文版中относительно大多出現(xiàn)于ровное и относительно быстрое развитие或ровный и относительно быстрый рост的組合,合譯為“平穩(wěn)較快發(fā)展”或“平穩(wěn)較快增長”。借助《俄羅斯國家語料庫》和Google Ngram Viewer數(shù)據庫,俄語中并無ровное и относительно быстрое развитие或ровный и относительно быстрый рост的說法,但這不意味著我國政府工作報告俄文版中不能出現(xiàn)這樣的翻譯?!捌椒€(wěn)較快發(fā)展”或“平穩(wěn)較快增長”是我國政治文獻獨具中國特色的表述方式。從使用頻率上看,選用относительно翻譯“平穩(wěn)較快發(fā)展”或“平穩(wěn)較快增長”中的“較”字最合適。俄語中,除относительно外,還有3個副詞能表達“相對”含義:сравнительно、условно和релятивно,它們的使用頻率見圖1:
圖1 относительно,сравнительно,условно,релятивно使用頻率
其中,относительно的使用頻率最高,релятивно的使用頻率最低。在2013-2014年中國政府工作報告俄文版中,сравнительно,условно和релятивно均未出現(xiàn),即表達“相對”含義時首選單詞относительно,這符合俄語語言習慣,也最易被俄羅斯讀者接受。
3 примерно(大約)
примерно在2013-2014年中國政府工作報告俄文版中常與數(shù)字連用,表達概數(shù)含義,共出現(xiàn)14次。同年俄羅斯國情咨文則選用почти,около或приблизительно表達概數(shù)含義。почти和около的使用頻率明顯高于примерно和приблизительно(見圖2)。但在中國政府工作報告俄文版中,почти出現(xiàn)0次,около出現(xiàn)4次,приблизительно出現(xiàn)2次,明顯少于примерно的出現(xiàn)次數(shù)。除приблизительно更書面化外,почти、около和примерно在書面語及口語中皆可使用,加之這4個詞在用法上并無明顯差別,鑒于此,建議中國政府工作報告俄文版在翻譯概數(shù)意義時,可相對增加почти和около的使用頻度。
圖2 почти,около,примерно,приблизительно使用頻率
4 медстрахование(醫(yī)保)和медицинское страхование(醫(yī)療保險)
медстрахование是詞組медицинское страхование的縮略形式,медстрахование更傾向于譯成“醫(yī)?!?,而медицинское страхование的翻譯則更傾向于“醫(yī)療保險”。在2013-2014年中國政府工作報告俄文版中,二者往往混用,各出現(xiàn)5次,在同年俄羅斯國情咨文中,медицинское страхование和медстрахование分別出現(xiàn)了1次和0次。俄語中медицинское страхование的使用頻率遠高于медстрахование(見圖3):
圖3 медстрахование和медицинскоестрахование使用頻率
與此類似的還有соцстрахование(社會保險)、экостроительство(生態(tài)建設)、экоохрана(生態(tài)保護)等“音節(jié)型”縮略語,它們由一個單詞的詞首和另一個完整單詞組成,這類“音節(jié)型”縮略語的絕對數(shù)量雖未超過“首字母型”縮略語,但近年來呈上升趨勢。所以,翻譯中國政治文獻中的特定詞匯時,是優(yōu)先選用“音節(jié)型”縮略語還是全稱尚有待商榷。
5 еще和ещё(還)
2013-2014年俄羅斯國情咨文中共有488個單詞包含字母ё,中國政府工作報告俄文版中ё的使用次數(shù)卻為0。雖然《俄語正字法和標點符號使用規(guī)則》沒有規(guī)定政治文獻必須使用ё(劉昶君,2012:29-31),但鑒于2013-2014年俄羅斯國情咨文中未采用е取代ё,建議中國政府工作報告俄文版保留字母ё的使用,進一步縮小與俄羅斯國情咨文的用詞差異。
6 притом(況且)
單詞притом屬于連詞,可譯為“況且”、“并且”、“同時”(大俄漢詞典,2001:1784)。在2013-2014年中國政府工作報告俄文版中,該詞共出現(xiàn)28次,主要起連接作用,有時并無對應漢語譯文。然而,該詞在2013-2014年俄羅斯國情咨文中未出現(xiàn)。《俄語國家語料庫》統(tǒng)計顯示,1823-1882年,притом的使用頻率較高,但1882年起,該詞的使用頻率逐年下降,2000年時其使用頻率達到歷史新低,見圖4:
因此,建議中國政府工作報告俄文版減少притом的使用量。
7 автомобиль和автомашина(汽車)
單詞автомобиль和автомашина均可譯為“汽車”(大俄漢詞典,2001:9),但二者的使用頻率并不一致?!抖碚Z國家語料庫》統(tǒng)計顯示,автомобиль的使用頻率遠高于автомашина的使用頻率,見圖5:
在2013年俄羅斯國情咨文中,автомобиль及其變形共出現(xiàn)了3次,автомашина未出現(xiàn)。在2014年俄羅斯國情咨文中,автомобиль和автомашина均未出現(xiàn)??梢?,在2013-2014年俄羅斯國情咨文中,автомобиль的出現(xiàn)頻率高于автомашина的出現(xiàn)頻率,與《俄語國家語料庫》的統(tǒng)計結果相符。在2013-2014年中國政府工作報告俄文版中,автомашина及其變形出現(xiàn)了7次,而автомобиль僅出現(xiàn)1次。顯然,2013年和2014年中國政府工作報告俄文版中,автомашина的出現(xiàn)頻率遠高于автомобиль的出現(xiàn)頻率,與《俄語國家語料庫》的統(tǒng)計結果相悖。建議中國政府工作報告俄文版用автомобиль替代автомашина,盡量減少автомашина的使用次數(shù)。
8 либо和или(或者)
либо作連詞使用時可譯為“或”、“或者”(大俄漢詞典,2001:917),與или同義。然而,или的使用頻率遠高于либо的使用頻率,見圖6。
圖6 или和либо使用頻率
在2013-2014年俄羅斯國情咨文中,или共出現(xiàn)19次,либо作為不定代詞出現(xiàn)在каких-либо結構中僅1次,即在2013-2014年俄羅斯國情咨文中,или的使用頻率遠高于либо,與《俄語國家語料庫》的統(tǒng)計結果相符。在2013-2014年中國政府工作報告俄文版中,или的使用頻率反而低于либо的使用頻率,или僅出現(xiàn)1次,либо卻出現(xiàn)了16次,與《俄語國家語料庫》的統(tǒng)計結果相悖。為使или和либо的出現(xiàn)頻率與《俄語國家語料庫》的統(tǒng)計結果相符,建議中國政府工作報告俄文版使用или替代либо,表達“或者”含義。
綜上所述,2013-2014年俄羅斯國情咨文用詞的頻率整體略高于中國政府工作報告俄文版用詞,建議中國政府工作報告俄文版增加《俄語國家語料庫》詞頻表中最常用30 000俄語詞及其變形的使用量。具體來說,建議中國政府工作報告俄文版增加почти和около的使用頻度,減少притом的使用次數(shù),用автомобиль代替автомашина,用или而非либо表達“或者”含義并保留字母ё的使用。至于在翻譯特定詞匯時,優(yōu)先選用“音節(jié)型”縮略語還是全稱尚有待商榷。
比較中國政府工作報告俄文版和俄羅斯國情咨文中最常用30000俄語詞及其變形的使用量是本課題的階段性研究成果。高頻詞的使用很大程度上決定了譯文與目的語的接近度,高頻詞翻譯是政治文獻翻譯的基礎。
[1] Плунгян, В. А, Сичинава, Д. В. Национальный корпус русского языка: опыт создания корпуса текстов современного русского языка[A]. ЛН Беляева и др.[C]. 2004: 216-238.
[2] Sinclair,J. 1991.[M]. New York: Oxford University Press.
[3] 李劍沖. 2003. 語言學研究中的統(tǒng)計方法[J]. 內蒙古統(tǒng)計, (5): 104-105 .
[4] 劉昶君. 2012. 俄語字母ё趣議[J]. 俄語學習, (4): 29-31 .
[5] 秦穎. 2015. 翻譯質量自動評價研究綜述[J]. 計算機應用研究, (2): 326-329, 335.
[6] 唐家渝, 劉知遠, 孫茂松. 2013. 文本可視化研究綜述[J]. 計算機輔助設計與圖形學學報, (3): 273-285.
[7] 韋曉琴. 1985. 現(xiàn)代語言科學研究的有效手段—統(tǒng)計法——讀查理·繆萊的《語言統(tǒng)計學方法入門》[J]. 法國研究, (1): 82-86.
(責任編輯:呂紅周)
“中央文獻翻譯研究”專欄
主持人語(王銘玉):
翻譯研究要關注現(xiàn)實的重大問題,要走出象牙塔,發(fā)揮翻譯活動在現(xiàn)實政治經濟文化生活中的作用,認識翻譯在多元文化語境下的使命。包括中央文獻在內的外宣翻譯研究是近年來在國內新興的翻譯研究方向,并且是具有中國特色的漢譯外翻譯研究。本專欄的開設是和我國翻譯研究的發(fā)展趨勢相吻合的,也是和天津外國語大學的特色研究相吻合的。中央文獻外譯作為我國對外宣傳的重要文獻資料,主要是指黨和國家領導人的講話與著述、黨和政府的文件與工作報告、報刊社論等,它直接牽涉到國內外的重大問題和國家、民族的政治立場和觀點。這里選取的三篇文章較有代表性,分別從宏觀、中觀、微觀角度來探索中央文獻對外翻譯的問題:李多和康喆文的《中央文獻研究現(xiàn)狀的文獻計量分析(1957-2015)》一文應用文獻計量分析的方法,從宏觀角度掃描了58年來中國知網(CNKI)上關于中央文獻研究的期刊文章、碩博士論文在研究對象、研究視角等方面情況,分析了研究層面上存在的問題,并針對這些問題提出了相應的思考,具有重要的參考價值;王銘玉和劉子夜的《詞頻分析與中-俄政治文獻翻譯》一文以2013-2014年中國政府工作報告俄文版和俄羅斯國情咨文為語料,借助詞頻統(tǒng)計手段對其進行了量化分析,并提取了8個典型常用詞作為比對詞匯來研究兩種語言在同類文獻中的用詞差異現(xiàn)象,對我國政治文獻漢譯俄問題具有不可忽視的啟示意義;姜雅明和李夢雅的《中央文獻俄譯文本語句結構特征探析》一文也選取了政府工作報告俄譯本為例,但探討的卻是傳統(tǒng)句法在文獻翻譯中的體現(xiàn)問題,涉及了謂語表達方式、主客體關系、句際邏輯關系、常用固定句型等方面,得出了俄文譯本的語句結構特征及政論文本的性質特點,為語法研究與翻譯研究的融合提供了有益的范例。
H35
A
1008-665X(2016)3-0001-06
2016-01-04;
2016-02-23
國家社會科學基金重點項目“中央文獻術語外譯詞典(中英、中俄、中日)編纂的理論與應用研究”(14AYY003);天津市教委2012年度社科重大項目“中央文獻對外翻譯與傳播創(chuàng)新研究”(2012ZD040)
王銘玉,男,教授,博士,博導,研究方向:語言符號學、普通語言學、外語教學論 劉子夜,男,碩士生,研究方向:語料庫語言學