王 翊 ,張瑞娥,韓名利
(安徽科技學院 外國語學院,安徽 鳳陽 233100)
《淮南子》由淮南王劉安主持編纂,成書于西漢初年,是繼《呂氏春秋》之后黃老道家的集大成之作,其篇幅宏大、包羅廣巨,融合儒、法、墨、陰陽等諸子百家思想之長,涵蓋神話傳說、天地之理、人間之事、治國方略等諸多內容。然而相較于其他先秦諸子典籍,《淮南子》在英語世界的譯介與傳播則更顯艱難與滯后,其英譯本最早見于1884年《中國評論》(The China Review or Notes and Queries on the Far East)所刊載巴爾福(Frederic H. Balfour)的《原道訓》譯文;20世紀以來尤其是第一次世界大戰(zhàn)之后,隨著西方對道家思想的研究熱潮興起,《淮南子》英文節(jié)譯本開始陸續(xù)出現(xiàn),其中比較有影響力的有伊萬·摩根(Ivan Morgan)、本杰明·沃克(Benjamin E. Wallacker)及安樂哲(Roger T. Ames)的譯本;然而,其全譯本直至2010年方才推出,分別有美國歷史學家約翰·梅杰(John S. Major)和中國學者翟江月、牟愛鵬兩個版本。
近年來國內學者對于《淮南子》的英譯研究關注不足,為數(shù)不多的研究主要選取特定理論視角進行譯文對比,觀照其翻譯規(guī)范及策略選擇問題,如陳云會(2015)、李志強(2016)、丁立福(2016)、譚小菊(2019);對西方漢學的相關研究進行梳理介紹,如陳云會(2016)、孟慶波(2018);從出版模式、副文本設計等方面探討《淮南子》的譯介傳播路徑,如楊凱(2016)、丁立福(2019)等。鑒于現(xiàn)有研究仍以傳統(tǒng)內省式、定性研究為主,主觀性相對較強,本文嘗試以《淮南子》原文、白話譯文及現(xiàn)有兩個英文全譯版本為語料,建立“《淮南子》漢英平行語料庫”并對其應用于相關研究進行展望,旨在為《淮南子》英譯研究提供新的視角及一定的方法論借鑒。
語料庫是依據(jù)一定采樣標準收集的、能夠反映某種語言或語言變體在真實語境下使用情況的大規(guī)模電子文本集合,是對海量自然語言進行存儲、檢索、統(tǒng)計分析的資料庫。語料庫翻譯學研究濫觴于Mona Baker(1993)在“Corpus Linguistics and Tanslation Studies: Implications and Applications”一文中對相關研究理論價值、實際意義及具體路徑的探討,并于之后二十多年間不斷汲取語料庫語言學及描寫性譯學研究成果,逐漸發(fā)展為繼“語文學范式”“語言學范式”“文化范式”之后譯學研究的又一重大范式轉向。
自1995年Baker率其團隊建立首個翻譯類語料庫——TEC(Translational English Corpus)并據(jù)此展開相關譯學研究以來,國內外陸續(xù)建立了一批用于翻譯研究的語料庫,如英國蘭卡斯特大學建立的“Babel中英對應語料庫”、美國馬里蘭大學建立的“《圣經(jīng)》多語平行語料庫”、北京外國語大學建設的“中國英漢平行語料庫”、上海交通大學建設的“莎士比亞戲劇英漢平行語料庫”、燕山大學建設的“《紅樓夢》中英文平行語料庫”、天津科技大學建設的“《詩經(jīng)》多譯本平行語料庫”等?;谡Z料庫的翻譯研究涉及語料庫建設、翻譯規(guī)范、翻譯語言特點、譯者風格等眾多領域,如Olohan以“英國國家語料庫”和“翻譯英語語料庫”構成可比語料庫,探討了英語緩和詞(moderator)在原創(chuàng)文本和譯語文本中的使用頻率和搭配的差異;胡顯耀以語料庫為工具和方法對當代漢語翻譯小說的翻譯規(guī)范進行描寫分析,并結合哈貝馬斯(Habermas)的“交往行為理論”對翻譯行為的性質進行了重新闡釋;周芹芹在系統(tǒng)歸納評述國內外近20年語料庫翻譯研究基礎之上,提出了“MTI學習者翻譯語料庫”設計思路及研究路徑;胡開寶在分析譯者風格內涵與特征及梳理譯者風格研究進展和問題的基礎之上,詳細論述了語料庫應用于譯者風格研究的具體路徑。
語料庫翻譯學是對語料庫語言學及描寫性譯學的創(chuàng)造性繼承和融合,其以建成的語料庫為研究基礎,以可靠的雙語或翻譯語料為研究對象,以數(shù)據(jù)整理及實證解析為研究手段,將定量和定性方法、自下而上與自上而下的方法相結合,注重進行多層次描寫和多視角闡釋,是一種對翻譯標準、翻譯實質及翻譯過程進行解析闡釋的全新范式,相較于傳統(tǒng)的內省式、誘導式研究方法更具客觀性、科學性。
語料庫建設歷來是語料庫研究的重點議題之一,所有圍繞語料庫進行的研究都始于語料庫的構建,語料庫中語料的選擇、布局對將要開展的研究至關重要。語料庫的基本類型按其所涵蓋的語言種類及其相互關系可分為單語語料庫、雙語/多語語料庫、平行語料庫、可比語料庫、原創(chuàng)語/譯語語料庫等。鑒于應用于翻譯研究的語料庫需承載至少兩種語言并反映其對應轉換關系,雙語平行語料庫與之有著較強的契合度,是本語料庫建設所選擇的庫型,其創(chuàng)建過程主要涉及語料選擇、語料對齊、語料標記/標注、語料檢索四個方面。
《淮南子》原書共計62篇,分為內篇、中篇、外篇三部分,現(xiàn)僅有包括《原道訓》、《齊俗訓》、《道應訓》、《精神訓》、《人間訓》、《兵略訓》在內的21篇內篇存世。原文語言為古代文言文,與現(xiàn)代漢語在詞匯特點、句法結構、音韻體系、語法規(guī)范等方面大相近庭,因此對其進行英譯實際上經(jīng)歷了從古代漢語到現(xiàn)代漢語再到現(xiàn)代英語的過程,即包含語內翻譯和語際翻譯的一個“二度翻譯”的過程。有鑒于此,本語料庫建設所選語料除包括《淮南子》原文、《淮南子》英譯文之外,還將收錄《淮南子》白話譯文。
《淮南子》原文自成書至今版本眾多,較為著名的有東漢許慎所撰《淮南鴻烈閑詁》、高誘所撰《淮南子注》、北宋蘇頌所撰《?;茨献印?、明代道家天師張宇初、張宇清所撰道藏版《淮南鴻烈解》等,其中部分版本在流傳過程中已經(jīng)遺失,現(xiàn)存最早版本為清代劉履芬影抄北宋小字本《淮南鴻烈》,1920年上海商務印書館出版。此外,另有劉文典撰《淮南鴻烈集解》,1923年上海商務印書館排印本;劉家立撰《淮南內篇集證》,1924年上海中華書局出版;楊樹達撰《淮南子證聞》,1953年北京中國科學院排印本;馬宗霍撰《淮南舊注參正》,1984年齊魯書社標點排印出版;劉殿爵撰《淮南子逐字索引》,1992年香港商務印書館出版;張雙棣撰《淮南子校釋》,1997年北京大學出版社排印本;陳廣忠撰《淮南子》校點,2016年上海古籍出版社出版等。
《淮南子》英語全譯本現(xiàn)有兩個版本,分別為美國歷史學家約翰·梅杰(John S. Major)及其翻譯團隊編撰的“The
Huainanzi
:A
Guide
to
the
Theory
and
Practice
of
Government
in
Early
Han
China
”,2010年哥倫比亞大學出版社出版;中國學者翟江月、牟愛鵬所撰《淮南子》中英對照版,2010年廣西師范大學出版社出版,“大中華文庫”收錄。鑒于約翰·梅杰譯本以劉殿爵版《淮南子逐字索引》(收錄自“先秦兩漢古籍逐字索引叢刊”,1992年版)為藍本比照,故將其收入作為原文語料;翟、牟譯文為中英對照版,可直接將中文原文收入,然而此版并未對其所選原文版本進行明確說明,后期有待與作者就此進行溝通核實;翟、牟中英對照版不僅包含了《淮南子》原文,另有翟江月今譯白話文版,即意味著白話譯文與英譯文出自相同譯者,在“二度翻譯”時有利于對其進行分析描述,故將白話文版一并收入語料庫作為平行語料;此外,將以上兩個版本英文全譯文均收入作為譯文語料。
確定所選各版本語料后,即可開展中英雙語語料的錄入工作。劉殿爵版《淮南子逐字索引》、約翰·梅杰及翟、牟版全譯文均可從亞馬遜等圖書網(wǎng)站獲取紙質版,部分文本可從網(wǎng)絡獲取影印電子版。之后便可利用掃描儀、圖片文字轉換軟件等工具進行文本電子化處理,處理后的電子文本分原文、白話譯文、英譯文以unicode內碼格式存儲為txt純文本文件。在進行文本電子化的過程中難免會生成一些不合規(guī)范的文字、標點或段落標記,為保證語料的質量,先使用文本整理軟件(Text Editor)進行“文本降噪”,再輔以人工校對。
雙語平行語料庫的一個顯著特征體現(xiàn)在雙語文本間所構成的翻譯對應關系,在形式上則表現(xiàn)為雙語語料按照一定單位粒度對齊。對齊單位可分為篇章、段落、句、詞等幾個層次,單位粒度越小,所提供的語言信息就越多,應用價值也就越大。出于漢英語言差異及語料庫預期用途考量,這里對語料進行句級對齊?,F(xiàn)今用于雙語平行文本對齊的主流軟件有Tmxmall Aligner、ABBYY Aligner、ParaConc、雪人等,以翟、牟版《淮南子》第一卷《原道訓》白話文、英譯文為例,使用ABBYY Aligner進行自動對齊的結果如圖1所示:
圖1 《原道訓》漢英文本對齊結果(部分)
劉殿爵版《淮南子逐字索引》古漢語原文與約翰·梅杰版英譯文以及翟、牟版古漢語原文與英譯文也將進行匹配對齊。由于現(xiàn)有的自動對齊軟件無法支持古漢語文本,其對齊工作需人工手動進行,最終形成3個雙文本對齊文件并以tmx及txt兩種格式分別儲存。
語料收集入庫后尚屬“生文本”(Raw Text),無法有效發(fā)揮其潛在應用價值,對語料進行標記/標注是語料庫開發(fā)和增值的重要途徑。語料庫標記、標注分別指對語料文本外部信息、結構特征的記錄及對語料文本內部語言信息的附加注釋。根據(jù)語料庫的基本架構和預期用途,這里對語料進行元信息標記、語法標注、翻譯信息標注等處理。
元信息是一種用于描述和解釋信息源的結構化信息,在語料庫文本中,元信息通常用于提供語料來源、語言產出者、產出年代、語體類型等重要信息。這里使用XML語言對《淮南子》各版本及文本分章節(jié)進行簡單的層級標注,內容主要包含文本類型、書名/標題、出版社、作者、頁碼、字數(shù)、翻譯方向等信息。以翟、牟版第二卷《俶真訓》白話文-英譯文對齊后的平行文本為例,其元信息標注如圖2所示:
圖2 《俶真訓》漢英平行文本元信息標注
語法標注即依據(jù)詞性對文本進行賦碼,是句法等高級標注的基礎,已成為語料庫廣泛采用的基本標注之一。在進行詞性賦碼前需先對文本進行分詞,即進行字符-形符轉換,這里使用中科院分詞系統(tǒng)(NLPIR)在線工具進行處理,以約翰·梅杰版第二卷“Activating The Genuine”為例,詞性賦碼后的結果如圖3所示:
圖3 “Activating the Genuine” 語法標注結果(部分)
翻譯信息標注是對平行語料庫語料進行的深度加工,做法是選擇具有鮮明區(qū)別性語言特征的雙語語料,對其所采用的翻譯策略、方法、技巧等進行標注,以體現(xiàn)雙語轉換過程中所發(fā)生的文本操縱情況。目前,關于翻譯信息標注的標注原則、標注項目、標記符號等尚未有統(tǒng)一標準,這里嘗試采用朱純深、Po-Ching Yip(2010)提出的翻譯標注分類法,將翻譯信息在宏觀上分為信息組織(information organization)、信息分布(information distribution)、信息明晰(information explicitation)、信息表達(information representation)、信息再現(xiàn)(information realization)、信息重構(information reformulation)、信息及副信息(information and para-information)七大類,借鑒熊兵(2015)關于具體翻譯方法(TM translation method)、翻譯技巧(TT translation technique)的標記符號,并添加翻譯策略(TS translation strategy)標記符號,選定部分有代表性的文本進行標注,部分標記符號如表1所示:
表1 翻譯信息標記符號
現(xiàn)今學界對于翻譯信息標注的研究尚處于初期探索階段,自然語言處理(NLP)軟件亦無法實現(xiàn)自動批量處理,標注工作主要依賴人工手動,是一項長期的系統(tǒng)工程。
語料檢索是遵循一定檢索規(guī)則,對語料庫數(shù)據(jù)進行批量提取及模式化呈現(xiàn),并據(jù)此發(fā)現(xiàn)及驗證語言現(xiàn)象和語言規(guī)律的重要途徑。語料庫檢索工具可依據(jù)語言種類、檢索載體、適用范圍大致分為單/雙語、基于網(wǎng)絡/單機、通用/專用幾類,比較常用的軟件有AntConc、ParaConc、Concordance、Wordsmith Tools等,其基本功能包括關鍵詞索引(KWIC)、詞表生成(Wordlist)、詞頻統(tǒng)計(Frequency)、型符/類符統(tǒng)計(types/tokens)、搭配統(tǒng)計(Collocate)等。結合語料庫語料性質和各檢索軟件的特點,這里選擇ParaConc作為檢索工具,該軟件為雙語、單機、通用型,對平行語料庫兼容度較高,支持利用通配符和正則表達式進行批量檢索,并將檢索結果以純文本形式存儲。
本語料庫包含《淮南子》原文、白話譯文及兩種英譯文,承載英漢兩種語言并反映其相互對應關系,屬于雙語平行語料庫,與語言對比及翻譯研究有著天然的內在聯(lián)系,其具體應用主要有以下幾個方面:
翻譯策略及方法歷來是翻譯研究重點關注的議題之一,對于《淮南子》的英譯策略方法已有學者進行了一些探究。然而,傳統(tǒng)的研究路徑多是自上而下式,即在某一特定翻譯理論觀照下預設一些翻譯策略和方法再加以實例佐證,這就較為容易陷入自說自話的境地,且若不能充分舉證,又難免有以偏概全之嫌?;谡Z料庫/語料庫驅動的翻譯策略和方法研究將自上而下和自下而上的方法相結合,以充分、真實的雙語語料為基礎,對文本字/詞數(shù)、句數(shù)、詞/句長、詞頻、形/類符等數(shù)據(jù)進行統(tǒng)計分析,依據(jù)分析結果對譯者所采用的翻譯策略及方法進行描述歸納并嘗試對其成因做出解釋,更具邏輯性、客觀性。
語料庫翻譯學將譯語文本視為譯入語的翻譯語言變體,肯定其在譯入語文化中的地位和作用,關注譯語本身所具有的特點及獨創(chuàng)性。翻譯語言特征可分為翻譯共性特征和具體語言對翻譯語言特征兩類,前者主要關注翻譯文本中所普遍存在的規(guī)律性特征,后者則關注具體語言由于受原語、目的語影響在詞匯、句法和篇章層面所體現(xiàn)出的特點。語料庫建成后,可借助一些具有可比性的語料庫作為參照庫,嘗試從詞匯、句法結構特征、主題詞及搭配、語義韻及搭配等方面入手,對《淮南子》兩個英文全譯本的翻譯語言特征進行探究。
語料庫翻譯學對于翻譯規(guī)范的研究承襲自描寫性譯學,后者將翻譯活動視作一種特定的社會行為,而翻譯規(guī)范則是社會共享價值觀念對于此種社會行為的制約,體現(xiàn)為譯者在特定時期、特定社會文化環(huán)境下所做出的規(guī)律性、習慣性選擇,這也使得譯本往往會呈現(xiàn)出一些具有某種傾向性的語言特征。基于《淮南子》漢英平行語料庫,選取一批同時期產生的原創(chuàng)文本作為參照語料,以形/類符比、詞性分布、平均句長、語義信息強度等要素為變量考察譯本的翻譯共性特征,進而對該時期的翻譯規(guī)范進行假設、證實/偽、重構,并嘗試從特定理論視域探索該翻譯規(guī)范的成因。
語料庫方法應用于譯學研究衍生出了語料庫翻譯學這一新的研究范式。作為對語言學范式及文化范式的批判性繼承,語料庫翻譯學將對于翻譯語言特征及相關翻譯事實/現(xiàn)象的考查置于語言學詮釋及社會文化因素互動關系研究的雙重視域下,以大量真實語料為依據(jù),借助自然語言處理、信息檢索等技術手段,系統(tǒng)分析考察翻譯現(xiàn)象及其內在規(guī)律,其定量、定性相結合的方法增強了相關研究的客觀性、科學性。
鑒于目前學界對于《淮南子》英譯研究關注不足且定量視角缺乏,本研究擬選取劉殿爵版《淮南子逐字索引》古漢語原文和翟、牟版古漢語原文及現(xiàn)代漢語譯文,約翰·梅杰版及翟、牟版英譯文為語料構建雙語平行語料庫,實現(xiàn)了文本的句級對齊、元信息標注及詞性賦碼,并嘗試進行翻譯信息標注等深加工處理,語料庫建成后預計可用于《淮南子》英譯策略及方法研究、翻譯語言特征研究、翻譯規(guī)范研究等譯學領域。相較于以往以內省、定性為主的研究,集描寫、闡釋為一體的語料庫方法可以為相關研究提供更為豐富的視角和路徑,以期能夠為《淮南子》英譯及中華典籍外譯研究提供一定的方法論借鑒。