華東師范大學 趙朝永
提 要: 語域特征是文本的一種重要屬性,譯本的語域變異由此成為譯者風格描寫的有效參照。多維分析法(MF /MD)能有效識別譯本的語域類屬并在不同語域維度上描寫其傾向性特征,因此可用于對比基于同一原作的多譯本語域特征,以考察不同譯本的語域變異情況。譯本語域維度差異及參與計算的因子差異均可作為譯者風格的綜合考察指標,其聚類共現(xiàn)能夠反映出譯者各自的語言風格乃至翻譯策略。多維分析對譯本語域特征描寫和譯者風格考察均具重要意義。
譯者風格研究是語料庫翻譯學的核心課題之一。近年來,得益于語料庫語言學和語料庫翻譯學在理論探究、工具研發(fā)和范式創(chuàng)新上的成就,基于語料庫的譯者風格研究取得了長足進展(胡開寶、謝麗欣,2017;黃立波,2018)?;谕辉鞯亩嘧g本對比已成為考察譯者風格差異、揭示并解釋譯介規(guī)律的有效手段。經(jīng)典文學作品的多譯本對比成果尤為顯著,如基于語料庫的《紅樓夢》霍、楊兩譯本對比(馮慶華,2008)、邦、霍、楊三譯本對比(趙朝永,2014、2020b)以及喬、邦、霍、楊四譯本對比(劉澤權(quán)、劉超鵬、朱虹,2011;趙朝永,2019)等。此外,董琇(2016)從詞語、句子、篇章和文化四個層面對比《三國演義》羅慕士、鄧羅兩譯本的譯者風格,黃立波(2014)則借助語料庫考察了《駱駝祥子》三個英譯本中敘述話語翻譯的譯者風格差異。上述研究多從詞匯、句法、語義和語篇等層面,通過“一本多譯”的比照,對語料庫譯者風格和翻譯語言特征描寫進行了卓有成效的探索,但其不足之處也顯而易見。語料庫譯者風格研究大多滿足于對局部譯者風格具體表象的描述,未對譯者風格進行整體上的歸納(胡開寶、謝麗欣,2017: 16)。顯然,局部風格并不等同于整體風格,多個指標的聚類有助于對譯者風格進行更為系統(tǒng)的描寫。當前國內(nèi)語料庫翻譯學的翻譯風格研究過于注重淺層語言特征的描寫,多維分析的復雜統(tǒng)計方法使用較少(許家金,2018: 8),未來研究亟待新視野、新方法的引介。
譯者風格研究是翻譯文體研究的一個側(cè)面,從歷時角度看,其大體經(jīng)歷了修辭文體觀、語言文體觀、敘事文體觀和語料庫文體觀四個階段的變化(黃立波,2014)。每一種文體觀的變化也伴隨著理論視角、研究范式和研究手段的變革。自Baker(2000)率先提出譯者風格的語料庫研究方法后,基于語料庫的譯者風格研究迅速發(fā)展,較有代表性的研究有Olohan(2003)、Bosseuax(2004)、Winters(2009)、劉澤權(quán)、閆繼苗(2010)、黃立波、朱志瑜(2012)、黃立波(2014)等。基于語料庫的譯者風格研究可分為類比模式和平行模式兩大類(黃立波,2018: 79),前者側(cè)重于某一譯者翻譯作品在整體上與另一譯者同類翻譯作品的差異(如Baker,2000;黃立波、朱志瑜,2012),后者則重在關(guān)注不同譯者對同一部源文本的同一目標語中的處理差異,也即“一本多譯”或“多譯本”研究,以考察譯者對源文本中不同語言特征的規(guī)律性處理方式(如Bosseuax, 2004; Winters, 2009;劉澤權(quán)、劉超鵬、朱虹,2011;黃立波,2014;趙朝永,2020b)。此外,譯者風格降維法分析(董琇,2014)也是對譯者風格量化考察的有益探索。需指出的是,類比模式所考察的語言特征雖在一定時期具有穩(wěn)定性,但同時也容易受到源語文本的影響,拋開源語的對比存在一定缺陷,因此同一原作的不同譯本能夠更有效地反應譯者風格差異。
基于語料庫的譯者風格本對比既有借助單一指標的多譯本局部對比,如報道動詞(劉澤權(quán)、閆繼苗,2010;趙朝永,2014)、“被”字句(胡開寶,2011: 116-121)與敘述話語(黃立波,2014)等,也有融合不同指標的多譯本綜合對比(如劉澤權(quán)、劉超鵬、朱虹,2011;趙朝永,2020b)。這兩種模式均較多使用詞匯量、詞匯密度、句子難度等某一種或多種語言手段進行對比描寫。基于語料庫的譯者風格描寫已取得有效進展,語料庫規(guī)模越來越大,分析指標越來越多,跨學科屬性越來越明顯。然而,譯者風格并不等于若干局部風格的簡單相加,因此譯者風格研究更應當強調(diào)總體風格研究(global style),而不是局部風格(local style)考察。此外,基于語料庫的譯者風格對比不應局限于平均詞長、平均句長、標準化類-形比等傳統(tǒng)形式參數(shù)統(tǒng)計,而應當拓寬思路,向語義、語用、社會-文化等參數(shù)及認知語言學等視角(金勝昔、林正軍,2016)拓展。同時,需借鑒語料庫文體學、計量語言學、計算語言學等相鄰領(lǐng)域的研究方法,拓寬翻譯文體或風格研究的范圍,使這一研究課題的方法論更加科學化和系統(tǒng)化(黃立波,2018: 77)。因此,當前研究的局限性不言而喻: 第一,計量指標相對單一,且僅關(guān)注譯者風格某一側(cè)面的描寫;第二,統(tǒng)計指標之間缺乏關(guān)聯(lián)性,聚類程度較低,缺乏多維度的定量與定性有機結(jié)合;第三,多重視原文參照,對參照目標語規(guī)范的語域變異缺乏重視。
Biber(1988)創(chuàng)立的多維分析法(Multidimensional Analysis,以下簡稱“多維分析”)可有效區(qū)分文本的語域(1)關(guān)于“語域”這一術(shù)語,英文中有對應的近義詞style、genre、register,中文有“語體”“體裁”“語類”等,學界尚未就此形成統(tǒng)一認識。為避免術(shù)語混淆,本文暫不做區(qū)分,統(tǒng)一采用“語域”這一術(shù)語。多維分析法旨在探究“語域變異”(register variation),這也是文本采取該術(shù)語的另一原因。及語域子類,是文本語域特征對比的有效手段。多維分析的核心概念是語言特征的共現(xiàn),即不同的共現(xiàn)模式可表征不同的潛在語域變異維度。自問世以來,多維分析受到學界一致認可,已成為語料庫語言學界話語分析的代表性方法之一(江進林、許家金,2015)。自創(chuàng)立以來,多維分析已被用作比較口語與筆語語域特征差異(Biber, 1988; Van Rooy, 2008)、小說、論文、私人信函(Biber & Finegan, 1989)、對話、演講和學術(shù)文章(McEneryetal., 2006)、法律英語(Asgharetal., 2018)等體裁。受其影響,國內(nèi)學者借助多維分析開展實證研究,范圍涉及學術(shù)語篇(雷秀云、楊惠中,2001;武姜生,2001)、中外科技論文摘要(曹雁、肖中華,2015)、商務(wù)英語(江進林、許家金,2015)、學習者書面語體(潘璠,2012;趙朝永、王文斌,2017)、漢語語體變異(劉艷春,2019)以及翻譯語域特征(胡顯耀,2010;趙朝永,2020a)等,多維分析已成為區(qū)別語域特征的有效手段。多維分析法不僅避免了以往單一或少數(shù)幾個語言特征可能引起的語體分析的偏頗,也實現(xiàn)了定性與定量的有效結(jié)合(劉艷春,2019: 100)。
如上所述,基于語料庫的譯者風格對比雖已逐漸走向深入,但依然存在指標單一、描寫片面、重定量輕定性及缺乏對目標語語域規(guī)范的參照等局限。因此,譯者風格研究只有采用更為科學的計量工具和方法,才能實現(xiàn)研究手段的科學化和研究結(jié)果的可靠性(韓紅建、蔣躍、袁小陸,2019: 91)。黃立波(2018: 80)將譯者風格描寫概括為三個視角: 翻譯學視角、敘事文體學視角和計量語言學視角,根據(jù)Biber(1988)所設(shè)立的多維分析是上述三種類別的綜合,能有效避免傳統(tǒng)研究不足,對譯者風格進行更為系統(tǒng)、綜合、立體的描寫。
1) 基本理念
Biber(1988)基于英語口語語料庫(LLC, London Lund Corpus)和英語書面語語料庫(LOB,Lancaster-Oslo-Bergen),通過兩組文本的67個語言特征(如時態(tài)、體態(tài)、情態(tài)、詞性、疑問句等等),考察了口語與書面語及其10多個子語域的區(qū)別性特征。Biber的MDA分析工具首先自動識別并統(tǒng)計出67個語言特征的頻數(shù)及每千詞標準化頻率,然后根據(jù)其在相應語域中的共現(xiàn)情況歸納為7個維度(2)維度1為交互性與信息性(involved versus informational production);維度2為敘述性與非敘述性(narrative versus situation-narrative reference);維度3為情境獨立與情境依賴(explicit versus situation-dependent reference);維度4為顯性勸誘表述(overt expression of persuasion);維度5為信息抽象與具體程度(abstract versus non-abstract information);維度6為即席信息組織精細度(online information elaboration);維度7為學術(shù)性模糊表達(academic hedging)。。各維度一般具有兩種值,正負值表達的文本特征相反,起到區(qū)別文本特征的作用。如,維度1中的正特征因子得分越高,表明文本互動性越強,反之則文本信息性越強。維度2上的正特征因子得分越高,表示文本具有較強敘述性,反之亦然。由于維度7數(shù)據(jù)較少,其形成的維度與其余6個維度不具有可比性,在實際操作中通常舍棄。
2) 分析工具
Nini(2015)開發(fā)的多維標注與分析工具Multidimensional Analysis Tagger 1.3.1(以下簡稱MAT)復制了Biber(1988)多維分析模型,可對文本進行自動標注、特征提取和數(shù)據(jù)統(tǒng)計,并參照Biber(1989)判斷出文本的語域類型。該工具運行要求在Windows操作系統(tǒng)下運行,須有Java環(huán)境。MAT與McEneryetal.(2006)提供的多維分析程序包不同,它使用了Biber(1988,1989)的67個語言特征和6個功能維度,且通過內(nèi)嵌的“斯坦福詞性賦碼器”(Stanford POS Tagger)進行詞性賦碼。通過比較Nini(2015)和Biber(1988)兩種方法所得的分析結(jié)果,證實了MAT可以有效復制Biber(1988)所提出的所謂分析全過程。而McEneryetal.(2006)的程序包只能提取58個語言特征,其詞性賦碼工具也與Biber(1988)不同,因此兩者的研究結(jié)論在可比性上存在一定差距。
3) 操作步驟
武姜生(2001)曾對Biber(1988)的多維分析法有過詳細介紹,此不贅述。以下著重介紹采用Nini(2015)MAT多維分析軟件進行多譯本語域變異分析的基本步驟。
(1) 創(chuàng)建語料庫
MAT軟件僅接受純文本格式(ANSI與UTF-8均可),若文本格式不兼容,處理過程中會報錯。文本的識別、整理和降噪方法可參照梁茂成、李文中、許家金(2010)。譯文文本以每個獨立的章節(jié)為單位,單獨保存,整體形成一組文本,以便于后續(xù)對組數(shù)據(jù)進行顯著性檢驗與回歸分析。
(2) 語料的自動標注、特征提取和語域特征計算
MAT軟件可先標注再分析,也可一步完成。自動處理完數(shù)據(jù)后,MAT提供了以下基礎(chǔ)統(tǒng)計數(shù)據(jù): ① 以“Corpus_Statistics.txt”命名的所有因子原始頻次信息;② 以“Zscores.txt”命名的頻數(shù)標準分(Z分數(shù));③ 以“Dimensions.txt”命名的各文本維度分數(shù)(經(jīng)過標準化處理的Z分數(shù));④ 標記文本維度趨向的幾張圖表,標識出與當前文本最接近的語域趨向。更為詳盡的操作步驟可參見Nini(2015)MAT軟件的操作手冊2—4頁。
(3) 語域維度的呈現(xiàn)與解釋
MAT對語域維度的描寫以分析語言特征的“共現(xiàn)”模式為基礎(chǔ)。多維分析利用統(tǒng)計學上的因子分析(factor analysis)來推斷語域維度和共現(xiàn)特征。因子分析是一種多元統(tǒng)計方法,可將眾多的語言特征變量通過聚類,合并為某一公共因子,即MAT分析中所要呈現(xiàn)的6個“維度”。每個維度與其下屬語言特征的相關(guān)性表現(xiàn)為各語言特征在此項因子上的因子負荷(factor loading)。因子負荷超過 0.35 以上的“顯性” 語言特征可視為具有共現(xiàn)關(guān)系。以第1維度“交互性與信息性”為例,其部分共現(xiàn)語言特征見表1。
表1.維度1部分共現(xiàn)因子及因子負荷
維度1上共有34個因子參與計算,其中正值因子25個,負值因子9個。對于部分參與多個維度計算的因子,當其在其他維度上的負荷大于本維度時,將不再參與本維度的計算。維度1上共有6個因子(如條件狀語從句、地點狀語、無施動標記被動句等)在其他維度上的負荷高于本維度,因此被排除在外。此外,Nini(2015)僅采用Biber(1988: 77)Z分數(shù)均值高于1的因子,因此維度1上實際參與計算的因子僅有24個。由表1可知,因子負荷為負值的語言特征意義比較明顯。名詞、介詞、詞長、類符與形符比等特征具有信息含量高、表達準確的特點,在以傳達信息為主的語篇(如說明性文章)中有著較高的分布頻率,而較少出現(xiàn)在以人際功能為主的口語文本中。負荷值為正值的語言特征如第二人稱代詞、動詞的現(xiàn)在時態(tài)以及私動詞等。這些特征體現(xiàn)了語篇人際功能的交互性,情感性等屬性,在語域中的分布規(guī)律與上述負荷值為負的語言特征正好相反,即兩者呈互補分布。因此,維度1代表了人際交流功能與信息傳達功能的對比。其余維度因子的共現(xiàn)可參見Biber(1988)第6章,此不贅述。
(4) 語域變異分析
根據(jù)MAT匯報的維度分數(shù)可對文本語域進行多維度的比較分析,即可描寫各個維向的功能意義,也可按照維度分數(shù)的差異比較不同文本語域在各維度上的差異,具體可參見Biber(1988)第7章。
(5) 顯著性檢驗及相關(guān)性分析
語域變異的對比分析需借助SPSS統(tǒng)計分析軟件對MAT報告的維度分與Z值進行顯著性檢驗,并通過多元線性回歸確定影響每個維度語域變異的共現(xiàn)因子,以深入挖掘所有67個語言因子的“共變”信息,從而更加綜合、系統(tǒng)地判斷導致文本語域變異的因素。線性回歸對于多譯本對比尤為重要,是發(fā)現(xiàn)及解釋譯者風格差異的一種有效手段。
我們選取經(jīng)典文學作品《金瓶梅》的三個英文譯本(埃杰頓譯本、奧米爾譯本和芮效衛(wèi)譯本,以下分別簡稱“埃譯本”“米譯本”“芮譯本”)作為案例,借助Nini(2015)MAT軟件對譯本進行多維分析,以進一步展現(xiàn)多維分析法對多譯本風格對比描寫的有效性。關(guān)于兩譯本和四譯本的對比范式,可參照趙朝永(2019,2020a)。
1) 語料情況
語料由埃譯本、米譯本、芮譯本三部分組成,其中埃譯本、芮譯本為100回全譯本,米譯本為節(jié)譯本,僅有49回。三譯本均按自然章節(jié)切分為多個文本,語料詳情如下。
表2.語料庫構(gòu)成(3)本文在趙朝永(2020a)基礎(chǔ)上,再次對埃譯本和芮譯本的語料進行整理與校核,對可能引起統(tǒng)計誤差的個別專有名詞拼寫方法做了統(tǒng)一處理,以最大程度較少誤差。因此,文本個別統(tǒng)計數(shù)據(jù)較之前文有微調(diào),但兩個譯本整體語域特征、維度傾向及譯本間的維度差異均保持不變。
2) 譯本維度趨向
根據(jù)MAT軟件匯報的維度分數(shù),可將三譯本的維度差異轉(zhuǎn)換為圖表(見圖1),限于篇幅,軟件匯報的維度趨向圖從略。埃譯本被歸入“虛構(gòu)性敘述”(Imaginative Narrative)語域,而米譯本和芮譯本均被歸入“普通敘述說明”(general narrative exposition)語域,前者主要包括“愛情小說、普通小說、懸疑小說”等子類;后者則通常包括“新聞報道、評論、傳記”等子類,所涵蓋文本帶有非文學色彩。
圖1.《金瓶梅》三譯本語域維度差異
3) 譯本維度差異對比
我們使用SPSS軟件對三個譯本的維度分數(shù)進行方差分析(2個譯本對比可使用獨立樣本T檢驗)。結(jié)果顯示,三者在維度1上呈現(xiàn)出明顯差異,埃譯本信息性弱但交互性強,而米譯本與芮譯本均為信息性強于交互性的文本,且二者的信息性程度無顯著差異。在維度2上,三者均呈現(xiàn)出較強的敘述性,這符合其作為小說的語域特征。其中,埃譯本的敘述性相對最強,芮譯本與米譯本依序次之。在維度3上,埃譯本與芮譯本表現(xiàn)出情境獨立特征,而米譯本則傾向于情境依賴。在維度4上,三者均展現(xiàn)出顯性勸說特征,這與文本中存在大量對話有一定關(guān)系,該特征為所有小說文本所共有,但三者顯性勸誘的程度不同,由高到低依次為埃譯本、芮譯本和米譯本。在維度5上,芮譯本和米譯本表現(xiàn)出較高的信息抽象程度,埃譯本則表現(xiàn)出較高的信息具體程度。從維度6上的數(shù)據(jù)可知,三者表現(xiàn)出較低的即席信息組織精細度,其中米譯本相對高于另外兩個譯本,而埃譯本和芮譯本之間不存在區(qū)別。
表3.《金瓶梅》三個英譯本語域維度差異分析
4) 單一維度內(nèi)影響因子回歸分析
為進一步考察參與維度計算的因子之間的“共變”情況,我們借助SPSS軟件對每個維度對應的變量進行了逐步回歸,以確定三組文本在3個具有顯著差異維度上的影響因子。限于篇幅,僅選取米譯本的維度1作為案例。維度1上共有34個變量,其旨在區(qū)分文本的交互性與信息性。結(jié)果顯示,米譯本共有24個變量進入回歸方程,其中預測強度最佳的5個變量為“名詞(不含名詞化及動名詞)(NN)”“現(xiàn)在時(VPRT)”“類符 /形符比(TTR)”“平均詞長(AWL)”及“私動詞(PRIV)”。
表4.維度1逐步回歸模型整體效果參數(shù)表
表5.米譯本維度1逐步回歸系數(shù)表
由表4、表5可知,米譯本前5個變量對維度1具有良好的預測作用(R2=0.955),即五個變量的“共現(xiàn)”能解釋該維度95.5%的變異。表4顯示,“現(xiàn)在時”與“私動詞”回歸系數(shù)為正值,“名詞(不含名詞化及動名詞)”“類符 /形符比”與“平均詞長”回歸系數(shù)為負值,其標準化回歸方程為: 維度1=-2.641*NN + 5.597*VPRT-1.255*TTR-3.899* AWL + 2.511*PRIV。這表明米譯本傾向于較少使用“現(xiàn)在時”“私動詞”這類體現(xiàn)交互性的詞,而較多使用體現(xiàn)信息性的“名詞(不含名詞化及動名詞)”“類符 /形符比”與“平均詞長”。這一結(jié)果反映出米譯本信息性較強,結(jié)合原文的語體特征可知,譯本相對偏離了小說文本應有的交互性特征,呈現(xiàn)出“敘述說明”的特點。
需指出的是,除上述單一維度共現(xiàn)因子的回歸分析外,還可將參與維度分計算的所有67個因子設(shè)為回歸的變量,在更大范圍內(nèi)觀察本維度以外因子的“共變”情況,以充分利用和挖掘數(shù)據(jù)。韓紅建、蔣躍、袁小陸(2019: 91)指出,文本數(shù)據(jù)挖掘、計量風格學、計算語言學和計量語言學領(lǐng)域的一些成熟算法在國內(nèi)外語料庫語言學和翻譯界尚未發(fā)揮大的作用。多維分析呈現(xiàn)的多種數(shù)據(jù)信息更是如此,有待研究者根據(jù)研究目的和文本特點進行充分利用。
5) 譯本維度差異影響因子整體分析
為進一步呈現(xiàn)兩譯本差異,還可通過獨立樣本t檢驗,兩兩對比參與語域維度計算的67項語言因子。由于埃譯本和米譯本同年問世,且譯者均為英國人,可比性較強,我們檢驗了參與其維度計算的67個語言特征。結(jié)果顯示,二者具有顯著差異的因子多達53個(79.1%)。限于篇幅,下表僅列出差異較大的前15個因子(見表6)。
表6.埃譯本與米譯本差異最大的15個語言因子
結(jié)合前文分析可知,埃譯本交互性和敘事性特征更明顯,信息具體程度高,情境獨立程度高,勸誘特征明顯,相對更符合小說文本的體裁特征,且傾向于通過更為簡明、生動的語言展現(xiàn)原文情節(jié),具體表現(xiàn)為更多使用特殊疑問句、一般過去時、公動詞及表強化的副詞等(趙朝永,2020: 291)。米譯本信息性強,解釋說明特征更為明顯,信息抽象程度高,傾向于通過更為抽象的信息轉(zhuǎn)釋原文的語言與文化,具體表現(xiàn)為多使用非限定性定語從句、多去分詞做獨立小句、各類狀語從句、并列成分以及較高的詞匯密度等。因此,總體而言,米譯本已相對偏離小說文本的體裁特征,出現(xiàn)了語域變異。需指出的是,上述差異的產(chǎn)生同譯者的翻譯目的、對待源語文化的態(tài)度及整體翻譯策略息息相關(guān)。埃杰頓以尋找心理學研究材料為目的,重在呈現(xiàn)原作的“故事性”,并不關(guān)注源語文化內(nèi)涵的傳遞,其據(jù)此制定了將原作向目標語文體規(guī)范靠攏的策略,其譯本由此更加符合小說文本的語域特征。米奧爾譯本的目標群體是受過教育的讀者,整體風格偏正式,且由于是節(jié)譯本,概括性較強,其譯文因而更較強的信息性和抽象性,而交互性與敘述性則相對較弱。由此可見,譯本語域特征是譯者翻譯風格乃至譯者主體性的綜合體現(xiàn)。
基于語料庫的多譯本語域變異多維分析是一種涉及類比-平行、語際-語內(nèi)的綜合分析模式。多維分析能有效區(qū)分文本的語域變異情況,且能夠?qū)⒂绊懳谋菊Z域差異的語言因素一一展現(xiàn)出來,這一方法對多譯本風格的定量對比與定性分析均具有重要意義。多維分析方法使譯者風格描寫從靜態(tài)轉(zhuǎn)向多譯本之間動態(tài)對比,從局部描寫轉(zhuǎn)向整體考察,從相對于源語的譯語風格,轉(zhuǎn)向進入目標語參照系統(tǒng)后的語域變異考察。限于篇幅,本文僅側(cè)重介紹基于MAT的多維分析操作,對于造成譯本在不同語域維度的具體差異及動因,仍需根據(jù)研究目的結(jié)合定性分析深入探究。多譯本語域變異對比是參照目標語的語域?qū)ψg本進行描寫,而對語域變異的動因分析則需回溯原文,并將影響譯者風格的內(nèi)部主體性因素(如譯者翻譯動機、目的、對待源語文化和原作的態(tài)度、個性特征等)及外部客觀因素(如時代背景、贊助人、合作人、詩學等)。就此,我們將另文探討。