朱明慧
(上海大學,上海 201900)
近年來,隨著語言學的各分支學科的不斷深入發(fā)展,同時也得益于計算機科學的飛速發(fā)展以及統(tǒng)計分析方法的日益完善,定量分析研究逐漸引起學界的廣泛重視,成為對比語言學研究的一種趨勢。而在定量對比研究中,基于語料庫的研究方法是最常用的方法之一。許余龍(2009)[1]在對第五屆國際對比語言學大會的述評中指出,大會的宣讀論文中有60.2%的英語論文選擇使用語料庫的研究手段,并以此為主要依據(jù)進行深入探討。
然而,我國的對比語言學研究尚存在一些不足。王文斌(2019)[2]以近70年內國內漢英對比語言學研究為對象,對其展開了系統(tǒng)的梳理和總結,強調了多年來我國英漢語言對比研究成績顯著,問題亦不少。在研究方法層面,他指出,目前的研究大多在思辨層面,即使有些實證研究,也通常是一些數(shù)據(jù)羅列,尚未充分借用語料庫對某些語言現(xiàn)象進行較為系統(tǒng)而全面的描述。同時,在語言對比研究方面,中國學者國際化意識不足。
因此,文章著眼于定量對比分析中較為常用的基于語料庫的研究方法,從對比語言學國際領先期刊Languages in Contrast選取了3篇關于英漢對比的英語文章,從國內外國語言類核心期刊選取了2篇漢語文章,對英漢語言對比領域的主要研究方法進行綜述。文章擬從對比研究的主要類型、研究設計和在數(shù)據(jù)統(tǒng)計分析過程進行初步探討,進而對英漢語言對比研究方法得出較為清晰的認識,力求對國內學者進行英漢語言的對比提供研究方法上的建議。
文章共收錄文章5篇,其中3篇英文文章來自Languages in Contrast,兩篇漢語期刊分別來自《解放軍外國語學院學報》和《外國語》。Languages in Contrast是由同行評審的對比語言學學術期刊。期刊著重于對兩種或兩種以上的語言進行對比研究,范圍包含理論語言學與應用語言學的所有分支,是對比語言學領域最為權威的國際期刊之一。同時,《解放軍外國語學院學報》和《外國語》也屬于國內外語類的權威期刊,是國內學者交流學術熱點的重要陣地。
在定量對比研究中,研究的主要類型、研究設計以及數(shù)據(jù)統(tǒng)計分析過程是十分重要的部分。
許余龍(2001)[3]提出,根據(jù)語言對比研究的特點,可以將實證性定量對比研究分為定量篇章對比分析研究、語言對比調查研究和語言對比實驗研究。文章所涵蓋的5篇文章均屬于定量篇章對比分析研究范疇。定量篇章對比分析研究主要是在對兩種語言的篇章進行對比分析的基礎上,研究兩種語言中兩個相對應的語言系統(tǒng)或項目在使用數(shù)量、分布和用法方面的異同和特點。
McEnery和Xiao(2006)[4]利用4個獨立的語料庫,即英語、漢語書面語語料庫及英語、漢語口語語料庫,從被動語態(tài)的長短、語義層面、語用特征、句法功能以及體裁類型方面,對英漢語言中的被動語態(tài)的使用頻率進行了全面的對比,探討了兩者在被動語態(tài)使用的異同,也解釋了兩者產(chǎn)生差異的原因。
Boulin(2017)[5]利用由小說文本組成的英漢雙語平行語料庫,每種語言約268000字(不包括翻譯文本),探討了英漢語中的指示副詞now和“現(xiàn)在”的使用頻率、語義范圍和語用功能異同。
Xiao(2011)[6]利用三個平衡類比語料庫,囊括英語、漢語以及對應英語翻譯,對英漢語中詞叢和重復話語標記的出現(xiàn)頻次和使用場景的異同,為英漢互譯提供策略上的建議。
吳格奇(2013)[7]以英文和漢語學術論文作者如何通過自稱建構身份為研究目標,利用自建語料庫進行了詳細的對比分析。語料庫包括90篇基于實驗或語料的實證性研究的英、漢語期刊論文,對論文作者在自稱時使用的第一人稱代詞和第三人稱名詞進行統(tǒng)計,探討了英漢論文作者身份構建方式的異同。
許文勝(2011)[8]借助“英漢文學名著語料庫”,以語言類型學為切入點,在文本采樣的基礎上,運用檢索軟件對英漢兩種語言的連詞使用情況展開考查,對英語和漢語這兩種語言系統(tǒng)在各方面使用的差異和相同之處,包括連詞的使用數(shù)量、分布及用法方面。同時,也考查英漢兩種語言由翻譯對譯入語造成的潛在影響。
定量研究設計的基本原則是控制差異,這一原則與對比研究的基本原則一致,其目的是確保對比研究建立在某一共同基礎上。本部分將以選取的5篇以定量篇章對比分析研究為主的文章為例,來探討其研究設計以及討論其設計的合理性。
一種語言內部可以有多種類型的不同語言變體。在定量語言對比研究中,只有控制語言變體和其他方面的不同而帶來的差異,才能觀察和說明所研究的語言之間的差異。在探討定量研究設計中如何控制差異時,維爾斯曼(1997)[9]認為,有如下四種控制差異的基本方法:隨機化、保持因子不變、設定自變量因子以及統(tǒng)計調節(jié)。
在5篇論文中,控制差異的主要方法是保持條件或因素不變,縮小變量的變化范圍。例如,Boulin(2017)[5]所采用的語料庫是由現(xiàn)代小說文本組成的平行雙向翻譯語料。英語的語料選自于若干外國作家的代表作品(Brown,2003[10];Rowling,2007[11])。漢語的語料選自于中國臺灣作家鐘文音(2012)的《艷歌行》[12]、吳明益(2013)的《復眼人》[13]以及巴代(2007)的《女巫笛鸛》[14]。所選取的語料均為相似的文學文本,同時語料字數(shù)也相似,以考察now和“現(xiàn)在”的使用異同。使用這種方法的好處在于保持了問題會影響研究結果的因子保持恒定不變。許文勝(2015)[8]也是采用研究文學作品的方法來縮小變量的變化范圍。語料來源為18部英美小說及其譯本、26篇現(xiàn)代漢語小說、《紅樓夢》及其兩個英譯本。研究的文本為從語料庫中選擇的著名作家及其代表作,以及在學界具有一定影響力的翻譯作品。吳格奇(2013)[7]的研究對象為學術論文,自建的語料庫中涵蓋了90篇期刊論文,英漢論文的數(shù)量相等,各45篇。為了控制差異,選取的所有論文都是獨立作者展開的實證性研究。
采用保持因子不變的方法可以較為深入地研究語言之間某一文體中的差異,然而,研究結果的有效性也因此受到了限制。在所列舉的例子中,英漢兩種語言的差別不再能反映兩種語言的整體差別,而只能反映兩種語言在某一種文體中的使用差別。
在控制差異時,設定自變量因子也是一種可行的方法。如果既要看語言之間的差異,又要研究語言內部不同問題之間是否存在差異,可以采用設定自變量因子的方法。例如,McEnery和Xiao(2006)[4]所選取的語料涵蓋15種不同的體裁,包括冒險小說、科幻類小說、新聞報道等類型,以語料的體裁設定為自變量因子,分別統(tǒng)計英漢被動語態(tài)在各種體裁中的使用量。
Xiao(2011)[6]也采用了類似的語料,但不同的是,筆者采用了雙向翻譯對等語料,在部分研究設計中把文類設定為自變量因子,將英語原文語料與對應的漢語譯文語料進行對比。對體裁這一因子的處理,則采用保持因子不變的方法,在統(tǒng)計的時候選用某一類型作為分析的單一體裁語料。
控制差異的最后一種方法是統(tǒng)計調節(jié),這一方法通過對統(tǒng)計數(shù)據(jù)進行處理來控制差異,消除控制變量的影響。例如,許文勝(2015)[8]在統(tǒng)計數(shù)據(jù)是采用每百句和每千詞(字)中連詞頻率作為參數(shù)。McEnery和Xiao(2006)[4]在對英語文本中被動語態(tài)的使用進行統(tǒng)計時,為保證頻率統(tǒng)計的可比性,數(shù)據(jù)只包括由be/get后面緊跟實義動詞的過去分詞形式的結構,排除了get用作使役動詞的情況。同時筆者不僅將各語料庫的頻率進行了統(tǒng)計,也將每100000詞(字)的被動語態(tài)使用情況作為參數(shù)。
在進行定量對比研究的數(shù)據(jù)統(tǒng)計分析時,極為重要的一點是必須對數(shù)據(jù)反映什么樣的語言事實有一個清楚的認識,從而確定數(shù)據(jù)之間的可比性。
McEnery和Xiao(2006)[4]進行了多項數(shù)據(jù)的對比,包括在語料庫中英、漢語被動語態(tài)各自的使用頻率,有施事被動句和無施事被動句的使用頻率以及在書面語和口語語料庫中的差異、在不同體裁中被動語態(tài)的使用情況、被動語態(tài)在句中所作的成分等。在進行了兩種語言內部的比較后,筆者轉而比較兩種語言之間的差異,得出了兩種語言在總體使用頻率、被動語態(tài)的施事者、語義特征、句法功能及體裁類型具有差異,并解釋了產(chǎn)生差異的潛在原因。
Boulin(2017)[5]進行了兩個角度的對比,包括英語原文和漢語譯文角度以及漢語原文和英語譯文角度進行比較。理論上來說,在翻譯對等的語料中,指示副詞now和“現(xiàn)在”在語義結構上應該是相同的,因此出現(xiàn)的頻率也應一致。分析發(fā)現(xiàn),now在英語原文出現(xiàn)的頻率高于英語譯文,“現(xiàn)在”在漢語譯文中出現(xiàn)的頻率高于漢語原文。在對應圖式和非對應圖式的統(tǒng)計中,研究發(fā)現(xiàn)now在大多數(shù)情況下不會被漢譯成“現(xiàn)在”,而“現(xiàn)在”大多被英譯為now。
Xiao(2011)[6]旨在研究語言內部及語言間的詞叢和言語重復標記的使用情況及異同,因此結合英語原文、漢語譯文及漢語原文進行了數(shù)據(jù)分析。在分析中,作者指出與漢語相比,英語中使用詞叢的頻率更高。而與漢語原文相比,漢語譯文中詞叢的使用更為常見,使用范圍也更加廣泛。使用言語重復標記時,作者將漢語和英語分開對比,得出漢語譯文比漢語原文使用頻率更高,英語譯文比英語原文使用頻率更高的結論。
吳格奇(2013)[7]首先統(tǒng)計了英漢論文中作者自稱的出現(xiàn)頻次。統(tǒng)計得出無論是英語論文還是漢語論文,第一人稱自稱的使用頻次都比第三人稱高。在英漢論文自稱第三人稱使用頻次都較低時,筆者指出,雖然漢語論文中使用第三人稱的頻次稍高與英語語料,但是這種現(xiàn)象不能直接判定漢語論文作者在論文中有更強烈的呈現(xiàn)自我傾向。這里第三人稱的不可比性是文章較為嚴謹?shù)囊稽c。
許文勝(2015)[8]利用語料庫和檢索軟件,以英語的語義類型作為視點與漢語的連詞進行比較,從英、漢原文文本、英—漢、漢—英譯文文本等方面進行定量分析,用數(shù)據(jù)解釋英漢語篇銜接中連詞使用數(shù)量、分布和用法方面的異同,指出理解連詞的重要性,并強調了連詞在翻譯中的重要作用。
近年來,無論是理論上還是時間上,國內外的對比語言學研究成果都頗有建樹。在研究方法層面,研究者傾向于利用語料庫來獲取更多的語言事實,在描述語言事實的同時,嘗試深入挖掘語言差異現(xiàn)象。在利用語料庫進行定量對比分析研究時,要深入思考,并選擇適當?shù)难芯款愋?,遵守研究設計的基本原則,遵循控制差異的四種基本方法,并在數(shù)據(jù)分析過程中合理運用數(shù)據(jù)來說明語言事實。在基于語料庫的對比研究迅猛發(fā)展時,研究者也要注意研究的深度和廣度。研究者應充分借用語料庫對某些語言現(xiàn)象進行較為系統(tǒng)而全面的描述,不能只是簡單的數(shù)據(jù)羅列。定量分析與定性分析并不矛盾,而是可以看作一個連續(xù)體(維爾斯曼,1997)[9]。因此,為了避免研究方法過于單一,未來研究者可以以語料庫方法為基礎,采用定量對比分析和定性對比分析的方法來探討語言之間,特別是英漢語之間的異同,以達到研究深度和廣度上的掘深和拓寬。
文章以5篇選自于國內外頂級期刊的基于語料庫的定量對比研究為例,討論了在英漢對比中定量對比研究的主要類型、研究設計以及數(shù)據(jù)分析過程。文章選取的案例均為定量對比篇章分析研究,在研究設計上采用多種方法控制差異,并在數(shù)據(jù)分析過程中合理運用數(shù)據(jù)對語言事實進行闡釋。當下,語料庫技術在不斷更新發(fā)展,研究者可以充分利用語料庫為主要依據(jù)和手段,采用定量對比分析與定性對比分析相結合的方法,對某些語言現(xiàn)象進行系統(tǒng)且全面的描述,而國內學者應多重視采用語料庫的方法進行英漢語之間的全面而深入的對比。