鄭媛媛
廣西外國語學(xué)院廣西南寧530222
基于自建語料庫的四字格語塊特點(diǎn)研究
鄭媛媛
廣西外國語學(xué)院廣西南寧530222
語塊是指語言中出現(xiàn)頻率較高,形式和意義較固定,以整體形式儲存在大腦中的一串詞,可整體或稍作改動后作為預(yù)制語塊供學(xué)習(xí)者應(yīng)用,具有整體儲存、整體提取、整體使用的特性。本研究借助Antconc3.4.3軟件,以中國國家政府報(bào)告英譯本為語料并自建語料庫;提取語料庫中的四詞語塊,進(jìn)行結(jié)構(gòu)上和功能上的分類;然后對庫中的四詞語塊進(jìn)行分析,最后剖析四詞語塊結(jié)構(gòu)和功能的關(guān)系,探討四詞語塊用詞特征。
語塊;語料庫;特點(diǎn);中國政府工作報(bào)告
(一)語塊
又稱詞塊,是指語言中出現(xiàn)頻率較高,形式和意義較固定,以整體形式儲存在大腦中的一串詞,可整體或稍作改動后作為預(yù)制語塊供學(xué)習(xí)者應(yīng)用。雖然學(xué)術(shù)界對語塊的定義和稱謂各有差別,如Pawley&Syder(1983)更側(cè)重于其語法功能于作用,把它定義為“具有固定的語法形式和詞匯意義的分句單位”;Biber et al(1999).將其定義為“由三個或以上的單詞構(gòu)成,在一個特定的語域里以一種高頻共現(xiàn)的方式出現(xiàn)的結(jié)構(gòu)”;Wray(2002:94)將之稱為程式化序列(formulaic sequence),定義為“作為整體使用和整體儲存的詞語程式”;NattingerandDeCarrico(1990:1)認(rèn)為語塊是“介于句子和詞匯之間的模式化短語,是一個詞匯-語法單位”。
(二)語塊的分類和功能
Cortes(2004)把語塊分成九種結(jié)構(gòu),分別是名詞短語+of、名詞短語+that從句、其它名詞短語、介詞短語、介詞短語+of、it+be+adj+that、聯(lián)系動詞be+補(bǔ)語結(jié)構(gòu)、動詞短語、其它結(jié)構(gòu)。
從功能上看,Biber將語塊分成三大功能:指稱功能、文本銜接功能和態(tài)度立場功能。
(一)研究工具
本文運(yùn)用日本早稻田大學(xué)Laurence Anthony教授研發(fā)的綠色免費(fèi)語料庫軟件AntConc為工具自建小型語料庫,對中國政府工作報(bào)告里的四詞語塊進(jìn)行研究。
(二)研究文本
中國政府報(bào)告作為一種官方文件,其文體正式,用詞嚴(yán)謹(jǐn),表達(dá)精確,內(nèi)含大量固定的表達(dá)和措辭,以體現(xiàn)政府的權(quán)威性和嚴(yán)謹(jǐn)性。政府報(bào)告的詞塊的提取、歸類和分析有助于譯者更直觀、更迅速地保證翻譯的準(zhǔn)確性、流暢性和得體性。本文里的中國政府報(bào)告英譯本的文本來源于中國政府編譯局的官方網(wǎng)站(http://www.cctb.net/),以2012-2014年這三年的政府工作報(bào)告英譯本為例。
(三)研究過程
文本被建立成庫前,所有的文本應(yīng)先用文本處理器經(jīng)過格式的凈化處理,由word文檔模式變成text模式,完成格式處理之后可建庫如下:
完成語料的建庫之后,需要從中提取出四詞詞組。在提取過程中,四詞詞組出現(xiàn)的頻率很重要。一方面,頻率決定著語塊的辨析,某個結(jié)構(gòu)共現(xiàn)的頻率越高,那么它越有可能會被識別稱為語塊以省去使用中的認(rèn)知和加工過程;另一方面,一旦這個結(jié)構(gòu)被整體存儲和整體記憶以后,當(dāng)再次表達(dá)相關(guān)意思或概念時(shí),它會被優(yōu)先使用和表達(dá)(Wray,2002)。
Altenberg(1998)認(rèn)為,任意一個以固定形式和固定意義出現(xiàn)2次或以上的結(jié)構(gòu)被稱之為語塊;Butler(1997)認(rèn)為語塊至少包含3個單詞并共現(xiàn)超過10次以上;DeCock et al (1998)指出語塊的頻率和語塊的長度成反比,即一個詞匯短語的長度越長,頻率越低;因此對不同長度的語塊頻率標(biāo)準(zhǔn)也應(yīng)該有所不同:2詞語塊的頻率應(yīng)為9次或以上;三詞語塊的頻率為4次或以上;四詞語塊的頻率為3次或以上;5詞語塊的頻率為2次或以上。因此,本數(shù)據(jù)庫里,選項(xiàng)“theCluster/N-grams(詞簇)”的參數(shù)被設(shè)定為最小值(Min size)4,頻率(Frequency)3。
(四)研究結(jié)果
本數(shù)據(jù)庫含有38,416形符(tokens)和3,444類符(types)。形符類似于我們?nèi)粘Uf的“詞”,總形符數(shù)是語料庫容量的最常用的測量單位;類符作為一個統(tǒng)計(jì)量,指語料庫文本中的任何一個獨(dú)特的詞形,即重復(fù)出現(xiàn)的形符只能記做一個類符,如Gertrude Stein的“Rose is a rose is a rose is a rose”這句話中,形符一共有10個,而類符只有3個(rose,is,a)(梁茂成,李文忠,許家金,2010:9)。按照之前設(shè)定的參數(shù),把一些不合格的四詞結(jié)構(gòu)剔除后,本庫四詞語塊的總數(shù)為714,由3,203形符以1229的頻率出現(xiàn)在庫中。下圖為本庫中出現(xiàn)頻率前15的四詞語塊。
表一
從前15個高頻出現(xiàn)的四詞語塊分布來看,動詞詞組(we will continue to,we will improve the,deepen reform of the,we will deepen reform,improve the mechanism for,give high priority to,improve the system of)和名詞詞組(economic and social development,the past five years,central and western regions,reform and opening up,agriculture rural areas and,rural areas and farmers,the people’s wellbeing)分別占據(jù)了47%的比例,而介詞短語占據(jù)了余下的大約6%.
1、四詞詞塊的結(jié)構(gòu)性分析
對所提取的四詞語塊進(jìn)行分析提煉后,結(jié)構(gòu)分布頻率圖如下:(見表二)
本庫共有符合要求的四詞語塊共714個,比例分布較大的為名詞短語(Other NP)(30%)、動詞短語(V)(20%)、介詞類(Other PP)(17%);名詞短語+of結(jié)構(gòu)(NP+of)占16%.而其余的結(jié)構(gòu),如名詞短語+that從句(NP+nominal),介詞短語+of(PP+of),其余類型(Others)and系動詞be+表語/補(bǔ)語成分(V be),分別占據(jù)了整庫不到10%的比例。值得注意的是在本庫中,“It+V be+adjective+(clause fragment)”缺失,沒有出現(xiàn)。
表二
在本庫中,與名詞相關(guān)的語塊(NP+of,NP+nominal, OtherNP)占據(jù)了將近一半的比例,說明政府工作報(bào)告里面涉及到的名詞指稱相當(dāng)龐大和多樣。作為面向全國的政府工作總結(jié),囊括國家各行各業(yè)的發(fā)展,更有對未來的展望和計(jì)劃,因此名此類詞塊獨(dú)占榜首也不足為奇,通常來說,名詞類結(jié)構(gòu)在文章里主要是解釋概念,指代以及具體化。
介詞短語限定或界定了名詞的范圍,也使得表達(dá)更精確和流暢,由于和名詞關(guān)系密切,因此所占比重也較大。
動詞類語塊在本庫中占據(jù)了21%的比例,其中,主動語態(tài)高達(dá)93%而被動結(jié)構(gòu)結(jié)構(gòu)僅占7%左右,可以看出,雖然政府報(bào)告屬于政論文,但其由總理代表政府述職的形式也影響了語態(tài)的選擇;更重要的是,政府報(bào)告還承擔(dān)著為未來做計(jì)劃,向人民展示政府的成就、繼續(xù)推進(jìn)改革開發(fā)讓人民享受更好的發(fā)展的決心,因此,主動語態(tài)成為報(bào)告中的主要語態(tài)。
短語類語塊(NP+of,Other NP,PP+of,Other PP,V be,V, Others)和分句類語塊(NP+nominal,It+V be+adjective+ clause fragment)相比,短語類比重高達(dá)95%,而分句類語塊僅占5%;而It+V be+adjective+clause fragment該結(jié)構(gòu)在庫中甚至是缺失的,這個研究結(jié)果和前人的研究相符合,即短語類語塊比分句類語塊要更常見,頻率更高(Biber at al, 1999;Biber&Barbieri,2007;Yu 2013)。
2、四詞詞塊的功能性分析
本庫中的四詞語塊的功能頻率分類如下:(見表三)
四詞語塊在本庫中功能頻率的分布依次為:指稱功能(69%),態(tài)度立場功能(23%),文章銜接功能(8%)。這一結(jié)果和Biber&Barbieri(2007)的研究相符。此前研究發(fā)現(xiàn),幾乎70%的語塊都是指稱類的,而語塊的指稱作用也是正式文體中的主功能(Biber&Barbieri 2007:278)。作為官方文件,所述理當(dāng)客觀,不偏不倚,因此態(tài)度立場功能所占比位于指稱功能之下;從態(tài)度立場的子功能里也可看出,認(rèn)知態(tài)度和預(yù)測態(tài)度占比較大,愿望、職責(zé)和能力態(tài)度所占比極小,體現(xiàn)出了客觀、中立的表述態(tài)度。
表三
3、四詞詞塊的結(jié)構(gòu)和功能的關(guān)系
表四
以上圖表體現(xiàn)了四詞語塊的結(jié)構(gòu)和功能分布頻率的關(guān)系。指稱功能往往由名詞類語塊和介詞類語塊充當(dāng)(NP+of structure,PP+of structures,NP structures and PP structures)。幾乎所有的表示態(tài)度的功能都由動詞類語塊充當(dāng)(V be,V),文章的銜接功能則主要由分句類語塊實(shí)現(xiàn)(NP+nominal,It +V be+adj),部分由名詞類語塊(Other NP)、介詞類語塊(Other PP)和其它結(jié)構(gòu)實(shí)現(xiàn)(Others structures)。
從上述分析可看出,中國政府報(bào)告中的四詞語塊出現(xiàn)頻率較高;從結(jié)構(gòu)上看,最主要的結(jié)構(gòu)是名詞短語語塊(Other NP),共占比30%;頻率較高的還有動詞語塊(V),介詞語塊(Other PP)以及名詞+of(NP+of)語塊;由此可見,中國政府工作報(bào)告英譯文偏向于采用包含名詞和介詞的詞塊來表達(dá)指稱、概念、質(zhì)量以及限定性,側(cè)面展示了報(bào)告內(nèi)容的綜合性、復(fù)雜性和精確;而動詞結(jié)構(gòu)多用于表達(dá)政府不遺余力地推動經(jīng)濟(jì)改革,改善民生,促進(jìn)社會公正公平的堅(jiān)定信念和決心,故主動語態(tài)以93%的高頻成為譯本的主要語態(tài)。
從功能上看,指稱功能居于首位,隨后是態(tài)度立場功能和文章銜接功能,體現(xiàn)了中國政府報(bào)告譯文所含的內(nèi)容量的豐富、廣度,文體正式,分析客觀。在本庫中,指稱功能占比69%,其所包含的子功能里,指稱時(shí)間地點(diǎn)文本的功能(Time/ place/text reference)以及屬性細(xì)化功能(Specification of attribute)占比最重,這一點(diǎn)和結(jié)構(gòu)上多使用名詞類以及介詞類語塊相呼應(yīng);在篇章銜接功能里,鑒定說明(elaboration/clarification)居首位,而這個功能和指稱功能相互依賴、密不可分。在態(tài)度立場功能的子功能里,分量最重的當(dāng)屬認(rèn)知態(tài)度(epistemic stance)和傾向預(yù)測態(tài)度(Intentional/prediction stance),這與報(bào)告剖析過往發(fā)展成就和展望下一年的內(nèi)在屬性息息相關(guān)。
從兩者的關(guān)系上看,某些特定功能的語塊往往由相對固定的結(jié)構(gòu)實(shí)現(xiàn)。指稱功能往往由帶“of”結(jié)構(gòu)的語塊實(shí)現(xiàn),包括(NP+of,PP+of)名詞類語塊和動詞類語塊也主要體現(xiàn)在指稱功能上;態(tài)度立場功能由動詞類語塊完成,銜接功能主要由分句類語塊體現(xiàn);而前兩類功能主要由短語類語塊完成。
因此,在對中國政府工作報(bào)告進(jìn)行翻譯時(shí),譯者可根據(jù)語塊特點(diǎn)而進(jìn)行針對性翻譯,如表示實(shí)體或概念指稱作用多用含“of”結(jié)構(gòu)以及名詞、介詞類語塊(NP+of,PP+of,other NP,other PP...);對于動作、質(zhì)量的指稱多用(V,V be)語塊;文本銜接常用短語類語塊表達(dá)等。對于一些出現(xiàn)頻率較高的語塊,可整體使用,以保證譯文的準(zhǔn)確、通順、流暢。
最后,本語料庫建庫較為簡單,容量較小,也僅分析了四詞語塊,還有許多亟待完善之處,關(guān)于語塊的學(xué)習(xí)與研究也可在此基礎(chǔ)上不斷深化與改進(jìn)。
[1]Wray.A.Future Directions in Formulaic Language Research[J].Wang Lifei,Advances in Theoretical and Empirical Research on Formulaic Language[C].Shanghai:Shanghai Foreign Language Education Press,2012.
[2]梁茂成,許家金,李文中.語料庫應(yīng)用教學(xué)[C].北京:外語教學(xué)與研究出版社,2013.
[3]俞苗.不同學(xué)科學(xué)術(shù)語篇中四詞語塊的研究——以食品科學(xué)與教育學(xué)為例[M].大連海事大學(xué),2013.