張慧婷
(江蘇省有色金屬華東地質(zhì)勘查局,江蘇 南京 210007)
語料庫是按照一定的語言原則,運(yùn)用文本或話語片段而建成具有一定容量的大型電子文本庫。1999 年廣東外語外貿(mào)大學(xué)桂詩春教授和上海交通大學(xué)楊惠中教授牽頭開發(fā)建成“中國學(xué)習(xí)者語料庫”(CLEC)。許多高校研究者個(gè)人也建立了適合自己的小型專用英語語料庫,如廣州體育學(xué)院陳建生建立了美國職業(yè)籃球比賽賽事報(bào)道語料庫,并探討了體育英語語料庫的建設(shè);在工作中積累了很多專用詞匯,結(jié)合實(shí)際,本文主要進(jìn)行后者的研究,探討構(gòu)建個(gè)性化的,專門化以及行業(yè)化的語料庫的設(shè)想。
(1)對(duì)外發(fā)展需要。隨著礦業(yè)對(duì)外的發(fā)展,對(duì)外的交流就越來越需要得到重視,建立一個(gè)有色金屬行業(yè)英語語料庫,對(duì)ECE的涉外業(yè)務(wù)的發(fā)展也會(huì)添磚加瓦。
(2)資源綜合利用。ECE下設(shè)的翻譯中心承擔(dān)對(duì)外業(yè)務(wù)文件翻譯,每年約280萬字的翻譯量。翻譯過的資料都未整理成庫,建設(shè)專用語料庫,可以將之前工作積累的一部分資源轉(zhuǎn)換為語料,服務(wù)于自行建立的語料庫,倡導(dǎo)資源綜合利用。
(3)有色金屬行業(yè)創(chuàng)新性。目前經(jīng)過初步調(diào)研,有色金屬行業(yè)還未出現(xiàn)專業(yè)的語料庫,而語料庫語言學(xué)又的確提供了研究專門英語的新方法與新視角,建立一個(gè)有色金屬行業(yè)專用語料庫是大勢(shì)所趨,也具有行業(yè)創(chuàng)新性,將給有色金屬翻譯研究者注入新的活力[1]。
語料庫的建設(shè)要考慮的因素很多,構(gòu)建方面如建庫目的,建庫內(nèi)容,建庫原則。構(gòu)建步驟可分為語料采集、語料校對(duì)、語料標(biāo)注等。本文從以下幾個(gè)方面闡述構(gòu)建ECE專用英語語料庫的主要參數(shù)。
依據(jù)Mona Baker的理論,用于翻譯研究的語料庫主要有三種類型:平行語料庫(parallel corpus)、可比語料庫(comparable corpus)和多語語料庫(multilingual corpus)。在這三類語料庫中,平行語料庫與翻譯實(shí)踐之間結(jié)合最為緊密。翻譯人員在遇到一些無法翻譯的詞語或者搭配時(shí),可以通過查詢工作,從語料庫中找出相關(guān)內(nèi)容,從而輔助翻譯者的翻譯。譯者通過檢索語料可以有效、即時(shí)地提高翻譯速度和譯文質(zhì)量。語料庫建設(shè)的初衷就是更好的服務(wù)于翻譯,資源的綜合利用,因此ECE專用英語語料庫構(gòu)建的是平行語料庫[2]。
為了滿足對(duì)有色金屬英語詞匯、句法、篇章等多方面的定量與定性分析研究的需要,有色金屬英語語料庫需要遵循以下原則:
①抽樣隨機(jī)原則:對(duì)有色金屬語言素材進(jìn)行分層次、分類別地收集,從而建立盡可能全面反映有色金屬英語語言事實(shí)的語料庫。保證語料的質(zhì)量和樣本的代表性。②內(nèi)容真實(shí)原則:收集的語料不進(jìn)行刻意的改正與修飾,盡量保證語料的原汁原味。③庫容適度原則:語料規(guī)模是中小型。建庫第一階段,只考慮書面語文本,暫不收口語語料。④質(zhì)量過硬原則:收錄的語料要挑選語言質(zhì)量高的原本,特別注意譯本的質(zhì)量。
圖1 建庫步驟
(1)人工翻譯轉(zhuǎn)換為機(jī)器翻譯,提高工作效率。利用專用英語語料庫,把制作好的語料庫按照規(guī)定的格式編輯好,然后利用計(jì)算機(jī)輔助翻譯軟件的詞庫和例句庫導(dǎo)入功能,把該語料導(dǎo)入到翻譯軟件,如果遇到庫中儲(chǔ)存的詞語和例句,可以利用軟件的翻譯記憶和計(jì)算機(jī)匹配技術(shù),既提高翻譯效率,又提高翻譯的準(zhǔn)確性和一致性。
(2)加深有色金屬英語語言規(guī)律的認(rèn)識(shí)。建立語料庫能夠?qū)τ猩饘儆⒄Z的各種現(xiàn)象做出全面細(xì)致的描寫,易于觀察發(fā)現(xiàn)其特點(diǎn)與規(guī)律。專用語料庫針對(duì)性強(qiáng),語料新,語境豐富,利用檢索功能,可以對(duì)有色金屬行業(yè)的英語措辭,詞語搭配等進(jìn)行研究,可以了解行業(yè)英語規(guī)律。
(3)學(xué)習(xí)材料與辭典編纂。語料庫不僅能夠提供更完備和詳盡的關(guān)于詞義和詞匯搭配的信息,而且利用語料庫中的頻率統(tǒng)計(jì)可以直觀的反映詞匯用法的使用情況。由于語料庫的素材來自實(shí)際使用的語言,利用其素材作為詞典的例句更具真實(shí)性和準(zhǔn)確性。利用語料庫編撰詞典不僅能反映語言的真實(shí)變化,而且編撰周期也會(huì)大大縮短。待語料庫庫容逐漸擴(kuò)大后,可以整理一些學(xué)習(xí)材料并且適當(dāng)時(shí)編撰專屬于ECE的學(xué)習(xí)詞典[3]。
目前國內(nèi)沒有有色金屬的英語語料庫,因此建立一個(gè)專門用途的有色金屬語料庫,使有色金屬語料更廣泛,操作更簡便,更具即時(shí)性,集學(xué)習(xí)、研究和使用為一體,是一個(gè)值得研究的話題。本文對(duì)建立有色金屬語料庫進(jìn)行了可行性研究,語料庫建設(shè)是一項(xiàng)復(fù)雜、繁重的工作,更好的服務(wù)工作。語料庫是有用的參考工具或工作平臺(tái),具有廣闊的使用前景和潛在開發(fā)價(jià)值。無論從深度上還是從廣度上,該領(lǐng)域的研究還有進(jìn)一步提高的空間。