黃瓊
【摘 要】 本文綜述分析了應(yīng)用對比語言學(xué)的研究成果,探索了基于信息技術(shù)的布依語泰國語應(yīng)用對比研究途徑:平行語料庫建設(shè),在線雙語詞典的編纂及雙語機(jī)器翻譯系統(tǒng)的開發(fā)。
【關(guān)鍵詞】 布依語泰國語對比;平行語料庫;在線雙語詞典;機(jī)器翻譯
一、應(yīng)用對比語言學(xué)相關(guān)理論及發(fā)展
對比語言學(xué)是對兩種或多種語言進(jìn)行系統(tǒng)比較的學(xué)科,旨在描述語言之間的近似與差異。對具體語言和語言結(jié)構(gòu)的對比描寫有助于更深刻地理解具體語言及其結(jié)構(gòu)特性。應(yīng)用對比語言學(xué)屬于對比語言學(xué)的一個分支。應(yīng)用對比語言學(xué)的目的是將理論對比語言學(xué)的研究成果應(yīng)用到外語教學(xué)、翻譯、詞典編纂等相關(guān)活動中去,為應(yīng)用服務(wù),并探討應(yīng)用中的一些理論和方法。
語言對比研究最早可以追溯到十九世紀(jì)末,至今也有近百年的歷史了,但這個領(lǐng)域是在近幾十年內(nèi)才真正受到重視,產(chǎn)出大量有益的研究成果。四十年代前受到業(yè)內(nèi)肯定的成果有1892年羅曼語文學(xué)家格蘭德琴特(CharlesH.Grandgent)出版的《德語和英語的語言》;還有1906年法國語音學(xué)家帕西(PaulPassy)的《簡論歐洲主要語言的比較語音學(xué)》;以及1933年著名語言學(xué)家趙元任出版的《英語語調(diào)與漢語語調(diào)初探》。這個時期的對比研究領(lǐng)域主要集中在語音對比研究方面,而其他領(lǐng)域鮮有涉足。
我國的對比研究起步與發(fā)展有三個階段。首先的起步階段是以馬建忠的《馬氏文通》和嚴(yán)復(fù)的《英文漢詁》算起,到四十年代末。在這段時間內(nèi),不少研究人員都開展了非常有價值的漢外對比研究,主要集中在英漢對比研究領(lǐng)域。第二個階段集中在1949-1976年這個時期,在這段時間內(nèi),中國的對比語言學(xué)相關(guān)研究走向沉寂,少有成果。第三個階段是從1977年5月呂叔湘先生發(fā)表《通過對比研究語法》開始的。對比語言學(xué)開始受到關(guān)注和重視,大量有價值的研究成果不斷涌現(xiàn)。如王克菲大型英漢雙語平行語料庫的建立。潘文國對比語言學(xué)的目標(biāo),研究范圍和新發(fā)展進(jìn)行的探索和研究。二語習(xí)得和翻譯研究與教學(xué)得到長足發(fā)展,跨文化交際也有了飛躍式的進(jìn)步。機(jī)器翻譯和在線詞典的出現(xiàn)使得不同文化之間的合作與交流日益頻繁,為社會帶來了巨大的變革和發(fā)展。
由此可見,應(yīng)用對比語言學(xué)的研究已經(jīng)成為語言學(xué)研究的重要領(lǐng)域和研究熱點(diǎn),如何開展有意義的應(yīng)用對比語言學(xué)研究,是擺在相關(guān)研究人員面前的重要課題之一。
二、基于信息技術(shù)的布依語泰國語應(yīng)用對比研究的重要性
以計算機(jī)多媒體和網(wǎng)絡(luò)通信為基礎(chǔ)的信息技術(shù),已經(jīng)深入到我們生活、教育、醫(yī)療和服務(wù)等各個領(lǐng)域,應(yīng)用對比語言研究也同樣面臨著巨大的機(jī)遇和挑戰(zhàn),基于信息技術(shù)的應(yīng)用對比語言研究不僅是應(yīng)用對比語言學(xué)的新發(fā)展,同樣也為語言的研究、翻譯和教學(xué)拓寬了新的研究領(lǐng)域,并產(chǎn)出了大量有價值的成果。這充分說明,基于信息技術(shù)的應(yīng)用對比語言研究是值得深入探索的領(lǐng)域,它必將為應(yīng)用對比語言研究的發(fā)展帶來更多的有益的成果,并促進(jìn)社會和時代的發(fā)展與變革。
泰語與中國布依語都同屬于漢藏語系侗臺語族的臺語支,泰國人和布依族他們來源于古越人,雖然雙方距離遙遠(yuǎn),但在經(jīng)濟(jì)文化上至今仍有許多相同或相似之處。而中國布依語現(xiàn)在面臨著城鎮(zhèn)化和漢語及主流文化的沖擊和影響,其生存和發(fā)展都遭受到了前所未有的危機(jī)和挑戰(zhàn)。如何保護(hù)和傳承布依語及其文化已經(jīng)成為相關(guān)研究人員亟待解決的問題之一。結(jié)合信息技術(shù)對布依語和泰語進(jìn)行應(yīng)用對比研究,不僅會保護(hù)布依語及其文化,而且于對比語言學(xué)的發(fā)展、雙語教學(xué)以及翻譯研究與實踐也都有著重大應(yīng)用價值。
三、基于信息技術(shù)的布依語泰國語應(yīng)用對比研究形式思考
筆者在CNKI上搜索了相關(guān)論文,進(jìn)行整理分析后,總結(jié)了以下三種可行的也比較有價值的基于信息技術(shù)的布依語泰國語應(yīng)用對比研究形式。
1、平行語料庫建設(shè)
在非計算機(jī)狀態(tài)下,語言數(shù)據(jù),不僅數(shù)據(jù)資源少,而且還分散在各種印刷媒體上和非專業(yè)化的錄像和電影中,這樣的數(shù)據(jù)源對于相關(guān)數(shù)據(jù)需求者來說,使用很不方便,查找,摘抄一個信息往往要花費(fèi)很長的時間,也不容易保管。而有了信息技術(shù)的支持,網(wǎng)絡(luò)上搜尋相關(guān)數(shù)據(jù),已經(jīng)是非常方便快捷,也易于儲存。但仍然存在一個問題,就是沒有進(jìn)行系統(tǒng)的管理,對于數(shù)據(jù)的初步整理分類都成為了相關(guān)數(shù)據(jù)需求者的難題。而語料庫,即經(jīng)科學(xué)取樣和加工的大規(guī)模電子文本庫,就恰恰解決了這個問題,因為語料庫可以借助計算機(jī)分析軟件,對語料庫中的海量數(shù)據(jù)進(jìn)行提取分析。
而雙語平行語料庫更是語料庫突破性的發(fā)展,它是一種重要的語言資源,統(tǒng)計機(jī)器翻譯系統(tǒng)可以借此研制翻譯統(tǒng)計模型,基于實例的機(jī)器翻譯系統(tǒng)和各類計算機(jī)輔助翻譯系統(tǒng)能夠以此作為翻譯記憶庫,翻譯人員也能從中觀察和選取鮮活的語言與翻譯實例,與當(dāng)前單語語料庫的建造動輒上億詞的龐大庫容相比,這類資源研制的數(shù)量要少得多。
平行語料庫的研制歷史并不長,從世界上第一個初步的平行語料庫加拿大議會會議錄英法平行語料庫(TheCanadianHansardCorpus)建成到目前也只有20年左右。但是因為平行語料庫在語言對比研究,翻譯研究,翻譯教學(xué),雙語詞典編纂等領(lǐng)域都具有巨大的潛在應(yīng)用價值,因而在世界范圍內(nèi)得到了迅速發(fā)展。克姆尼茨英-德翻譯語料庫(ChemnitzE-GTranslationCorpus)、德-英文學(xué)文本平行語料庫(GEPCOLT)、英語-挪威語平行語料庫(ENPC)、英語-意大利語雙向平行語料庫(CEXI)、葡-英雙向平行語料庫(Compara)相繼建成。國內(nèi)平行語料庫的研究起步較晚,但也取得了一定的發(fā)展。北京外國語大學(xué)中國外語研究中心王克非主持和研制的北外“通用漢英對應(yīng)語料庫”是目前世界上最大的雙語平行語料庫,目前容量為3000萬字詞,并在進(jìn)一步建設(shè)中。
布依語泰國語平行語料庫的建設(shè),是布依語泰國語應(yīng)用對比研究最有價值的呈現(xiàn)形式:第一,促進(jìn)對比語言學(xué)的發(fā)展。建立一個雙語平行語料庫,不僅能為后續(xù)的語言對比研究提供最可靠的數(shù)據(jù)源,而且其還是應(yīng)用對比研究最有價值和開發(fā)潛力的實踐成果之一。第二,布依語及其文化的最原生態(tài)的記錄。第三,為雙語詞典編纂和機(jī)器翻譯提供可靠數(shù)據(jù)源。
2、在線雙語詞典的編纂
雙語詞典使用領(lǐng)域非常廣泛,例如機(jī)器翻譯、交叉語言信息提取等,對語言的學(xué)習(xí)和教學(xué)也有著不可替代的重要作用。雙語詞典既能夠進(jìn)行語言翻譯,還可以幫助使用者進(jìn)行文化交流。傳統(tǒng)雙語詞典編纂都是通過人工完成的。這種詞典是在經(jīng)濟(jì)全球化的時代下應(yīng)運(yùn)而生的,能夠滿足當(dāng)時的社會發(fā)展需要。但是自從第一臺計算機(jī)問世至今,計算機(jī)科學(xué)與通信技術(shù)日新月異,更新速度快,數(shù)據(jù)信息存儲大的在線,查詢便捷,成本低的在線詞典已經(jīng)成為了新時代的寵兒。
建立布依語泰國語在線雙語詞典主要的問題在于,網(wǎng)絡(luò)上布依語的語料數(shù)據(jù)量和泰國語的語料數(shù)據(jù)量肯定是不能匹配的,布依語作為一種地區(qū)性的民族語言,在漢語及其文化的影響下,以及城鎮(zhèn)化的發(fā)展破壞了原來布依語使用的原生態(tài)母語環(huán)境,使得布依語的使用人群開始出現(xiàn)了嚴(yán)重的老齡化傾向,年輕人在生活中主要使用漢語作為日常生活中的社會交際語言。因而在網(wǎng)絡(luò)上布依語的語料會相對泰國語的語料來說會少很多。所以,研制布依語泰國語在線雙語詞典可以有兩個解決途徑。第一,加大網(wǎng)絡(luò)布依語料的上傳。這個可以通過政府相關(guān)政策支持,建立一些布依語漢語雙語網(wǎng)頁,或者布依語英語雙語網(wǎng)頁,對布依族的生活文化教育風(fēng)俗等方面進(jìn)行文章的撰寫和配圖、配音,相關(guān)視頻制作等。然后建立一個基于網(wǎng)絡(luò)語料庫的布依語泰國語在線雙語詞典。第二,可以先建立起布依語泰語雙語平行語料庫,然后研制一個基于這個平行語料庫的布依語泰語在線雙語詞典,這種在線雙語詞典會促進(jìn)布依語網(wǎng)絡(luò)上語料的增加,當(dāng)網(wǎng)絡(luò)中的布依語語料自然累積到足夠數(shù)量時再建一個基于網(wǎng)絡(luò)語料庫的在線雙語詞典。
辭書是一個國家、一個民族文化的集中體現(xiàn)。雙語詞典是辭書的重要組成部分。在線雙語詞典的出版有助于推廣民族語言和文化,增強(qiáng)國家文化軟實力,對我國的經(jīng)濟(jì)建設(shè)、科技發(fā)展、文化繁榮等都具有很強(qiáng)的實用價值。
3、雙語機(jī)器翻譯系統(tǒng)的開發(fā)
自然語言理解,是研究如何利用計算機(jī)來理解和生成自然語言的理論和方法。用以完成這一過程的軟件叫做機(jī)器翻譯系統(tǒng)。而不同語言之間的翻譯成為文化交流過程中的關(guān)鍵所在。面對海量的語言信息,人工翻譯已經(jīng)遠(yuǎn)遠(yuǎn)無法滿足需要,因此能夠?qū)崿F(xiàn)自動化的自然語言翻譯的機(jī)器翻譯技術(shù)在過去十幾年中一直是人工智能研究領(lǐng)域的熱點(diǎn)。隨著經(jīng)濟(jì)全球化及互聯(lián)網(wǎng)的飛速發(fā)展,機(jī)器翻譯技術(shù)在促進(jìn)政治、經(jīng)濟(jì)、文化交流等方面起到越來越重要的作用。
機(jī)器翻譯的研究起源于20世紀(jì)三四十年代。20世紀(jì)30年代初,法國科學(xué)家G.B.阿爾楚尼開始了用機(jī)器來進(jìn)行翻譯的理論探索。隨后不久,信息論的先驅(qū)、美國科學(xué)家W.Weaver和英國工程師A.D.Booth在討論電子計算機(jī)的應(yīng)用范圍時,于1947年論述了基于計算機(jī)的語言自動翻譯。1949年,W.Weaver發(fā)表《翻譯備忘錄》,正式提出機(jī)器翻譯理論。但由于1966年ALPAC委員會對機(jī)器翻譯的譯文質(zhì)量進(jìn)行調(diào)查后,否定了機(jī)器翻譯的應(yīng)用價值,機(jī)器翻譯研究因此長期停滯不前。最近的二十年,隨著語言學(xué)理論的發(fā)展、計算機(jī)科學(xué)和通信技術(shù)的不斷完善,翻譯理論和研究的進(jìn)步,人們對機(jī)器翻譯也有了更加準(zhǔn)確的認(rèn)識,機(jī)器翻譯在此背景下取得了長足的發(fā)展。但是全自動高質(zhì)量的機(jī)器翻譯系統(tǒng)仍未出現(xiàn),其原因在于語言知識的復(fù)雜性和人類認(rèn)識語言規(guī)律的有限性。
盡管如此,相關(guān)研究仍然在強(qiáng)烈的需求下應(yīng)運(yùn)而生,不斷發(fā)展。筆者認(rèn)為對布依語泰語雙語機(jī)器翻譯系統(tǒng)的開發(fā)是很有必要的,因為它們在發(fā)音、詞匯、語法甚至文化方面都十分近似,所以,對這兩種語言進(jìn)行機(jī)器翻譯的效果應(yīng)該會大大勝過以往民族文化不同源,發(fā)音,語法文化差異大的兩種語言的機(jī)器翻譯效果。那么雙語機(jī)器翻譯的最有效的應(yīng)用領(lǐng)域也許會找到答案。
四、結(jié)語
布依語是區(qū)域性民族語言,目前處于瀕危的困境。而與之同源的泰語卻在東盟經(jīng)濟(jì)圈的建立背景下,越來越受到中國學(xué)習(xí)者的青睞。布依語和泰語有許多相同和相似之處。本文探究了在應(yīng)用對比語言學(xué)的理論框架下如何在實踐中去有價值地描述和呈現(xiàn)這兩種語言的相似和差異的三種途徑,以期在豐富和發(fā)展應(yīng)用對比語言學(xué)的理論和實踐的同時,能為少數(shù)民族語言的保護(hù)和傳承貢獻(xiàn)應(yīng)有的力量與價值。
【參考文獻(xiàn)】
[1] 潘文國.對比語言學(xué)的新發(fā)展[J].中國外語,2006(6)14-19.
[2] 林雯.對比語言學(xué)在英語教育中的應(yīng)用[J].雞西大學(xué)學(xué)報,2014(3)83-84.
[3] 潘文國.漢英對比研究一百年[J].世界漢語教學(xué),2002(1)60-86.
[4] 伍文義.布依語與泰國語的語音比較研究[J].貴州民族研究,1999(1)164-172.
[5] 龍海燕,蔡吉燕.布依語的使用現(xiàn)狀及其結(jié)構(gòu)特征——以貴陽市花溪區(qū)養(yǎng)牛村布依語為例[J].貴州民族學(xué)院學(xué)報(哲學(xué)社會科學(xué)版),2011(1)13-17.
[6] 何高大,劉凡.信息技術(shù)與語言實驗室的發(fā)展[J].中國教育技術(shù)裝備,2006(5)1-5.
[7] 王克非.中國英漢平行語料庫的設(shè)計與研制[J].中國外語,2012(6)23-27.
[8] 黃立波,朱志瑜.國內(nèi)英漢雙語平行語料庫建構(gòu)與研究現(xiàn)狀及展望[J].當(dāng)代外語研究,2013(1)45-49.
[9] 肖忠華,戴光榮.語料庫在語言教學(xué)中的應(yīng)用——中國英語學(xué)習(xí)者被動句式習(xí)得個案研究[J].浙江大學(xué)學(xué)報(人文社會科學(xué)版),2010(4)189-200.
[10] 韓軍.基于萬維網(wǎng)資源的雙語詞典的構(gòu)造和查詢處理技術(shù)研究[D].北京:清華大學(xué),2014.
[11] 孫娜.耗散結(jié)構(gòu)理論視域下的雙語詞典出版研究[D].四川:西南交通大學(xué),2014.
[12] 王博.機(jī)器翻譯系統(tǒng)的自動評價及診斷方法研究[D].哈爾濱:哈爾濱工業(yè)大學(xué),2010.
[13] 關(guān)曉薇.基于語義語言的機(jī)器翻譯系統(tǒng)中若干關(guān)鍵問題研究[D].山東:大連理工大學(xué),2009.
[14] 郭永輝.英漢機(jī)器翻譯系統(tǒng)關(guān)鍵技術(shù)研究[D].河南:信息工程大學(xué),2006.
【作者簡介】
黃 瓊(1986-)女,湖南冷水江人,貴州師范學(xué)院外國語學(xué)院講師,研究方向:現(xiàn)代教育技術(shù).