摘 要:對語言的某種現(xiàn)象進行闡述,也即對這些現(xiàn)象進行一個對比分析的過程,這在對比語言學中的應用是十分廣泛的。近年來,使用語料庫進行外語多領域研究呈現(xiàn)出越來越廣泛的應用性,其規(guī)范度和成熟度也日趨提升,取得了豐富的研究成果。將語料庫方法應用于對比語言學,指出語料庫方法對對比語言學領域的研究與發(fā)展的顯著推動作用,是本文將要討論的主要內(nèi)容。
關鍵詞:語料庫;對比語言學;應用分析
語料庫是現(xiàn)代語言學的三大研究方法之一,另外分別是內(nèi)省法和誘導法。語料庫的發(fā)展,對于推動現(xiàn)代語言學的發(fā)展,起到了至關重要的作用。在對比語言學的研究中,語料庫和語料庫語言學能夠提供大量的原始語料,結(jié)合計算機的數(shù)字化功能,能夠方便快捷的得出相應的結(jié)論。
1 語料庫的定義和發(fā)展歷史
語料庫是語言數(shù)據(jù)的集合。語料庫語言學則是以語料庫為基礎對真實文本中的語言進行觀察和分析,結(jié)合自然語言中的一些抽象規(guī)則,探討某種語言及雙語或多語之間的關系,并根據(jù)真實發(fā)生的語言現(xiàn)象得出比較可靠的分析結(jié)果的一門語言學。一般認為語料庫語言學的研究有兩層主要含義:一是利用語料庫這個新的研究手段對語言的某個或某些方面進行研究;二是依據(jù)語料庫所反映出來的語言事實對現(xiàn)行語言學理論進行批判,從而提出新的觀點或理論。
在20世紀30年代計算機出現(xiàn)之前,語料庫研究大多手工完成,十分繁瑣。計算機的出現(xiàn),打破了這一局限,出現(xiàn)大規(guī)模自動化語言處理模式。20世紀30年代,經(jīng)歷了第一代計算機處理的語料庫,以及第二代電子計算機處理的語料庫兩個發(fā)展階段接近50年的時間之后,進入20世紀80年代,現(xiàn)代科技的迅猛發(fā)展促使語料庫及語料庫語言學也進入快速發(fā)展期,各國家、各語種語料庫的庫容動輒以百萬字詞甚至千萬字詞為計。
對中國而言,語料庫的發(fā)展最早的標志是上海交通大學科技英語語料庫的完成。此后,經(jīng)過大約30年的努力,語料庫獲得了飛速進展,基本建成了一批可與國際同類語料庫相當?shù)膶iT語料庫、學習者口筆語語料庫以及數(shù)量眾多的各種平行語料庫等。事實上,幾乎語言學的各個領域都可以從語言使用的角度進行研究,語料庫數(shù)據(jù)正是所使用語言的樣本,它所提供的海量語料使研究者能夠系統(tǒng)地對大量的文本語料進行審視,使人們有可能發(fā)現(xiàn)一些以前從未發(fā)現(xiàn)的語言事實。
因此,語料庫作為研究手段可用于語言學研究的諸多領域,如詞匯學、語言教學、對比語言學、翻譯等。
2 對比語言學的定義和特點
作為語言學的一個分支,對比語言學是對兩種或者兩種以上的語言進行共時對比研究,獲得其間異同,特別是語言之間的不同之處,并將其應用于具體研究范疇的一類語言學。它有其自身的獨特特點。
第一,共時性。對比語言學是共時的對語言進行研究。共時性,是指對兩種或兩種以上語言的現(xiàn)實狀態(tài)進行對比研究,強調(diào)時態(tài)的一致性。因為語言的發(fā)展有其特定的背景和環(huán)境,脫離了共同的時態(tài),對比的變量就不再單一,就不具有代表性。
第二,差異性。對比語言學的定義中雖然說是研究和描述兩種或兩種以上的語言的異同,但是側(cè)重點仍然在它們的差異上。因為差異性更能凸顯出我們研究的“對比”意義。
3 語料庫種類及其在對比語言學中的應用
研究認為, 語料庫可分為兩大類:多語語料庫和單語語料庫。前者包括平行語料庫和類比語料庫;后者則包括同一語言的原創(chuàng)文本和翻譯文本,或者用母語撰寫的文本和學習者文本。第一大類中的平行語料庫,又稱翻譯語料庫。平行語料庫中的雙語或多語語料形式十分多樣,可以是單向翻譯對等,也可以是雙向翻譯對等;可以是一個原本對一個譯本,也可以是一個原本對多個譯本。例如,德國達姆斯塔特工業(yè)大學Anke Schulz的論文《情態(tài)的邊緣: 英德情態(tài)動詞系統(tǒng)與將來時界面探索》所采用的Brem en Translation Corpus含有英、德語原文, 以及每一原文文本在另一種語言中的五個譯本。第一大類中的類比語料庫,又稱平衡語料庫。此類語料庫中的雙語或多語語料雖然并不翻譯對等,但需要在語域、年代等方面保持一致。平衡語料庫進一步強調(diào)了樣本數(shù)量上的一致。例如,比利時根特國有專業(yè)學院Gert de Sutter和Marc Van de Velde 的論文《超越句法表層:一項基于語料庫的荷德介詞短語外位移動原則對比研究》所采用的平衡語料庫就含有二戰(zhàn)后荷、德文學作品各10部的選段。第二大類語料庫,即單語語料庫,包括單一語言的原文語料庫、譯文語料庫,以及學習者語料庫。英語原文語料庫用得最多的是英國國家語料庫。而英語學習者語料庫用得最多的是含有不同母語背景的英語學習者文本的國際英語學習者語料庫。
對比語言學研究是語言學研究的重要分支,但目前的語言研究多表現(xiàn)為高度抽象性,其應用方面應該要向具體化發(fā)展。在語言研究由高度抽象向語言的實際使用的過渡中,語料庫和語料庫語言學起著十分重要的作用,體現(xiàn)為以下幾個方面:
一是提供真實語料,語料庫的龐大語料足夠做到這一點; 二是提供統(tǒng)計數(shù)據(jù),作為兼有數(shù)據(jù)庫特點的語料庫,可以提供充分的統(tǒng)計數(shù)據(jù);三是驗證現(xiàn)行的理論,對比語言的應用可以通過語料庫語言學來檢驗;四是構建新的理論,通過對比尋找兩種或者多種語言的差異性,能夠形成新的理論。
對比語言研究與其他語言學學科一樣,其研究日益成為基于數(shù)據(jù)的或數(shù)據(jù)驅(qū)動的,依靠對語料數(shù)據(jù)的統(tǒng)計來驗證假設或揭示語言之間的相似和差異。因此,利用語料庫方法的語言對比研究取得了豐碩成果,以語言具體層次的比較為主,如詞匯層面,短語層面,語法層面等,同時輔以個案研究,說明具體問題,陳述研究發(fā)現(xiàn)及其在教學應用上的意義。通過總結(jié)概括大量的個案研究,可以進一步深入探討語言表面背后的原因。
4 結(jié)束語
總之,語料庫在對比語言學中的研究中具有十分重要的作用。但同時,語料庫也有其局限性。語料庫數(shù)據(jù)提供的只是所使用語言的事實例證,它本身無法對數(shù)據(jù)進行解釋和對語料庫數(shù)據(jù)進行推理。因此,這些數(shù)據(jù)在輔助人們的語言直覺和內(nèi)省判斷的時候,離不開研究者本人的語言直覺和內(nèi)省。只有將基于計算機龐大存取能力的語料庫和研究人員的語言直覺、語言素養(yǎng)這兩者有機結(jié)合起來,對比語言學的研究發(fā)展才會取得更大的進步。
參考文獻
[1]丁信善.語料庫語言學的發(fā)展及研究現(xiàn)狀[J].當代語言學,1998(5):5-13.
[2]楊惠中.語料庫語言學導論[M].上海外語教育出版社,2002:6.
[3]潘文國.對比語言學的目標與范圍[J].外語與外語教學,2006,01:25-31.
作者簡介
李一(1980-),女,內(nèi)蒙古赤峰人,滿族,本科,講師,研究方向:對比語言學,英語語言學。