樊 斌,韓存新
(1.集美大學外國語學院,福建廈門361021;2.廈門大學外文學院,福建廈門361005)
如果以 Quirk等進行的“Survey of English Usage”①R.Quirk等從20世紀60年代初開始著手進行“英語用法調(diào)查”(Survey of English Usage)的研究,但當時的調(diào)查是純手工完成。該語料庫直到1989年才實現(xiàn)計算機化。(參見李文中,2010)作為起點的話,語料庫語言學發(fā)展至今已經(jīng)有將近50年的歷史。語料庫語言學基本上以Firth和Sinclair的語言學思想作為其理論基礎,[1-2]而作為美國結構主義創(chuàng)始人和代表人物之一的Charles C.Fries(1887-1967),在語料庫語言學界知道的人并不多,因為他在應用語言學方面的巨大成就掩蓋了他在語料庫語言學方面的探索。其實,F(xiàn)ries不僅是一位開拓性的應用語言學家,還是一名具有超前意識的語料庫語言學思想家和杰出的語料庫實踐家。國內(nèi)對Fries的應用語言學思想進行研究的比較多,但是對其語料庫語言學思想進行探討的文章尚不多見。鑒于此,本文擬從Fries的數(shù)據(jù)觀、研究焦點、研究范式三個方面對Fries的語料庫語言學思想及方法進行闡述,以期填補語料庫語言學史的研究空白,為更好地繼承他的語料庫語言學遺產(chǎn)做出一點貢獻。
“數(shù)據(jù)是研究方法和研究范式的組成部分,其重要性不言而喻。一定性質(zhì)的數(shù)據(jù)往往和語言學流派及其哲學立場相關”。[2]25與同時代其他結構主義語言學家不同的是,F(xiàn)ries在語言研究當中并沒有摒棄意義,而是把語言看作傳遞意義的工具。他認為,語言本身不是意義,語言是信號的代碼。至于語言學,他認為是“對語言的科學研究”,是“關于人類語言本質(zhì)和功能的知識和理解”。[3]92Fries的語言交際觀以及對待語言學的科學態(tài)度決定了他選擇真實交際中的語言作為研究材料。
20世紀早期,語言學研究的重點還是在對書面語言,特別是文學語言的研究上。而Fries認為文學語言與真實話語相比,實現(xiàn)的交際功能有限,對于語言學研究的價值也有限。因此,他強調(diào)“真正”的語言是人們在交際中使用的口語。在其專著《美國英語語法》一書中,他指出“對于調(diào)查當今美國英語的音調(diào)變化和句法來說,最理想的材料莫過于大量記錄那些自然發(fā)生 (spontaneous),即席而成 (unstudied)的語言”。[4]99為了完成對英語結構的研究,F(xiàn)ries 從1946年開始,用錄音機記錄了美國中北部說標準英語的人的許多會話材料。他收集了大約300個不同說話人所提供的內(nèi)容各異的50個小時的會話錄音,經(jīng)過轉寫后語料庫庫容總共達到25萬多字。[5]
站在真實客觀數(shù)據(jù)的立場上,F(xiàn)ries對于主觀內(nèi)省的材料有所貶抑。他堅信,既然語言是潛意識的、自發(fā)的行為,那么把內(nèi)省這種帶有一定意識的材料作為研究的數(shù)據(jù)源是“極其”可疑的。[6]75Fries的數(shù)據(jù)觀與當代語料庫語言學的數(shù)據(jù)主張完全吻合。Firth強調(diào)使用“驗證的”(attested)數(shù)據(jù),而與之一脈相承的Sinclair則主張使用“自然發(fā)生數(shù)據(jù)” (naturally occurring data)。[2]25與以上二者稍微不同的是,F(xiàn)ries在肯定真實使用中的數(shù)據(jù)的同時,并沒有完全否定內(nèi)省數(shù)據(jù)的價值。比如,他認為內(nèi)省在語言學研究中有提示 (suggestions)和啟示 (hunches)的作用。[4]
除了強調(diào)真實客觀的數(shù)據(jù)以外,F(xiàn)ries還注意到了數(shù)據(jù)的代表性。這是基于他對語言學研究進行科學處理的自然結果。他認為,用于語言分析的的數(shù)據(jù)必須是能夠代表某個社區(qū)語言的“代表性樣本”。當然,“代表性樣本”本身就是一個有爭議的概念,因為數(shù)據(jù)是否具有代表性取決于“想要代表誰”。Peter H.Fries①Peter H.Fries是Charles C.Fries的兒子,現(xiàn)為美國中密歇根大學教授。歸納了語言學家通常使用的兩種語料庫采樣方法:隨機采樣和系統(tǒng)采樣。[4]隨機采樣指的是收集各種類型的語言實例,其目的是為了獲得支持研究的證據(jù)或用于教學。這種采樣的缺陷是無法給語言現(xiàn)象以全面的觀察,因此其代表性較弱。而系統(tǒng)采樣指的是系統(tǒng)地收集語言某個層面的代表性樣本,特別注意樣本要代表的對象及收集樣本的方法。Matthiessen把前一種樣本統(tǒng)稱為“文檔” (archive),而把后一種樣本稱為“語料庫” (corpus)。[7]雖然Fries在研究中力圖使用具有代表性的語料庫,但是有時由于一些客觀原因又不得不與社會現(xiàn)實妥協(xié)。比如,在對英語結構的研究中,盡管他使用了錄音機,但是由于受到客觀條件的限制,他只錄制了極其有限的幾個人的會話。但是這在當時已屬不易。“我們不能因為條件的限制,而否定他所收集的語料及其研究的價值”。[4]103
Fries對于數(shù)據(jù)代表性的主張還包括對語域的考慮。盡管 Fries并沒有正式提出“語域”(register)的思想,但是他清楚地知道人們在從事不同的社會活動時會相應地改變所使用的語言。在研究shall和will的用法時,他發(fā)現(xiàn)“在幾種文體當中,由于不同語法人稱的分布,導致它們在數(shù)據(jù)上的分布也不同。因此,可比較的統(tǒng)計數(shù)據(jù)必須來自同一類型的文體”。[8]987-989而在撰寫專著《美國英語語法》的時候,他在選擇研究數(shù)據(jù)的過程中就非常注意選擇那些同一主題的信件,要求“這些通信必須涵蓋不同話題。使用的材料基本上都是在詳細描述家庭情況,比如家庭活動、家庭糾紛等等”。[4]107在語料庫語言學成為一門科學的過程中,語料庫的代表性起著關鍵性作用,因為它保證了語料庫調(diào)查結果真實可靠。從理論上來講,語料庫的庫容越大,收集的素材類型越多,其代表性就越強。而Fries的語料庫實踐啟示我們:語料庫的代表性取決于它“想要代表誰”。語料庫的選擇和收集最好是參考語料庫研究的目標和對象來定。研究中所使用的語料庫并非越大越好,而是取決于所研究語言特征在語料庫中是否有充足的出現(xiàn)率。
Fries使用的一個重要研究手段是“對比性特征” (contrastive features)。[9]43-44詞匯意義由詞匯項的對比性特征表示,結構意義由這些詞匯項的對比性排列和形式表示。[10]Fries指出,識別一種語言的詞型 (word-pattern)和句型(sentence pattern)的功能單位并不是由一些語音特征像積木那樣相加組合在一起。[3]98這些功能單位其實是一些抽象的對比性差異——聲音特征、序列、分布、音高上的對比性差異。所以在Fries看來,“結構意義是語句基本的、必要的意義,是語句最重要的部分。這就使得Fries注重研究表示結構意義的信號,研究形式和對比的對比性區(qū)別”。[9]44Fries(1928)在編撰《近代英語詞典》 (Early Modern English Dictionary)時,精選了69篇具有代表性的語篇,并制作了700 000張用法小紙條。[4]這些紙條詳細記錄了每個詞每個意義的差別性語境。Fries把這些差別性語境稱之為不同意義的“詞匯集” (lexical sets)。需要注意的是,F(xiàn)ries的“詞匯集”概念涵蓋“搭配”和“類聯(lián)接”這兩種語言現(xiàn)象。在語法結構上,他既關注橫組合也關注縱聚合。但是相比較而言,從他的語言對比觀出發(fā),他更強調(diào)縱聚合結構在語言研究中的重要性。在Fries幾乎所有的大型研究項目中,他總是利用語料庫對出現(xiàn)在語料庫當中的對立性對比特征(conflicting contrastive features)進行系統(tǒng)性、窮盡性統(tǒng)計。這足見他在數(shù)據(jù)分析中對縱聚合關系的重視。
Fries的研究焦點與當代語料庫語言學的研究對象不謀而合?;贔irth學說的語料庫語言學將研究對象設定為“真實使用中的語言,中心內(nèi)容包括重現(xiàn)的語言型式及其基本規(guī)律、不同方式的意義與功能的實現(xiàn),等等”。[2]25Sinclair則提出了擴展意義單位 (Extended Unit of Meaning)概念。根據(jù)Sinclair的說法,擴展意義單位包括了詞的搭配、類聯(lián)接、語義選擇趨向和語義韻等內(nèi)容??梢?,F(xiàn)ries關注的研究焦點正是當代語料庫語言學所關注的重要研究對象。
Peter H.Fries總結出語料庫分析大致有三種范式:(1)為了配合某人的研究目的而搜索語料庫,尋找合適的例證;(2)在語料庫中系統(tǒng)地、徹底地分析所有相關例證;(3)對語言某個層面的對立性對比特征進行系統(tǒng)性、窮盡性統(tǒng)計。[4]雖然這三種范式Fries都用,但是他比較偏向使用第三種。因為他覺得,統(tǒng)計對比性特征可以在語言的使用和發(fā)展中識別語言型式。Fries一直反對將語言看作是一組沒有聯(lián)系的詞項。他堅持認為詞項間的關系才是最重要的。因此,他提出從結構主義的觀點出發(fā),所有孤立的詞項都不具備語法意義。只有當它們在一個任意的型式系統(tǒng)當中與別的詞項構成對立才有語法意義。也就是說,語言當中最重要的是處于對比之中的語言特征”。[3]
無論Fries使用上面的哪一種方法,我們都可以看出這是一種基于語料庫的研究方法。而當代語料庫語言學早已分化為“基于語料庫”和“語料庫驅(qū)動”兩大陣營,盡管有些學者反對這樣的區(qū)分或者認為兩大陣營正在融合。[11-13]在這一點上,我們贊同衛(wèi)乃興的立場,即“兩大陣營的區(qū)分似乎不宜絕對化。絕對或純粹的客觀證據(jù)并不存在……語料庫研究的主流方法是數(shù)據(jù)驅(qū)動,但假設驅(qū)動的研究也應有其一席之地”。[1]18總之,二者并非是對立、不可調(diào)和的,而是相輔相成的關系。它們完全可以從對方的研究當中汲取養(yǎng)分從而達到相得益彰的效果。
Fries的語料庫語言學思想概括一下主要有以下幾點:(1)語言學是一門科學。因此,他主張用實證的研究方法來研究真實交際中的語言。(2)口語是第一性的。書面語只不過是口語的映像。(3)數(shù)據(jù)要想具有代表性必須考慮到語域的差異。(4)語言學研究的焦點是語言中的對比性特征。不過,F(xiàn)ries的語料庫語言學思想及方法也存在著一些不足。這其中一部分是客觀條件的限制所致,比如,從Fries的所有語料庫研究來看,他從未使用過賦碼的計算機語料庫,所使用的一些統(tǒng)計手段也只是頻數(shù)統(tǒng)計。相比之下,當代語料庫語言學已經(jīng)發(fā)展起一套非常精密復雜的語料賦碼系統(tǒng)和數(shù)據(jù)統(tǒng)計手段。另外一部分不足則源于Fries的個人認識。比如,他太過強調(diào)口語語料和定量研究的重要性,因而忽視了書面語料和定性研究。雖然Fries在研究當中注意到了語域的差異,但是他卻沒有意識到口語和書面語也只不過是語域的一種變體。另外,書面語料對于語料庫語言學研究來說同樣重要。盡管有學者指出“語言研究應當更多地注重口語”,[14]但是從世界范圍內(nèi)來看,目前絕大多數(shù)語料庫研究還是基于書面語料的。這個跟建成的語料庫絕大部分是書面語料庫不無關系。其次,當代語料庫語言學的研究范式也不再是單純的定量研究,而更多的是定量和定性相結合的研究。
Fries從20世紀20年代起就開始使用手工的語料庫進行研究,比Quirk等進行的“Survey of English Usage”以及 Henry Kucera和 W.Nelson Francis創(chuàng)建的BROWN語料庫要早將近40年。因此,他完全可以稱得上是語料庫語言學的先驅(qū)。從以上討論可以看出,盡管有些許不足,但是Fries的不少語料庫語言學思想至今都是語料庫語言學研究的基本指導原則。研究Fries的語料庫語言學思想及方法,不僅可以填補語料庫語言學史研究上的空白,而且還有助于繼承Fries的語料庫語言學遺產(chǎn),推動當代語料庫語言學思想與方法的創(chuàng)新。
[1]衛(wèi)乃興.John Sinclair的語言學遺產(chǎn)——其思想與方法評述[J].外國語,2007(4):14-19.
[2]衛(wèi)乃興.語料庫語言學的弗斯學說基礎[J].外國語,2008,31(2):23-32.
[3] FRIES CHARLES C.Linguistics and Reading[M].New York:Holt,Rinehart and Winston,1963.
[4] FRIES PETER H.Charles C.Fries,Linguistics and Corpus Linguistics[J].ICAME Journal,2010,34:89-119.
[5] FRIES CHARLES C.The Structure of English[M].New York:Harcourt Brace,1952.
[6] FRIES PETER H C C.Fries'View of Language and Linguistics[M] //P H FRIES,N M FRIES.Towards an Understanding of Language:Charles C.Fries in Perspective.Amsterdam,New York:John Benjamins,1985:63-84.
[7] MATTHIESSEN CHRISTIAN M I M.Frequency Profiles of Some Basic Grammatical Systems:An interim report[M] //G THOMPSON,S HUNSTON.System and Corpus:Exploring Connections.London:Equinox,2006:103-142.
[8] FRIES CHARLES C.The Periphrastic Future withshallandwillin Modern English[J].PMLA,1925,40(4):963-1024.
[9]楊信彰.Charles C.Fries的語言交際理論與信號語法[J].外國語,2000(1):41-46.
[10] FRIES CHARLES C.Meaning and Linguistic Analysis[J].Language,1954,30(1):57-68.
[11]MCENERY T,RICHARD X,TONO Y.Corpusbased Language Studies:An Advanced Resource Book[M].London and New York:Routledge,2006.
[12] GRIES S TH.Corpus Linguistics and Theoretical Linguistics:A Love-hate Relationship?Not necessarily…[J].International Journal of Corpus Linguistics,2010,15(3):327-343.
[13]濮建忠.語料庫與語言一元化研究[J].解放軍外國語學院學報,2010,33(2):41-44.
[14]衛(wèi)乃興.約翰·辛克萊“語料庫語言學的發(fā)展與前景”導讀[J].現(xiàn)代外語,2004,27(2):112.