陳功 梁茂成
(對外經(jīng)濟貿(mào)易大學(xué),北京100029;北京外國語大學(xué),北京100089)
型式語法(Pattern Grammar)是在COBUILD語法研究成果的基礎(chǔ)上產(chǎn)生的,是對COBUILD成果的全面總結(jié)。作為第一部語料庫驅(qū)動的英語描寫語法,它顛覆以往語言學(xué)家看待語言、獲取語言知識的傳統(tǒng),給語言研究提供一個全新的視角。為了讓更多的研究者了解型式語法在理論和實踐方面的貢獻及價值,本文從型式語法產(chǎn)生的背景、理論淵源、內(nèi)容、特點和應(yīng)用價值等方面對其進行詳細的梳理和探討。
作為一種全新視角的語言描寫理論,型式語法的產(chǎn)生和發(fā)展絕不是偶然的。下文將從3個方面詳細探討型式語法產(chǎn)生的時代背景。
在現(xiàn)代語言學(xué)研究中,各個時期占據(jù)主導(dǎo)地位的語法研究都體現(xiàn)出重結(jié)構(gòu)、輕詞匯的傾向。無論是索緒爾的“組合關(guān)系、聯(lián)想關(guān)系”,布龍菲爾德的“直接成分分析法”,還是喬姆斯基的“句法研究”,“都將語法視為獨立于詞匯的一個系統(tǒng)”(Hunston, Francis 2000:7),“結(jié)構(gòu)第一位,詞匯第二位”(Owen 1993:168)。由于結(jié)構(gòu)主義和喬姆斯基的強大影響,詞匯—語法二元劃分根深蒂固,影響到理論語言學(xué)界和應(yīng)用語言學(xué)界的大批學(xué)者。
20世紀70年代以后,語言學(xué)研究開始越來越多地關(guān)注詞匯,并將詞匯看成語言的核心(Hunston,F(xiàn)rancis 2000:7)。 到90年代,盡管詞匯—語法二元劃分的影響依然深刻,但學(xué)者對詞匯研究的觀點已經(jīng)逐漸達成共識。Owen指出,“盡管傳統(tǒng)主流的力量仍就強大,但在過去的十幾年中,研究方向已經(jīng)發(fā)生了明顯的轉(zhuǎn)變”(Owen 1993:169),即“從對結(jié)構(gòu)事實的解釋向?qū)υ~匯事實的解釋轉(zhuǎn)變的趨勢”(Hudson 1990:3)。 這是語法研究的第一次轉(zhuǎn)向。
如果語法研究第一次轉(zhuǎn)向的目的是為了糾正當時“重語法、輕詞匯”的傾向,尋求語法研究和詞匯研究之間的平衡,那么,第二次轉(zhuǎn)向則開始真正深入看待語法—詞匯之間的關(guān)系。對此,不少研究者意識到,語法和詞匯并不是非此即彼的關(guān)系,兩者是不可分割的(Sinclair 1991,Halliday 1976,F(xiàn)rancis 1993)?!懊總€單詞都有自己的語法”(Lewis 1993:142),組成語言的單位是“語法化了的詞匯,而不是詞匯化了的語法”(同上:vi)。
20世紀80年代之后,關(guān)于多詞單位或短語的研究開始出現(xiàn),如Pawley和Syder(1983)、Melcuk(1995)等。盡管短語研究的時間長,范圍廣,研究者們卻“始終沒有將短語看作是一種正常的語言組織原則”(Hunston, Francis 2000:21),相反,“只有當語法不能解釋一些語言現(xiàn)象時,我們才會轉(zhuǎn)而尋求短語的幫助”(同上:254)。短語所受到的空前重視與其在語言研究中的實際地位極其不相符。正是在這樣的需求下,3代語料庫語言學(xué)家Firth,Sinclair,F(xiàn)rancis,Hunston等人在搭配、短語學(xué)等領(lǐng)域不斷探索,推陳出新,逐漸形成對語言規(guī)律的獨特認識。
“在20世紀50年代以前,現(xiàn)代語言學(xué)的傳統(tǒng)……都注重語言事實,提倡經(jīng)驗主義”(Hunston 2006:11),即“從實踐出發(fā),以行為數(shù)據(jù)為研究對象,對言語進行科學(xué)、系統(tǒng)的描寫,并從中歸納出語言理論”(梁茂成2010:90)。然而,隨著喬姆斯基在語言研究中主導(dǎo)地位的確立,經(jīng)驗主義的傳統(tǒng)逐漸被主流遺棄,語言研究進入主要通過內(nèi)省和直覺來解釋語言的理性主義時期。
理性主義強調(diào)研究者的分析解釋能力,本身并無過錯。然而,喬姆斯基對經(jīng)驗主義的排斥以及對真實語言的忽視卻逐漸引來質(zhì)疑聲音。一方面,“理性主義的研究所得出的語言規(guī)則似乎只能適用于一種子語言,而不能推廣到該子語言之外的其他語言現(xiàn)象,具有很大的局限性”(馮志偉2006:12)。另一方面,語言學(xué)家的直覺是否如他們所相信的那樣可靠,是否可以說基于直覺的語法“更多的是對直覺的研究,而非對語言的研究”(Sinclair 1991:4)。
在對理性主義不斷質(zhì)疑的同時,語料庫建設(shè)卻如火如荼地展開。由于語料庫研究尊重語言事實,注重對真實語言的描述,經(jīng)驗主義的傳統(tǒng)開始回歸。受這一趨勢的影響,“大多數(shù)學(xué)者認為:語言學(xué)的研究必須以語言事實作為根據(jù),必須詳盡地、大量地占有材料,才有可能在理論上得出比較可靠的結(jié)論”(馮志偉 2006:12 -13)。
經(jīng)驗主義的回歸是另外一個語言學(xué)研究時代——“后描寫主義”時代的開始,型式語法是這個時代的典型代表。
新方法的出現(xiàn)不僅可以對以往觀點或理論進行證實或證偽,還能激發(fā)思想,催生新的理論。Hunston和Francis指出,“不管在任何研究領(lǐng)域,新的方法不僅帶來新的數(shù)據(jù),更能帶來不同類型的數(shù)據(jù),從而進一步啟發(fā)出新的理論”(Hunston,F(xiàn)rancis 2000:250)。型式語法的出現(xiàn)就是得益于語料庫研究方法在研究思路和研究工具上的新進展。
前計算機時代的語言學(xué)研究者在搜集、整理和加工語言材料時,基本上完全靠手工進行,而且獲得的語言材料極其有限?!按笠?guī)模機器可讀語料庫的出現(xiàn)和使用,把語言學(xué)家從艱苦繁重的手工勞動中解放出來,使語言學(xué)家可以集中精力來研究那些更加重要的問題,這對于促進語言學(xué)研究的現(xiàn)代化具有不可估量的作用?!保T志偉2010:34)
另外,語料庫檢索軟件的出現(xiàn)也使我們能夠更加方便地觀察語言,獲取語言知識。Hunston指出:“如果沒有語料庫檢索軟件的幫助,語料庫充其量只是一大批實際使用語言的集合。而檢索軟件能夠以不同的方式對語料進行重新排列組合,可以使我們進行多方面的觀察”(Hunston 2002/2006:3)。它的出現(xiàn)使語料庫研究方法成為語言研究中的“顯微鏡和望遠鏡”(Stubbs 1996:231),擴大語言學(xué)研究的視野,“使他們看得更遠,看得更細,從而使他們能夠發(fā)現(xiàn)更多的語言現(xiàn)象,挖掘出更多的語言事實”(馮志偉 2006:14-15)。和20世紀美國的結(jié)構(gòu)主義語言學(xué)相比,語料庫語言學(xué)同樣重視描寫和分析,但是在方法上卻有質(zhì)的飛躍。
型式語法的理論淵源可以追溯到倫敦學(xué)派的奠基人 J.R.Firth(1957)在“Modes of Meaning”一文中對搭配(collocation)及其意義的研究。不過,對型式語法產(chǎn)生直接影響的則主要是Sinclair的語言思想以及Francis對前人思想和方法的繼承與發(fā)展。
Sinclair主張語法和詞匯不可分割,并提出根本上與傳統(tǒng)語法不同的思想,對型式語法的產(chǎn)生和發(fā)展起到直接的推動作用,主要表現(xiàn)如下:
(1)語料庫驅(qū)動語言描寫對語料的要求:Sinclair(1991)對語料庫語料的關(guān)注構(gòu)成語料庫驅(qū)動語言描寫的基礎(chǔ)。Hunston和 Francis(2000:15)總結(jié)Sinclair對語料5個方面的要求:第一,語料要真實,依靠語言學(xué)家的內(nèi)省或直覺獲得的數(shù)據(jù)是不可靠的;第二,不能根據(jù)研究需要選擇語料,傳統(tǒng)的語言學(xué)研究通常會使用例句對語言點進行闡述,這一做法等于“按圖索驥”,是不可取的;第三,語料數(shù)量要大,Sinclair的一個觀點就是bigger is always better(同上:16),語料庫的容量越大,我們就越有可能對低頻詞項進行更加準確的描述;第四,語料的組織要系統(tǒng),語料的組織決定文本以何種方式呈現(xiàn),從而最終決定研究者對語料的觀察;第五,不要根據(jù)現(xiàn)有理論對語料進行標注,除了對標注的準確性有所顧慮之外,Sinclair最擔(dān)心標注依據(jù)的理論對語料庫研究創(chuàng)新的束縛將會使發(fā)現(xiàn)新的語言現(xiàn)象或規(guī)律的可能性大大降低。
(2)意義與結(jié)構(gòu)(sense and structure)的聯(lián)系:Sinclair(1991)通過對多義動詞及其所在結(jié)構(gòu)進行考察發(fā)現(xiàn),意義與結(jié)構(gòu)有千絲萬縷的聯(lián)系。具體來說,如果一個詞有多個義項,并且該詞可以用于多個型式,那么每一個型式總會相對應(yīng)地與其中一個義項頻繁共現(xiàn),這樣,我們反過來可以通過型式來預(yù)測該詞的意義。因此,Sinclair明確表示,“意義和句法之間的聯(lián)系表現(xiàn)出了很強的共現(xiàn)傾向”(Sinclair 1991:65)。 “在正常的語篇當中,結(jié)構(gòu)確實能夠有效地區(qū)分意義”(Hunston,F(xiàn)rancis 2000:21),“形式和意義根本上是不可分的”(Sinclair 1991:7)。
(3)成語原則:Sinclair(1991)的主要貢獻之一是提出觀察或解釋語言的兩個不同模型:開放原則和成語原則。開放原則,也稱為“空位—填充”模型,主要為詞匯的選擇提供基本的語法約束,保證語言的合語法性,是傳統(tǒng)研究看待或描寫語言的方式。然而,Sinclair同時也發(fā)現(xiàn),更多的詞匯選擇是開放原則無法解釋的,“語言使用者掌握了大量的半預(yù)制的短語結(jié)構(gòu),雖然每個短語看上去都可以分成不同的部分,但卻構(gòu)成使用者的唯一選擇”(Sinclair 1991:110),這就是成語原則。它表明語言具有短語傾向,即詞語不是孤立存在,而是通過它們的共選關(guān)系而獲得意義。大部分文本都可用成語原則來解釋,具體來說,“80%以上的詞項共現(xiàn)具有共選關(guān)系,只有20%的詞項是通過獨立的語法聚合選擇出現(xiàn)的”(Sinclair 2000)。
(4)意義單位(units of meaning):開放原則作為語言的語法模型,將單詞的詞匯語義層面和句法組織割裂開來(Barnbrook 2007),句子結(jié)構(gòu)空位對詞匯的選擇基本上是基于單詞的詞性,完全不考慮語義。喬姆斯基轉(zhuǎn)換生成語法的短語結(jié)構(gòu)成分就是很好的例子。
Sentence→NP+VP
NP→T+N+Number
Number→ {sing, pl}VP→Verb+NP
Verb→Aux+V
Aux→Tense
T→the
N → man, ball, etc.
V → hit, took, etc.
(Malmkj?r 1991:483)
盡管這一系列規(guī)則可以保證生成的句子符合語法,但所有詞匯和語義方面的問題都未加以考慮。
與開放原則不同,成語原則的基本單位不是詞,而是詞所重復(fù)出現(xiàn)的短語。在對搭配、短語的研究中,Sinclair發(fā)現(xiàn)短語的意義“分布于整個短語的所有詞匯中”(Sinclair 1987:110),如 have a bath(Sinclair 1991:113),其中,have義項眾多,通過與短語中其他詞的共選才獲得該短語作為一個整體唯一的意義。這很好地解釋語言中的意義是如何產(chǎn)生的,而作為意義單位的短語也被認為是語料庫描述語法的核心單位。
(5)搭配框架:Sinclair和Renouf提出“搭配框架”(collocational framework)的概念,如a +? +of等。他們的研究證明,搭配框架和其中的搭配詞高度共選,而且這些搭配詞屬于特定的意義范疇。如an+? +of框架中的名詞可分為7個不同的意義組(Sinclair, Renouf 1991:136 -137)。
這一研究對型式語法具有兩大積極的影響。第一,對于同一種語言現(xiàn)象的描述可以有很多種不同的方法。該發(fā)現(xiàn)令Hunston和Francis喜憂參半,喜的是“對英語的描述原來可以有多種視角”;憂的是多視角下的“語言描述將永無止境”(Hunston, Francis 2000:26)。 因此,盡管“搭配框架”的真正描寫還不無問題,但型式語法的方向卻清晰很多?!耙徊空Z料庫驅(qū)動語法需要多方面、多視角地對英語進行描述”,而且“讓這部語法做到非常完備、全面幾乎是不可能的”(同上:27)。第二,對搭配框架提取方法的思考。Sinclair和Renouf(1991)的研究完全依靠計算機自動提取,該方法省時省力,但卻容易遺漏其它一些重要的語法信息。基于此,Hunston和Francis提出兩種完全不同卻又互補的方法:一是完全依靠計算機軟件,根據(jù)共現(xiàn)頻率提取搭配;二是采取更有解釋力的人工查找的辦法(Hunston,F(xiàn)rancis 2000:27)。盡管型式語法的最終提取方法并不僅僅是兩者的折中,但方法的思考卻對型式語法產(chǎn)生至關(guān)重要的影響。
Francis是Sinclair語法思想的繼承者和發(fā)揚者,主要在以下4個方面發(fā)展了Sinclair的思想,也逐漸成就了型式語法。
(1)意義和型式:Francis的“意義和型式”(同上:29)雖然在措辭上只是略不同于Sinclair的“意義和結(jié)構(gòu)”(Sinclair 1991:53),卻是對 Sinclair思想的深化,主要表現(xiàn)為3個方面:第一,Sinclair的“結(jié)構(gòu)”概念較大,一個結(jié)構(gòu)可以是短語,可以是小句,也可以是整個句子。而根據(jù)Sinclair(1991)考察的例子,即多義動詞的義項與其所在結(jié)構(gòu)的關(guān)系,這個“結(jié)構(gòu)”顯然應(yīng)該是一個局部概念,稱為“短語結(jié)構(gòu)”或“型式”更為合理。第二,“型式”這一概念可以更好地將Sinclair的“意義和結(jié)構(gòu)”與成語原則下的“意義單位”結(jié)合起來。第三,Sinclair(1991)僅探討多義詞的不同義項可以在各自典型的結(jié)構(gòu)中得以區(qū)分,而Francis則著重考察另一個方面,即“特定的型式能夠選擇具有特定意義的詞”(Hunston, Francis 2000:29)。
(2)詞匯語法和短語學(xué):在承認語法和詞匯不可分割的基礎(chǔ)上,F(xiàn)rancis(1993,1995)首先肯定詞匯的重要地位,并指出“句法是由詞匯驅(qū)動的,詞匯在交際中具有優(yōu)先性”,或許這就是為何Hunston和Francis(2000)將其專著Pattern Grammar的副標題定為“語料庫驅(qū)動的英語詞匯語法”的原因。
Francis指出,詞匯語法“認識到橫組合型式(syntagmatic patterning)以及受其影響的詞匯選擇在語言架構(gòu)中的重要性”(Francis 1993:142-143)。換句話說,“句法結(jié)構(gòu)和詞項之間具有共選關(guān)系,不能將其分開考察”(Hunston,F(xiàn)rancis 2000:30)。具體表現(xiàn)為:一方面,特定的句法結(jié)構(gòu)通常與特定的詞項共現(xiàn);另一方面,詞項通常只出現(xiàn)在有限的結(jié)構(gòu)中。詞匯語法的目標就是關(guān)注處在“短語漸變區(qū)”中具有不同程度共選傾向的短語,并對其進行忠實的描述(Francis 1993:143, 146)。
(3)對語料庫驅(qū)動描寫語法研究方法的探索:對 Sinclair和 Renouf(1991)研究方法的思考給Francis非常大的啟示,F(xiàn)rancis提出“從環(huán)境①到詞項,再到環(huán)境”的觀察路徑(Francis 1993:146)。在COBUILD語法型式系列(Francis et al.1996,1998)的編撰過程中,上述方法也得到進一步的細化和完善。在大多數(shù)情況下,觀察是從詞項到環(huán)境;需要補充語法信息時,再從環(huán)境回到詞項,目的是為了盡量完整地列出各個型式分別所選擇的詞項。此外,還需要對由此產(chǎn)生的詞項列表進行義項的分組歸類,這個任務(wù)主要由語法學(xué)家人工完成。
值得一提的是,在整個語法系列的編撰過程中,除語料庫驅(qū)動的方法外,語言學(xué)家的人工處理也占據(jù)很大比重。Francis和Sinclair明確表示,COBUILD的工作離不開語言學(xué)家的直覺(Francis,Sinclair 1994:191)。COBUILD提倡使用真實語料,忠實語言事實,但這并不等于對直覺的壓制或拋棄,相反,語料庫在輔助人們的語言直覺和內(nèi)省的同時,離不開研究者本人的語言分析和判斷能力。
(4)對語料庫驅(qū)動語法的進一步探討:對語料庫驅(qū)動語法和傳統(tǒng)語法的不同,F(xiàn)rancis總結(jié)4點內(nèi)容:第一,語例真實,COBUILD項目語法研究的觀察語料和語例均取自“Bank of English”語料庫;第二,旨在構(gòu)建一部非對比語法,即只展示詞項本身的用法,不與其他詞項或其他范式的用法做對比;第三,定位為數(shù)據(jù)驅(qū)動語法,通過觀察大規(guī)模語料來獲得對語言的認識,是語料庫時代“基于觀察的語法”,而不是“基于直覺的語法”(Aarts 1991:46);第四,旨在構(gòu)建一部真正意義上的詞匯語法(Francis 1993:137 - 139)。
和傳統(tǒng)語法標注相比,型式語法的編碼設(shè)計有較為大膽的改革,基本上不采用語法功能標簽,如vt.(及物動詞)、V+O(動詞+賓語)等作為語法編碼的做法。取而代之的是一串字母加具體單詞或相關(guān)說明文字的組合,例如,V nasn,型式的基本要素包括3個部分。為了便于解釋,筆者將3個部分分別稱做核心詞項、補足成分和其他成分。其中,核心詞項(V)是構(gòu)成型式最為關(guān)鍵的要素,是任何型式都不可缺的成分;補足成分和其他成分則根據(jù)語言的不同使用規(guī)律附加于核心詞項,或為具體單詞(如 V so/not, I hope so.),或為成分說明(如V n to-inf ,I need you to bethere.),或兩者同時用于型式的構(gòu)成(如V natn,He shot a glace at her.)。根據(jù)需要將這些編碼進行組合便可構(gòu)成核心詞項的不同型式。
型式語法的編碼主要遵循靈活性、透明性和一致性3 個原則(Hunston, Francis 2000:33)。 首先,編碼的靈活性是指語法標注不受短語長度的限制。由于編碼只使用表層的分類范疇和具體單詞,因此不論型式有多長,都可以使用有限的編碼將其表示出來。在例句It seemsto me that I had done everything I could中,動詞seem的型式可以通過簡單的編碼表達為it V to n that.第二,透明性在一定程度上反映語法編碼的易懂性,即語法編碼不考慮句法方面的抽象概念,只反映詞項的表層使用以方便學(xué)習(xí)者的理解和記憶。第三,一致性是指編碼要保持統(tǒng)一,進行表層描述。在傳統(tǒng)的詞典中,make her happy往往會被標注為verb+object+adjective,其中不僅包括功能標簽object,還包括詞類標簽verb,這是語法編碼的混合使用。
盡管型式語法的編碼也存在多種類型,如詞類標簽(n, v, adj等)、具體詞項(on, into, of)、語言使用說明(amount,with quote等),但筆者通過文獻學(xué)習(xí)發(fā)現(xiàn),這樣的編碼設(shè)計有其特定的考慮。首先,型式語法的編撰者關(guān)注的只是對語言表層的描述,不論采用何種編碼,只要不違背表層描寫原則并能方便學(xué)習(xí)者的理解和記憶,都可為我所用。其次,型式語法編碼體現(xiàn)對傳統(tǒng)語言學(xué)研究成果的尊重和認同,如詞類劃分標簽,但并不是簡單的繼承,而是結(jié)合型式語法的編碼需求,對其內(nèi)涵或外延進行適當擴展。例如,在型式語法中,傳統(tǒng)語言學(xué)名詞詞類標簽n并不單純指一個詞,還可以指整個名詞詞組。正如 Hunston和Francis所言,“型式語法的編碼體系是語言使用概括與具體的折中,盡量能夠做到在描述一棵樹的同時,腦中還裝著整片森林”(同上:249)。
型式語法的兩個理論主張是詞匯和語法不可分與型式和意義相聯(lián)系(同上:250)。
在型式語法中,詞匯和語法互不可分。也就是說,核心詞項與其他詞項或其所在結(jié)構(gòu)存在共選關(guān)系,相互之間具有形式上的依賴性,而且詞項和結(jié)構(gòu)之間并不是簡單的一一對應(yīng)關(guān)系,本文以動詞為例進行闡述。
首先,詞項對型式有選擇,而且一個動詞詞項可以對應(yīng)多個不同的型式。動詞的行為是復(fù)雜的,在大多數(shù)情況下,一個型式根本無法滿足描寫的需要。例如,通過觀察動詞explain與周圍其他詞項的共現(xiàn)情況,我們可以歸納出該動詞所依賴的9個不同型式(如V n,V wh,V about n等)。
其次,型式對詞項也有選擇,而且一個型式可以選擇若干個不同的動詞。也就是說,這些動詞的用法在特定的語境中相同,可以出現(xiàn)在同一個型式中。例如,對于型式V over n,有許多動詞符合要求,其中包括 argue,compromise,disagree,quarrel等。
型式和意義相聯(lián)系是指核心詞項與其他詞項或其所在結(jié)構(gòu)共同構(gòu)建一個穩(wěn)定的意義,該意義與型式不可分割。例如:
表1 型式V as n的動詞詞項列表
通過對表1中動詞型式V as n的動詞列表進行簡單觀察便可發(fā)現(xiàn),共享同一型式Vasn的這組動詞并不是任意出現(xiàn)的,其中很多詞項在意義上非常接近,例如,enlist和 volunteer, resign,stand down和 step down,begin和 start,end,end up,finish和finish up等。根據(jù)意義的相關(guān)性我們可以把動詞劃分成不同的意義組,根據(jù)Francis等(1996:159-162),這48個動詞可以被劃分成6個意義組(見表2給出的其中3個意義組)。
觀察表2可以發(fā)現(xiàn),這些動詞之所以能按照意義進行分組是因為對于共享同一型式的眾多詞項來說,雖然它們常用的詞典意義不盡相同,但由于同一型式所造成的語言環(huán)境,或多或少產(chǎn)生意義上的交集。簡單來說,共享型式的詞項同時也共享其詞意的某些方面(Hunston,F(xiàn)rancis 2000:256)。例如,動詞qualify,train是在它們共同的使用環(huán)境V as n中體現(xiàn)出與“入職培訓(xùn)”相關(guān)的意義。我們很難說是意義的構(gòu)建產(chǎn)生相應(yīng)的型式,還是型式的構(gòu)建產(chǎn)生相應(yīng)的意義,總之,型式和意義在很大程度上是不可分的。
表2 型式V as n中的動詞意義分類(部分)
不可否認,型式語法是語料庫理論建設(shè)的優(yōu)秀成果,是英語語法理論的一個突破。除了在COBUILD詞典中做語法標注之外,型式語法還在英語教學(xué)領(lǐng)域和自然語言處理領(lǐng)域有不可估量的應(yīng)用價值,這和型式語法一開始的定位——教學(xué)語法和描寫語法——不無關(guān)系。
型式語法在教學(xué)中的應(yīng)用價值主要有4個方面:
第一,型式語法有助于提高學(xué)習(xí)者的語言意識。大規(guī)模語料觀察表明,型式語法重在對詞項表層行為的關(guān)注,詞項的行為具有高度的重復(fù)性和規(guī)律性,讓學(xué)習(xí)者認識到這一點非常重要。另外,型式語法的編碼在設(shè)計之初就已經(jīng)考慮到要盡可能方便學(xué)習(xí)者的接受和理解,因此,其簡潔透明的特性在某種程度上可以幫助學(xué)習(xí)者更加清晰地把握語言規(guī)律,并掌握詞項的典型用法。
第二,型式語法有助于提高學(xué)習(xí)者語言產(chǎn)出的準確性和流利性。型式語法是一部詞的語法,提供具體詞項的詳細信息,學(xué)習(xí)者在了解詞項及其型式的同時,就可獲得具體詞項的用法,有助于提高學(xué)習(xí)者語言產(chǎn)出的準確性。例如,通過學(xué)習(xí)動詞discourage及其型式 V n from n/-ing,便可知 discourage的典型用法是discourage+名詞詞組+介詞from,其中介詞from不可隨意替換。而一旦學(xué)習(xí)者掌握該詞及其詞項,其語言產(chǎn)出也會相應(yīng)地是整個詞項的短語。
第三,型式語法有助于學(xué)習(xí)者詞匯的積累。型式語法不僅歸納出所有詞項的所有型式,還對同一型式下的詞項進行意義分組。換句話說,有一部分詞項不僅用法相同,意義也相似。例如,在學(xué)習(xí)動詞discourage及其型式V n from n/-ing時,教師可以根據(jù)學(xué)習(xí)者的詞匯水平列出與discourage同一意義組的詞項,如 stop, keep, prevent,prohibit, restrain, restrict,等等。 這樣,學(xué)習(xí)者既學(xué)到discourage的用法,也了解到其他類似的詞匯及用法。此外,由于這些詞項之間存在意義上的聯(lián)系,更方便學(xué)習(xí)者記憶。
表3 用不同的型式和詞項表達同一意義
第四,型式語法有助于學(xué)習(xí)者語言產(chǎn)出的靈活性和多樣性。共享同一型式的詞項通常存在意義上的共享或意義交集。但是,某一方面意義的表達卻并非只能通過一種型式來實現(xiàn)(Hunston et al.1997:215)。表3顯示的就是用不同的型式和詞匯來表達“某人喜歡一個想法或觀點”。通過對詞項和型式的學(xué)習(xí),學(xué)習(xí)者逐漸會用靈活多樣的詞匯來表達思想。
《型式語法》(Hunston, Francis 2000)推出之后,很快受到自然語言處理界的關(guān)注。次年,《計算語言學(xué)》(Computational Linguistics)第二期就刊登出FrameNet項目組前計算詞典學(xué)家Christopher Johnson的書評。Johnson指出,型式語法的語言思想對于計算語言學(xué)和理論語言學(xué)的重要性不可低估(Johnson 2001:138)。 同時,他還建議,如果計算語言學(xué)家想獲得型式描述的相關(guān)資源,并將其應(yīng)用到自然語言處理當中,還須要參考 Francis等(1996,1998)的型式語法系列。不過,從計算語言學(xué)的視角Johnson指出,盡管型式語法有很多值得學(xué)習(xí)之處,但其本身既不屬于計算語言學(xué),也不是形式語法體系,因此,希望今后能看到一部更加形式化、更加系統(tǒng)的型式語法(Johnson 2001)。
近年來,隨著自然語言處理界對語料庫的不斷重視,型式語法也開始受到愈來愈多的關(guān)注。型式語法逐漸體現(xiàn)出在自然語言處理領(lǐng)域的價值。正如Johnson所期待的,已經(jīng)有研究者開始著手構(gòu)建基于型式語法的語法形式體系,或者將型式語法的理念用于自然語言處理程序的設(shè)計當中。Otero和López認為,型式語法提出的“語法—詞匯不可分”和“意義—結(jié)構(gòu)相聯(lián)系”的觀點是當前其他形式語法體系所或缺的。詞匯—語法分離、意義—結(jié)構(gòu)分離的后果是無法處理搭配、習(xí)語等占據(jù)語言很大部分的固定或半固定短語結(jié)構(gòu),而形式化體系在發(fā)展過程中一直都忽略這個問題。鑒于此,他們結(jié)合型式語法和依存語法的思想,建構(gòu)一部語法形式體系——Dep Pattern.Huang等(2011)則將型式語法的方法和理念運用到學(xué)習(xí)者語法檢查系統(tǒng)“EdIt”的設(shè)計中,最終測試結(jié)果顯示,EdIt的查錯結(jié)果要好于微軟的ESL Assistant.
陳功(2012a)以型式語法為理論基礎(chǔ),通過鏈語法形式化語法體系對動詞型式(如V as n等)進行形式化,并結(jié)合中國大學(xué)英語四六級和專業(yè)英語四八級考試大綱要求學(xué)生掌握的動詞,構(gòu)建一個面向中國學(xué)生的英語書面語動詞形式錯誤檢查系統(tǒng)。該研究測試結(jié)果顯示,加入動詞型式后,鏈語法分析器的查錯性能和句法分析能力得到很大的提高。對包含動詞形式錯誤檢查的召回率比原系統(tǒng)提高4.5個百分點,準確率提高15.7個百分點;對本族者正確句子分析的準確率提高12.2個百分點。該研究表明,型式語法不僅能夠較好地運用于自然語言處理領(lǐng)域的形式模型,還可以更好地服務(wù)于中國學(xué)生書面語形式錯誤檢查系統(tǒng)的構(gòu)建。在此基礎(chǔ)上,陳功(2012b)進一步指出,基于型式語法理論構(gòu)建的錯誤檢查系統(tǒng)不僅能幫助學(xué)習(xí)者檢查動詞形式錯誤,還能夠借助型式語法的理念,設(shè)計動詞型式參考句庫和動詞型式自動反饋工具,為學(xué)習(xí)者提供更好的語言學(xué)習(xí)平臺。對于學(xué)習(xí)者來說,不論是錯誤檢查,還是診斷、糾錯,其最主要的目的是提高語言技能,避免在同一個語言點上重復(fù)出錯。這也是我們今后努力的方向。
這些最新的研究成果表明,自然語言處理領(lǐng)域的研究者已經(jīng)逐漸認識到型式語法在語言描寫方面的優(yōu)勢,并正在將這一語料庫語言學(xué)的理論成果積極運用于自然語言處理的實踐中。今后,型式語法的應(yīng)用研究非常值得期待。
本文對型式語法的產(chǎn)生背景、理論淵源、主要內(nèi)容、特點、問題及其在英語教學(xué)和自然語言處理領(lǐng)域的應(yīng)用價值進行了詳細的梳理。不難看出,型式語法已經(jīng)被越來越多的研究者所接受、認可。而近年來,型式語法在自然語言處理領(lǐng)域的應(yīng)用也表明,語料庫語言學(xué)的思想和理論還有更大的發(fā)展前景和應(yīng)用價值。
注釋
①“環(huán)境”指“型式”(pattern),即詞項出現(xiàn)的環(huán)境。Francis指出,環(huán)境/型式和詞項本來是不可分的,之所以作區(qū)分,為了從不同的視角觀察語言型式。
陳 功.中國學(xué)習(xí)者英語書面語動詞形式錯誤自動檢查:一項基于鏈語法的研究[D].北京外國語大學(xué)博士學(xué)位論文,2012a.
陳 功.自然語言處理技術(shù)在語言教學(xué)和研究中的應(yīng)用初探——以重構(gòu)后的鏈語法分析器為例[J].中國外語教育, 2012b(4).
馮志偉.自然語言處理的形式模型[M].合肥:中國科學(xué)技術(shù)大學(xué)出版社,2010.
梁茂成.理性主義、經(jīng)驗主義與語料庫語言學(xué)[J].中國外語,2010(4).
Aarts,J.Intuition-based and Observation-based Grammars[A].In: Aijmer, K., Altenberg, B.(Eds.),English Corpus Linguistics[C].Harlow: Longman,1991.
Barnbrook, G.Sinclair on Collocation[J].International Journal of Corpus Linguistics, 2007(2).
Firth, J.R.Modes of Meaning[A].In: Firth, J.R.(Ed.),Papers in Linguistics[C].London: Oxford University Press,1957.
Francis, G.A Corpus-driven Approach to Grammar: Principles, Methods and Examples[ A].In: Baker, M.,F(xiàn)rancis, G., Tognini-Bonelli, E. ( Eds.),Text and Technology:In Honour of John Sinclair[C].Amsterdam: John Benjamins,1993.
Francis,G.Corpus-driven Grammar and Its Relevance to the Learning of English in a Cross-cultural Situation[A].In: Pakir, A.(Ed.),English in Education:Multicultural Perspectives[C].Singapore: Unipress, 1995.
Francis, G., Hunston, S., Manning, E.Collins COBUILD Grammar Patterns 1:Verbs[M].London: Harper Collins,1996.
Francis, G., Hunston, S., Manning, E.Collins COBUILD Grammar Patterns 2:Nouns and Adjectives[M].London: Harper Collins, 1998.
Francis, G., Sinclair, J.M.I Bet He Drinks Carling Black Label: A Riposte to Owen on Corpus Grammar[J].Applied Linguistics, 1994(2).
Halliday, M.A.K.System and Function in Language:Selected Papers[M].London: Oxford University Press,1976.
Huang, C., Chen, M., Huang, S., Chang, J.S.EdIt: A Broad-coverage Grammar Checker Using Pattern Grammar[OL].http://www.aclweb.org/anthology/P11 - 4005,2011.
Hudson, R.English Word Grammar[M].Oxford: Blackwell,1990.
Hunston, S.Corpora in Applied Linguistics[M].Beijing:WPC, 2002/2006.
Hunston, S., Francis, G.Pattern Grammar:A Corpus-driven Approach to the Lexical Grammar of English[M].Amsterdam: John Benjamins,2000.
Hunston, S., Francis, G., Manning, E.Grammar and Vocabulary: Showing the Connections[J].ELT Journal,1997(3).
Johnson, C.Review of “Pattern Grammar: A Corpus-driven Approach to the Lexical Grammar of English”[J].Computational Linguistics, 2001(2).
Lewis, M.The Lexical Approach:The State of ELT and aWay Forward[M].Hove: LTP,1993.
Malmkj?r, K.The Linguistics Encyclopedia[M].London:Routledge,1991.
Melcuk,I.Phrasemes in Language and Phraseology in Linguistics[ A].In: Everaert, M., van der Linden, E.,Schenk, A., Schreuder, R.(Eds.),Idioms:Structural and Psychological Perspectives[C].Hillsdale: Lawrence Erlbaum Associates,1995.
Otero, P.G., López, I.G.A Grammatical Formalism Based on Patterns of Part of Speech Tags [J].International Journal of Corpus Linguistics, 2011(1).
Owen, C.Corpus-based Grammar and the Heineken Effect:Lexico-grammatical Description for Language Learners[J].Applied Linguistics, 1993(2).
Pawley, A., Syder, F.H.Two Puzzles for Linguistic Theory:Native-like Selection and Native-like Fluency[A].In:Richards, J.C., Schmidt, R.W.(Eds.),Language and Communication[C].London: Longman, 1983.
Sinclair, J.M.Grammar in the Dictionary[A].In: Sinclair,J.M. (Ed.),Looking Up:An Account of the COBUILD Project in Lexical Computing[C].London: Collins ELT,1987.
Sinclair, J.M.Corpus,Concordance,Collocation[M].Oxford: Oxford University Press, 1991.
Sinclair, J.M.Lexical Grammar[J].Naujoji Metodologija,2000(24).
Sinclair, J.M., Renouf, A.Collocational Frameworks in English[A].In: Aijmer, K., Alternberg, B.(Eds.),English Corpus Linguistics:Studies in Honour of Jan Svartvik[C].London: Longman, 1991.
Stubbs, M.Text and Corpus Analysis[M].London: Blackwell,1996.