滿海霞
(北京科技大學(xué)外國(guó)語(yǔ)學(xué)院,北京100083)
把字句是現(xiàn)代漢語(yǔ)中的一種重要句式,它的基本構(gòu)式為“(NP1/CP1)把NP2VP”①CP代表從句。。其中,VP可以是簡(jiǎn)單動(dòng)詞②這里將“了”看做句法透明的成分,所以所謂的“簡(jiǎn)單動(dòng)詞”是指動(dòng)詞本身不是由兩個(gè)或多個(gè)動(dòng)詞復(fù)合的。但因?yàn)榘炎志涞膭?dòng)詞至少要帶“了”、“著”表示時(shí)體信息,所以很多學(xué)者也認(rèn)為,把字句中的動(dòng)詞均呈復(fù)雜形式。(楊小璐、肖丹,2008)(如①),也可能是述補(bǔ)結(jié)構(gòu)(如②)。VP中出現(xiàn)的述補(bǔ)結(jié)構(gòu)還可以再細(xì)分,分為得字式(如③)、動(dòng)結(jié)式(如②、④)、動(dòng)趨式(如⑤)和動(dòng)介式(如⑥)。細(xì)分之后我們發(fā)現(xiàn),①—③中的NP2似乎都是VP的主語(yǔ),④—⑥似乎都是VP的賓語(yǔ),代表了漢語(yǔ)學(xué)界對(duì)NP2性質(zhì)的兩種主流看法。但是,兩種看法任一種都不能完全概括所有把字句的情況。(沈陽(yáng),1997)
①把幾個(gè)犯人跑了 ②把好多人都累病了 ③把我愁得大病一場(chǎng)
④把孩子咳嗽醒了 ⑤把牙吃壞了 ⑥把電話打通了
沈陽(yáng)通過(guò)考察漢語(yǔ)把字句中“把”后名詞短語(yǔ)(即以上基本構(gòu)式中的NP2)在相應(yīng)變形句式中的位置,認(rèn)為以下⑦—12○中的A、B兩式是C式所代表的各種把字句的生成歷史。基本想法是,“把”后不是NP2的生成位置,NP2從A式經(jīng)過(guò)一個(gè)后移過(guò)程先達(dá)到B式,然后求助于“把”得以重新回到動(dòng)詞前邊某一個(gè)可能的位置,得到把字句C式,體現(xiàn)了句式之間相互關(guān)聯(lián)的想法。
⑦A幾個(gè)犯人跑了 B跑了幾個(gè)犯人 C把幾個(gè)犯人跑了
⑧A好多人都累病了 B累病了好多人 C把好多人都累病了
⑨A我愁得大病一場(chǎng) B愁得我大病一場(chǎng) C把我愁得大病一場(chǎng)
⑩A(保姆)咳嗽+孩子醒了 B(保姆)咳嗽醒了孩子 C(保姆)把孩子咳嗽醒了
11○A(這孩子)吃(糖)+牙壞了 B(這孩子)吃壞了牙 C(這孩子)把牙吃壞了
12○A(我)打(電話)+電話通了 B(我)打通電話了 C(我)把電話打通了
換而言之,把字句的典型結(jié)構(gòu)是由NP2多重移位造成的。由此,沈陽(yáng)將除簡(jiǎn)單動(dòng)詞把字句之外的典型把字句結(jié)構(gòu)刻畫為“雙主謂套合結(jié)構(gòu)”:
組合范疇語(yǔ)法(Combinatory Categorial Grammar,簡(jiǎn)稱 CCG。參見(jiàn) Steedman,1987,1990,1996,2000)是范疇語(yǔ)法(Bar-Hillel,1953;馮志偉,2000;方立,2003;滿海霞,李可勝,2010)的一個(gè)現(xiàn)代分支,其模擬范疇類型邏輯(Moortgat,1996)得到的多模態(tài)版本被稱為多模態(tài)范疇語(yǔ)法(簡(jiǎn)稱MMCCG。參見(jiàn)Baldridge&Kruijff,2003;Baldridge,2002)。CCG汲取了范疇語(yǔ)法的基本思想,仍使自然語(yǔ)言語(yǔ)詞按照各自的句法性質(zhì)對(duì)應(yīng)于不同的范疇,通過(guò)范疇之間類似分?jǐn)?shù)消去的運(yùn)算,計(jì)算語(yǔ)句是否合語(yǔ)法。
定義1 范疇①為表區(qū)別,本文用斜體表示自然語(yǔ)言對(duì)應(yīng)的范疇,正體表示某種短語(yǔ)。如NP代表名詞短語(yǔ),NP代表名詞短語(yǔ)所對(duì)應(yīng)的句法范疇。
給定基本范疇集A,CAT(A)是滿足以下條件的最小集合:
i.A?CAT(A)
ii.如果 A,B∈ CAT(A),則 A/iB,AiB∈CAT(A)
iii.i∈{*,×,◇,?,?,·}
iv.除了由(i)—(iii)得到的,其他都不是范疇。
定義1是關(guān)于MMCCG范疇的基本定義。一般范疇演算的最小基本范疇集為{NP,S},NP為名稱的范疇,S為語(yǔ)句的范疇。②本文也將以{NP,S}為基本范疇集。CCG范疇采取結(jié)果范疇始終居于最左側(cè)的寫法,論元范疇根據(jù)結(jié)合先后由右至左排列。比如函項(xiàng)范疇(X/Y)就表示它先后向左、向右分別結(jié)合范疇Z和Y后,會(huì)得到結(jié)果范疇X。在CCG中,模態(tài)下標(biāo)i=。而在MMCCG中,根據(jù)定義1(iii),模態(tài)下標(biāo)i可能是六種模態(tài)算子,其中,?和?標(biāo)記函項(xiàng)范疇的結(jié)合方向,其他四種模態(tài)算子分別體現(xiàn)對(duì)結(jié)合律和置換率的不同滿足情況,如表1所示(具體語(yǔ)例分析參見(jiàn)鄒崇理,2011):
[S1主語(yǔ)NP1[S2(把)主語(yǔ)NP2[謂語(yǔ)VP1[謂語(yǔ)VP2]]]]
這種有關(guān)語(yǔ)言現(xiàn)象的研究和總結(jié),對(duì)于語(yǔ)法現(xiàn)象的形式化十分有幫助。我們希望我們所進(jìn)行的形式刻畫能夠盡可能把握該語(yǔ)言現(xiàn)象的規(guī)律,具有合適的概括性。下面我們將簡(jiǎn)要介紹本文使用的句法計(jì)算理論——多模態(tài)組合范疇語(yǔ)法,利用組合范疇語(yǔ)法對(duì)各組A、B、C式的計(jì)算,說(shuō)明組合范疇語(yǔ)法在計(jì)算性上的優(yōu)勢(shì)。
(表 1) MMCCG 的模態(tài)算子等級(jí)表(Baldridge,2002:102)
衡量一套語(yǔ)法系統(tǒng)是否適合用于刻畫自然語(yǔ)言句法構(gòu)造過(guò)程,一個(gè)重要的依據(jù),就是看它是否和自然語(yǔ)言一樣,屬于適度的上下文敏感(Mildly Context Sensitive)文法。③自然語(yǔ)言是適度上下文敏感的,即介于上下文自由和上下文敏感之間,因?yàn)橛泻芏嗾Z(yǔ)言現(xiàn)象敏感于所出現(xiàn)的上下文,如英語(yǔ)第三人稱單數(shù)、荷蘭語(yǔ)中的交叉依存(crossing dependency)(Shieber,1985)以及德語(yǔ)、土耳其語(yǔ)中的長(zhǎng)距離混序(Long distance scrambling)(Rambow,1994;Hoffman,1995)等,但自然語(yǔ)言在大部分時(shí)候仍是保序和結(jié)合的。以短語(yǔ)結(jié)構(gòu)語(yǔ)法為例,它作為早期最有影響力的形式句法理論之一,由于是一種純粹的上下文自由文法,不足以用來(lái)刻畫許多自然語(yǔ)言現(xiàn)象及現(xiàn)象之間的關(guān)系(Chomsky,1957),從而啟發(fā)語(yǔ)言學(xué)家對(duì)自然語(yǔ)言句法理論孜孜不倦地探索。轉(zhuǎn)換生成語(yǔ)法將短語(yǔ)結(jié)構(gòu)語(yǔ)法的改寫規(guī)則發(fā)展為中心語(yǔ)(head)與其投射(projection)之間的關(guān)系,利用移位、拷貝等技術(shù)手段,模擬出自然語(yǔ)言語(yǔ)句從深層結(jié)構(gòu)到表層輸出結(jié)構(gòu)的生成歷史。如簡(jiǎn)單語(yǔ)句John walks的短語(yǔ)結(jié)構(gòu)改寫規(guī)則集為(14?),其轉(zhuǎn)換生成語(yǔ)法樹(shù)為(14○b)。
轉(zhuǎn)換生成語(yǔ)法對(duì)普遍語(yǔ)法(Universal Grammar)的探究無(wú)疑是成績(jī)卓著的,但是在信息處理過(guò)程中,機(jī)器在信息界面只能看到一系列有語(yǔ)形實(shí)現(xiàn)形式的字符串,對(duì)于特殊的語(yǔ)法結(jié)構(gòu)(如語(yǔ)序靈活的情況、包含VP省略的并列結(jié)構(gòu)等),什么時(shí)候發(fā)生了拷貝刪略,什么時(shí)候發(fā)生了移位,它是很難判斷的。計(jì)算語(yǔ)言學(xué)家Ades和Steedman出于計(jì)算性考慮,提出了基于范疇的組合計(jì)算方法。他們認(rèn)為,完全有可能避開(kāi)生成語(yǔ)法的深層操作,只通過(guò)對(duì)表層語(yǔ)詞的計(jì)算,判斷語(yǔ)句的合語(yǔ)法性,如(14○c)。這一思想后來(lái)發(fā)展成為CCG,并被證明具有適度的上下文敏感性(Baldridge,2002)。
從探索適于信息處理的“普遍語(yǔ)法”的角度來(lái)看,MMCCG將CCG又向前推進(jìn)了一步。MMCCG在CCG的斜線算子上添加模態(tài)算子有兩點(diǎn)好處:一方面,區(qū)別各條規(guī)則中的斜線類型可以滿足規(guī)則在句法毗連上的不同要求,保證這一部分不因語(yǔ)言不同而變化,即相當(dāng)于跨語(yǔ)言通用的“普遍語(yǔ)法”;另一方面,在特定語(yǔ)言中,根據(jù)語(yǔ)詞的實(shí)際句法特征對(duì)其范疇所含斜線算子做允許保序、交換或者結(jié)合的多模態(tài)限制,以選擇合適的組合運(yùn)算規(guī)則,這相當(dāng)于因語(yǔ)言不同而不同的“參數(shù)”。
15○中左右兩欄分別是基本范疇語(yǔ)法和MMCCG中的規(guī)則。②將MMCCG規(guī)則中斜線算子上的模態(tài)修飾成分去掉,就得到CCG的規(guī)則集。后者除基本范疇語(yǔ)法的函項(xiàng)應(yīng)用規(guī)則>和<、類型提升規(guī)則T之外,還包含能夠結(jié)合兩個(gè)函項(xiàng)范疇的組合性規(guī)則B和允許重復(fù)使用同一語(yǔ)言資源的置換規(guī)則S。③每種規(guī)則都分別包括結(jié)合方向向前和向后的兩個(gè)版本,而且規(guī)則B和S因?yàn)槎际侵苯訉?duì)兩個(gè)函項(xiàng)范疇進(jìn)行運(yùn)算,所以還區(qū)分兩個(gè)函項(xiàng)在斜線方向上是否一致,不一致的在規(guī)則名稱上加交叉符號(hào)×標(biāo)記。正是這兩組新增的規(guī)則(B和S)使范疇語(yǔ)法④Bar-Hillel et al.(1960)證明范疇語(yǔ)法弱等價(jià)于上下文自由文法。具有適度的上下文敏感性,善于處理非成分并列、混序等現(xiàn)象。
有了MMCCG句法框架,我們將在下一部分構(gòu)造漢語(yǔ)把字句片段的詞庫(kù),并對(duì)⑦—12○中的六組語(yǔ)句進(jìn)行MMCCG生成,考察該語(yǔ)法在句法處理上的能力,看它在多大程度上能體現(xiàn)和區(qū)別同一組內(nèi)語(yǔ)句之間、以及各組語(yǔ)句中相同句式之間的相似和相異性。
①由于篇幅所限,在此只給出了簡(jiǎn)化的生成過(guò)程。TP為時(shí)態(tài)短語(yǔ)(tense phrase),DP為限定詞短語(yǔ)(determiner phrase)。John為滿足EPP規(guī)則(生成語(yǔ)法的一個(gè)假設(shè),要求每個(gè)從句主語(yǔ)位置不能為空)而上移,在VP下的DP位置留了一個(gè)語(yǔ)跡t,walk與T所帶的[+present]特征進(jìn)行核查,得到了第三人稱單數(shù)詞綴-s。
先定義基本詞庫(kù)如下。該基本詞庫(kù)只包括直覺(jué)上句法性質(zhì)比較明顯的語(yǔ)詞,其中,我們認(rèn)為“都”對(duì)主語(yǔ)NP做限制,為其指派范疇NPNP。對(duì)“把”、“得”以及句法性質(zhì)有所改變的語(yǔ)詞的范疇賦值,我們將在討論過(guò)程中逐一添加。
基本詞庫(kù):
{人,犯人,我,牙,電話}├NP;
{幾個(gè),好多}├NP/NP;
{跑了,累病了,大病一場(chǎng),壞了,咳嗽,醒了}├SNP;
{都}├NPNP
{吃,打,愁}├(SNP)/NP。
基于基本詞庫(kù),若想為每組中把字句及相關(guān)的A式和B式做出盡可能統(tǒng)一的句法生成,考察CCG的生成能力,還需要首先回答幾個(gè)問(wèn)題:
(1)每組A、B、C句式變換過(guò)程中,組成成分的句法性質(zhì)有否改變?
(2)沈陽(yáng)提出的“雙主謂套合結(jié)構(gòu)”在句法上如何套合?套合前后兩個(gè)VP的性質(zhì)如何?
(3)基本詞庫(kù)未給出的“把”和“得”的范疇賦值是什么?
i.NP VP和VP NP的語(yǔ)序
語(yǔ)詞的句法表現(xiàn)是范疇演算的基本依據(jù)。我們看到,⑦和⑧組語(yǔ)句中A式和B式只是NP和VP順序的調(diào)換,按照一般對(duì)不及物動(dòng)詞范疇的賦值,這兩個(gè)B式中動(dòng)詞所對(duì)應(yīng)的函項(xiàng)范疇SNP向后尋找論元,在句法上無(wú)法看到其右側(cè)的論元,導(dǎo)致生成失敗,如16○。
16?. b.
在這一點(diǎn)上,最直接的解決辦法,是為兩個(gè)VP再賦一個(gè)向右結(jié)合論元的S/NP范疇,由此,B式中的S/NP就可以利用>規(guī)則結(jié)合其右側(cè)的NP,得到語(yǔ)句范疇S。但是,這種做法面臨著本體論上的顧慮。漢語(yǔ)是SVO語(yǔ)言②S、V、O分別代表主、謂、賓三種成分。,基本句型或者是SV,或者是SVO,不可能只有VO沒(méi)有S。反過(guò)來(lái),如果認(rèn)為漢語(yǔ)允許語(yǔ)序如此靈活,承認(rèn)SV和VS都是其基本句型,那么漢語(yǔ)必然也應(yīng)該同時(shí)允許SVO和VSO語(yǔ)序。但是實(shí)際情況是,VSO語(yǔ)序?qū)τ跐h語(yǔ)來(lái)說(shuō)無(wú)論如何都是很難接受的(如:*吃他飯)。于是我們有兩個(gè)選擇:(1)認(rèn)為動(dòng)詞確實(shí)要向右尋找論元,但是為避免本體論問(wèn)題,令這類動(dòng)詞的范疇變?yōu)椋⊿NP)/NP,包含了一個(gè)缺省的主語(yǔ)。③漢語(yǔ)任何位置的名詞都可以省略。(Huang,1984)(2)堅(jiān)持SNP范疇,考驗(yàn)我們句法運(yùn)算系統(tǒng)處理語(yǔ)序置換現(xiàn)象的能力。
ii.VP1+VP2的性質(zhì)
根據(jù)沈陽(yáng)的考察和推斷,⑩—12○組語(yǔ)句C式中“把”后的NP2產(chǎn)生于VP2的主語(yǔ)位置(如A式),由于某種原因后移得到B式,然后求助于“把”得以重新回到動(dòng)詞前邊某一個(gè)可能的位置。問(wèn)題是,在復(fù)雜把字句中,動(dòng)結(jié)式、動(dòng)介式、動(dòng)補(bǔ)式都是以動(dòng)詞為核心的結(jié)構(gòu),在語(yǔ)義上不等于單純的VP1+VP2,“吃壞了”不等于既“吃了”又“壞了”,但A式中的兩個(gè)VP分別是兩個(gè)成分子句的謂詞,在地位上不分主次。所以,VP1與VP2結(jié)合的過(guò)程一定伴隨著VP2句法特征的改變,由一個(gè)謂語(yǔ)動(dòng)詞變成了一個(gè)謂語(yǔ)修飾成分,對(duì)應(yīng)范疇VPVP。VP對(duì)應(yīng)SNP或者(SNP)/NP。但是,如果所有能做動(dòng)詞后修飾成分的語(yǔ)詞都具有雙重VP身份,無(wú)疑會(huì)大大增加詞庫(kù)負(fù)擔(dān),增加運(yùn)算的搜索時(shí)間。幸運(yùn)的是,CCG對(duì)此亦有作為,我們將在3.4節(jié)通過(guò)計(jì)算說(shuō)明,利用交叉組合規(guī)則>B×,范疇為(SNP)(SNP)的謂詞修飾語(yǔ)也可以修飾二元?jiǎng)釉~,避免詞庫(kù)所含信息激增。
①為討論方便,我們?cè)谶@一部分只在有必要進(jìn)行區(qū)分的時(shí)候才為范疇斜線添加模態(tài)下標(biāo)。
第三個(gè)問(wèn)題是“把”和“得”的范疇賦值。盧英順認(rèn)為把字句存在“配價(jià)增值”現(xiàn)象,即把字句中的動(dòng)詞所能帶的配價(jià)成分比非把字句中多,如6○1和7○1“警覺(jué)”和“停泊”從一價(jià)動(dòng)詞變成了二價(jià)動(dòng)詞。按照這種說(shuō)法,“把”是一個(gè)句法上沒(méi)有貢獻(xiàn)、相對(duì)透明的語(yǔ)詞,類似于X/X范疇,同時(shí),把字句句中的動(dòng)詞從n元增加到n+1元。但是我們不禁要問(wèn)一個(gè)現(xiàn)實(shí)問(wèn)題,所謂新增動(dòng)元“薄暮的春寒”、“呻吟般的歌聲”的語(yǔ)義角色是什么?施事、受事、工具,還是地點(diǎn)?顯然都不合適,最接近的情況是“致事”。繼續(xù)論證下去,哪個(gè)帶有[+致使]語(yǔ)義特征的成分發(fā)出信號(hào),要求增加致事論元呢?如果是動(dòng)詞“覺(jué)醒”,那么“覺(jué)醒”一定有能力進(jìn)入“A覺(jué)醒B”的結(jié)構(gòu),但似乎事實(shí)并非如此?;蛘哒f(shuō),把字句結(jié)構(gòu)中NP1如果是動(dòng)詞增值的結(jié)果,它應(yīng)與VP具有緊密的聯(lián)系,但我們發(fā)現(xiàn),NP1與VP的關(guān)系尚不如它與“把”的關(guān)系緊密。這樣就只有一種可能——“把”在句法上不是透明的,它引入了主語(yǔ)論元。①有時(shí)把字句內(nèi)VP的動(dòng)詞的確具有致使或者處置意義,如NP2可以還原為VP賓語(yǔ)的把字句,如“××把花姑娘急瘋了”可以還原為“××急瘋了花姑娘”。但這與我們下面20○中對(duì)“把”的句法假設(shè)并不矛盾。同樣的,還有一些句子,在非把字句中可以分別帶的不同種類的配價(jià)成分只有在把字句中才可以同時(shí)出現(xiàn),如8○1中可以分別作“揉”的賓語(yǔ)的“面”和“饅頭”,這種情況同樣得益于“把”的句法作用。
16○薄暮的春寒把她警·覺(jué)·,才知道迷迷糊糊地已到寓處。(錢鐘書《紀(jì)念》)
17○呻吟般的歌聲把風(fēng)景?!げ础ぴ诤?。
18○我 把 面揉· 饅 頭 。
其實(shí),“把”的語(yǔ)法意義②這里使用的“語(yǔ)法意義”與上文使用的“句法意義”不同。后者指與其他成分在句法上純粹的毗連關(guān)系,前者還包含對(duì)抽象語(yǔ)義、語(yǔ)用含義等方面的討論。一直頗受爭(zhēng)議,但不管“把”的語(yǔ)法意義是什么,一般學(xué)者都將“把”看做把字句的句法核心,它的句法作用是表達(dá)NP1/CP1、NP2和VP三者之間的某種關(guān)系。③參見(jiàn)沈家煊(2002)。該文對(duì)把字句的語(yǔ)法關(guān)系作了很好的回顧和解釋。所以“把”的句法范疇可以表示為9○1:
19○ a.把├SNP/VP/NP
b.把1├SNP(/SNP)/NP
c.把2├SNP(/(SNP)/NP)/NP 19?表示“把”由右向左的論元結(jié)合順序是NP2、VP和NP1,也就是說(shuō),“把”與NP2結(jié)合最緊,之后是VP和NP1。19?可以分裂為兩個(gè)版本9○1b、19○c,分別對(duì)應(yīng)VP為一元?jiǎng)釉~和二元?jiǎng)釉~兩種情況。比如⑦c就可以通過(guò)以下范疇計(jì)算,最后表達(dá)式的范疇為SNP,即“把”的左側(cè)還需要一個(gè)主語(yǔ)。
20○ ⑦C的范疇生成過(guò)程
觀察⑨中“得”字所出現(xiàn)的句法環(huán)境。“得”右側(cè)可以帶一個(gè)一元謂詞或者一個(gè)語(yǔ)句,左側(cè)帶一個(gè)二元謂詞。“得”在這個(gè)環(huán)境中重要的一個(gè)性質(zhì),或者說(shuō)特點(diǎn),是它遏制了二元?jiǎng)釉~帶賓語(yǔ)的能力,比如說(shuō),我因?yàn)楹⒆訉W(xué)習(xí)不好而愁得大病一場(chǎng),那么只有⑨B和C兩式可以在句首添加“孩子成績(jī)不好”做主語(yǔ),如?b和?c。而⑨A中已經(jīng)帶有一個(gè)論元的“愁”似乎就很難接受其前再有一個(gè)欲做其論元的成分,如21?,除非將“孩子成績(jī)不好”用逗號(hào)與后面部分隔開(kāi),使它單獨(dú)做一個(gè)小句,說(shuō)明后面事件的原因。如果“愁”帶賓語(yǔ)的能力沒(méi)有被抑制,那么“孩子成績(jī)不好”應(yīng)該可以看作是被話題化提前了的成分,如“蘋果我喜歡”。
? a.*孩子成績(jī)不好我愁得大病一場(chǎng)
b.孩子成績(jī)不好愁得我大病一場(chǎng)
c. 孩子成績(jī)不好把我愁得大病一場(chǎng)
在此基礎(chǔ)上,我們給出本文所需的“得”的范疇賦值?:①關(guān)于“得”第二個(gè)論元帶一元?jiǎng)釉~的情況參見(jiàn)孔繁清、滿海霞(2011)。
?.得1├(SNP)((SNP)/NP)/(SNP)
b.得2├(SNP)((SNP)/NP)/S
注意,?a.中“得”的結(jié)果范疇是(SNP),而不是S,這一點(diǎn)區(qū)別于3.2節(jié)對(duì)“把”的范疇賦值?!鞍选北豢醋鍪前炎志涞暮诵?,而“得”只是它所在動(dòng)詞短語(yǔ)的核心。原因在于,V+得+補(bǔ)語(yǔ)往往可以嵌入到其他結(jié)構(gòu)中,如?c作為把字句的一部分,又如重動(dòng)結(jié)構(gòu)“愁孩子成績(jī)不好愁得大病一場(chǎng)”。設(shè)定(SNP)作為“得”的結(jié)果范疇滿足結(jié)構(gòu)上的要求。
到現(xiàn)在為止,本節(jié)一開(kāi)始提出的三個(gè)問(wèn)題均已得到了回答?;诂F(xiàn)有的詞庫(kù)和句法規(guī)則,以下我們將對(duì)⑦—?組語(yǔ)句做句法生成。
首先計(jì)算⑦和⑧兩組語(yǔ)句。兩組A式和C式都可以用它們?cè)谠~庫(kù)中的賦值使用向前的函項(xiàng)應(yīng)用規(guī)則直接生成,如?分別給出了⑦A和⑧C的句法生成過(guò)程。
23a. b.
但B式的情況稍微不同,表面上看它們是從A式調(diào)換了NP和VP順序得來(lái)的。我們?cè)?.1節(jié)已經(jīng)提到VP NP語(yǔ)序帶來(lái)的問(wèn)題,提出了兩種解決辦法:(1)VP范疇仍為SNP,考驗(yàn)系統(tǒng)的生成能力;(2)VP范疇轉(zhuǎn)化為(SNP)/NP。仔細(xì)考察兩個(gè)B式的句法表現(xiàn)我們發(fā)現(xiàn),它們恰好對(duì)應(yīng)這兩種情況。24○展示了兩式在句首添加不同種類名詞后語(yǔ)句的可接受程度。24?在句首添加地點(diǎn)或者時(shí)間名詞,語(yǔ)句都能接受,但是加上其他種類的名詞,語(yǔ)句就不符合語(yǔ)感了。
⑦B跑了幾個(gè)犯人
⑧B累病了好多人
?a.牢房/昨天/*惡劣環(huán)境 跑了幾個(gè)犯人。
b.?公司/?昨天/連日加班 累病了好多人。事實(shí)是,⑦B可以看作存現(xiàn)句去掉句首地點(diǎn)或時(shí)間成分的片段。雖然對(duì)于存現(xiàn)句的問(wèn)題學(xué)術(shù)界一直有所爭(zhēng)論,但是沒(méi)有人認(rèn)為一元?jiǎng)釉~進(jìn)入存現(xiàn)句后變成了二元?jiǎng)釉~。這與⑧B恰好相反。18○b中我們嘗試給“累病了”前面加上不同的成分,只有可以做致使好多人累病了的原因的成分才顯得合適。如果句首的“公司”是借代或擬人用法,代表公司的管理人員,語(yǔ)句的接受度就提高了。而如果單看“昨天累病了好多人”,似乎我們還會(huì)有一個(gè)心理預(yù)期,有什么沒(méi)有言說(shuō)的原因?qū)е潞芏嗳死鄄×?,即只有得到那個(gè)NP才能構(gòu)成一個(gè)完整的語(yǔ)句。所以⑧B的生成仍只需要使用一步函項(xiàng)應(yīng)用規(guī)則,如25?。⑦B對(duì)于傳統(tǒng)范疇語(yǔ)法來(lái)說(shuō)是不可能生成的語(yǔ)句,而MMCCG令人興奮的一點(diǎn),是它的類型提升規(guī)則是保序的,由于范疇X提升到T/i(T\iX)要保證斜線算子的模態(tài)下標(biāo)相同,那么如果“跑了”后面的NP范疇被提升為S/?(S?NP),模態(tài)算子?就能保證提升得到的范疇向左結(jié)合SNP,最終計(jì)算得到合語(yǔ)法句子,如25○b所示:
?a. b.
⑨中A、B、C三式都可以直接利用詞庫(kù)賦值和函項(xiàng)應(yīng)用規(guī)則直接做CCG生成,限于篇幅在此不做細(xì)述。
⑩—12○的A式不是實(shí)際語(yǔ)句,所以我們只看B式和C式。按照3.1節(jié)的假設(shè),VP2與VP1結(jié)合之后成為一個(gè)動(dòng)詞,VP2是VP1的補(bǔ)充修飾成分,范疇由此變成(S\NP)\(S\NP)。11○B(yǎng)和11○C的范疇生成過(guò)程如26○所示。其中,變?yōu)閯?dòng)詞修飾語(yǔ)的“壞了”與“吃”利用<B×規(guī)則毗連,得到的仍是一個(gè)二元?jiǎng)釉~。
?a. b.
但是,⑩B不能用26?的做法做出正確的范疇演算,因?yàn)閂P1+VP2所得的動(dòng)補(bǔ)結(jié)構(gòu)所帶論元數(shù)與VP1相同,⑩B中的VP1是一元?jiǎng)釉~,NP2因此變成了一個(gè)多余的論元。如27?,完整語(yǔ)句“保姆咳嗽醒了孩子”在這個(gè)操作中顯然多了一個(gè)論元:
?a.b.
但是,系統(tǒng)自然不會(huì)失敗一次便放棄。27?的生成失敗后,系統(tǒng)會(huì)嘗試其他生成方式。在這里便可以借助CCG系統(tǒng)中的一條處理并列現(xiàn)象的經(jīng)驗(yàn)規(guī)則Conj①最早由Partee&Rooth(1983)提出,后為各種形式語(yǔ)義學(xué)理論所接受。(Steedman,1996):
Conj: X CONJ X?X
“保姆咳嗽”和“醒了孩子”可以看做是兩個(gè)語(yǔ)義合取的語(yǔ)句,生成過(guò)程如27○b。
對(duì)于⑩C,“咳嗽”和“醒了”則既可以用Conj規(guī)則求合取,也可以用26○中的方法讓“醒了”修飾“咳嗽”,得到句法結(jié)果一致,語(yǔ)義稍有不同(28○只給出二者的結(jié)合片段,其他部分生成與其他把字句同)。有趣的是,這兩種方法恰好代表形式語(yǔ)義學(xué)處理修飾關(guān)系的兩種典型方法,對(duì)于外延修飾關(guān)系,兩種方法得到的結(jié)果相等。
由此,我們變?yōu)榘炎志錁?gòu)造了一個(gè)CCG的句法生成系統(tǒng),并得到了滿意的句法生成。值得一提的是,CCG的句法和語(yǔ)義系統(tǒng)之間存在一個(gè)透明的接口,所以凡是句法上可以運(yùn)算的,都可以給出相應(yīng)的語(yǔ)義衍生。因此,上面句法分析的成功也保證了語(yǔ)義計(jì)算的可能性。(Steedman,2000:37)
21世紀(jì)是信息高速發(fā)展的世紀(jì),在這一大背景下,自然語(yǔ)言語(yǔ)法研究的任務(wù)不單是描述自然語(yǔ)言的規(guī)律,解釋為何如此,更有責(zé)任服務(wù)于自然語(yǔ)言信息處理的需求,幫助機(jī)器“掌握”和“理解”自然語(yǔ)言。出于這一目的,一套合適的、適于機(jī)器學(xué)習(xí)的語(yǔ)法系統(tǒng),應(yīng)該具有以下幾個(gè)特點(diǎn):(1)生成力上相當(dāng)于適度的上下文敏感文法,能夠應(yīng)付自然語(yǔ)言時(shí)而存在的靈活語(yǔ)序、非成分并列等異?,F(xiàn)象;(2)避免機(jī)器不可見(jiàn)的深層操作;(3)易于配備語(yǔ)義生成。本文通過(guò)對(duì)漢語(yǔ)六種把字句及其變式的CCG探討和生成,說(shuō)明CCG在這三方面表現(xiàn)十分出眾。同時(shí),為自然語(yǔ)言語(yǔ)詞賦以CCG范疇的過(guò)程也反過(guò)來(lái)幫助我們更深刻地認(rèn)識(shí)自然語(yǔ)言中的現(xiàn)象。在實(shí)際的信息處理中,CCG已經(jīng)得到廣泛的應(yīng)用和檢驗(yàn)。Steedman等人不但已經(jīng)完成了賓州樹(shù)庫(kù)到CCG樹(shù)庫(kù)的轉(zhuǎn)換,并不斷做跨語(yǔ)言的嘗試,如土耳其語(yǔ)、德語(yǔ)等組合范疇語(yǔ)法詞庫(kù)的生成(Cakici,2005;Hockenmaier,2006),也有很多計(jì)算語(yǔ)言學(xué)家不斷嘗試提高CCG詞庫(kù)提取的準(zhǔn)確性和速度(Boxwell,2011;Tse,Daniel&Curran,James,2012;Ng,Dominick&Curran,James,2012)。相比之下,漢語(yǔ)CCG的研究和生成剛剛起步,還有很多問(wèn)題有待解決,如語(yǔ)詞之間的依存關(guān)系、語(yǔ)義角色、兼語(yǔ)句、連動(dòng)句等謂詞論元關(guān)系問(wèn)題等,都需要語(yǔ)言學(xué)界的探索為其提供理論方案,從而達(dá)到更好的刻畫效果。
[1]Ades Anthony,Steedman Mark.On the order of words[J].Linguistics and Philosophy,1982,(4).
[2]Baldridge Jason.Lexically Specified Derivational Control in Combinatory Categorial Grammar[D].Edinburgh:University of Edinburgh,2002.
[3]Baldridge Jason,Kruijff Geert-Jan.Multi-Modal Combinatory Categorial Grammar[C]//Proceedings of EACL.Budapest,April 2003.
[4]Bar-Hillel Yehoshua.A quasi-arithmetical notation for syntactic description[J].Language,1953,(1).
[5]Bar-Hillel Yehoshua,Gaifman Haim,Shamir Eli.On categorical and phrase structure grammars[J].Bulletin of the Research Council of Israel,1960,(9).
[6]Boxwell Stephen,et al..Semantic role labeling without treebanks?[OL]//Proceedings of the 5th International Joint Conference on Natural Language Processings.Chiang Mai,Nov 2011.
[7]Cakici Ruken.Automatic Induction of a CCG Grammar for Turkish[OL]//ACL Student Research Workshop.Ann Arbor,Jun 2005.
[8]Chomsky Noam.Three models for the description of language[J].IRE Transactions on Information Theory,1956,(2).
[9]Chomsky Noam.Syntactic Structures[M].the Hague:Mouton,1957.
[10]Tse Daniel,Curran James.The Challenges of Parsing Chinese with Combinatory Categorial Grammar[OL]//2012 Conference of the North American Chapter of the Association for Computational Linguistics:Human Language Technologies.Los Angeles.June 2012.
[11]Hockenmaier Julia.Creating a CCGbank and a wide-coverage CCG lexicon for German[OL]//Proceedings of the Joint Conference of the International Committee on Computational Linguistics and the Association for Computational Linguistics COLING/ACL 2006.Sydney,Jul 2006.
[12]Hoffman Beryl.Computational Analysis of the Syntax and Interpretation of “Free”Word order in Turkish[D].Philadelphia:University of Pennsylvania,1995.
[13]Huang James.On the Distribution and Reference of Empty Pronouns[J].Linguistic Inquiry,1984,(15).
[14]Moortgat Michael.Categorial type logics[M]//Benthem Jon van,Meulen Alice.Handbook of Logic and Language.Cambridge(Massachusetts):MIT Press,1996.
[15]Ng Dominick,Curran James.Dependency Hashing for n-best CCG parsing[OL]//Proceedings of the 50th Annual Meetings of the Association for Computational Linguistics.Jeju Island,Jul 2012.
[16]Partee Barbara,Mats Rooth.Generalized conjunction and type ambiguity[M]//B?uerle Rainer,Schwarze Christoph,von Stechow Arnim,de Gruyter Walter.Meaning,Use and Interpretation of Language.Berlin:Walter de Gruyter,1983.
[17]Rambow Owen.Formal and Computational Aspects of Natural Language Syntax[D].Philadelphia:University of Pennsylvania,1994.
[18]Shieber Stuart.Evidence against the context-freeness of natural language[J].Linguistics and Philosophy,1985,(8).
[19]Steedman Mark.Combinatory grammars and parasitic gaps[J].Natural Language and Linguistic Theory,1987,(5).
[20]Steedman Mark.Gapping as constituent coordination[J].Linguistics and Philosophy,1990,(13).
[21]Steedman Mark.Surface Structure and Interpretation[M].Cambridge(Massachusetts):MIT Press,1996.
[22]Steedman Mark.The Syntactic Process[M].Cambridge(Massachusetts):MIT Press,2000.
[23]方立.范疇語(yǔ)法[J].外國(guó)語(yǔ)言文學(xué),2003,(3).
[24]馮志偉.范疇語(yǔ)法[J].語(yǔ)言文字應(yīng)用,2000,(3).
[25]盧英順.把字句的配價(jià)及相關(guān)問(wèn)題[J].語(yǔ)言科學(xué),2003,(2).
[25]孔繁清,滿海霞.類型邏輯語(yǔ)法的詞匯主義思想[J].哲學(xué)動(dòng)態(tài),2011,(2).
[27]滿海霞,李可勝.類型邏輯語(yǔ)法[J].哲學(xué)動(dòng)態(tài),2010,(10).
[28]沈家煊.如何處置“處置式”?[J].中國(guó)語(yǔ)文,2002,(5).
[29]沈陽(yáng).名詞短語(yǔ)的多重移位形式及把字句的構(gòu)造過(guò)程與語(yǔ)義解釋[J].中國(guó)語(yǔ)文,1997,(6).
[30]楊小璐,肖丹.現(xiàn)代漢語(yǔ)把字句習(xí)得的個(gè)案研究[J].當(dāng)代語(yǔ)言學(xué),2008,(3).
[31]鄒崇理.關(guān)于組合范疇語(yǔ)法CCG[J].重慶理工大學(xué)學(xué)報(bào):社會(huì)科學(xué)版,2011,(8).