亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        關(guān)于組合范疇語(yǔ)法CCG

        2011-10-30 12:25:54鄒崇理
        關(guān)鍵詞:指派詞庫(kù)斜線

        鄒崇理

        (1.燕山大學(xué)文法學(xué)院,河北秦皇島 066004;2.中國(guó)社會(huì)科學(xué)院哲學(xué)研究所,北京 100732)

        關(guān)于組合范疇語(yǔ)法CCG

        鄒崇理1,2

        (1.燕山大學(xué)文法學(xué)院,河北秦皇島 066004;2.中國(guó)社會(huì)科學(xué)院哲學(xué)研究所,北京 100732)

        組合范疇語(yǔ)法CCG(Combinatory Categorial Grammar)和類型邏輯語(yǔ)法TLG(Type Logical Grammar)都是范疇語(yǔ)法的現(xiàn)代版本,前者關(guān)注范疇語(yǔ)法的語(yǔ)言學(xué)應(yīng)用和自然語(yǔ)言的信息處理,后者傾向于從邏輯的角度審視范疇語(yǔ)法的理論性質(zhì)。CCG的特點(diǎn)有:原子范疇的加標(biāo)多樣化和徹底的詞匯主義思路;斜線算子的下標(biāo)模態(tài)化和函子范疇的多樣組合;基于范疇等級(jí)和范疇構(gòu)造的視角建立CCG的證明論。

        組合范疇語(yǔ)法CCG;類型邏輯語(yǔ)法TLG;函子范疇的組合

        范疇語(yǔ)法是一種面向自然語(yǔ)言信息處理的邏輯理論。按照這種理論,自然語(yǔ)言是由詞構(gòu)成詞組、詞組構(gòu)成語(yǔ)句的符號(hào)系統(tǒng),自然語(yǔ)言的這種構(gòu)造生成被看作是計(jì)算推演的過(guò)程。范疇語(yǔ)法產(chǎn)生于20世紀(jì)30~40年代,50年代以后逐步走向成熟。

        組合范疇語(yǔ)法 CCG(Combinatory Categorial Grammar,簡(jiǎn)稱CCG)則在20世紀(jì)80~90年代開(kāi)始出現(xiàn),是對(duì)范疇語(yǔ)法進(jìn)行擴(kuò)展的現(xiàn)代版本。擴(kuò)展的實(shí)質(zhì)在于“組合”(combinatory),即基于范疇語(yǔ)法增添了函子范疇的組合運(yùn)算,這類似數(shù)學(xué)中函數(shù)的復(fù)合。與此同時(shí),類型邏輯語(yǔ)法TLG(Type Logical Grammar,簡(jiǎn)稱TLG)也是范疇語(yǔ)法發(fā)展的現(xiàn)代產(chǎn)物,這個(gè)發(fā)展方向的源頭是著名的蘭貝克演算(Lambek,1958)。自誕生起CCG和TLG就顯示出各自側(cè)重的偏好。CCG關(guān)注自然語(yǔ)言“語(yǔ)境敏感層面”的表達(dá)力問(wèn)題,從語(yǔ)言學(xué)和計(jì)算語(yǔ)言學(xué)的角度探討基于統(tǒng)計(jì)模型的自然語(yǔ)言的自動(dòng)機(jī)處理問(wèn)題。而TLG的蘭貝克傳統(tǒng)則熱心于范疇語(yǔ)法的邏輯理論問(wèn)題,把范疇語(yǔ)法看成是一個(gè)邏輯系統(tǒng),配備框架語(yǔ)義學(xué),討論系統(tǒng)的可靠性和完全性,以及系統(tǒng)的可判定性。本文從范疇語(yǔ)法的基礎(chǔ)出發(fā),進(jìn)而介紹CCG,看看這個(gè)理論到底具有哪些不同于TLG的內(nèi)容。

        跟范疇語(yǔ)法一脈相承,CCG也是一種基于詞匯的語(yǔ)法形式理論。就是說(shuō),CCG把自然語(yǔ)言的生成過(guò)程凝縮在詞條的范疇構(gòu)造上[1]。例如:

        我們可以通過(guò)詞條“proved”的范疇構(gòu)造(2)來(lái)體現(xiàn)生成規(guī)則(1)的內(nèi)容。從某種意義上說(shuō),(1)確定了(2)。根據(jù)(1),我們有生成樹(shù):

        按照(3)從上到下看,節(jié)點(diǎn)VP對(duì)應(yīng)的函子范疇是:運(yùn)算的論元是NP,運(yùn)算的結(jié)果是S,記作S NP,其運(yùn)算是向后的,即論元范疇在函子范疇的后邊。而節(jié)點(diǎn)V對(duì)應(yīng)的函子范疇為:論元是NP,結(jié)果是SNP,記作(SNP)/NP,其運(yùn)算是向前的,即論元在函子的前邊。(SNP)/NP就是詞條Proved對(duì)應(yīng)的范疇。因此說(shuō),范疇語(yǔ)法指派給動(dòng)詞的函子范疇的構(gòu)造顯示出:運(yùn)算前的論元范疇和運(yùn)算后的結(jié)果范疇以及運(yùn)算的方向。于是,CCG從范疇語(yǔ)法那里傳承的函項(xiàng)應(yīng)用于論元的規(guī)則為[1]:

        向前的應(yīng)用

        向后的應(yīng)用

        以上規(guī)則就是CCG對(duì)范疇語(yǔ)法基本思想的繼承。除此以外,CCG還發(fā)展出自己新的內(nèi)容,概括為三點(diǎn):原子范疇的加標(biāo)多樣化和徹底的詞匯主義思路;斜線算子的下標(biāo)模態(tài)化和函子范疇的多樣組合規(guī)則;基于范疇等級(jí)和范疇構(gòu)造的概念建立CCG的證明論。

        首先,CCG為刻畫豐富多彩的自然語(yǔ)言,其范疇設(shè)置比TLG更加精細(xì)化。對(duì)原子范疇譬如N, NP,PP,S等等,可以通過(guò)添加數(shù)格等標(biāo)記進(jìn)一步多樣化,如名詞短語(yǔ)范疇根據(jù)數(shù)的特征分為NPsg和NPpl,根據(jù)格的特征分為NPsbj和NPobj,還有主格復(fù)數(shù)名詞短語(yǔ)范疇NPplsbj等等。CCG是徹底的詞匯主義語(yǔ)法理論,詞庫(kù)中甚至還有詞綴的范疇指派[2]:

        圖1 詞庫(kù)

        圖1這樣的詞庫(kù)顯示:第一列的第七行就是對(duì)名詞的復(fù)數(shù)詞綴的范疇指派,第二列第八行就是對(duì)第三人稱動(dòng)詞詞綴的范疇指派?;谶@樣的詞庫(kù),CCG關(guān)于動(dòng)詞第三人稱詞綴和名詞復(fù)數(shù)詞綴的推演例子如圖2[2]:

        圖2 推演例

        其次,純粹的范疇語(yǔ)法限于函項(xiàng)應(yīng)用于論元的句法貼合規(guī)則,這樣限制了語(yǔ)境自由文法的表達(dá)力。CCG擴(kuò)大了語(yǔ)境自由文法的規(guī)則集合,添加了基于函子范疇的組合(置換)獲得另一函子范疇的那些規(guī)則。如:

        函子范疇的向前組合

        函子范疇的向后組合

        函子范疇的向前置換

        函子范疇的向后置換

        不僅如此,基于Jacobson(1990,1992)、Hepple(1990)、Baldridge(2002)和Baldridge&Kruijff (2003)等人的工作,CCG進(jìn)一步提出函子范疇及其規(guī)則的模態(tài)化概念,即給斜線算子添加下標(biāo)。具體來(lái)說(shuō),CCG提出四個(gè)基本的模態(tài)*,◇,×和■作為斜線算子的下標(biāo),各種不同下標(biāo)的斜線算子適用于不同的函子范疇組合規(guī)則。換言之,不同下標(biāo)的斜線算子的性質(zhì)往往通過(guò)各自適用的組合規(guī)則體現(xiàn)出來(lái)。

        提出斜線算子模態(tài)的用意在于:帶下標(biāo)*的斜線算子是最受限的,僅適用于最基本的函項(xiàng)應(yīng)用規(guī)則(即NL的規(guī)則);帶下標(biāo)◇的斜線算子允許推演中的結(jié)合性(即適用于L的規(guī)則);帶下標(biāo)×的斜線算子允許推演中的交換性(即適用于NLP的規(guī)則);帶下標(biāo)■的斜線算子適用于所有的范疇推演規(guī)則(即適用于LP系統(tǒng)的規(guī)則)[1],見(jiàn)圖3:

        圖3 斜線模態(tài)下標(biāo)的作用

        提出斜線算子模態(tài)下標(biāo)的后果是給有關(guān)詞條指派帶下標(biāo)的函子范疇,詞條在生成中受到的限制通過(guò)各自不同下標(biāo)的斜線算子不同的適用范圍體現(xiàn)出來(lái)。如果不用模態(tài)下標(biāo),要避免某些不合語(yǔ)法的詞序(詞的線性排列),我們不得不把各種自然語(yǔ)言生成中受限制或被禁止的地方專門列出來(lái),從而使組合規(guī)則因自然語(yǔ)言的不同而異。采用模態(tài)下標(biāo)的手段,組合規(guī)則就是普遍適用的,每一自然語(yǔ)言的語(yǔ)法適用同樣的規(guī)則集合,不同自然語(yǔ)言的差異表現(xiàn)在詞庫(kù)中,即有關(guān)詞條指派帶模態(tài)下標(biāo)的函子范疇,這是CCG的特色。

        四個(gè)模態(tài)下標(biāo)的關(guān)系類似四個(gè)蘭貝克演算的關(guān)系:處于頂端的*是最強(qiáng)的母類型,適用的組合規(guī)則范圍最窄;處于底端的 ■ 是最弱的子類型,適用的組合規(guī)則范圍最寬,見(jiàn)圖4。

        圖4 斜線模態(tài)下標(biāo)之間的關(guān)系

        帶下標(biāo)*的斜線算子適用的規(guī)則范圍最窄,只有少量的組合規(guī)則適用于帶下標(biāo)*的斜線算子,這包括范疇語(yǔ)法最基本的規(guī)則(>)和(<):

        因?yàn)椋瞧渌B(tài)下標(biāo)的最大母類型,(>)和(<)之類斜線/*涉及的規(guī)則適用于其他所有模態(tài)下標(biāo)的范疇。即對(duì)任α∈{*,◇,×,■},X/αY Y?X總能成立。

        以下組合規(guī)則對(duì)帶■的斜線算子范疇適用,但對(duì)*不成立:

        這些組合規(guī)則由于具有上述限制,我們就可以在詞庫(kù)中對(duì)英語(yǔ)連詞“and”指派帶*的斜線算子范疇,以剔除那些不符合英語(yǔ)語(yǔ)法的生成推演,從而指出某些英語(yǔ)詞條的排列不合語(yǔ)法性。在詞庫(kù)中只要有(4)這樣的指派,(5)那樣的推演就不能獲得結(jié)果,(<B)向后組合規(guī)則不適用于帶*的斜線算子范疇。這就從CCG的角度解釋了“sleeps and he talks”的不合語(yǔ)法性。

        推而廣之,指派給“and”的范疇表現(xiàn)為:(X★X)/★X,這種指派能夠滿足英語(yǔ)中正常表達(dá)式的范疇推演,如圖5:

        圖5 推演例

        最后,我們簡(jiǎn)略介紹CCG基于范疇等級(jí)概念和從范疇構(gòu)造的視角建立的CCG證明論。CCG的英語(yǔ)片段思想和蒙太格語(yǔ)法略有不同,不同種類自然語(yǔ)言的區(qū)別在蒙太格語(yǔ)法那里通過(guò)句法規(guī)則體現(xiàn)出來(lái),而CCG貫徹詞匯主義的思路把這些差異放到詞庫(kù)中去。CCG的證明論也不同于TLG的做法,而是從范疇構(gòu)造的獨(dú)特視角建立的范疇推演理論[2]。

        先介紹類型(范疇)等級(jí)(type hierarchy)的概念。類型的等級(jí)是序?qū)Α碩,?〉,滿足:

        1)T是類型的字母表。

        2)?是T上自返的反對(duì)稱的和傳遞的關(guān)系,稱作管轄關(guān)系,該系統(tǒng)是一個(gè)弱序。

        3)〈T,?〉有一個(gè)最小元素(處于等級(jí)頂端的),即存在一個(gè)類型管轄自身在內(nèi)的所有類型。

        4)〈T,?〉滿足:T的具有上限的每一子集都有一個(gè)最小上限?!碩,?〉中極大類型的集合中的元素是除自身外不管轄其他任何類型,換言之,極大類型是沒(méi)有(真)子類型的類型。

        我們給出類型等級(jí)的例子,如圖6:

        圖6 英語(yǔ)的范疇等級(jí)關(guān)系

        直線條表示管轄關(guān)系?。top是該類型等級(jí)中的最小類型,它管轄該等級(jí)中所有的類型。是該類型等級(jí)中的極大類型,它們只管轄自身。T在這里作為飽和(原子)范疇的集合A有top,S,Nom等17個(gè)成員。

        上述類型等級(jí)中只有飽和的原子范疇,這對(duì)刻畫自然語(yǔ)言的生成推演是不夠的。我們還需要大量的函子范疇,所以CCG就有函子范疇的構(gòu)造(category structure)、函子范疇的描述(category description)以及前者對(duì)應(yīng)后者的滿足等概念。

        前面談到,指派給詞條的范疇,尤其是函子范疇的構(gòu)造凝聚了有關(guān)的句法生成過(guò)程。

        對(duì)范疇構(gòu)造進(jìn)行形式化定義就構(gòu)成了CCG證明論的語(yǔ)義基礎(chǔ)?;陲柡?原子)范疇字母表A上的范疇構(gòu)造是一個(gè)六元組〈Q,Res,Arg,Vs,VM,VA〉,其中:1)Q是點(diǎn)的集合;2)Res和Arg分別是Q上的結(jié)果關(guān)系和論元關(guān)系;3)Vs和VM對(duì)每一非終結(jié)點(diǎn)分別指派斜線和斜線的模態(tài)下標(biāo); 4)VA對(duì)每一終結(jié)點(diǎn)指派A中的一個(gè)飽和范疇。例如,基于字母表{S,NP}的函子范疇(S×(NP)/*(NP◇S)的構(gòu)造樹(shù)為(見(jiàn)圖7):

        圖7 范疇構(gòu)造樹(shù)

        范疇構(gòu)造是語(yǔ)義概念,相關(guān)的句法概念是范疇描述。范疇描述的集合是這樣一個(gè)最小的集合,滿足:

        1)每一飽和范疇符號(hào)自身是范疇描述,即A?Φ;

        2)對(duì)所有φ,ψ∈Φ,所有μ∈{*,◇,×,■},φ/μψ∈Φ;

        3)對(duì)所有φ,ψ∈Φ,所有μ∈{*,◇,×,■},φ/μψ∈Φ;

        4)對(duì)所有φ,ψ∈Φ,所有μ∈{*,◇,×,■},φ/μψ∈Φ。①這里出現(xiàn)的豎線雙方向算子在通常文獻(xiàn)中不常見(jiàn),參見(jiàn)參考文獻(xiàn)[2]。

        然后,令基于類型等級(jí)〈A,?〉的范疇構(gòu)造S=〈Q,Res,Arg,Vs,VM,VA〉,q∈Q。S與q局部滿足A上的范疇描述φ,即S,q╞φ當(dāng)且僅當(dāng)

        1)φ∈A:存在某個(gè)滿足 φ?α的 α使得VA(q)=α

        2)φ=(ψ1δμψ2),δ∈{/,},μ∈{*,◇,×},Vs(q)=δ,VM(q)=μ,S,Res(q)╞ψ1并且S,Arg(q)╞ψ2

        3)φ=(ψ1|μψ2),μ∈{*,◇,×},VM(q)=μ,S,Res(q)╞ψ1并且S,Arg(q)╞ψ2

        4)φ=(ψ1δ■μψ2),δ∈{/,},Vs(q)=δ,S,Res(q)╞ψ1并且S,Arg(q)╞ψ2

        5)φ=(ψ1|■ψ2),S,Res(q)╞ψ1,S,Arg(q)╞ψ2

        基于上述英語(yǔ)范疇的等級(jí),CCG給出英語(yǔ)片段,也叫英語(yǔ)部分語(yǔ)句系統(tǒng)的形式定義。令∑是英語(yǔ)詞條的集合,我們有∑基礎(chǔ)上的四元組〈A,?,S,L〉滿足:

        1)〈A,?〉是飽和范疇的等級(jí)。

        2)S是A中的特異元素。

        3)L是從∑中非空符號(hào)串到A上生成的范疇描述的映射,即英語(yǔ)詞庫(kù)。

        這樣的〈A,?,S,L〉就稱作CCG的英語(yǔ)片段。

        最后,CCG給出任意兩個(gè)范疇描述φ和ψ的?-相容概念,在英語(yǔ)片段基礎(chǔ)上定義各種有效推理模式的概念:把詞庫(kù)中對(duì)詞條的范疇指派定義成前提詞條結(jié)論為范疇的推理模式;范疇的提升、不同模態(tài)下標(biāo)的函子范疇的各種組合和置換規(guī)則自然就是CCG證明論中帶有各種不同限制條件的推理模式[2]。

        所以,組合范疇語(yǔ)法CCG比較類型邏輯語(yǔ)法TLG而言,能更加深入揭示自然語(yǔ)言的語(yǔ)言學(xué)特點(diǎn),全面服務(wù)于自然語(yǔ)言的計(jì)算機(jī)處理需求。其特征是:1)為刻畫自然語(yǔ)言詞類的豐富句法特征對(duì)原子范疇進(jìn)行加標(biāo)多樣化的設(shè)置;2)為描述自然語(yǔ)言句法生成的細(xì)微之處對(duì)斜線算子實(shí)行模態(tài)化分類,據(jù)此確立不同斜線算子范疇的多樣組合規(guī)則;(3)基于范疇等級(jí)和范疇構(gòu)造的思想構(gòu)造CCG的證明論系統(tǒng)。

        [1]Steedman M,Baldridge J.Combinatory Categorial Grammar[C]//Kirsti B?rjars.Non-transformational syntax:a guide to current models.[S.l.]:Blackwell,2005.

        [2]McConville,Mark.Type-h(huán)ierarchical CCG[M].Edinburgh:University of Edinburgh,2005.

        Combinatory Categorial Grammar CCG

        ZOU Chong-li1,2
        (1.School of Humanities and Law,Yanshan University,Qinghuangdao 066004,China; 2.Institute of Philosophy,Chinese Academy of Social Sciences,Beijing 100732,China)

        Combinatory Categorial Grammar(CCG)and Type Logical Grammar(TLG)are the modern version of the categorial grammar.The former approach is concerned with the application of the linguistics and the information processing of the natural language;and the later one tended to scrutinize the nature of the theory of categorial grammar from the perspective of logic.The features of CCG are: the various way of labeling the basic category and the complete lexicalism;the modalization to the index of the slash operator and the multiple combinations of functor categories;the proof to CCG which based on the class of category and the construction of category.

        CCG;TLG;combination of functor categories

        B81

        A

        1674-8425(2011)08-0001-05

        2011-06-06

        國(guó)家社科基金項(xiàng)目“面向自然語(yǔ)言信息處理的范疇類型邏輯研究”(09BZX046)研究成果。

        鄒崇理(1953—),男,四川成都人,研究員,博士生導(dǎo)師,研究方向:自然語(yǔ)言邏輯。

        (責(zé)任編輯 魏艷君)

        猜你喜歡
        指派詞庫(kù)斜線
        詞庫(kù)音系學(xué)的幾個(gè)理論問(wèn)題芻議
        零元素行擴(kuò)展路徑算法求解線性指派問(wèn)題
        具有直覺(jué)模糊信息的任務(wù)指派問(wèn)題研究
        環(huán)境變了,詞庫(kù)別變
        電腦迷(2014年14期)2014-04-29 00:44:03
        非線性流水線的MTO/MOS工人指派優(yōu)化決策研究
        瘋狂的游戲
        飛碟探索(2013年2期)2013-08-13 09:31:01
        瘋狂的游戲
        飛碟探索(2012年12期)2012-04-29 23:33:50
        瘋狂的游戲
        飛碟探索(2012年10期)2012-04-29 21:11:10
        QQ手機(jī)輸入法如何導(dǎo)入分類詞庫(kù)
        電腦迷(2012年15期)2012-04-29 17:09:47
        更正啟事
        国产高跟丝袜在线诱惑| 久久久久国产一区二区| 精品一二三四区中文字幕| 成年女人a毛片免费视频| 国产熟妇另类久久久久| 99久久久无码国产aaa精品| 久久青草国产免费观看| 亚洲天堂av路线一免费观看| 一个少妇的淫片免费看| 99精品国产一区二区三区| 久久久久久国产精品美女| 亚洲国产AV无码男人的天堂| 97无码人妻一区二区三区蜜臀| 亚洲精品中文字幕乱码 | 精品国品一二三产品区别在线观看| 中文字幕久无码免费久久| 国产精品麻豆综合在线| 亚洲精品成AV无在线观看| 久久精品成人一区二区三区蜜臀| 亚洲最大水蜜桃在线观看| 日韩亚洲欧美中文在线| 成人做爰69片免费看网站| 欧美午夜精品久久久久久浪潮| 亚洲一区二区不卡日韩| 丝袜美腿在线观看一区| 激情影院内射美女| 一本久道久久综合五月丁香| 日本一区二区三区中文字幕视频 | 91麻豆精品久久久影院| 国产亚洲精品在线视频| 亚洲 中文 欧美 日韩 在线| 国产性生交xxxxx免费| 久久亚洲日本免费高清一区| 日韩精品极品视频在线免费| 亚洲av少妇一区二区在线观看| 国产精品白浆在线观看免费| 久久亚洲精品ab无码播放| 日韩成人无码v清免费| av免费在线播放一区二区| 在线观看国产成人av天堂野外| 久9re热视频这里只有精品|