亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        人工智能驅(qū)動(dòng)的“PDRT+CCG”視域下的預(yù)設(shè)研究

        2020-11-26 05:38:44鄒崇理武瑞豐
        關(guān)鍵詞:指針句法語(yǔ)句

        鄒崇理, 武瑞豐

        (湘潭大學(xué) 碧泉書院, 湖南 湘潭 411105)

        0 引言:人工智能對(duì)自然語(yǔ)言預(yù)設(shè)的研究需求

        當(dāng)今人工智能(AI)的發(fā)展,圖像方面的進(jìn)步非常快,但是識(shí)別圖像只是智能的一部分,人的智能中最高端的特征是語(yǔ)言。AI領(lǐng)域認(rèn)為:讓計(jì)算機(jī)理解自然語(yǔ)言是人工智能皇冠上的明珠。新一代人工智能取得突破的更高目標(biāo)就是讓機(jī)器理解人類的自然語(yǔ)言,這涉及到語(yǔ)義和語(yǔ)義背后的知識(shí)。要真正理解自然語(yǔ)言、攻克人工智能的難關(guān),需要AI自然語(yǔ)言處理領(lǐng)域的工作,需要對(duì)語(yǔ)言進(jìn)行語(yǔ)義分析,需要采用數(shù)學(xué)或邏輯的方式來(lái)表征語(yǔ)義背后的人類知識(shí)。清華大學(xué)教授、北京智源首席科學(xué)家孫茂松認(rèn)為:“從文本中挖掘知識(shí)庫(kù),文本中有大量的知識(shí),對(duì)知識(shí)進(jìn)行形式化,……變成類似謂詞邏輯表達(dá)式,相當(dāng)于變成某種公式,這時(shí)就可以往知識(shí)庫(kù)里補(bǔ)充。如果這條道走通了,這個(gè)問(wèn)題就會(huì)得到相當(dāng)程度的解決?!?1)《孫茂松:深度學(xué)習(xí)的紅利我們享受得差不多了!》,2019年11月20日,https:www.sohu.coma354990464_99979179,2020年1月5日。

        自然語(yǔ)言處理近年的發(fā)展,跟圖像識(shí)別的進(jìn)展類似,依賴的方法都是基于統(tǒng)計(jì)的深度學(xué)習(xí)。深度學(xué)習(xí)最顯著的特點(diǎn)就是背靠大數(shù)據(jù),機(jī)器憑借海量的數(shù)據(jù)進(jìn)行自主訓(xùn)練。自然語(yǔ)言處理中比如語(yǔ)音識(shí)別和機(jī)器翻譯,都是靠大數(shù)據(jù)驅(qū)動(dòng),即便如此,機(jī)器翻譯系統(tǒng)也沒(méi)有完全理解語(yǔ)言。如英語(yǔ)句“The box was in the pen”,“box”是盒子,“pen”有兩個(gè)意思:一個(gè)是“鋼筆”,另一個(gè)是“圍欄”。大數(shù)據(jù)驅(qū)動(dòng)的機(jī)器翻譯系統(tǒng)如谷歌、百度、微軟的機(jī)器翻譯系統(tǒng)都會(huì)把上句翻譯成“盒子在鋼筆里”。因?yàn)闄C(jī)器依據(jù)的是“鋼筆”出現(xiàn)頻度很高而“圍欄”出現(xiàn)頻度很低的統(tǒng)計(jì),機(jī)器不知道介詞“in”語(yǔ)義背后的知識(shí):一個(gè)體積小的東西才能放到一個(gè)體積大的東西里邊。機(jī)器不知道盒子比鋼筆大,不能放到鋼筆里,而盒子比圍欄小,可以放到圍欄里。再比如,若一個(gè)句子包含生活常識(shí),機(jī)器翻譯系統(tǒng)更會(huì)被搞得稀里糊涂。公交車上的到站提醒“前門快到了,請(qǐng)從后門下車”,這個(gè)句子對(duì)計(jì)算機(jī)系統(tǒng)來(lái)說(shuō)是難以理解的,機(jī)器不知道句中的“前門”是個(gè)地名,而“后門”卻是下車的通道。

        怎樣構(gòu)建訓(xùn)練人工智能翻譯系統(tǒng)所需要的知識(shí)庫(kù),這需要計(jì)算機(jī)科學(xué)、邏輯學(xué)、語(yǔ)言學(xué)和認(rèn)知科學(xué)等諸多領(lǐng)域的研究者通力合作,對(duì)人類知識(shí)的載體——自然語(yǔ)言的語(yǔ)義進(jìn)行數(shù)學(xué)和邏輯的分析處理。我們認(rèn)為,自然語(yǔ)言語(yǔ)義的一個(gè)部分——預(yù)設(shè)是自然語(yǔ)言承載知識(shí)的重要環(huán)節(jié),上文涉及的兩個(gè)例子都跟語(yǔ)言的預(yù)設(shè)有關(guān)聯(lián)。本文在當(dāng)今AI理解處理自然語(yǔ)言的迫切需求的激勵(lì)下,嘗試采用國(guó)際上新產(chǎn)生的語(yǔ)言邏輯工具——投射的話語(yǔ)表述理論P(yáng)DRT和組合范疇語(yǔ)法CCG對(duì)自然語(yǔ)言的預(yù)設(shè)現(xiàn)象進(jìn)行分析處理,為AI理解自然語(yǔ)言而構(gòu)建大知識(shí)庫(kù)的工作做些理論上的探索。

        1 預(yù)設(shè)是什么

        1.1 預(yù)設(shè)的邏輯起源

        預(yù)設(shè),也稱為前提、先設(shè)。預(yù)設(shè)是語(yǔ)義學(xué)、邏輯學(xué)、語(yǔ)用學(xué)等學(xué)科研究中的一個(gè)重要概念。預(yù)設(shè)的概念最初來(lái)源于邏輯學(xué),可以追溯到古希臘時(shí)代。最早研究預(yù)設(shè)的是哲學(xué)家和邏輯學(xué)家。其中,最有影響的三位哲學(xué)家是弗雷格、羅素和斯特勞森。

        弗雷格是第一個(gè)把預(yù)設(shè)作為概念進(jìn)行探討的。他在《意義和指稱》(“On Sense and Reference”)中提出:任何一個(gè)語(yǔ)句所包含的簡(jiǎn)單或者復(fù)雜的專有名詞都得具有指稱對(duì)象,否則這個(gè)語(yǔ)句就沒(méi)有真假值(2)A.P.馬蒂尼奇:《語(yǔ)言哲學(xué)》,牟博、楊音萊等譯,北京:商務(wù)印書館,2006年,第388-389頁(yè)。。如弗雷格以下的經(jīng)典例子能說(shuō)明這一點(diǎn)。

        (1)Kepler died in misery.(開(kāi)普勒死于貧困)

        (2)Kepler existed.(開(kāi)普勒存在)

        在弗雷格看來(lái),如果(1)要有真假值,那么就一定語(yǔ)義預(yù)設(shè)了(2),即開(kāi)普勒的存在。根據(jù)弗雷格的觀點(diǎn),一個(gè)句子的任何部分如果沒(méi)有指稱對(duì)象,那么這個(gè)句子的真值無(wú)法判定,就會(huì)出現(xiàn)真值間隙。

        羅素在《論指稱》(“On Denoting”)中反對(duì)真值間隙,堅(jiān)持二值論(3)B.Russell,“On Denoting”,Mind,Vol.14,No.56,1905.。在他看來(lái),一個(gè)語(yǔ)句要么為真,要么為假。如“法國(guó)國(guó)王是個(gè)禿子”可以翻譯為三個(gè)命題的并列,即“存在一個(gè)人是法國(guó)國(guó)王”、“如果存在一個(gè)y是法國(guó)國(guó)王,那么y就是x”和“x是禿子”。我們可以形式化地表述為:?x[F(x)∧?y[F(y)→y=x]∧C(x)]。因?yàn)榇斯綖楹先∈?,則可知,不存在法國(guó)國(guó)王,合取支為假,整個(gè)公式為假。羅素認(rèn)為預(yù)設(shè)是命題邏輯語(yǔ)義的一部分,如果預(yù)設(shè)為真,整個(gè)命題為真,反之亦然。

        在很長(zhǎng)一段時(shí)間里,羅素的觀點(diǎn)一直占有統(tǒng)治性的地位,直到1950年代,受到斯特勞森的挑戰(zhàn)。斯特勞森認(rèn)為羅素混淆了語(yǔ)句的意義和陳述的概念(4)P.F.Strawson,“On Referring”,Mind,Vol.59,No.235,1950.。一個(gè)語(yǔ)句不同于在具體的語(yǔ)境中應(yīng)用這個(gè)句子做出的陳述,一個(gè)語(yǔ)句可以有意義,但沒(méi)有真假,只有語(yǔ)句的陳述才有真假之分。使用語(yǔ)句進(jìn)行陳述需要結(jié)合一定的語(yǔ)境,這就開(kāi)啟了一種新的預(yù)設(shè)概念。例如,“法國(guó)的國(guó)王是禿子”,這句話本身無(wú)所謂真假,只有結(jié)合一定語(yǔ)境才能判斷真假。法國(guó)在君主制的時(shí)候,說(shuō)出這句話有真值,而在當(dāng)今,說(shuō)出這句話就無(wú)真假可言。

        1.2 預(yù)設(shè)的邏輯定義

        從邏輯語(yǔ)義角度看,學(xué)界大都把預(yù)設(shè)當(dāng)作句子與句子之間的一種真值關(guān)系。無(wú)論句子是真還是假,預(yù)設(shè)都為真。如果命題S′是命題S的預(yù)設(shè),當(dāng)且僅當(dāng),S邏輯地蘊(yùn)涵著S′,且S的否定式S也邏輯地蘊(yùn)涵著S′,即S?S′,且S?S′,則S′是S的預(yù)設(shè)。當(dāng)S′為假,則S非真非假。例如“開(kāi)普勒存在”是“開(kāi)普勒死于貧困”的預(yù)設(shè),當(dāng)且僅當(dāng),“開(kāi)普勒死于貧困”蘊(yùn)涵“開(kāi)普勒存在”,同時(shí),“開(kāi)普勒并非死于貧困”也蘊(yùn)涵“開(kāi)普勒存在”。若“開(kāi)普勒存在”為假,即“開(kāi)普勒”不存在,則談?wù)摗伴_(kāi)普勒是否死于貧困”就沒(méi)有意義而無(wú)所謂真假。

        然而,預(yù)設(shè)是動(dòng)態(tài)的,并不是僅僅與真假相關(guān)的語(yǔ)義現(xiàn)象,對(duì)它的分析還可從語(yǔ)用的角度來(lái)進(jìn)行。對(duì)于語(yǔ)用的分析,較有影響的有三類:將預(yù)設(shè)視為命題態(tài)度、話語(yǔ)被理解所需要滿足的條件和交際雙方所共有的知識(shí)或背景信息。最早提出“語(yǔ)用預(yù)設(shè)”概念的是斯托內(nèi)克爾。他曾指出:預(yù)設(shè)是一種態(tài)度,一種接受某物為真的態(tài)度;說(shuō)話人和聽(tīng)話人如果要想正常地會(huì)話,那么就需要遵守合作原則,預(yù)設(shè)正是交際雙方遵守合作原則的產(chǎn)物(5)M.K.Munitz,P.K.Unger,eds.,Semantics and Philosophy,New York:New York University Press,1974,pp.197-213.。還有學(xué)者把預(yù)設(shè)視為交際雙方都理解、接受的背景知識(shí)即共知性,指出語(yǔ)用預(yù)設(shè)的共知性是交際雙方能夠順利交際的基礎(chǔ)(6)陳晶晶:《預(yù)設(shè)投射問(wèn)題探析》,中國(guó)人民大學(xué)博士學(xué)位論文,2014年,第16頁(yè)。。如,A問(wèn)B:“小李的孩子上學(xué)了嗎?”這句話前提就是A和B都知道小李的所指以及小李有孩子。

        1.3 預(yù)設(shè)觸發(fā)語(yǔ)導(dǎo)致的預(yù)設(shè)分類

        預(yù)設(shè)是一種特殊的已知信息,它跟話語(yǔ)中的某些詞條或句子結(jié)構(gòu)緊密關(guān)聯(lián),也就是說(shuō)這些詞條和句子結(jié)構(gòu)可以稱作“預(yù)設(shè)觸發(fā)語(yǔ)”。

        卡圖南(L.Karttunen)曾收集了31種觸發(fā)預(yù)設(shè)的語(yǔ)言表達(dá)式(7)L.Karttunen,“Presuppositions of Compound Sentences”,Linguistic Inquiry,Vol.4,No.2,1973.,索姆斯(S.Soames)則列舉了8類(8)S.Soames,“How Presupposition are Inherited:A Solution to the Projection Problem”,Linguistic Inquiry,Vol.13,No.3,1982.,而列文森(Stephen C.Levinson)在《語(yǔ)用學(xué)》中共涉及了13種觸發(fā)語(yǔ)(9)Stephen C.Levinson,Pragmatics,Cambridge:Cambridge University Press,1983,pp.179-185.。在此,我們按照奴提雅(N.J.Venhuizen)的觀點(diǎn)(10)N.J.Venhuizen,Projection in discourse:A data-driven formal semantic analysis,PhD Dissertation,University of Groningen,2015,pp.12-14.,把預(yù)設(shè)觸發(fā)語(yǔ)大致分為“存在觸發(fā)語(yǔ)”、“基本命題觸發(fā)語(yǔ)”和“先決條件觸發(fā)語(yǔ)”三類。相應(yīng)地,把預(yù)設(shè)分為三大類。

        第一類:存在觸發(fā)語(yǔ)通常是說(shuō)指稱表達(dá)式預(yù)設(shè)某個(gè)實(shí)體的存在,主要包括限定摹狀詞、專名、所有格或帶修飾成分的名詞短語(yǔ)(包括代詞)。如:

        (1)那個(gè)發(fā)現(xiàn)行星軌道為橢圓的人悲慘地死去。(限定摹狀詞)

        預(yù)設(shè):存在發(fā)現(xiàn)行星軌道的人。

        (2)英國(guó)首相感染了新冠肺炎。(專名)

        預(yù)設(shè):存在英國(guó)首相。

        (3)他的妻子沒(méi)在家。(所有格)

        預(yù)設(shè):他有妻子。

        (4)證明月球繞地球公轉(zhuǎn)的不是中國(guó)人。(帶修飾成分的名詞短語(yǔ))

        預(yù)設(shè):有人證明了月球繞地球公轉(zhuǎn)。

        我國(guó)老一輩邏輯學(xué)家周禮全先生指出:“單獨(dú)名稱又可分為簡(jiǎn)單的單獨(dú)名稱和復(fù)雜的單獨(dú)名稱。前者就是通常所說(shuō)的專名,如‘開(kāi)普勒’;后者相當(dāng)于羅素所說(shuō)的摹狀詞,如‘那個(gè)發(fā)現(xiàn)行星運(yùn)行軌道的人’?!?11)周禮全主編:《邏輯——正確思維和有效交際的理論》,北京:人民出版社,1994年,第453-454。

        第二類:基本命題觸發(fā)語(yǔ)所觸發(fā)的是其嵌入或隱含的小句,主要包括事實(shí)動(dòng)詞、分裂句、時(shí)間修飾語(yǔ)、疑問(wèn)句、帶重讀成分的隱含分裂句。

        A.事實(shí)動(dòng)詞表示既成事實(shí),如“知道、后悔、意識(shí)到、抱歉的是、高興的是、驕傲的是”等等。這樣的動(dòng)詞觸發(fā)預(yù)設(shè)其嵌入的小句,也就是說(shuō)動(dòng)詞所涉及的事實(shí)內(nèi)容。如:

        (5)約翰知道瑪麗喜歡他。

        預(yù)設(shè):瑪麗喜歡約翰。

        B.分裂句就是強(qiáng)調(diào)句,目的是為了突出某一結(jié)構(gòu)的信息。分裂句所觸發(fā)預(yù)設(shè)就是和強(qiáng)調(diào)的焦點(diǎn)相關(guān)的預(yù)設(shè)。如:

        (6)是約翰殺了瑪麗。

        預(yù)設(shè):有人殺了瑪麗。

        C.時(shí)間修飾語(yǔ)在這里指的是“在……之前、在……之后、在……期間”等,它們所觸發(fā)的是時(shí)間狀語(yǔ)從句的內(nèi)容。如:

        (7)在長(zhǎng)沙旅游期間,我們受到了朋友的熱情款待。

        預(yù)設(shè):我們?cè)陂L(zhǎng)沙旅游。

        第三類:先決條件觸發(fā)語(yǔ)是以某種方式對(duì)其上下文施加先決條件或要求的表達(dá)式,主要包括蘊(yùn)涵動(dòng)詞、體動(dòng)詞、重復(fù)標(biāo)志。

        A.蘊(yùn)含動(dòng)詞指的是蘊(yùn)含其他事件的動(dòng)詞,其所觸發(fā)的預(yù)設(shè)得根據(jù)動(dòng)詞蘊(yùn)含意義。如:

        (8)我在路上偶遇了一個(gè)老朋友。

        預(yù)設(shè):我沒(méi)曾想會(huì)在路上碰到他。

        B.體動(dòng)詞表示動(dòng)作的開(kāi)始、結(jié)束、繼續(xù)等,其觸發(fā)的預(yù)設(shè)是動(dòng)詞意義的先前狀態(tài)。如:

        (9)課后繼續(xù)討論這個(gè)話題。

        預(yù)設(shè):已經(jīng)討論這個(gè)話題了。

        C.重復(fù)標(biāo)志表示某個(gè)動(dòng)作或狀態(tài)重復(fù)的詞語(yǔ),包括“再一次、又、第n次(n>1)”等,它們表示重復(fù)內(nèi)容的預(yù)設(shè)。如:

        (10)這是我第三次來(lái)廣西了。

        預(yù)設(shè):我來(lái)過(guò)廣西兩次。

        本文限于篇幅,作為應(yīng)用新邏輯工具解決預(yù)設(shè)問(wèn)題的起步,先處理第一類預(yù)設(shè)現(xiàn)象。

        2 處理預(yù)設(shè)的邏輯語(yǔ)義學(xué)工具

        自從弗雷格把預(yù)設(shè)作為邏輯概念進(jìn)行討論以來(lái),出現(xiàn)了許多研究預(yù)設(shè)的邏輯語(yǔ)義學(xué)工具,本文主要涉及投射的話語(yǔ)表征PDRT和組合范疇語(yǔ)法CCG。

        2.1 話語(yǔ)表征理論DRT對(duì)預(yù)設(shè)的處理——PDRT

        范德杉特(R. van der Sandt)的理論認(rèn)為,預(yù)設(shè)投射(12)這里所謂預(yù)設(shè)投射粗淺地理解為:把一個(gè)語(yǔ)句的預(yù)設(shè)信息吸收到該語(yǔ)句的語(yǔ)義表征中。等同于回指消解,預(yù)設(shè)和回指表現(xiàn)出相似的行為(13)R.van der Sandt,“Presupposition Projection as Anaphora Resolution”,Journal of Semantics,Vol.9,No.4,1992.。然而,與回指不同的是,在沒(méi)有合適先行詞的情況下,預(yù)設(shè)可以恰當(dāng)?shù)爻霈F(xiàn)。在這些情況下,一個(gè)新的DRS是在一個(gè)可及的話語(yǔ)層面上被創(chuàng)造出來(lái)的,這個(gè)過(guò)程被稱為“納入”。范德杉特采用DRT框架來(lái)實(shí)現(xiàn)對(duì)預(yù)設(shè)的處理。如:

        (1)Somebody did not notice the pilot.

        預(yù)設(shè)信息被納入的DRS

        上例句的預(yù)設(shè)觸發(fā)語(yǔ)是“the pilot”,涉及的預(yù)設(shè)信息是“存在y:pilot(y)”,在可及的整體DRS中這個(gè)預(yù)設(shè)信息被納入其中,但R.van der Sandt在采用DRT處理預(yù)設(shè)時(shí)產(chǎn)生的一個(gè)問(wèn)題是:在預(yù)設(shè)投射納入后,納入的預(yù)設(shè)信息和斷言信息是沒(méi)有區(qū)分的。例如,在(1)的DRS中,納入的預(yù)設(shè)信息“存在y:pilot(y)”被添加到整體的DRS中,因此獲得與“person”引入的斷言信息相同的狀態(tài)。Krahmer認(rèn)為,納入的預(yù)設(shè)應(yīng)該保持其預(yù)設(shè)性,它們不同于斷言的信息(14)Emiel Krahmer,Presuppostion and Anaphora,Standford:CSLI Publications,1998,pp.13-19.。為解決這一問(wèn)題,Krahmer引入了預(yù)設(shè)信息的標(biāo)記,使得預(yù)設(shè)在更高的語(yǔ)篇層次上被納入,允許其有不同于斷言信息的解釋。這里需要一個(gè)單一的表示框架,允許對(duì)斷言的信息和預(yù)設(shè)的信息進(jìn)行區(qū)別。于是產(chǎn)生了投射的DRT(Projective Discourse Representation Theory),即DRT的擴(kuò)展——PDRT(15)N.J.Venhuizen,et al.,“Parsimonious Semantic Representation with Projection Pointer”,Proceedings of the 10th International Conference on Computational Semantics,Potsdam,2013,pp.252-263.。在PDRT中,給所有PDRS中的話語(yǔ)所指和PDRS條件添加指針,顯示它們的投射納入位置。這意味著預(yù)設(shè)的信息可以從納入它的PDRS中清楚地識(shí)別出來(lái)。

        在PDRT中,斷言信息和預(yù)設(shè)信息的差異在于它們指向不同的PDRS語(yǔ)境。斷言信息的指針就是引入斷言的PDRS標(biāo)簽。預(yù)設(shè)信息的指針是另一可及的PDRS標(biāo)簽,也可以是自由變量。如(2)所示,我們使用正整數(shù)表示標(biāo)簽(約束指針),而f表示自由指針。

        (2)a.A boy smiles.

        b.The boy smiles.

        c.It is not the case that the boy smiles.

        所有的話語(yǔ)指稱和DRS條件都跟一個(gè)指針相關(guān)聯(lián),指針是一個(gè)倒箭頭指向的對(duì)象。(2a)顯示,沒(méi)有投射的預(yù)設(shè)信息,則有關(guān)的話語(yǔ)指稱和DRS條件都指向引入這些信息的PDRS(標(biāo)記為“1”的PDRS)。另一方面,在(2b)和(2c)中,限定摹狀詞“the boy”觸發(fā)了關(guān)于話語(yǔ)指稱存在的預(yù)設(shè),這里預(yù)設(shè)信息的指針為自由變?cè)?這里是“f”)。自由指針代表最外層的PDRS的標(biāo)簽,在(2b)和(2c)中,自由指針代表的都是標(biāo)記為“1”的PDRS。

        大多數(shù)預(yù)設(shè)理論主張預(yù)設(shè)信息由詞匯驅(qū)動(dòng)。即是說(shuō),特定的詞匯項(xiàng)將產(chǎn)生預(yù)設(shè),特定的詞條稱為“預(yù)設(shè)觸發(fā)語(yǔ)”。因此,預(yù)設(shè)的信息將體現(xiàn)在投射觸發(fā)語(yǔ)的詞條語(yǔ)義上。根據(jù)邏輯的組合原則,從作為預(yù)設(shè)觸發(fā)語(yǔ)的詞條語(yǔ)義出發(fā),一步步推演出涉及預(yù)設(shè)的語(yǔ)句的語(yǔ)義。于是有學(xué)者采用λ-演算的工具對(duì)PDRT進(jìn)行組合處理(16)Reinhard Muskens,“Combining Montague semantics and discourse representation”,Linguistics and Philosophy,Vol.19,No.2,1996;Johan Bos,“Implementing the Binding and Accommodation Theory for Anaphora Resolution and Presupposition Projection”,Computational Linguistics,Vol.29, No.2,2003.。PDRT中的組合性是通過(guò)以類型化的λ-項(xiàng)的形式為每個(gè)詞條提供語(yǔ)義來(lái)實(shí)現(xiàn)的。為了組合這些語(yǔ)義,PDRT提出PDRS的合并操作,通過(guò)合并將兩個(gè)PDRS合并為一個(gè)。我們對(duì)斷言的和預(yù)設(shè)的DRS使用不同的合并形式,以顯示它們不同的組合特性。在PDRT中,涉及預(yù)設(shè)投射信息的PDRS合并與涉及斷言信息的PDRS合并其操作標(biāo)識(shí)是不同的:用“+”表示兩個(gè)斷言PDRS的合并;用“*”表示涉及預(yù)設(shè)PDRS的合并。

        兩個(gè)PDRS之間的斷言合并可以通過(guò)各自話語(yǔ)所指和PDRS條件的并集來(lái)定義。合并后的整體PDRS的標(biāo)簽必須與合并前第二個(gè)PDRS的標(biāo)簽一致。斷言合并操作的定義如下所示:

        定義斷言合并

        這里對(duì)合并的結(jié)果進(jìn)行了指針的重命名,把第一個(gè)PDRS中的話語(yǔ)所指集合Di和PDRS條件集合Ci中的指針i替換成第二個(gè)PDRS中的話語(yǔ)所指集合和PDRS條件集合中的指針j,分別得Di[j/i]和Ci[j/i],再把它們分別同第二個(gè)PDRS中的Dj和Cj進(jìn)行并集運(yùn)算,最后完成合并獲得新的整體PDRS。語(yǔ)句系列“A man sings. A woman dances.”的PDRS合并如下:

        這里標(biāo)簽(約束指針)為1的PDRS,其話語(yǔ)所指集合D1={1←x},其條件集合C1={1←man(x),1←sing(x)},對(duì)此進(jìn)行指針重命名后得標(biāo)簽為2的PDRS:D2={2←x},C2={2←man(x),2←sing(x)},再跟原本標(biāo)簽為2的PDRS的話語(yǔ)所指集合和條件集合分別進(jìn)行并集運(yùn)算,這樣就得到合并操作后的整體PDRS。

        另一方面,預(yù)設(shè)的信息在合并操作時(shí)則不受合并后的整體PDRS其他信息的影響,而是保留預(yù)設(shè)信息的指針,指針指向其納入PDRS語(yǔ)境的標(biāo)簽或是自由變?cè)?。因此,涉及預(yù)設(shè)的合并只需將預(yù)設(shè)信息中的話語(yǔ)所指及其條件添加到整體PDRS中。這就產(chǎn)生了以下定義:

        定義涉及預(yù)設(shè)的合并

        出于理解的直觀性,我們以“John loves his child”的PDRT的分析為例(17)下面的PDRS方框中最下層行表明標(biāo)簽所代表的PDRS之間的可及關(guān)系。如“2≤1”表明PDRS2中話語(yǔ)所指被指被PDRS1所約束。:

        此例是說(shuō)John和his child都是預(yù)設(shè)觸發(fā)語(yǔ),其在PDRS1和PDRS2中預(yù)設(shè)信息的指針合并后在整體PDRS中被保留下來(lái)。

        2.2 組合范疇語(yǔ)法CCG對(duì)預(yù)設(shè)的處理——格羅寧根意義庫(kù)GMB

        組合范疇語(yǔ)法,簡(jiǎn)稱CCG。其特征大致有:第一,CCG對(duì)自然語(yǔ)言的句法語(yǔ)義分析面向的是大規(guī)模的真實(shí)文本,CCG處理的就是自然語(yǔ)言的個(gè)案?jìng)€(gè)例。第二,CCG認(rèn)為自然語(yǔ)言只有表層結(jié)構(gòu)這樣的句法層面,這也是所謂單層結(jié)構(gòu)的思想。句法表層的每個(gè)成分都有各自的語(yǔ)義作用,自然語(yǔ)言邏輯語(yǔ)義的分析推演自始至終基于句法表層的構(gòu)造,而不像喬姆斯基的GB理論假定自然語(yǔ)言具有一個(gè)便于語(yǔ)跡移動(dòng)的深層結(jié)構(gòu),也不似蒙太格語(yǔ)法那樣假定自然語(yǔ)言具有用于量化嵌入規(guī)則的帶邏輯變項(xiàng)的底層結(jié)構(gòu)。第三,CCG的詞匯主義原則是:“我們假定,所有的結(jié)構(gòu)都是由詞匯管轄的,并且詞匯中心語(yǔ)具有明顯的語(yǔ)義形式”(18)Mark Steedman,Combinatory Categorial Grammar,Philadelphia,PA:The SOMESUCH Press,2017,pp.143-144.。自然語(yǔ)言表達(dá)式所有的句法結(jié)構(gòu)都被作為其構(gòu)造成分的詞條所控制,換言之,詞條的范疇指派凝縮了句法結(jié)構(gòu)的運(yùn)算推演過(guò)程。同樣一個(gè)詞條在不同的個(gè)案?jìng)€(gè)例句中可能被指派不同的范疇。第四,CCG強(qiáng)調(diào)句法和語(yǔ)義的對(duì)應(yīng)原則,即句法和語(yǔ)義的透明原則。CCG所謂透明性原則指出,每個(gè)句法范疇對(duì)應(yīng)一個(gè)唯一的語(yǔ)義類型。尤其是,語(yǔ)句范疇S對(duì)應(yīng)邏輯公式的類型t,這確保生成的語(yǔ)句翻譯成一個(gè)邏輯公式。

        組合范疇語(yǔ)法怎樣處理預(yù)設(shè)?這需要借鑒PDRT分析預(yù)設(shè)的技術(shù)手段,譬如前文提及的“指針”概念,尤其需要關(guān)注涉及PDRT的兩個(gè)合并操作的規(guī)則運(yùn)用的情況。CCG自身一些重要的經(jīng)驗(yàn)主義特征——個(gè)案?jìng)€(gè)例的方法,如詞例和規(guī)則例的思想會(huì)對(duì)PDRT產(chǎn)生影響。即CCG對(duì)PDRT的吸納是一種“取長(zhǎng)補(bǔ)短”的互動(dòng)。如:CCG對(duì)連詞或起連詞作用的逗號(hào)進(jìn)行個(gè)案?jìng)€(gè)例的特殊處理,牽涉到PDRT的合并規(guī)則,CCG可能產(chǎn)生許多具體的規(guī)則例。

        CCG的并列規(guī)則的一般模式<Φn>為:

        X:f conj:b X:g ?ΦnX:λ…b(f…)(g…) (conj是范疇(XX)X的縮寫)

        具體來(lái)說(shuō):

        當(dāng)Φ0時(shí),bxy≡bxy

        當(dāng)Φ1時(shí),bfg≡λx.b(fx)(gx)

        當(dāng)Φ2時(shí),bfg≡λx.λy.b(fxy)(gxy)

        當(dāng)Φ3時(shí),bfg≡λx.λy.λz.b(fxyz)(gzyz)

        當(dāng)Φ4時(shí),bfg≡λx.λy.λz.λw.b(fxyzw)(gxyzw)

        對(duì)自然語(yǔ)言中包含預(yù)設(shè)的并列句如“張三有女兒并且張三的女兒出嫁了”、“李四曾經(jīng)抽煙并且現(xiàn)在戒煙了”之類的分析,基于PDRT作為語(yǔ)義表征的CCG可以把自己的并列規(guī)則模式變成涉及PDRS合并的規(guī)則例:

        S:PDRS K1conj:* S:PDRS K2? S:PDRS K1*PDRS K2

        而不涉及預(yù)設(shè)的通常并列句,其并列規(guī)則例可以是:

        S:PDRS K1conj:+ S:PDRS K2? S:PDRS K1+PDRS K2

        格羅寧根意義庫(kù)GMB就是在CCG框架內(nèi)采用PDRT的技術(shù)手段分析自然語(yǔ)言的產(chǎn)物(19)格羅寧根意義庫(kù)GMB以數(shù)據(jù)驅(qū)動(dòng)語(yǔ)義分析為基礎(chǔ),旨在標(biāo)注各種各樣的語(yǔ)言現(xiàn)象。它不僅結(jié)合了各種層次的語(yǔ)言標(biāo)注,而且提供了一個(gè)“深”層的形式意義表征,它把多個(gè)層面的標(biāo)注合成到一個(gè)單一的語(yǔ)言形式,而且將這個(gè)單一的語(yǔ)言形式整合到一個(gè)單一的表征框架中,即PDRT所提供的結(jié)構(gòu)。GMB這樣的資源庫(kù)的構(gòu)建需要幾個(gè)階段,包括為收集語(yǔ)義標(biāo)注數(shù)據(jù),選擇和開(kāi)發(fā)用于自動(dòng)分析數(shù)據(jù)的NLP工具,以及選擇正確的方法來(lái)存儲(chǔ)和評(píng)估標(biāo)注。。

        GMB語(yǔ)料庫(kù)中對(duì)英語(yǔ)句的分析,其對(duì)預(yù)設(shè)的語(yǔ)義表征采用PDRT的方式。GMB的亮點(diǎn)是在語(yǔ)句的分析推演中增加了范疇的運(yùn)算,即在CCG框架內(nèi)生成語(yǔ)句。生成是一種句法和語(yǔ)義的并行推演——既有各類表達(dá)式句法范疇的運(yùn)算,又有與之對(duì)應(yīng)的PDRS語(yǔ)義表征的組合。即把CCG原有的作為語(yǔ)義表征的λ-項(xiàng)換成了PDRT中的PDRS。GMB的重要特征是句法與語(yǔ)義接口的透明性,句法與語(yǔ)義的并行推演,這一特征是對(duì)CCG基本特征的繼承。也就是說(shuō),GMB堅(jiān)持邏輯語(yǔ)義學(xué)工具的傳統(tǒng)——句法和語(yǔ)義對(duì)應(yīng)的組合原則。

        在GMB語(yǔ)義庫(kù)中,涉及預(yù)設(shè)的英語(yǔ)句“the cow moos”的CCG+PDRT推演圖示如下:

        上推演圖的最后結(jié)果中的預(yù)設(shè)信息為:存在是“cow”的個(gè)體。

        3 嘗試采用PDRT+CCG的工具分析預(yù)設(shè)現(xiàn)象

        對(duì)語(yǔ)言學(xué)界熟知的語(yǔ)義疑難句“王冕死了父親”,大都認(rèn)為:該句中的“死”通常作為不及物動(dòng)詞(一元謂詞),為什么出現(xiàn)了兩個(gè)論元(王冕和父親)?其次,“王冕”和“父親”的關(guān)系到底是什么?顯然不是施事與受事的關(guān)系。有學(xué)者將“父親”稱為“領(lǐng)主屬賓語(yǔ)”,該句的主語(yǔ)和賓語(yǔ)存在明顯的“領(lǐng)有隸屬”關(guān)系,而沒(méi)有直接的語(yǔ)義關(guān)系。類似的表達(dá)還有:

        張三爛了一筐梨。

        這個(gè)學(xué)校倒了一堵墻。

        孫從眾的《從語(yǔ)義—句法界面看“王冕死了父親”的生成方式》(20)孫從眾:《從語(yǔ)義—句法界面看“王冕死了父親”的生成方式》,《寧波廣播電視大學(xué)學(xué)報(bào)》2016年第4期。一文認(rèn)為該句式的形成結(jié)合了語(yǔ)義的糅合和謂語(yǔ)動(dòng)詞的移位,移位動(dòng)因是“死”的語(yǔ)義增值……句式結(jié)構(gòu)中“死”的背后附加了一種“損失”之意,或者說(shuō)“死”與“損失”兩種意義相糅合,最終導(dǎo)致句法結(jié)構(gòu)發(fā)生了相應(yīng)的改變——移位(21)對(duì)這類語(yǔ)言現(xiàn)象,主流的研究觀點(diǎn)主要從三個(gè)角度進(jìn)行嘗試:第一種是從生成語(yǔ)法出發(fā),到后來(lái)在句法—語(yǔ)用交接面完善(張三被打斷了一條腿?張三的一條腿被打斷了?張三打斷了一條腿);第二種是利用認(rèn)知語(yǔ)言學(xué)的構(gòu)式語(yǔ)法來(lái)解釋;第三種則是從歷時(shí)的角度出發(fā),從歷史語(yǔ)料尋找演變的原因。。

        本文的解決思路是:把“死”仍當(dāng)作不及物動(dòng)詞,預(yù)設(shè)存在一個(gè)被領(lǐng)屬的個(gè)體,而“王冕”則是這個(gè)領(lǐng)屬者。表征領(lǐng)屬者的邏輯表達(dá)PDRS跟“死”的PDRS組合,回頭來(lái)再跟“父親”的PDRS組合,最后的結(jié)果是“父親”找到領(lǐng)屬者,同時(shí)“死”也找到了論元。組成句子“王冕死了父親”的詞條信息及其推演如下:

        2.死了 SNP:λx.(b2〈?,{b2←死了′(x)}〉)

        3.父親 SNP:λx2.(b3〈?,{b3←父親′(x2)}〉)

        句子的推演如下圖所示:

        推演最后結(jié)果表明:預(yù)設(shè)的觸發(fā)語(yǔ)是專名“王冕”。b2的語(yǔ)境顯示:預(yù)設(shè)存在一個(gè)父親的個(gè)體,而且是王冕所領(lǐng)有的個(gè)體。在這個(gè)預(yù)設(shè)下,句子表達(dá)的意思是“王冕父親的個(gè)體死了”。這樣解決了該句所謂“領(lǐng)屬”和“移位”問(wèn)題,而該句關(guān)于語(yǔ)義糅合的問(wèn)題留待今后的工作。

        本文引言中提到AI發(fā)展需要構(gòu)建知識(shí)庫(kù)遇到的語(yǔ)義難題,這里嘗試采用PDRT+CCG的語(yǔ)言邏輯工具,對(duì)含多個(gè)預(yù)設(shè)的例句“The box was in the pen”進(jìn)行分析。該語(yǔ)句的詞條信息為:

        該語(yǔ)句詳細(xì)的推演步驟如下:

        最后獲得的PDRS作為例句的語(yǔ)義表征,包含的三個(gè)預(yù)設(shè)信息是:b2〈{b2←x1},{b2←box(x1)}〉、b6〈{b6←x5},{b6←pen(x5)}〉和b3〈?,{b3←larger-than(x5,x1)}〉。b2表明:存在一個(gè)是盒子的個(gè)體;b6說(shuō)的是:存在一個(gè)是圍欄的個(gè)體;b3意味著:作為圍欄的個(gè)體比作為盒子的個(gè)體體積大。名詞短語(yǔ) “the box”和“the pen”所表示的預(yù)設(shè)是由詞匯意義或者結(jié)構(gòu)所引發(fā)的,而預(yù)設(shè)b3“l(fā)arger-than(x5, x1)”是句子“The box was in the pen”得以恰當(dāng)表達(dá)的適宜性條件,是說(shuō)話人主觀認(rèn)定當(dāng)然成立的命題,或者是說(shuō)話人認(rèn)為交際雙方共有的交際信息或聽(tīng)話人能夠自然推斷出來(lái)的信息。b3的預(yù)設(shè)信息正好是本文引言中提到的關(guān)于新一代AI需要解決的問(wèn)題:語(yǔ)言表達(dá)式be-in預(yù)設(shè)“一個(gè)較小的東西放到一個(gè)較大東西里邊”的常識(shí)。

        在當(dāng)今AI構(gòu)建知識(shí)庫(kù)的另一例句“前門快到了,請(qǐng)從后門下車”中,構(gòu)成該語(yǔ)句的詞匯的句法范疇和語(yǔ)義范疇為:

        5.[請(qǐng)從…下車](23)從非連續(xù)的范疇邏輯視角看,該句系列第二句中的動(dòng)詞被分析成非連續(xù)詞條:請(qǐng)從…下車。該句系列的兩個(gè)子句都是祈使句,推演最后的結(jié)果是語(yǔ)句函項(xiàng)的類型。(SNP)(S(SNP)):λY.λx5.(Y@λx6.(b4〈{b4←e2,b4←t1},{b4←[請(qǐng)從…下車]′(e2),b4←Time(e2,t1),b4←t1=now,b4←Agent(e2,x5),b4←Patient(e2,x6)}〉))

        此句詳細(xì)的推演步驟見(jiàn)下頁(yè)文尾。

        這個(gè)例子包含的兩個(gè)預(yù)設(shè)是:存在是“前門”并且作為“車站名”的個(gè)體x1,存在是“后門”并且作為“下車通道”的個(gè)體x4,即“前門”和“后門”對(duì)應(yīng)的預(yù)設(shè)信息涉及“車站名”和“下車通道”。這個(gè)包含生活常識(shí)的句子對(duì)于機(jī)器翻譯來(lái)說(shuō)是無(wú)法識(shí)別的,因?yàn)樗婕暗搅苏f(shuō)話人和聽(tīng)話人的知識(shí)背景。再如,語(yǔ)句“你真好”包含至少兩層意思:對(duì)一個(gè)人的贊揚(yáng)或者諷刺。但對(duì)于英漢機(jī)器翻譯系統(tǒng)來(lái)說(shuō),并不能識(shí)別語(yǔ)句所包含的贊揚(yáng)或諷刺,而只能機(jī)械地翻譯成“You are really kind”。這些表明,當(dāng)涉及文化背景、認(rèn)知、心理、時(shí)間、地點(diǎn)等語(yǔ)用因素時(shí),機(jī)器翻譯系統(tǒng)就顯得力不從心。因此,構(gòu)建人工智能的翻譯系統(tǒng)所需要的知識(shí)庫(kù)顯得尤為重要,這就需要計(jì)算機(jī)科學(xué)、邏輯學(xué)、語(yǔ)言學(xué)和認(rèn)知科學(xué)等研究領(lǐng)域共同合作。本文采用“PDRT+CCG”的數(shù)理邏輯工具表征這些涉及預(yù)設(shè)的知識(shí)信息,期待有助于人工智能關(guān)于自然語(yǔ)言理解的工作。

        4 結(jié)語(yǔ)

        AI的發(fā)展必然會(huì)給社會(huì)帶來(lái)根本性的變化,也會(huì)為語(yǔ)言、邏輯的發(fā)展提供新的契機(jī)。當(dāng)今的語(yǔ)言研究者要想使得計(jì)算機(jī)“理解”自然語(yǔ)言,就需要對(duì)自然語(yǔ)言進(jìn)行句法和語(yǔ)義的形式化分析,使自然語(yǔ)言成為一種可計(jì)算、可推演的處理對(duì)象。這不僅需要涉及詞匯、語(yǔ)義、語(yǔ)法、語(yǔ)用等方面的理論語(yǔ)言學(xué)研究,而且還需要語(yǔ)料庫(kù)語(yǔ)言學(xué)、計(jì)算語(yǔ)言學(xué)等方面的實(shí)驗(yàn)語(yǔ)言學(xué)研究。也就是說(shuō),既需要基于文本大數(shù)據(jù)的研究,又需要面向自然語(yǔ)言處理的資源庫(kù)的建設(shè)。近兩年國(guó)家層面的哲學(xué)社會(huì)科學(xué)重大項(xiàng)目清單中經(jīng)常出現(xiàn)“新一代人工智能的哲學(xué)思考”、“新一代人工智能發(fā)展的自然語(yǔ)言理解研究”、“大數(shù)據(jù)背景下的人工智能及其邏輯的哲學(xué)反思”及“新一代人工智能驅(qū)動(dòng)的邏輯學(xué)研究”等題目。這里的關(guān)鍵詞有“人工智能”、“哲學(xué)思考或反思”和“自然語(yǔ)言理解或邏輯學(xué)研究”。本文關(guān)注的題材是類似的,即語(yǔ)言邏輯研究什么?怎樣研究?我們可以從人工智能的需求找到答案,AI需要理解處理自然語(yǔ)言語(yǔ)義及其背后的知識(shí),這就是語(yǔ)言邏輯研究的對(duì)象。AI要求采用數(shù)學(xué)或邏輯的形式化方式表征自然語(yǔ)言的語(yǔ)義,我們的語(yǔ)言邏輯研究就采用新的邏輯工具PDRT+CCG來(lái)分析自然語(yǔ)言的語(yǔ)義。我們注意到自然語(yǔ)言語(yǔ)義及其背后的知識(shí)跟語(yǔ)句的預(yù)設(shè)相關(guān),因此,本文的論題就此確定。自然語(yǔ)言的真實(shí)文本是浩淼無(wú)邊的大海,本文的研究具有起航的意義。預(yù)設(shè)的信息是否可以完全地在被預(yù)設(shè)語(yǔ)句的語(yǔ)義中討論,以及更多的預(yù)設(shè)現(xiàn)象如何表征等問(wèn)題,留待今后的工作。

        猜你喜歡
        指針句法語(yǔ)句
        句法與句意(外一篇)
        述謂結(jié)構(gòu)與英語(yǔ)句法配置
        重點(diǎn):語(yǔ)句銜接
        偷指針的人
        句法二題
        詩(shī)詞聯(lián)句句法梳理
        精彩語(yǔ)句
        為什么表的指針都按照順時(shí)針?lè)较蜣D(zhuǎn)動(dòng)
        基于改進(jìn)Hough變換和BP網(wǎng)絡(luò)的指針儀表識(shí)別
        ARM Cortex—MO/MO+單片機(jī)的指針變量替換方法
        欧美大香线蕉线伊人久久| 精品日韩一级免费视频| 久久狠狠色噜噜狠狠狠狠97| 精品无码国产自产野外拍在线| 国产精品99久久久精品免费观看| 玩弄极品少妇被弄到高潮| 久久一区二区三区久久久| 亚洲国产天堂久久综合网| 亚洲肥老熟妇四十五十路在线 | 性久久久久久久| 亚欧免费视频一区二区三区| 看国产亚洲美女黄色一级片| 欧洲熟妇色xxxx欧美老妇性| 国产色综合天天综合网| 亚洲色欲色欲大片WWW无码| 91精品人妻一区二区三区水蜜桃| 国产成人av综合色| 粉嫩少妇内射浓精videos| 国产精品一区二区三密桃| av黄页网国产精品大全| 国产农村妇女毛片精品久久 | 夜晚黄色福利国产精品| 粗大猛烈进出高潮视频| 狠狠躁夜夜躁AV网站中文字幕| 在线视频播放观看免费| 国产免费观看黄av片| 国产自偷亚洲精品页65页| 4hu44四虎www在线影院麻豆 | 久久久精品2019免费观看| 久久久久久人妻一区精品| 青青河边草免费在线看的视频| 天天躁日日躁狠狠久久| 波霸影院一区二区| 国产女人乱码一区二区三区| 国产激情综合在线观看| 91精品视品在线播放| 亚洲av自偷自拍亚洲一区| 久久亚洲精品情侣| 欧洲熟妇乱xxxxx大屁股7| 狼人av在线免费观看| 99久久免费视频色老|