唐 忠, 劉華陽, 劉珊珊, 李大舟
(沈陽化工大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院, 遼寧 沈陽 110142)
謂詞邏輯是一種數(shù)理邏輯方法,用于知識表示和推理,在計(jì)算機(jī)領(lǐng)域有著廣泛的應(yīng)用.在自然語言中,具有確定真值的陳述句,即命題,可以劃分為主語和謂語部分.謂詞邏輯將命題的主語部分表示為客體,用于表達(dá)事物,謂語部分表示為謂詞,表達(dá)事物的性質(zhì)、狀態(tài)以及事物之間的關(guān)系.謂詞邏輯將句子中的成分進(jìn)行細(xì)化,具有比命題邏輯更精確的表達(dá)能力.
在自然語言處理的語義分析研究過程中,也將自然語言轉(zhuǎn)換為謂詞公式,即轉(zhuǎn)為計(jì)算機(jī)可處理的形式[1].語義分析的目的是理解自然語言所表達(dá)的意義,而謂詞邏輯僅能表達(dá)命題中的主語和謂語部分,不能完整準(zhǔn)確地反映句子的全部語義,這也使得現(xiàn)有的語義分析技術(shù)應(yīng)用領(lǐng)域受限,只能應(yīng)用于簡單結(jié)構(gòu)的語句中.語義分析技術(shù)要想得到更廣泛的應(yīng)用,謂詞公式必須能夠精確地表達(dá)句子原有的語義,即必須能夠表達(dá)出主語謂語以外的其他語法成分和復(fù)雜的句子結(jié)構(gòu).因此,必須對傳統(tǒng)的謂詞邏輯進(jìn)行擴(kuò)展.
謂詞邏輯一直保持著客體和謂詞的基本組成結(jié)構(gòu),近年來雖然有一些改進(jìn),如:文獻(xiàn)[2]給出了可以進(jìn)行集合表示和操作的謂詞lambda演算,文獻(xiàn)[3]提出了消去存在量詞及其約束變元的Lambda依存組合語義(lambda dependency based compositional semantics,λ-DCS),但謂詞的基本結(jié)構(gòu)并沒有改變,因此,其表達(dá)能力并沒有本質(zhì)上的變化.
從語句到謂詞的轉(zhuǎn)換通常是基于謂詞的定義、根據(jù)句子中的語法成分進(jìn)行,在轉(zhuǎn)換過程中有一些特定的規(guī)則,如通用名詞一般轉(zhuǎn)換為謂詞,專有名詞一般轉(zhuǎn)換為客體,形容詞一般轉(zhuǎn)換為謂詞,等.比較經(jīng)典的轉(zhuǎn)換方法研究有:TAYAL對英語句子按語法結(jié)構(gòu)進(jìn)行分類,得出9種類型,然后給出不同類型句子的謂詞轉(zhuǎn)換規(guī)則,用于自然語言處理中的知識表示[4];MPAGOULI給出了動詞、形容詞和名詞分別做謂詞時(shí),英語句子結(jié)構(gòu)和一元、二元謂詞之間的對應(yīng)關(guān)系[5].
在語義分析中,Liang給出了一種轉(zhuǎn)換的語法規(guī)則,可以比較容易地得到語句的謂詞表示,進(jìn)而利用計(jì)算機(jī)來處理[6].這也是語義分析中謂詞轉(zhuǎn)換的典型方法.但是由于謂詞邏輯本身表達(dá)能力的限制,現(xiàn)有的語義分析技術(shù)通?;赪ebQestion[7]、GeoQuery[8]、Freebase[9]、Yago[10]、Wikipedia[11]等特定的數(shù)據(jù)庫.這些數(shù)據(jù)庫通常描述(實(shí)體、關(guān)系、類別、實(shí)例)或(實(shí)體、屬性、關(guān)系)等結(jié)構(gòu)化的信息,可以通過結(jié)構(gòu)的對應(yīng)關(guān)系,將自然語言轉(zhuǎn)換為謂詞表示.其中,實(shí)體轉(zhuǎn)換成客體,關(guān)系、屬性、類別以及實(shí)例分別轉(zhuǎn)換成一元和二元謂詞.另外,組合范疇語法(combinatory categorial grammar,CCG)也可以用來得到句子的邏輯形式,但所使用的謂詞來源于標(biāo)注好的語料庫或知識庫,并且需要進(jìn)行有監(jiān)督和無監(jiān)督的訓(xùn)練,所以,只應(yīng)用于較小的知識庫領(lǐng)域.其中:文獻(xiàn)[12]利用依存分析模式給出動詞、通用名詞、專有名詞、名詞詞組、介詞短語等語法成分的謂詞表示;類似地,文獻(xiàn)[13]也給出了語句中的動詞短語、名詞短語、介詞短語等語法結(jié)構(gòu)與表示實(shí)體屬性與關(guān)系的一元和二元謂詞之間的對應(yīng)規(guī)則,從而更加準(zhǔn)確地完成從語句到謂詞的轉(zhuǎn)換過程.
在目前語義分析研究過程中,謂詞邏輯所存在的主要問題包括:
(1) 謂詞邏輯不能表示句子的狀語、補(bǔ)語等成分.如“他來了”和“他馬上來了”可以用相同的謂詞P(t)表示,這就造成謂詞所表示語義的不準(zhǔn)確.
(2) 客體和謂詞的轉(zhuǎn)換沒有固定的規(guī)則.例如通用名詞既可以做主語也可以用在謂語部分,因此,可以分別表示為客體和謂詞.如“貓是貓科動物”表示為P(c),“貓科動物是哺乳動物”表示為B(p),“貓科動物”在這兩個句子中分別是客體和謂詞,這會引起結(jié)構(gòu)和邏輯上的不一致.又如,不同的關(guān)系用相同的謂詞表示:Bornin(person,date)、Bornin(person,location);介詞做謂詞:in(x,UK),這都會增加謂詞定義的二義性.漢語與英語相比,語法結(jié)構(gòu)更靈活,謂詞和客體的轉(zhuǎn)換更不確定,更加缺乏有效的謂詞轉(zhuǎn)換方法.
(3) 一些語法結(jié)構(gòu)復(fù)雜的句子無法用謂詞表示.如“老師今天講的內(nèi)容很重要”用P(a)來表示,客體a代表主語“老師今天講的內(nèi)容”,這樣主語中所包含的語義信息細(xì)節(jié)就無法精確地表達(dá)出來.
傳統(tǒng)謂詞的以上問題,影響了語義表示的完整性和準(zhǔn)確性,所以基于傳統(tǒng)謂詞的語義分析目前只能用于較小的知識庫范圍內(nèi)和簡單結(jié)構(gòu)的句子中.因此,有必要對傳統(tǒng)謂詞邏輯進(jìn)行改進(jìn)和擴(kuò)展.
本文針對謂詞邏輯在語義分析中存在的問題進(jìn)行擴(kuò)展.其意義在于使謂詞公式具有與漢語語句完全相同的語義,并提供由語句到謂詞的規(guī)范轉(zhuǎn)換方法,支持語義分析技術(shù)應(yīng)用到更加廣泛的領(lǐng)域中.
自然語言是一種符號系統(tǒng),用來交流和描述人們所認(rèn)知的現(xiàn)實(shí)世界.在“符號學(xué)三角形”語義理論中,“所指物”referent(thing)是所認(rèn)知的世界,而“概念”concept(thought)是世界中的事物在頭腦中的反映,“符號”symbol(word)是用來表達(dá)頭腦中所形成的概念思想的各種標(biāo)記形式[14].因此,語言盡管形式上靈活豐富、多種多樣,但本質(zhì)上是通過頭腦中對應(yīng)的概念,也就是認(rèn)知概念,來反映現(xiàn)實(shí)世界.謂詞與符號學(xué)三角形關(guān)系見圖1.
圖1 謂詞與符號學(xué)三角形Fig.1 Predicate and semiotic triangle
認(rèn)知概念所對應(yīng)的世界包含各種各樣不同的事物.事物有具體的、抽象的,簡單的、復(fù)雜的,如事實(shí)、過程和事件等.每個事物都有各自的性質(zhì)、狀態(tài)、動作、行為、類屬、組成等屬性,這些屬性還可以有不同的程度、方式和范圍等.世界中的事物是相互聯(lián)系、相互影響,同時(shí)也是不斷發(fā)展變化的.這也是自然語言所表達(dá)語義的本質(zhì).
謂詞邏輯同樣作為一種符號系統(tǒng),雖然不可能與自然語言完全一致,但也是要表達(dá)出語言中所包含的真正語義,即抓住語言所表達(dá)的本質(zhì).謂詞邏輯只要能完整準(zhǔn)確地反映現(xiàn)實(shí)世界所對應(yīng)的認(rèn)知概念,也就能實(shí)現(xiàn)與自然語言語義上的一致.
自然語言的語句是由字、詞這樣的基本符號,按照一定語法規(guī)則組合起來的,用來表達(dá)特定的意義,描述我們對現(xiàn)實(shí)世界的認(rèn)知.
詞是漢語中最小的獨(dú)立運(yùn)用單位,也是最小的語義單位.漢語中的名詞、數(shù)詞、量詞(數(shù)量詞)和代詞直接或間接表示事物.動詞、形容詞則表示事物的行為、動作和性質(zhì)、狀態(tài).副詞用于修飾動詞和形容詞,表示時(shí)間、范圍、程度、頻率以及肯定或者否定等意義.介詞組成介詞結(jié)構(gòu),用于修飾動詞等,表示處所、時(shí)間、狀態(tài)、方式、原因、目的、比較對象等.其他的連詞、助詞、嘆詞、語氣詞和擬聲詞等分別起相應(yīng)的輔助作用.
事物及其性質(zhì)、狀態(tài)、行為等屬性是世界在我們頭腦中所形成概念中的最基本的元素,詞的作用就是符號化這些基本的認(rèn)知概念.世界上任何一個事物以及每個事物各種屬性的概念在自然語言中都有對應(yīng)的詞語表示,不同類型的概念用不同的詞類表示.
短語是由詞組合構(gòu)成的語法單位.句子是由詞或短語構(gòu)成的語言的基本運(yùn)用單位,有固定的語法規(guī)則,表達(dá)一個完整的意思,可以分為單句和復(fù)句.
句子主語表示陳述的對象.謂語用來陳述主語,說明主語的性狀、行為等.賓語是動詞性成分所涉及的人或事物.定語是用來修飾、限定、說明人或事物的性狀、數(shù)量、領(lǐng)屬等.狀語用來修飾、限制動詞或形容詞,表示狀態(tài)、方式、時(shí)間、處所、條件、對象、肯定、否定、范圍、程度或語氣等.補(bǔ)語是動詞或形容詞后起補(bǔ)充說明作用的成分,補(bǔ)充說明情況、結(jié)果、程度、趨向、情態(tài)、時(shí)間、處所、數(shù)量、性狀等.
句子描述現(xiàn)實(shí)世界中的事物具有什么性質(zhì)、狀態(tài)、類屬、行為等,即表示“什么人”或“什么事物”、“是什么”或“怎么樣”以及“什么程度”等.句子還描述事物之間相互影響、聯(lián)系和事物的發(fā)展、變化及其過程和因果關(guān)系.句子表達(dá)的內(nèi)容和語義是認(rèn)知概念中的事實(shí)、判斷和過程等.
謂詞邏輯中的基本組成元素是客體和謂詞,分別表示認(rèn)知概念中的事物及其性質(zhì)、狀態(tài)和相互關(guān)系.漢語中的名詞、數(shù)詞、量詞(數(shù)量詞)和代詞表示事物,在謂詞邏輯中用客體表示.動詞、形容詞表示事物的性質(zhì)、狀態(tài)、動作等,可以用謂詞表示.其他的連詞、助詞、語氣詞等詞類可以結(jié)合語法成分、語義進(jìn)行轉(zhuǎn)換.
漢語中修飾動詞和形容詞的成分,在傳統(tǒng)謂詞邏輯中沒有對應(yīng)的表示元素,認(rèn)知概念中所包含的這類語義將無法用謂詞表示.因此,為謂詞增加“謂詞修飾”元素來表示修飾動詞和形容詞的狀語、補(bǔ)語成分,形式如:
αP(m),或P(m)α,或α(s)P(m).
其中:α是所擴(kuò)展的謂詞修飾;α(s)是包含客體的謂詞修飾,如漢語中的介詞短語.
現(xiàn)實(shí)世界中,有些事物可能是復(fù)雜的事實(shí)、過程甚至是事件,有些性狀及其修飾也比較復(fù)雜.漢語中復(fù)雜單句的一些語法成分本身就是由短語、小句等構(gòu)成,英語句子中也有多種從句形式.
在謂詞邏輯中,可以擴(kuò)展客體和謂詞的組合方式,用一個完整的謂詞公式做客體或修飾成分,來表示復(fù)雜的語法成分,這樣就形成了“復(fù)雜謂詞元素”.
(1) 復(fù)雜客體可以表示為
P(S(a)).
(1)
其中謂詞S(a)做主體謂詞P(x)的客體,表示復(fù)雜的主語.
例如:
“他這么做真好”表示為βR(αP(t)),αP(t)表示復(fù)雜主語客體“他這么做”;
“我知道他來了”表示為K(w,P(t)),P(t)表示復(fù)雜賓語客體“他來了”.
(2) 復(fù)雜的定語可以擴(kuò)展表示為
P(a)∧Q(a).
(2)
因?yàn)槎ㄕZ一般表示客體的性質(zhì)、狀態(tài)等,所以復(fù)雜定語仍然通過謂詞的形式表示.
如“我知道他讀的書”表示為K(w,b)∧R(t,b),R(t,b)表示定語“他讀的書”.
(3) 復(fù)雜的謂詞修飾可以擴(kuò)展表示為
α(R(s))P(m).
(3)
其中以謂詞R(s)做修飾成分α的客體,表示復(fù)雜的狀語.復(fù)雜補(bǔ)語類似.
“我回來的時(shí)候他剛走”表示為α(R(w))βP(t),α(R(w))表示時(shí)間狀語“我回來的時(shí)候”.
“他說得大家都笑了”表示為S(t)α(P(e)),α(P(e))表示復(fù)雜補(bǔ)語“得大家都笑了”.
擴(kuò)展后的謂詞,仍然可以轉(zhuǎn)換成為傳統(tǒng)謂詞公式,與以前的公式兼容.
(1) 復(fù)雜客體的變換.以謂詞做客體的復(fù)雜謂詞,可以轉(zhuǎn)換成傳統(tǒng)謂詞中的客體.
P(Q(x))?P(x′).
(4)
(2) 復(fù)雜定語的變換.復(fù)雜定語可以與所修飾的客體合并,變換公式為
K(a,b)∧R(t,b)?K(a,b′).
(5)
(3) 謂詞修飾的變換.謂詞修飾可以與所修飾的動詞形容詞合并,共同作為謂詞.
α(c)P(x)?P′(x).
(6)
在認(rèn)知概念中,事物與其性狀行為等屬性以及修飾成分有固有聯(lián)系.一個性質(zhì)或動作一定有其關(guān)聯(lián)的事物,一個修飾成分也有其固有的修飾對象.與之對應(yīng),在謂詞邏輯中,客體、謂詞和謂詞修飾成分也是以一定規(guī)則相互依存,不能單獨(dú)孤立存在.
自然語言為了避免表達(dá)過于冗余繁瑣,常省略一些人們熟知或次要的成分和內(nèi)容.因此,自然語言轉(zhuǎn)換成謂詞時(shí),需要根據(jù)上下文和認(rèn)知概念中的語義恢復(fù)和補(bǔ)充所省略的內(nèi)容,與認(rèn)知概念保持語義上的一致.
與認(rèn)知概念對應(yīng),在完整的句子中,名詞,即事物,要有性狀、行為、屬性或與其他事物的聯(lián)系;動詞要有動作的發(fā)出者、承受者;形容詞、副詞、介詞短語等要確定其修飾對象.句子的語法成分和復(fù)句分句之間也有固定的組合關(guān)系.在漢語句子里具有固定關(guān)聯(lián)的詞語和成分,如果有省略要先將其補(bǔ)充完整,然后再進(jìn)行轉(zhuǎn)換,這樣才可以準(zhǔn)確地構(gòu)成謂詞公式.
如動詞短語做句子語法成分時(shí)要補(bǔ)充對應(yīng)的主語,以構(gòu)成完整的謂詞.“騎車很危險(xiǎn)”的完整語義是“(人)騎車很危險(xiǎn)”,謂詞表示為αD(R(m,b)),其中:αD(x)表示“x很危險(xiǎn)”,R(m,b)表示“人騎車”.不補(bǔ)充“騎車”短語的主語,對應(yīng)的謂詞不適合公式;而如果僅以“騎車”做主語,又會丟失部分語義.
謂詞擴(kuò)展后,漢語語句到謂詞公式的基本轉(zhuǎn)換方法和步驟:
(1) 首先根據(jù)認(rèn)知概念,將漢語詞類轉(zhuǎn)換成對應(yīng)的謂詞組成元素;
(2) 再根據(jù)句子的語法結(jié)構(gòu)和語義關(guān)系,建立謂詞元素間的組合關(guān)系;
(3) 最后構(gòu)成整個句子的謂詞公式.
采用的轉(zhuǎn)換方法是將句子的基本語義單位和整體結(jié)構(gòu)對應(yīng)到謂詞公式,這樣可以保證所得到的謂詞公式語義上的完整性和準(zhǔn)確性.
漢語句子中,每種語法成分都可以由多種詞類和短語構(gòu)成,一種詞類或短語又可以充當(dāng)多種不同的成分,語法成分和詞類之間沒有對應(yīng)關(guān)系,所以要根據(jù)詞性、語法結(jié)構(gòu)和語義完成對應(yīng)的轉(zhuǎn)換.
(1) 主語和賓語:做主語和賓語的名詞和名詞性詞組(包括名詞性聯(lián)合詞組、偏正詞組、“的”字詞組、“所”字詞組、主謂詞組等)代表事物,代詞、數(shù)詞、數(shù)量偏正詞組間接代表事物,時(shí)間方位名詞是特定的事物:其都可以轉(zhuǎn)換成為謂詞公式中的客體.動詞、形容詞及其詞組則要補(bǔ)充隱含的主語,然后與小句一樣,轉(zhuǎn)換成為完整的謂詞公式做客體.
賓語包括受事、施事、結(jié)果、工具、處所、目的、原因、存現(xiàn)和說明等類型,轉(zhuǎn)換謂詞時(shí)要根據(jù)語義進(jìn)行變換,否則會引起語義錯誤.如“我們吃食堂”中“食堂”是處所賓語,句子的實(shí)際語義是“我們在食堂吃”,對應(yīng)的謂詞是:β(s)E(w),“s”(食堂)做謂詞修飾.
(2) 謂語:動詞和形容詞做謂語時(shí),直接轉(zhuǎn)換成為謂詞.名詞做謂語,表示的是主語的屬性值,實(shí)際是一個判斷句,要根據(jù)語義先變?yōu)榕袛嗑湓俎D(zhuǎn)換.如“今天星期一”的實(shí)際語義是“今天是星期一”.主謂謂語先根據(jù)語義確定大小主語間的領(lǐng)屬和支配關(guān)系之后再轉(zhuǎn)換,如“他身體好”先變換為“他的身體好”.受事關(guān)系的主語謂語,即“被動句”,要在轉(zhuǎn)換謂詞前先進(jìn)行結(jié)構(gòu)的變換,否則得到的謂詞公式會有語義錯誤,如“玻璃擦干凈了”.
(3) 定語:除了副詞以外的所有實(shí)詞和短語都能做定語.在轉(zhuǎn)換時(shí),根據(jù)定語所限定的數(shù)量、時(shí)間、處所、領(lǐng)屬等屬性,或描寫的性質(zhì)、狀態(tài)、特征、用途、質(zhì)料、職業(yè)等方面的語義,對不同詞類的定語進(jìn)行轉(zhuǎn)換.多數(shù)定語轉(zhuǎn)換為謂詞.
(4) 狀語:副詞、能愿動詞、一般動詞、形容詞、代詞、方位詞、時(shí)間名詞、一般名詞、方位詞組、介詞詞組、比況詞組等可以做不必帶“地”的狀語,而數(shù)量偏正詞組、偏正、聯(lián)合、動賓、主謂、謂補(bǔ)、比況等詞組可做必須帶“地”的狀語.狀語也有許多類型,同時(shí)狀語成分在使用時(shí)也有許多省略,在轉(zhuǎn)換時(shí)需要先根據(jù)語義補(bǔ)充缺失了的成分,然后再轉(zhuǎn)換.如“我們北京見”,“北京”做地點(diǎn)狀語,實(shí)際是“我們在北京見”.
(5) 補(bǔ)語:動詞、形容詞、副詞“很”和“極”、介詞結(jié)構(gòu)、動量詞組和由動詞、形容詞組成的詞組都能做補(bǔ)語.漢語的補(bǔ)語成分也非常靈活,在轉(zhuǎn)換時(shí)也要結(jié)合語義進(jìn)行分析.如“人嚇跑了”是動詞做補(bǔ)語而非聯(lián)動謂語,“我們談了十分鐘”是時(shí)間名詞做補(bǔ)語而非賓語.
《實(shí)用現(xiàn)代漢語教程》[15]一書全面詳細(xì)地論述和分析了漢語的詞法和語法結(jié)構(gòu),有對應(yīng)的實(shí)例和練習(xí),包括各種形式的詞類、短語、語法成分和句型,比起一般的知識庫或標(biāo)注語料中的句子有更全面的語法覆蓋性.使用該書中的語句作為分析實(shí)例可以更好地驗(yàn)證擴(kuò)展謂詞的表達(dá)能力.假設(shè)給定的漢語句子可以正確地分詞、確定詞性,并可以得出句子正確的語法結(jié)構(gòu)及語義關(guān)系,在這基礎(chǔ)上,根據(jù)語言中所反映的認(rèn)知概念,分別使用傳統(tǒng)的謂詞表示方法和擴(kuò)展謂詞方法,將句子轉(zhuǎn)換成謂詞公式,驗(yàn)證比較其轉(zhuǎn)換能力及語義的完整性和準(zhǔn)確性.
在驗(yàn)證實(shí)驗(yàn)中,首先對文獻(xiàn)[15]中由各種詞類和語法結(jié)構(gòu)所構(gòu)成的主語、謂語、賓語、定語、狀語、補(bǔ)語例句進(jìn)行謂詞轉(zhuǎn)換,以驗(yàn)證擴(kuò)展后謂詞對不同語法成分的轉(zhuǎn)換能力.例句的數(shù)量分別為30、48、49、26、58、46個.然后分析了296個經(jīng)典綜合例句的謂詞轉(zhuǎn)換.
用轉(zhuǎn)換率來評價(jià)謂詞轉(zhuǎn)換結(jié)果,即:轉(zhuǎn)換率=正確轉(zhuǎn)換的語法成分個數(shù)/句子中的語法成分總數(shù).
例如:句子“他散步”的語法成分包括主語和謂語,用謂詞表示為W(h),詞語和語法成分都轉(zhuǎn)換為對應(yīng)的謂詞元素,語義保持不變.轉(zhuǎn)換率為100%.
而句子“他在公園散步”,傳統(tǒng)謂詞仍然表示為W(h),狀語成分無法表示,轉(zhuǎn)換率為2/3=67%.只考慮狀語成分時(shí),轉(zhuǎn)換率為0.而利用擴(kuò)展謂詞可以把句子表示為α(p)W(h),三個語法成分都可以表示,并保持了原來句子的語義,轉(zhuǎn)換率為100%.
句子“我們吃食堂”,僅考慮語法結(jié)構(gòu)時(shí)謂詞表示為E(w,s).此時(shí)賓語的語義不正確,所以轉(zhuǎn)換率為67%.如果考慮賓語的真實(shí)語義,“食堂”作為處所,謂詞表示為β(s)E(w),則轉(zhuǎn)換率為100%.
通過實(shí)驗(yàn)驗(yàn)證得出:利用傳統(tǒng)謂詞進(jìn)行表示時(shí),不同形式主語、謂語、賓語、定語、狀語和補(bǔ)語的轉(zhuǎn)換率分別為56%、61%、55%、77%、0和0,狀語和補(bǔ)語以及短語、小句充當(dāng)?shù)恼Z法成分無法表示,語義上也有很多不對應(yīng)的情況.而利用擴(kuò)展謂詞進(jìn)行表示,當(dāng)僅通過詞性和語法規(guī)則進(jìn)行轉(zhuǎn)換時(shí),總的轉(zhuǎn)換率約為85%,其中不同形式主語、謂語、賓語、定語、狀語和補(bǔ)語的轉(zhuǎn)換率分別為82%、81%、93%、88%、77%和89%.而考慮了語義后總的轉(zhuǎn)換率約為97%,各語法成分的轉(zhuǎn)換率都有明顯的提高,謂語和定語的轉(zhuǎn)換率可以達(dá)到100%,其他成分的轉(zhuǎn)化率也都在95%以上.
通過實(shí)例分析可以看出,傳統(tǒng)謂詞經(jīng)過擴(kuò)展后,語義的表達(dá)能力有了大幅的提高,可以正確表示狀語、補(bǔ)語等語法成分和復(fù)雜句子結(jié)構(gòu),謂詞公式中各種元素的構(gòu)成也比較規(guī)范,解決了前文中提到的傳統(tǒng)謂詞中所存在的問題.
擴(kuò)展后,謂詞邏輯的組成元素與漢語中最基本的語法單位對應(yīng),其不同的組合方式可以表示漢語所有的語法成分和句型結(jié)構(gòu),并且通過認(rèn)知概念與漢語語義保持一致.所以擴(kuò)展的謂詞邏輯能夠完整準(zhǔn)確地反映漢語句子的內(nèi)在含義,并可以表示復(fù)雜的漢語語句.同時(shí),擴(kuò)展謂詞還可以與傳統(tǒng)的謂詞公式兼容,其轉(zhuǎn)換方法也可以應(yīng)用到英語等其他語言當(dāng)中.
然而與自然語言相比,謂詞的表達(dá)能力畢竟有限,一些復(fù)雜的語言結(jié)構(gòu)還是難以表示,成語、修辭、主觀感覺和情緒都不能準(zhǔn)確表達(dá).例如:“平平淡淡,隨遇而安是一種生活方式”,這句話的主語就難以用謂詞進(jìn)一步細(xì)化表示,只能用一個客體來表示,在轉(zhuǎn)換后的謂詞公式中就失去了原有的語義.
再有,在轉(zhuǎn)換的過程中,要準(zhǔn)確地確定漢語句子的語法結(jié)構(gòu),僅僅通過分析句子中的詞語和語法規(guī)則是不夠的,還需要借助詞語的語義.
有些語法成分,如賓語和狀語,有不同的類型和含義,如“挖坑”是結(jié)果賓語,“發(fā)展地看”是方式狀語,必須通過語義確定后再進(jìn)行轉(zhuǎn)換.還有些語法結(jié)構(gòu)也需要通過語義才能確定,如“門口有兩個孩子”和“小李有兩個孩子”有相同的詞類組合,卻是不同的句型結(jié)構(gòu),對應(yīng)的謂詞公式也不一樣.因此,在根據(jù)詞語詞性確定語法成分和結(jié)構(gòu)有歧義的情況下,需要通過語義才能確定詞語之間的相互關(guān)系,正確確定句子結(jié)構(gòu),從而最終得到完整準(zhǔn)確的謂詞表示.
針對謂詞公式有限表達(dá)能力所產(chǎn)生的語義分析研究過程中的問題,依據(jù)“符號學(xué)三角形”理論,以現(xiàn)實(shí)世界在頭腦中的概念為聯(lián)系的紐帶,基于認(rèn)知概念對傳統(tǒng)謂詞進(jìn)行擴(kuò)展,實(shí)現(xiàn)了漢語與謂詞邏輯在組成元素和結(jié)構(gòu)上的對應(yīng)和轉(zhuǎn)換.主要研究成果包括:(1) 在謂詞邏輯中增加了表示狀語和補(bǔ)語的組成元素,增加了能夠表示由短語和小句做語法成分的復(fù)雜元素;(2) 規(guī)范了漢語詞類、語法成分與謂詞表示元素之間的對應(yīng)關(guān)系.
對各種語法類型漢語句子的語義分析結(jié)果表明,謂詞公式的語義表達(dá)能力有了大幅度的提高,可以更加完整精確地反映自然語言所表達(dá)的事物及其性狀、行為屬性的概念和事實(shí),保證了與漢語句子語義上的一致性.這就使語義分析的邏輯結(jié)果具有更加全面和準(zhǔn)確的語義,同時(shí)不再局限于較小范圍的結(jié)構(gòu)化知識庫和標(biāo)注語料,可以應(yīng)用到更廣泛的領(lǐng)域當(dāng)中,解決了當(dāng)前語義分析面臨的問題.
然而,由于漢語語法的靈活性,為保證漢語語句能夠正確轉(zhuǎn)換為謂詞公式,必須結(jié)合詞語的具體語義來確定句子的語法結(jié)構(gòu)和語義關(guān)系.僅僅通過詞語本身及其詞性,在轉(zhuǎn)換過程中會產(chǎn)生歧義,得到錯誤的謂詞表示.如何利用計(jì)算機(jī)通過詞語的語義知識和語法規(guī)則,來確定語句的語法結(jié)構(gòu),并用相應(yīng)的謂詞表示它的準(zhǔn)確語義,是下一步在擴(kuò)展謂詞研究基礎(chǔ)上的重要工作.