祁 琪
(解放軍外國(guó)語(yǔ)學(xué)院,河南洛陽(yáng) 471003)
從轉(zhuǎn)移類概念看HNC對(duì)概念依存理論的擴(kuò)展
祁 琪
(解放軍外國(guó)語(yǔ)學(xué)院,河南洛陽(yáng) 471003)
概念依存理論和概念層次網(wǎng)絡(luò)(簡(jiǎn)稱HNC)理論都是面向自然語(yǔ)言理解的理論體系,概念依存理論通過(guò)語(yǔ)義基元和概念間的關(guān)聯(lián)來(lái)描述和分析自然語(yǔ)言,對(duì)HNC理論設(shè)計(jì)語(yǔ)義網(wǎng)絡(luò)有很大的啟發(fā),尤其是概念依存理論對(duì)轉(zhuǎn)移類概念的深入研究,為概念層次網(wǎng)絡(luò)中語(yǔ)義網(wǎng)絡(luò)和句類知識(shí)的設(shè)計(jì)和構(gòu)造提供了不少寶貴經(jīng)驗(yàn)。從這兩種理論對(duì)轉(zhuǎn)移類概念處理的對(duì)比分析入手,研究HNC理論對(duì)概念層次網(wǎng)絡(luò)的借鑒及擴(kuò)展。
概念依存理論;概念層次網(wǎng)絡(luò)(HNC);轉(zhuǎn)移類概念
自然語(yǔ)言理解的本質(zhì)是對(duì)自然語(yǔ)言的詞匯、句法、語(yǔ)義等各方面進(jìn)行形式化描述,使其能夠被計(jì)算機(jī)理解和處理。其中最突出的問(wèn)題是對(duì)語(yǔ)義的理解,如何對(duì)語(yǔ)義信息進(jìn)行清晰準(zhǔn)確的形式化表達(dá)是目前自然語(yǔ)言處理發(fā)展的瓶頸。Schank提出的概念依存理論(Conceptual Dependency Theory,簡(jiǎn)稱CD理論)對(duì)語(yǔ)義的理解不同于傳統(tǒng)語(yǔ)言學(xué)先進(jìn)行句法分析再將句法結(jié)構(gòu)形式化的方法,而是主張將句法、語(yǔ)義和推理相互融合的一體化(integrated)處理模型,更接近于人腦對(duì)自然語(yǔ)言的理解過(guò)程。概念層次網(wǎng)絡(luò)(Hierarchical Network of Concepts,簡(jiǎn)稱HNC)理論以概念聯(lián)想脈絡(luò)為主線,建立了一種模擬人腦感知語(yǔ)言過(guò)程的表述模式和計(jì)算機(jī)理解處理模式,其設(shè)計(jì)思想有一部分來(lái)源于概念依存理論。其中,概念依存理論對(duì)于轉(zhuǎn)移類概念的研究尤其對(duì)概念層次網(wǎng)絡(luò)中轉(zhuǎn)移概念二級(jí)節(jié)點(diǎn)的設(shè)計(jì)有很大啟發(fā)。本文將分別就這兩種理論對(duì)轉(zhuǎn)移類概念的分析和處理進(jìn)行對(duì)比研究,從處理的異同中闡釋HNC理論對(duì)概念依存理論的吸收和擴(kuò)展,從而對(duì)自然語(yǔ)言的語(yǔ)義處理有更深的理解。
“轉(zhuǎn)移”的基本釋義是事物從某處移動(dòng)到另一處,這里的事物可以是具體物,也可以是抽象物(如信息)或精神上的,移動(dòng)的實(shí)現(xiàn)可以是通過(guò)外力推動(dòng),也可以是自身的移動(dòng)。例如,“張三把茶幾移到墻角”是表示物的被動(dòng)移動(dòng),“張三從家跑到了學(xué)校”是“張三”自身的位移,而“張三把好消息告訴了李四”就表示信息的轉(zhuǎn)移。對(duì)轉(zhuǎn)移概念的描述主要包括以下幾個(gè)要素:一是轉(zhuǎn)移概念本身,二是轉(zhuǎn)移的物或信息,即轉(zhuǎn)移的內(nèi)容,三是轉(zhuǎn)移內(nèi)容的接收者。此外,轉(zhuǎn)移概念中還可能包含有轉(zhuǎn)移的起點(diǎn)、終點(diǎn)和途經(jīng)(路徑或中轉(zhuǎn)點(diǎn)),轉(zhuǎn)移的起點(diǎn)和終點(diǎn)可以與轉(zhuǎn)移的發(fā)出者或接收者重合。
(一)概念依存理論概述
概念依存理論(Conceptual Dependency Theory,簡(jiǎn)稱CD理論)是由美國(guó)計(jì)算語(yǔ)言學(xué)家R. Schank于1973年提出的,主要用于描述自然語(yǔ)言中短語(yǔ)和句子的意義。
概念依存理論的核心是三大基本原理:(1)對(duì)于任意兩個(gè)意義相同的句子,即便它們屬于不同的語(yǔ)言,語(yǔ)義表達(dá)式也是相同的;(2)蘊(yùn)涵在一個(gè)句子中的任何為理解所必須的信息都應(yīng)該得到顯式的表達(dá),這樣的顯式表達(dá)式一般描述為概念依存表達(dá)式,即將概念表達(dá)式化(conceptualization);(3)在句子的意義表達(dá)式中,必須盡量把隱晦地蘊(yùn)含在句子中的信息表面化,往往通過(guò)在表達(dá)式中增加概念節(jié)點(diǎn)來(lái)實(shí)現(xiàn)。[1]
概念依存模型由若干個(gè)語(yǔ)義基元(semantic primitive,或稱概念基元)和概念間的關(guān)聯(lián)組成,這些語(yǔ)義基元可以分為基本行為和基本狀態(tài)兩種。其中,對(duì)基本行為的定義有利于制訂動(dòng)詞框架和推理規(guī)則,是概念依存理論的一項(xiàng)重要內(nèi)容。Schank等人共列出了11個(gè)基本行為,包括PTARNS、ATRANS、INGEST、PROPEL、MTRANS、MBUILD、MOVE、GRASP、EXPEL、SPEAK、ATTEND等,嘗試用有限個(gè)基本行為描述人類社會(huì)的所有活動(dòng)。而基本狀態(tài)數(shù)量眾多,描述的是事物的物理狀態(tài)或生命體的精神狀態(tài)等。
將基本行為和基本狀態(tài)結(jié)合起來(lái),可以得到語(yǔ)句的概念依存表達(dá)式。例如,句子“John told Marythat Bill was happy.”用基本行為和基本狀態(tài)表示為:
John MTRANS (BILL BE MANTAL-STATE(+5)) to Mary
其中,MTRANS表示John把某種精神信息轉(zhuǎn)移給Mary,MANTEL-STATE(+5)表示Bill的精神狀態(tài)及程度,而B(niǎo)ill的精神狀態(tài)是精神信息轉(zhuǎn)移的內(nèi)容。
此外,在概念依存理論的基本原理之上,Schank等人提出了腳本(script)、計(jì)劃(plan)、目的(goal)和主題(theme)等知識(shí)結(jié)構(gòu)來(lái)理解故事,有助于實(shí)現(xiàn)句法、語(yǔ)義和推理相互融合的一體化處理模型。
(二)概念依存理論中的轉(zhuǎn)移類概念
概念依存理論主要研究的基本行為中大部分是屬于轉(zhuǎn)移類概念的,其中包括PTRANS、ATRANS、INGEST、MTRANS和EXPEL。
PTRANS描述的是物體的物理位置的轉(zhuǎn)移,ATRANS描述的是占有、物主或控制等抽象關(guān)系的轉(zhuǎn)移,INGEST描述的是攝入食物、流體或氣體等的行為,也是轉(zhuǎn)移的一種表現(xiàn),MTRANS描述的是人與人之間或在一個(gè)人身上的精神信息的轉(zhuǎn)移,而EXPEL描述的吐出的動(dòng)作,與INGEST相對(duì)。
(一)概念層次網(wǎng)絡(luò)的概述
概念層次網(wǎng)絡(luò)(Hierarchical Network of Concepts,簡(jiǎn)稱HNC)是面向整個(gè)自然語(yǔ)言理解的理論框架,這個(gè)理論框架是以語(yǔ)義表達(dá)為基礎(chǔ)的,它對(duì)語(yǔ)義的表達(dá)具有概念化、層次化、網(wǎng)絡(luò)化的特征。[2]
HNC理論的目標(biāo)是以概念聯(lián)想脈絡(luò)為主線,建立一種模擬大腦語(yǔ)言感知過(guò)程的自然語(yǔ)言表述模式和計(jì)算機(jī)理解處理模式,[2]認(rèn)為概念聯(lián)想脈絡(luò)的表述是理解語(yǔ)義的根本問(wèn)題,將認(rèn)知結(jié)構(gòu)劃分為局部聯(lián)想脈絡(luò)和全局聯(lián)想脈絡(luò)。局部聯(lián)想是在詞匯層面的聯(lián)想,體現(xiàn)為一個(gè)概念表述體系,并設(shè)計(jì)了五元組和語(yǔ)義網(wǎng)絡(luò)來(lái)表示抽象概念,通過(guò)掛靠展開(kāi)近似表達(dá)具體概念。全局概念是在語(yǔ)句及篇章層面上的聯(lián)想,提出了語(yǔ)義塊和句類理論從語(yǔ)言深層上描述語(yǔ)句。
為了描述抽象概念,HNC設(shè)計(jì)了三大語(yǔ)義網(wǎng)絡(luò):基本概念、基元概念和邏輯概念。語(yǔ)義網(wǎng)絡(luò)描述的是概念之間的關(guān)聯(lián),這三大語(yǔ)義網(wǎng)絡(luò)同時(shí)也是對(duì)抽象概念的基本分類。與概念依存理論相似,HNC的語(yǔ)義網(wǎng)絡(luò)中也有概念節(jié)點(diǎn),指的是語(yǔ)義網(wǎng)絡(luò)每一層中的若干個(gè)節(jié)點(diǎn),每一個(gè)節(jié)點(diǎn)都可以由從最高層開(kāi)始到該節(jié)點(diǎn)結(jié)束的一串?dāng)?shù)字或字母來(lái)唯一地確定或指稱。語(yǔ)義網(wǎng)絡(luò)中的任一節(jié)點(diǎn)都是一個(gè)概念而不是某個(gè)特定的語(yǔ)義,同時(shí)它們又都是概念的基元,可以通過(guò)不同的組合形成復(fù)合概念。[3]
概念依存理論中的概念節(jié)點(diǎn)雖然已經(jīng)脫離了詞匯符號(hào)的所指,指的是概念本身,但是仍然是自然語(yǔ)言的形式,對(duì)于計(jì)算機(jī)來(lái)說(shuō)依然難以處理,而HNC構(gòu)建了網(wǎng)絡(luò)式概念基元符號(hào)體系,每個(gè)概念由唯一確定的符號(hào)串表示,不僅清晰無(wú)歧義地表達(dá)了概念的所指,而且還可以把概念間的聯(lián)想關(guān)系形式化地表現(xiàn)出來(lái),便于計(jì)算機(jī)進(jìn)行理解和推理。
(二)HNC中的轉(zhuǎn)移類概念
HNC理論將萬(wàn)事萬(wàn)物發(fā)生、發(fā)展和消亡的過(guò)程用作用效應(yīng)鏈來(lái)表示。作用效應(yīng)鏈包括作用、過(guò)程、轉(zhuǎn)移、效應(yīng)、關(guān)系和狀態(tài)六個(gè)基本環(huán)節(jié),反映一切事物存在和發(fā)展的基本法則,也是語(yǔ)言表達(dá)和概念推理的法則。[2]“轉(zhuǎn)移”是HNC理論強(qiáng)調(diào)的作用效應(yīng)鏈六大環(huán)節(jié)中的一個(gè)基本環(huán)節(jié),實(shí)際上是“過(guò)程”的一個(gè)子類,但“過(guò)程”側(cè)重于事物在時(shí)間狀態(tài)序列中的表現(xiàn),而“轉(zhuǎn)移”更強(qiáng)調(diào)事物在空間狀態(tài)序列中發(fā)生的變化,因此,“轉(zhuǎn)移”雖然繼承了“過(guò)程”的基本特征,但傾向于認(rèn)為是一個(gè)獨(dú)立的基元概念。
在HNC中,轉(zhuǎn)移基元概念二級(jí)節(jié)點(diǎn)的設(shè)計(jì)從概念依存理論中得到不少啟發(fā)。概念依存理論中研究了轉(zhuǎn)移的不同表現(xiàn)形式,如物的轉(zhuǎn)移、信息的轉(zhuǎn)移、食物的攝入和排出等,HNC將其進(jìn)行歸納并擴(kuò)展出轉(zhuǎn)移類概念的四個(gè)二級(jí)節(jié)點(diǎn):21 接收;22 物的轉(zhuǎn)移;23 信息的轉(zhuǎn)移;24 交換、替代和變換。
HNC中用于描述“轉(zhuǎn)移”概念的句類稱為轉(zhuǎn)移句。上文已說(shuō)明了轉(zhuǎn)移概念應(yīng)包含的要素,而事實(shí)上,在轉(zhuǎn)移句中,轉(zhuǎn)移動(dòng)作的發(fā)出者所處的位置即為轉(zhuǎn)移的起始位置,而轉(zhuǎn)移動(dòng)作的接收者所處的就是轉(zhuǎn)移的結(jié)束位置,除此之外,轉(zhuǎn)移的途經(jīng)不是必須知道并加以描述的,所以轉(zhuǎn)移句一般包含轉(zhuǎn)移的特征語(yǔ)義塊(T)、轉(zhuǎn)移發(fā)出者(TA)、轉(zhuǎn)移的內(nèi)容(TC)和轉(zhuǎn)移接收者(TB)這四個(gè)要素。
(一)概念依存理論對(duì)轉(zhuǎn)移句的處理
概念依存理論設(shè)計(jì)基本行為的依據(jù)是轉(zhuǎn)移的類別。PTRANS表示的是物體的轉(zhuǎn)移,可以是外力使其轉(zhuǎn)移,也可以是具體物自身的轉(zhuǎn)移,若是物自身的轉(zhuǎn)移,可以對(duì)應(yīng)到HNC中的22b節(jié)點(diǎn),包括來(lái)、去、回、別離等概念,以及在空中、水中或陸地的自身轉(zhuǎn)移。ATRANS表示的是物主占有關(guān)系的轉(zhuǎn)變,也是具體事物的轉(zhuǎn)移,INGEST指的是食物、液體、氣體等進(jìn)入體內(nèi),對(duì)應(yīng)到HNC中的221表示入概念的節(jié)點(diǎn),包括氣態(tài)物、液體物、固體物的輸入、抽、吸,與之相對(duì)的EXPEL則可以對(duì)應(yīng)到222的“出”概念,221和222表示“入”和“出”是一對(duì)對(duì)偶性概念,是同一個(gè)高層概念下的兩極??偟膩?lái)說(shuō),這四個(gè)基本行為實(shí)際上都是物的轉(zhuǎn)移,不論是食物、氣體還是金錢,它們的轉(zhuǎn)移對(duì)象都是具體概念。而概念依存理論中還有MTRANS,表示人與人之間或一個(gè)人精神信息的轉(zhuǎn)移,也就是抽象事物的轉(zhuǎn)移。
在對(duì)具體的語(yǔ)句進(jìn)行理解和處理時(shí),概念依存理論采用概念依存表達(dá)式或概念依存模型來(lái)對(duì)表示語(yǔ)句中概念之間的關(guān)系。例如句子“John gives Mary a book.”,句中的轉(zhuǎn)移概念“give”對(duì)應(yīng)著基本行為ATRANS,表示占有關(guān)系的變化,即“a book”在轉(zhuǎn)移的過(guò)程中所有者也發(fā)生了變化。這個(gè)句子的概念依存表達(dá)式如下:
圖1 概念依存表達(dá)式
在這個(gè)表達(dá)式中,John、book和Mary均為概念節(jié)點(diǎn),ATRANS這個(gè)節(jié)點(diǎn)表示的是基本行為,描述give這種抽象關(guān)系的轉(zhuǎn)移,標(biāo)有R的三個(gè)箭頭表示Mary是book的接收者,即Mary、John和book之間的接受或給予的依存關(guān)系,而標(biāo)有O的箭頭表示賓位的依存關(guān)系,即book為受事格,是ATRANS的轉(zhuǎn)移內(nèi)容。對(duì)于句子“The book was given to Mary by John.”來(lái)說(shuō),由于與上句表示的是相同的意思,所以可以用同一個(gè)概念依存表達(dá)式描述。
對(duì)于基本行為MTRANS而言,轉(zhuǎn)移物為抽象的信息,通常需要用語(yǔ)句來(lái)實(shí)現(xiàn)對(duì)抽象信息的表達(dá),因?yàn)樾畔⑿枰谜Z(yǔ)句來(lái)描述。在概念依存理論中,可以將基本行為和基本狀態(tài)結(jié)合起來(lái),得到概念依存表達(dá)式。例如,句子“John told Mary that Bill was happy.”可以表示為:
John MTRANS (BILL BE MANTAL-STATE(+5)) to Mary
其中,基本行為MTRANS表示John把信息轉(zhuǎn)移給Mary,基本狀態(tài)MANTEL-STATE(+5)表示Bill的精神狀態(tài)是高興的,而B(niǎo)ill的精神狀態(tài)是轉(zhuǎn)移的內(nèi)容。
概念依存理論在一定程度上能夠擺脫句法結(jié)構(gòu)和語(yǔ)種的限制,用概念依存表達(dá)式將自然語(yǔ)言的深層語(yǔ)義表達(dá)出來(lái),但是存在的問(wèn)題是,概念依存表達(dá)式中的概念節(jié)點(diǎn)雖然指的是概念而不是詞匯意義本身,但依然是自然語(yǔ)言形式的概念,對(duì)于計(jì)算機(jī)來(lái)說(shuō)依然不容易處理。并且,11個(gè)基本行為數(shù)量較少,只能夠描述自然語(yǔ)言中常見(jiàn)的情境,若想深入進(jìn)行詳細(xì)的描述是有一定難度的,而且每個(gè)基本行為的涵蓋面過(guò)廣,對(duì)語(yǔ)義的描寫顆粒度較大。
(二)HNC對(duì)轉(zhuǎn)移句的處理
根據(jù)上文提到的的轉(zhuǎn)移概念的二級(jí)節(jié)點(diǎn)劃分以及句中強(qiáng)調(diào)的要素,HNC理論將轉(zhuǎn)移句分為:基本轉(zhuǎn)移句、自身轉(zhuǎn)移句、接收句、傳輸句、自身轉(zhuǎn)移句、交換句、替代句和變換句,基本轉(zhuǎn)移句中包括一般轉(zhuǎn)移句、物轉(zhuǎn)移句和信息轉(zhuǎn)移句。
除了物的轉(zhuǎn)移和信息的轉(zhuǎn)移這兩類概念基元,HNC的轉(zhuǎn)移概念中還包含“接收”這個(gè)概念?!敖邮铡敝傅氖寝D(zhuǎn)移全過(guò)程的后一半,是轉(zhuǎn)移過(guò)程的一部分。通常,人們理所當(dāng)然地認(rèn)為“接收”是包含在轉(zhuǎn)移的過(guò)程之中,不管轉(zhuǎn)移的內(nèi)容是什么,轉(zhuǎn)移的要素中包含著轉(zhuǎn)移的接收方,而且對(duì)轉(zhuǎn)移過(guò)程的描述更多的是從轉(zhuǎn)移發(fā)出方的角度進(jìn)行描述。但是HNC認(rèn)識(shí)到“接收”對(duì)轉(zhuǎn)移過(guò)程的重要性,將“接收”設(shè)立為與物和信息轉(zhuǎn)移并列的節(jié)點(diǎn),因?yàn)椤敖邮铡逼鋵?shí)是轉(zhuǎn)移的本質(zhì)所在,意味著轉(zhuǎn)移的結(jié)局和目的。例如感知和審查,還有天文觀測(cè)等,都只涉及單方面的接受,但這些顯然都是重要的信息轉(zhuǎn)移。因此,HNC的接收句弱化轉(zhuǎn)移發(fā)出者,強(qiáng)調(diào)從接收端的角度描述轉(zhuǎn)移。HNC的這種處理方式使得對(duì)轉(zhuǎn)移概念的描述更加全面深入,豐富了轉(zhuǎn)移概念的內(nèi)涵,也有助于對(duì)轉(zhuǎn)移概念更加深刻的理解[4]。
此外,HNC中將交換、替代和變換作為轉(zhuǎn)移的一個(gè)子類,體現(xiàn)了“涉及兩項(xiàng)轉(zhuǎn)移內(nèi)容并且兩項(xiàng)交互”的共性。這個(gè)共性在轉(zhuǎn)移概念里比較突出,例如談判和貿(mào)易都具有這個(gè)共性。交換顯然具有交互性,替代雖然一般不具有交互性,但也涉及兩項(xiàng)轉(zhuǎn)移內(nèi)容,而變換也具有交互性且通常能可逆,因此,HNC將交換、替代和變換合并且單列為轉(zhuǎn)移概念下的一個(gè)節(jié)點(diǎn)。
采用HNC理論處理轉(zhuǎn)移句還有一個(gè)優(yōu)點(diǎn),就是對(duì)于具體的句類,語(yǔ)義塊的類型會(huì)有一定的限制,這對(duì)計(jì)算機(jī)識(shí)別和處理來(lái)說(shuō)格外重要。在轉(zhuǎn)移句中,轉(zhuǎn)移發(fā)出者TA優(yōu)先是pp類(廣義的人,包括組織、機(jī)構(gòu)、團(tuán)體等)和jw62(動(dòng)物)類概念,一般轉(zhuǎn)移的TA優(yōu)先選擇具體概念,而物轉(zhuǎn)移句的TA一定是具體概念,信息轉(zhuǎn)移句的TA一定是pp類和jw62類概念,或者r(效應(yīng))和gw(信息物)概念,其中r主要是r232(信息輸出的效應(yīng),比如言論、聲明、講話等)、r8(思維活動(dòng)的效應(yīng),比如學(xué)說(shuō)、理論、見(jiàn)解等)和ra5(法律法規(guī))等,gw概念主要是gwa34(出版物)。然而,轉(zhuǎn)移接收者TB必須是具體概念或空間概念,并且信息轉(zhuǎn)移句的TB一定是pp或jw62類概念,因?yàn)橹挥芯哂兴季S活動(dòng)的生命體才能接收理解抽象的信息。對(duì)于省略了TB的轉(zhuǎn)移句,其TB一般都是顯而易見(jiàn)不必關(guān)注的,例如由v62221(人或動(dòng)物的生理活動(dòng):吃、喝、抽、吸、吞、咽等)形成的物轉(zhuǎn)移句,TB即為TA的生理器官,比如對(duì)句子“Jack has eaten three sandwiches.”接收者就是Jack的胃,這在語(yǔ)義理解上是顯而易見(jiàn)的,不需要在句中另外強(qiáng)調(diào)。
對(duì)于物轉(zhuǎn)移句(T2J)和信息轉(zhuǎn)移句(T3J),轉(zhuǎn)移的內(nèi)容分別記為T2C和T3C,而一般轉(zhuǎn)移句的轉(zhuǎn)移內(nèi)容TC既可以指具體概念,也可以是抽象概念。物轉(zhuǎn)移句中的轉(zhuǎn)移內(nèi)容T2C一定是具體的概念,而信息轉(zhuǎn)移句的轉(zhuǎn)移內(nèi)容T3C一定是塊擴(kuò),因?yàn)槌橄蟮男畔⑿枰谜Z(yǔ)句來(lái)表達(dá),而且為了更好地對(duì)句類進(jìn)行劃分,HNC規(guī)定了信息轉(zhuǎn)移句的轉(zhuǎn)移內(nèi)容必須是塊擴(kuò),如果有例外的情況會(huì)通過(guò)用信息轉(zhuǎn)移句和效應(yīng)句的混合來(lái)處理。T3C的表達(dá)形式很豐富,一方面它可以是隱含的,即在上下文中有指代概念,例如“John told Mary this good news.”這個(gè)句子中的T3C“this good news”并不是塊擴(kuò),但是它在上下文中的指代概念,即“this good news”的內(nèi)容一定是用語(yǔ)句來(lái)表達(dá)的。另一方面,塊擴(kuò)也可以變換為原型包裝句蛻,例如“John told Mary [ # Bill would get married # ].”①和“John told Mary the good news {that Bill would get married}/.”②具有相同的語(yǔ)義信息,前一句的T3C是塊擴(kuò),加了“the good news”轉(zhuǎn)換成了原型包裝句蛻。此外,T3C的形式還可以是多個(gè)句子,也可以是一段話,甚至是加了引號(hào)的直接引語(yǔ)。
(三)兩種理論對(duì)轉(zhuǎn)移句處理的對(duì)比
對(duì)于涉及基本行為PTRANS的句子,如果是外力使事物發(fā)生轉(zhuǎn)移的,可以歸為一般轉(zhuǎn)移句或物轉(zhuǎn)移句,例如“John sent the letter to Mary.”為T0J(一般轉(zhuǎn)移句),“John put the bottle in his pocket.”是T2J(物轉(zhuǎn)移句)。如果是自身發(fā)生轉(zhuǎn)移,表示出發(fā)、到達(dá)、來(lái)、去、回等自身轉(zhuǎn)移的概念,可以用自身轉(zhuǎn)移句來(lái)處理,比如“Jack will go to Shanghai.”是T2bJ(自身轉(zhuǎn)移句),“Mary has just come back to Beijing from Shanghai.”是T2b0J(自身轉(zhuǎn)移句,與T2bJ結(jié)構(gòu)上不同),“He passed down the tunnel.”是T2b3J(不同形式的自身轉(zhuǎn)移句)。
概念依存理論的基本行為ATRANS表示的是占有、物主關(guān)系的轉(zhuǎn)移,在HNC中沒(méi)有直接對(duì)應(yīng)的概念,但是HNC采用多種句類來(lái)對(duì)此類行為進(jìn)行描寫。例如“John gave Mary a book.”中的give就是占有關(guān)系的ATRANS,這個(gè)句子對(duì)應(yīng)HNC中的一般轉(zhuǎn)移句T0J,“John bought the book from Jack.”表示“the book”的物主從Jack轉(zhuǎn)移到John,buy的概念表示換入的一方具有主動(dòng)性,對(duì)應(yīng)于HNC中的換入交換句T491J。若句子轉(zhuǎn)換為“Jack sold the book to John.”表示換出方是主動(dòng)的,該句為換入交換句T492J。
INGEST和EXPEL分別表示的是固態(tài)物、液態(tài)物或氣態(tài)物的入和出的概念,在HNC中可采用一般轉(zhuǎn)移句或物轉(zhuǎn)移句來(lái)描寫。例如“We should often ingest fresh air.”是物轉(zhuǎn)移句T21J。
包含基本行為MTRANS的句子表示信息轉(zhuǎn)移的概念,可以是人與人之間信息的轉(zhuǎn)移,比如“tell”,也可以是在自身發(fā)生的信息轉(zhuǎn)移,比如“see”。在HNC中,人與人之間信息的轉(zhuǎn)移一般歸為信息轉(zhuǎn)移句,而將自身的信息轉(zhuǎn)移歸為接收句。接收句分為一般接收句和針對(duì)性接收句,針對(duì)性接收句中的轉(zhuǎn)移內(nèi)容是與轉(zhuǎn)移無(wú)直接關(guān)系的對(duì)象及其表現(xiàn)。例如“Jack saw Mary was dancing.”,這類句子并不強(qiáng)調(diào)信息的發(fā)出者,而強(qiáng)調(diào)的是接收者和接收的內(nèi)容,這個(gè)句子中Mary不是轉(zhuǎn)移發(fā)出者,“dancing”是表現(xiàn)而不是轉(zhuǎn)移內(nèi)容,因此該句是針對(duì)性接收句T19J。
根據(jù)轉(zhuǎn)移句中強(qiáng)調(diào)要素的不同,HNC中還有基本轉(zhuǎn)移句的變體:傳輸句、替代句和變換句。傳輸句以轉(zhuǎn)移的內(nèi)容為中心,突出TBn(轉(zhuǎn)移的起點(diǎn)、終點(diǎn)和途經(jīng))信息,TBn在基本轉(zhuǎn)移句中不是必要要素,但在傳輸句中是必要的。與基本轉(zhuǎn)移句相對(duì)應(yīng),傳輸句分為一般傳輸句、物傳輸句和信息傳輸句。例如句子“The book was bought by John from Tom.”與句子“John bought the book from Tom.”“Tom sold the book to John.”表達(dá)的意思相近,但強(qiáng)調(diào)的要素不同,用概念依存語(yǔ)法來(lái)分析的話,這三個(gè)句子中的基本行為都是ATRANS,可以用相同的概念依存表達(dá)式來(lái)表示,但對(duì)HNC而言則是不同的句類,第一個(gè)句子是物傳輸句T2a0J,第二個(gè)句子是換入交換句T491J,第三個(gè)句子是換出交換句T492J。以此為例,HNC通過(guò)句類的劃分清晰地將“買”、“賣”概念中包含的主動(dòng)、被動(dòng)關(guān)系表達(dá)了出來(lái),說(shuō)明HNC的句類知識(shí)能夠細(xì)致、準(zhǔn)確地表達(dá)語(yǔ)句的深層語(yǔ)義,將概念間的差別清晰地區(qū)別開(kāi),這是其他理論所不具有的優(yōu)勢(shì)。
替代句強(qiáng)調(diào)替代的雙方和替代的內(nèi)容,比如“Jack will replace John as chairman of the company.”是基本替代句T4a1J,Jack和John是替代動(dòng)作的雙方T4B1和T4B2,替代內(nèi)容“chairman of the company”是T4C。變換句T4bJ是轉(zhuǎn)移和效應(yīng)之間的邊緣概念,變換句中需要有變換前后的對(duì)象及其表現(xiàn)T4BC1和T4BC2,并且T4BC1和T4BC2之間具有源流關(guān)系。例如“Products of labor are transformed into commodities.”就是典型的變換句,勞動(dòng)產(chǎn)品是T4BC1,商品是T4BC2,它們之間具有對(duì)仗性。在概念依存理論的基本行為中沒(méi)有可以與替代句和變換句相對(duì)應(yīng)的表達(dá),可以說(shuō)概念依存理論在這一點(diǎn)上并沒(méi)有將轉(zhuǎn)換句的分類考慮得如HNC這般透徹。
從上文的分析可以看出,概念依存理論提出的用概念節(jié)點(diǎn)和語(yǔ)義基元來(lái)描述語(yǔ)義的方法嘗試對(duì)人腦的認(rèn)知模式進(jìn)行模仿,很大程度上突破了句法結(jié)構(gòu)對(duì)語(yǔ)義理解的限制,也意識(shí)到深層語(yǔ)義是與語(yǔ)種無(wú)關(guān)的,概念是不局限于在某語(yǔ)種的表示符號(hào)。HNC借鑒了概念依存理論通過(guò)語(yǔ)義基元和概念間關(guān)聯(lián)來(lái)分析處理自然語(yǔ)言的方法,提出了概念聯(lián)想脈絡(luò)并建立語(yǔ)句的語(yǔ)義表述模式,基本上窮盡了自然語(yǔ)言句子語(yǔ)義的基本表達(dá)式。
概念依存理論嘗試用基本行為描述所有行為活動(dòng),缺點(diǎn)在于基本行為數(shù)量不夠,對(duì)于活動(dòng)的描述有疏漏的地方,每個(gè)基本行為的涵蓋面太廣,對(duì)語(yǔ)義分析的顆粒度較大,并且概念依存理論對(duì)于概念節(jié)點(diǎn)沒(méi)有進(jìn)一步的描述。而HNC的句類設(shè)計(jì)在吸收概念依存理論優(yōu)點(diǎn)的同時(shí)進(jìn)行了擴(kuò)展,從兩種理論對(duì)轉(zhuǎn)移類概念及轉(zhuǎn)移句的分析上可以看出,HNC在吸取概念依存理論的精髓之上,以具有完備性的符號(hào)體系將自然語(yǔ)言的語(yǔ)義描述提升到了一個(gè)新的高度,用語(yǔ)義網(wǎng)絡(luò)和概念基元符號(hào)體系來(lái)描述概念,并用句類表達(dá)式來(lái)描述自然語(yǔ)言語(yǔ)句,能夠更深刻全面地描述自然語(yǔ)言,并且這種高度形式化的符號(hào)體系更有利于計(jì)算機(jī)對(duì)句子進(jìn)行理解和處理。
注釋:
①塊擴(kuò)的語(yǔ)義塊用[#...#]來(lái)標(biāo)出。
②{...}表示原型句蛻,.../表示包裝句蛻。
[1]馮志偉.自然語(yǔ)言處理簡(jiǎn)明教程[M].上海:上海外語(yǔ)教育出版社,2012.
[2]黃曾陽(yáng).HNC(概念層次網(wǎng)絡(luò))理論——計(jì)算機(jī)理解語(yǔ)言研究的新思路[M].北京:清華大學(xué)出版社,1998.
[3]苗傳江.HNC(概念層次網(wǎng)絡(luò))理論導(dǎo)論[M].北京:清華大學(xué)出版社,2005.
[4]苗傳江.HNC句類知識(shí)研究[D].北京:中國(guó)科學(xué)院聲學(xué)研究所,2001.
[責(zé)任編輯 張永杰]
On HNC Theory’s Expansion of CD Theory from the Prospect of TRANS Concepts
QI qi
(University of Foreign Language of PLA, Luoyang 471003, China)
The CD (Concept Dependency) theory and HNC (Hierarchical Network of Concepts) theory are two theories aiming at natural language processing. CD theory describes and analyzes natural language through semantic primitives and the connections between the concepts. It inspired the design of semantic network of HNC theory, especially the study of TRANS concepts provided a lot experience for the construction of semantic network and sentence knowledge. Through the comparative study of how the two theories deal with the TRANS concepts, the HNC theory’s expansion of CD theory is generalized and summarized.
CD theory; HNC theory; TRANS concepts
H136
A
1008-9128(2017)03-0054-05
10.13963/j.cnki.hhuxb.2017.03.0014
2016-09-05
祁琪(1990-),女,廣西欽州人,博士生,研究方向:中文語(yǔ)言處理。