王恩旭,袁毓林
(1.北京大學(xué) 中文系,北京100871; 2. 曲阜師范大學(xué) 文學(xué)院,山東 曲阜273165)
機(jī)器理解詞義主要借助于詞典,但目前的詞典釋義還不準(zhǔn)確,也不完備。突出表現(xiàn)在:
(1) 文獻(xiàn)[1]、[2]考察詞典的名詞釋義時(shí)發(fā)現(xiàn),釋義不完備的情況隨處可見(jiàn)。比如“書(shū)”“唱片”等本該包含“物質(zhì)”“信息”兩個(gè)義位,但詞典只收錄“物質(zhì)”一個(gè)義位,漏掉了“信息”義位。
(2) 文獻(xiàn)[3]調(diào)查了《現(xiàn)代漢語(yǔ)詞典》(2005版,簡(jiǎn)稱(chēng)《現(xiàn)漢》)、《現(xiàn)代漢語(yǔ)規(guī)范詞典》(2004版,簡(jiǎn)稱(chēng)《規(guī)范》)、《新華字典》(2001版)等辭書(shū)后發(fā)現(xiàn),“本義-引申義”的聯(lián)系普遍不夠明顯。
(3)循環(huán)釋義的情況還比較常見(jiàn),比如“漂亮”,《現(xiàn)漢》(2012版)的釋義就是循環(huán)的:
【漂亮】好看;美觀。
【好看】看著舒服;美觀;精彩。
【美觀】好看;漂亮。
從文獻(xiàn)[4]對(duì)《現(xiàn)漢》(2012版)的調(diào)查來(lái)看,2 094個(gè)雙音復(fù)合詞中循環(huán)釋義的有246個(gè),占總量的11.7%。循環(huán)釋義或同義詞釋義的方式,對(duì)以漢語(yǔ)為母語(yǔ)的人來(lái)說(shuō)問(wèn)題不大,但對(duì)機(jī)器或外國(guó)學(xué)習(xí)者來(lái)說(shuō),卻容易出問(wèn)題。因?yàn)椋魏蝺蓚€(gè)詞的意義都不完全對(duì)等。此時(shí),用一個(gè)同義詞來(lái)解釋另一個(gè)同義詞,就容易讓讀者忽略同義詞之間的差別,造成詞語(yǔ)使用上的混亂。
(4) 不論詞典的規(guī)模多大、更新的速度多快,通常都無(wú)法窮盡所有的新詞,而這些新詞往往就是機(jī)器理解詞的主要障礙。*以分詞為例,研究表明,60%的分詞錯(cuò)誤是新詞和未登錄詞造成的[6]。
本文的目標(biāo): 通過(guò)分析詞的語(yǔ)義結(jié)構(gòu)、構(gòu)建詞的釋義模版,解決多義詞、同義詞、新造、合成詞等釋義問(wèn)題,為自然語(yǔ)言處理及機(jī)器詞典編纂服務(wù)。
分析詞的語(yǔ)義結(jié)構(gòu),本文采用生成詞庫(kù)論的方法。*和已有的理論相比,生成詞庫(kù)論提供了一個(gè)更為豐富、完備的詞義描述框架,被廣泛應(yīng)用于多種語(yǔ)言的詞典編纂和語(yǔ)義資源建設(shè)之中。但在漢語(yǔ)中,生成詞庫(kù)論還限于解釋一些個(gè)別的語(yǔ)言現(xiàn)象,系統(tǒng)的面向計(jì)算的詞匯語(yǔ)義分析尚未展開(kāi)[7]。根據(jù)文獻(xiàn)[5],詞的概念結(jié)構(gòu)中可能包括以下四方面的信息:
(1) 語(yǔ)義類(lèi)型(TYPESTR): 每個(gè)詞都屬于一個(gè)特定的語(yǔ)義類(lèi);
(2) 論元結(jié)構(gòu)(ARGSTR): 確定謂詞的論元性質(zhì)、數(shù)量及其句法實(shí)現(xiàn)情況;
(3) 事件結(jié)構(gòu)(EVESTR): 確定表達(dá)式的事件類(lèi)型、事件成分及事件關(guān)系;
(4) 物性結(jié)構(gòu)(QUALIA): 包括一個(gè)詞的表現(xiàn)形式是什么(formal)、由什么構(gòu)成(constitutive)、有哪些功能(telic)、怎樣產(chǎn)生(agentive)四種物性角色。
詞類(lèi)不同,詞的語(yǔ)義結(jié)構(gòu)分析方法往往便不同。分析名詞的語(yǔ)義結(jié)構(gòu),適合從物性結(jié)構(gòu)入手。和其他詞類(lèi)相比,名詞的語(yǔ)義信息更為復(fù)雜,除了文獻(xiàn)[5]的四種物性角色外,還可能包含材料、單位、處置、行為、定位五種物性角色[1]。分析名詞的語(yǔ)義結(jié)構(gòu),先要弄清名詞包含了哪些物性信息;然后再分析它的語(yǔ)義成分和語(yǔ)義關(guān)系。以“椅子(有腿有靠背的坐具)”為例,分析它的物性結(jié)構(gòu),可以得到以下信息:
語(yǔ)義類(lèi)信息: 人造物;家具類(lèi)
物性結(jié)構(gòu)信息: 功用角色(供人坐);構(gòu)成角色(由靠背、四條腿等構(gòu)成)
在此基礎(chǔ)上,確定“椅子”的詞義成分和詞義關(guān)系:
詞義成分: 3個(gè)(人/家具/靠背和四條腿)。
詞義關(guān)系: 3種(語(yǔ)義類(lèi)關(guān)系,“家具”和“椅子”是上下位關(guān)系;功用關(guān)系,“供人坐”或“用來(lái)坐”是“椅子”的功用;構(gòu)成關(guān)系,“靠背和四條腿”是“椅子”的構(gòu)成成分。)
分析動(dòng)詞的語(yǔ)義結(jié)構(gòu),適合從論元結(jié)構(gòu)入手。論元結(jié)構(gòu)的基本語(yǔ)義成分是動(dòng)詞和論元,基本語(yǔ)義關(guān)系是動(dòng)詞和論元的關(guān)系。論元有兩種: 一種是必有論元,一種是非必有論元[8]。根據(jù)必有論元數(shù)量的多少,可將動(dòng)詞分為三類(lèi): 一價(jià)動(dòng)詞(帶一個(gè)必有論元)、二價(jià)動(dòng)詞(帶兩個(gè)必有論元)和三價(jià)動(dòng)詞(帶三個(gè)必有論元)。分析動(dòng)詞的論元結(jié)構(gòu),先要弄清動(dòng)詞需要跟帶哪些論元,哪些是必有論元,哪些是非必有論元;然后弄清動(dòng)詞和論元之間的關(guān)系。以“走(人或鳥(niǎo)、獸用雙腳在地上交替向前移動(dòng))”為例:
語(yǔ)義類(lèi)信息: 身體活動(dòng);位移類(lèi)
必有論元: 1個(gè)(人或鳥(niǎo)、獸);
非必有論元: 3個(gè)(雙腳/前/地上)
語(yǔ)義關(guān)系: 6種(語(yǔ)義類(lèi)關(guān)系,“移動(dòng)”和“走”是上下位關(guān)系;施事-動(dòng)作關(guān)系,“人或鳥(niǎo)、獸”是“移動(dòng)”的施事;工具-動(dòng)作關(guān)系,“(用)雙腳”是“移動(dòng)”的工具;處所-動(dòng)作關(guān)系,“(在)地上”是“移動(dòng)”的處所;方式-動(dòng)作關(guān)系,“(雙腳)交替”是“移動(dòng)”的方式;動(dòng)作-方向關(guān)系,“移動(dòng)”的方向是“(向)前”)
分析形容詞的語(yǔ)義結(jié)構(gòu),適合從搭配入手。選擇從搭配入手,基于以下幾方面的考慮: (1)形容詞的意義虛泛、空靈,從其自身入手不容易把握,最好的辦法莫過(guò)于看它的搭配對(duì)象。(2)從形式上看,形容詞常和兩類(lèi)詞搭配: 另一類(lèi)是名詞,如“白紙”、“薄皮”、“明月”、“甜棗”、“低空”等;一類(lèi)是動(dòng)詞,如“明說(shuō)”“慢走”“亂跑”“高唱”“緊握”等。從意義上看,形容詞并不直接和實(shí)體名詞搭配,而是先和屬性名詞搭配,然后再和實(shí)體名詞搭配,即“顏色白的紙/厚度小的皮/光線明的月亮”;同樣,形容詞也并不直接和動(dòng)詞搭配,而是先和屬性名詞搭配,然后再和動(dòng)詞搭配,即“以公開(kāi)的方式說(shuō)/以較慢的速度走/以較高的聲音唱”。這說(shuō)明,形容詞無(wú)論和實(shí)體名詞還是和動(dòng)詞搭配,本質(zhì)是一樣的,其真正的搭配對(duì)象是屬性名詞。(3)文獻(xiàn)[9-10]指出,實(shí)體名詞、屬性名詞和形容詞之間存在配價(jià)上的關(guān)系,實(shí)體名詞可以看作是屬性名詞的論元,形容詞是屬性的值,即“實(shí)體名詞(屬性名詞)=形容詞”。
詞的意義和搭配之間存在著一種內(nèi)在的聯(lián)系[11]。分析形容詞的語(yǔ)義結(jié)構(gòu),就是要弄清形容詞和什么樣的屬性名詞搭配。弄清了這些,也就大體弄清了形容詞的意義和用法[2]。以“薄(扁平物體的厚度小)”為例:
語(yǔ)義類(lèi)信息: 物性的值;小類(lèi)
語(yǔ)義成分: 3個(gè)(實(shí)體名詞: 扁平物體;屬性名詞: 厚度;屬性值: 小)
語(yǔ)義關(guān)系: 3種(語(yǔ)義類(lèi)關(guān)系,“薄”和“小”之間有上下位關(guān)系;領(lǐng)屬關(guān)系,“扁平物體”包含著多種屬性,“厚度”是其中的一種,兩者存在著領(lǐng)屬關(guān)系;屬性和屬性值關(guān)系,“厚度”是屬性,“小”是該屬性的值,兩者是屬性和屬性值的關(guān)系)
基于詞的語(yǔ)義結(jié)構(gòu)分析,構(gòu)建詞的釋義模版。構(gòu)建釋義模版時(shí),遵循三個(gè)原則:
(1) 不同的詞類(lèi)之間,釋義模板可能是不同的。比如,構(gòu)建名詞的釋義模版,適合從物性結(jié)構(gòu)入手;構(gòu)建動(dòng)詞的釋義模版,適合從論元結(jié)構(gòu)入手構(gòu);構(gòu)建形容詞的釋義模板,適合從搭配對(duì)象入手。比較:*為增強(qiáng)詞義信息的完整性和典型性,本文在釋義時(shí)采用了文獻(xiàn)[1]的方法,將被釋詞嵌入釋義之中。以“椅子”為例: 《柯林斯》【chair】A chair is a piece of furniture for one person to sit on,with a back and four legs.《現(xiàn)漢》【椅子】有腿有靠背的坐具?!侗疚摹贰疽巫印恳巫邮且环N供人坐的家具,它有靠背和四條腿。和《現(xiàn)漢》相比,本文釋義的語(yǔ)義信息更加豐富。(進(jìn)一步討論,參見(jiàn)第5部分)
【椅子】X是……(語(yǔ)義類(lèi)),X是用來(lái)……(功用角色),X由……構(gòu)成(構(gòu)成角色)。(X表被釋詞,下同)
【走】當(dāng)人或鳥(niǎo)獸(施事)X時(shí),他/它用……(工具)在……(處所)以……方式(方式)向……(方向)移動(dòng)(語(yǔ)義類(lèi))。
【薄】如果說(shuō)一個(gè)物體(實(shí)體)X,那么意味著 它的……方面(屬性)……(屬性值)。
(2) 同一詞類(lèi)內(nèi)部、不同的語(yǔ)義類(lèi)之間*本文的語(yǔ)義分類(lèi)主要參照《現(xiàn)代漢語(yǔ)語(yǔ)義分類(lèi)詞典》[13]、《現(xiàn)代漢語(yǔ)語(yǔ)義詞典》(北京大學(xué)計(jì)算語(yǔ)言學(xué)研究所),個(gè)別分類(lèi)吸收了現(xiàn)代語(yǔ)言學(xué)的研究成果。比如,將動(dòng)詞分為自主動(dòng)詞和非自主動(dòng)詞是吸收了文獻(xiàn)[14]的成果。,釋義模板也可能是不同的。比如名詞“紙(可供寫(xiě)字、繪畫(huà)、印刷、包裝等用的薄片狀的東西,多用植物纖維制成)”和“質(zhì)地(材料的結(jié)構(gòu)性質(zhì))”詞類(lèi)相同,但由于語(yǔ)義類(lèi)別不同(前者屬于“具體事物-辦公用品”類(lèi),后者屬于“抽象事物-屬性”類(lèi)),釋義模版便不同。試比較:
【紙】X是……(語(yǔ)義類(lèi)),X的形狀是……(形式角色),用X來(lái)……(功用角色),X由……制成(施成角色)。
【質(zhì)地】X表示……方面的(構(gòu)成角色)性質(zhì)(語(yǔ)義類(lèi))。
類(lèi)似的情況在其他詞類(lèi)中也存在。以動(dòng)詞為例,自主動(dòng)詞和非自主動(dòng)詞的語(yǔ)義類(lèi)別不同,釋義模版也不同。自主動(dòng)詞具有“有意性”和“可控性”,比如“打、跑、吃、開(kāi)、發(fā)球、生產(chǎn)”等;非自主動(dòng)詞具有“無(wú)意性”和“非可控性”,比如“病、死、跌、塌、丟、發(fā)芽、生根”等[14]。自主動(dòng)詞的語(yǔ)義結(jié)構(gòu),除了包含動(dòng)詞和必有論元信息外,還包含意愿、工具、方式、依據(jù)、目的等信息。相對(duì)而言,非自主動(dòng)詞的語(yǔ)義結(jié)構(gòu),通常只包含動(dòng)詞和必有論元信息,不包含意愿、工具、方式、依據(jù)、目的等信息。試比較:
自主動(dòng)詞:
【打】如果 你(施事)X某人或某物(受事),那么 你 有意(意愿)用……(工具)大力(方式)擊打(語(yǔ)義類(lèi))他/它。
【發(fā)球】②如果 你(施事)X球(受事),那么 你 依照……(依據(jù))把球(處置)發(fā)給(語(yǔ)義類(lèi))……(與事)。非自主動(dòng)詞:
【丟】如果 你(施事)X某物(受事),那么 你 失去了(語(yǔ)義類(lèi))它。
【發(fā)芽】如果 種子(施事)X芽(受事),那么 它 長(zhǎng)出(語(yǔ)義類(lèi))幼芽。
(3) 在同一詞類(lèi)、同一語(yǔ)義類(lèi)內(nèi)部,釋義模板要相同或盡可能相同。比如:
“紫檀、白樺、紅柳、黃蘗”等屬于喬木類(lèi)名詞,應(yīng)該具有相同的釋義模版;
“打、擊、敲、捶、揍”等屬于打擊類(lèi)動(dòng)詞,應(yīng)該具有相同的釋義模版;
“好看、漂亮、美觀、俊秀”等表示評(píng)價(jià)屬性的值,應(yīng)該有相同的釋義模版;
“稍、較、很、極、太”等屬于程度類(lèi)副詞,應(yīng)該具有相同的釋義模版;
“朝、向、對(duì)、往、迎、逆”等屬于方向類(lèi)介詞,應(yīng)該具有相同的釋義模版;
……
有關(guān)同一語(yǔ)義類(lèi)詞語(yǔ)的釋義模版,后面還會(huì)進(jìn)一步討論,這里暫略。
文獻(xiàn)[15-16]利用釋義模版解決了名名短語(yǔ)的自動(dòng)釋義問(wèn)題(準(zhǔn)確率為94.23%)。在詞語(yǔ)層面,根據(jù)本文的觀察,利用釋義模版可以解決以下四方面的問(wèn)題:
(1) 解決多義詞的釋義問(wèn)題。
多義詞的義項(xiàng)之間存在語(yǔ)義上的聯(lián)系,利用這種聯(lián)系,可以“把錯(cuò)綜復(fù)雜的一詞多義的現(xiàn)象理出頭緒,并串聯(lián)起來(lái),從而更好地掌握一個(gè)詞的全部意義”[17: 39-40]。為了增強(qiáng)義項(xiàng)間的語(yǔ)義聯(lián)系,《新牛津英語(yǔ)詞典》(1998)、《規(guī)范》做了大量的研究工作,但義項(xiàng)間的語(yǔ)義聯(lián)系依然不夠明顯[3]。本文通過(guò)釋義模版來(lái)解決這一問(wèn)題。以形容詞“好”為例,《規(guī)范》(第3版)概括了六個(gè)義項(xiàng),本文從搭配入手為“好”建構(gòu)了統(tǒng)一的釋義模版,即“如果說(shuō)……好,那么他或它……方面優(yōu)點(diǎn)多;令人滿(mǎn)意”。利用這一模版,將“好”的各項(xiàng)意義關(guān)聯(lián)了起來(lái),如表1所示。試比較: (為了節(jié)約篇幅,義項(xiàng)①用完整釋義模式“如果……,那么……”,其他義項(xiàng)用簡(jiǎn)潔釋義模式。下同。)
表1 多義詞“好”的釋義比較
和《規(guī)范》相比,本文的釋義有三方面優(yōu)點(diǎn): ①通過(guò)設(shè)置典型語(yǔ)境凸顯形容詞的典型意義和典型用法,便于讀者理解形容詞的意義。②用同一釋義模版解釋多義詞的多項(xiàng)意義,有利于增強(qiáng)義項(xiàng)間的語(yǔ)義聯(lián)系。③兼用“跟……相近”或“跟……相對(duì)”的釋義方式,有利于增強(qiáng)被釋詞與其相關(guān)同義詞、反義詞的聯(lián)系。
利用釋義模版可以解決多義形容詞的釋義問(wèn)題,也可以解決其他多義詞的釋義問(wèn)題。比如動(dòng)詞“傳”,《規(guī)范》概括了六個(gè)義項(xiàng): ①一方交給另一方;上代交給下代。②把知識(shí)、技能等教給別人。③廣泛散布;宣揚(yáng)。④命令別人來(lái)。⑤表達(dá);流露。⑥熱或電在導(dǎo)體中流通。仔細(xì)觀察這六項(xiàng)意義,不難發(fā)現(xiàn)它們都表示“轉(zhuǎn)移”。利用這一共性,可以建立統(tǒng)一的釋義模版。利用這一模版,可以將“傳”的各項(xiàng)意義重新解釋如下:
【傳】釋義模版:如果一方X……給另一方,那么……從一方轉(zhuǎn)移到另一方。
① 如果一方(上一代) X物品或技藝給 另一方(下一代),那么 物品或技藝 從一方(上一代)轉(zhuǎn)移到 另一方(下一代)。跟“傳遞、遺傳”相近。
② 如果一方X知識(shí)、技能等給 另一方,那么知識(shí)、技能等從一方 轉(zhuǎn)移到 另一方。跟“傳授”相近。
③ 如果一方X言論、信息等給 另一方,那么言論、信息等廣泛地從一方 轉(zhuǎn)移到 另一方。跟“傳播”相近。
④ 如果說(shuō)話(huà)人X命令給 聽(tīng)話(huà)人,那么 命令 從說(shuō)話(huà)人這里 轉(zhuǎn)移到 聽(tīng)話(huà)人那里,并使聽(tīng)話(huà)人來(lái)說(shuō)話(huà)人這里。跟“傳喚”相近。
⑤ 如果一方X思想、感情等給 另一方,那么思想、感情等 從一方 轉(zhuǎn)移到 另一方。跟“傳情”相近。
⑥ 如果某物體X電或熱,那么 電或熱 從該物體的一端 轉(zhuǎn)移到 另一端。跟“傳導(dǎo)”相近。
利用釋義模版解決多義詞的釋義問(wèn)題,需要語(yǔ)言學(xué)研究的支持。文獻(xiàn)[18]發(fā)現(xiàn),多義詞有一個(gè)共同的核心義。比如“發(fā)”,核心義表示“(使)……離開(kāi)……”,利用核心義可以將“發(fā)”的各項(xiàng)意義聯(lián)系起來(lái): 義項(xiàng)①“發(fā)射”表示“使箭或炮彈離開(kāi)”;義項(xiàng)②“產(chǎn)生;發(fā)生”表示“使某種事物脫離本體”;義項(xiàng)③“派遣;出發(fā)”表示“(使)人有目的地離開(kāi)”;義項(xiàng)④“打開(kāi)”表示“使覆蓋的部分離開(kāi)”;義項(xiàng)⑤“啟發(fā)”表示“使蒙蔽思想的部分離開(kāi)”。如果說(shuō)文獻(xiàn)[18]的研究還是個(gè)案式的、無(wú)法窺測(cè)核心義全貌的話(huà),那么文獻(xiàn)[19]對(duì)“按、拔、報(bào)、保、北、備”等200多個(gè)多義詞核心義的研究則完善了“核心義的概念體系”,凸顯了核心義對(duì)多義詞釋義的價(jià)值。
(2) 解決同義詞的釋義問(wèn)題。
同義詞的廣泛分布,讓人們習(xí)慣于用一個(gè)同義詞來(lái)解釋另一個(gè)同義詞。比如,解釋“好看”用“漂亮;美觀”;解釋“漂亮”用“好看”,解釋“美觀”用“好看;漂亮”。這樣做,不僅造成了大量的循環(huán)釋義,也難以凸顯同義詞之間的細(xì)微語(yǔ)義差別。釋義模版則可以解決這一問(wèn)題。由于同義詞以名、動(dòng)、形為絕大多數(shù)*根據(jù)文獻(xiàn)[20]對(duì)《新華同義詞詞典》(2005版)的統(tǒng)計(jì),名詞、動(dòng)詞、形容詞占同義詞的絕大多數(shù)(占92%)。其中,動(dòng)詞數(shù)量最多(占45%),形容詞次之(占25%),名詞再次之(占22%)。。因此,下面的討論將圍繞著名、動(dòng)、形同義詞展開(kāi)。
先來(lái)看名詞,以“椅子”類(lèi)同義詞為例。前面解決了“椅子”的釋義問(wèn)題,基于這一釋義,可以解決和“椅子”同一語(yǔ)義類(lèi)詞的釋義問(wèn)題。稍有不同的是,前者在后者的基礎(chǔ)上增加或替換了一些語(yǔ)義角色(下劃線部分)。比如:
釋義模版:X是一種……的椅子。
【竹椅】X是一種 由竹子做的 椅子。(增加了施成角色)
【長(zhǎng)椅】X是一種 長(zhǎng)條形的 椅子。(增加了形式角色)
【躺椅】X是一種 用來(lái)躺臥的 椅子。(替換了功用角色)
【搖椅】X是一種 有枕部和扶手、可以前后搖晃的 椅子。(替換了構(gòu)成、功用角色)
接下來(lái)看動(dòng)詞,以“打擊”類(lèi)動(dòng)詞為例。解釋“打擊”類(lèi)動(dòng)詞,文獻(xiàn)[21]用了“工具、方式、力度、部位/對(duì)象、頻率、目的/結(jié)果”六種語(yǔ)義成分,本文用了“施事、受事、意愿、工具、力度、頻率、語(yǔ)義類(lèi)、部位、目的/結(jié)果”九種語(yǔ)義成分。釋義前,先構(gòu)建釋義模版:
如果 施(施事)X受(受事),那么 施 有意(意愿)用……(工具)以……(力度或頻率)擊打(語(yǔ)義類(lèi))受或受的……部位(部位),以/使……(目的/結(jié)果)。
利用這一模版,解釋“打擊”類(lèi)動(dòng)詞的意義。比如:
【打】如果 你 X 某人或某物,那么你 有意 用手或器物 大力 擊打 他(它)。
【敲】如果 你 X 某物(門(mén)、鼓等),那么你 有意 用手或器物 連續(xù) 擊打 它,以引起某人的注意。
【摑】如果 你 X 某人,那么你 有意 用手掌 擊打 他(臉/耳光)。
【揍】如果 你 X 某人,那么你 有意 用手或器物 擊打 他。
施事、意愿、語(yǔ)義類(lèi)是共有的語(yǔ)義成分,擊打部位、擊打工具、擊打力度等是每個(gè)“打擊”動(dòng)詞特有的語(yǔ)義成分(下劃線部分)。解釋前者,是為了凸顯“打擊”類(lèi)動(dòng)詞的共性;解釋后者,是為了凸顯每一個(gè)“打擊”動(dòng)詞的個(gè)性,即凸顯“打擊”類(lèi)動(dòng)詞之間的細(xì)微語(yǔ)義差別。
最后看形容詞,以“漂亮”“好看”“美觀”為例。解釋這些詞語(yǔ),《現(xiàn)漢》《規(guī)范》的釋義是循環(huán)的,本文則不會(huì)出現(xiàn)這樣的問(wèn)題,二者的比較如表2所示。
表2 同義詞“漂亮”“好看”“美觀”的釋義比較
通過(guò)釋義模版,“漂亮”“好看”“美觀”的差別就很明顯了: “漂亮”可以評(píng)價(jià)人、事、物或動(dòng)作的整體(如“這一仗打得真漂亮”),也可以評(píng)價(jià)人、事、物或動(dòng)作的某一方面(如外觀);“好看”通常評(píng)價(jià)人、物、動(dòng)作的某一方面(如外觀);“美觀”通常評(píng)價(jià)景、物的某一方面(如外觀、款式等)。
(3) 解決新造合成詞的釋義問(wèn)題。
新詞詞形、詞義是“新的”,但詞法結(jié)構(gòu)、語(yǔ)義結(jié)構(gòu)往往是“舊的”。因此,可以用“舊的”釋義模板解釋新詞。比如“裸X”,分析它的語(yǔ)義結(jié)構(gòu),可以建構(gòu)如下釋義模板:
【裸X】(相對(duì)……來(lái)說(shuō),)裸X是一種除了其自身外、什么都沒(méi)有或不附帶的X。
利用這一模板,可以解釋像“裸機(jī)”這樣已收入《現(xiàn)漢》的新詞,也可以解釋像“裸官”“裸考”“裸油價(jià)”這樣未收入《現(xiàn)漢》的新詞:
【裸機(jī)】裸機(jī)是一種除了其自身外、什么(網(wǎng)絡(luò)、系統(tǒng)等)都不附帶的機(jī)器。
【裸官】(相對(duì)家屬、財(cái)產(chǎn)在國(guó)內(nèi)的官員來(lái)說(shuō),)裸官是一種除了其自身外、什么(家屬、財(cái)產(chǎn))都不在國(guó)內(nèi)的官員。
【裸油價(jià)】裸油價(jià)是一種除了油自身的價(jià)格外、什么(附加稅)都不附帶的價(jià)格。
利用釋義模版,可以解決以下兩類(lèi)新詞的釋義問(wèn)題:
一類(lèi)是構(gòu)詞形式相似的新詞,以仿擬詞為代表。通過(guò)仿擬產(chǎn)生的新詞,在構(gòu)詞形式、表意特點(diǎn)方面有很多相似之處。利用這些相似之處,可以為仿擬詞建構(gòu)統(tǒng)一的釋義模版。比如,“裸X”表示“一種除了其自身外、什么都沒(méi)有或不附帶的X”;“XX門(mén)”表示“一種和……有關(guān)的丑聞”(如“艷照門(mén)/伊朗門(mén)/拉鏈門(mén)”等);“互聯(lián)網(wǎng)+”表示“一種互聯(lián)網(wǎng)和……相結(jié)合的行業(yè)”(如“互聯(lián)網(wǎng)+政務(wù)服務(wù)/互聯(lián)網(wǎng)+手機(jī)/互聯(lián)網(wǎng)+雜貨店”等)。
另一類(lèi)是語(yǔ)義上密切相關(guān)的新詞,以新造同義詞為代表。這些詞在產(chǎn)生新意義之前,概念意義可能并不相同;進(jìn)入某一特定的領(lǐng)域后,概念意義才變得相同或基本相同。比如“奔馳”“寶馬”“大眾”等,沒(méi)有描述汽車(chē)品牌之前,不是同義詞;進(jìn)入汽車(chē)行業(yè)后,才變成了同義詞。變成同義詞后,可以用釋義模版來(lái)解釋?zhuān)?/p>
X是……汽車(chē)品牌(語(yǔ)義類(lèi)),X始創(chuàng)于……(施成角色),X的標(biāo)志是……(形式角色),X的特色是……(評(píng)價(jià)角色),X的車(chē)型有……(構(gòu)成角色)。
有些新造同義詞的使用條件受限,只能在特定的語(yǔ)境下使用。解釋這些新詞,需要設(shè)置一個(gè)特定的語(yǔ)境。比如“潛水”“冒泡”“吐槽”“活躍”“話(huà)嘮”“傳說(shuō)”,通常只在QQ群中使用,用來(lái)描述QQ群成員的活躍程度。其中,“潛水”的活躍程度最低,發(fā)言次數(shù)最少;“冒泡”的活躍程度較低,偶爾發(fā)幾次言;“吐槽”的活躍程度中等,針對(duì)某些話(huà)題發(fā)言較多;“活躍”的活躍程度較高,發(fā)言次數(shù)超出了平均水平;“話(huà)嘮”的活躍程度很高,發(fā)言次數(shù)超出平均水平很多;“傳說(shuō)”的活躍程度最高,發(fā)言次數(shù)遠(yuǎn)遠(yuǎn)超出了平均水平?;谝陨戏治?,可構(gòu)建“潛水”類(lèi)新詞的釋義模版:
如果 某人 在QQ群中 處于X等級(jí),那么意味著 他 在該群的活躍程度……,發(fā)言次數(shù)……。
(4) 有利于解決句子或篇章的理解問(wèn)題。
釋義模版不是憑空產(chǎn)生的,而是在大量真實(shí)語(yǔ)料的基礎(chǔ)上提煉、概括而成的。釋義模版概括得越全面、越準(zhǔn)確,越有利于理解詞在真實(shí)語(yǔ)境中的意義和用法。以“食堂”為例,《規(guī)范》將其解釋為“機(jī)關(guān)、團(tuán)體里向本單位人員供應(yīng)伙食的部門(mén)和處所”,還不夠全面。因?yàn)?,該釋義只在“食堂”和“創(chuàng)辦單位”“就餐人員”“食物”之間建立起了聯(lián)系,有利于理解例a類(lèi)的句子;沒(méi)有在“食堂”和“食材”“炊事員”“筷子”之間建立起聯(lián)系,不利于理解例b類(lèi)的句子。(語(yǔ)料源自北京大學(xué)CCL語(yǔ)料庫(kù))
a1. 工人們?cè)谑程么蛄孙埦统鰜?lái),……。(就餐人員、食物)
a2. 她……,在醫(yī)院食堂買(mǎi)了飯菜帶回來(lái)讓我們吃了以后,又匆匆地去上班了。(創(chuàng)辦單位、食物、就餐人員)
b1. 我們學(xué)校食堂用蒸箱蒸饅頭, ……。(創(chuàng)辦單位、食物、炊具)
b2. 村里辦起了食堂,家中的米鹽柴什么的也全被村里沒(méi)收了,……(創(chuàng)辦單位、食材)
b3. 我看見(jiàn)了……這條船的食堂,炊事員正在洗筷子,……。(創(chuàng)辦者、炊事人員、餐具)
通過(guò)物性結(jié)構(gòu),本文將和“食堂”有關(guān)的重要信息都關(guān)聯(lián)到了一起,形成新的“食堂”釋義:
【食堂】X 是一個(gè)由食材、食物、炊具、餐具、炊事人員等構(gòu)成(構(gòu)成角色)的非盈利性場(chǎng)所(語(yǔ)義類(lèi)),主要由機(jī)關(guān)、學(xué)校等企事業(yè)單位創(chuàng)辦(施成角色),用于制作和供應(yīng)企事業(yè)單位內(nèi)部職工、學(xué)生的飲食(功用角色)。
有了這一釋義,不僅可以理解例a類(lèi)的句子,也可以理解例b類(lèi)的句子。
以上說(shuō)了釋義模版對(duì)句子理解的作用,下面再說(shuō)一下釋義模版對(duì)語(yǔ)篇理解的作用。以汽車(chē)品牌“奔馳”為例,對(duì)于這一品牌,百度百科用了14 000多字來(lái)描述,內(nèi)容涉及“奔馳創(chuàng)始人”“奔馳標(biāo)志”“品牌特色”“發(fā)展歷程”“車(chē)型列表”等方面,如圖1所示。
圖1 百度百科對(duì)“奔馳”的語(yǔ)篇描述目錄
利用釋義模版,可將以上的描述概括如下:
【奔馳】奔馳是德國(guó)汽車(chē)品牌(語(yǔ)義類(lèi)),始創(chuàng)于1926年(施成角色),標(biāo)志是三叉星(形式角色),因外貌出眾、性能卓越、售后服務(wù)良好(評(píng)價(jià)角色)而聞名,主要車(chē)型有乘用車(chē)系、商用車(chē)系、輕型商務(wù)車(chē)系(構(gòu)成角色)。
詞語(yǔ)釋義是語(yǔ)篇描述的一個(gè)關(guān)鍵詞集合,弄清了“奔馳”的詞匯意義是什么,也就大體弄清了“奔馳”語(yǔ)篇描述的關(guān)鍵詞有哪些。從這個(gè)意義上說(shuō),做好“奔馳”的釋義工作,對(duì)于理解語(yǔ)篇中的“奔馳”也是有幫助的。
機(jī)器詞典和詞匯語(yǔ)義資源是自然語(yǔ)言理解中的基礎(chǔ)性資源,機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘、單詞相似度計(jì)算等通常都要在機(jī)器詞典和詞匯語(yǔ)義資源的基礎(chǔ)上進(jìn)行。但目前的機(jī)器詞典和詞匯語(yǔ)義資源建設(shè)還不盡如人意,詞的語(yǔ)義知識(shí)描述、表示等問(wèn)題依舊是制約詞匯語(yǔ)義分析深入的一個(gè)關(guān)鍵問(wèn)題[22]。
為了解決詞義知識(shí)的描述問(wèn)題,本團(tuán)隊(duì)構(gòu)建了親屬關(guān)系自動(dòng)推理模型[23-24]、名名組合釋義模板[15-16]、漢語(yǔ)名詞物性結(jié)構(gòu)描寫(xiě)體系[1]、形容詞語(yǔ)義分析框架[25],揭示了復(fù)合名詞詞義中的物性角色分布規(guī)律[26]。在此基礎(chǔ)上,本文進(jìn)一步推進(jìn),建構(gòu)了漢語(yǔ)詞的釋義模版。建構(gòu)釋義模版時(shí),本文做了兩方面的改進(jìn):
(1) 受柯林斯詞典(CollinsCOBUILDAdvancedLearner’sEnglishDictionary2006年第5版)的啟發(fā),放棄了傳統(tǒng)的、描述式的釋義方法,改用了基于用法的、例證式的釋義方法。以“打”為例,試比較:
《柯林斯》【hit】?If you hit someone or something, you deliberately touch them with a lot of force, with your hand or an object held in your hand.
《現(xiàn)漢》【打】?用手或器具撞擊物體。
《本課題》【打】?如果你打某人或某物,那么你會(huì)故意用手或器物大力擊打它。
以往的釋義方法,被釋詞和釋義是分離的;例證式的釋義方法,被釋詞和釋義是一體的,被釋詞被嵌入到了釋義之中。例證式釋義方法的優(yōu)點(diǎn),誠(chéng)如《柯林斯》詞典前言所說(shuō): “所有義項(xiàng)均采用整句釋義,親切自然,深入淺出,成功凸顯了詞語(yǔ)在典型語(yǔ)境中的典型用法,釋義本身就是絕佳的例證?!?/p>
(2) 放棄按詞、按義項(xiàng)逐一釋義的方法,改用了模版統(tǒng)一釋義的方法。研究表明,建構(gòu)釋義模版有助于解決詞語(yǔ)釋義不完備問(wèn)題、多義詞釋義問(wèn)題、同義詞釋義問(wèn)題、新造合成詞釋義問(wèn)題、句子理解及語(yǔ)篇理解等問(wèn)題。
[1]袁毓林. 漢語(yǔ)名詞物性結(jié)構(gòu)的描寫(xiě)體系和運(yùn)用案例[J].當(dāng)代語(yǔ)言學(xué),2014(1): 31-48.
[2]李強(qiáng), 袁毓林.生成詞庫(kù)理論和名詞語(yǔ)義的結(jié)構(gòu)描述與概念解釋[C].詞匯學(xué)國(guó)際學(xué)術(shù)會(huì)議暨第十一屆全國(guó)漢語(yǔ)詞匯學(xué)學(xué)術(shù)研討會(huì)論文, 北京: 北京大學(xué), 2016.
[3]施春宏.詞義結(jié)構(gòu)的認(rèn)知基礎(chǔ)及釋義原則[J].中國(guó)語(yǔ)文, 2012(2): 114-127。
[4]馬英新. “動(dòng)+名”偏正式雙音復(fù)合詞的結(jié)構(gòu)義及其釋義研究[D].石家莊: 河北師范大學(xué)博士學(xué)位論文,2013.
[5]Pustejovsky J. The generative lexicon[M]. Cambridge: MIT Press, 1995.
[6]Sproat R, Emerson T. The first international Chinese word segmentation bakeoff[C]//Proceedings of the 2nd SIGHAN work-shop on Chinese language processing, 2003: 11-17.
[7]Pierrette B, Federica B (eds.),黃居仁, 蘇祺(導(dǎo)讀),2001/2010,詞義的語(yǔ)言: 詞義理論的跨學(xué)科討論[M].北京: 北京大學(xué)出版社.
[8]袁毓林. 漢語(yǔ)配價(jià)語(yǔ)法研究[M].北京: 商務(wù)印書(shū)館,2010.
[9]Miller G A. Nounsin WordNet[M]. WordNet: An Electronic Lexical Database. Cambridge & MA: The MIT Press, 1998.
[10]袁毓林. 形容詞的語(yǔ)義特征和句式特點(diǎn)之間的關(guān)系[J].漢藏語(yǔ)學(xué)報(bào),2013(7): 147-165.
[11]Lyons J. Semantics[M].Cambridge: Cambridge University Press,1977.
[12]柯林斯出版公司. Collins COBUILD advanced learner’s English dictionary: new edition[M]. 北京: 外語(yǔ)教學(xué)與研究出版社, 2006.
[13]蘇新春. 現(xiàn)代漢語(yǔ)語(yǔ)義分類(lèi)詞典[Z].北京: 商務(wù)印書(shū)館,2014.
[14]馬慶株. 自主動(dòng)詞和非自主動(dòng)詞[J].中國(guó)語(yǔ)言學(xué)報(bào), 北京: 商務(wù)印書(shū)館, 1988(3): 157-180.
[15]魏雪, 袁毓林. 基于語(yǔ)義類(lèi)和物性角色建構(gòu)名名組合的釋義模板[J].世界漢語(yǔ)教學(xué),2013(2): 172-181.
[16]魏雪, 袁毓林. 基于規(guī)則的漢語(yǔ)名名組合的自動(dòng)釋義研究[J].中文信息學(xué)報(bào),2014(3): 1-10.
[17]郭在貽. 訓(xùn)詁學(xué)(修訂本)[M].北京: 中華書(shū)局,1986/2005.
[18]張聯(lián)榮. 談詞的核心義[J]. 語(yǔ)文研究,1995(3): 31-36.
[19]王云路, 王誠(chéng). 漢語(yǔ)詞匯核心義研究[J].北京: 北京大學(xué)出版社,2014.
[20]歐陽(yáng)麗文, 李仕春. 從詞性的角度看現(xiàn)代漢語(yǔ)同義詞的分布規(guī)律[J].廣西教育學(xué)院學(xué)報(bào), 2013(2): 82-85.
[21]蔣紹愚. 打擊義動(dòng)詞的詞義分析[J].中國(guó)語(yǔ)文, 2007(5): 387-401.
[22]中文信息學(xué)會(huì). 中文信息處理發(fā)展報(bào)告[Z]. www.cipsc.org.cn,2016.
[23]陳振宇, 袁毓林, 張秀松, 等. 一種基于大知識(shí)庫(kù)的親屬關(guān)系自動(dòng)推理模型[J]. 中文信息學(xué)報(bào), 2010a, 24(3): 117-123.
[24]陳振宇, 袁毓林. 漢語(yǔ)親屬關(guān)系的語(yǔ)義表示和自動(dòng)推理[J]. 中國(guó)語(yǔ)文, 2010b(1): 44-56.
[25]Wang Enxu, Yuan Yunlin.The meaning of the Chinese polysemous adjective “Hao”(Good).Chinese Lexical Semantics. Wu Yunfang et al. (Eds), CLSW2017, Springer Verlag, Berlin Heidelberg, 2017. (forthcoming)
[26]王恩旭,袁毓林. 詞義中物性角色的分布及其對(duì)詞語(yǔ)釋義的影響[J].外國(guó)語(yǔ),2017.(已錄用,待發(fā)表)