亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        連動(dòng)結(jié)構(gòu)的自動(dòng)識(shí)別和分析

        2013-12-10 07:46:02許有勝
        巢湖學(xué)院學(xué)報(bào) 2013年4期
        關(guān)鍵詞:句法結(jié)構(gòu)短語(yǔ)語(yǔ)義

        許有勝

        (中國(guó)石油大學(xué)對(duì)外漢語(yǔ)教學(xué)部,北京102249)

        1 引言

        本文主要是基于規(guī)則的方法,討論漢語(yǔ)中一種復(fù)雜謂語(yǔ)——連動(dòng)結(jié)構(gòu)的自動(dòng)識(shí)別以及分析的辦法,我們不奢求能解決所有問(wèn)題,我們的目標(biāo)有兩個(gè):一是如何識(shí)別出連動(dòng)結(jié)構(gòu),二是如何大致分析出同時(shí)關(guān)系連動(dòng)結(jié)構(gòu)還是異時(shí)關(guān)系連動(dòng)結(jié)構(gòu),如果是表示異時(shí)關(guān)系連動(dòng)結(jié)構(gòu),可以分辨出是順承關(guān)系連動(dòng)結(jié)構(gòu)還是有時(shí)間先后也兼表目的關(guān)系的連動(dòng)結(jié)構(gòu)。我們的目標(biāo)是在一個(gè)實(shí)際語(yǔ)料的語(yǔ)篇中,通過(guò)系統(tǒng)的自動(dòng)分析,辨析出連動(dòng)結(jié)構(gòu),以及連動(dòng)結(jié)構(gòu)的基本類型。大致的分析流程主要包括:分句規(guī)則→詞法分析→短語(yǔ)結(jié)構(gòu)分析→句法語(yǔ)義分析→分解規(guī)則→連動(dòng)結(jié)構(gòu)分析。

        2 各種識(shí)別規(guī)則

        對(duì)句子進(jìn)行識(shí)別,首先要切分小句。我們利用張衛(wèi)國(guó)(2003)的研究成果,可以將一整段話按照標(biāo)點(diǎn)符號(hào)將每個(gè)小句分行顯示,完成分句分析。這樣,就為我們?cè)谛【浠A(chǔ)上分析連動(dòng)結(jié)構(gòu)作好了前提條件和準(zhǔn)備。

        2.1 詞法分析

        提取出小句后,就需要對(duì)各個(gè)句子進(jìn)行詞法分析,包括自動(dòng)分詞和詞性標(biāo)注兩個(gè)方面。通過(guò)最大匹配法、最大概率法都可以達(dá)到很好的分詞效果;通過(guò)基于隱馬爾可夫模型的詞性標(biāo)注方法或者是基于轉(zhuǎn)換的錯(cuò)誤驅(qū)動(dòng)的詞性標(biāo)注方法①關(guān)于這兩種詞性標(biāo)注方法可以參看俞士汶,《計(jì)算語(yǔ)言學(xué)概論》,北京,商務(wù)印書(shū)館,2004。這些方法的標(biāo)注正確率可以達(dá)到95%以上,基本能滿足句法分析的需要。經(jīng)過(guò)自動(dòng)分詞處理和詞性標(biāo)注以后的語(yǔ)句,很多語(yǔ)言信息可以在此基礎(chǔ)上處理。如“把這篇報(bào)道編輯一下”,標(biāo)注以后的形式如下:

        把/p這/r篇/q報(bào)道/n編輯/v一/m 下/q②本文所采用詹衛(wèi)東(1999)的符號(hào)代碼,可以參看詹衛(wèi)東,《面向中文信息處理的現(xiàn)代漢語(yǔ)短語(yǔ)結(jié)構(gòu)規(guī)則研究》,北京,清華大學(xué)出版社,1999,第20頁(yè)。其中p表示介詞,r表示代詞,q表示量詞,n表示名詞,v表示動(dòng)詞,m表示動(dòng)量詞。

        2.2 短語(yǔ)層面的處理

        作為一個(gè)句法成分,很多語(yǔ)言分析是在短語(yǔ)層面進(jìn)行的,而對(duì)連動(dòng)結(jié)構(gòu)來(lái)說(shuō),尤其如此,如我們?cè)谟懻撨B動(dòng)結(jié)構(gòu)的時(shí)候是以動(dòng)詞短語(yǔ)為單位,而不能以動(dòng)詞為單位,如:

        他/n爬/v起來(lái)/v了/u。

        上面的例句中有兩個(gè)動(dòng)詞,但我們不能據(jù)此判斷這是一個(gè)連動(dòng)結(jié)構(gòu),我們只能以一個(gè)動(dòng)詞短語(yǔ)“爬起來(lái)”計(jì)算,判斷這是一個(gè)單動(dòng)結(jié)構(gòu)的謂語(yǔ)句。

        對(duì)短語(yǔ)層面的處理包括對(duì)短語(yǔ)邊界的界定和對(duì)短語(yǔ)性質(zhì)的界定兩個(gè)方面。對(duì)于短語(yǔ)邊界的界定,主要的方法有:基于規(guī)則、基于互信息、基于神經(jīng)元網(wǎng)絡(luò)、基于最大熵模型以及利用二叉樹(shù)剪枝等手段來(lái)識(shí)別。①分別參看郁梅(1994)、張國(guó)煊(1995)、奚晨海(2002)、李劍鋒(2004)、荀恩東(2006)等人著作。

        關(guān)于各種短語(yǔ)性質(zhì)界定,可以參見(jiàn)詹衛(wèi)東(1999)。

        短語(yǔ)中也可以鑲嵌短語(yǔ),標(biāo)注以后的一些形式如下:

        周仲偉/n[跑/v過(guò)去/v]vp[拉/v開(kāi)/v]vp了/u[[這/r道/q]rp門(mén)/n]np 。

        其中,“這道門(mén)”這個(gè)名詞性短語(yǔ)中鑲嵌了“這道”一個(gè)代詞性短語(yǔ)。

        2.3 句法結(jié)構(gòu)和語(yǔ)義分析

        在進(jìn)行句法結(jié)構(gòu)分析之前,要首先對(duì)句法結(jié)構(gòu)中缺省和省略的一些句法成分進(jìn)行還原處理。我們需要補(bǔ)出的主要是主語(yǔ)和論元兩個(gè)部分。

        2.3.1 補(bǔ)出主語(yǔ):

        構(gòu)成連動(dòng)結(jié)構(gòu)的一個(gè)基本要求就是多個(gè)動(dòng)詞性結(jié)構(gòu)只有一個(gè)共同的主語(yǔ),而連動(dòng)結(jié)構(gòu)的主語(yǔ)很多是在小句之外,給識(shí)別造成困難,這就要在小句外面找出該連動(dòng)結(jié)構(gòu)的主語(yǔ),幫助識(shí)別。如:

        (1)他走到擺著煙卷的黃銅橢圓桌子邊,從銀匣里撿了一枝雪茄煙燃著了。②本文例句大多選自茅盾《子夜》,例句后方括號(hào)數(shù)字為選自該書(shū)的章節(jié)數(shù)。

        “撿了一枝雪茄”和“燃著了”在小句范圍內(nèi)都沒(méi)有主語(yǔ),聯(lián)系前一個(gè)分句,這個(gè)主語(yǔ)應(yīng)該是“他”。

        2.3.2 補(bǔ)出動(dòng)詞的論元成分

        我們?cè)谶M(jìn)行自動(dòng)分析的時(shí)候很大程度是依靠動(dòng)詞的論元的語(yǔ)義角色的辨別,所以對(duì)于不是按照正常排位的句法序列,要將動(dòng)詞的論元調(diào)整和找回,以便于連動(dòng)結(jié)構(gòu)類型的識(shí)別,如:

        (2)“家里的貓食快吃完了,你再去超市買(mǎi)點(diǎn)回來(lái)來(lái)喂貓?!眿寢寣?duì)我說(shuō)。

        對(duì)于這個(gè)例句,我們不能按照常規(guī)的分析方式,而是要首先還原動(dòng)詞的語(yǔ)義角色的配位方式。應(yīng)該先把“貓食”抽取出來(lái),作為“買(mǎi)”的受事和“喂貓”的材料。這樣就是通過(guò)論元共享而關(guān)聯(lián)起來(lái)的連動(dòng)結(jié)構(gòu),我們可以判斷出這是表示目的關(guān)系的連動(dòng)結(jié)構(gòu)。否則,我們只能根據(jù)VP1是動(dòng)結(jié)式短語(yǔ)“買(mǎi)回來(lái)”判斷這是一個(gè)表示異時(shí)關(guān)系的連動(dòng)結(jié)構(gòu)。

        在完成對(duì)句法成分的補(bǔ)充處理以后,整個(gè)句子相對(duì)比較理想,各種成分也比較完整。在這個(gè)基礎(chǔ)上可以進(jìn)行句法分析(parsing)和語(yǔ)義角色標(biāo)注(semantic role annotation)。句法分析是指研究如何通過(guò)計(jì)算機(jī)算法得到自然語(yǔ)言句子的句法結(jié)構(gòu)。完成句法分析任務(wù)的計(jì)算機(jī)程序或軟件叫做句法分析器(parser)。句法分析器的主要功能是判斷輸入的自然語(yǔ)言的句子是否是句法上合法的句子,如果是句法上正確的句子,則輸出它們的句法結(jié)構(gòu)。如我們輸入一個(gè)句子 “王大栓去下窗板”(《茶館》),得到的句法分析的樹(shù)形圖如下:③此樹(shù)形圖見(jiàn)詹衛(wèi)東先生開(kāi)發(fā)“現(xiàn)代漢語(yǔ)句法樹(shù)庫(kù)”(TreeBank)。

        連動(dòng)結(jié)構(gòu)句法分析圖

        語(yǔ)義角色標(biāo)注主要是通過(guò)標(biāo)明在一個(gè)事件中扮演了不同參與者角色的有關(guān)語(yǔ)言成分,這種分析是基于動(dòng)詞的。把這種語(yǔ)義角色與動(dòng)詞的關(guān)系標(biāo)明出來(lái)后會(huì)對(duì)句法分析和語(yǔ)義信息的處理提供很大的方便。

        連動(dòng)結(jié)構(gòu)中語(yǔ)義角色標(biāo)注圖

        一種比較成熟的語(yǔ)義標(biāo)注方法是加州大學(xué) Gildea.D&Jurafsky.D(2002)提出的自動(dòng)標(biāo)注方法①參見(jiàn) Gildea,D,Jurafsky,D,“Automatic Labeling of Semantic Roles”,Computational Linguistics,NO3,245-288,2002。。這種標(biāo)注方法對(duì)于已經(jīng)切分了成分的語(yǔ)料在辨別語(yǔ)義角色時(shí)候,可以達(dá)到82%的正確率。而對(duì)于需要同時(shí)進(jìn)行片段切分和標(biāo)注語(yǔ)義角色的語(yǔ)料,可以達(dá)到65%的正確率和62%的召回率。

        在樹(shù)形圖上進(jìn)行語(yǔ)義角色標(biāo)注過(guò)的句子形式如下:②表示語(yǔ)義角色的符號(hào)請(qǐng)參看袁毓林(2006)。

        2.4 分解規(guī)則

        我們?cè)诓檎摇蹲右埂愤B動(dòng)結(jié)構(gòu)的同時(shí)也注意了和連動(dòng)結(jié)構(gòu)的形似句(多動(dòng)結(jié)構(gòu)的謂語(yǔ)),發(fā)現(xiàn)一個(gè)句子中的謂語(yǔ)里多動(dòng)結(jié)構(gòu)有以下幾種類型。

        2.4.1 與緊縮句的分解規(guī)則

        根據(jù)向若(1984)的歸納,緊縮句共有四種類型:

        主語(yǔ)相同的兩個(gè)謂語(yǔ)間有關(guān)聯(lián)詞語(yǔ),如:

        (3)主任答不上來(lái)就發(fā)了脾氣。

        主語(yǔ)不同的兩個(gè)謂語(yǔ)間沒(méi)有停頓,如:

        (4)你不問(wèn)我替你問(wèn)。

        單句形式前有連詞

        (5)就是世界上最快的馬也要落在背后。

        前后呼應(yīng)的緊縮復(fù)句

        (6)我不問(wèn)也明白八成。

        結(jié)合向若的分析,從形式上看,緊縮句可以分為兩類,一類是有標(biāo)記關(guān)聯(lián)的緊縮句,一類是沒(méi)有標(biāo)記的關(guān)聯(lián)。其中前者要占絕大多數(shù)。根據(jù)陳穎(2005)統(tǒng)計(jì),在選取的786個(gè)例句中,有標(biāo)記關(guān)聯(lián)的636個(gè),占81%,無(wú)標(biāo)記關(guān)聯(lián)的150個(gè),占19%。

        對(duì)于有標(biāo)記關(guān)聯(lián)的緊縮句,可以通過(guò)標(biāo)記詞語(yǔ)和詞性標(biāo)注,分解出來(lái)。對(duì)這些關(guān)聯(lián)標(biāo)記,我們可以窮盡地歸納出來(lái),關(guān)聯(lián)詞獨(dú)用的有“就、也、還、又、都、才”,成對(duì)使用的關(guān)聯(lián)詞有“一……就……、再……也……、不……也……、非……也……、不……不……、越……越……”等,③其中有些連詞是兼類詞,比如“一”,可以是數(shù)詞,在這里可以看作連詞,這些詞性分別可以通過(guò)詞性標(biāo)注解決。對(duì)于這些有標(biāo)記的緊縮句,可以利用這些標(biāo)記將他們分辨出來(lái)。即兩個(gè)動(dòng)詞性結(jié)構(gòu)之間總有關(guān)聯(lián)成分連接。

        對(duì)于沒(méi)有標(biāo)記關(guān)聯(lián)的緊縮句,它們的一個(gè)特點(diǎn)是兩個(gè)動(dòng)詞的主語(yǔ)不同,這類多動(dòng)結(jié)構(gòu)可以通過(guò)句法結(jié)構(gòu)分析和語(yǔ)義角色分析結(jié)合的辦法從連動(dòng)結(jié)構(gòu)中分解出去。如“你不問(wèn)我替你問(wèn)”中,在句法分析上,兩個(gè)小句并列:“你不問(wèn)”和“我替你問(wèn)”。第一個(gè)小句主語(yǔ)是“你”,第二個(gè)小句的主語(yǔ)是“我”。在語(yǔ)義角色分析上,第一個(gè)問(wèn)的施事是“你”,第二個(gè)“問(wèn)”的施事是“我”。

        2.4.2 與兼語(yǔ)句的分解規(guī)則

        兼語(yǔ)句的第一個(gè)動(dòng)詞后面必須要有一個(gè)名詞性成分(也就是身兼兩職的成分)。兼語(yǔ)句的另一個(gè)特點(diǎn)是它的第一個(gè)動(dòng)詞在意義上有很明顯的特征,具有[+使成]、[+命令]、[+命名]等特征。 而且這些動(dòng)詞是封閉的類,我們可以窮盡性列舉,形成一個(gè)“兼語(yǔ)動(dòng)詞”詞表,①我們通過(guò)對(duì)《漢語(yǔ)動(dòng)詞用法詞典》(商務(wù)印書(shū)館,1999)中1223個(gè)動(dòng)詞(2117個(gè)義項(xiàng))進(jìn)行統(tǒng)計(jì),得出一份可以作為兼語(yǔ)動(dòng)詞的詞表,共163個(gè)。在實(shí)際語(yǔ)料中,能作兼語(yǔ)動(dòng)詞的,可能不止我們列舉的這些動(dòng)詞。但這份詞表是開(kāi)放的,可以不斷添加新的詞語(yǔ)。如:“讓、叫、要、使、強(qiáng)迫、逼、催、督促、責(zé)成、縱容、惹、招、勸、吩咐、囑咐、告訴、指示、提拔、提升、分配、收、培養(yǎng)、派、打發(fā)、送、放、趕、分配”等。 這一點(diǎn)李臨定(1986)、邢欣(1995)有詳細(xì)論述。

        我們可以通過(guò)句法結(jié)構(gòu)與這種兼語(yǔ)動(dòng)詞匹配的方式進(jìn)行,即先掃描輸入的語(yǔ)料,如果掃描到“V1+NP+VP2”序列,再用V1與詞表匹配,如果是詞表中的詞語(yǔ),基本就可以確定是兼語(yǔ)句。如下面兩個(gè)句子:(1)我/n買(mǎi)/v一本書(shū)/np看/v;(2)他/n逼/v我/n/看/v書(shū)/n。第一個(gè)句子可以掃描到“vnpv”這樣的序列串,然后再拿v1與詞表進(jìn)行匹配,沒(méi)有發(fā)現(xiàn)“買(mǎi)”,可以斷定這不是一個(gè)兼語(yǔ)句,第二個(gè)句子可以先掃描出“vnpv”這樣的序列串,在匹配時(shí)候可以發(fā)現(xiàn)v1“逼”是詞表中收錄的一個(gè)動(dòng)詞,可以判斷出這是一個(gè)兼語(yǔ)句。

        2.4.3 與動(dòng)狀句的分解規(guī)則

        動(dòng)詞作狀語(yǔ)一般可以分為兩類,一種是后面有“地”作為標(biāo)記的,如:

        (7)他同情地望著這個(gè)傷病員。

        因?yàn)閰^(qū)別詞“地”的出現(xiàn),這類動(dòng)詞狀語(yǔ)句比較容易區(qū)別出來(lái),掃描句子中的VP是否有“V地V”格式,如果有,則判定是動(dòng)狀句。

        難辦的是動(dòng)詞直接作狀語(yǔ)的類型。在句法結(jié)構(gòu)的線性序列上與部分連動(dòng)結(jié)構(gòu)相似,如:

        (8)他先告辭/v走/v了(連動(dòng))

        (9)從龍?zhí)逗珗@鳥(niǎo)市買(mǎi)回15對(duì)虎皮鸚鵡試/v養(yǎng)/v。 (動(dòng)狀)

        對(duì)這類結(jié)構(gòu)的分解可以采用兩種規(guī)則,一是通過(guò)“詞表”匹配的辦法,根據(jù)孫德金(2000)在3036個(gè)動(dòng)詞的統(tǒng)計(jì)中,有36個(gè)單音節(jié)動(dòng)詞和78個(gè)雙音節(jié)動(dòng)詞可以直接做狀語(yǔ)。高增霞(2006)通過(guò)對(duì)2002年5月19日的《北京青年報(bào)》統(tǒng)計(jì),又得出19個(gè)雙音節(jié)動(dòng)詞可以直接作狀語(yǔ),我們?cè)谶@些動(dòng)詞的基礎(chǔ)上編制一份“詞表”,然后對(duì)V1與詞表進(jìn)行匹配。

        其次是“音節(jié)搭配規(guī)律”,根據(jù)孫德金(2000)的研究,動(dòng)詞作狀語(yǔ)在音節(jié)搭配上,基本上遵循著“單音節(jié)+單音節(jié)”“雙音節(jié)+雙音節(jié)”的組配模式。我們可以利用這一音節(jié)的組配模式作為辨別的輔助手段,可以排除象“告辭走了”一類句子。

        2.4.4 與動(dòng)詞聯(lián)合結(jié)構(gòu)的分解規(guī)則

        兩個(gè)動(dòng)詞組合在一起也可以形成聯(lián)合結(jié)構(gòu),如:

        (10)工廠開(kāi)發(fā)研制了一種新產(chǎn)品。

        (11)我們加工整理了一遍。

        聯(lián)合結(jié)構(gòu)沒(méi)有什么標(biāo)記,動(dòng)詞的語(yǔ)義特征上也不明顯,分解出來(lái)比較困難,我們這里采用吳云芳(2004)對(duì)“V+V”識(shí)別聯(lián)合結(jié)構(gòu)采取的方法。她先采用排除方法,縮小范圍:先討論什么情況下不能形成并列關(guān)系。這樣就排除了三分之二的“V+V”結(jié)構(gòu)。然后再討論什么情況下可以形成并列關(guān)系。(具體參見(jiàn)吳云芳2004)

        2.4.5 與謂賓結(jié)構(gòu)的分解規(guī)則

        朱德熙(1982)將謂賓動(dòng)詞分為真謂賓動(dòng)詞和準(zhǔn)謂賓動(dòng)詞,為了計(jì)算機(jī)識(shí)別的需要我們將謂賓動(dòng)詞重新調(diào)整分為兩類:一類是動(dòng)詞性結(jié)構(gòu)作賓語(yǔ)(包括單個(gè)動(dòng)詞、述賓結(jié)構(gòu)、述補(bǔ)結(jié)構(gòu)、連動(dòng)結(jié)構(gòu)、偏正結(jié)構(gòu)),一類帶小句賓語(yǔ),我們分別為它們建立詞表。

        我們收集的動(dòng)詞性結(jié)構(gòu)賓語(yǔ)的謂賓動(dòng)詞共有489個(gè),這種動(dòng)詞如果后接動(dòng)詞性結(jié)構(gòu),只能是謂賓結(jié)構(gòu)。V1如果是帶動(dòng)詞性結(jié)構(gòu)作賓語(yǔ)的動(dòng)詞,在形如“V1V2”結(jié)構(gòu)中,只能是動(dòng)詞性結(jié)構(gòu)作賓語(yǔ),而不可能是連動(dòng)結(jié)構(gòu)。如果是“V1N/NPV2”的序列,則不可能是謂詞賓語(yǔ)句。這樣,我們就可以對(duì)照詞表和句法結(jié)構(gòu)將該類謂賓結(jié)構(gòu)將帶動(dòng)詞性結(jié)構(gòu)賓語(yǔ)的句子直接掃描出來(lái)。

        帶了小句賓語(yǔ)的謂賓結(jié)構(gòu),一般會(huì)先掃描出“V1N(NP)V2”的字符串,其中的 N(NP)是賓語(yǔ)小句的主語(yǔ)。如果V1是可以帶小句賓語(yǔ)的動(dòng)詞,在“V1N(NP)V2”序列中,若 N(NP)是 V2 的一個(gè)論元,則這個(gè)句子是動(dòng)詞帶小句賓語(yǔ),如“觀察熱帶魚(yú)甩子”;若N(NP)是V1的論元,則這個(gè)句子不是小句作賓語(yǔ)。

        3 連動(dòng)結(jié)構(gòu)的分析

        3.1 連動(dòng)結(jié)構(gòu)的結(jié)構(gòu)特征

        連動(dòng)結(jié)構(gòu)按照時(shí)間關(guān)系,可以分為同時(shí)、異時(shí)和泛時(shí)關(guān)系。若幾個(gè)動(dòng)詞性詞組之間有先后關(guān)系,則稱為異時(shí)關(guān)系連動(dòng)結(jié)構(gòu);若動(dòng)詞性詞組表達(dá)的動(dòng)作或狀態(tài)大致同時(shí)發(fā)生,則稱為同時(shí)關(guān)系連動(dòng)結(jié)構(gòu)。如果細(xì)分,先后關(guān)系連動(dòng)結(jié)構(gòu)還可以分為順承關(guān)系和目的關(guān)系連動(dòng)結(jié)構(gòu)。目的關(guān)系則可以分為位移、工具等下位類型的連動(dòng)結(jié)構(gòu)。分不出同時(shí)或先后關(guān)系的連動(dòng)結(jié)構(gòu)是泛時(shí)關(guān)系連動(dòng)結(jié)構(gòu)。

        各種不同類型的連動(dòng)結(jié)構(gòu)有以下幾個(gè)特點(diǎn):

        其一,不同連動(dòng)結(jié)構(gòu)的動(dòng)詞性詞組之間有一些不同的形式特征,如異時(shí)關(guān)系的體標(biāo)記“了”,同時(shí)關(guān)系的持續(xù)體標(biāo)記“著”、“在”等一些“特征詞/字”;異時(shí)關(guān)系連動(dòng)結(jié)構(gòu)中VP1中的結(jié)果補(bǔ)語(yǔ)等。

        其二,連動(dòng)結(jié)構(gòu)各個(gè)動(dòng)詞性詞組存在不少省略成分,如主語(yǔ)和論元。

        其三,對(duì)于多于兩個(gè)動(dòng)詞詞組的連動(dòng)結(jié)構(gòu),存在先后組合的層次問(wèn)題,如:

        (12)姚太太拄著拐杖站起來(lái)迎接,問(wèn)來(lái)客姓名。

        “拄著拐杖”、“站起來(lái)”和“迎接”是三個(gè)動(dòng)作,“拄著拐杖”和“站起來(lái)”先組合為一個(gè)同時(shí)關(guān)系連動(dòng)結(jié)構(gòu),然后“拄著拐杖站起來(lái)”和“迎接”再組合,形成先后關(guān)系的連動(dòng)結(jié)構(gòu)。

        泛時(shí)關(guān)系連動(dòng)結(jié)構(gòu)結(jié)構(gòu)數(shù)量較少,就我們?cè)凇蹲右埂分械慕y(tǒng)計(jì),泛時(shí)連動(dòng)結(jié)構(gòu)占了整個(gè)連動(dòng)結(jié)構(gòu)的13.5%。

        我們?cè)谙挛闹兄饕懻搶?duì)異時(shí)和同時(shí)連動(dòng)結(jié)構(gòu)的識(shí)別和分析。

        3.2 利用“形式特征”進(jìn)行的處理

        從形式上看,各類連動(dòng)結(jié)構(gòu)大多有形式上的特征,可資我們利用的有時(shí)體標(biāo)記、句法結(jié)構(gòu)特征(如動(dòng)結(jié)式)等。根據(jù)我們的研究,VP1在形式標(biāo)記上比較明顯,而VP2的形式標(biāo)記則不容易作出歸納,所以決定連動(dòng)結(jié)構(gòu)類型主要依靠VP1的形式特征,我們主要考察VP1的形式特征,而沒(méi)有過(guò)多關(guān)注VP2的形式特征。

        VP1形式特征主要有以下一些:

        3.2.1 “了”

        (13)末后就開(kāi)了房門(mén)出去。

        連動(dòng)結(jié)構(gòu)中兩個(gè)動(dòng)詞性結(jié)構(gòu)之間出現(xiàn) “了”的一律可以認(rèn)為是在時(shí)間上表示異時(shí)關(guān)系。

        3.2.2 動(dòng)結(jié)式短語(yǔ)

        動(dòng)結(jié)式短語(yǔ)由兩部分組成,前一部分表示一個(gè)動(dòng)作,后一部分表示因?yàn)榍耙粋€(gè)動(dòng)作而產(chǎn)生的結(jié)果。我們這里所說(shuō)的動(dòng)結(jié)式是廣義的,也包括動(dòng)趨式,如“爬起來(lái)、走回去”等。

        通過(guò)檢索《現(xiàn)代漢語(yǔ)語(yǔ)法信息詞典》,我們可以知道哪些動(dòng)詞可以帶結(jié)果補(bǔ)語(yǔ),哪些形容詞、動(dòng)詞可以作結(jié)果補(bǔ)語(yǔ)??梢宰鹘Y(jié)果補(bǔ)語(yǔ)的單音節(jié)形容詞204個(gè),單音節(jié)動(dòng)詞112個(gè)。形容詞如“笨、昏、蒙、呆、乖、傻、好、壞”等,動(dòng)詞如“懂、累、忘、通、怕、迷、煩”等。

        動(dòng)趨式結(jié)構(gòu)可以通過(guò)趨向動(dòng)詞來(lái)判斷,大家認(rèn)定的趨向動(dòng)詞基本包括下面24個(gè),如“上、下、來(lái)、去、上來(lái)、下來(lái)”等。

        3.2.3 動(dòng)詞的短時(shí)體(簡(jiǎn)單重疊形式)和瞬間完成體“一”

        動(dòng)詞的簡(jiǎn)單重疊形式和動(dòng)詞前的準(zhǔn)瞬間完成體標(biāo)記“一”在時(shí)間上都有一個(gè)終結(jié)點(diǎn),當(dāng)連動(dòng)結(jié)構(gòu)的VP1出現(xiàn)這些標(biāo)記的時(shí)候,都是表明第一個(gè)動(dòng)作發(fā)生以后才會(huì)發(fā)生第二個(gè)動(dòng)作,如:

        (14)宋教授看看苗情以后說(shuō)。

        (15)他一聽(tīng)以后非常驚慌。

        3.2.4 “著”

        “著”作為一種靜態(tài)持續(xù)體的標(biāo)記,表示伴隨著VP2發(fā)生的動(dòng)作的同時(shí)發(fā)生了VP1的動(dòng)作。雖然“V1著V2”的形式可以表示兩種類型的連動(dòng)結(jié)構(gòu):既可以表示伴隨狀況的連動(dòng)結(jié)構(gòu),也可以表示異時(shí)關(guān)系的連動(dòng)結(jié)構(gòu)。前者如“閉著眼睛說(shuō)瞎話”,后者如“留著喂狗”等。至于兩者的區(qū)分可以再利用“語(yǔ)義角色”來(lái)加以區(qū)分,但“著”作為一個(gè)表示同時(shí)關(guān)系的連動(dòng)結(jié)構(gòu)的可能條件,不失為判斷表示同時(shí)關(guān)系連動(dòng)結(jié)構(gòu)的一個(gè)重要的形式特征。

        3.2.5 動(dòng)詞的復(fù)雜重疊

        動(dòng)詞的復(fù)雜重疊形式作為連動(dòng)結(jié)構(gòu)的第一個(gè)動(dòng)詞性結(jié)構(gòu),表示動(dòng)作連續(xù)不斷,可以作為VP2表示的動(dòng)作的伴隨狀況,所以掃描到VP1是動(dòng)詞的復(fù)雜重疊形式的連動(dòng)結(jié)構(gòu)即可以判斷這種連動(dòng)結(jié)構(gòu)表示同時(shí)關(guān)系。根據(jù)陳前瑞(2003)統(tǒng)計(jì),這種復(fù)雜重疊從形式上看有以下幾種:“V1V1V2V2(蹦蹦跳跳)、V 來(lái) V 去(走來(lái)走去)、V1了 V2,V2了 V1(打了談,談了打)、一 V 一 V(一拐一拐)、VV(V 為雙音節(jié)動(dòng)詞,走動(dòng)走動(dòng))、V了又V(說(shuō)了又說(shuō))”。

        此外,限定性定語(yǔ)、名/動(dòng)量補(bǔ)語(yǔ)等也可以作為判斷連動(dòng)結(jié)構(gòu)時(shí)間類型的形式上的判斷標(biāo)準(zhǔn)。

        3.3 利用“語(yǔ)義角色”進(jìn)行的處理

        語(yǔ)義關(guān)系也可以對(duì)結(jié)構(gòu)類型的辨別起到一定的作用。

        3.3.1 通過(guò)語(yǔ)義角色來(lái)分解目的關(guān)系連動(dòng)結(jié)構(gòu)的下位類型

        在表示時(shí)間先后關(guān)系的連動(dòng)結(jié)構(gòu)中,如果兩個(gè)動(dòng)詞之間有共享的論元,則基本上可以判定是表示目的的連動(dòng)結(jié)構(gòu)。分析共享論元分別是V1和V2的什么語(yǔ)義角色,可以幫助我們判斷出目的關(guān)系連動(dòng)結(jié)構(gòu)的下位類型。

        3.3.2 通過(guò)語(yǔ)義角色可以分解不同類型的連動(dòng)結(jié)構(gòu)

        “V1著V2”可以表示兩種不同類型的連動(dòng)結(jié)構(gòu),目的關(guān)系和伴隨狀況。如:“留著那些飯喂狗”與 “閉著眼睛休息”。它們?cè)诰浞ㄐ问缴贤耆嗤?,沒(méi)有辦法通過(guò)形式特征來(lái)識(shí)別。但這兩者在語(yǔ)義角色上有很多的不同,表示目的關(guān)系的“V1著V2”存在著共享的論元,“飯”是“留”的受事,同時(shí)又是“喂”的耗費(fèi)材料。而表示伴隨狀況的“V1著 V2”則不存在論元共享,“眼睛”是“閉”的受事,與“休息”之間沒(méi)有直接的語(yǔ)義聯(lián)系。

        4 連動(dòng)結(jié)構(gòu)的自動(dòng)分析

        4.1 連動(dòng)結(jié)構(gòu)的分析模型

        根據(jù)上面的分析,我們建立的連動(dòng)結(jié)構(gòu)的分析模型,總共分為六個(gè)大的模塊,各自負(fù)責(zé)一些功能,可以如下圖所示:

        連動(dòng)結(jié)構(gòu)分析模型圖

        4.2 連動(dòng)結(jié)構(gòu)的分析算法

        連動(dòng)結(jié)構(gòu)的算法可以用下面的自然語(yǔ)言描述出來(lái):

        Step1:進(jìn)行篇章掃描,掃描出具有分句作用的標(biāo)點(diǎn)符號(hào),然后作出切分,另起一行輸入,得到各個(gè)小句;

        Step2:進(jìn)行小句掃描,對(duì)小句中的詞語(yǔ)進(jìn)行自動(dòng)切分和詞性標(biāo)注。

        Step3:對(duì)已經(jīng)詞法處理過(guò)的句子進(jìn)行短語(yǔ)層面的處理,即界定出短語(yǔ)并對(duì)短語(yǔ)的性質(zhì)進(jìn)行判斷。

        Step4:先對(duì)小句進(jìn)行句法成分還原處理,找回缺省和省略的成分,盡量保持一個(gè)完整的理想的句法結(jié)構(gòu);然后進(jìn)行句法結(jié)構(gòu)分析,切分出句子的主語(yǔ)和謂語(yǔ);以連動(dòng)結(jié)構(gòu)中的動(dòng)詞為核心,作出語(yǔ)義角色的標(biāo)注。

        Step5:對(duì)作過(guò)切分和詞性標(biāo)注的句子進(jìn)行句法結(jié)構(gòu)分析。

        Step6:對(duì)句子的謂語(yǔ)再次進(jìn)行掃描,如果有多于兩個(gè)動(dòng)詞的,則作為備查對(duì)象,另外儲(chǔ)存起來(lái)。

        Step7:調(diào)用形似句的分解規(guī)則,排除出是以緊縮結(jié)構(gòu)、兼語(yǔ)結(jié)構(gòu)、動(dòng)詞性并列結(jié)構(gòu)、動(dòng)詞作狀語(yǔ)、以及謂賓結(jié)構(gòu)作謂語(yǔ)的句子,保留剩下來(lái)的句子,即連動(dòng)結(jié)構(gòu)作謂語(yǔ)的句子。

        Step8:對(duì)連動(dòng)結(jié)構(gòu)進(jìn)行順向和逆向多次掃描,結(jié)合能掃描出的形式特征,查詢特征規(guī)則庫(kù),得出這種類型時(shí)間關(guān)系,如果沒(méi)有形式上的特征,結(jié)合語(yǔ)義角色關(guān)系進(jìn)行判斷;對(duì)于已經(jīng)判斷出時(shí)間類型的連動(dòng)結(jié)構(gòu),再利用語(yǔ)義角色上一些特征,判斷該種時(shí)間類型連動(dòng)結(jié)構(gòu)的下位語(yǔ)義關(guān)系。

        Step9:如果n=2,則分析到Step7已經(jīng)完成了整個(gè)分析過(guò)程;如果n>2,則首先順次掃描前動(dòng)詞性結(jié)構(gòu),根據(jù)先同時(shí),后異時(shí);異時(shí)關(guān)系連動(dòng)結(jié)構(gòu)按照句法出現(xiàn)先后順序兩兩組合;同時(shí)關(guān)系連動(dòng)結(jié)構(gòu)按照伴隨狀況的動(dòng)詞性結(jié)構(gòu)和前景化動(dòng)詞性結(jié)構(gòu)分別組合;完成連動(dòng)結(jié)構(gòu)的最后分析。

        最后,根據(jù)分析的結(jié)構(gòu),畫(huà)出連動(dòng)結(jié)構(gòu)的關(guān)系類型圖。

        5 自動(dòng)分析示例

        我們根據(jù)上面的算法,給出兩個(gè)例子的分析過(guò)程(一個(gè)三個(gè)動(dòng)詞詞組的同類組合,一個(gè)四個(gè)動(dòng)詞詞組的異類組合)。

        我們分析的例句是“我十分高興,爬起來(lái)到客廳接電話。”這是《王朔文集》中的一個(gè)句子,分析結(jié)果如下:

        Step1分析結(jié)果:將句子“我十分高興”和“爬起來(lái)到客廳接電話”都分離出來(lái),作為一個(gè)單獨(dú)的小句。

        Step2分析結(jié)果:將句子中的詞語(yǔ)自動(dòng)切分出來(lái)并進(jìn)行了詞性標(biāo)注。得到結(jié)果如下:

        我/r十分/d高興/a,

        爬/v起來(lái)/v到/v客廳/n接/v電話/n。

        Step3分析結(jié)果:對(duì)詞語(yǔ)串進(jìn)行短語(yǔ)層面的組合,上面兩個(gè)句子則被標(biāo)記如下:

        我/r十分高興/ap,

        爬起來(lái)/vp到客廳/vp接電話/vp。

        Step4分析結(jié)果:通過(guò)句法還原處理,上面一個(gè)分句沒(méi)有改變,下面一個(gè)小句則把主語(yǔ)“我”給還原回來(lái)了。變成了:

        (我/r) 爬起來(lái)/vp 到客廳/vp 接電話/vp。

        Step5分析結(jié)果:對(duì)小句進(jìn)行句法結(jié)構(gòu)分析,得出:

        我/r||十分高興/ap

        (我/r)||爬起來(lái)/vp 到客廳/vp 接電話/vp。

        Step6分析結(jié)果:對(duì)小句謂語(yǔ)部分掃描,因?yàn)榈谝粋€(gè)小句的謂語(yǔ)只有一個(gè)形容詞短語(yǔ),所以可以排除;對(duì)下一個(gè)小句的謂語(yǔ)進(jìn)行掃描,里面包含了三個(gè)動(dòng)詞性結(jié)構(gòu),作為備查對(duì)象保存起來(lái)。

        Step7分析結(jié)果:將 “爬起來(lái)/vp 到客廳/vp接電話/vp”分成兩個(gè)結(jié)構(gòu)體“爬起來(lái)/vp 到客廳/vp”和“到客廳/vp 接電話/vp”與連動(dòng)結(jié)構(gòu)形似句進(jìn)行比照,不能將其歸入其中任何一類,如兩個(gè)結(jié)構(gòu)體都沒(méi)有緊縮句的標(biāo)記,所以不屬于緊縮句;“爬”和“到”都不是兼語(yǔ)結(jié)構(gòu)第一個(gè)動(dòng)詞的特征,所以排除了兼語(yǔ)結(jié)構(gòu)的可能;“爬”和“到”均不是可作狀語(yǔ)動(dòng)詞,且兩個(gè)詞后面都有后續(xù)成分,所以不是動(dòng)詞狀語(yǔ)結(jié)構(gòu),同時(shí)也可以排除并列結(jié)構(gòu)和謂賓句的可能。所以可以判斷出這是一個(gè)由三個(gè)動(dòng)詞性結(jié)構(gòu)組成的連動(dòng)結(jié)構(gòu)。

        Step8分析結(jié)果:以動(dòng)詞為中心進(jìn)行語(yǔ)義標(biāo)注可以形成下面的形式:

        [爬/v1起來(lái)/v]vp [到v2客廳/nGO2L3]vp[接v3電話/RE]vp

        Step9分析結(jié)果:因?yàn)閚>3,所以依次相臨兩個(gè)動(dòng)詞性結(jié)構(gòu)組合一次,“[爬/v1起來(lái)/v]vp[到v2客廳/nGO2L3]vp”和“[到 v2 客廳/nGO2L3]vp[接v3電話/RE]vp”根據(jù)形式特征和語(yǔ)義特征,可以判斷出前兩個(gè)動(dòng)詞性結(jié)構(gòu)之間的關(guān)系是時(shí)間先后關(guān)系,因?yàn)椤芭榔饋?lái)”是一個(gè)動(dòng)結(jié)式短語(yǔ);后兩個(gè)動(dòng)詞性結(jié)構(gòu)之間也是時(shí)間先后的連動(dòng)結(jié)構(gòu),而且兩者之間有目的關(guān)系,兩者共享一個(gè)論元“客廳”。這類聯(lián)合結(jié)構(gòu)屬于同類組合,所以依次組合,可以得出這樣的關(guān)系類型圖:

        6 結(jié)束語(yǔ)

        連動(dòng)結(jié)構(gòu)屬于復(fù)雜的句法形式,涉及到一個(gè)結(jié)構(gòu)體中含有多個(gè)動(dòng)詞,在句法形式上也有很多的形似句,因而對(duì)于自動(dòng)識(shí)別來(lái)說(shuō)是個(gè)難題,我們提供的方案只是一種基于“規(guī)則識(shí)別”的思路,是通過(guò)對(duì)連動(dòng)結(jié)構(gòu)在漢語(yǔ)本體的分析研究基礎(chǔ)上,建立了一系列的規(guī)則,如與相似句的分解規(guī)則、利用形式特征和語(yǔ)義角色來(lái)進(jìn)行類型識(shí)別的規(guī)則等。當(dāng)然,我們的規(guī)則不可能解決全部的問(wèn)題,很多環(huán)節(jié)的處理還不能達(dá)到理想的效果,如對(duì)語(yǔ)義角色的標(biāo)注問(wèn)題。一個(gè)環(huán)節(jié)的問(wèn)題沒(méi)解決,就會(huì)帶來(lái)后面一系列問(wèn)題的處理。但這是一種解決問(wèn)題思路,具體的每個(gè)模塊的操作都是可以逐步完善的。

        [1]陳穎.緊縮句的有標(biāo)關(guān)聯(lián)和無(wú)標(biāo)關(guān)聯(lián)[D].武漢:華中科技大學(xué),2005.

        [2]高增霞.現(xiàn)代漢語(yǔ)連動(dòng)式的語(yǔ)法化視角[M].北京:中國(guó)檔案出版社,2006.

        [3]李劍鋒,等.基于最大熵模型的韻律短語(yǔ)邊界預(yù)測(cè)[J].中文信息學(xué)報(bào),2004,(5).

        [4]李臨定.現(xiàn)代漢語(yǔ)句型[M].北京:商務(wù)印書(shū)館,1986.

        [5]孫德金.現(xiàn)代漢語(yǔ)動(dòng)詞做狀語(yǔ)考察[J].語(yǔ)言教學(xué)與研究,1997,(3).

        [6]吳云芳.V+V 形成的并列結(jié)構(gòu)[J].語(yǔ)言研究,2004,(3).

        [7]奚晨海,孫茂松.基于神經(jīng)元網(wǎng)絡(luò)的漢語(yǔ)短語(yǔ)邊界識(shí)別[J].中文信息學(xué)報(bào),2002,(2).

        [8]向若.緊縮句[M].上海:上海教育出版社,1984.

        [9]邢欣.致使動(dòng)詞的配價(jià)[A].沈陽(yáng),鄭定歐編.現(xiàn)代漢語(yǔ)配價(jià)語(yǔ)法研究[C].北京:北京大學(xué)出版社,1996.

        [10]荀恩東,等.應(yīng)用二叉樹(shù)剪枝識(shí)別韻律短語(yǔ)邊界[J].中文信息學(xué)報(bào),2006,(3).

        [11]郁梅,等.基于規(guī)則的漢語(yǔ)短語(yǔ)邊界劃分的研究[J].蘇州大學(xué)學(xué)報(bào)(自然科學(xué)版),1994,(3).

        [12]俞士汶.計(jì)算語(yǔ)言學(xué)概論[M].北京:商務(wù)印書(shū)館,2004.

        [13]俞士汶.現(xiàn)代漢語(yǔ)語(yǔ)法信息詞典[M].北京:清華大學(xué)出版社,1998.

        [14]袁毓林,等.編制語(yǔ)義角色框架文檔的規(guī)范(未發(fā)表).2006.

        [15]詹衛(wèi)東.面向中文信息處理的現(xiàn)代漢語(yǔ)短語(yǔ)結(jié)構(gòu)規(guī)則研究[M].北京:清華大學(xué)出版社,1999.

        [17]張國(guó)煊,等.基于互信息的漢語(yǔ)短語(yǔ)邊界劃分[J].杭州電子工業(yè)學(xué)院學(xué)報(bào),1995,(1).

        [18]張衛(wèi)國(guó).ICON語(yǔ)言教程[M].北京:清華大學(xué)出版社,2003.

        [19]Gildea,D,Jurafsky,D.Automatic Labeling of Semantic Roles[J].Computational Linguistics,2002,(3).

        猜你喜歡
        句法結(jié)構(gòu)短語(yǔ)語(yǔ)義
        語(yǔ)言與語(yǔ)義
        現(xiàn)代漢語(yǔ)句法結(jié)構(gòu)解讀
        山西青年(2017年7期)2017-01-29 18:25:26
        《基本句法結(jié)構(gòu):無(wú)特征句法》評(píng)介
        “上”與“下”語(yǔ)義的不對(duì)稱性及其認(rèn)知闡釋
        認(rèn)知范疇模糊與語(yǔ)義模糊
        回避沖突:名詞義與句法結(jié)構(gòu)義之間
        構(gòu)詞派生:語(yǔ)義關(guān)系與句法結(jié)構(gòu)
        語(yǔ)義分析與漢俄副名組合
        丁香美女社区| 天堂a版一区二区av| 久久精品国产亚洲片| 精品国产亚洲av久一区二区三区| 色播视频在线观看麻豆| 精品福利一区二区三区蜜桃| 国产69精品久久久久777| 毛片a级毛片免费观看| 国产色诱视频在线观看| 亚洲欧美日韩国产精品网| 日本久久精品国产精品| 日本精品久久不卡一区二区| 国产办公室秘书无码精品99| 韩国无码av片在线观看网站| 精品久久久久中文字幕APP| 久久AⅤ天堂Av无码AV| 久久久亚洲精品蜜臀av| 国产在线一区二区av| 中文无码成人免费视频在线观看| 人妻少妇av中文字幕乱码| 热久久亚洲| 加勒比东京热综合久久| 无色码中文字幕一本久道久| 少妇夜夜春夜夜爽试看视频| 国产影片中文字幕| 男人的天堂av网站一区二区| 中文字幕色婷婷在线视频| 国产一区二区精品亚洲| 真实国产老熟女无套中出| 麻豆一区二区99久久久久| 亚洲国产成人精品激情资源9| 国产午夜福利av在线麻豆| 亚洲成年国产一区二区| 日日麻批免费40分钟无码| 特级做a爰片毛片免费看无码| 999精品免费视频观看| 亚洲一区二区三区麻豆| 蜜桃视频在线免费观看| 天堂网www资源在线| 亚洲色大成网站www尤物| 九九在线精品视频xxx|