王步康,王紅玲,袁曉虹,周?chē)?guó)棟
(蘇州大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,江蘇 蘇州 215006;江蘇省計(jì)算機(jī)信息處理技術(shù)重點(diǎn)實(shí)驗(yàn)室,江蘇 蘇州 215006)
當(dāng)前根據(jù)采用的句法分析結(jié)果,自動(dòng)語(yǔ)義角色標(biāo)注(Semantic Role Labeling, SRL)可分為:基于短語(yǔ)結(jié)構(gòu)句法分析的語(yǔ)義角色標(biāo)注和基于依存結(jié)構(gòu)句法分析的語(yǔ)義角色標(biāo)注。針對(duì)前者的研究已較為成熟,并取得了很好的性能,然而伴隨此方法的發(fā)展帶來(lái)的瓶頸問(wèn)題也日漸突出,如局部模型的機(jī)器學(xué)習(xí)方法很難有更大進(jìn)展,語(yǔ)料的稀疏問(wèn)題嚴(yán)重,更有效的特征難以抽取等等,導(dǎo)致了性能無(wú)法進(jìn)一步提高。因此近兩年來(lái)基于依存句法的語(yǔ)義角色標(biāo)注開(kāi)始受到重視,尤其是CoNLL2008 shared task[1]和CoNLL2009 shared task[2]都將基于依存關(guān)系的SRL作為評(píng)測(cè)主題,推進(jìn)了基于依存句法的語(yǔ)義角色標(biāo)注的發(fā)展。
依存結(jié)構(gòu)句法分析相比于短語(yǔ)結(jié)構(gòu)句法分析,它表達(dá)的句法結(jié)構(gòu)是單詞與單詞之間的依賴(lài)關(guān)系。從理論上分析,依存句法中的句法—語(yǔ)義接口更簡(jiǎn)單、更直觀,并提供了更透明的謂詞—論元關(guān)系表達(dá)。因此在基于短語(yǔ)結(jié)構(gòu)句法分析的語(yǔ)義角色標(biāo)注系統(tǒng)遭遇到發(fā)展瓶頸后,研究基于依存結(jié)構(gòu)句法分析的語(yǔ)義角色標(biāo)注更具有現(xiàn)實(shí)意義。
本文采用英文語(yǔ)義角色標(biāo)注的研究方法,使用中文依存句法分析,構(gòu)建了一個(gè)中文語(yǔ)義角色標(biāo)注系統(tǒng)。文章第2部分簡(jiǎn)述了基于依存關(guān)系的SRL的相關(guān)工作。第3部分介紹了基于依存句法的中文語(yǔ)義角色標(biāo)注系統(tǒng),重點(diǎn)描述構(gòu)建系統(tǒng)的各個(gè)步驟,基礎(chǔ)特征和擴(kuò)展特征。第4部分給出了各個(gè)擴(kuò)展特征的表現(xiàn),并對(duì)實(shí)驗(yàn)結(jié)果進(jìn)行了分析和比較。最后第5部分對(duì)本文進(jìn)行了總結(jié),并對(duì)后期工作進(jìn)行了展望。
和基于短語(yǔ)結(jié)構(gòu)句法分析的SRL相比,基于依存分析的SRL研究相對(duì)較少。在英文方面,Hacioglu等[3]首次采用基于依存分析的方法來(lái)實(shí)現(xiàn)語(yǔ)義角色標(biāo)注,所使用的依存樹(shù)是由句法樹(shù)轉(zhuǎn)化而來(lái),采用SVM分類(lèi)器實(shí)現(xiàn)了角色的分類(lèi),提出了12個(gè)特征(依存關(guān)系,位置,中心詞,依賴(lài)詞等),并且表明謂詞相關(guān)信息的重組對(duì)性能影響很大。最終在基于手工依存分析語(yǔ)料庫(kù)Depbank和CoNLL2004 shared task語(yǔ)料庫(kù)上的F1值分別為84.6%和79.8%。而最新的基于依存關(guān)系的SRL研究出現(xiàn)在CoNLL2008評(píng)測(cè)中,具有代表性的工作是Johansson等[4-5]的研究,在文中詳細(xì)分析比較了兩種SRL系統(tǒng)在PropBank語(yǔ)料上的性能,文章的貢獻(xiàn)在于分別使用基于部分短語(yǔ)的(Segment-Based)和基于依存關(guān)系(Dependency-Based)的衡量標(biāo)準(zhǔn)來(lái)公平地比較代表當(dāng)前最好性能的兩類(lèi)SRL系統(tǒng)的性能。他們實(shí)現(xiàn)的基于依存句法的SRL系統(tǒng)在上述兩項(xiàng)衡量標(biāo)準(zhǔn)下F1值分別為77.97%(WSJ+Brown)和84.29%(CoNLL2008測(cè)試集)。
到目前為止,還未有文獻(xiàn)報(bào)告基于依存句法分析的中文語(yǔ)義角色標(biāo)注研究。正在進(jìn)行的CoNLL 2009 shared task是在CoNLL2008 shared task的基礎(chǔ)上,進(jìn)行包括中文在內(nèi)的多種語(yǔ)言的依存句法和語(yǔ)義的聯(lián)合分析,最新結(jié)果顯示在中文上使用CoNLL2009評(píng)測(cè)語(yǔ)料達(dá)到的最好SRL系統(tǒng)性能是78.60%(Labeled F1值)。在基于短語(yǔ)結(jié)構(gòu)句法分析的SRL方面,代表工作是Xue等[6-7]的研究,其主要工作是比較和分析了中文和英文語(yǔ)義角色標(biāo)注的性能以及影響因素,在Chinese Propbank上的實(shí)驗(yàn)結(jié)果表明:基于手工標(biāo)注句法樹(shù)的SRL系統(tǒng)F1值可達(dá)91.3%;基于單一自動(dòng)標(biāo)注句法樹(shù),F(xiàn)1值大幅降為61.3%。這說(shuō)明基于手工分析的中文語(yǔ)義角色標(biāo)注的系統(tǒng)結(jié)果基本與英文的相當(dāng),甚至稍微高出一點(diǎn);但對(duì)于自動(dòng)產(chǎn)生的句法樹(shù),結(jié)果要比英文的差得多。
盡管目前針對(duì)中文的依存句法分析研究很多,但是尚未出現(xiàn)通用的大規(guī)模標(biāo)注的中文依存關(guān)系語(yǔ)料庫(kù)。當(dāng)然也沒(méi)有大規(guī)模標(biāo)注的基于依存關(guān)系的語(yǔ)義角色標(biāo)注語(yǔ)料。因此要進(jìn)行基于依存句法的自動(dòng)語(yǔ)義分析研究,首先要解決語(yǔ)料庫(kù)的來(lái)源問(wèn)題。
為了便于評(píng)測(cè)比較,系統(tǒng)使用了兩種語(yǔ)料資源。一種是轉(zhuǎn)換語(yǔ)料(下文又稱(chēng)CTB轉(zhuǎn)換語(yǔ)料),獲得方法類(lèi)似于CoNLL2008 shared task的語(yǔ)料獲得,基本語(yǔ)料庫(kù)是Chinese TreeBank5.0,標(biāo)注信息來(lái)源于PropBank1.0,并且只針對(duì)動(dòng)詞性謂詞標(biāo)注語(yǔ)義角色。借助MaltParser*http://w3.msi.vxu.se/~nivre/research/MaltParser.html工具將基于短語(yǔ)結(jié)構(gòu)的句法樹(shù)庫(kù)轉(zhuǎn)換成依存關(guān)系樹(shù)庫(kù),并使用Penn2Malt[1]工具將語(yǔ)料轉(zhuǎn)換成CoNLL2008標(biāo)注的格式。實(shí)驗(yàn)選取CTB中的前760篇文檔(chtb_001.fid到chtb_931.fid),共10 364個(gè)句子,其中(chtb_100.fid到chtb_931.fid)中9 127 個(gè)句子作為訓(xùn)練語(yǔ)料,共有謂詞32 387個(gè);(chtb_001.fid到chtb_099.fid)中共 1 238個(gè)句子作為測(cè)試語(yǔ)料,共有謂詞4 793個(gè)。
圖1 中文依存關(guān)系樹(shù)實(shí)例圖
另一種語(yǔ)料是CoNLL2009 shared task提供的,其中訓(xùn)練集有句子22 277句,謂詞102 813個(gè),使用開(kāi)發(fā)集*由于CoNLL2009 shared task提供的測(cè)試集還沒(méi)有公布Gold標(biāo)注,所以我們用開(kāi)發(fā)集充當(dāng)測(cè)試集。作為測(cè)試語(yǔ)料,共有句子1 762句,含有的謂詞數(shù)為8 103個(gè)。該語(yǔ)料是CTB6.0的一個(gè)子集,語(yǔ)義信息則源自Chinese PropBank 2.0。
下面給出了轉(zhuǎn)換語(yǔ)料中的一個(gè)例子,圖1給出了例句的中文依存關(guān)系樹(shù)圖,圖中ARG表示謂詞角色,W表示單詞,R表示依存關(guān)系,G表示詞性。
例:中國(guó)進(jìn)出口銀行與中國(guó)銀行加強(qiáng)(.01)合作。
在例句中只有一個(gè)謂詞:加強(qiáng),其中(.01)表示這個(gè)謂詞的詞義,該詞義是Chinese PropBank中謂詞“加強(qiáng)”在框架語(yǔ)義中對(duì)應(yīng)的詞義項(xiàng)編號(hào)。
本文構(gòu)建的基于依存關(guān)系的中文SRL系統(tǒng)其標(biāo)注過(guò)程分成了四個(gè)部分(如圖2所示):謂詞標(biāo)注(Predicate Labeling)、預(yù)處理(Pre-Processing),語(yǔ)義角色識(shí)別(Semantic Role Identification)、語(yǔ)義角色分類(lèi)(Semantic Role Classification)。
圖2 系統(tǒng)標(biāo)注過(guò)程
其中謂詞標(biāo)注是識(shí)別出句子中的動(dòng)詞性謂語(yǔ),并為它們分配詞義。在傳統(tǒng)的基于短語(yǔ)結(jié)構(gòu)句法分析的SRL系統(tǒng)中通常不執(zhí)行這步,默認(rèn)謂詞已識(shí)別正確。由于CoNLL2008要求進(jìn)行謂詞標(biāo)注,所以在此我們也對(duì)系統(tǒng)在自動(dòng)謂詞標(biāo)注下進(jìn)行實(shí)驗(yàn)。所采用的自動(dòng)謂詞標(biāo)注使用基于統(tǒng)計(jì)的方法實(shí)現(xiàn)[8],在CTB轉(zhuǎn)換語(yǔ)料和CoNLL2009語(yǔ)料上的謂詞識(shí)別的F1的值分別為96.95%和95.64%。另外為方便比較,在本系統(tǒng)中只采用謂詞識(shí)別的結(jié)果,不為它們分配詞義。
在預(yù)處理階段主要對(duì)依存關(guān)系樹(shù)進(jìn)行剪枝,刪除依存樹(shù)上最不可能承擔(dān)謂詞角色的關(guān)系節(jié)點(diǎn),以消除不必要的結(jié)構(gòu)化信息,有效地減少輸入到分類(lèi)器中的實(shí)例個(gè)數(shù)。
此前Hacioglu[3]提出了一種簡(jiǎn)單的剪枝算法,其方法是:在依存樹(shù)中,保留與謂詞具有以下關(guān)系的節(jié)點(diǎn):父親,孩子,孫子,兄弟,兄弟的孩子,兄弟的孫子節(jié)點(diǎn),其他節(jié)點(diǎn)都被過(guò)濾掉。該算法主要針對(duì)英文句法樹(shù)且謂詞為動(dòng)詞性謂語(yǔ)。
在仔細(xì)分析中文依存關(guān)系樹(shù)結(jié)構(gòu)的基礎(chǔ)上,我們擴(kuò)展了Hacioglu剪枝方法,增加了與謂詞具有以下關(guān)系的節(jié)點(diǎn),即保留了謂詞節(jié)點(diǎn)的祖父節(jié)點(diǎn)、祖父的孩子節(jié)點(diǎn),祖父的父親節(jié)點(diǎn)等。系統(tǒng)使用該改進(jìn)的Hacioglu算法后,經(jīng)過(guò)統(tǒng)計(jì)進(jìn)入分類(lèi)器的訓(xùn)練實(shí)例大大減少(減少約76.9%),同時(shí)誤剪率不足1%。
特征一直是決定語(yǔ)義角色標(biāo)注系統(tǒng)性能的重要因素。本文在角色識(shí)別和角色分類(lèi)中使用相同的特征集。類(lèi)似于基于短語(yǔ)結(jié)構(gòu)句法分析的系統(tǒng),參照Gildea[9]等選取的7個(gè)基本特征(謂詞、句法類(lèi)型、子類(lèi)框架、分析樹(shù)路徑、位置、語(yǔ)態(tài)和中心詞),我們選取以下特征作為系統(tǒng)基礎(chǔ)特征。假設(shè)上述例句對(duì)應(yīng)依存樹(shù)(圖1)中當(dāng)前節(jié)點(diǎn)為“W=銀行”,當(dāng)前謂詞為“加強(qiáng)”,現(xiàn)將各特征列舉如下:
謂詞原型:當(dāng)前謂詞的原型。(加強(qiáng))
謂詞詞性:當(dāng)前謂詞的詞性。(VV)
子類(lèi)框架:當(dāng)前謂詞節(jié)點(diǎn)的所有孩子節(jié)點(diǎn)的依存關(guān)系鏈。(ROOT-SBJ-COMP)
路徑:句法樹(shù)上當(dāng)前節(jié)點(diǎn)到謂詞的路徑,即途經(jīng)節(jié)點(diǎn)的依存關(guān)系。(SBJ->ROOT)
位置:當(dāng)前節(jié)點(diǎn)的中心詞相對(duì)于當(dāng)前謂詞的前后順序。(before)
依存關(guān)系:當(dāng)前節(jié)點(diǎn)所對(duì)應(yīng)的依存關(guān)系。(SBJ)
中心詞:當(dāng)前節(jié)點(diǎn)的父親節(jié)點(diǎn)所對(duì)應(yīng)的單詞本身。(加強(qiáng))
借鑒基于英文依存關(guān)系的語(yǔ)義角色標(biāo)注系統(tǒng),我們?cè)谙到y(tǒng)上加入了以下擴(kuò)展特征。
假設(shè)上述例句對(duì)應(yīng)依存樹(shù)(圖1)中當(dāng)前節(jié)點(diǎn)為“W=加強(qiáng)”,當(dāng)前謂詞為“加強(qiáng)”,現(xiàn)將各特征列舉如下,特征如果不存在使用NULL代替。
謂詞的孩子的依存關(guān)系鏈:當(dāng)前謂詞的所有孩子節(jié)點(diǎn)的依存關(guān)系組成的鏈。(SBJ-COMP)
謂詞的孩子的詞性鏈:當(dāng)前謂詞的所有孩子節(jié)點(diǎn)的詞性組成的鏈。(NN-NN)
謂詞的兄弟的依存關(guān)系鏈:當(dāng)前謂詞的所有兄弟的依存關(guān)系組成的鏈。(NULL)
謂詞的兄弟的詞性鏈:當(dāng)前謂詞的所有兄弟節(jié)點(diǎn)的詞性組成的鏈。(NULL)
依賴(lài)詞:指當(dāng)前節(jié)點(diǎn)本身單詞。(加強(qiáng))
中心詞詞性:中心詞的詞性。(NULL)
依賴(lài)詞的詞性:當(dāng)前節(jié)點(diǎn)單詞的詞性。(VV)
家族成員:剪枝后剩下的節(jié)點(diǎn),幾乎都是與謂詞在同一個(gè)家族樹(shù)中,此特征說(shuō)明了在此家族樹(shù)中,當(dāng)前關(guān)系節(jié)點(diǎn)與當(dāng)前謂詞的家族關(guān)系,如:father,child,siblings等等。(myself)
謂詞+中心詞:當(dāng)前謂詞原型+中心詞。(加強(qiáng)+NULL)
當(dāng)前關(guān)系+中心詞:當(dāng)前節(jié)點(diǎn)依存關(guān)系+中心詞。(ROOT+NULL)
謂詞原型+路徑:當(dāng)前謂詞原型+路徑。(加強(qiáng)+ROOT)
依存關(guān)系+依存關(guān)系前一個(gè)詞:當(dāng)前依存關(guān)系的類(lèi)型+依存關(guān)系前一個(gè)詞。(ROOT+銀行)
依存關(guān)系+依存關(guān)系后一個(gè)詞:當(dāng)前依存關(guān)系的類(lèi)型+依存關(guān)系后一個(gè)詞。(ROOT+合作)
實(shí)驗(yàn)采用最大熵分類(lèi)器[10],其原型是開(kāi)源軟件maxent-2.4.0*http://maxent.sourceforge.net/,并在此基礎(chǔ)上進(jìn)行了相關(guān)的修改,使輸出符合系統(tǒng)的要求,參數(shù)cutoff和interation分別設(shè)為2和100。評(píng)測(cè)時(shí)采用CoNLL2008 shared task提供的評(píng)測(cè)程序eval08.pl[1],仍使用Precision、Recall和Labeled F1對(duì)最終系統(tǒng)的性能進(jìn)行評(píng)價(jià)。
實(shí)驗(yàn)時(shí)我們首先建立一個(gè)基于基礎(chǔ)特征的系統(tǒng),稱(chēng)為基礎(chǔ)系統(tǒng);然后把擴(kuò)展特征單獨(dú)加入基礎(chǔ)系統(tǒng)中,得到每個(gè)特征的表現(xiàn),如表1所示。
表1 每個(gè)擴(kuò)展特征和組合特征單獨(dú)加在基礎(chǔ)系統(tǒng)上的結(jié)果
從表1中可以看出,與依存關(guān)系有關(guān)的特征(依賴(lài)詞和依存關(guān)系)對(duì)系統(tǒng)性能提高較明顯。特別加入依賴(lài)詞特征后,系統(tǒng)在兩種語(yǔ)料上的性能分別提高了5.74%和1.64%,效果最明顯。特征“依存關(guān)系+依存關(guān)系前一個(gè)詞”和“依存關(guān)系+依存關(guān)系后一個(gè)詞”表達(dá)了當(dāng)前依存關(guān)系的上下文特征,在分別加入這兩個(gè)特征后,系統(tǒng)性能也有提高。這首先說(shuō)明依存關(guān)系對(duì)系統(tǒng)性能貢獻(xiàn)很大,反過(guò)來(lái)也說(shuō)明系統(tǒng)對(duì)依存關(guān)系的依賴(lài)較強(qiáng),系統(tǒng)受到依存句法性能的影響。另外從Wang等[11]的研究中可發(fā)現(xiàn),在基于短語(yǔ)結(jié)構(gòu)句法分析的SRL系統(tǒng)中,中心詞特征對(duì)系統(tǒng)性能貢獻(xiàn)很大。而實(shí)際上,依存句法中的依賴(lài)詞就相當(dāng)于短語(yǔ)結(jié)構(gòu)句法分析中的成分中心詞,因此它們的作用也是類(lèi)似的,我們的實(shí)驗(yàn)也證明了這一點(diǎn)。而我們?cè)诖颂岢龅闹行脑~概念與前者的中心詞概念有所不同,與之有關(guān)的特征也基本未起作用。
與謂詞孩子和兄弟節(jié)點(diǎn)有關(guān)的特征(謂詞孩子的詞性鏈、依存關(guān)系鏈和兄弟節(jié)點(diǎn)的詞性鏈、依存關(guān)系鏈等)加入系統(tǒng)后,系統(tǒng)性能略有下降。使用這些特征的本意是想表達(dá)與謂詞相關(guān)的上下文信息,但由于依存關(guān)系本身已包含了一些這樣的信息,因此這些特征的作用不大。
在基礎(chǔ)系統(tǒng)上添加了全部擴(kuò)展特征以后,得到了系統(tǒng)在兩種語(yǔ)料上的性能,結(jié)果如表2所示。為評(píng)測(cè)謂詞標(biāo)注對(duì)系統(tǒng)性能的影響,我們分別在標(biāo)準(zhǔn)謂詞和自動(dòng)識(shí)別謂詞上進(jìn)行了實(shí)驗(yàn)。
表2 系統(tǒng)結(jié)果
從表2中可以明顯看出系統(tǒng)在使用標(biāo)準(zhǔn)謂詞的兩個(gè)語(yǔ)料上獲得的性能有所差別,F(xiàn)1值分別為 84.30% 和81.68%,系統(tǒng)在CTB轉(zhuǎn)換語(yǔ)料上的性能比CoNLL2009語(yǔ)料上高了2.62%。同時(shí)系統(tǒng)在自動(dòng)識(shí)別謂詞上的性能都有所降低,說(shuō)明謂詞標(biāo)注也是影響系統(tǒng)性能的一個(gè)重要因素。相比較而言,轉(zhuǎn)換語(yǔ)料上由謂詞標(biāo)注帶來(lái)的性能降低比較明顯,準(zhǔn)確率和召回率均降低,造成整個(gè)F1值下降了3.28%;而在CoNLL2009語(yǔ)料上,準(zhǔn)確率降了2.26%,召回率反而有所上升,因此整個(gè)系統(tǒng)的F1值下降不明顯,這說(shuō)明在CoNLL2009語(yǔ)料上系統(tǒng)受謂詞標(biāo)注性能的影響較小,出現(xiàn)這種情況原因可能在于標(biāo)注語(yǔ)料庫(kù)(CTB5.0與CTB6.0,CPB1.0與CPB2.0)之間的差別,詳細(xì)原因有待進(jìn)一步分析。但總的來(lái)說(shuō),由于CoNLL2009的語(yǔ)料數(shù)據(jù)量大,因此結(jié)果更加可信。
相比于CoNLL2009公布的中文SRL的系統(tǒng)性能(使用主辦方提供的測(cè)試集得到F1值為78.60%),我們的系統(tǒng)在基于自動(dòng)識(shí)別謂詞的CoNLL2009中文開(kāi)發(fā)集語(yǔ)料上的性能與之基本相當(dāng)。另外相比于基于短語(yǔ)結(jié)構(gòu)句法分析的中文SRL系統(tǒng)(手工標(biāo)注,標(biāo)準(zhǔn)謂詞,F(xiàn)1值為92.75%),兩者的性能差距很大,這與中文依存句法分析結(jié)果不完善有關(guān)。因此現(xiàn)階段,中文依存句法分析性能是影響中文依存語(yǔ)義分析的關(guān)鍵因素。
相比于英文基于標(biāo)準(zhǔn)依存分析和標(biāo)準(zhǔn)謂詞標(biāo)注的SRL系統(tǒng),如Johansson等[5]其F1值為85.52%,中文的SRL系統(tǒng)性能略微有所下降。其中主要的原因可能在于中英文標(biāo)準(zhǔn)依存關(guān)系的來(lái)源。由于目前兩種語(yǔ)言都沒(méi)有大規(guī)模手工標(biāo)注的依存關(guān)系語(yǔ)料庫(kù),因此本文中所指的中英文標(biāo)準(zhǔn)依存關(guān)系,均由短語(yǔ)結(jié)構(gòu)句法分析轉(zhuǎn)換得來(lái)。對(duì)于英文的轉(zhuǎn)換,CoNLL2008的主辦方經(jīng)過(guò)了精心處理,因此轉(zhuǎn)換結(jié)果較為可靠;而對(duì)于中文的轉(zhuǎn)換,我們的轉(zhuǎn)換語(yǔ)料只是使用了MaltParser工具進(jìn)行,該工具是一個(gè)針對(duì)多語(yǔ)言的句法分析器,因此對(duì)中文的許多語(yǔ)言現(xiàn)象不可能做很多的特殊處理,因此轉(zhuǎn)換結(jié)果存在一定的誤差,也就影響了后續(xù)的SRL性能。
本文使用英文語(yǔ)義角色標(biāo)注的方法,實(shí)現(xiàn)了一個(gè)基于依存句法的中文語(yǔ)義角色標(biāo)注系統(tǒng)。相比于傳統(tǒng)的基于短語(yǔ)結(jié)構(gòu)句法分析的中文語(yǔ)義角色標(biāo)注,該系統(tǒng)使用依存句法分析結(jié)果構(gòu)建相應(yīng)句法分析樹(shù),并在此樹(shù)上抽取特征,進(jìn)行語(yǔ)義角色的識(shí)別和分類(lèi)。由于這方面的研究還未開(kāi)展,同時(shí)也缺乏可靠的手工標(biāo)注的語(yǔ)料庫(kù)和統(tǒng)一的評(píng)價(jià)標(biāo)準(zhǔn),因此無(wú)
法詳細(xì)評(píng)價(jià)系統(tǒng)性能,在此我們只是報(bào)告一個(gè)初步的實(shí)驗(yàn)結(jié)果,起到拋磚引玉的作用。
后續(xù)的工作中,我們將在這個(gè)方向展開(kāi)進(jìn)一步的研究,包括如何選取更為豐富、有效的特征提高系統(tǒng)性能,使用自動(dòng)依存句法分析進(jìn)行中文SRL,以及如何進(jìn)行句法分析和語(yǔ)義分析聯(lián)合學(xué)習(xí)等內(nèi)容。
[1] CoNLL 2008,http://www.yr-bcn.es/conll2008/, [EB].
[2] CoNLL 2009,http://ufal.mff.cuni.cz/conll2009-st/,[EB].
[3] Kadri Hacioglu. Semantic Role Labeling Using Dependency Trees[C]//Proc.of CoNLL-2004,Boston,MA,US,2004.
[4] Johansson R. and Nugues P.. Dependency-based semantic role labeling of PropBank[C]//Proceedings of EMNLP-2008. 2008.
[5] Johansson R. and Nugues P.Dependency-based syn-
tactic-semantic analysis with PropBank and NomBank[C]//Proceedings of CoNLL-2008.23-24 Aug. 2008.
[6] Xue Nianwen,Palmer M .Automatic semantic role labeling for Chinese verbs[C]//Proc. of IJCAI-2005,2005.
[7] Xue Nianwen, Palmer M. Calibrating features for semantic role labeling[C]//Proc. of EMNLP-2004,2004.
[8] 袁曉虹,王步康,王紅玲,周?chē)?guó)棟:基于依存關(guān)系的中文謂詞標(biāo)注研究[C]//全國(guó)第十屆計(jì)算語(yǔ)言學(xué)學(xué)術(shù)會(huì)議(CNCCL-2009),煙臺(tái),2009.7.
[9] Gildea D,Jurafsky D. Automatic labeling of semantic roles[J] .Computational Linguistics,2002,28(3):245-288.
[10] 劉挺,車(chē)萬(wàn)翔,李生.基于最大熵分類(lèi)器的語(yǔ)義角色標(biāo)注[J].軟件學(xué)報(bào),2007,18(3):565-573.
[11] Wang Hongling,Zhou Guodong,Zhu Qiaoming and Qian Peide.Exploring various features in semantic role labeling[C]//Proceedings of ALPIT’2008. 2008:23-25 .