亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        語義角色標(biāo)注研究綜述

        2011-04-12 11:09:22李業(yè)剛孫福振李鑒柏呂新宇
        關(guān)鍵詞:謂詞組塊句法

        李業(yè)剛,孫福振,李鑒柏,呂新宇

        (1.山東理工大學(xué)計算機(jī)科學(xué)與技術(shù)學(xué)院,山東淄博255091;2.北京理工大學(xué)計算機(jī)學(xué)院,北京100081)

        語義角色標(biāo)注就是對于給定句子中的每個謂詞(動詞、名詞等)分析出其在句中的相應(yīng)語義成分,并作相應(yīng)的語義標(biāo)記,如施事、受事、工具或附加語等.具體而言,即標(biāo)注句子中的一些成分為給定謂詞的語義角色,這些成分作為此謂詞框架的一部分被賦予一定的語義含義.語義角色標(biāo)注綜合了自然語言處理領(lǐng)域的基礎(chǔ)技術(shù),如分詞、詞性標(biāo)注、句法分析等,因此研究語義角色標(biāo)注也為研究機(jī)器學(xué)習(xí)方法和那些底層的技術(shù)提供了研究平臺.作為自然語言處理的基礎(chǔ)技術(shù),語義角色標(biāo)注在很多應(yīng)用中也發(fā)揮了很大的作用.目前語義角色標(biāo)注已在問答系統(tǒng)[1]、信息抽取、信息檢索[4],自動文摘[5]、文本蘊(yùn)涵、機(jī)器翻譯[8]等領(lǐng)域成功應(yīng)用.本文擬從語義角色標(biāo)注的語料庫的資源、預(yù)處理、標(biāo)注單元、標(biāo)注過程及目前研究存在的問題及發(fā)展方向等進(jìn)行了論述.

        1 語料資源

        進(jìn)行自動語義角色標(biāo)注,需要規(guī)模大、質(zhì)量高的語料資源的支持.目前,英語較為知名的語義角色標(biāo)注資源為FrameNet[9]、PropBank[10]和Nom-Bank[11].

        U.C.Berkeley開發(fā)的FrameNet以框架語義為標(biāo)注的理論基礎(chǔ)對英國國家語料庫進(jìn)行標(biāo)注.它試圖描述每個謂詞(動詞、部分名詞以及形容詞)的語義框架,并試圖描述這些框架之間的關(guān)系.Prop-Bank是賓夕法尼亞大學(xué)在Penn TreeBank句法分析語料庫的基礎(chǔ)上標(biāo)注的語義角色標(biāo)注語料庫.PropBank只對動詞(不包括系動詞)進(jìn)行標(biāo)注,相應(yīng)的被稱作謂語動詞.而且只包含20多個語義角色.其中核心的語義角色為Arg0~5六種,Arg0通常表示動作的施事,Arg1通常表示動作的影響等,Arg2~5根據(jù)謂語動詞不同會有不同的語義含義.與FrameNet相比,PropBank基于Penn TreeBank手工標(biāo)注的句法分析結(jié)果進(jìn)行標(biāo)注,因此標(biāo)注的結(jié)果幾乎不受句法分析錯誤的影響,準(zhǔn)確率較高.它幾乎對Penn TreeBank中的每個動詞及其語義角色進(jìn)行了標(biāo)注,因此覆蓋范圍更廣,可學(xué)習(xí)性更強(qiáng).紐約大學(xué)的研究人員開發(fā)的NomBank是為了彌補(bǔ)PropBank僅以動詞作為謂詞,存在標(biāo)注過于粗略的缺點(diǎn).NomBank標(biāo)注了Penn TreeBank中的名詞性的謂詞及其語義角色.另外NomBank容許角色出現(xiàn)相互覆蓋的情況,這也是與PropBank不同的.

        中文語義角色標(biāo)注的研究主要使用三種資源:Chinese Proposition Bank(CPB),Chinese Nombank[12],Chinese FrameNet[13].Chinese PropBank(CPB)同英文PropBank基本類似,是Upenn基于Penn Chinese Treebank(CTB)標(biāo)注的漢語淺層語義標(biāo)注資源,在Penn Chinese Treebank句法分析樹的對應(yīng)句法成分中加入了語義信息.Chinese Nombank把傳統(tǒng)的英文Proposition Bank和Nombank的標(biāo)注框架,擴(kuò)展到對中文名詞性謂詞的標(biāo)注.山西大學(xué)構(gòu)建的Chinese FrameNet是基于框架語義理論的,是一種FrameNet風(fēng)格的中文詞典.它描述了詞匯單元以及參與者框架元素之間的關(guān)系,也包含了框架元素的詳細(xì)句法信息.

        2 預(yù)處理

        預(yù)處理主要是對原始句子進(jìn)行詞匯、句法分析和謂詞識別等.謂詞識別是識別出句子中的動詞性謂語,并為它們分配詞義.在傳統(tǒng)的基于短語結(jié)構(gòu)句法分析的語義角色標(biāo)注(SRL)系統(tǒng)中通常不執(zhí)行這步,默認(rèn)謂詞已識別正確.CoNLL2008要求進(jìn)行謂詞標(biāo)注,謂詞識別分為兩步:謂詞標(biāo)注和詞義識別.謂詞標(biāo)注的任務(wù)是標(biāo)注出句子中的謂詞;詞義識別在前者所識別的謂詞基礎(chǔ)上進(jìn)行詞義的分配.這兩步都可以看成是分類問題,前者是一個二元分類問題,詞義識別則是多元分類問題,因此在實現(xiàn)時可采用各種分類器進(jìn)行分類.在特征向量的選取上,采用了同語義角色標(biāo)注類似的特征.因此預(yù)處理的關(guān)鍵就變成了分類器的選擇和特征向量的選取的問題.

        3 標(biāo)注單元

        根據(jù)對句子的不同標(biāo)注情況,語義角色標(biāo)注系統(tǒng)自動標(biāo)注的基本單元可以是句法成分、組塊、短語、詞等.詞標(biāo)注單元主要用于基于依存句法分析語義角色標(biāo)注系統(tǒng),短語主要用于基于Chunk的語義角色標(biāo)注系統(tǒng),句法成分主要用于基于短語結(jié)構(gòu)句法分析的語義角色標(biāo)注系統(tǒng).目前,從整體效果上看,以句法成分為標(biāo)注單元的語義角色標(biāo)注要優(yōu)于以詞和短語為標(biāo)注單元的方法.

        文獻(xiàn)[14] 以句法成分為基本標(biāo)注單元的,這種策略在短語結(jié)構(gòu)句法分析比較成熟的語言(如英文等)上表現(xiàn)得較好.然而,在其它語言上,很難自動的獲得這種深層句法分析的結(jié)果,而且現(xiàn)有的句法分析系統(tǒng),在通用領(lǐng)域表現(xiàn)欠佳.為此有人試圖將語義角色標(biāo)注建立在淺層句法分析的基礎(chǔ)之上,其中文獻(xiàn)[15] 中文語義角色標(biāo)注F1值為74%.畢竟淺層句法分析的魯棒性要好于深層句法分析.詞是比短語更細(xì)的語言單位,有些語義角色標(biāo)注系統(tǒng)也使用詞作為標(biāo)注的基本單位,然而效果并不如基于短語的和基于句法成分的理想[16].以上的方法都是建立在短語結(jié)構(gòu)句法分析方法基礎(chǔ)之上的,Hacioglu使用依存句法分析結(jié)果進(jìn)行語義角色標(biāo)注[17],也取得了可以與基于短語結(jié)構(gòu)句法分析的相比較的結(jié)果.我們可以直接使用依存句法分析器獲得依存句法分析的結(jié)果,也可以轉(zhuǎn)化短語結(jié)構(gòu)句法分析的結(jié)果為依存句法分析結(jié)果.與基于短語結(jié)構(gòu)句法分析的方法相比,基于依存句法分析不但可以利用短語之間的依存特征,而且只需要學(xué)習(xí)和預(yù)測與謂詞有依存關(guān)系的短語為某種語義角色即可,因此也加快了標(biāo)注的速度.

        3.1 基于短語結(jié)構(gòu)句法分析的語義角色標(biāo)注

        基于短語結(jié)構(gòu)的句法分析是句法分析中最為成熟的技術(shù),性能和結(jié)果各方面都比較可靠、穩(wěn)定.這種策略在句法分析比較成熟的語言(如英文等)上表現(xiàn)得較好.然而句法分析效果并不完美,所以不可能每一個角色都能夠在句法分析樹中找到與之匹配的句法成分.據(jù)統(tǒng)計在PropBank中,基于手工標(biāo)注的句法分析樹中有4.3%的語義角色找不到句法成分與之相匹配.對于由Charniak Parser產(chǎn)生的自動句法分析樹約有10.0%的語義角色與句法成分不相匹配.而由Collins Parser產(chǎn)生的自動句法分析樹,這一數(shù)值更高,約為12%.在其它語言上,很難自動的獲得這種句法分析的結(jié)果,而且現(xiàn)有的句法分析系統(tǒng),在通用領(lǐng)域表現(xiàn)欠佳.為此有研究者試圖將淺層語義分析建立在淺層句法分析的基礎(chǔ)上.

        現(xiàn)在絕大多數(shù)的語義角色標(biāo)注系統(tǒng)采用基于短語結(jié)構(gòu)的句法分析,按照對句法分析的不同依賴程度可分成三類:基于最佳單棵句法樹的SRL方法、基于最佳n棵句法樹的SRL方法和基于聯(lián)合學(xué)習(xí)的句法分析和SRL方法.在這些方法中,基于最佳單棵句法樹的SRL方法是被研究最多的,占主導(dǎo)地位.目前文獻(xiàn)報告的在單個自動句法樹上的有劉挺等[18],F(xiàn)1值為77.13%,李軍輝[19]等在CoNLL2005 Shared Task開發(fā)集和WSJ測試集上分別獲得了77.54%和78.75%的F1值,.而在手工句法分析上最好的成績是Pradhan等[20]報告的,F(xiàn)1值為89.4%.從上述數(shù)據(jù)可看出,基于手工句法分析的結(jié)果相比于自動句法分析的結(jié)果,相差了約12.3%,它們的性能差別主要取決于提供的句法分析的性能.

        3.2 基于組塊的句法分析

        基于語義組塊分析的語義角色標(biāo)注中,標(biāo)注的流程不再是傳統(tǒng)的句法分析-語義角色識別-語義角色分類,而是一種簡化的語義組塊識別-語義組塊分類流程.這一方法將語義角色標(biāo)注從一個節(jié)點(diǎn)的分類問題轉(zhuǎn)化為序列標(biāo)注問題,由于避開了句法分析這個階段,使得語義角色標(biāo)注擺脫了對句法分析的依賴,從而突破了語法分析器的時間和性能限制.可以取得較高的準(zhǔn)確率,并且大大節(jié)省了分析的時間.丁偉偉[21]與Carreras[22]等,Punyakanok[23]等比較發(fā)現(xiàn),在中文語義角色標(biāo)注中基于語義組塊的方法上產(chǎn)生了與基于句法分析的方法可比較的結(jié)果.而英文則不然,主要因為,從分析準(zhǔn)確率來看,中文的句法分析器相較于英文遜色許多,錯誤的分析對語義角色標(biāo)注的負(fù)面影響是很大的,這使得使用基于句法分析的方法進(jìn)行語義角色標(biāo)注效果不好.其次,不同于基于語法組塊的方法,語義組塊使組塊分析直接面向語義角色標(biāo)注.語義組塊識別直接依賴于特定動詞,有利于充分提取與語義角色標(biāo)注相關(guān)的特征,這使得基于語義組塊方法避免了傳統(tǒng)的基于語法組塊方法中由于句法組塊分析和語義角色標(biāo)注脫節(jié)(例如組塊邊界和語義角色邊界不一致)帶來的弊端,提高了標(biāo)注的準(zhǔn)確率.

        3.3 基于依存句法分析的語義角色標(biāo)注

        依存句法分析表達(dá)的句法結(jié)構(gòu)是單詞與單詞之間的依賴關(guān)系圖.從理論上分析,依存句法中的句法-語義接口更簡單、更直觀,并提供了更透明的謂詞-論元關(guān)系表達(dá).因此在基于短語結(jié)構(gòu)句法分析的語義角色標(biāo)注系統(tǒng)遭遇到發(fā)展瓶頸,如局部模型的機(jī)器學(xué)習(xí)方法很難有更大進(jìn)展,數(shù)據(jù)的稀疏問題嚴(yán)重,更有效的特征難以抽取等,導(dǎo)致性能無法進(jìn)一步提高.因此研究者開始探討在另一種句法分析上進(jìn)行語義角色標(biāo)注——基于依存關(guān)系的語義角色標(biāo)注.

        基于依存分析的SRL研究相對較少,Hacioglu等[24]首次采用基于依存分析的方法來實現(xiàn)語義角色標(biāo)注,所使用的依存樹是由句法樹轉(zhuǎn)化而來,采用SVM分類器實現(xiàn)了角色的分類,提出了12個特征(依存關(guān)系,位置,中心詞,依賴詞等),并且表明謂詞相關(guān)信息的重組對性能影響很大.最終在基于手工依存分析語料庫Depbank和CoNLL2004shared task語料庫上的F1值分別為84.6和79.8.這表明雖然使用的信息比基于句法分析SRL少,但取得的結(jié)果相似.Pradhan等[25]使用基于規(guī)則的依存分析結(jié)果進(jìn)行SRL實驗,取得的結(jié)果比使用最新的基于統(tǒng)計短語結(jié)構(gòu)句法分析的性能要差很多,在WSJSection23上的F值從78.4下降到了47.2.類似的,Swanson和Gordon[26]報告:從基于規(guī)則的依存分析中抽取的句法樹特征不如從短語結(jié)構(gòu)句法分析上抽取的相同特征表現(xiàn)穩(wěn)定.而最新的基于依存關(guān)系的SRL研究出現(xiàn)在CoNLL2008評測中,代表作是Johansson等的工作.在Johansson等一文中,詳細(xì)比較了基于短語結(jié)構(gòu)句法分析和基于依存結(jié)構(gòu)句法分析的SRL在FrameNet語料庫上的性能,結(jié)果表明使用現(xiàn)代基于統(tǒng)計的依存句法分析,兩者的性能幾乎是相當(dāng)?shù)模恼逻€指出早期基于依存關(guān)系SRL的性能較差的原因是依存句法分析的準(zhǔn)確率較低.他們的實驗還表明,依存關(guān)系表示中的語法功能信息影響了語義角色分類器的訓(xùn)練;而使用依存關(guān)系訓(xùn)練得到的角色分類器對因跨領(lǐng)域而引起的詞匯問題更具復(fù)原力.在Johansson等的另一篇文章[28]中詳細(xì)分析比較了兩種SRL系統(tǒng)在Prop-Bank語料上的性能.這篇文章的貢獻(xiàn)在于分別使用基于部分短語的(segment-based)和基于依存關(guān)系(dependency-based)的衡量標(biāo)準(zhǔn)來公平的比較代表當(dāng)前最好性能的兩類SRL系統(tǒng)的性能.他們實現(xiàn)的基于依存句法的SRL系統(tǒng)在上述兩項衡量標(biāo)準(zhǔn)下F值分別為77.97(WSJ+Brown)和84.29(CoNLL-2008測試集).實驗結(jié)果表明,基于依存分析的SRL系統(tǒng)更偏向于查找角色頭而不是角色的文字片斷.這樣的特性究竟是優(yōu)點(diǎn)還是缺點(diǎn)取決于具體的應(yīng)用,如對于使用模板填充類的系統(tǒng)可能需要完整的角色;而對于使用語義角色標(biāo)注表示的文本分類則可能僅需要角色的頭.同基于短語結(jié)構(gòu)句法分析的語義角色標(biāo)注類似,基于依存關(guān)系的語義角色標(biāo)注步驟一般可分為三步:謂詞識別、角色識別和角色分類.當(dāng)然還可以包括后處理,這里的后處理主要是進(jìn)行全局推導(dǎo).

        4 標(biāo)注過程

        進(jìn)行語義角色標(biāo)注首先需要進(jìn)行句法分析,并在句法分析的基礎(chǔ)上進(jìn)行謂詞識別.所謂謂詞識別就是識別出句子中的謂語動詞或名詞,并為該謂詞標(biāo)注詞義.目前大部分的語義角色標(biāo)注系統(tǒng)并不進(jìn)行謂詞識別,這是因為大部分系統(tǒng)默認(rèn)使用了語料庫中人工標(biāo)注的謂詞及其詞義.但謂詞識別也是語義角色標(biāo)注中的重要一步,它的性能直接影響到系統(tǒng)性能.除去對原始句子進(jìn)行詞匯、句法分析和謂詞識別等預(yù)處理外,目前大部分語義角色標(biāo)注系統(tǒng)的標(biāo)注過程采用四個步驟完成:剪枝、識別、分類和后處理.國內(nèi)外很多學(xué)者對每個過程的研究也非常豐富,對于識別、分類階段的特征挑選方面也進(jìn)行了細(xì)致的研究.當(dāng)然,并非所有的系統(tǒng)都包括以上4個步驟,特別是前兩個步驟,其主要目的是提高處理效率,但隨之帶來的是召回率的下降,即損失了一些本應(yīng)是語義角色的標(biāo)注單元.因此,在某些系統(tǒng)中,去除了剪枝步驟.還有些系統(tǒng)合并了識別和分類步驟[29],直接對語義角色進(jìn)行分類,也就是將非語義角色的標(biāo)注單元也看成是一類.

        4.1 剪枝算法

        以句法成分為標(biāo)注單元的語義角色標(biāo)注,首先需要一種簡單的剪枝預(yù)處理方法來過濾句法分析樹中一些不可能成為語義角色的句法成分,保留盡量少的候選句法成分,以提高準(zhǔn)確性.劉挺等[18]采用識別分類一步到位的方法對與謂詞相關(guān)的全部句法成分進(jìn)行訓(xùn)練和預(yù)測,只裁掉了句法類型為詞性的句法成分.但使得AM-MOD和AM-NEG等角色對句法樹上的句法成分匹配率很低,還要進(jìn)行后處理.使用最廣泛的剪枝算法是由Xue等[12]提出的.其基本思想是選取當(dāng)前謂詞結(jié)點(diǎn)和其祖先的兄弟結(jié)點(diǎn)作為候選角色,輸入到角色識別階段,其中如果當(dāng)前結(jié)點(diǎn)是PP,則同時收集其直接孩子結(jié)點(diǎn).

        王紅玲等[30]提出了基于中心詞的剪枝算法,在預(yù)處理階段,針對句法分析樹中句法成分與語義角色不一一匹配的問題,在Xue[12]剪枝算法的基礎(chǔ)上改進(jìn),提出了基于中心詞的剪枝算法.該算法除選取當(dāng)前謂詞結(jié)點(diǎn)和其祖先的兄弟結(jié)點(diǎn)作為候選角色外,也選取這些兄弟結(jié)點(diǎn)的孩子結(jié)點(diǎn),如孩子結(jié)點(diǎn)與其父親結(jié)點(diǎn)具有相同中心詞時,舍去孩子結(jié)點(diǎn)和其兄弟結(jié)點(diǎn).該算法提高了系統(tǒng)的召回率(1.1%).

        4.2 語義角色的識別和分類

        標(biāo)注方法語義角色的識別和分類步驟尤為重要,它們可以作為分類問題處理.也就是說,人們可以逐一判斷一個標(biāo)注單元是否是某一動詞的語義角色,更進(jìn)一步的,可以預(yù)測其屬于何種具體的語義角色.最初人們使用基于規(guī)則的方法來解決分類問題,但是,此方法需要專家構(gòu)筑大規(guī)模的知識庫,這不但需要有專業(yè)技能的專家,也需要付出大量勞動.同時,隨著知識庫的增加,矛盾和沖突的規(guī)則也隨之產(chǎn)生.為了克服知識庫方法的缺點(diǎn),人們后來使用機(jī)器學(xué)習(xí)的方法來解決此問題.該方法的優(yōu)點(diǎn)是不需要有專業(yè)技能的專家書寫知識庫,只需要有一定專業(yè)知識的人對任意一種語言現(xiàn)象做出適當(dāng)?shù)姆诸惣纯桑缓笠源藶橛?xùn)練數(shù)據(jù),再使用各種學(xué)習(xí)方法構(gòu)造性能卓越的分類器.該方法通常稱為有指導(dǎo)學(xué)習(xí)(Supervised Learning)方法.雖然它能夠較好的解決一些已有大量正確標(biāo)注語料庫的自然語言處理問題,但是通常,我們獲得這種語料庫的代價也是昂貴的.為此,人們試圖使用未標(biāo)注的語料庫直接進(jìn)行學(xué)習(xí),這種方法被稱作無指導(dǎo)學(xué)習(xí)(Unsupervised Learning)[31].或者只借助少量標(biāo)注語料,利用大量未標(biāo)注語料的半指導(dǎo)學(xué)習(xí)(Semi-supervised Learning)[32].然而無論是無指導(dǎo)學(xué)習(xí),還是半指導(dǎo)學(xué)習(xí),其理論都不甚完備,效果也不如有指導(dǎo)學(xué)習(xí)方法,但是泛化要好得多.

        4.3 后處理

        對于一個句法成分嵌套在另一個成分中的情況,如不采取處理系統(tǒng)有可能對這兩個成分都進(jìn)行了標(biāo)注.但是,根據(jù)語義角色標(biāo)注的規(guī)范,這是不允許的.因此,最簡單的做法是在嵌套關(guān)系發(fā)生時,只保留一個角色.由于最大熵分類器能夠很容易地預(yù)測每一個輸出的概率,因此,處理嵌套時只把嵌套關(guān)系中概率最高的成分標(biāo)注出來.

        嵌套關(guān)系的處理也可以放在論元識別之后、分類之前進(jìn)行.這是因為二元訓(xùn)練中樣例大致平衡,準(zhǔn)確率也比較高,同時對分類階段引入的錯誤也可以降低.Toutanova等[33]采用了這種方法,而且還采用動態(tài)規(guī)劃的方法,自底向上地從句法樹的葉子結(jié)點(diǎn)開始到根計算當(dāng)前句法成分為根形成的不嵌套的子樹與當(dāng)前句法成分分別為空角色和非空角色的概率和,從而取得不嵌套的論元序列.

        王紅玲等[34]提出了基于角色共現(xiàn)概率的去除重復(fù)論元算法,具體思想為:經(jīng)過分類后,可取得最可能承擔(dān)當(dāng)前句法成分角色的兩個角色的概率,即具有最高概率的兩個角色,然后通過計算角色的共現(xiàn)概率,來決定最終的角色.在后處理階段,針對語義角色標(biāo)注中不允許兩個嵌套的句法成分同時承擔(dān)動詞的角色的問題,提出了基于角色共現(xiàn)概率的去除嵌套關(guān)系的算法,其基本思想是根據(jù)角色共現(xiàn)概率的大小決定保留的角色.針對謂語動詞不會同時存在兩個或兩個以上的相同的核心角色的問題,提出了基于角色共現(xiàn)概率的去除重復(fù)論元的算法,具體思想為:經(jīng)過分類后,取得最可能承擔(dān)當(dāng)前句法成分角色的兩個角色的概率,即具有最高概率的兩個角色,然后通過計算角色的共現(xiàn)概率,來決定最終的角色.實驗結(jié)果表明,角色分類的準(zhǔn)確率普遍提高,而對召回率的影響很?。@個現(xiàn)象充分說明了后處理對角色分類是有效的.

        5 結(jié)論和展望

        語義角色標(biāo)注的性能嚴(yán)重依賴于句法分析的性能,而這個問題在中文的語義角色標(biāo)注中尤其突出;由于很難提出更有效的特征,基于短語結(jié)構(gòu)的語義角色標(biāo)注系統(tǒng)發(fā)展遭遇瓶頸,性能很難進(jìn)一步提高;跨領(lǐng)域分析性能較差等各個方面.

        由于句法分析的錯誤,語義分析的性能等原因,獨(dú)立的語義角色標(biāo)注系統(tǒng)很難獲得滿意的分析結(jié)果,因此試圖融合多種語義角色標(biāo)注的結(jié)果可以作為一種嘗試.但要面對各種融合方法都或多或少的提高了系統(tǒng)的整體性能,當(dāng)然也造成了系統(tǒng)構(gòu)造復(fù)雜,分析效率不高等問題.

        語義角色標(biāo)注的性能離實用化還有一定的距離,需要繼續(xù)深入研究.歸納起來,有以下幾個方面有待進(jìn)一步研究:

        1)領(lǐng)域適應(yīng)性問題.為了使語義角色標(biāo)注達(dá)到實用的目的,必須解決領(lǐng)域適應(yīng)性問題,也就是說解決測試語料和訓(xùn)練語料屬于不同的領(lǐng)域,性能下降較多的問題.研究結(jié)果表明,Brown語料上的評測結(jié)果均較之WSJ語料結(jié)果低10%左右.真正解決這個問題還有很遠(yuǎn)的路要走.

        2)句法分析和語義分析的聯(lián)合學(xué)習(xí).以往的研究均表明,不管是短語結(jié)構(gòu)句法還是依存結(jié)構(gòu)句法,語義角色標(biāo)注系統(tǒng)的性能都受制于句法分析的性能,這一點(diǎn)在中文上表現(xiàn)尤為突出.實驗結(jié)果表明:在英文中,使用手工標(biāo)注和自動標(biāo)注句法分析的SRL系統(tǒng)性能相差10%,而在中文上,這個值達(dá)到了30%.而進(jìn)行聯(lián)合學(xué)習(xí)是解決這個問題的一個有效途經(jīng).

        3)基于依存句法分析的中文語義角色標(biāo)注的進(jìn)一步研究.這個研究方向剛剛起步,主要原因是沒有合適的標(biāo)注語料庫,也沒有合理的評測標(biāo)準(zhǔn).已有研究表明,依存句法分析相比與短語結(jié)構(gòu)的句法分析,含有更多的語義信息.因此該研究方向值得進(jìn)一步深入研究.

        [1] Shen D,Lapata M.Using semantic roles to improve question answering[C] //Annie Zaenen,Antal van den Bosch.Proceedings of the 2007Joint Conference on Empirical Methods in Natural Language Processing and Computational Natural Language Learning.Edmonton:Association for Computational Linguistics,2007:12-21.

        [2] Mihai S,Sanda H,John W.Using predicate-argument structures for information extraction[C] //Erhard W Hinrichs,Dan Roth.Proceedings of the Annual Meeting on Association for Computational Lingustics.Sapporo:Association for Computational Linguistics,2003:8-15.

        [3] 于江德,樊孝忠,龐文博.事件信息抽取中語義角色標(biāo)注研究[J] .計算機(jī)科學(xué).2008,35(3):155–157

        [4] Bilotti M W,Ogilvie P,Callan J,et al.Structured retrieval for question answering[C] //Kraaij W,de Vries AP,Clarke CLA,eds.Proceedings of the 30th Annual Int'l ACM SIGIR Conf.on Research and Development in Information Retrieval.New York:ACM,2007,351-358.

        [5] 秦兵,劉挺,李生.多文檔自動文摘綜述[J] .中文信息學(xué)報,2005,19(6):14-20.

        [6] Braz R,Girju R,Punyakanok V,Roth D,et al.An inference model for semantic entailment in natural language[C] //Cristiano Castelfranchi.National Conference on Artificial Intelligence.Virginia:AAAI,2005:1 678-1 679.

        [7] 吳曉鋒,宗成慶.基于語義角色標(biāo)注的新聞領(lǐng)域復(fù)述句識別方法.中文信息學(xué)報[J] .2010,24(5):3-8

        [8] Jinho D C,Matha P.Transition-based semantic role labeling using predicate argument clustering[C] //Matsumoto,Yuji Mihalcea,Rada.Proceedings of the 49th Annual Meeting of the Association for Computational Linguistics:Human Language Technologies.Portland:Association for Computational Linguistics,2011:37-45.

        [9] Baker C F,F(xiàn)illmore C J,Lowe J B.The berkeley frameNetproject[C] //Salimer M.Proceedings of the 36th Annual Meeting of the Association for Computational Linguistics and 17th International Conference on Computational Linguistics.Montreal:Association for Computational Linguistics.1998:86-90.

        [10] Palmer M,Gildea D,Kingsbury P.The proposition bank:an annotated corpus of semantic roles[J] .Computational Linguistics.2005,31(1):71-106.

        [11] Meyers A,Reeves R,Macleod C.The nombank project:an interim report[C] //Susan Dumais,Daniel Marcu,Salim Roukos Proceedings of HLT-NAACL 2004Workshop:Frontiers in Corpus Annotation.Boston:Association for Computational Linguistics,2004:24-31.

        [12] Xue N.Annotating the predicate-argument structure of chinese nominalizations[C] //M Gild.Proceedings of the LREC 2006.Genoa:Association for Computational Linguistics,2006:1382 1387.

        [13] You L P,Liu K Y.Building chinese framenet database[C] //Mrques K.Conference on Natural Language Processing and Knowledge Engineering(IEEE NLP-KE).NewYork:IEEE,2005:301-306.

        [14] Punyakanok V,Roth D,Yih W T.The necessity of syntactic parsing for semantic role labeling[C] //R.Dale.Proceedings of IJCAI-2005.Berlin:Association for Computational Linguistics,2005:1 117-1 123.

        [15] 王鑫,孫薇薇,穗志方.基于淺層句法分析的中文語義角色標(biāo)注研究.中文信息學(xué)報[J] .2011,25(1):116–122

        [16] Kwong O Y,Tsou B K.Semantic role tagging for chinese at the lexical level[C] //Robert Dale.Second International Joint Conference on Natural Language Processing.Jeju Island:Association for Computational Linguistics,2005:804-814.

        [17] Hacioglu K.Semantic role labeling using dependency trees[C] //COLING'04Proceedings of the 20th international conference on Computational Linguistics.Geneva:Association for Computational Linguistics,2004:1 273-1 281.

        [18] 劉挺,車萬翔,李生.基于最大熵分類器的語義角色標(biāo)注[J] .軟件學(xué)報,2007,18(3):565-573.

        [19] 李軍輝,王紅玲,周國棟,等.語義角色標(biāo)注中句法特征的研究.中文信息學(xué)報[J] .2009,23(6):11-18

        [20] Pradhan S,Hacioglu K,Krugler V,et al.Support vector learning for semantic argument classification[J] .Machine Learning Journal.2005,60(1):11-39.

        [21] 丁偉偉,常寶寶.基于語義組塊分析的漢語語義角色標(biāo)注.中文信息學(xué)報[J] .2009,23(5):53-61,74

        [22] Carreras X,Mrques L.Introduction to the conll2005shared task:semantic role labeling[C] //Daniel Gildea,CONLL'05 Proceedings of the Ninth Conference on Computational Natural Language Learning.Stroudsburg:Association for Computational Linguistics,2005:152-164.

        [23] Duan H,Bai X,Chang B,et al.Chinese word segmentation at Peking University[C] //Qing Ma,F(xiàn)ei Xia.Proceedings of the Second SIGHAN Workshop on Chinese Language Processing.Sapporo:Association for Computational Linguistics,2003:152-155.

        [24] Hacioglu K.Semantic role labeling using dependency trees[C] //Joakim Nivre,COLING'04Proceedings of the 20th international conference on Computational Linguistics.Geneva:Association for Computational Linguistics,2004:1273-1276.

        [25] Pradhan S,Ward W,Hacioglu K,et al.Semantic role labeling using different syntactic views[C] //Kevin Knight,Hwee Tou Ng,Kemal Oflazer.Proceedings of the 43rd Annual Meeting of the Association for Computational Linguistics,Ann Arbor:Association for Computational Linguistics,2005:581-588.

        [26] Swanson R,Gordon A S.A comparison of alternative parser tree paths for labeling semantic roles[C] //Nicoletta Calzolari,Claire Cardie,Pierre Isabelle.Proceedings of the 21st International Conference on Computational Linguistics and 44th Annual Meeting of the Association for Computational Linguistics.Sydney:Association for Computational Linguistics,2006:811-818.

        [27] Johansson R,Nugues P.The effect of syntactic representation on semantic role labeling[C] //Donia Scott,Hans Uszkoreit,Proceedings of 22nd International Conference on Computational Linguistics.Stroudsburg:Association for Computational Linguistics 2008:393-400.

        [28] Johansson R,Nugues P.Dependency-based semantic role labeling of PropBank[C] //Mirella Lapata,Hwee Tou Ng,Proceedings of the 2008Conference on Empirical Methods in Natural Language Processing,Honolulu:Association for Computational Linguistics.2008:69-78.

        [29] Liu T,Che W,Li S,et al.Semantic role labeling system using maximum entropy classifier[C] //Daniel Gildea.CONLL'05 Proceedings of the Ninth Conference on Computational Natural Language Learning.Stroudsburg:Association for Computational Linguistics,2005:189-192.

        [30] Wang H L,Zhou G D,Zhu Q M.Dependency tree-based SRL with proper pruning and extensive feature engineering[C] //Iryna Gurevych,Delphine Bernhard.Proceedings of the 22nd International Conference on Computational Linguistics(Coling 2008),Manchester:Coling 2008Organizing Committee,2008.23-24.

        [31] Swier R S,Stevenson S.Unsupervised semantic role labelling[C] //D Lin,D Wu.Proceedings of the 2004Conference on Empirical Methods in Natural Language Processing.Barcelona:Association for Computational Linguistics,2004:95-102

        [32] 陳耀東,王挺,陳火旺.半監(jiān)督學(xué)習(xí)和主動學(xué)習(xí)相結(jié)合的淺層語義分析.中文信息學(xué)報[J] .2008,22(2):70-75

        [33] Zhang M,Che W X,AW A T,et al.A grammar-driven convolution tree kernel for semantic role classification[C] //Annie Zaenen,Antal van den Bosch.Proceedings of the 45th Annual Meeting of the Association of Computational Linguistics.Prague:Association for Computational Linguistics,2007:200-207.

        [34] Wang H L.Research on feature-based semantic role labeling for English and Chinese[D] .Suzhou:Soochow University,2008.

        猜你喜歡
        謂詞組塊句法
        句法與句意(外一篇)
        中華詩詞(2021年3期)2021-12-31 08:07:22
        述謂結(jié)構(gòu)與英語句法配置
        橫浪作用下大型上部組塊雙船浮托安裝動力響應(yīng)特性試驗研究
        被遮蔽的邏輯謂詞
        ——論胡好對邏輯謂詞的誤讀
        黨項語謂詞前綴的分裂式
        西夏研究(2020年2期)2020-06-01 05:19:12
        句法二題
        中華詩詞(2018年3期)2018-08-01 06:40:40
        詩詞聯(lián)句句法梳理
        中華詩詞(2018年11期)2018-03-26 06:41:32
        陸豐7-2油田導(dǎo)管架平臺上部組塊低位浮托安裝關(guān)鍵技術(shù)
        也談“語言是存在的家”——從語言的主詞與謂詞看存在的殊相與共相
        英語詞匯組塊學(xué)習(xí)路徑研究——組塊法
        亚洲av一区二区三区网站| 一本色综合久久| 伊伊人成亚洲综合人网7777| AV熟妇导航网| 狼人精品剧情av在线观看| 永久天堂网av手机版| 人与嘼交av免费| 久久精品中文字幕久久| 亚洲熟妇av一区二区三区hd | 亚洲国产精一区二区三区性色 | 久久久久人妻精品一区5555| 一区二区三区亚洲免费| 无码人妻精品一区二区三区东京热| 在教室伦流澡到高潮hgl视频| 99久久国产综合精品女乱人伦| 国产黄片一区二区三区| 欧美伦费免费全部午夜最新| 伊人蕉久中文字幕无码专区| 国产成人综合久久精品推荐免费| 国产自拍一区在线视频| 欧美成人看片一区二区三区尤物 | 中文字幕日韩高清| 国产一区二区精品久久呦| 亚洲欧洲免费无码| 免费精品一区二区三区第35| 女同av在线观看网站| 国产视频在线观看一区二区三区| 狠狠97人人婷婷五月| 亚洲av无码成人黄网站在线观看| 开心激情站开心激情网六月婷婷| 精品国内日本一区二区| 五月综合激情婷婷六月色窝| 久久国产亚洲高清观看5388| 国产视频免费一区二区| 欧美成人秋霞久久aa片| 成人免费ā片在线观看| 经典女同一区二区三区| 亚洲天堂成人av影院| 亚洲国产美女精品久久久| 96精品免费视频大全| 免费在线视频亚洲色图|