肖 升 ,李勇帆 ,何炎祥
XIAO Sheng1,2,LI Yongfan2,HE Yanxiang1
1.武漢大學 計算機學院,武漢 430079
2.湖南第一師范學院 信息科學與工程系,長沙 410205
1.School of Computer Science,Wuhan University,Wuhan 430079,China
2.Department of Information Science and Engineering,Hunan First Normal College,Changsha 410205,China
離合詞是現(xiàn)代漢語中一類特殊的語法現(xiàn)象,說其特殊,是因為除原形外,其構詞語素還會因插入、顛倒、省略而產生多種分離形式。由于離合詞多為動詞,因此在中文事件抽取中,表征事件的觸發(fā)詞也很可能是離合詞,本文將這類觸發(fā)詞統(tǒng)稱為離合觸發(fā)詞,例如:
例(1)~(14)中,下劃線部分均為離合觸發(fā)詞“流血”的合法分離形式,它們與原形“流血”一樣都能表征Injure(ACE2005)這類事件。不同的是,前12例在構詞語素“流”和“血”之間插入成分后形成V+X+O結構,第13例將語素顛倒并插入成分后形成S+X+V結構,而第14例則省略語素后形成單V結構。由于已有事件抽取方法都將原形作為觸發(fā)詞檢索的標準[1],因此想要完整地實現(xiàn)事件抽取,還必須準確判定離合觸發(fā)詞的合法分離形式。
現(xiàn)有語言學成果表明[2-10],離合詞雖然數(shù)量眾多,但所具有的合法分離形式卻相對有限,加之在這些分離形式中,各成分間的句法關系清晰且穩(wěn)定,因此找到一種可將句法關系轉化為依存規(guī)則的分析方法就能使判定問題迎刃而解。
目前,在中文信息處理中已獲成功應用的依存分析方法是獲取依存規(guī)則的可信賴方法[11-14]。此方法生成的依存框架不僅能充分體現(xiàn)各成分間直接或間接的依存關系,還有助于將依存規(guī)則轉化為判定規(guī)則。為此,本文提出一種基于依存分析的離合觸發(fā)詞合法分離形式判定算法(下文簡稱判定算法),以期實現(xiàn)離合觸發(fā)詞合法分離形式的自動判定。
依存分析是構建在依存語法基礎之上的句法分析方法。此方法能識別句子內部語法結構并由此突破語表匹配限制,其結果可為自然語言處理中的眾多應用提供有力支持。
就中文信息處理的要求而言,哈工大社會計算與信息檢索研究中心開發(fā)的中文依存句法分析系統(tǒng)較為成熟。該系統(tǒng)的核心是一個融合了詞匯支配度的統(tǒng)計模型,該模型不僅能有效應對粗粒度的詞性信息,還可以利用詞匯支配度獲取的結構信息來提高句法結構識別能力和避免非法結構生成[15]。
本課題組通過協(xié)議方式獲取了“哈工大信息檢索研究中心語言技術平臺共享包(完整版)”,并對其中開源的依存句法分析模塊進行了局部改寫,最終形成了本文實驗所用的依存句法分析系統(tǒng)。該系統(tǒng)將句子由一個線性序列轉化為一棵依存分析樹(哈德森樹),樹中詞結點由依存弧聯(lián)結,弧從支配詞指向從屬詞,弧上標有符合漢語特征的24種依存關系:ATT(定中關系)、QUN(數(shù)量關系)、COO(并列關系)、APP(同位關系)、LAD(前附加關系)、RAD(后附加關系)、VOB(動賓關系)、POB(介賓關系)、SBV(主謂關系)、SIM(比擬關系)、HED(核心)、VV(連謂結構)、CNJ(關聯(lián)結構)、MT(語態(tài)結構)、IS(獨立結構)、ADV(狀中結構)、CMP(動補結構)、DE(“的”字結構)、DI(“地”字結構)、DEI(“得”字結構)、BA(“把”字結構)、BEI(“被”字結構)、IC(獨立分句)、DC(依存分句)。經本文系統(tǒng)處理后的句子如圖1所示。
圖1 依存分析實例
從圖1可以看出,依存分析樹具有如下特征:
(1)每條依存弧聯(lián)結一個支配詞和一個從屬詞;一個詞在充當從屬詞的同時,還可以充當另一個詞的支配詞;一個詞只能充當一次從屬詞,卻可充當多次支配詞(如“流”)。
(2)句子的中心結點通常就是句子的核心謂詞(如本例中的“流”),此結點只有從屬詞而沒有支配詞(Root是遍歷樹所需的根結點,并非原句成分,不能充當中心結點)。
(3)依存框架中沒有非終結點,沒有短語結構樹中的“扁平結構(flat structure)”,有的是兩個詞的直接關聯(lián),這無疑將有利于細粒度的詞匯化表達[15]。
雖然現(xiàn)有語言學成果已對離合詞的合法分離形式及其成因進行了闡述[2-10],但由于缺乏機器應用背景,這些成果都難以直接運用于離合觸發(fā)詞合法分離形式的自動判定。依存分析是經長期實踐后被證明能運用于計算機的句法分析形式,課題組通過將其與現(xiàn)有語言學成果結合,形成了如下6條適用于自動判定的判定規(guī)則:
規(guī)則1(動態(tài)助詞規(guī)則)若三元語法序列MSVF+WDA+MSVS滿足:
(1)MSVF、MSVS分別為某離合詞的第1、2語素且兩者存在VOB或CMP依存。
(2)WDA是動態(tài)助詞且WDA∈{“著”,“了”,“過”}。
(3)MSVF與WDA存在MT依存。
則MSVF+WDA+MSVS是離合詞MSVFMSVS插入動態(tài)助詞后形成的合法分離形式。該規(guī)則的實例如圖2所示。
圖2 動態(tài)助詞規(guī)則實例
圖2顯示的例句中,“流”和“血”分別是離合詞“流血”的第1、2語素且兩者存在VOB依存;“流”與動態(tài)助詞“著/了/過”之間存在MT依存,因此“流著/了/過血”是“流血”的合法分離形式。
規(guī)則2(定補規(guī)則)若三元語法序列MSVF+WAC+MSVS滿足:
(1)MSVF、MSVS分別為某離合詞的第1、2語素且兩者存在VOB或CMP依存。
(2)WAC是MSVS的定語且兩者存在ATT依存,或WAC是MSVF的補語且兩者存在CMP依存。
則MSVF+WAC+MSVS是離合詞MSVFMSVS插入定語或補語后形成的合法分離形式。該規(guī)則的實例如圖3和圖4所示。
圖3 定語規(guī)則實例
圖4 補語規(guī)則實例
圖3和圖4顯示的例句中,“流”和“血”分別是離合詞“流血”的第1、2語素且兩者存在VOB依存;“動脈”是“血”的定語且兩者存在ATT依存;“完”是“流”的補語且兩者存在CMP依存,因此“流動脈血”和“流完血”均是“流血”的合法分離形式。
規(guī)則3(動助定補規(guī)則)若四元語法序列MSVF+WDA+WAC+MSVS、MSVF+WAC+WDA+MSVS或五元語法序列MSVF+WAC+WDA+WAC+MSVS滿足:
(1)MSVF、MSVS分別為某離合詞的第1、2語素且兩者存在VOB或CMP依存。
(2)WDA是動態(tài)助詞且WDA∈{“著”,“了”,“過”}。
(3)MSVF與WDA存在MT依存。
(4)WAC是MSVS的定語且兩者存在ATT依存,或WAC是MSVF的補語且兩者存在CMP依存。
則上述三種語法序列均是離合詞MSVFMSVS插入動態(tài)助詞和定、補語后形成的合法分離形式。該規(guī)則的實例如圖5至圖9所示。
圖5 四元動助定語規(guī)則實例
圖6 四元補語動助規(guī)則實例
圖7 四元動助補語規(guī)則實例
圖8 四元定補規(guī)則實例
圖9 五元動助定補規(guī)則實例
圖5至圖9顯示的例句中,“流”和“血”分別是離合詞“流血”的第1、2語素且兩者存在VOB依存;“流”與動態(tài)助詞“著/了/過”之間存在 MT 依存;“毒膿”和“烏黑粘稠的”都是“血”的定語且存在 ATT 依存;“出”、“少許”是“流”的補語且存在CMP依存,因此“流著/了/過毒膿血”、“流出了血”、“流了/過少許血”、“流出烏黑粘稠的血”、“流出了烏黑粘稠的血”都是“流血”的合法分離形式。
規(guī)則4(疊用規(guī)則)若三元語法序列MSVF+M'SVF+MSVS或四元語法序列MSVF+M'SVF+WAC+MSVS、MSVF+WN+M'SVF+MSVS或五元語法序列MSVF+WN+M'SVF+WAC+MSVS滿足:
(1)M'SVF=MSVF且兩者存在VV依存。
(2)MSVF、MSVS分別為某離合詞的第1、2語素且M'SVF與MSVS間存在VOB或CMP依存。
(3)WAC是MSVS的定語且兩者存在ATT依存。
(4)WN∈{“沒”,“不”}且與M′SVF間存在ADV依存。
則上述四種語法序列均是離合詞MSVFMSVS第一語素疊用及插入定、狀語后形成的合法分離形式。該規(guī)則的實例如圖10至圖13所示。
圖10 三元疊用規(guī)則實例
圖11 四元疊用定語規(guī)則實例
圖12 四元疊用狀語規(guī)則實例
圖13 五元疊用規(guī)則實例
圖10至圖13顯示的例句中,第2個“流”是第1個“流”的疊用且兩者存在VV依存;第1個“流”和“血”分別是離合詞“流血”的第1、2語素且第2個“流”與“血”之間存在VOB依存;“毒膿”是“血”的定語且兩者存在ATT依存;“不/沒”是第2個“流”的狀語且兩者存在ADV依存,因此“流流血”、“流流毒膿血”、“流不/沒血”、“流不/沒毒膿血”都是“流血”的合法分離形式。
規(guī)則5(顛倒規(guī)則)若三元語法序列MSVS+WAD+MSVF滿足:
(1)MSVS、MSVF分別為某離合詞的第2、1語素且兩者存在SBV依存。
(2)WAD是MSVF的狀語且兩者存在ADV依存。
則MSVS+WAD+MSVF是離合詞MSVFMSVS顛倒并插入狀語后形成的合法分離形式。該規(guī)則的實例如圖14所示。
圖14 顛倒規(guī)則實例
圖14顯示的例句中,“血”和“流”分別是離合詞“流血”的第2、1語素且兩者存在SBV依存;“再不”和“泉涌般”是“流”的狀語且兩者存在ADV依存,因此“血再不泉涌般流”是“流血”的合法分離形式。
規(guī)則6(省略規(guī)則)若句群S1,S2滿足:
(1)MSVF、MSVS分別為某離合詞的第1、2語素且兩者存在VOB或CMP依存。
(2)S1中包含離合詞MSVFMSVS或規(guī)則1-5認定的MSVFMSVS的合法分離形式。
(3)S2由 MSVF或 MSVF+WDA構成,其中 WDA是動態(tài)助詞且WDA∈{“著”,“了”,“過”}。
則MSVF是離合詞MSVFMSVS的合法分離形式。
例如,在句群“流不流血?流?!敝校捎诘?個句子中包含“流血”的合法分離形式“流不流血”(疊用規(guī)則),因此第2個句子中的“流”可被認定為“流血”的合法分離形式。同理,在句群“血還流嗎?流?!焙汀傲餮藛?流了?!敝校?個句子中的“流”也可被認定為“流血”的合法分離形式。
規(guī)則1~規(guī)則6都是可信規(guī)則,它們組成的規(guī)則系統(tǒng)囊括了離合詞合法分離形式所有可能產生的依存關系,因此可以保證判定的完整性。若依次運用規(guī)則1~規(guī)則6均無法判定某語法序列為某離合詞的合法分離形式,則可以判定該語法序列不是此離合詞的合法分離形式。例如,在“傷口一直流著帶血的水?!敝?,由于“流”與“血”間既不存在VOB、CMP也不存在SBV依存,因此語法序列“流著帶血”顯然無法滿足規(guī)則1~規(guī)則6的判定條件,因此該語法序列肯定不是離合詞“流血”的合法分離形式。同理,在“眼睛充滿血后不停流眼淚?!敝校把蟛煌A鳌币膊皇恰傲餮钡暮戏ǚ蛛x形式。當然,語言學中并無絕對規(guī)則,因此可信規(guī)則也必定存在反例,但這些反例不應成為反對運用規(guī)則方法進行離合觸發(fā)詞合法分離形式判定的理由,下一步需要做的是圍繞判定規(guī)則來實現(xiàn)判定算法。
離合觸發(fā)詞合法分離形式的判定算法流程如圖15所示。
圖15 判定算法流程圖
從圖15不難看出,判定算法將在預處理、分詞及詞性標注、依存句法分析之后被執(zhí)行(虛線方框標識部分)。
判定算法的第1步是對依存分析產生的句子依存框架進行儲存。由于分詞后句中詞的個數(shù)確切,因此本文在算法實現(xiàn)時選用靜態(tài)鏈表作為存儲結構。鏈表結點記錄了8種與詞相關的信息,其中數(shù)據(jù)域6種:詞形、詞性、從屬詞、支配詞、從屬關系和支配關系;指針域2種:從屬詞結點和支配詞結點;結點(含根結點)的初始化由函數(shù)InitNode()完成,數(shù)據(jù)域輸入由PutInformation()完成;鏈表結點個數(shù)就是分詞后句中詞的個數(shù)。此步驟在實現(xiàn)時首先借助詞形匹配定位每個詞的從屬詞結點和支配詞結點,然后通過指針互指使具有依存關系的詞結點互聯(lián),最后鏈入根結點并由此完成對依存框架的樹狀儲存。
判定算法的第2步是候選詞語序列識別,所謂候選詞語序列是指依存框架中完整包含離合觸發(fā)詞語素的詞語序列。此步驟需要通過與儲存在文件中的離合觸發(fā)詞表進行比對才能完成,若識別成功則進入下一步判斷,若不成功則輸出NT(No Trigger),判定算法就此結束。
判定算法的第3步是合法分離形式判定,即根據(jù)判定規(guī)則1~規(guī)則6判定第2步確定的候選詞語序列是否為某離合觸發(fā)詞的合法分離形式。此步驟在實現(xiàn)時依次掃描儲存在靜態(tài)鏈表中的詞結點,若某兩個詞結點的詞形分別與某離合觸發(fā)詞的第1、2語素匹配,則調用判定規(guī)則1~規(guī)則4對兩結點間的語法序列進行判定;若某兩個詞結點的詞形分別與某離合觸發(fā)詞的第2、1語素匹配,則調用判定規(guī)則5對兩結點間的語法序列進行判定;若某詞結點的詞形與某離合觸發(fā)詞的第1語素匹配,且其后無與第2語素匹配的詞結點,則調用判定規(guī)則6對其進行判定;當某語法序列已被判定為合法時,為提高算法效率,不再調用其他規(guī)則而直接終止本次判定。若判定直接終止,則表明該候選詞語序列是某離合觸發(fā)詞的合法分離形式,輸出LSF(Legal Separation Form);若判定未直接終止,則表明該候選詞語序列不是某離合觸發(fā)詞的合法分離形式,輸出ISF(Illegal Separation Form)。無論最終輸出LSF還是ISF,判定算法都將到此結束。
判定算法的實現(xiàn)不僅使判定規(guī)則在機器中得以運用,也為后期基于真實文本的語料測試掃清了障礙。
為測試判定算法的效率,課題組開展了基于語料庫的半自動化實驗,實驗沿用ACE2005定義的測試事件,測試事件的離合觸發(fā)詞表經如下兩步生成:
(1)通過協(xié)議方式獲取哈工大社會計算與信息檢索研究中心研發(fā)的《同義詞詞林擴展版》(共77343條),從中選取與測試事件相關的觸發(fā)詞組成候選觸發(fā)詞表(共1584條),選詞時既要利用詞林對同義詞和近義詞的擴展來盡可能完整地收錄觸發(fā)詞,也要注意排除下列3類觸發(fā)詞的干擾:
①關聯(lián)事件觸發(fā)詞。例如,戀愛是婚姻的關聯(lián)事件,但戀愛不等于結婚,因此“談愛”、“相戀”等關聯(lián)事件觸發(fā)詞不應被當做婚姻事件觸發(fā)詞收錄。
②衍生事件觸發(fā)詞。例如,祭奠是死亡的衍生事件,雖然有祭奠一定意味著有死亡,但兩者的行事主體并不相同,因此“吊唁”、“奔喪”等衍生事件觸發(fā)詞不能被收錄。
③引申事件觸發(fā)詞。例如,除教學事件外,“下課”還可引申表征辭職事件(如“球隊主帥被迫下課?!保?,因此“下課”是辭職事件的引申事件觸發(fā)詞。但目前計算機還不能有效識別引申義,因此引申事件觸發(fā)詞應被排除在外。
(2)將獲業(yè)界認可的《現(xiàn)代漢語離合詞用法詞典》的離合詞表(共4029條)與候選觸發(fā)詞表作比對,取兩者交集為測試事件的離合觸發(fā)詞表(共277條),該詞表如表1所示。
從表1可以看出,在ACE2005定義的8大類33小類測試事件中,除Charge-Indict和Extradite外,其他31小類都涉及離合觸發(fā)詞,這充分印證,離合觸發(fā)詞是中文事件抽取中不可回避的問題。此外,就表1中離合觸發(fā)詞的語法用途而言,13條聯(lián)合型中的10條及2條偏正型可作為動賓型使用(如“游1次行”、“上過3次訴”等),聯(lián)合型中剩余的 3 條(“倒賣”、“盜賣”、“租用”)可作為動補型使用,因此,本文基于動賓和動補關系制定的判定規(guī)則不僅簡潔而且可靠。
實驗所用的測試語料庫同樣以協(xié)議方式從哈工大社會計算與信息檢索研究中心獲得,庫名為《漢語依存樹庫》。該語料庫是提升哈工大依存句法分析系統(tǒng)效率的基礎,將它作為測試語料庫,對以哈工大系統(tǒng)為內核的本文實驗系統(tǒng)而言,顯然可以最大限度地減少因依存分析錯誤而帶來的負面影響。同時,該語料庫中的語料均屬新聞文體,事件在此文體中的表達清晰規(guī)范,因文體引發(fā)的分析錯誤可被大大降低。該語料庫以XML格式儲存,占儲空間16.7 MB;按句子標號sent id統(tǒng)計,其語料規(guī)模為9999句。
本文實驗用準確率(Precision)、召回率(recall)和F值(F-Measure)來測試判定算法的效率,其中:
(1)Precision=機器正確判定的離合觸發(fā)詞合法分離形式數(shù)目(簡稱機器正確判定數(shù))/機器判定的離合觸發(fā)詞合法分離形式數(shù)目(簡稱機器判定數(shù))。
(2)recall=機器正確判定數(shù)/人工判定的離合觸發(fā)詞合法分離形式數(shù)目(簡稱人工判定數(shù))。
(3)F-Measure=(2×precision×recall)/(precision+recall)。
為采集效率測試所需的數(shù)據(jù),本實驗完成了如下3步:
(1)在解析、檢索、去噪等預處理之后,逐句對語料進行人工排查,確定其中共有2974個句子包含離合觸發(fā)詞,離合觸發(fā)詞總數(shù)為3146條,在這3146條離合觸發(fā)詞中有2267條(即人工判定數(shù))產生了合法分離形式,比例達72.1%。
(2)調用判定算法對語料進行機器分析,結果顯示,語料中共有2435個離合觸發(fā)詞的合法分離形式(即機器判定數(shù))。
(3)對機器判定數(shù)進行人工核查,確定其中共有2002個確為離合觸發(fā)詞的合法分離形式表(即機器正確判定數(shù))。
將上述數(shù)據(jù)代入相應公式計算得Precision=82.2%、recall=88.3%、F-Measure=85.1%,這說明,本文判定算法能在較高召回率的前提下獲得不錯的準確率。若進一步考察合法分離形式在8大類測試事件中的分布(如表2所示)。
表1 測試事件的離合觸發(fā)詞表1)
表2 離合觸發(fā)詞合法分離形式在測試事件中的分布 條
離合觸發(fā)詞的合法分離形式在不同事件類別中的分布并不均衡,若以人工判定數(shù)為標準計算,則有的分布密集,如Transaction類事件中,離合觸發(fā)詞產生合法分離形式的平均值高達18.6個/條;有的分布適中,如Conflict、Life、Contact、Justice、Personnel類事件中,平均值為5.1~8.5個/條;有的分布稀疏,如Business、Movement類事件中,平均值僅為2.2~2.6個/條;如果去除Business、Movement這2類可能引發(fā)數(shù)據(jù)稀疏的數(shù)據(jù)后重新計算,Precision=82.4% 、recall=88.7% 、F-Measure=85.4% ,比去除前略有提高,可見,本文的判定算法不僅高效而且可靠,已基本具備應用潛質。
此外,機器判定過程中的下列錯誤也值得關注:
(1)分詞錯誤;此類錯誤會影響離合觸發(fā)詞合法分離形式的識別。例如,將“包龍圖 /夢斷 /金蟬 /案。”錯誤地切分為“包龍圖 /夢 /斷 /金蟬 /案?!本蜁ⅰ皵嘟鹣s案”誤認為是“斷案(Convict)”的合法分離形式。又如,將“空調 /開 /一小會 /關 /一小會 /浪費 /電?!卞e誤地切分為“空調 /開 /一 /小會 /關 /一 /小會 /浪費/電?!睍ⅰ伴_一小會”誤認為是“開會(Meeting)”的合法分離形式。
(2)語義錯誤;此類錯誤將影響離合觸發(fā)詞合法分離形式的統(tǒng)計。例如,將“熱得要人命”、“胸口掛著大紅花”中的“要人命”和“掛著大紅花”分別誤認為是“要命(Die)”和“掛花(Injure)”的合法分離形式都將影響時間式計數(shù)。
(3)依存分析錯誤;該錯誤將會影響離合觸發(fā)詞合法分離形式的判定。例如,在“《星辰》創(chuàng)內刊發(fā)行量新高。”中的“創(chuàng)”應和“新高”之間存在動賓依存,但如果將其與“內刊”之間錯誤地分析為動賓依存,則會導致“創(chuàng)內刊”被誤判為“創(chuàng)刊(Start-Org)”的合法分離形式;又如,在“治污辦強化地板廠環(huán)保意識。”中“強化”應和“意識”之間存在動賓依存,但如果將其與“地板”之間錯誤地分析為定中依存,則會導致“辦強化地板廠”被誤判為“辦廠(Start-Org)”的合法分離形式。
上述問題顯然難以通過句法層面的依存分析全面解決,因此如何拓展語義層面的依存分析必將成為提升判定算法效率的主要后繼問題[16]。
作為一種基于規(guī)則的判定方法,規(guī)則在本文方法中所起的作用至關重要。由于研究對象相對封閉,課題組從已有語言學成果中人工提取了判定所需的依存規(guī)則,實驗結果表明,這些規(guī)則的作用令人滿意。可以預見,隨著語言學研究的逐漸深入,語言學成果將日益豐富,越來越多可靠的新規(guī)則將被挖掘并被納入規(guī)則庫,基于規(guī)則方法的效率也將有機會獲得進一步提升。但與此同時,還必須清楚地意識到,人工方法雖然有效但耗時費力,當研究對象擴大到一定范圍時,單純的人工方法已不可能窮盡所需規(guī)則,因此,如何在人工方法的基礎上引入機器學習方法,并借此提高依存規(guī)則的提取效率將是后期值得著重研究的問題。
[1]肖升,何炎祥.基于動詞論元結構的中文事件抽取方法[J].計算機科學,2012,39(5):161-164.
[2]馬玉蕾,陶明忠.構式語法視角下的離合詞[J].當代外語研究,2012,3(6):14-18.
[3]周清艷.特殊“V個N”結構對VN的選擇和制約條件分析[J].世界漢語教學,2012,26(1):85-93.
[4]蔡淑美.“X+V+Y+的+O”的事件結構及句法、語義限制[J].語言科學,2011,10(4):375-384.
[5]王海峰.基于語料庫的現(xiàn)代漢語離合詞語義特征考察[J].河北師范大學學報:哲學社會科學版,2010,33(1):96-100.
[6]王海峰.現(xiàn)代漢語離合詞離析現(xiàn)象語體分布特征考察[J].語言文字應用,2009,18(3):81-89.
[7]王海峰.離合詞離析形式A×B的構式特征[J].漢語學習,2009,30(1):31-35.
[8]李春玲.離合詞研究綜述[J].沈陽師范大學學報:社會科學版,2008,32(1):127-130.
[9]任海波,王剛.基于語料庫的現(xiàn)代漢語離合詞形式分析[J].語言科學,2005,4(6):75-87.
[10]饒勤.動賓式離合詞配價的再認識[J].語言教學與研究,2001,23(4):57-63.
[11]肖升,何炎祥,李勇帆.基于依存分析的中文時間表達式類型判定[J].計算機應用,2013,33(6):1582-1586.
[12]孫艷,周學廣,付偉.基于依存關聯(lián)分析的情感詞擴展[J].北京郵電大學學報,2012,35(5):90-93.
[13]王素格,吳蘇紅.基于依存關系的旅游景點評論的特征—觀點對抽取[J].中文信息學報,2012,26(3):116-121.
[14]付劍鋒,劉宗田,付雪峰,等.基于依存分析的事件識別[J].計算機科學,2009,36(11):217-219.
[15]劉挺,馬金山,李生.基于詞匯支配度的漢語依存分析模型[J].軟件學報,2006,17(9):1876-1883.
[16]肖升,何炎祥.事件超圖模型及類型識別[J].中文信息學報,2013,27(1):30-38.