亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        漢語復(fù)句關(guān)系詞的依存樹特征分析?

        2017-09-12 08:49:45楊進才羅越群陳忠忠胡金柱
        計算機與數(shù)字工程 2017年8期
        關(guān)鍵詞:特征

        楊進才羅越群陳忠忠胡金柱

        漢語復(fù)句關(guān)系詞的依存樹特征分析?

        楊進才羅越群陳忠忠胡金柱

        (華中師范大學計算機學院武漢430079)

        復(fù)句關(guān)系詞特征分析是復(fù)句關(guān)系詞自動標識的關(guān)鍵。論文提出基于依存樹的復(fù)句關(guān)系詞特征分析方法,通過依存樹核函數(shù)來捕獲復(fù)句句法結(jié)構(gòu)特征。對于復(fù)句句法分析所得依存樹,選取最短路徑包含樹SPT(Short Path Tree)從樹中選取關(guān)系詞特征序列,設(shè)計依存樹核函數(shù)對特征序列進行相似度的計算。實驗證明,運用該方法進行關(guān)系詞自動識別,具有較高的正確率。

        復(fù)句關(guān)系詞;依存樹核函數(shù);依存句法;特征分析

        Class NumberTP391.9

        1引言

        復(fù)句上連篇章,下含小句,兼具句法、語義和語用等方面的屬性[1]。它是漢語語法的重要實體單位,并且表達的語義信息豐富而復(fù)雜,因而成為漢語語法研究的熱點。漢語句子中復(fù)句占大多數(shù),復(fù)句是連接分句與篇章的橋梁,因而在中文信息處理領(lǐng)域具有較為重要的研究價值[2]。

        在中文信息處理領(lǐng)域,復(fù)句的研究主要包括分句和非分句的識別、復(fù)句關(guān)系詞的自動識別、復(fù)句層次的自動劃分以及復(fù)句關(guān)系類別的標識。現(xiàn)階段,對復(fù)句的分句和非分句的識別進行了大量的研究,且達到了較理想的識別效果。與此同時,復(fù)句關(guān)系詞識別的研究正在從人工識別向自動識別進行。

        目前關(guān)系詞自動識別主要通過規(guī)則的方法。該方法的主要思想是:首先對漢語復(fù)句語料庫中的復(fù)句進行分詞處理,從分詞的結(jié)果中提取關(guān)系詞的約束條件,包括字面約束、分句位置約束、關(guān)系詞位置約束、標記類型約束、詞性約束、分句數(shù)目約束、語義約束、句式約束、關(guān)系詞隱現(xiàn)約束、邏輯語義約束等。根據(jù)這些約束條件,分析關(guān)系詞所在復(fù)句的特征并形成規(guī)則,然后通過規(guī)則匹配識別關(guān)系詞[3~4]。例如:楊進才、郭凱凱等使用貝葉斯模型對漢語復(fù)句關(guān)系詞進行識別并對規(guī)則進行挖掘[5]。胡金柱、舒江波、胡泉等對復(fù)句關(guān)系詞識別的規(guī)則進行了研究[6]。

        因此,在復(fù)句關(guān)系詞自動識別系統(tǒng)中,復(fù)句關(guān)系詞特征分析模塊是該系統(tǒng)的核心模塊之一。復(fù)句關(guān)系詞特征分析模塊所提取的特征信息有效與否,直接關(guān)系到關(guān)系詞自動標識系統(tǒng)性能的高低。

        現(xiàn)有的復(fù)句關(guān)系詞特征的提取多為基于復(fù)句分句的分詞結(jié)果。雖然文獻[7]在對關(guān)系詞及復(fù)句類別識別時使用了句法特征,但僅從清華樹庫中抽取出標注為連詞、副詞、連接詞的詞,在帶功能標記的句法樹中進行關(guān)系詞的識別。但對沒有帶功能標記的句法樹中的關(guān)系詞沒有進行識別,關(guān)系詞在復(fù)句中被標注為其它詞性的情況也沒有考慮。本文將關(guān)系詞識別的對象作為準關(guān)系詞,即這個詞在關(guān)系詞庫中存在,可以充當連詞成分。但是,對準關(guān)系詞的詞性未作任何限定。

        依存語法(又稱從屬關(guān)系語法、配價語法),由法國語言學家L.Tesniere于1959年首次提出[8]。1970年計算語言學家J.Robinson提出依存語法中關(guān)于依存關(guān)系的四條公理。由于依存語法具有形式簡單、與語義關(guān)系接近、便于句法分析之后的進一步語義分析、更適合于處理自由語序的語言(如捷克語、漢語等)、更易于構(gòu)造基于機器學習的高精度句法分析程序等優(yōu)點,20世紀90年代我國學者開始將其引入漢語學的研究中,提出了用于中文信息處理的第五條公理?,F(xiàn)在依存關(guān)系在中文信息處理各個研究領(lǐng)域得到了廣泛的應(yīng)用,國內(nèi)有多家研究單位開發(fā)了中文依存樹庫,例如哈工大的漢語依存樹庫[9]。還有一些研究機構(gòu)如清華大學開發(fā)了樹庫轉(zhuǎn)換程序,將短語樹庫轉(zhuǎn)化成依存樹庫[10~11]。

        本文研究從復(fù)句依存樹中提取關(guān)系詞的句法特征,設(shè)計依存樹核函數(shù)進行特征分析,利用樹核函數(shù)的分析結(jié)果設(shè)計分類器,提高復(fù)句關(guān)系詞自動識別的效率與準確率。

        2復(fù)句依存樹中關(guān)系詞特征的選取

        對于給定句子的依存句法樹,如何選取樹中恰當?shù)牟糠钟糜陉P(guān)系抽取是實體關(guān)系抽取研究的關(guān)鍵問題之一[12~13]。復(fù)句依存樹中,需要選擇樹中的恰當部分代表關(guān)系詞所在復(fù)句的特征信息,使得這些特征對關(guān)系詞的自動標識更加有效。

        1)完全依存樹

        使用Stanford Parser[14~15]對例句1進行依存句法分析,所得到的句法分析結(jié)果如圖1所示。

        例句1:“是知道富士山的多,還是知道富士膠卷的多?”|《長江日報》1997年09月16日12版次。

        圖1例句1依存分析信息

        圖1 中,每一行都是一個三元組,表示一個依存關(guān)系:

        關(guān)系名(父節(jié)點詞語-層次編號,

        子節(jié)點詞語-層次編號)

        對于復(fù)句依存分析得到的依存信息表,設(shè)計樹生成算法來生成復(fù)句的依存樹表示形式:

        (1)遍歷所得到的復(fù)句依存信息列表,找出存在且唯一的沒有父節(jié)點的詞,將該詞當作復(fù)句依存樹的根。

        (2)為給定復(fù)句中的每個詞找尋其所有孩子節(jié)點。

        (3)當給定復(fù)句當中的所有的詞都被設(shè)置了父子關(guān)系以后,算法結(jié)束。

        根據(jù)樹生成算法,將例句1的依存關(guān)系信息生成依存樹的形式,所得到的依存樹形式如圖2所示。

        圖2 例句1的依存樹

        2)最短路徑包含樹

        句法樹關(guān)系抽取的結(jié)果表明:句法樹中的最短路徑包含樹部分,被認為對表明實體關(guān)系、捕獲句法樹有效結(jié)構(gòu)特征信息發(fā)揮著重要的作用。利用句法樹中的最短路徑包含樹部分用作關(guān)系抽取,較之于使用完全句法樹進行關(guān)系抽取,最短路徑包含樹將取得更佳的效果。

        在對含有搭配型關(guān)系詞“是,還是”的復(fù)句依存樹,將采用最短路徑包含樹方法,選取樹中連接關(guān)系詞“是,還是”的最短路徑及路徑以下的部分,作為表示關(guān)系詞所在復(fù)句的結(jié)構(gòu)化特征。

        例句2:“是排球給了他一切,還是他將一切都給了排球?”|《長江日報》1996年05月08日13版次。

        圖3 例句2的依存樹

        圖4 例句2的最短路徑包含樹

        例句2的依存樹如圖3所示,最短路徑包含樹如圖4所示。在使用依存樹核函數(shù)計算兩復(fù)句的句法結(jié)構(gòu)相似度時,將使用此結(jié)構(gòu)的特征信息。通過依存樹核函數(shù)對關(guān)系詞所在復(fù)句的結(jié)構(gòu)特征信息計算出的相似度,對搭配型復(fù)句關(guān)系詞進行自動標識。

        3核方法及依存樹核函數(shù)

        3.1核方法

        由于核方法可以充分利用特征方法無法表示的結(jié)構(gòu)化信息,因此近年來越來越多的研究人員開始研究和使用該方法[16]。通過使用核方法,將原特征空間之中的非線性分類問題轉(zhuǎn)化為在變換后的高維特征空間的線性分類問題。該方法通過在原特征空間進行對象之間相似度計算得到變換后的高維特征空間中對象之間的相似值。

        3.2依存樹核函數(shù)

        依存樹核函數(shù)計算的是兩復(fù)句實例依存樹T1和T2之間的相似值,該函數(shù)記為K(T1,T2)。依存樹T包含一系列節(jié)點{t0,t1,…,tn},樹節(jié)點ti的特征表示為?(ti)={v1,v2,…,vd};使用ti[j]來表示樹節(jié)點ti的第j個子節(jié)點,ti[c]代表樹節(jié)點ti的所有子節(jié)點集合,樹節(jié)點ti的父親節(jié)點表示為ti.p。

        對含有搭配型關(guān)系詞“是,還是”的復(fù)句實例3進行依存句法分析,使用依存樹生成算法,將該例句依存分析所得依存關(guān)系列表構(gòu)造成依存樹形式。

        例句3:“是守著包袱求穩(wěn)定,還是在發(fā)展中解包袱?”|《長江日報》1995年10月28日02版次。

        圖5例句3的依存樹

        圖5 中,t0[1]=t2,t0[c]=t0[{0,1,2}]={t1,t2,t3},t1.p=t0,?(t6)={“還是”,“AD”,“ad v mod”}。

        對定義于依存樹節(jié)點特征的匹配函數(shù)m(ti,tj)∈{0,1}與相似度函數(shù)s(ti,tj)∈(0,+∞]進行如下簡要說明:設(shè)定樹節(jié)點ti的特征系列?(ti)={v1,v2,…,vd}包含以下兩個特征子集?m(ti)??(ti)和?s(ti)??(ti)。在匹配函數(shù)的計算中使用?m(ti),在相似度函數(shù)的計算中使用?s(ti)。函數(shù)具體形式如式(1)、(2)所示。

        C(vq,vr)是定義于兩具體特征值之間的函數(shù),計算方法如式(3)所示。

        s(ti,tj)返回兩特征集合?s(ti)和?s(tj)之間存在的相同的具體特征值的數(shù)目。

        對兩個根節(jié)點分別為r1,r2的依存樹T1和T2,定義依存樹核函數(shù)K(T1,T2)為如式(4)所示。

        式(5)中,Kc是定義于子節(jié)點上的核函數(shù)。令a和b都是指數(shù)系列,a的形式如下a1≤a2≤…≤an,b的取值與a類似。d(a)=an-a1+1,l(a)是系列a的長度。

        常量0<λ<1是一個衰減因子,該衰減因子的引入是為了懲罰子系列中出現(xiàn)的匹配項,避免函數(shù)值過度依賴于樹規(guī)模的大小,加快核函數(shù)的收斂速度。

        4復(fù)句關(guān)系詞標識

        4.1關(guān)系詞特征序列相似度計算

        使用句法特征選取策略,對含有搭配型關(guān)系詞的復(fù)句依存樹進行結(jié)構(gòu)特征的抽取,分別獲得包含關(guān)系詞在內(nèi)的完全依存樹和最短路徑包含樹。對代表關(guān)系詞所在復(fù)句句法特征的結(jié)構(gòu)對象,使用依存樹核函數(shù)對其進行相似度的計算。

        依存樹核函數(shù)采用自頂向下的方式依次比較兩結(jié)構(gòu)化對象對應(yīng)位置上的節(jié)點,當兩結(jié)構(gòu)對象的某個節(jié)點匹配成功時,則調(diào)用相似度計算函數(shù)計算相似值,并且使用相同的計算方法對其所有子節(jié)點進行遞歸計算,直到出現(xiàn)節(jié)點不匹配或者匹配已經(jīng)達到了樹的葉子節(jié)點。

        4.2根據(jù)特征序列相似度計算對關(guān)系詞標識

        有標復(fù)句搭配型關(guān)系詞自動標識的研究目標是,通過計算待標識的關(guān)系詞特征序列與已知標識結(jié)果的關(guān)系詞特征序列之間的相似度,來發(fā)現(xiàn)待標識關(guān)系詞的標識類別。本文采用依存樹核函數(shù)聯(lián)合SVMLight(Support Vector Machine Light)機器學習方法構(gòu)造聯(lián)合分類器來發(fā)現(xiàn)待標識關(guān)系詞的類別。文中使用的基于依存樹核的SVMLight分類器對關(guān)系詞標識的依據(jù)是,根據(jù)待標識關(guān)系詞特征序列與訓練集中位于決策邊緣上的關(guān)系詞特征序列之間的相似值給出分類結(jié)果,根據(jù)分類結(jié)果得到關(guān)系詞的標識結(jié)果?;谝来鏄浜撕瘮?shù)的SVMLight機器學習方法使用的判別公式如式(6)所示。

        式(6)中,yi∈{} -1,1,表示訓練樣例xi所代表的關(guān)系詞是否是真正關(guān)系詞(yi=1,是真正關(guān)系詞,yi=-1,不是真正關(guān)系詞),K(xi,z)=Φ(xi)·Φ(z)涉及計算變換后的空間中向量對之間的點積,即表示測試樣例和訓練樣例的相似度,K(xi,z)表示前面部分介紹的依存樹核函數(shù)。關(guān)系詞標識規(guī)則為:如果f(z)=1,則判定關(guān)系實例z所包含的關(guān)系詞是真正關(guān)系詞;否則,不是真正關(guān)系詞。

        5實驗結(jié)果與分析

        對含有搭配型關(guān)系詞的有標選擇復(fù)句使用斯坦福大學的依存句法分析工具對其進行依存句法解析,通過對依存句法分析的結(jié)果進行處理,得到復(fù)句的完全依存樹、最短路徑包含樹、最短依賴路徑。

        實驗中將搭配型關(guān)系詞的自動標識問題看作是分類問題,使用SVMLight作為分類器,然后在其中插入依存樹核,使其能夠支持樹結(jié)構(gòu)形式的輸入。

        將復(fù)句的上述兩種樹結(jié)構(gòu)處理為分類器所需的格式。實驗過程中,從華中師范大學語言所研究的漢語復(fù)句語料庫(the Corpus of Chinese Com?pound Sentences,CCCS)中選用了500條包含搭配型關(guān)系詞“是”,“還是”的復(fù)句實例,其中包含正例數(shù)目為300,負例為200。“是”,“還是”是弱式關(guān)系詞,并將其標識規(guī)律用于其它搭配型關(guān)系詞的自動標識。

        采用準確率(Precision),召回率(Recall)和F值來評價關(guān)系詞的自動標識性能。標識結(jié)果如表1。

        表1 基于復(fù)句依存樹的實驗結(jié)果

        表1比較了使用從復(fù)句依存樹結(jié)構(gòu)中抽取的三種結(jié)構(gòu)特征,用于合用型關(guān)系詞的自動標識的性能高低。從表中可看出,最短路徑包含樹取得了最佳性能,完全依存樹次之,最短依賴路徑的性能最差。

        完全依存樹包含了最豐富的特征信息。最短路徑包含樹保留連接關(guān)系詞的路徑特征以及路徑以下包含的部分,而將完全依存樹的其它部分予以剔除。實驗結(jié)果說明,完全依存樹盡管包含了最豐富的特征信息,但同時也引入了噪聲信息,使得在關(guān)系詞的自動標識中噪聲特征抵消了有效特征的作用。而最短路徑包含樹通過剔除部分特征,取得了最佳性能。表明,最短路徑包含樹所包含的特征信息更能代表復(fù)句關(guān)系詞所在依存樹的結(jié)構(gòu)特征。

        最短依賴路徑只保留依存樹中連接關(guān)系詞的路徑特征,該特征未能夠有效表示復(fù)句關(guān)系詞所在復(fù)句的句法結(jié)構(gòu)特征。

        在關(guān)系詞的自動標識中,卷積樹核使用子集樹的設(shè)置比使用子樹設(shè)置所取得的效果更好。表2列出了使用卷積樹核對從短語句法樹中抽取的特征進行計算的結(jié)果。

        表2 基于復(fù)句短語結(jié)構(gòu)句法樹的實驗結(jié)果

        表2表明,使用上下文相關(guān)的最短路徑包含樹用于關(guān)系詞的標識,取得了較好的效果。這意味著,合用型有標選擇復(fù)句的短語結(jié)構(gòu)句法樹中的,相較于其它幾種結(jié)構(gòu)特征,該部分特征能更加有效表示關(guān)系詞所在短語結(jié)構(gòu)句法樹的特征信息。

        表1與表2結(jié)果對照表明,從依存樹抽取最短路徑包含樹,用依存樹核函數(shù)計算相似度比從短語樹中抽取特征,用卷積樹核計算相似度的方法性能更優(yōu)。

        6結(jié)語

        本文介紹了基于依存樹核函數(shù)的復(fù)句關(guān)系詞特征分析。給出依存樹核對復(fù)句關(guān)系詞特征信息序列進行相似度計算的基本原理,給出代表關(guān)系詞所在復(fù)句的特征信息序列的抽取。分類器根據(jù)復(fù)句關(guān)系詞特征信息序列相似度的計算結(jié)果,給出關(guān)系詞的標識結(jié)果。通過觀察最終關(guān)系詞的自動標識效果,對完全依存樹和最短路徑包含樹代表關(guān)系詞所在復(fù)句句法特征的有效性進行比照。

        復(fù)句關(guān)系詞的自動標識可分為如下兩種類型:單用型關(guān)系詞的自動標識以及搭配型關(guān)系詞的自動標識。搭配型關(guān)系詞的自動標識是研究的重點。搭配型關(guān)系詞根據(jù)組成部分的數(shù)量情況,可分為“兩件套”,“三件套”等類型。本文從“兩件套”關(guān)系詞的自動標識入手,發(fā)現(xiàn)并總結(jié)其自動標識規(guī)律。將所得規(guī)律應(yīng)用于其它類型的關(guān)系詞的自動標識當中。

        利用從復(fù)句實例依存樹中選取的特征信息進行關(guān)系詞的自動標識,最短路徑包含樹(SPT)取得了最佳標識性能。表明使用SPT代表關(guān)系詞所在復(fù)句句法結(jié)構(gòu)特征的有效性。

        基于依存樹核函數(shù)的復(fù)句關(guān)系詞特征分析,需要解決如下兩個關(guān)鍵問題:特征選取與依存樹核函數(shù)形式。需要更多的實驗去發(fā)現(xiàn)更能代表復(fù)句句法特征的關(guān)系詞特征序列,針對文中依存樹核函數(shù)在計算特征序列相似度時的局限性,需要進行進一步的改進,使得到的依存樹核函數(shù)更能適應(yīng)復(fù)句關(guān)系詞的靈活搭配形式。

        [1]邢福義.漢語復(fù)句研究[M].北京:商務(wù)印書館,2001:1-695.

        XING Fuyi.Research of Chinese Compound Sentence[M].Beijing:The commercialpress,2001:1-695.

        [2]黃昌寧,趙海.中文分詞十年回顧[J].中文信息學報,2007,21(3):8-19.

        HUANG Changning,ZHAO Hai.Chinese Word Segmenta?tion:A Decade Review[J].Journalof Chinese Information Processing,2007,21(3):8-19.

        [3]胡金柱,陳江曼,楊進才,等.基于規(guī)則的連用關(guān)系標記的自動標識研究[J].計算機科學,2012,39(7):190-194.

        HU Jinzhu,CHEN Jiangman,YANG Jincai,et al.Re?search on Auto-identifying of Adjoining Relation Markers Based on Rule[J].Computer Science,2012,39(7):190-194.

        [4]胡金柱,舒江波,胡泉,等.漢語復(fù)句關(guān)系詞自動識別中規(guī)則的約束條件研究[J].語言文字應(yīng)用,2015(1):82-89.

        HU Jinzhu,SHU Jiangbo,HU Quan,et al.On the Restric?tion of Rules in Auto-identifying Relational Words in Chi?nese Complex Sentences[J].Applied Linguistics,2015(1):82-89.

        [5]楊進才,郭凱凱,沈顯君,等.基于貝葉斯模型的復(fù)句關(guān)系詞自動識別與規(guī)則挖掘[J].計算機科學,2015,42(7):291-294.

        YANG Jincai,GUO Kaikai,SHEN Xianjun,et al.Auto?matic Identification and Rule Mining for Relation Words of Chinese Compound Sentences Based Bayesian Model[J].Computer Science,2015,42(7):291-294.

        [6]胡金柱,舒江波,胡泉,等.復(fù)句關(guān)系詞自動識別中規(guī)則的表示方法研究[J].計算機工程與應(yīng)用,2016,52(1):127-132.

        HU Jinzhu,SHU Jiangbo,HU Quan,etal.Research on ex?pression method of rules in auto-identifying relational word of Chinese compound sentences.Computer Engineer?ing and Applications,2016,52(1):127-132.

        [7]李艷翠,孫靜,周國棟,等.基于清華漢語樹庫的復(fù)句關(guān)系詞識別與分類研究[J].北京大學學報(自然科學版),2014,50(1):118-124.

        LI Yancui,SUN Jing,ZHOU Guodong,et al.Recognition and Classification of Relation Words in the Compound Sen?tences Based on Tsinghua Chinese Treebank[J].Acta Sci?entiarum Naturalium Universitatis Pekinensis,2014,50(1):118-124.

        [8]高松,馮志偉.基于依存樹庫的文本聚類研究[J].中文信息學報,2011,25(3):59-63.

        GAO Song,F(xiàn)EN Zhiwei.Research on Text Clustering Based on Dependency Treebank[J].Journalof Chinese In?formation Processing,2011,25(3):59-63.

        [9]王躍龍,姬東鴻.漢語樹庫綜述[J].當代語言學,2009(1):47-55.

        WANG Yuelong,JI Donghong.A review of Chinese tree?banks[J].Contemporary Linguistics,2009(1):47-55.

        [10]黨政法,周強.短語樹到依存樹的自動轉(zhuǎn)換研究[J].中文信息學報,2005,19(3):21-27.

        DANG Zhengfa,ZHOU Qiang.Automatically Convert Treebank from Phase Structure to Dependency Structure[J].Journal of Chinese Information Processing,2005,19(3):21-27.

        [11]尤昉,李涓子,王作英.基于語義依存關(guān)系的漢語語料庫的構(gòu)建[J].中文信息學報,2003,17(1):46-53.

        YOU Fang,LI Juanzi,WANG Zuoying.On Construction of a Chinese Corpus Based on Semantic Dependency Re?lations[J].Journal of Chinese Information Processing,2003,17(1):46-53.

        [12]車萬翔,劉挺,李生.實體關(guān)系自動抽?。跩].中文信息學報,2005,19(2):1-6.

        CHE Wanxiang,LIU Ting,LI Sheng.Automatic Entity Relation Extraction[J].Automatic Entity Relation Ex?traction,2005,19(2):1-6.

        [13]董靜,孫樂,馮元勇,等.中文實體關(guān)系抽取中的特征

        [16]張興,汪楊俊,余暢舟.LCL并網(wǎng)逆變器改進型重復(fù)控制策略[J].電力系統(tǒng)自動化,2014(20):101-107.

        ZHANG Xing,WANG Yangjun,XU Changzhou.Im?proved repetitive control strategy for LCL grid connected inverters[J].Automation of electric power systems,2014(20):101-107.

        [17]黃天富,石新春,魏德冰.基于電流無差拍控制的三相光伏并網(wǎng)逆變器的研究[J].電力系統(tǒng)保護與控制. 2012,40(11):36-41.

        HUANG Tianfu,SHI Xinchun,WEI Debing.Study of three phase photovoltaic grid connected inverter based on Deadbeat Control[J].Power system protection and control,2012,40(11):36-41.

        [18]劉士榮,李松峰,寧康紅.基于極端學習機的光伏發(fā)電功率短期預(yù)測[J].控制工程,2013,20(2):372-376.

        LIU Shirong,LI Songfeng,NING Kanghong.Short term prediction of photovoltaic power generation based on ex?treme learning machine[J].Control engineering,2013,20(2):372-376.選擇研究[J].中文信息學報,2007,21(4):80-85.

        DONG Jing,SUN Le,F(xiàn)ENG Yuanyong,et al.Chinese Automatic Entity Relation Extraction[J].Journal of Chi?nese Information Processing,2007,21(4):80-85.

        [14]Kumar M,Dua M.Adapting Stanford Parser's Dependen?cies to Paninian Grammar's Karaka Relations Using VerbNet[J].Procedia Computer Science,2015,58:363-370.

        [15]Culotta A,Sorensen J.Dependency tree kernels for rela?tion extraction[C]//Proceedings of the 42nd Annual Meeting on Association for Computational Linguistics. Association for Computational Linguistics,2004:423.

        [16]莊成龍,錢龍華,周國棟.基于樹核函數(shù)的實體語義關(guān)系抽取方法研究[J].中文信息學報,2009,23(1):3-8.

        ZHUANG Chenglong,QIAN Longhua,ZHOU Guodong. Research on Tree Kernel-Based Entity Semantic Rela?tion Extraction[J].Journal of Chinese Information Pro?cessing,2009,23(1):3-8.

        Feature Analysis of Relation Words in Chinese Complex Sentences Based on Dependency Tree

        YANG Jincai LUO Yuequn CHEN Zhongzhong HU Jinzhu
        (Schoolof Computer Science,CentralChina Normal University,Wuhan 430079)

        Feature analysis ofrelation words in Chinese complex sentences is the core work in automatic identification ofrela?tion words in complex sentence.In this paper,a feature analysis method of relation words based on dependency tree kernel is pro?posed.In the method,grammar tree features ofcomplex sentences are extracted by tree kernelfunction.A Short Path Tree(SPT)is used for features extract.A tree kernel function is designed for similar computation of features.Experiment shows the method achieves a very good effect.

        relation word ofcomplex sentence,dependency tree kernel,dependency grammar,feature analysis

        TP391.9

        10.3969/j.issn.1672-9722.2017.08.023

        2017年2月7日,

        2017年3月20日

        國家社會科學基金項目(編號:14BYY093);國家自然科學基金項目(編號:31371275)資助。

        楊進才,男,教授,博士生導師。研究方向:現(xiàn)代信息系統(tǒng)、中文信息處理。羅越群,男,碩士研究生,研究方向:中文信息處理。陳忠忠,男,碩士研究生,研究方向:中文信息處理。胡金柱,男,教授,博士生導師,研究方向:中文信息處理、軟件工程。

        猜你喜歡
        特征
        抓住特征巧觀察
        離散型隨機變量的分布列與數(shù)字特征
        具有兩個P’維非線性不可約特征標的非可解群
        月震特征及與地震的對比
        如何表達“特征”
        被k(2≤k≤16)整除的正整數(shù)的特征
        不忠誠的四個特征
        當代陜西(2019年10期)2019-06-03 10:12:04
        詈語的文化蘊含與現(xiàn)代特征
        新聞傳播(2018年11期)2018-08-29 08:15:24
        抓住特征巧觀察
        基于特征篩選的模型選擇
        中文字幕精品亚洲一区二区三区 | 人妻少妇精品视频专区二区三区 | 亚洲精品中文幕一区二区| 亚洲小说图区综合在线| 国产人妻人伦精品1国产盗摄| 日韩人妻无码一区二区三区久久99| 在线中文字幕有码中文| 久久中文字幕日韩精品| 中文字幕精品永久在线| 美女射精视频在线观看| 视频一区二区三区黄色| 久久亚洲精品中文字幕| 亚洲av综合a色av中文| 国产高清乱理伦片| 男女视频在线一区二区| 青青草免费高清视频在线观看| av网址大全在线播放| 国产成人精品久久二区二区91 | 国产乱子伦精品无码专区 | 中文字幕av久久激情亚洲精品| 99久久婷婷亚洲综合国产| 久久久99精品免费视频| 久久综合亚洲色hezyo国产 | 黄色成人网站免费无码av| 人人超碰人人爱超碰国产| 在线成人爽a毛片免费软件| 丰满岳乱妇久久久| 欧亚精品无码永久免费视频| 国产av一区麻豆精品久久| 中文字日产幕码三区的做法步| 午夜亚洲av日韩av无码大全| 日韩免费无码一区二区三区| 国产精品理人伦国色天香一区二区| 综合图区亚洲另类偷窥| 精品国产a毛片久久久av| 亚洲av手机在线观看| 不卡日韩av在线播放| 人妻少妇不满足中文字幕| 成 人 色综合 综合网站| 春色成人在线一区av| 国产一区二区高清不卡在线|