亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        中文重疊關(guān)系抽取的動態(tài)分層級聯(lián)標(biāo)記模型

        2024-01-01 00:00:00張利張歡歡袁玉波
        關(guān)鍵詞:文本挖掘機(jī)制

        摘要:構(gòu)建了動態(tài)分層級聯(lián)標(biāo)記中文重疊關(guān)系抽?。≧WG-LSA)模型:首先基于預(yù)訓(xùn)練語言模型和gated 機(jī)制構(gòu)建了動態(tài)字詞融合特征學(xué)習(xí)模型(RWG),有效避免了主體標(biāo)記模塊的特征缺失和無法并行計(jì)算等問題;其次引入動態(tài)權(quán)局部自注意力(LSA),自主學(xué)習(xí)到主體層面的語義特征;最后在有效融合了輸入序列的全局和主體局部特征的基礎(chǔ)上,實(shí)現(xiàn)RWG-LSA 模型對文本中實(shí)體對和關(guān)系的抽取。在SKE 中文數(shù)據(jù)集上的實(shí)驗(yàn)表明,本模型對重疊關(guān)系抽取有顯著效果,F(xiàn)1 值達(dá)到了82.44%。

        關(guān)鍵詞:文本挖掘;中文重疊關(guān)系抽取;動態(tài)字詞融合;預(yù)訓(xùn)練語言模型;gated 機(jī)制;局部自注意力機(jī)制

        中圖分類號:TP391.1 文獻(xiàn)標(biāo)志碼:A

        在文本數(shù)據(jù)爆炸式增長的今天,如何從海量文本數(shù)據(jù)中挖掘出重要信息成為自然語言處理領(lǐng)域的主流方向,關(guān)系抽取是其中的一項(xiàng)重要方式。關(guān)系抽取任務(wù)是從非結(jié)構(gòu)化文本數(shù)據(jù)中抽取出結(jié)構(gòu)(主體、關(guān)系、客體)的三元組數(shù)據(jù),以此表達(dá)實(shí)體以及實(shí)體間的語義關(guān)系。由三元組數(shù)據(jù)作為基本構(gòu)成單元的知識圖譜和智能問答系統(tǒng),可以協(xié)助司法案件處理、企業(yè)合同智能管理等方面的相關(guān)人員更好地掌握信息情報(bào)、識別相關(guān)風(fēng)險(xiǎn),實(shí)現(xiàn)智能化輔助決策。因此,關(guān)系抽取作為這些下游任務(wù)的數(shù)據(jù)來源,具有較高的應(yīng)用價(jià)值和研究價(jià)值。

        目前,聯(lián)合抽取實(shí)體和關(guān)系的方法是關(guān)系抽取中的主流方法。許多新穎的聯(lián)合抽取方法被提出[1-2],其效果優(yōu)于基于流水線[1] 的方法。然而,大多數(shù)現(xiàn)有的方法并不能有效處理實(shí)體間存在重疊語義關(guān)系的情況?,F(xiàn)有的解決關(guān)系重疊問題的聯(lián)合抽取方法大致可分為3 種:(1)基于分層級聯(lián)標(biāo)記的方法通常使用二進(jìn)制(0/1) 標(biāo)記序列來確定主體的開始和結(jié)束標(biāo)記,以及每種關(guān)系下客體的開始和結(jié)束標(biāo)記。Wei 等[3]基于BERT[4](Bidirectional Encoder Representationsfrom Transformers) 提出分層級聯(lián)標(biāo)記(CasRel)的方式解決關(guān)系重疊問題,在數(shù)據(jù)集NYT 和WebNLG 上取得了顯著效果;Ren 等[5] 針對關(guān)系類別不均衡的問題,構(gòu)建了基于BERT 和交叉熵?fù)p失的置信度閾值的級聯(lián)標(biāo)記模型(ConCasRTE)。(2)基于表格填充的方法為每種關(guān)系維護(hù)一個(gè)擁有該關(guān)系的實(shí)體開始位置和結(jié)束位置的表。Wang等[6] 采用單階段標(biāo)記對鏈接(TPLinker)方式實(shí)現(xiàn)關(guān)系表填充,并解決了暴露偏差問題。(3)基于Seq2Seq 的方法將三元組視為序列數(shù)據(jù),按一定順序生成三元組。Zeng等[7] 按照先生成關(guān)系再生成實(shí)體的順序,提出了復(fù)制機(jī)制(CopyRE)解決關(guān)系重疊問題;Nayak 等[8] 針對復(fù)制機(jī)制無法識別完整實(shí)體的缺點(diǎn)改進(jìn)解碼方式,一種方法以字逐個(gè)預(yù)測,即WDec( Word-based Decoding) ,另一種方法是解碼生成實(shí)體頭尾位置, 即PNDec( PointerNetwork-based Decoding)。除上述方法外,F(xiàn)u 等[9] 還引入圖卷積網(wǎng)絡(luò)(Graph Convolutional Network,GCN)將文本建模作為關(guān)系圖來預(yù)測每個(gè)實(shí)體對的潛在關(guān)系。

        猜你喜歡
        文本挖掘機(jī)制
        構(gòu)建“不敢腐、不能腐、不想腐”機(jī)制的思考
        自制力是一種很好的篩選機(jī)制
        文苑(2018年21期)2018-11-09 01:23:06
        數(shù)據(jù)挖掘技術(shù)在電站設(shè)備故障分析中的應(yīng)用
        基于LDA模型的95598熱點(diǎn)業(yè)務(wù)工單挖掘分析
        文本數(shù)據(jù)挖掘在電子商務(wù)網(wǎng)站個(gè)性化推薦中的應(yīng)用
        商(2016年34期)2016-11-24 16:28:51
        從《遠(yuǎn)程教育》35年載文看遠(yuǎn)程教育研究趨勢
        定向培養(yǎng) 還需完善安置機(jī)制
        慧眼識璞玉,妙手煉渾金
        文本觀點(diǎn)挖掘和情感分析的研究
        破除舊機(jī)制要分步推進(jìn)
        人人爽人人爽人人爽| 日韩av中出在线免费播放网站| 国产综合一区二区三区av | 97久久综合区小说区图片专区| 免费黄网站一区二区三区| 国产情侣一区二区三区| 欧美饥渴熟妇高潮喷水水| 国产WW久久久久久久久久| 亚洲一区二区三区亚洲| 国产乱码人妻一区二区三区| 日日摸日日碰夜夜爽无码| 久久久AV无码精品免费| 伊人久久综合狼伊人久久| 国产人妻鲁鲁一区二区| 无码成人aaaaa毛片| 色综合久久精品中文字幕| 日本国产一区二区在线观看| 亚洲国产综合精品中久| 亚洲愉拍99热成人精品热久久| 亚洲国际无码中文字幕| 熟女人妻中文字幕一区| 精品一区中文字幕在线观看 | 亚洲中文字幕无码专区| 免费无码AⅤ片在线观看| 中国黄色一区二区三区四区| 国产无遮挡又黄又爽免费网站| 99热视热频这里只有精品| 人妖与人妖免费黄色片| 人人妻人人澡人人爽人人dvd| 久久人人爽人人爽人人片亞洲| 亚洲AV无码日韩综合欧亚| 亚洲天堂av一区二区| 国内精品视频在线播放不卡| 极品美女高潮喷白浆视频| 午夜视频福利一区二区三区| 日韩在线精品视频一区| 毛片a级毛片免费观看| 久久精品亚洲中文无东京热| 精品视频手机在线免费观看| 免费超爽大片黄| 国产精品黄在线观看免费软件|