亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        自然語(yǔ)言處理綜述

        2019-03-26 07:08:52
        福建質(zhì)量管理 2019年9期
        關(guān)鍵詞:語(yǔ)料庫(kù)規(guī)則文本

        (西南大學(xué)榮昌校區(qū)商貿(mào)學(xué)院 重慶 400000)

        一、概述

        自然語(yǔ)言處理(Natural Language Processing,NLP)是數(shù)據(jù)科學(xué)里的一個(gè)分支,它的主要覆蓋的內(nèi)容是:以一種智能與高效的方式,對(duì)文本數(shù)據(jù)進(jìn)行系統(tǒng)化分析、理解與信息提取的過(guò)程。通過(guò)使用NLP以及它的組件,我們可以管理非常大塊的文本數(shù)據(jù),或者執(zhí)行大量的自動(dòng)化任務(wù),并且解決各式各樣的問(wèn)題,如自動(dòng)摘要,機(jī)器翻譯,命名實(shí)體識(shí)別,關(guān)系提取,情感分析,語(yǔ)音識(shí)別,以及主題分割等等。

        二、自然語(yǔ)言處理的應(yīng)用

        鑒于深度學(xué)習(xí)日漸成熟,它的無(wú)監(jiān)督學(xué)習(xí)與深度挖掘深層次特征的能力使得自然語(yǔ)言處理能夠應(yīng)用于實(shí)踐來(lái)解決現(xiàn)實(shí)問(wèn)題。下面將從詞性標(biāo)注,句法分析,情感分析,機(jī)器翻譯等幾個(gè)方面對(duì)近幾年的應(yīng)用技術(shù)進(jìn)行綜述。

        (一)詞性標(biāo)注

        詞性標(biāo)注(Part-of-Speech tagging 或POS tagging),又稱詞類標(biāo)注或者簡(jiǎn)稱標(biāo)注,是指為分詞結(jié)果中的每個(gè)單詞標(biāo)注一個(gè)正確的詞性的程序,也即確定每個(gè)詞是名詞、動(dòng)詞、形容詞或其他詞性的過(guò)程。

        2018年Elaheh S,Deyuan G等使用最先進(jìn)的加速器,自動(dòng)處理器和FPGA,提出了一種高效的POS標(biāo)記方法,得出更多樣化的目標(biāo)那幾和語(yǔ)料庫(kù)越大,POS標(biāo)記的準(zhǔn)確性就會(huì)越高,而增加規(guī)則的數(shù)量只會(huì)增加較小的計(jì)算開銷。

        (二)句法分析

        Cereda P R M,Miura N K2018年提出一種基于規(guī)則的自然語(yǔ)言句子改寫系統(tǒng)[1],利用一種主動(dòng)技術(shù)對(duì)自然語(yǔ)言句子進(jìn)行策略分析。將句子的依賴結(jié)構(gòu)分解為一個(gè)語(yǔ)法樹。引入重寫系統(tǒng)和基于層次重寫的句法分析方法,將分析本身化成成若干抽象層次,以層次結(jié)構(gòu)的方式處理。該方法較好地解決了句子的句法敏感性問(wèn)題,減少了語(yǔ)言處理中相互依賴結(jié)構(gòu)的可能性。同年,F(xiàn)aiza Qanber Ali通過(guò)實(shí)驗(yàn)得出[2],對(duì)象是一個(gè)實(shí)體或參與者,它經(jīng)歷了行為執(zhí)行者所做的動(dòng)作。從句法上講,阿拉伯語(yǔ)的賓語(yǔ)可以是同源的,使役的或伴隨的,而英語(yǔ)的并于可以是直接賓語(yǔ),間接賓語(yǔ)或補(bǔ)語(yǔ)。這個(gè)結(jié)論在結(jié)合英語(yǔ)自然語(yǔ)言處理經(jīng)驗(yàn)中,促進(jìn)了對(duì)阿拉伯語(yǔ)的自然語(yǔ)言處理的發(fā)展。

        (三)情感分析

        情感分析(Sentiment Analysis,SA)又稱傾向性分析。2018年,Ravishankar,N.,Shriram等提出了一個(gè)基于語(yǔ)法規(guī)則的推文情感分類的n-gram模型[3],并運(yùn)用TF-IDF,否定規(guī)則和形容詞規(guī)則對(duì)情緒進(jìn)行分類[9]。根據(jù)他們的報(bào)告結(jié)果,形容詞規(guī)則比TF-IDF和否定規(guī)則產(chǎn)生更好的準(zhǔn)確率,高達(dá)64.72%。Leila Arras,Gregoire Montavon等提出一種特殊的傳播規(guī)則[4],將分層關(guān)聯(lián)傳播(LRP)的應(yīng)用擴(kuò)展到遞歸神經(jīng)網(wǎng)絡(luò)。該項(xiàng)技術(shù)被實(shí)驗(yàn)證明比之前流行的基于梯度的相關(guān)方法有更好的結(jié)果。

        (四)機(jī)器翻譯

        2017年,Melvin Johnson,Mike Schuster等與谷歌翻譯團(tuán)隊(duì)合作提出了一種利用單神經(jīng)機(jī)器翻譯(NMT)支持使用單一模型的多語(yǔ)言NMT系統(tǒng)[5]。該模型使用單編譯碼器來(lái)驗(yàn)證真正多語(yǔ)言翻譯的使用,而將該模型投入生產(chǎn)的產(chǎn)品將是自然語(yǔ)言處理史上第一部論證零數(shù)據(jù)翻譯可能性的作品。同年,Zhaopeng Tu,Yang Liu等人在波束搜索策略中發(fā)現(xiàn)非常大的光束產(chǎn)生的效果更差[6],波束搜索中應(yīng)存在一個(gè)最佳光束寬度的“最佳點(diǎn)”,認(rèn)為進(jìn)一步研究超參數(shù)在波束搜索中的魯棒性對(duì)NMT的研究具有重要意義。

        三、問(wèn)題與展望

        (一)難點(diǎn)與問(wèn)題

        1.指代消歧

        即句子中的指代詞還原,因?yàn)檎Z(yǔ)料庫(kù)中的語(yǔ)料并不足夠,此外,盡管消歧問(wèn)題被多方研究,但目前仍沒(méi)有較高正確率的模型。

        2.二義性

        有些句子,往往有多種理解方式,其中以兩種理解方式的最為常見,稱二義性。這涉及情感句模問(wèn)題。而因?yàn)閭€(gè)體表達(dá)差異,所以語(yǔ)言表達(dá)的句子沒(méi)有規(guī)范的模型,也即情感句模庫(kù)即使已經(jīng)包含大量句模仍不能保證句子斷句準(zhǔn)確性。

        3.OOV問(wèn)題

        隨著詞嵌入技術(shù)大熱后,使用預(yù)訓(xùn)練的詞向量似乎成為了一個(gè)主流。但文本數(shù)據(jù)中的詞很可能不在預(yù)訓(xùn)練好的詞表里面,此即OOV(out of vocabulary)。目前主流方法是要么當(dāng)做UNK處理,要么生成隨機(jī)向量或零向量處理,當(dāng)然都存在一定的弊端。更合理的是用subword和char-CNN。

        4.文本生成的評(píng)價(jià)指標(biāo)

        目前文本生成的評(píng)價(jià)指標(biāo)多用BLEU或者ROUGE,但這兩個(gè)指標(biāo)都是基于n-gram的,也就是說(shuō)會(huì)判斷生成的句子與標(biāo)簽句子詞粒度上的相似度。這用在文本摘要和對(duì)話生成中會(huì)有很大的問(wèn)題。

        (二)中文自然語(yǔ)言處理問(wèn)題

        因?yàn)槟壳跋冗M(jìn)的,前沿的研究都是由國(guó)外學(xué)者領(lǐng)導(dǎo)主持,所以大多數(shù)自然語(yǔ)言處理的研究成果可以說(shuō)是對(duì)英語(yǔ)的自然語(yǔ)言處理。對(duì)于國(guó)內(nèi)而言,自然語(yǔ)言處理方面的研究沒(méi)有突破性地發(fā)展,而且存在研究數(shù)據(jù)不足,研究實(shí)力較國(guó)外學(xué)者還有較大差距問(wèn)題,除此之外,我國(guó)是一個(gè)多民族國(guó)家,這就意味著我們不但要考慮到普通話的處理,還有少數(shù)民族的語(yǔ)言處理。

        四、結(jié)束語(yǔ)

        自然語(yǔ)言處理作為人機(jī)交互的關(guān)鍵性技術(shù),雖然已經(jīng)隨著深度學(xué)習(xí)的發(fā)展而得到飛躍進(jìn)步,但這些進(jìn)步幾乎都是以英語(yǔ)為處理對(duì)象。而中文比之英語(yǔ),又將會(huì)有更多的新問(wèn)題。因此中文自然語(yǔ)言處理的研究主力只可能是以中文為母語(yǔ)的國(guó)內(nèi)學(xué)者。因此國(guó)內(nèi)學(xué)者能否解決好中文自然語(yǔ)言處理中的實(shí)體歧義,情感分析,句模庫(kù),語(yǔ)料庫(kù)等問(wèn)題很大程度地決定了中文自然語(yǔ)言處理的研究進(jìn)度快慢。

        猜你喜歡
        語(yǔ)料庫(kù)規(guī)則文本
        撐竿跳規(guī)則的制定
        數(shù)獨(dú)的規(guī)則和演變
        《語(yǔ)料庫(kù)翻譯文體學(xué)》評(píng)介
        在808DA上文本顯示的改善
        基于doc2vec和TF-IDF的相似文本識(shí)別
        電子制作(2018年18期)2018-11-14 01:48:06
        讓規(guī)則不規(guī)則
        Coco薇(2017年11期)2018-01-03 20:59:57
        把課文的優(yōu)美表達(dá)存進(jìn)語(yǔ)料庫(kù)
        TPP反腐敗規(guī)則對(duì)我國(guó)的啟示
        文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學(xué)隱喻
        基于JAVAEE的維吾爾中介語(yǔ)語(yǔ)料庫(kù)開發(fā)與實(shí)現(xiàn)
        狠狠色综合7777久夜色撩人ⅰ| 国产高清自产拍av在线| 久草手机视频在线观看| 国内精品久久久久影院薰衣草| 丰满岳乱妇久久久| 欧美黑人xxxx性高清版| 街拍丝袜美腿美女一区| 一本久久综合亚洲鲁鲁五月天| 亚洲 暴爽 av人人爽日日碰| 亚洲欧洲日韩另类自拍| 亚洲综合中文日韩字幕| 成人免费a级毛片无码片2022| 日韩人妻无码一区二区三区久久99 | 国产av国片精品jk制服| 久久综合精品国产丝袜长腿| www.av在线.com| 人妻有码av中文幕久久| 成人影院yy111111在线| 亚洲成av人最新无码| 中文字幕一区二区三区在线视频| 日本一二三区免费在线| 成人国产精品一区二区视频| 久久尤物AV天堂日日综合| 中文字幕精品亚洲一区二区三区| 中文字幕国产精品一二三四五区| 国产精品无码av一区二区三区| 欧美日韩亚洲一区二区精品| 丰满少妇av一区二区三区 | 国产真实乱对白精彩久久老熟妇女| 日韩在线不卡免费视频| 中文字幕亚洲精品高清| 久久久久久夜精品精品免费啦| 三级在线看中文字幕完整版| 亚洲区精选网址| 在线成人影院国产av| 末成年女a∨片一区二区| 亚洲AⅤ无码日韩AV中文AV伦| 国产免费一区二区三区在线观看| 免费大片黄国产在线观看| 国产亚洲精品久久久久秋霞| 亚洲av午夜福利精品一区二区|