亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        面向方面級情感分類與深度學(xué)習(xí)的分層網(wǎng)絡(luò)模型①

        2020-03-09 10:28:18李重霖李明軒謝卓亨張楚其陳珂
        關(guān)鍵詞:極性語料分層

        李重霖,李明軒,謝卓亨,張楚其,陳珂

        (1.廣東石油化工學(xué)院 自動(dòng)化學(xué)院,廣東 茂名 525000;2.廣東石油化工學(xué)院 計(jì)算機(jī)學(xué)院,廣東 茂名 525000)

        基于方面的情感分類是情感分析領(lǐng)域的細(xì)粒度子任務(wù),也是一個(gè)深層次的情感分析任務(wù)[1-3]。與一般情感分析不同,基于方面的情感分類旨在推測特定目標(biāo)詞在不同語境下的情感極性。同一個(gè)句子,針對不同的目標(biāo)可能會出現(xiàn)完全相反的情感極性?;谏窠?jīng)網(wǎng)絡(luò)的方法在情感分析中已經(jīng)得到廣泛應(yīng)用,取得了較好的性能。注意力機(jī)制在關(guān)系分類、機(jī)器翻譯等相關(guān)領(lǐng)域中具有優(yōu)異的表現(xiàn)性能[4,5]。同時(shí),注意力機(jī)制能很好地與神經(jīng)網(wǎng)絡(luò)相結(jié)合,在基于方面的情感分類中獲得更好的結(jié)果。然而,這些方法只能在訓(xùn)練模型時(shí)專注于方面本身,忽略了目標(biāo)詞語對句子的影響,且無法在整個(gè)語料中提取該方面的重要信息。

        一般來說,同一個(gè)語料中表達(dá)相似觀點(diǎn)的句子具有相同的情感極性,因此同一語料中不同句子之間的關(guān)系,對于基于方面的情感分類很重要。例如,一些短句沒有任何明顯的情感詞來預(yù)測極性,僅僅考慮獨(dú)立句子就很難預(yù)測這些句子的情感極性,而語境關(guān)系可以用來處理這些情況。

        基于此,本文提出了一種層次化的區(qū)域性CNN-LSTM模型,在訓(xùn)練過程中考慮分區(qū)域和句子層面的注意力,同時(shí)利用句子內(nèi)部和句子間的關(guān)系。分層區(qū)域CNN旨在通過獲取接收的多個(gè)區(qū)域來搜索句子之間的關(guān)系,并且新的分層輸入能夠在整個(gè)搜索中提取方面的長距離依賴性。分層LSTM體系結(jié)構(gòu)由單詞級別和句子級別LSTM組成。單詞級別的LSTM可以接收單詞級別的順序輸入和注意力,集中考查句子的不同方面即不同的目標(biāo)。句子級別LSTMs能夠通過從分層區(qū)域CNN接收的連續(xù)輸入來獲取句子級別的注意力,用以表達(dá)句子在整個(gè)評論中的重要關(guān)系信息。

        1 分層分區(qū)域CNN-LSTM模型

        本文提出的CNN-LSTM模型,主要考慮關(guān)注單詞級和句子級的情感信息,充分利用更多豐富的句子和整個(gè)語料的特征信息。模型分4部分:(1)區(qū)域CNN:接收幾個(gè)不同區(qū)域的上下文輸入。(2)分層輸入層:向分層CNN輸入與語料嵌入矩陣。(3)合并層:將語料信息與區(qū)域CNN輸出的功能相結(jié)合。(4)分層LSTM:利用單詞級和句子級的注意力來獲得更深入的信息,來自句子內(nèi)部和句子間的關(guān)系。

        1.1 任務(wù)定義

        給定一個(gè)句子s= {w1,w2,...,t,...,wn},其中t是句子中的一個(gè)目標(biāo),句子中有0個(gè)或多個(gè)目標(biāo)對應(yīng)不同的方面。每個(gè)方面由一個(gè)實(shí)體和一個(gè)屬性組成,例如FOOD#QUALITY,基于方面的情感分類旨在預(yù)測句子中不同方面的情感極性。對于每個(gè)方面,生成一個(gè)嵌入a∈Rm的m維表示方面,其中a是實(shí)體和屬性嵌入的平均值。

        1.2 區(qū)域CNN

        區(qū)域CNN是針對輸入長文本任務(wù)的CNN的改進(jìn),根據(jù)目標(biāo)將語料的每個(gè)句子劃分為一個(gè)或多個(gè)區(qū)域。本文的區(qū)域CNN主要受區(qū)域CNN-LSTM長文本情感分析模型的啟發(fā)。對于評論中的每個(gè)句子,都非常注意目標(biāo)和目標(biāo)周圍的單詞,例如s={w1,w2,...,t1,...,t2,...,wn},句子中有兩個(gè)目標(biāo),根據(jù)目標(biāo)將這個(gè)句子分成兩個(gè)區(qū)域。對于每個(gè)區(qū)域,都會將該區(qū)域的長度切斷或填充到目標(biāo)上,并將其作為輸入提供給區(qū)域CNN。由于s={w1,w2,...,wn}是一個(gè)沒有任何目標(biāo)詞的句子,可以直接將它切割或填充到長度為h的區(qū)域。

        1.3 分層區(qū)域CNN

        1.4 分層LSTM

        2 實(shí)驗(yàn)結(jié)果與分析

        2.1 實(shí)驗(yàn)數(shù)據(jù)集

        在Semeval2016任務(wù)5的兩種語言的4個(gè)數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn)。每個(gè)數(shù)據(jù)集包含一系列客戶評論語料,每個(gè)評論包含幾個(gè)句子和方面,其統(tǒng)計(jì)信息見表1。本文刪除了沒有超出任務(wù)范圍的方面的句子。

        表1 數(shù)據(jù)集統(tǒng)計(jì)信息

        在實(shí)驗(yàn)中,使用Glove初始化英文的詞向量和中文的Leipzig Corpora Collection。并使用了300維的單詞向量,在CNN中分別設(shè)置了3,4,5個(gè)具有100個(gè)特征映射的窗口。訓(xùn)練所有模型的最小批量為32,退出率為0.5,L2正則化權(quán)重為0.001,以及采用Ada Grad的更新規(guī)則。區(qū)域長度設(shè)為50,并且對中文數(shù)據(jù)進(jìn)行細(xì)分。

        2.2 典型模型實(shí)驗(yàn)

        將本文模型與幾種典型模型進(jìn)行比較,其中包括ATT-CNN,LSTM,ATT-LSTM,HP-LSTM。

        (1)RCNN-LSTM模型。該模型為本文構(gòu)建的模型,沒有在CNN架構(gòu)中使用分層輸入層,不能考慮整個(gè)評論中方面的長距離依賴性。(2)HRCNN-LSTM模型。該模型為本文的完整模型,它能夠在整個(gè)預(yù)測過程中捕捉深度依賴的方面。(3)ATT-CNN模型?;谧⒁饬Φ腃NN模型,主要在語句對建模方面有較好的性能,本文使用類似的模型來接收單詞嵌入和方面嵌入,以便能夠關(guān)注預(yù)測中的方面。(4)LSTM模型。標(biāo)準(zhǔn)的LSTM,沒有加入針對方面的注意力,無法準(zhǔn)確推斷同一句中不同方面的情感極性。(5)ATT-LSTM模型?;谧⒁饬Φ腖STM模型,可以集中關(guān)注句子的不同方面。該模型實(shí)現(xiàn)了方面級別情感分類,但使用獨(dú)立句子作為輸入并嵌入額外的方面向量。(6)HP-LSTM模型。一個(gè)能夠利用句子內(nèi)部和句子間關(guān)系的層次LSTM模型,這個(gè)模型考慮了方面和整個(gè)評論之間的關(guān)系。

        在不同領(lǐng)域數(shù)據(jù)集上,采用本文的RCNN-LSTM和HRCNN-LSTM模型及幾種基于神經(jīng)網(wǎng)絡(luò)的模型進(jìn)行基于方面的情感分類的二元預(yù)測(正面和負(fù)面),其準(zhǔn)確性見表2。

        表2 二元預(yù)測準(zhǔn)確率 %

        由表2可知,本文模型在所有領(lǐng)域數(shù)據(jù)集上的二元預(yù)測準(zhǔn)確率超過其他模型。相對于二元預(yù)測的結(jié)果,本文模型比其他基于神經(jīng)網(wǎng)絡(luò)的模型具有更好的性能,表明本文方法的有效性。此外,與RCNN-LSTM相比,使用分層輸入層的HRCNN-LSTM在所有數(shù)據(jù)集上的準(zhǔn)確性有所提高,揭示了CNN分層輸入在本文方法中是有效的。

        2.3 根據(jù)目標(biāo)劃分區(qū)域的影響

        本文采用了基于目標(biāo)劃分的兩種策略:一是根據(jù)目標(biāo)將評論的每個(gè)句子分成幾個(gè)區(qū)域;二是將一個(gè)單獨(dú)的句子作為數(shù)據(jù)集的一個(gè)區(qū)域,通過兩種策略驗(yàn)證本文基于目標(biāo)劃分區(qū)域方法的有效性?;谀繕?biāo)劃分區(qū)域,采用本文的兩種模型在不同長度區(qū)域內(nèi)測試其準(zhǔn)確率,其結(jié)果如圖1所示。圖1中,TAR為根據(jù)目標(biāo)劃分評論區(qū)域,DIR為使用單個(gè)句子作為區(qū)域。

        圖1 本文模型具有不同長度區(qū)域的分類準(zhǔn)確率

        由圖1可知,HRCNN-LSTM和RCNN-LSTM在基于目標(biāo)劃分區(qū)域方面比直接使用單個(gè)句子作為區(qū)域的效果更好。這表明了根據(jù)目標(biāo)劃分區(qū)域是必要的。

        2.4 典型例子分析

        采用HRCNN-LSTM(本文模型)、ATT-LSTM和HP-LSTM在餐館數(shù)據(jù)集上進(jìn)行預(yù)測,其結(jié)果見表3。

        表3 典型樣例分析

        表3中例1是一個(gè)短句,沒有任何明顯的情感詞匯,ATT-LSTM模型的獨(dú)立句子分類器預(yù)測了一個(gè)錯(cuò)誤的標(biāo)簽,而HP-LSTM和HRCNN-LSTM通過捕獲評論的上下文關(guān)系識別正確。表3中例2是一個(gè)模棱兩可的句子,ATT-LSTM和HP-LSTM都不能推斷模糊句子,而本文模型卻揭示了正確的答案。例2在同一評論的其他句子中仍然可以表現(xiàn)出情感極性,表明提取某個(gè)方面的遠(yuǎn)距離依賴性的意義。對于例3和例4中給出的多方面和模糊句子,本文HRCNN-LSTM能夠有效地區(qū)分不同方面的情感極性。

        3 結(jié)語

        本文提出了一個(gè)層次化區(qū)域性的CNN-LSTM,并采用一個(gè)基于方面的情感分類的CNN層次化輸入層。該模型能夠通過分層體系結(jié)構(gòu)在整個(gè)評論中提取方面的長距離依賴性,并通過探索單詞級和句子級關(guān)注來捕獲句子的內(nèi)部和相互關(guān)系。通過對SemEval-2016基于方面的情感分類任務(wù)的多個(gè)領(lǐng)域數(shù)據(jù)集進(jìn)行實(shí)驗(yàn),驗(yàn)證了本文模型的有效性。

        猜你喜歡
        極性語料分層
        跟蹤導(dǎo)練(四)
        一種沉降環(huán)可準(zhǔn)確就位的分層沉降儀
        雨林的分層
        有趣的分層
        基于語料調(diào)查的“連……都(也)……”出現(xiàn)的語義背景分析
        表用無極性RS485應(yīng)用技術(shù)探討
        華語電影作為真實(shí)語料在翻譯教學(xué)中的應(yīng)用
        一種新型的雙極性脈沖電流源
        《苗防備覽》中的湘西語料
        國內(nèi)外語用學(xué)實(shí)證研究比較:語料類型與收集方法
        全免费a级毛片免费看| 日韩精品极品免费在线视频| 天堂丝袜美腿在线观看| 日韩视频在线观看| 俺来也俺去啦最新在线| 97精品伊人久久大香线蕉app| 欧美手机在线视频| 高清国产亚洲精品自在久久| 亚洲毛片在线免费视频| 777米奇色8888狠狠俺去啦| 日本一区二区不卡视频| 久草视频华人在线观看| 亚洲天堂av路线一免费观看| 99re66在线观看精品免费| 亚洲av无码无限在线观看| 在线va免费看成| 久久精品这里只有精品| 国产大全一区二区三区| 久久777国产线看观看精品 | 精品国产成人亚洲午夜福利| 视频女同久久久一区二区三区| 亚洲国产综合人成综合网站| 丰满人妻熟妇乱又仑精品| 免费特级毛片| 日韩成人无码v清免费| 91精品福利一区二区三区| 亚洲综合第一页中文字幕| 少妇人妻中文字幕hd| 国产精品后入内射日本在线观看| 一区二区无码精油按摩| 蜜桃传媒网站在线观看| 色妞ww精品视频7777| 无码日韩人妻AV一区免费| 男女动态视频99精品| 人妻无码一区二区三区| 欧美日韩久久久精品a片| 日本av一区二区播放| 女人av天堂国产在线| 国产综合久久久久| 精品一区二区三区在线视频观看| 久久中文字幕亚洲综合|