亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于Bi-LSTM-Attention 的英文文本情感分類(lèi)方法

        2022-09-02 06:24:56朱亞輝
        電子設(shè)計(jì)工程 2022年16期
        關(guān)鍵詞:分類(lèi)情感模型

        朱亞輝

        (長(zhǎng)沙師范學(xué)院外國(guó)語(yǔ)學(xué)院,湖南長(zhǎng)沙 410100)

        情感分類(lèi)是自然語(yǔ)言處理中的一種底層技術(shù),對(duì)于問(wèn)答系統(tǒng)、推薦系統(tǒng)等任務(wù)都有較大的幫助[1]。當(dāng)前,隨著社交媒體的廣泛普及,網(wǎng)絡(luò)上的很多關(guān)于商品、服務(wù)的評(píng)論留言對(duì)改善商家服務(wù)以及了解人們的情感傾向很有幫助[2]。而情感分類(lèi)任務(wù)就是能夠根據(jù)評(píng)論文本中的情感色彩傾向性進(jìn)行分類(lèi),得到積極和消極情感兩個(gè)類(lèi)別[3]。該文將重點(diǎn)討論句子級(jí)別的情感分類(lèi)任務(wù),即對(duì)給定的語(yǔ)句進(jìn)行情感二分類(lèi)。

        1 相關(guān)工作

        最近十幾年里,基于深度學(xué)習(xí)的理論在圖像和文本處理領(lǐng)域均取得了飛躍式的成果與發(fā)展[4-5],情感分類(lèi)任務(wù)自然也引入了基于深度學(xué)習(xí)的方法[6-8]。當(dāng)前,盡管情感分類(lèi)領(lǐng)域中有不少的研究工作都已達(dá)到了良好的成效,但一方面情感模型無(wú)法有效地捕捉兩個(gè)方向的句子上下文依賴[9],另一方面又無(wú)法對(duì)情感特征內(nèi)部的相互依賴性進(jìn)行建模。

        為了解決上述問(wèn)題,該文同時(shí)采用雙向長(zhǎng)短期記憶(Bidirectional Long Short-term Memory)網(wǎng)絡(luò)Bi-LSTM 與自注意力機(jī)制,提出了一種采用Bi-LSTM 與Attention 的英文文本情感分類(lèi)算法模型。

        2 相關(guān)技術(shù)

        2.1 長(zhǎng)短期記憶網(wǎng)絡(luò)LSTM

        圖1為一個(gè)基本的LSTM的結(jié)構(gòu)圖。

        圖1 標(biāo)準(zhǔn)的LSTM結(jié)構(gòu)

        LSTM 網(wǎng)絡(luò)[10]是基于門(mén)控機(jī)制構(gòu)建而成的,每個(gè)LSTM 單元中主要包含了輸入門(mén)i、遺忘門(mén)f和輸出門(mén)o。首先,遺忘門(mén)根據(jù)當(dāng)前輸入與上一個(gè)隱藏狀態(tài)ht-1來(lái)選擇遺忘上一個(gè)狀態(tài)ht-1中的哪些信息。其次,輸入門(mén)對(duì)單元的狀態(tài)進(jìn)行更新,決定了輸入xt和上一個(gè)隱藏狀態(tài)ht-1的信息通過(guò)量。最后,輸出門(mén)控制從當(dāng)前單元狀態(tài)到隱藏狀態(tài)的信息流。在第t個(gè)時(shí)間步單個(gè)LSTM 單元狀態(tài)的運(yùn)算流程如下:

        其中,xt∈Rn是輸入向量,而W∈Rm·n是各個(gè)門(mén)的參數(shù),b∈Rm是偏置向量;上標(biāo)n與m分別是輸入向量的維度與數(shù)據(jù)集中單詞的總數(shù);而[·]表示拼接操作。

        2.2 雙向長(zhǎng)短期記憶網(wǎng)絡(luò)

        Bi-LSTM 網(wǎng)絡(luò)[11]同時(shí)考慮了從前往后和從后往前兩個(gè)方向的上下文信息,這樣就可以獲取到單個(gè)句子中相鄰詞語(yǔ)間的依賴關(guān)系。如圖2 所示是一個(gè)標(biāo)準(zhǔn)的Bi-LSTM 的基本結(jié)構(gòu)。給定輸入xt和上一個(gè)時(shí)間步的隱藏狀態(tài)ht-1,前向和后向的LSTM 的隱藏狀態(tài)的計(jì)算公式如下:

        圖2 標(biāo)準(zhǔn)的Bi-LSTM結(jié)構(gòu)

        最終,Bi-LSTM 的輸出是拼接前后兩個(gè)方向的隱藏狀態(tài)得出的,即。

        3 基于Bi-LSTM-Attention的情感分類(lèi)模型

        如圖3 所示為該文所提模型的整體網(wǎng)絡(luò)架構(gòu)圖。該模型主要包含了以下幾個(gè)必不可少的組成部分,分別是輸入句子序列層、詞嵌入層、Bi-LSTM 層、自注意力層和一個(gè)Softmax 分類(lèi)器。

        圖3 Bi-LSTM-Attention模型的整體架構(gòu)圖

        3.1 輸入句子序列層

        輸入的第i句子si可以表示為:

        其中,xik是句子序列中的第k個(gè)單詞,n是句子序列的最大長(zhǎng)度。

        3.2 詞嵌入層

        詞嵌入層主要用于將輸入句子序列中的單詞表示為一個(gè)個(gè)維度為n的實(shí)值向量。該文使用了300維的GloVe 向量作為詞嵌入預(yù)訓(xùn)練模型。

        3.3 Bi-LSTM層

        Bi-LSTM 利用前后兩個(gè)方向的上下文特征信息,有效解決了上下文信息的提取和利用問(wèn)題。Bi-LSTM 層的輸出為:

        3.4 自注意力層

        在情感分類(lèi)任務(wù)中,自注意力機(jī)制可以實(shí)現(xiàn)對(duì)當(dāng)前輸入進(jìn)行權(quán)重調(diào)整,突出了對(duì)分類(lèi)結(jié)果有重大影響的詞語(yǔ)的作用,而非同等對(duì)待所有的上下文信息。給定Bi-LSTM 層的隱層輸出h,注意力權(quán)重的計(jì)算過(guò)程如下:

        其中,K∈,α∈RT,r∈Rd,Wh∈Rd×d,Wa∈以及w∈都是參數(shù)矩陣。α是注意力權(quán)重矩陣,而r是輸入句子的權(quán)重表示。ha?ek表示向量h重復(fù)地拼接了k次,而ek是大小為k的列向量。

        最終,用于分類(lèi)的句子表示為:

        3.5 Softmax分類(lèi)器

        該文通過(guò)Softmax 層來(lái)計(jì)算條件概率分布,即預(yù)測(cè)輸入句子對(duì)應(yīng)的標(biāo)簽。條件概率的計(jì)算公式為:

        其中,Wsm和bsm分別是Softmax 層的權(quán)重參數(shù)與偏置參數(shù)。

        3.6 損失函數(shù)

        該文在訓(xùn)練的過(guò)程中主要使用交叉熵?fù)p失函數(shù):

        其中,i和j分別是句子的索引與類(lèi)別索引,yi是預(yù)測(cè)的標(biāo)簽。λ是L2正則化項(xiàng),θ代表模型的可優(yōu)化參數(shù)集合,即{Wf,bf,Wi,bi,Wc,bc,Wo,bo,Wsm,bsm}。同樣地,詞嵌入向量也是模型的參數(shù)。

        4 實(shí)驗(yàn)結(jié)果與分析

        4.1 實(shí)驗(yàn)設(shè)置

        在訓(xùn)練模型之前,該文通過(guò)GloVe 詞向量來(lái)建立所有的詞向量,模型中的詞向量及其隱藏層向量均為300 維,Bi-LSTM 層的節(jié)點(diǎn)數(shù)為16 個(gè)。注意力權(quán)重的長(zhǎng)度與句子的最大寬度是相同的,設(shè)為25。批次大小設(shè)置為32,學(xué)習(xí)率初始值設(shè)置為0.001,衰減因子為0.01,選擇Adam 作為優(yōu)化器,L2正則化項(xiàng)λ=0.1。為了防止模型過(guò)擬合,該文使用了隨機(jī)失活的方法隨機(jī)丟棄掉Bi-LSTM 層中的一些網(wǎng)絡(luò)單元,隨機(jī)失活率設(shè)為0.3,訓(xùn)練總輪數(shù)為50。

        4.2 數(shù)據(jù)集和評(píng)價(jià)指標(biāo)

        該文主要使用兩個(gè)常用的公開(kāi)數(shù)據(jù)集來(lái)進(jìn)行實(shí)驗(yàn),分別是MR 數(shù)據(jù)集和SST-2 數(shù)據(jù)集。表1 中給出了各個(gè)數(shù)據(jù)集的詳細(xì)統(tǒng)計(jì)信息。

        表1 數(shù)據(jù)集的詳細(xì)信息

        該文主要采用準(zhǔn)確率(Accuracy)作為指標(biāo)來(lái)評(píng)估所提出的模型的性能和有效性。上述指標(biāo)的計(jì)算公式如下:

        其中,TP為被準(zhǔn)確地區(qū)分為正例的總數(shù),F(xiàn)P為被誤分為正例的總數(shù),F(xiàn)N為被誤分為負(fù)例的總數(shù),TN是被準(zhǔn)確地區(qū)分為負(fù)例的總數(shù)。

        4.3 對(duì)比的基準(zhǔn)模型

        為了充分地驗(yàn)證所提算法模型的效果,該節(jié)將所提出的模型與其他8 種基準(zhǔn)模型進(jìn)行了實(shí)驗(yàn)對(duì)比,即SVM[12]、RNTN[13]、RAE[14]、MV-RNN[15]、CNNmultichannel[16]、CNN-non-static[16]、LSTM與Bi-LSTM。為了確保公平合理,所有的對(duì)比模型都是基于同一訓(xùn)練集從零開(kāi)始訓(xùn)練的。

        4.4 實(shí)驗(yàn)結(jié)果

        表2 中提供了上述各個(gè)對(duì)比模型在MR 與SST-2數(shù)據(jù)集中的測(cè)試結(jié)果。對(duì)比表2 中的各個(gè)模型的準(zhǔn)確率可以發(fā)現(xiàn),采用深度學(xué)習(xí)的分類(lèi)模型的性能遠(yuǎn)勝于常規(guī)的采用機(jī)器學(xué)習(xí)方法(即SVM)的分類(lèi)模型。實(shí)驗(yàn)對(duì)比結(jié)果表明,該文所提出的模型在兩個(gè)數(shù)據(jù)集上的性能是最優(yōu)的。具體而言,原始的LSTM 模型在兩個(gè)數(shù)據(jù)集上的性能明顯低于CNN 模型的性能,而使用了Bi-LSTM 模型之后性能稍微有所提升,因?yàn)锽i-LSTM 同時(shí)考慮了前后兩個(gè)方向的上下文信息,但其整體性能依舊低于CNN 模型的。然而,所提出的Bi-LSTM-Attention 模型結(jié)合了自注意力機(jī)制之后,其性能一舉超越了CNN 模型,這充分表明結(jié)合了自注意力機(jī)制的Bi-LSTM 模型能夠更好地探索語(yǔ)義特征間的內(nèi)部依賴關(guān)系,并自適應(yīng)地提升句子中的情感詞的語(yǔ)義特征的權(quán)重,從而提升情感分類(lèi)的性能。

        表2 在MR和SST-2數(shù)據(jù)集上的準(zhǔn)確率

        5 結(jié)論

        針對(duì)英文文本的情感分類(lèi)任務(wù),該文主要提出了一種Bi-LSTM-Attention 分類(lèi)模型。實(shí)驗(yàn)結(jié)果表明,該文提出的Bi-LSTM-Attention 模型在MR 和SST-2數(shù)據(jù)集上的性能顯著勝于其他對(duì)比模型,能夠利用注意力機(jī)制提升評(píng)論文本中的重要情感詞語(yǔ)的權(quán)重,從而提升情感分類(lèi)的性能。此外,該文提出的模型同時(shí)利用了前后兩個(gè)方向的LSTM 來(lái)捕獲雙向的上下文信息,大大提升了模型的特征捕獲與表達(dá)能力。

        猜你喜歡
        分類(lèi)情感模型
        一半模型
        分類(lèi)算一算
        如何在情感中自我成長(zhǎng),保持獨(dú)立
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
        失落的情感
        北極光(2019年12期)2020-01-18 06:22:10
        情感
        分類(lèi)討論求坐標(biāo)
        如何在情感中自我成長(zhǎng),保持獨(dú)立
        數(shù)據(jù)分析中的分類(lèi)討論
        久久久久亚洲av无码专区| 亚洲一区二区免费在线观看视频| 欧美做受又硬又粗又大视频| 一二三四视频社区在线| 国产成人美女AV| av天堂在线免费播放| 少妇人妻综合久久中文字幕| 国产在线精品一区二区在线看| 亚洲a∨天堂男人无码| 国产日产免费在线视频| 美利坚日韩av手机在线| 久激情内射婷内射蜜桃| 国产综合自拍| 人妖系列在线免费观看| 亚洲乱码一区二区三区在线观看| 97在线观看| 999精品免费视频观看| 一本到亚洲av日韩av在线天堂| 国产大屁股喷水视频在线观看| 中国老妇女毛茸茸bbwbabes| 亚洲av成人一区二区三区网址| 国产亚洲一区二区精品| 日韩精品专区av无码| 99久久久无码国产aaa精品| 亚洲高清一区二区三区在线观看| 国产国拍精品亚洲av在线观看| 久久视频在线| 麻豆AV免费网站| 亚洲中文字幕国产剧情| 夜夜躁日日躁狠狠久久av| 最近日本中文字幕免费完整| 亚洲一区二区精品久久岳| 在线观看国产视频午夜| 人妻少妇精品中文字幕av| 亚洲AV毛片无码成人区httP| 美利坚亚洲天堂日韩精品| 欧美国产激情二区三区| 欧美成人精品第一区二区三区| 亚洲av五月天天堂网| 亚洲精品中文字幕乱码影院| 人妻少妇精品中文字幕av蜜桃|