亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于TextCNN 融合模型的離散情感分析

        2023-09-12 00:50:38陳秀明
        科學(xué)技術(shù)創(chuàng)新 2023年21期
        關(guān)鍵詞:文本情感效果

        程 鋼,陳秀明*,于 翔

        (1.阜陽(yáng)師范大學(xué)計(jì)算機(jī)與信息工程學(xué)院,安徽 阜陽(yáng);2.臺(tái)州學(xué)院電子與信息工程學(xué)院,浙江 臺(tái)州)

        引言

        文本情感分析是自然語(yǔ)言處理中的熱門研究方向,又稱作文本挖掘。它的主要工作,是對(duì)網(wǎng)絡(luò)各種媒體消息材料、社會(huì)媒體文章,尤其是對(duì)帶有情感色彩的主觀性信息,進(jìn)行提取、分析處理、整合和判斷。

        情感表達(dá)由觀點(diǎn)持有者、評(píng)論對(duì)象、情感種類及評(píng)論時(shí)間等四要素構(gòu)成。其中評(píng)論時(shí)間和文字發(fā)布時(shí)間保持一致,通常按網(wǎng)頁(yè)發(fā)布時(shí)間來(lái)確定文章持有者與評(píng)論對(duì)象的提取通常由命名實(shí)體抽取和語(yǔ)義角色分析等方式在文章中獲取; 而對(duì)于文字中所表達(dá)的情感種類分析,根據(jù)其目的內(nèi)涵的不同而選取為不同的情感類種類,在體系上一般包括褒貶、喜怒哀樂悲恐驚、情感評(píng)分(列如1-5 分)等類型。

        情感分析領(lǐng)域在國(guó)外已經(jīng)有了十幾年的歷程,但是我國(guó)的研究卻剛剛起步。由于語(yǔ)言的差異,部分國(guó)外的研究技術(shù)無(wú)法轉(zhuǎn)化到中文處理中。所以,對(duì)于中文處理領(lǐng)域的專家們來(lái)說,如何針對(duì)中文語(yǔ)言的特點(diǎn)將某些較為嫻熟的技巧與手段應(yīng)用到中文情感研究領(lǐng)域,是一個(gè)值得積極探索的任務(wù)。

        1 方法介紹

        1.1 Jieba 分詞與隱馬爾可夫模型

        Jieba 庫(kù)的主要作用為分詞、關(guān)鍵詞提取、添加自定義詞典和詞性標(biāo)注,并有精確模式、搜索引擎模式和全模式三種分詞模式。

        隱馬爾可夫模型是一種概率轉(zhuǎn)化模型, 如表1 所示:一個(gè)人換下一份工作的轉(zhuǎn)換可能性[1]。

        表1 隱馬爾可夫模型轉(zhuǎn)化舉例說明

        1.2 LDA 模型

        LDA 主題分類法主要是用于預(yù)測(cè)文章的主題狀況,LDA 認(rèn)為文章可根據(jù)主題這么表示:

        《美妝日記》{美妝:0.8,美食:0.1,其他:0.1}

        假設(shè)我們要制作一個(gè)文本,它里邊的所有單詞產(chǎn)生的概率是[2]:

        1.3 TextCNN 模型

        與傳統(tǒng)圖像的CNN 網(wǎng)絡(luò)相比,TextCNN 在網(wǎng)絡(luò)結(jié)構(gòu)上幾乎沒有任何變化(甚至更加簡(jiǎn)單了),TextCNN 其實(shí)是一層卷積,就是一個(gè)max-pooling,然后再把圖像進(jìn)行外接softmax 來(lái)n 分類[3]。

        1.4 改進(jìn)算法TextRCNN 模型

        在TextCNN 系統(tǒng)中,整體網(wǎng)路架構(gòu)使用了卷積層+池化層的架構(gòu),在RCNN 中,基于卷積層的特征提取的功能逐漸被RNN 所替代,導(dǎo)致整體架構(gòu)設(shè)計(jì)上成為了雙向的RNN+池化層架構(gòu),又稱為RCNN[4-5]。

        1.5 多頭注意力機(jī)制

        多頭注意力機(jī)制即將輸入數(shù)據(jù)進(jìn)行多次映射,每次使用不同的作為注意力機(jī)制輸入的查詢,以捕捉不同的表示子空間的特征,從而可獲得更全面、更富有表現(xiàn)力的表示結(jié)果,如圖1 所示。

        圖1 多頭注意力

        2 實(shí)驗(yàn)過程

        2.1 數(shù)據(jù)來(lái)源

        這里使用了阿里天池上的語(yǔ)料庫(kù)。共獲取了2500 條數(shù)據(jù),并將原來(lái)的兩種情感,變?yōu)? 種情感:其中pos:開心pos1:信任neg:難受neg1:疑惑neg2:憤怒neg12:疑惑又憤怒,并將文件以純文字文檔進(jìn)行保存。將其中的4/5 劃分為訓(xùn)練數(shù)據(jù),1/5 劃分為測(cè)試數(shù)據(jù),表2 展示的是數(shù)據(jù)具體的分布情況[6-7]。

        表2 數(shù)據(jù)分布情況

        2.2 數(shù)據(jù)預(yù)處理

        去除數(shù)字,字母,分詞,去除停用詞。由于數(shù)據(jù)集的內(nèi)容經(jīng)常會(huì)出現(xiàn)一些非中文與不用的字符以及標(biāo)點(diǎn)符號(hào)等[8]。文本數(shù)據(jù)預(yù)處理后結(jié)果如表3 所示。

        表3 數(shù)據(jù)預(yù)處理展示

        2.3 舉例說明構(gòu)建開心和疑惑又憤怒的情感的詞云圖[6]

        快樂情感詞云見圖2,疑惑又憤怒詞云見圖3。

        圖2 快樂情感詞云

        圖3 疑惑又憤怒詞云

        2.4 從每種情感的詞云圖中挖掘主題

        各種情感的主體見表4。

        表4 各種情感的主題

        通過對(duì)比:開心的主題是價(jià)格和快遞方面,信賴的主題是物流價(jià)格與產(chǎn)品不錯(cuò),難受的主要主題是售后沒有免費(fèi),只免費(fèi)了材料費(fèi),疑惑的主要主題是售后的態(tài)度比較差,憤怒的主要主題是安裝費(fèi),憤怒疑惑混合的主要主題是安裝收費(fèi)這方面,因?yàn)檫@種情緒最為強(qiáng)烈,所以這種情感反應(yīng)的問題也是最急切的。

        2.5 實(shí)驗(yàn)依據(jù)

        采用分類精確率precision、召回率recall、平衡F分?jǐn)?shù)f1-score 作為評(píng)價(jià)實(shí)驗(yàn)好壞的指標(biāo),其表示方法如下:TP:將正類預(yù)測(cè)為正類數(shù);TN:將負(fù)類預(yù)測(cè)為負(fù)類數(shù);FP:將負(fù)類預(yù)測(cè)為正類數(shù)誤報(bào);FN:將正類預(yù)測(cè)為負(fù)類數(shù),如下依次表示為精確率P,召回率R,平衡F分?jǐn)?shù)F1[9-10]。

        2.6 實(shí)驗(yàn)結(jié)果

        TextCNN 各情感效果對(duì)比見表5,TextRCNN 各情感效果對(duì)比見表6,TextRCNN-Attention 各情感效果對(duì)比見表7。

        表5 TextCNN 各情感效果對(duì)比

        表6 TextRCNN 各情感效果對(duì)比

        表7 TextRCNN-Attention 各情感效果對(duì)比

        通過觀察TextRCNN-Attention 的預(yù)測(cè)效果較好。

        結(jié)束語(yǔ)

        為了數(shù)據(jù)背后的故事,對(duì)文本做情感分析是一種可行的方式,但它還是不能完全挖掘數(shù)據(jù)背后的故事。我國(guó)漢字博大精深,一詞能代表許多的意思,它涉及對(duì)詞匯、句法和語(yǔ)義規(guī)則的深刻理解,所以對(duì)情感的準(zhǔn)確分析還有很長(zhǎng)的一段路要走。在大數(shù)據(jù)背景下,自然語(yǔ)言的廣度和復(fù)雜度得到進(jìn)一步的發(fā)展,同時(shí)也帶來(lái)了更大的挑戰(zhàn),其發(fā)展仍需要很長(zhǎng)一段時(shí)間,望砥礪前行。

        猜你喜歡
        文本情感效果
        按摩效果確有理論依據(jù)
        如何在情感中自我成長(zhǎng),保持獨(dú)立
        失落的情感
        北極光(2019年12期)2020-01-18 06:22:10
        情感
        在808DA上文本顯示的改善
        迅速制造慢門虛化效果
        基于doc2vec和TF-IDF的相似文本識(shí)別
        電子制作(2018年18期)2018-11-14 01:48:06
        如何在情感中自我成長(zhǎng),保持獨(dú)立
        抓住“瞬間性”效果
        模擬百種唇妝效果
        Coco薇(2016年8期)2016-10-09 02:11:50
        国产一区二区三区影院| 成人一区二区人妻少妇| 免费观看mv大片高清| 男人扒开女人下面狂躁小视频| 久久精品无码一区二区2020| 亚洲综合天堂av网站在线观看| 美腿丝袜在线一区二区| 国产成人无码av一区二区| 国产99r视频精品免费观看 | 日韩精品一区二区三区免费视频| 国产成人啪精品午夜网站| 黑丝国产精品一区二区| 国产91传媒一区二区三区| 在线看片免费人成视频久网下载| 中文字幕天堂在线| 手机在线观看亚洲av| 日韩女同视频在线网站| 国产国拍精品av在线观看按摩| 日本中文字幕不卡在线一区二区| 国内精品久久人妻互换| 人妻夜夜爽天天爽三区丁香花| 国产午夜精品一区二区三区软件| 97中文字幕在线观看| 一二三四在线观看韩国视频| 亚洲精品乱码久久久久久不卡| 人人添人人澡人人澡人人人人| 久久夜色精品国产亚洲噜噜 | 校园春色综合久久精品中文字幕| 影音先锋女人av鲁色资源网久久| 中字无码av电影在线观看网站| 亚洲av自偷自拍亚洲一区| 午夜精品久久久久久久久| av天堂久久天堂av色综合| 午夜无码亚| 色久悠悠婷婷综合在线| 国产精品自在线拍国产手机版| 狠狠干视频网站| 青青草在线免费观看视频| 久久久久成人精品无码中文字幕 | 国产中文制服丝袜另类| 国产自拍伦理在线观看|