亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于深度學(xué)習(xí)的網(wǎng)絡(luò)輿情情感監(jiān)測(cè)系統(tǒng)設(shè)計(jì)

        2021-03-07 07:57:50許學(xué)添鄒同浩肖楓
        電子技術(shù)與軟件工程 2021年24期
        關(guān)鍵詞:深度特征文本

        許學(xué)添 鄒同浩 肖楓

        (廣東司法警官職業(yè)學(xué)院 廣東省廣州市 510520)

        1 引言

        輿情是指在一定的社會(huì)空間內(nèi),圍繞社會(huì)事件的發(fā)生、發(fā)展和變化,作為主體的民眾對(duì)作為客體的社會(huì)管理者、企業(yè)、個(gè)人及其他各類組織及其政治、社會(huì)、道德等方面的取向產(chǎn)生和持有的社會(huì)態(tài)度,是較多群眾關(guān)于社會(huì)中各種現(xiàn)象、問題所表達(dá)的信念、態(tài)度、意見和情緒等等表現(xiàn)的總和。隨著信息技術(shù)的發(fā)展和互聯(lián)網(wǎng)媒體的興起,截至2021年2月,我國的網(wǎng)民數(shù)量已經(jīng)達(dá)到9.89 億,網(wǎng)絡(luò)已經(jīng)成為輿情產(chǎn)生與傳播的主要途徑,特別是社會(huì)生活中的熱點(diǎn)事件或問題,更是會(huì)有大量網(wǎng)民通過評(píng)論表達(dá)出自己的情感態(tài)度,通過對(duì)這些網(wǎng)絡(luò)輿情進(jìn)行情感分析[1],可以有效掌握和解讀民意,科學(xué)、高效地做好輿情監(jiān)控和引導(dǎo)工作。

        網(wǎng)絡(luò)輿情一般是以文本作為表現(xiàn)形式,隨著自然語言處理技術(shù)的發(fā)展與成熟,利用其來對(duì)網(wǎng)絡(luò)輿情進(jìn)行分析處理,成為目前網(wǎng)絡(luò)輿情自動(dòng)監(jiān)測(cè)的一種主流方法,其中對(duì)網(wǎng)絡(luò)輿情的情感傾向分析是一個(gè)重要的研究方向。XingMou 等[2]結(jié)合了知網(wǎng)HowNet 情感詞典和其他領(lǐng)域詞典對(duì)微博上關(guān)于電影的評(píng)論進(jìn)行了情感分析;劉志明等[3]使用了三種特征選取方法和三種特征值權(quán)重計(jì)算方法,通過訓(xùn)練SVM 分類模型、貝葉斯分類模型、n 元語言模型進(jìn)行情感分類的研究;Xiao Sun 等[4]通過擴(kuò)展的卷積神經(jīng)網(wǎng)絡(luò),完成對(duì)微博內(nèi)容的情感識(shí)別;李洋等[5]提出一種卷積神經(jīng)網(wǎng)絡(luò)和雙向長短時(shí)記憶特征融合的模型,利用卷積神經(jīng)網(wǎng)絡(luò)提取文本向量的局部特征,利用BiLSTM 提取與文本上下文相關(guān)的全局特征,將兩種互補(bǔ)模型提取的特征進(jìn)行融合,提高了文本情感識(shí)別的準(zhǔn)確率。

        本文所設(shè)計(jì)的是基于深度學(xué)習(xí)的網(wǎng)絡(luò)輿情情感分析系統(tǒng),利用爬蟲技術(shù)獲取網(wǎng)絡(luò)上的輿情文本數(shù)據(jù),在標(biāo)注后,由深度學(xué)習(xí)模型對(duì)句子中詞向量的情感特征進(jìn)行學(xué)習(xí),訓(xùn)練后的模型可以對(duì)新采集的輿情數(shù)據(jù)進(jìn)行情感分析,統(tǒng)計(jì)出網(wǎng)民們的情感傾向,并通過Web系統(tǒng)進(jìn)行管理和數(shù)據(jù)顯示。

        2 系統(tǒng)整體設(shè)計(jì)

        系統(tǒng)整體設(shè)計(jì)包括數(shù)據(jù)采集、數(shù)據(jù)存儲(chǔ)、情感分析和系統(tǒng)管理四個(gè)模塊,如圖1所示,數(shù)據(jù)采集采用分布式爬蟲,由IP 代理池和Cookie 池實(shí)現(xiàn)多IP 地址的訪問偽裝和多用戶模擬登錄,由Scrapy 爬蟲框架實(shí)現(xiàn)數(shù)據(jù)抓取,Scrapy 是Python 開發(fā)的一個(gè)快速Web 信息抓取框架,用于抓取Web 站點(diǎn)并從頁面中提取結(jié)構(gòu)化的數(shù)據(jù),獲取的數(shù)據(jù)以文檔的形式存儲(chǔ)在MongoDB 數(shù)據(jù)庫。

        圖1:系統(tǒng)整體結(jié)構(gòu)

        情感分析模塊主要完成對(duì)獲取的文本輿情數(shù)據(jù)進(jìn)行情感分析,實(shí)現(xiàn)的方法主要有幾種,包括基于情感詞典的情感分析方法、基于傳統(tǒng)機(jī)器學(xué)習(xí)的情感分析方法和基于深度學(xué)習(xí)的情感分析方法等[6]。基于情感詞典的情感分析方法,主要依賴情感詞典的構(gòu)建,在信息爆炸的今天,各種網(wǎng)絡(luò)流行語、諧音語、雙關(guān)語等新詞語層出不窮,這就要求情感詞典不斷擴(kuò)充才能保證分析的正確率;而基于傳統(tǒng)機(jī)器學(xué)習(xí)的情感分析方法,使用統(tǒng)計(jì)機(jī)器學(xué)習(xí)算法,抽取文本情感特征,輸出情感分析結(jié)果,往往過度依賴文本情感特征的提取方法以及分類器的設(shè)計(jì),也不能充分考慮上下文的語境信息,也存在一定的缺陷。本系統(tǒng)主要采用基于深度學(xué)習(xí)的情感分析方法,該方法可以有效解決情感詞典擴(kuò)充和文本情感特征提取的問題,由深度學(xué)習(xí)的模型自主學(xué)習(xí)文本信息高維度的、深層次的情感特征信息,可以進(jìn)一步提高分析的準(zhǔn)確度。

        情感分析模塊首先要對(duì)輿情文本數(shù)據(jù)進(jìn)行預(yù)處理,包括:

        (1)數(shù)據(jù)清洗,去除文本含有的“噪聲”;

        (2)分詞處理,利用jieba 分詞工具包將語句進(jìn)行中文分詞;

        (3)去除停用詞,借助已有的停用詞詞典,過濾掉文本中的停用詞,降低停用詞對(duì)分析結(jié)果的影響。

        預(yù)處理之后進(jìn)行詞向量轉(zhuǎn)換[7],通過算法模型將文本轉(zhuǎn)化為一系列能夠表示文本的語義向量,本文借助Gensim 工具包中Word2Vec 模型完成詞向量訓(xùn)練。最后,詞向量作為input,輸入一個(gè)長短期記憶網(wǎng)絡(luò)(Long Short-Term Memory, LSTM)[8]和卷積神經(jīng)網(wǎng)絡(luò)(Convolution Neural Network, CNN)[9]組成的深度學(xué)習(xí)模型,在完成調(diào)參、訓(xùn)練后對(duì)文本進(jìn)行情感分析。

        系統(tǒng)管理模塊作為系統(tǒng)的用戶接口模塊,包括用戶管理和對(duì)輿情情感分析結(jié)果進(jìn)行可視化顯示,系統(tǒng)采用瀏覽器/服務(wù)器(B/S)結(jié)構(gòu),為了方便調(diào)用深度學(xué)習(xí)模型,采用Flask Web 框架,用戶數(shù)據(jù)和情感分析結(jié)果數(shù)據(jù)存儲(chǔ)在MySQL 數(shù)據(jù)庫,按照事件、時(shí)間、情感傾向等因素進(jìn)行結(jié)果展示,可視化工具采用Echarts 庫。

        3 文本情感分析模型

        基于深度學(xué)習(xí)的情感分析模型是本系統(tǒng)的核心模塊,主要采用LSTM+CNN 建立網(wǎng)絡(luò)輿論數(shù)據(jù)的情感分類模型。

        卷積神經(jīng)網(wǎng)絡(luò)是一種流行的深度學(xué)習(xí)模型,通過多維的卷積核可以獲取信息對(duì)象不同層次的多維特征,再通過池化操作來取得局部的關(guān)鍵信息。詞嵌入層(Word Embedding)[10]是一層可學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò),基于CBOW 和Skip-gram 兩種模型,將高維度稀疏的特征向量映射為低維度稠密的詞向量,并且詞向量之間具有較高的主義相關(guān)性;CNN 用一維卷積核就可以抽取不同粒度的短文本特征,可以高效地挖掘數(shù)據(jù)的局部特征,但是CNN 在處理文本信息時(shí),比較依賴卷積核長度,對(duì)語序不敏感,CNN 的公式如下:

        LSTM 網(wǎng)絡(luò)是遞歸神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,它能解決RNN 的梯度消失問題,更重要的是相對(duì)于RNN,其增加了3 個(gè)特殊的門:輸入門、輸出門和遺忘門,這樣其記憶單元就具有了保存、更新和重置功能,具有兼顧長距離歷史信息的能力,應(yīng)用在文本信息處理中,可以有效提取上下文語義信息,LSTM 的計(jì)算公式如下,其中σ 為Sigmod 激活函數(shù),代表了門開關(guān),it為輸入門的輸出,ot輸出門的輸出,ft為遺忘門輸出,W 為對(duì)應(yīng)的權(quán)重,b 為對(duì)應(yīng)的偏置,LSTM 的更新公式為:

        本文基于深度學(xué)習(xí)的文本情感分類模型如圖2所示,每個(gè)句子分詞后,每個(gè)詞的詞向量作為輸入(Input),通過詞嵌入層(Word embeding)重新映射為長度128 的詞向量,再分別獨(dú)立經(jīng)過CNN 層和LSTM 層進(jìn)行特征提取,其中CNN 層卷積核長度為512,數(shù)量為36,LSTM 層單元數(shù)量為64,之后通過RuLU 激活函數(shù)進(jìn)行非線性變換,再進(jìn)行dropout 處理,按照一定的概率p 將神經(jīng)網(wǎng)絡(luò)單元暫時(shí)從網(wǎng)絡(luò)中丟棄,再分別通過最大值池化操作(Max pooling),將特征進(jìn)行降采樣,以減少運(yùn)算量和防止過擬合,池化操作后的CNN 層特征和LSTM 層特征再進(jìn)行特征融合,輸入全連接層神經(jīng)網(wǎng)絡(luò)(Full connection)進(jìn)一步特征提取,最后通過Softmax 分類器輸出文本情感分類結(jié)果。

        圖2:文本情感分類模型

        本文采用第二十六屆全國信息檢索學(xué)術(shù)會(huì)議評(píng)測(cè)大賽提供的網(wǎng)民情緒數(shù)據(jù)集(https://www.datafountain.cn/competitions/423/datasets)進(jìn)行測(cè)試,該數(shù)據(jù)集是230 個(gè)主題關(guān)鍵詞進(jìn)行采集的數(shù)據(jù),其中10 萬條已經(jīng)人工標(biāo)注(積極、中性和消極)的數(shù)據(jù)70%作為訓(xùn)練集,30%作為驗(yàn)證集,在驗(yàn)證集上可以得到70.4%的準(zhǔn)確率,F(xiàn)1 值為73.1。

        4 總結(jié)

        本文提出了一種基于深度學(xué)習(xí)的輿情情感監(jiān)測(cè)系統(tǒng),通過爬蟲技術(shù)抓取網(wǎng)絡(luò)中的評(píng)論文本數(shù)據(jù),再調(diào)用基于CNN 和LSTM 融合的深度學(xué)習(xí)模型進(jìn)行情感分類,訓(xùn)練后的模型可以充分考慮句子不同粒度的短文本特征和上下文信息,因此能夠獲得較好情感分類效果,最后系統(tǒng)將情感傾向按照事件、時(shí)間等因素進(jìn)行可視化展示。該系統(tǒng)可以及時(shí)監(jiān)測(cè)廣大網(wǎng)民對(duì)某一事件的態(tài)度,實(shí)現(xiàn)科學(xué)、高效的輿情分析和引導(dǎo),具有較高的應(yīng)用價(jià)值。

        猜你喜歡
        深度特征文本
        深度理解一元一次方程
        如何表達(dá)“特征”
        在808DA上文本顯示的改善
        不忠誠的四個(gè)特征
        深度觀察
        深度觀察
        基于doc2vec和TF-IDF的相似文本識(shí)別
        電子制作(2018年18期)2018-11-14 01:48:06
        深度觀察
        抓住特征巧觀察
        文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學(xué)隱喻
        美女裸体无遮挡免费视频国产| 婷婷综合另类小说色区| 伊人精品久久久久中文字幕| 最近免费mv在线观看动漫| 亚洲中文字幕无码一区| 国产特级全黄一级毛片不卡| 国产精品日本天堂| 亚洲国内精品一区二区在线| 日本午夜剧场日本东京热| 精品国产一区二区三区2021| 爆乳熟妇一区二区三区霸乳| 越南女子杂交内射bbwxz| 久草午夜视频| 最近亚洲精品中文字幕| 久久少妇高潮免费观看| 国产av自拍视频在线观看| 极品少妇小泬50pthepon| 久久人人妻人人做人人爽| 亚洲精品综合第一国产综合| 大白屁股流白浆一区二区三区| 亚洲一区二区av天堂| 欧美精品无码一区二区三区| 亚洲娇小与黑人巨大交| 亚洲最大中文字幕无码网站| 免费二级毛片在线播放| 一本久道视频无线视频试看| 亚洲国产精品婷婷久久| 朝鲜女人大白屁股ass孕交| 军人粗大的内捧猛烈进出视频| 精品十八禁免费观看| 国产一区二区内射最近人| 麻豆精品在线视频观看| 18禁在线永久免费观看| 东北妇女xx做爰视频| 亚洲成在人线久久综合| 久久久久无码精品国| 乳乱中文字幕熟女熟妇| 国产精品久人妻精品老妇| 久久夜色精品国产欧美乱| 真实国产乱视频国语| 免费毛片一区二区三区女同|