亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        政府政務(wù)微博效能評估及可視化分析

        2021-03-25 02:09:18賈斯涵郝琳琳
        軟件導(dǎo)刊 2021年3期
        關(guān)鍵詞:政務(wù)可視化卷積

        賈斯涵,王 英,郝琳琳,王 鑫

        (1.吉林大學(xué)計算機科學(xué)與技術(shù)學(xué)院;2.吉林大學(xué)人工智能學(xué)院,吉林長春 130012)

        0 引言

        從2009 年開始,作為新型的社交媒體平臺,微博逐漸走進了人們的視野中。10 年間,微博發(fā)展到如今的月活躍用戶5.16 億人次,愈來愈多的人開始借助微博了解世界,微博也因此成為人們溝通交流、情感表達的重要媒介,其間充斥著大量帶有情感色彩的評論與觀點,使得這些微博文本無論是在商業(yè)分析還是輿情監(jiān)測中都具有重要的經(jīng)濟和社會價值[1]。政務(wù)新媒體是近年來政府緊跟時代脈搏的產(chǎn)物,是加快政府職能轉(zhuǎn)變,提高政府治理能力的重要手段。作為政務(wù)新媒體發(fā)展最早、最成熟的社交平臺,政務(wù)微博已經(jīng)成為各級政務(wù)機構(gòu)推行政務(wù)公開,拉近政府與公眾距離的重要載體。

        本文針對政府政務(wù)微博的效能評估及可視化分析問題,使用卷積神經(jīng)網(wǎng)絡(luò)解決政務(wù)微博評論的情感分析問題,利用Echarts 工具,從公眾反響、傳播能力、互動用戶的整體特征等角度進行可視化,實現(xiàn)輿情統(tǒng)計和分析。

        1 情感分析方法概述

        文本情感分析,又稱傾向性分析、意見挖掘等,是自然語言處理(Natural Language Processing,NLP)的一個重要領(lǐng)域。世界上絕大多數(shù)數(shù)據(jù)都沒有預(yù)先定義文本的組織結(jié)構(gòu),通過構(gòu)建模型識別和提取文本中的觀點和特征,對文本進行理解和分類,可以幫助人們在數(shù)據(jù)爆炸時代快速處理非結(jié)構(gòu)化文本,提高工作效率?,F(xiàn)有的情感分類技術(shù)主要有3 類。

        1.1 基于情感詞典的方法

        基于情感詞典的分類方法比較機械化,需要大量文本作為基礎(chǔ)素材,模擬人的思維進行判斷,通過對語料庫的人工整理構(gòu)建不同粒度的情感詞典,以及否定詞詞典、程度副詞詞典等自定義詞典。

        最基本的方法是對詞典中情感程度相同的詞組賦予相等權(quán)重,將分詞后的詞語與語料庫詞典中的詞進行匹配,對情感值進行線性疊加,其中否定詞和副詞可以根據(jù)實際情況生成自己的判斷規(guī)則:判斷為否定詞時,權(quán)值反號處理,判斷有副詞時,可以進行倍數(shù)處理。目前,較為知名的中文詞典包括臺灣大學(xué)整理的NTUSD 詞典、知網(wǎng)發(fā)布的Hownet 情感詞典以及清華大學(xué)李軍中文褒貶義詞典。

        但無論如何改進,基于情感詞典的分類方法都存在它獨有的局限性,即它始終依賴于“詞典”本身,這也意味著情感詞典在面臨新詞的不斷迭出和舊詞新意等情況時,無法及時擴展更新。同時,由于情感詞典的不同選擇,情感分類結(jié)果也會因此受到影響。

        1.2 基于機器學(xué)習(xí)的方法

        近年來,隨著人工智能的快速發(fā)展,機器學(xué)習(xí)不斷進入人們的視野中,其關(guān)鍵步驟是如何使機器可以像人一樣學(xué)習(xí)?;跈C器學(xué)習(xí)的情感分析方法主要是手動進行文本特征提取,通過一系列指令讓機器從數(shù)據(jù)中學(xué)習(xí),最后根據(jù)這些指定的算法對文本實現(xiàn)分詞,并輸出情感分類的最終答案。它能有效解決詞庫無法及時更新的問題,在減少人工成本的同時,分類效果也很好。其中,較為常見的算法為支持向量機(SVM)、最大熵和樸素貝葉斯等。

        1963 年,一種有監(jiān)督的非概率模型,即支持向量機被提出。該算法基本原理是在訓(xùn)練集合中找到最優(yōu)的超平面H,最優(yōu)的分類超平面可以滿足將不同類別的數(shù)據(jù)以最大間隔分開。將標(biāo)記好的文本表示映射成多維空間上的點,通過學(xué)習(xí)將不同情緒的樣本劃分到空間的不同區(qū)域,并對新文本進行情緒極性預(yù)測[2]。

        但是作為有監(jiān)督的機器學(xué)習(xí),其局限性體現(xiàn)在手動標(biāo)記文本特征,同時過度依賴分類器。在大數(shù)據(jù)時代,基于機器學(xué)習(xí)的情感分析方法訓(xùn)練大規(guī)模文本數(shù)據(jù)較為困難[3]。

        1.3 基于深度學(xué)習(xí)的方法

        作為機器學(xué)習(xí)的一個重要分支,深度學(xué)習(xí)是利用深度神經(jīng)網(wǎng)絡(luò)模擬生物的神經(jīng)系統(tǒng)解決特征提取問題[4]。有別于淺層模型,它可以自動從原始數(shù)據(jù)中學(xué)習(xí)層次化的特征,高效地標(biāo)示出數(shù)據(jù)中蘊含的復(fù)雜模式[5]。同時可以很好地避免傳統(tǒng)的情感分析方法帶來的的局限,在進行文本情感傾向性分析時,它能夠自動提取文本特征,并在學(xué)習(xí)過程中不斷地修正模型。

        卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)在文本分類的第一個應(yīng)用中是由Kim[6]提出的一個模型,在其研究結(jié)果中CNN 對于情感分類的效果要遠好于SVM,避免了顯示的特征抽取,同時網(wǎng)絡(luò)可以并行學(xué)習(xí),降低了運行的復(fù)雜度。其中,卷積神經(jīng)網(wǎng)絡(luò)的特征包括局部感知,可以減少參數(shù)數(shù)量,降低過擬合的可能性;共享權(quán)重可以幫助神經(jīng)網(wǎng)絡(luò)的輸入保持空間不變性,混合可以簡化從卷積層輸出的信息[7]。在文獻[8]中,作者對于TextCNN模型做了大量調(diào)參測試,對其進行的文本分類給出了具體建議,包括對預(yù)訓(xùn)練詞向量、激活函數(shù)的研究等;在文獻[9]中,作者對比了TextCNN 模型、基于TF-IDF 特征提取的傳統(tǒng)機器學(xué)習(xí)模型以及LSTM 模型,實驗結(jié)果顯示在短文本分類中,TextCNN 模型的準確率遠高于傳統(tǒng)機器學(xué)習(xí)模型,且訓(xùn)練時間遠小于LSTM 模型;文獻[10]提出的動態(tài)卷積模型(DCNN)更加復(fù)雜,但其可以提取句子中活躍的特征,同時性能顯示出非常好的結(jié)構(gòu)。

        長短期記憶網(wǎng)絡(luò)(LSTM)作為特殊的RNN 網(wǎng)絡(luò),專門為了解決普通循環(huán)神經(jīng)網(wǎng)絡(luò)的長期依賴問題而設(shè)計。它由Hochreiter 等[11]于1997 年首次提出。接下來,越來越多的專家學(xué)者投入到情感分析研究中。劉騰飛等[12]提出結(jié)合循環(huán)網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)的文本分類研究,結(jié)果顯示這是一個可以利用卷積神經(jīng)網(wǎng)絡(luò)獲得有價值的特征,利用循環(huán)網(wǎng)絡(luò)高效獲取文本內(nèi)部信息的復(fù)合模型,在完成文本分類任務(wù)中顯現(xiàn)出良好性能。李洋等[13]提出一種卷積神經(jīng)網(wǎng)絡(luò)和BLSTM 特征融合的模型,利用CNN 提取局部特征,利用BLSTM 提取與上下文本相關(guān)的全局特征,結(jié)果較二者分別使用準確率更優(yōu)。

        但是對于CNN 進行文本分類仍然需要大量的研究工作,未來還需要注意卷積核大小、超參數(shù)調(diào)節(jié)等問題,同時進行CNN 與其它深度學(xué)習(xí)算法的融合實驗[14]。

        2 基于深度學(xué)習(xí)的情感分類方法

        自然語言處理領(lǐng)域較為活躍的研究方向包括文本分類,根據(jù)情緒的不同進行分類可以視為情感的傾向性分析。深度學(xué)習(xí)算法在計算機圖像中取得顯著成績,運用到文本分類中也表現(xiàn)出色。

        2.1 卷積神經(jīng)網(wǎng)絡(luò)

        卷積神經(jīng)網(wǎng)絡(luò)屬于前饋神經(jīng)網(wǎng)絡(luò),最早可以追溯到1962 年的一項生物學(xué)研究?,F(xiàn)已發(fā)展為深度學(xué)習(xí)領(lǐng)域一項重要模塊,主要用于圖像識別。它主要運用了3 種基本概念:局部感受野、共享權(quán)重和混合。

        (1)局部感受野(Local Receptive Fields)。在卷積神經(jīng)網(wǎng)絡(luò)中,輸入一般看作方形排列的像素矩陣,這不同于在傳統(tǒng)網(wǎng)絡(luò)中,輸入的神經(jīng)元被理解為縱向排列的形式。同時,與全連接層網(wǎng)絡(luò)的每個輸入神經(jīng)元連接到每個隱藏神經(jīng)元不同,卷積網(wǎng)絡(luò)只將輸入圖像的像素進行局部區(qū)域連接,即一個隱藏神經(jīng)元對應(yīng)輸入神經(jīng)元的一個小矩陣,該矩陣叫做局部感受野,針對不同的神經(jīng)網(wǎng)絡(luò)可以移動不同的跨距。這樣可以有效解決全連階層網(wǎng)絡(luò)而不考慮空間結(jié)構(gòu)問題。

        (2)共享權(quán)重(Shared Weights)。由于一部分輸入像素對應(yīng)一個隱藏神經(jīng)元,因此在卷積網(wǎng)絡(luò)中,每個連接對應(yīng)相等的權(quán)重,同時每個隱藏神經(jīng)元也對應(yīng)一個相等的偏置。同時,將卷積層中訓(xùn)練的所有權(quán)重或偏置設(shè)置為相同的權(quán)值,這種平移不變性可以有效減少需要學(xué)習(xí)的參數(shù)量。共享的權(quán)重和偏置可以被視為一個濾波器或者卷積和。

        (3)混合(Pooling)。混合也稱作池化。其本質(zhì)是簡化從卷積層輸出的信息,起到類似壓縮圖片的作用?;旌纤惴ㄒ话惆ㄗ畲笾祷旌希╩ax-pooling)和L2 混合(L2 pool?ing)。其中,最大值混合是計算出相鄰區(qū)域內(nèi)的最大激活值,而L2 混合是取區(qū)域內(nèi)所有值平方和的平方根。神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)不同,兩種算法使用效果也不同。卷積神經(jīng)網(wǎng)絡(luò)的多卷積核使得其最終可以獲得多種特征。

        2.2 TextCNN

        Kim[6]在2014 年提出了TextCNN,結(jié)構(gòu)如圖1 所示,他將用于圖像識別的卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于文本分類技術(shù)中,利用不同大小的卷積核提取文本中的關(guān)鍵特征,從而達到良好的文本分類效果。

        Fig.1 TextCNN model structure圖1 TextCNN 模型結(jié)構(gòu)

        (1)嵌入層(Embedding Layer)。嵌入層輸入降維后的句子矩陣,其中每一行表示一個詞向量,若矩陣大小為n×k,則詞向量的維度為k,矩陣大小為7×5,則詞向量維度為5。類似CNN 模型中輸入圖像的原始像素。

        (2)卷積層(Convolution Layer)。在TextCNN 模型中,由于文本的最小粒度是詞,因而詞向量的維度s 就是卷積核的寬度。高度即窗口大小一般設(shè)置為2、3、4,可以得到不同的特征圖,同時考慮了文本的上下文。

        (3)池化層(Polling Layer)。TextCNN 在池化層中選用1-Max-pooling 抽取每個特征中的強特征,認定其為最重要的特征,同時解決了經(jīng)過窗口大小不同的卷積核后特征向量維度不相等的問題,并保證了特征值位置不變。

        (4)全連接層(Fully Connected Layer)。TextCNN 的最后一層為全連接層,輸出時經(jīng)過softMax 激活函數(shù),它用來計算每個類別可能為正確結(jié)果的概率,最終可以將具有最大值的特征作為該文本的類別。

        其中,TextCNN 的詳細過程如圖2 所示。

        3 研究思路與框架

        3.1 研究思路

        Fig.2 TextCNN 's specific process圖2 TextCNN 的具體過程

        鑒于微博篇幅精簡、表達生活化等特點,針對微博評論的情感傾向性分析,在分類前需要對非結(jié)構(gòu)化的原始數(shù)據(jù)集進行預(yù)處理,即對文本進行中文分詞和詞向量訓(xùn)練,將文本轉(zhuǎn)換為數(shù)字特征的同時進行降維處理,并聯(lián)系上下文語義。本文采用基于深度學(xué)習(xí)的方法,區(qū)別于傳統(tǒng)情感分類算法的詞典構(gòu)建和特征提取,深度學(xué)習(xí)算法更加高效和精準。對此,采用TextCNN 深度學(xué)習(xí)算法對政務(wù)微博下的評論進行訓(xùn)練,完成積極、中立、消極的情感分類。

        針對數(shù)據(jù)可視化部分,據(jù)微博原文下參與互動的用戶相關(guān)信息、評論內(nèi)容及政務(wù)微博本身,本文將采用Echarts工具構(gòu)建圖表,直觀展示政府政務(wù)微博的受眾特點、傳播能力等特征,達到對效能評估結(jié)果的可視化展示目的。

        本文通過引入對信息其它層面多維度的統(tǒng)計與分析,改進了情感傾向性分析獨立存在的問題,形成多角度交叉對比,最終達到效能評估目的,并實現(xiàn)可視化分析,使枯燥的數(shù)據(jù)更加生動具體,讓人一目了然。

        3.2 效能評估及可視化分析

        本文的效能評估是指將訓(xùn)練好的用戶評論數(shù)據(jù)集與互動用戶數(shù)據(jù)集和政務(wù)微博數(shù)據(jù)集一同進行交叉或獨立式處理,包括從用戶地區(qū)分布、用戶年齡分布等角度進行統(tǒng)計,最終達到效能評估結(jié)果,而其中的情感傾向性分析為本文效能評估重點。

        對于可視化分析,本文采用Echarts 開源可視化工具作為將非結(jié)構(gòu)化的數(shù)字信息轉(zhuǎn)化為可視化圖表的媒介,以更為直觀的方式讓數(shù)據(jù)在可視化的同時達到展現(xiàn)分析結(jié)果的目的。

        3.3 研究框架

        本文通過對政府政務(wù)微博進行可視化的效能評估,提供更科學(xué)的評估手段,不僅可以推動技術(shù)上的革新,同時更有利于推進媒體管理模式創(chuàng)新。數(shù)據(jù)集選自法制日報、平安北京、首都網(wǎng)警、人民日報、中國警方在線以及最高人民檢察院的政務(wù)官方賬號所發(fā)布的1 385 條微博、其下的17 587 條評論,以及13 679 名參與討論的微博用戶信息。

        根據(jù)已有的微博評論,采用基于深度學(xué)習(xí)的情感分析方法,包括對數(shù)據(jù)集進行切分、預(yù)處理和分類。在分類過程中,采用三分類算法,將情感傾向性劃分為積極、消極和中立。同時,在微博用戶屬性、政務(wù)官方微博活躍程度等方面進行數(shù)據(jù)統(tǒng)計和對比,最終利用Echarts 開源可視化庫對結(jié)果進行展示。

        政府政務(wù)微博效能評估及可視化分析總體方案可大致分為以下4 個步驟,如圖3 所示。

        (1)Jieba 中文分詞。分詞的目的是進行情感分析,需要使用的數(shù)據(jù)集為微博評論文件中的評論部分,并將數(shù)據(jù)集劃分為測試集和訓(xùn)練集。分詞選用的是精確模式,可以將句子中的詞準確地加以分解,有利于后續(xù)文本分析。

        (2)詞向量訓(xùn)練。傳統(tǒng)特征提取方法需要評估函數(shù)才能進行權(quán)重計算,而評估函數(shù)是基于統(tǒng)計學(xué)方法的,需要規(guī)模較大的訓(xùn)練集,本文所使用的數(shù)據(jù)集規(guī)模較小,不適用于類似TF-IDF 的傳統(tǒng)做法。采用Keras 平臺的嵌入層進行詞向量訓(xùn)練模型可以有效解決one-hot 的維度爆炸問題,將文本數(shù)據(jù)映射到低緯度稀疏矩陣中,并可以直接應(yīng)用于TextCNN 后續(xù)步驟。

        (3)TextCNN 分類算法。TextCNN 分類算法來源于卷積神經(jīng)網(wǎng)絡(luò),其在文本分類中展現(xiàn)了很好的結(jié)果,解決了傳統(tǒng)神經(jīng)網(wǎng)絡(luò)由于全連接層而需要訓(xùn)練大量參數(shù)的問題。使用三分類算法,在最后一層使用softMax 全連接層,將積極、消極、中立的分類預(yù)測以概率形式輸出。

        (4)可視化顯示。由于本文數(shù)據(jù)集規(guī)模較小,采用MySQL 數(shù)據(jù)庫進行存儲,使用PHP 語言執(zhí)行SQL 語句進行數(shù)據(jù)庫的連接和操作,同時與HTML+CSS+JavaScript 結(jié)合進行后續(xù)Web 可視化應(yīng)用。在可視化實現(xiàn)過程中,使用Echarts 開源可視化庫從多種角度對用戶信息、政務(wù)微博和評論內(nèi)容進行統(tǒng)計和整理,最終以多種形式的圖表呈現(xiàn)政府政務(wù)新媒體的評估結(jié)果。

        Fig.3 The overall scheme of effectiveness evaluation and visual analysis of government Microblog圖3 政府政務(wù)微博效能評估及可視化分析方案

        4 情感分類模型實現(xiàn)

        4.1 文本分布式表示

        首先采用Keras 的Tokenizer 模塊將分詞后的文本轉(zhuǎn)化為機器可識別的數(shù)字矩陣,創(chuàng)建好Tokenizer 對象后,利用fit_on_texts()函數(shù)根據(jù)詞的詞頻進行編號,出現(xiàn)次數(shù)越多,編號越小。采用texts_to_sequences()函數(shù),將文本轉(zhuǎn)換成數(shù)字特征,形成整數(shù)形式的索引序列。使用pad_se?quences()函數(shù)對每條文本進行填充或修剪,設(shè)置一個固定值,超過閾值的會被截掉,不足的會在序列前面填充0,設(shè)置的最大長度為50。利用TextCNN 模型的第一層Embed?ding 層將每個編碼的詞進行one-hot 編碼,然后通過卷積神經(jīng)網(wǎng)絡(luò)進行線性變換,使其嵌入到低維空間中,最終映射成為稠密矩陣,同時通過神經(jīng)網(wǎng)絡(luò)不斷迭代,嵌入的詞向量得到訓(xùn)練和更新,使得上下文語義也得到了聯(lián)系。

        4.2 TextCNN 模型搭建

        本文選用通過卷積神經(jīng)網(wǎng)絡(luò)處理文本分類的TextCNN模型。模型結(jié)構(gòu)如圖4 所示。

        Fig.4 Construction of TextCNN model圖4 TextCNN 模型搭建

        第一層為嵌入層,第二層為一維卷積,第三層為池化層,窗口大小分別為3、4、5,它們通過融合層拼接在一起,其中激活函數(shù)為線性整流函數(shù)(Rectified Linear Unit,RE?LU),克服了sigmoid 函數(shù)在飽和區(qū)域收斂慢的問題,減少了反向傳播求誤差梯度的計算量,提高了訓(xùn)練速度。最后進入全連接層,經(jīng)由softMax 函數(shù)輸出3 種情感類別的概率。

        配置訓(xùn)練模型,損失函數(shù)(loss)是編譯模型必須存在的兩個參數(shù)之一,本文選用解析損失函數(shù),它是Keras 提供的一種交叉嫡代價函數(shù),幫助神經(jīng)網(wǎng)絡(luò)從錯誤中快速學(xué)習(xí),交叉嫡是非負的,因此模型正確率越高,交叉嫡的值越接近0。另一個重要參數(shù)為優(yōu)化器(Optimizer),采用梯度下降算法找到偏置和權(quán)重的最優(yōu)解,使代價函數(shù)最小化。選用自適應(yīng)矩估計(Adaptive moment estimation,Adam)優(yōu)化器,它屬于隨機梯度下降(SGD)算法的改進,通過隨機抽取小規(guī)模訓(xùn)練樣本進行計算,并在隨機梯度下降算法的基礎(chǔ)上增加了一階動量和二階動量,可以加速梯度下降并自動調(diào)整學(xué)習(xí)速率,進而減少訓(xùn)練時間。

        訓(xùn)練模型,fit()函數(shù)用來按照指定的迭代次數(shù)訓(xùn)練模型。訓(xùn)練集樣本數(shù)為11 200,每輪包含100 個樣本用來計算一次梯度下降算法優(yōu)化損失函數(shù),到第5 輪停止訓(xùn)練,同時指定驗證集的樣本數(shù)為1 400。

        最終訓(xùn)練結(jié)果如圖5 所示。

        Fig.5 TextCNN model training results圖5 TextCNN 模型訓(xùn)練結(jié)果

        5 可視化功能設(shè)計及構(gòu)建

        5.1 數(shù)據(jù)庫結(jié)構(gòu)設(shè)計

        采用phpMyAdmin 作為客戶端管理數(shù)據(jù)庫,它支持使用PHP 語言執(zhí)行SQL 各種語句以完成對政務(wù)數(shù)據(jù)的統(tǒng)計和可視化。

        以下是關(guān)于政府政務(wù)微博數(shù)據(jù)集存儲在數(shù)據(jù)庫中的基本表結(jié)構(gòu):

        (1)review 表(政務(wù)微博評論表)用來存儲政務(wù)微博下的評論及其相關(guān)信息。具體結(jié)構(gòu)如表1 所示。

        Table 1 Review Form(Government Microblog review Form)表1 review 表(政務(wù)微博評論表)

        (2)weibo 表(政務(wù)微博表)用來存儲政務(wù)微博原文內(nèi)容及標(biāo)題等相關(guān)信息。具體結(jié)構(gòu)如表2 所示。

        Table 2 Microblog table(Government Microblog table)表2 weibo 表(政務(wù)微博表)

        (3)weibo_user 表(微博用戶表)用來存儲評論過政務(wù)微博的用戶相關(guān)信息。具體結(jié)構(gòu)如表3 所示。

        Table 3 Weibo_user table(Weibo user table)表3 weibo_user 表(微博用戶表)

        本文還在微博用戶表、政務(wù)微博評論表和政務(wù)微博表的基礎(chǔ)上建立了兩個視圖user_review 和user_sentiment,它不占用實際內(nèi)存空間??梢杂脕斫鉀Q子查詢中的重復(fù)調(diào)用問題,降低代碼復(fù)雜度。

        5.2 可視化功能設(shè)計

        由于Echarts 的本質(zhì)是一個Javascript 的圖表庫,故只要將官網(wǎng)下載的js 文件放入項目的工程下,利用script 標(biāo)簽就可以將圖表組件引入HTML 頁面中。繪制時,調(diào)用echarts.init()函數(shù)初始化實例對象,創(chuàng)建option 數(shù)組以JSON 串的形式配置參數(shù)并導(dǎo)入需要統(tǒng)計的數(shù)據(jù),最后經(jīng)由對象調(diào)用setOption()函數(shù)顯示圖表。

        可視化主要分為3 部分:①對參與政務(wù)微博討論的用戶信息進行統(tǒng)計;②政務(wù)微博與用戶間互動信息整理;③用戶評論所體現(xiàn)出的情感傾向性分析。具體模塊如圖6所示。

        Fig.6 The overall function design圖6 功能整體設(shè)計

        5.3 可視化結(jié)果展示

        微博用戶年齡分布如圖7 所示。該部分從年齡角度展示不同年齡階段對政府政務(wù)微博的參與程度,從“0~10歲”、“10~20 歲”到“50~60 歲”、“60 歲以上”共劃分7 個年齡階段。采用雷達圖對不同年齡群體的數(shù)量進行統(tǒng)計和顯示,便于實現(xiàn)橫向比較。其中,各年齡段都在關(guān)注政府政務(wù)信息,這體現(xiàn)政民互動在年齡層面上的普及性,較為明顯的是,青年群體已然成為政務(wù)微博建設(shè)過程中的主力軍。

        Fig.7 Age distribution of Microblog users圖7 微博用戶年齡分布

        政務(wù)微博發(fā)博數(shù)與評論數(shù)展示如圖8 所示。針對不同政務(wù)微博之間與政務(wù)微博內(nèi)部兩個維度,采用雙柱狀圖的模式對微博發(fā)博數(shù)量和得到評論總數(shù)量進行統(tǒng)計。通過標(biāo)簽標(biāo)記最高點和最低點,從側(cè)面反映出發(fā)博數(shù)量和評論數(shù)量沒有必然聯(lián)系。政務(wù)微博是否受用戶歡迎,更多與新聞本身的內(nèi)容與質(zhì)量有關(guān)。

        Fig.8 Number of government posts and comments on Microblog圖8 政務(wù)微博發(fā)博數(shù)與評論數(shù)

        情感傾向性分析展示如圖9 所示。針對不同的政務(wù)媒體,統(tǒng)計微博原文下代表不同情感極性評論的各自數(shù)量及評論總數(shù)??梢钥闯?,評論數(shù)量無論多少,3 種情感極性在各自政務(wù)微博總評論中所占比例大致相同,且大多數(shù)評論表現(xiàn)出較強烈的感情傾向,展示出人們對政務(wù)工作的高度參與。

        Fig.9 Sentiment orientation analysis(independent)圖9 情感傾向性分析(獨立)

        性別與情感分布展示如圖10-圖12 所示。該部分以性別作為分類標(biāo)準,統(tǒng)計參與互動的微博用戶的情感部分。由于數(shù)據(jù)集中男女總數(shù)不同,故采用各自性別的評論總數(shù)作為比例公式中的分母,該性別的不同情感作為分子。如圖10 所示,男性和女性在與政務(wù)微博互動時,評論內(nèi)容所顯示出來的中立情感占各自群體總數(shù)的比例大致相同;而如圖11 和圖12 所示,男性群體評論所傾向的消極情感的占比遠高出女性,女性群體的評論所顯示出的情感更加積極。

        Fig.10 Gender and emotional distribution(neutral)圖10 性別與情感分布(中立)

        Fig.11 Gender and emotional distribution(positive)圖11 性別與情感分布(積極)

        Fig.12 Gender and emotional distribution(negative)圖12 性別與情感分布(消極)

        6 結(jié)語

        本文重點對微博評論所隱含的情感傾向性進行分類統(tǒng)計,采用基于深度學(xué)習(xí)情感分析方法中的TextCNN 模型對經(jīng)過預(yù)處理的文本進行訓(xùn)練、評估和預(yù)測,對數(shù)據(jù)進行數(shù)據(jù)庫導(dǎo)入、統(tǒng)計、分析和可視化。在MySQL 數(shù)據(jù)庫中創(chuàng)建表和視圖,方便實現(xiàn)后續(xù)對數(shù)據(jù)的查找和調(diào)用。采用Echarts 開源可視化工具將數(shù)據(jù)嵌入到柱狀圖、雷達圖、地區(qū)分布圖等圖表進行展示,同時通過參數(shù)更改,實現(xiàn)對組件的個性化調(diào)整。

        本文不足之處在于結(jié)果是靜態(tài)化展示,而眾所周知的是,將時間劃入統(tǒng)計范疇的動態(tài)可視化將更具有比較性和說服力。情感傾向性分析為三分類,而顯然人類的情感不可能只有三種,未來可以考慮進行更多分類研究,這更有利于細化輿情監(jiān)測針對公眾情感分析相關(guān)內(nèi)容,使政府收集的民情民意更加精準,幫助政務(wù)部門對輿論作出及時正確的引導(dǎo)。同時,研究中數(shù)據(jù)集規(guī)模較小,得到的結(jié)果不足以代表全部政務(wù)微博現(xiàn)狀,并且采用的數(shù)據(jù)集僅來源于政務(wù)微博,未來還可以對微信公眾號和政務(wù)新媒體客戶端和網(wǎng)站進行統(tǒng)計,使結(jié)果更具有說服力。

        猜你喜歡
        政務(wù)可視化卷積
        基于CiteSpace的足三里穴研究可視化分析
        基于Power BI的油田注水運行動態(tài)分析與可視化展示
        云南化工(2021年8期)2021-12-21 06:37:54
        基于3D-Winograd的快速卷積算法設(shè)計及FPGA實現(xiàn)
        基于CGAL和OpenGL的海底地形三維可視化
        “融評”:黨媒評論的可視化創(chuàng)新
        傳媒評論(2019年4期)2019-07-13 05:49:14
        從濾波器理解卷積
        電子制作(2019年11期)2019-07-04 00:34:38
        基于傅里葉域卷積表示的目標(biāo)跟蹤算法
        政務(wù)
        廣東飼料(2016年5期)2016-12-01 03:43:19
        政務(wù)
        廣東飼料(2016年3期)2016-12-01 03:43:09
        政務(wù)
        廣東飼料(2016年2期)2016-12-01 03:43:04
        夜色阁亚洲一区二区三区| 亚洲成人中文字幕在线视频| 亚洲精品中文幕一区二区| 无码综合天天久久综合网| 日韩精品欧美激情亚洲综合| 狼人狠狠干首页综合网| 国产美女主播视频一二三区 | 无码人妻少妇久久中文字幕蜜桃| 亚洲av无码不卡| 男人的天堂av网站一区二区| 久久久精品国产老熟女| 老妇高潮潮喷到猛进猛出| 日本边添边摸边做边爱的网站| 91超碰在线观看免费| 亚洲av高清一区二区| 国产裸体美女永久免费无遮挡| 999国内精品永久免费视频| 精品国产91久久综合| 久久黄色精品内射胖女人| 成人免费无码大片a毛片| 国产乱理伦片在线观看| 99在线无码精品秘 人口| 国产三级精品三级在线专区2| 在线观看成人无码中文av天堂| 夜色阁亚洲一区二区三区| 国产一区二区三区色区| 亚洲成人中文字幕在线视频 | 青青草视频在线观看视频免费| 久久国产精品一区二区三区| 亚洲av永久无码精品一区二区| 精品九九视频| 亚洲美女主播内射在线| 一本一道人人妻人人妻αv| 中国精品久久精品三级| 日本高清一区二区在线观看| 国产激情视频免费在线观看| 午夜三级a三级三点| 成人综合久久精品色婷婷| 国产精品亚洲一区二区麻豆| 无码丰满熟妇一区二区| 亚洲A∨无码国产精品久久网|