亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        微博話題中的情感分析研究

        2017-10-21 02:59:38張順香
        關(guān)鍵詞:情感分析

        王 銀,張順香

        (安徽理工大學 計算機科學與工程學院,安徽 淮南 232001)

        微博話題中的情感分析研究

        王 銀,張順香*

        (安徽理工大學 計算機科學與工程學院,安徽 淮南 232001)

        微博話題的情感分析是分析出微博話題中隱含的情感并實現(xiàn)對微博消息的分類,該研究可以幫助網(wǎng)絡(luò)監(jiān)管人員和政府機關(guān)人員針對網(wǎng)絡(luò)輿情及時做出積極有效的決策。微博話題情感分析的核心任務(wù)是分析微博話題中每條微博消息的情感傾向。本文提出的中文微博話題的情感分析是在基礎(chǔ)情感詞典之上,通過提取并構(gòu)建程度副詞、網(wǎng)絡(luò)用詞和否定詞等相關(guān)詞典,實現(xiàn)對基礎(chǔ)情感詞典的擴充,最后通過權(quán)值計算得到微博消息的情感極值,達到對微博消息進行情感分類的目的。實驗結(jié)果證明所提出的方法的有效性。

        情感詞典;微博話題;情感分析

        隨著社會網(wǎng)絡(luò)的迅速發(fā)展,越來越多的人通過網(wǎng)絡(luò)來發(fā)表對當前一些熱點話題的看法,而微博則成為用戶廣泛使用的數(shù)據(jù)平臺之一。在微博上,用戶發(fā)表的消息的數(shù)量正以指數(shù)的趨勢在不斷增長,而這些消息涉及到社會、生活、科技、娛樂等諸多領(lǐng)域。在大數(shù)據(jù)時代,這些包含用戶主觀情感信息成為非常寶貴的信息資源,而且越來越多的機構(gòu)把網(wǎng)絡(luò)上的情感觀點信息用于決策。

        然而,如何從海量的微博消息中快速提取出關(guān)鍵、有價值的情感信息成為當前的研究熱點。微博消息的情感分析之所以受到眾多學者的高度關(guān)注,主要是因為其與傳統(tǒng)的文本分析有許多不同的特性,如具有信息元素多樣化,語言靈活等特性。微博的以上特性也給情感分析方面也帶來了新的挑戰(zhàn)。

        微博消息中可以表達情感的信息元素較多,尤其是微博表情。基于機器學習的情感分析方法不能很好地應(yīng)用這些信息元素。情感詞典中可以將這部分特殊的信息元素單獨區(qū)分起來。當然,建立的情感詞典的質(zhì)量和數(shù)量也會影響得微博消息的情感判斷。將更多的微博消息的特征元素應(yīng)用到情感詞典的建立上,則可以有效地提高微博消息情感分析的準確率。因此,本文提出一種基于情感詞典的中文微博話題的情感分析方法。該方法的核心任務(wù)是在基礎(chǔ)情感詞典之上,根據(jù)微博的特征,建立相關(guān)詞典。建立的詞典包括基礎(chǔ)情感詞典,程度副詞詞典,網(wǎng)絡(luò)用詞詞典,否定詞詞典,表情符號詞典和關(guān)系連詞詞典,并將這些詞典導入到分詞系統(tǒng)中。最后根據(jù)每一部情感詞典的權(quán)值計算來對微博消息的情感傾向進行打分并分為正面,負面以及中立三類。其目的是幫助網(wǎng)絡(luò)監(jiān)管人員和政府機關(guān)人員及時采取有效的決策以防止輿論的變相發(fā)展?;谇楦性~典的中文微博話題的情感分析的過程如下圖1所示。

        圖1 基于情感詞典的中文微博話題的情感分析的過程

        1 相關(guān)工作

        情感分析是指分析說話者在傳達信息時所隱含的情緒狀態(tài),對說話者的態(tài)度、意見進行判斷或者評估[1]?;谡Z義詞典的情感計算方法主要是以開源的情感詞典或是擴充的情感詞典為基礎(chǔ),再結(jié)合一些自定義的語義規(guī)則來進行情感計算。朱嫣嵐等人基于Hownet詞典,提出兩種詞匯語義傾向性計算方法,即基于語義相似的方法和基于語義相關(guān)場的方法[2]。Jose R等人基于Senti-WordNet詞典和具有詞義消歧的WordNet詞典在Twitter數(shù)據(jù)上實驗,提出一種詞義消歧(WSD)的情感分類器來高情感分類的準確性[3]。Huang等人使用滑動窗口結(jié)合檢測和情感短語詞典的方法解決隱喻,轉(zhuǎn)折,多重否定和諷刺的語義識別問題[4]。Park等人通過在三個不同英文在線詞典來收集同義詞和反義詞來擴充詞集,建立一個分類詞典進行情感分類[5]。

        基于機器學習的情感分析方法,是采用機器學習的方法,通過對標注語料的訓練生成傾向分類器,對測試文本進行分類。李愛萍等人將句子劃分為簡單句和復雜句,對簡單句采用貝葉斯算法,復雜句采用情感判斷規(guī)則判別情感[6]。Shahheidari等人通過自動收集的微博建立微博語料庫,再利用樸素貝葉斯模型,建立一個簡單的情感分類器[7]。歐陽純萍等人提出一種基于多策略融合的細粒度情緒分析方法,結(jié)合樸素貝葉斯和支持向量機將微博分類[8]。在基于深度學習的情感分析方面,較多的學者使用的是神經(jīng)網(wǎng)絡(luò)方面的知識來進行情感分析[9,10],然而也有學者使用如模糊運算等方面的知識進行相關(guān)分析[11]。

        2 情感詞典的構(gòu)建

        我們首先對獲取的關(guān)于某一話題的微博消息進行預處理,然后再構(gòu)建相關(guān)的詞典。就目前而言,微博文本情感分析領(lǐng)域還沒有一部通用且完整的情感詞典。因此,本章節(jié)基于微博消息的信息元素多樣化和語言靈活等方面的特征,來構(gòu)建相關(guān)的詞典。構(gòu)建的詞典包括基礎(chǔ)情感詞典,程度副詞詞典,否定詞詞典,網(wǎng)絡(luò)用詞詞典,表情符號詞典和關(guān)系連詞詞典。

        2.1 微博文本的預處理

        微博文本不同于普通文本,具有許多普通文本沒有的特征。為了方便研究,需要對微博文本進行預處理。

        (i)去除網(wǎng)頁鏈接、動畫、視頻及圖片。這些內(nèi)容可能對微博消息本身有一定的影響作用,但目前還沒有較好的方法將這些內(nèi)容運用到微博中去,故將其去除。

        (i)去除“@+用戶名”。微博中的“@+用戶名”符號是用來告訴某個人或是引起某人的注意,對情感分析沒有實質(zhì)性的作用,故將其去除。

        (i)去除“#+話題+?!?。此段內(nèi)容為該微博主要談?wù)搶ο?。因為本次收集的微博都是關(guān)于某一話題的,所以此段內(nèi)容可忽略不計,去除即可。

        (i)繁體轉(zhuǎn)換為簡體,英文轉(zhuǎn)中文。微博中偶有繁體和英文出現(xiàn),為了讓后續(xù)工作簡便,可將文中的繁體字轉(zhuǎn)換為簡體字,英文使用翻譯軟件“有道翻譯”譯成中文。

        (i)保留表情符號。表情符號對于情感計算有極大的用處,且有規(guī)律可尋,故將表情符號予以保留。

        2.2 構(gòu)建相關(guān)情感詞典

        本文所構(gòu)建的情感詞典是在已有的基礎(chǔ)情感詞典之上,再根據(jù)微博消息的特征構(gòu)建其他的相關(guān)詞典,實現(xiàn)對情感詞典的擴充。本文的情感詞典主要包括基礎(chǔ)情感詞典,程度副詞詞典,網(wǎng)絡(luò)用詞詞典,否定詞詞典,表情符號詞典和關(guān)系連詞詞典。其中基礎(chǔ)的情感詞典來自于開源的大連理工大學的中文情感詞匯本體庫;程度副詞詞典來自于HowNet中英文情感詞典;否定詞詞典部分來自于前人整理的否定詞[12];網(wǎng)絡(luò)用詞詞典主要是網(wǎng)絡(luò)搜索得到的;表情符號詞典主要來自于新浪微博提供的可選表情符;關(guān)系連詞詞典則從大量已標注情感極性的微博文本中提取獲得。

        定義1 基礎(chǔ)情感詞典(Basic Sentiment Dictionary,BSD)。

        基礎(chǔ)情感詞典是大連理工大學中文情感詞匯本體庫中收錄的27 476個詞。這些情感詞根據(jù)極性分為正面詞,反面詞和中性詞。正面詞以1表示;反面詞以2表示;中性詞以0表示;具有正面和反面的詞以3表示。情感詞的極性強度分為1、3、5、7和9五個層次,9表示最大,1表示最小。為了方便后續(xù)的計算,我們將強度改為權(quán)值,并將極性為0的詞語的權(quán)值都設(shè)為0。具體基礎(chǔ)情感詞典的示例如表1所示。

        表1 基礎(chǔ)情感詞典示例

        定義2程度副詞詞典(Degree Adverb Dictionary,DAD)。

        程度副詞詞典使用的是HowNet詞典中提供的程度副詞詞典,共計219個詞,并將這些程度副詞分為6個等級。等次分別是超、極其最、很、較、稍和欠,但是沒有給出程度的權(quán)值。因此,本文結(jié)合中文語義規(guī)則,根據(jù)這6個等級的副詞對所修飾的情感詞的情感強度擴大的倍數(shù),分別設(shè)為為3倍、2.5倍、2倍、1.5倍、1倍和0.5倍。具體程度副詞詞典的示例如下表2所示。

        表2 程度副詞詞典示例

        定義3否定詞詞典(Negative Words Dictionary,NWD)。

        否定詞詞典包括兩部分,一部分是否定副詞,另一部分是反問詞。否定副詞來源于已有工作整理的31個否定詞;反問詞主要是人工整理的10個詞。由于否定詞和反問詞均表示與原句相反的意思,但反問詞語氣更為強烈,所以將否定詞權(quán)值設(shè)置為-1,反問詞權(quán)值設(shè)為-2。具體的否定詞詞典示例如下表3所示。

        表3 否定詞詞典示例

        定義4網(wǎng)絡(luò)用詞詞典(Network Term Dictionary,NTD)。

        網(wǎng)絡(luò)用詞具有隨著時間推移而逐漸增多的特點,本文中的這些網(wǎng)絡(luò)用詞主要是網(wǎng)絡(luò)搜索“2016年最新網(wǎng)絡(luò)用詞”和“常用網(wǎng)絡(luò)用詞”得到的,共計146個詞。我們將獲取的網(wǎng)絡(luò)用詞分為4個量級,并賦予相應(yīng)的權(quán)值。具體的網(wǎng)絡(luò)用詞詞典示例如下表4。

        表4 網(wǎng)絡(luò)詞詞典示例

        定義5表情符號詞典(Expression Symbol Dictionary,ESD)。

        表情符號詞典主要是網(wǎng)絡(luò)微博平臺上提供的表情符號。本文從中選取了高頻使用部分的表情來構(gòu)建表情符號詞典,主要分為默認浪小花和心情三類,去除重復的表情符號,共計217個表情。再將這些表情符分為五個量級,并賦予相應(yīng)權(quán)重。具體的表情符號詞典示例如下表5所示。

        表5 表情符號詞典示例

        定義6關(guān)系連詞詞典(Relational Conjunction Dictionary,RCD)。

        關(guān)系連詞詞典主要是對微博整句的情感分析起到輔助作用。微博消息中有時整個句子的前后情感極性相同,有時也不同。若整句中用關(guān)系連詞連接前后句子,則可以借助關(guān)系連詞的輔助作用來分析句子的情感。本文通過對大量已標注情感極性的微博消息進行分詞處理,得到若干具有詞性的詞,根據(jù)相連詞之間的極性關(guān)系,抽取出相應(yīng)的連詞。得到的關(guān)系連詞分為四個部分,即遞進、轉(zhuǎn)折、因果和讓步,并為相應(yīng)的部分賦予權(quán)值。具體的關(guān)系連詞詞典示例如下表6。

        文本的情感傾向大多是通過情感詞和一些輔助元素語來體現(xiàn),而情感詞典能否囊括全面情感詞在一定程度上影響著情感分析的結(jié)果。因此,情感詞典的構(gòu)建就成為情感分析的重要基礎(chǔ)。本文構(gòu)建的六部詞典共同組成了微博情感詞典,在對具體的微博消息進行分詞時,可以將情感詞典導入ICTCLAS分詞系統(tǒng)的自定義詞典,這樣得到的分詞結(jié)果更為準確。

        3 情感傾向的加權(quán)計算與分類

        3.1 單個子句的情感值計算

        一條子句中也可能會包含多種信息元素,根據(jù)一般句子的規(guī)律,我們對一條句子可能出現(xiàn)的組合情況做出相應(yīng)的處理。對并列的情感詞或表情的權(quán)值采用加法法則;對有修飾詞的情感詞采用乘法法則;對不同組合的情感權(quán)值采用加法法則。用S表示相應(yīng)句子組合情況的情感值,用O表示單獨某種情況的情感值,用W代表每個基礎(chǔ)情感詞的權(quán)值,用D代表每個程度副詞的權(quán)值,用N代表每個網(wǎng)絡(luò)用詞的權(quán)值,用E代表每個表情符號的權(quán)值。具體應(yīng)用公式如下所示。

        表6 關(guān)系連詞詞典示例

        情況一:子句的情感值僅依靠基礎(chǔ)情感詞的加權(quán)權(quán)值,則該子句情感值的計算公式如下:

        其中,k表示該子句中基礎(chǔ)情感詞的個數(shù)。

        情況二:子句的情感值僅依靠表情符號的加權(quán)權(quán)值,則該子句情感值的計算公式如下:

        其中,k表示該子句中表情符號的個數(shù)。

        情況三:子句的情感值僅依靠網(wǎng)絡(luò)用詞的加權(quán)權(quán)值,則該子句情感值的計算公式如下:

        其中,k表示該子句中網(wǎng)絡(luò)用詞的個數(shù)。

        情況四:情感詞前面出現(xiàn)否定詞,則句子的情感值與否定詞的個數(shù)有關(guān)。若否定詞的個數(shù)為單數(shù),則情感值與情感詞的極性相反,否則與情感詞極性一致。因此,該子句情感值的計算公式如下:

        其中,k為否定詞的個數(shù)。

        情況五:情感詞前面出現(xiàn)反問詞,則該子句情感值的計算公式如下:

        情況六:情感詞前面出現(xiàn)程度副詞,則該子句情感值的計算公式如下:

        情況七、八:情感詞前既有否定詞又有程度副詞分兩種情況,一種是“否定詞+程度副詞+情感詞”,這對情感值起到減弱的作用;另一種是“程度副詞+否定詞+情感詞”,這對情感值起到增強的作用。這兩種情況對句子情感值有一定的影響。如“不太吉祥”和“太不吉祥”,第一句比第二句的情感弱的多。因此兩種的計算公式分別乘上不同的系數(shù)來加以區(qū)分。

        否定詞+程度副詞+情感詞

        綜上所述,若一個句子包含上述8種情況,則情感值計算公式如下:

        3.2 帶有連詞的兩個子句情感值計

        由連詞連接的兩個句子,其整體情感極性往往都是與連詞后的子句極性相同,但情感值根據(jù)連詞不同有所加強或是減弱。所以,有連詞連接的兩句話,都只計算有連詞的句子的情感值。若有子句l-1和連詞子句l,其中子句l-1的情感值為Sl-1,子句l的情感值為Sl,則兩子句的情感值計算公式為:

        其中,C為關(guān)系連詞的權(quán)值。

        根據(jù)上述的詳細討論,可以設(shè)計一個算法來幫助計算一條微博消息中若干子句的情感值。微博消息中子句的情感值的算法如下算法1。

        算法1:微博消息中子句的情感值算法

        輸入:一條微博消息

        輸出:該條微博消息中每個子句的情感值

        算法1主要包括了若干條判斷語句和一條循環(huán)語句:

        (i)判斷語句,第6-21步,用來分析微博消息中單個子句的不同情況。根據(jù)上述的描述情況,將微博消息的子句分為8種情況,針對每種情況設(shè)置對應(yīng)的情感值計算方法。

        (ii)判斷語句,第24-26步,用來計算微博消息中有連詞連接的兩個子句的情感值。有連詞連接的兩個子句,則只對有連詞的子句進行情感計算。

        (iii)循環(huán)語句,第2-26步,是用來計算微博消息中單個子句的情感值。通過對每一個子句的構(gòu)造情況進行分析,綜合得到該子句的情感值。

        3.3 整條微博信息的情感值計算

        在現(xiàn)實的微博中,一條消息可能會包含多方面的情感元素。有的微博消息可能既有情感詞,也有表情符號,也可能包含各種修飾詞,甚至更為復雜。若一條微博包含有n個子句,則微博消息的最終情感值的?計算公式為:

        其中,V代表該條微博消息的最終的情感值;Sj代表該條微博中每條句子的情感值。最終的情感值V會出現(xiàn)三種情況:當V>0時,表示該條微博的情感為正面的;當V=0時,表示該條微博的情感為中立的;當V<0時,表示該條微博的情感為負面的。

        算法2:微博消息的情感分析的算法

        輸入:一條微博消息

        根據(jù)上述的詳細討論,可以設(shè)計一個算法來幫助分析一條微博消息的情感傾向。微博消息的情感分析的算法如下算法2:

        算法2主要包括了一條嵌套的循環(huán)語句和一條判斷語句:

        (i)嵌套循環(huán)語句,第3-4步,用來計算一整條微博消息的情感值。通過單個子句的情感值的相加,即可得到該條微博消息的整體情感值。

        (i)判斷語句,第5-12步,用來判斷微博消息的情感極性。當V>0時,則微博消息的情感傾向是正面的;當V<0時,則微博的情感傾向是負面的;當V=0時,則微博消息的情感傾向是中立的。

        4 實驗

        4.1 實驗方法

        本文對微博消息的情感分析采用的是基于構(gòu)造情感詞典的方法。為了驗證基于情感詞典的中文微博話題的情感分析的效果,本文從新浪微博上獲取了兩個話題的相關(guān)微博消息。具體的實驗步驟如下:

        (i)實驗數(shù)據(jù)獲取。實驗的具體數(shù)據(jù)來源于我們之前的研究工作[13]中獲取的兩個話題微博,即話題“空氣污染能導致肥胖”和“天價救護車”。

        (i)人工標注情感極性。由于獲取的數(shù)據(jù)沒有標注其情感極性,所以我們首先對這兩個話題進行了人工標注情感極性。人工標注的方法是隨機選取三名實驗者對著兩個話題的微博消息進行主觀判斷,最后統(tǒng)計相應(yīng)的結(jié)果。

        (i)構(gòu)建情感詞典。接下來根據(jù)上述第3節(jié)的方法分別構(gòu)建出六部情感詞典,即基礎(chǔ)情感詞典,程度副詞詞典,否定詞詞典,網(wǎng)絡(luò)用詞詞典,表情符號詞典和關(guān)系連詞詞典。

        (i)對獲取的話題微博進行情感分析。在構(gòu)建的六部相關(guān)的情感詞典的基礎(chǔ)上,對每個話題的微博消息進行情感分析并分類。

        本次實驗的環(huán)境為聯(lián)想筆記本電腦、MySql 5.0和Python 2.7。為了能驗證所提出的方法的有效性,我們將實驗結(jié)果與只有一部基礎(chǔ)情感詞典的實驗結(jié)果進行對比。

        4.2 實驗分析

        根據(jù)上述的實驗步驟,做作了以下兩組實驗:

        第一組實驗:結(jié)合上述的六部情感詞典對微博話題“空氣污染能導致肥胖”的1 642條微博消息進行情感分析,并進行微博消息分類。最后將實驗結(jié)果與只有一部基礎(chǔ)情感詞典的實驗結(jié)果進行比較。實驗結(jié)果如下圖3所示。

        圖3 話題“空氣污染能導致肥胖”的微博分類

        通過實驗一的結(jié)果,可以清楚的看到話題“空氣污染能導致肥胖”的微博消息分別基于一部基礎(chǔ)情感詞典和構(gòu)建的六部情感詞典上的分類正確率。從圖中可以看出,基于六部情感詞典的實驗方法比基于一部基礎(chǔ)情感詞典的實驗方法的正確率有較大的提升。

        第二組實驗:結(jié)合上述的情感詞典對微博話題“天價救護車”的1 839條微博消息進行情感分析,并進行微博文本分類。最后將實驗結(jié)果與只有一部基礎(chǔ)情感詞典的實驗結(jié)果進行比較。實驗結(jié)果如圖4所示。

        由實驗二的結(jié)果,可清楚地看到話題“天價救護車”的微博消息分別基于一部基礎(chǔ)情感詞典和構(gòu)建的六部情感詞典上的分類正確率。從圖中可看出,基于六部情感詞典實驗方法比基于一部基礎(chǔ)情感詞典實驗方法的正確率有較大的提升。

        圖4 話題“天價救護車”的微博分類

        上述的兩個實驗表明,對微博消息進行情感分析時,不能僅僅只依靠微博消息中帶有情感色彩的詞語(即上述的基礎(chǔ)情感詞),因為微博還具有其它文本不具有的特征,如信息元素多樣化,語言靈活等特點。因此,在對微博消息進行情感分析時還要考慮結(jié)合微博消息的特點,以此來提高微博消息情感分析的正確率。本文結(jié)合微博消息的特征,構(gòu)建了相關(guān)的情感詞典,如程度副詞詞典,否定詞詞典,網(wǎng)絡(luò)用詞詞典等多部詞典。將六部詞典應(yīng)用到微博消息的情感分析上,通過上述的實驗,證明了該方法的有效性。

        5 總結(jié)

        基于情感詞典的中文微博話題的情感分析能夠幫助微博平臺的管理人員以及政府機關(guān)有效的進行輿情監(jiān)管以及做出最佳的決策。實驗結(jié)果表明,基于情情感詞典的中文微博話題的情感分析能夠有效地對微博信息進行分類,更有助于輿情監(jiān)管人員做出相應(yīng)的決策。在未來,情感詞典的中文微博話題的情感分析也可以為其他的相關(guān)研究,如話題跟蹤,話題預測等方面打下了良好的基礎(chǔ),以便于更有效的研究。

        [1]周勝臣,瞿文婷,石英子,等.中文微博情感分析研究綜述[J].計算機應(yīng)用與軟件,2013,30(3):161-164,181.

        [2]朱嫣嵐,閔 錦,周雅倩,等.基于HowNet的詞匯語義傾向計算[J].中文信息學報,2006,20(1):14-20.

        [3]Jose R,Chooralil V S.Prediction of election result by enhanced sentiment analysis on Twitter data using Word Sense Disambiguation[C]//International Conference on Control Communication&Computing India,2015:638-641.

        [4]Huang S,You J P,Zhang H X,et al.Sentiment analysis of Chinese micro-blog using semantic sentiment space model[C]//PROCEEDINGS OF 2012 2ND INTERNATIONAL CONFERENCE ON COMPUTER SCIENCE AND NETWORK TECHNOLOGY(ICCSNT 2012),2012:1443-1447.

        [5]Park S,Kim Y.Building thesaurus lexicon using Dictionary-Based approach for sentiment classification[C]//2016 IEEE/ACIS 14TH INTERNATIONAL CONFERENCE ON SOFTWARE ENGINEERING RESEARCH,MANAGEMENTANDAPPLICATIONS(SERA),2016:39-44.

        [6]李愛萍,邸 鵬,段利國.基于句子情感加權(quán)算法的篇章情感分析[J].小型微型計算機系統(tǒng),2015,36(10):2252-2256.

        [7]Shahheidari S,Dong H,Bin Daud M N.Twitter sentiment mining:A multi domain analysis[C]//2013 SEVENTH INTERNATIONAL CONFERENCE ON COMPLEX,INTELLIGENT,AND SOFTWARE INTENSIVE SYSTEMS(CISIS),2013:144-149.

        [8]歐陽純萍,陽小華,雷龍艷,等.多策略中文微博細粒度情緒分析研究[J].北京大學學報:自然科學版,2014,50(1):67-72.

        [9]梁 軍,柴玉梅,原慧斌,等.基于深度學習的微博情感分析[J].中文信息學報,2014,28(5):155-161.

        [10]Hu Z K,Hu J Q,Ding W F,et al.Review sentiment analysis based on deep learning[C]//2015 IEEE 12TH INTERNATIONAL CONFERENCE ON E-BUSINESS ENGINEERING(ICEBE),2015:87-94.

        [11]Mouthami K,Devi K N,Bhaskaran V M.Sentiment analysis and classification based on textual reviews[C]//2013 INTERNATIONAL CONFERENCE ON INFORMATION COMMUNICATION AND EMBEDDED SYSTEMS(ICICES),2013:271-276.

        [12]郝雷紅.現(xiàn)代漢語否定副詞研究[D].北京:首都師范大學,2003:3-11.

        [13]Zhang S X,Wang Y,Zhang S Y,et al.Building associated semantic representation model for the ultra-short microblog text jumping in big data[J].Cluster Computing,2016,19(3):1399-1410.

        Research of sentiment analysis for Chinese micro-blog topic

        WANG Yin,ZHANG Shun-xiang*

        (School of Computer Science and Engineering,Anhui University of Science&Technology,Huainan Anhui 232001,China)

        Micro-blog topic sentiment analysis is to analyze the connotative sentiment from the micro-blog topic and to achieve the classification of micro-blog massages.This research can help network supervisors and government officials to make a positive and effective decision for network public opinion.The core task of micro-blog's sentiment analysis is the analysis of sentiment tendency from micro-blog messages.In this paper,the sentiment analysis of Chinese micro-blog topic is based on the sentiment dictionary.Afterwards,the basic sentiment dictionary can be extended by extraction and construction of degree adverbs,network terms,negative words and other related dictionaries.Finally,the sentiment extreme value of micro-blog message is obtained through the calculation of the weight,which achieves the purpose of sentiment classification of micro-blog massages.Experimental results prove the effectiveness of the proposed method.

        sentiment dictionary;micro-blog topic;sentiment analysis

        TP274.2

        A

        1004-4329(2017)02-050-07

        10.14096/j.cnki.cn34-1069/n/1004-4329(2017)02-050-07

        2016-12-16

        安徽省教育廳自然科學基金重點項目(KJ2015A111);上海市信息安全綜合管理技術(shù)研究重點實驗室(上海交通大學)開放課題(AGK2013002)資助。

        王 銀(1991- ),女,碩士生,研究方向:信息提取、文本表示與分析。

        張順香(1971- ),男,博士,教授,研究方向:語義Web、信息檢索與信息提取。Email:sxzhang@aust.edu.cn。

        猜你喜歡
        情感分析
        隱蔽失效適航要求符合性驗證分析
        如何在情感中自我成長,保持獨立
        被情感操縱的人有多可悲
        失落的情感
        北極光(2019年12期)2020-01-18 06:22:10
        情感
        電力系統(tǒng)不平衡分析
        電子制作(2018年18期)2018-11-14 01:48:24
        如何在情感中自我成長,保持獨立
        電力系統(tǒng)及其自動化發(fā)展趨勢分析
        情感移植
        中西醫(yī)結(jié)合治療抑郁癥100例分析
        亚洲av无码一区二区乱子伦as| 亚洲人成在久久综合网站| 极品少妇在线观看视频| 亚洲第一黄色免费网站| 奇米影视7777久久精品| 激情偷乱人伦小说视频在线| 国产成人精品免费视频大全| 亚洲精品国产av成拍| 国产精品人人做人人爽人人添| 在线亚洲欧美日韩精品专区| 欧美日韩国产成人综合在线影院 | 成美女黄网站18禁免费| 一区二区三区四区黄色av网站| 国产成人av在线免播放观看新| 无码a∨高潮抽搐流白浆| 一区二区三区放荡人妻| 国产理论亚洲天堂av| 亚洲色偷偷偷综合网| 免费1级做爰片1000部视频| 国产欧美乱夫不卡无乱码| 久久99热精品免费观看麻豆| 青青草免费在线爽视频| 久久久受www免费人成| 国产在线不卡AV观看| 亚洲av自偷自拍亚洲一区| 亚洲人成人无码www| 黑人巨大白妞出浆| 国产成人亚洲综合小说区| 一区二区视频在线国产| 免费人成网站在线观看欧美| 国产成人午夜精品免费视频| 综合久久青青草免费观看视频| 精品国产一区二区三区三| 国产人妻精品一区二区三区| 波多野结衣一区二区三区视频| 日本一区二区三区精品免费| 国产精品精品自在线拍| 丝袜AV在线一区二区三区| 热门精品一区二区三区| 美女露出粉嫩小奶头在视频18禁| 国产在线精品一区二区|