亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        文本情感分析研究概述

        2014-04-29 23:58:31董秦濤蘇亞峰屈志毅董秦濤蘇亞峰屈志毅
        電腦迷 2014年13期
        關(guān)鍵詞:情感分析語(yǔ)料庫(kù)

        董秦濤 蘇亞峰 屈志毅董秦濤 蘇亞峰 屈志毅

        摘 要 對(duì)文本情感分析研究進(jìn)行總結(jié),從情感詞抽取、語(yǔ)料庫(kù)和情感詞典構(gòu)建、主觀(guān)分析三個(gè)方面對(duì)文本情感分析研究相關(guān)文獻(xiàn)進(jìn)行梳理、評(píng)述,最后介紹了實(shí)際應(yīng)用。

        關(guān)鍵詞 情感分析 情感詞抽取 語(yǔ)料庫(kù) 情感詞典

        中圖分類(lèi)號(hào):TP3 文獻(xiàn)標(biāo)識(shí)碼:A

        0引言

        網(wǎng)絡(luò)已經(jīng)進(jìn)入到了“交互式網(wǎng)絡(luò)”時(shí)代。人們從網(wǎng)絡(luò)獲取信息的同時(shí),也直接在各種網(wǎng)絡(luò)平臺(tái)表達(dá)喜、怒、哀、樂(lè)等各種情感。這些主觀(guān)性文本每天以指數(shù)級(jí)的速度增長(zhǎng),僅靠人工進(jìn)行分析不僅需要消耗大量的人力和時(shí)間,還易造成信息遺漏。

        因此采用計(jì)算機(jī)快速地進(jìn)行文本信息分類(lèi)和情感信息的抽取,通過(guò)挖掘和分析文本中的立場(chǎng)、觀(guān)點(diǎn)、情緒等主觀(guān)信息,對(duì)文本情感傾向做出判斷,成為目前學(xué)術(shù)界研究的一個(gè)熱點(diǎn),即文本情感分析。

        1文本情感分析概述

        情感分析是指分析發(fā)表者在傳達(dá)信息時(shí)所隱含的情緒狀態(tài),對(duì)發(fā)表者的態(tài)度、意見(jiàn)進(jìn)行判斷或者評(píng)估。文本情感分析是自然語(yǔ)言理解領(lǐng)域的重要研究分支,涉及統(tǒng)計(jì)學(xué)、語(yǔ)言學(xué)、心理學(xué)、人工智能等領(lǐng)域的理論與方法。

        文本情感分析的主要任務(wù)就是根據(jù)文本信息來(lái)判斷發(fā)表者的情感傾向,主要利用底層情感信息抽取的結(jié)果將情感文本單元分為若干類(lèi)別本文將分別從情感詞抽取、語(yǔ)料庫(kù)和情感詞典構(gòu)建、主觀(guān)分析三個(gè)方面對(duì)文本情感分析研究相關(guān)文獻(xiàn)進(jìn)行梳理,最后介紹了實(shí)際應(yīng)用。

        2情感詞抽取

        情感詞又稱(chēng)極性詞、評(píng)價(jià)詞語(yǔ),特指帶有情感傾向性的詞語(yǔ)。評(píng)價(jià)詞語(yǔ)的抽取和判別,主要方法可分為基于大規(guī)模語(yǔ)料庫(kù)的統(tǒng)計(jì)方法 (表情符號(hào)可以視為情感詞的一種)、利用詞典計(jì)算相似度方法。

        2.1基于語(yǔ)料庫(kù)的情感詞抽取和判別

        利用大語(yǔ)料庫(kù)的統(tǒng)計(jì)特性,其最大優(yōu)點(diǎn)在于簡(jiǎn)單易行;缺點(diǎn)是可利用的語(yǔ)料庫(kù)有限,評(píng)價(jià)詞語(yǔ)在大語(yǔ)料庫(kù)中的分布等現(xiàn)象并不容易歸納。Wilson T等人對(duì)主觀(guān)性文本進(jìn)行系統(tǒng)的分析研究,挖掘大量的主觀(guān)性文本形成主觀(guān)表達(dá)式庫(kù),并基于此完成文本的主客觀(guān)分類(lèi)和褒貶分類(lèi)。RILOFF E等人用手工方法制定模板并以此選取種子情感詞,通過(guò)使用迭代的方法可以獲取名詞詞性的情感詞。

        2.2基于詞典的情感詞抽取及判別方法

        使用詞典中的詞語(yǔ)之間的詞義聯(lián)系挖掘評(píng)價(jià)詞語(yǔ),其最大優(yōu)點(diǎn)是獲取情感詞全面、準(zhǔn)確,缺點(diǎn)是存在一詞多義現(xiàn)象。朱嫣嵐等人提出基于HowNet詞的語(yǔ)義相似度和語(yǔ)義相關(guān)的情感詞極性計(jì)算方法。Yang C等人使用PMI(Point wise Mutual Information),通過(guò)計(jì)算一個(gè)詞和已知極性的種子詞(或表情符號(hào))的點(diǎn)互信息量,推斷該詞是不是情感傾向詞。王昌厚等人基于模式的Bootstrapping方法,從微博語(yǔ)料中抽取情感評(píng)價(jià)詞,通過(guò)模式劃定新詞的邊界,跨過(guò)新詞識(shí)別的過(guò)程,直接進(jìn)行情感傾向詞的抽取。

        3語(yǔ)料庫(kù)、情感詞典構(gòu)建

        語(yǔ)料庫(kù):WIEBE J等人建立多視角問(wèn)答語(yǔ)料庫(kù)對(duì)535篇廣泛來(lái)源的新聞進(jìn)行了語(yǔ)句級(jí)人工標(biāo)注,而且對(duì)語(yǔ)句的低層進(jìn)行了標(biāo)注,標(biāo)出了情感文本的發(fā)表者、對(duì)象、極性、強(qiáng)度等要素。除了情感,還標(biāo)注了情緒、推斷、信念等。

        情感詞典:STONE P等人收集了1915個(gè)褒義詞和2 293個(gè)貶義詞,并按照極性、強(qiáng)度、詞性等打上不同的標(biāo)簽,對(duì)于詞匯還列出不同的義項(xiàng),可以區(qū)別不同義項(xiàng)和詞性下的褒貶極性,也相當(dāng)于對(duì)每個(gè)單詞都構(gòu)建了一組語(yǔ)義消歧規(guī)則。HowNet評(píng)價(jià)詞詞典,包含9193個(gè)中文評(píng)價(jià)詞語(yǔ),9142個(gè)英文評(píng)價(jià)詞語(yǔ),并被分為褒貶兩類(lèi)。

        4主觀(guān)分析

        在情感分析中,分析意見(jiàn)的屬性與語(yǔ)句上下文正確理解對(duì)判斷情感極性至關(guān)重要。屬性極性判定的步驟為:(1)對(duì)句子進(jìn)行詞性標(biāo)注;(2)提取句子中所有的名詞利用挖掘算法尋找頻繁項(xiàng)集;(3)對(duì)頻繁項(xiàng)集的項(xiàng)進(jìn)一步篩檢;(4)從文本中抽取出包含特征詞的句子(情感句);(5)通過(guò)對(duì)情感詞的極性定位結(jié)合句子中可能出現(xiàn)的程度副詞和否定詞做出抽取屬性的傾向性判定。

        5文本情感分析應(yīng)用

        (1)用戶(hù)評(píng)論分析與決策

        在購(gòu)買(mǎi)產(chǎn)品或者服務(wù)前,消費(fèi)者可以獲取相關(guān)的評(píng)論可以提供參考,提供者可以通過(guò)評(píng)論進(jìn)一步改進(jìn)產(chǎn)品或者服務(wù)質(zhì)量。LIU B等人研究并開(kāi)發(fā)的產(chǎn)品信息反饋系統(tǒng),利用網(wǎng)絡(luò)上的顧客評(píng)論資源,提取并統(tǒng)計(jì)消費(fèi)者對(duì)產(chǎn)品特征的評(píng)價(jià),采用可視化方式顯示統(tǒng)計(jì)和比較結(jié)果。

        (2)輿情監(jiān)控

        政府機(jī)構(gòu)可以通過(guò)公眾對(duì)新聞事件或國(guó)家政策的看法來(lái)了解輿。朱元波在其碩士論文中設(shè)計(jì)了在線(xiàn)網(wǎng)絡(luò)挖掘系統(tǒng),對(duì)暴恐組織網(wǎng)上串聯(lián)進(jìn)行監(jiān)督。

        6結(jié)語(yǔ)

        本文就國(guó)內(nèi)外文本情感分析研究情況進(jìn)行了總結(jié)和梳理,重點(diǎn)介紹了文本情感分析研究中的幾個(gè)關(guān)鍵問(wèn)題:情感詞抽取、語(yǔ)料庫(kù)和情感詞典構(gòu)建、主觀(guān)分析,最后文本情感分析實(shí)際應(yīng)用進(jìn)行了概括。文本情感分析,特別是中文文本情感分析是一個(gè)新興的研究方向,具有非常廣闊的應(yīng)用前景。

        參考文獻(xiàn)

        [1] 楊立公,朱儉,湯世平.文本情感分析綜述.計(jì)算機(jī)應(yīng)用,2013,33(6):1574-1578.

        [2] 朱嫣嵐,閔錦,周雅倩等.基于HowNet的詞匯語(yǔ)義傾向計(jì)算[J].中文信息學(xué)報(bào),2006,20(1):14-20.

        [3] 王昌厚,王菲.使用基于模式的Bootstrapping方法抽取情感詞[J].計(jì)算機(jī)工程與應(yīng)用,2014,50(1):127-129.

        [4] 李思.基于合并模型的中文文本情感分析.第五屆全國(guó)信息檢索學(xué)術(shù)會(huì)議,2009,1( 1):322-328.

        猜你喜歡
        情感分析語(yǔ)料庫(kù)
        《語(yǔ)料庫(kù)翻譯文體學(xué)》評(píng)介
        基于語(yǔ)料庫(kù)“隱秘”的詞類(lèi)標(biāo)注初步探究
        把課文的優(yōu)美表達(dá)存進(jìn)語(yǔ)料庫(kù)
        基于語(yǔ)義的互聯(lián)網(wǎng)醫(yī)院評(píng)論文本情感分析及應(yīng)用
        基于雙向循環(huán)神經(jīng)網(wǎng)絡(luò)的評(píng)價(jià)對(duì)象抽取研究
        基于SVM的產(chǎn)品評(píng)論情感分析系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
        基于詞典與機(jī)器學(xué)習(xí)的中文微博情感分析
        在線(xiàn)評(píng)論情感屬性的動(dòng)態(tài)變化
        文本觀(guān)點(diǎn)挖掘和情感分析的研究
        基于JAVAEE的維吾爾中介語(yǔ)語(yǔ)料庫(kù)開(kāi)發(fā)與實(shí)現(xiàn)
        尤物网址在线观看| 国产老熟女伦老熟妇露脸| 国内精品久久人妻互换| 日韩一线无码av毛片免费 | 日本大片在线看黄a∨免费| 欧美疯狂性xxxxxbbbbb| 人妻av一区二区三区精品| 欧美黑人又粗又大久久久 | 国产一区二区视频免费在线观看| 日韩女优av一区二区| 无码爽视频| 精品国产乱码久久久久久婷婷 | 欧美成人精品一区二区综合| A阿V天堂免费无码专区| 久久久调教亚洲| 亚洲精品一区二区三区av| 手机av在线观看视频| 国产一区二区视频在线看| 极品少妇人妻一区二区三区| 亚洲爆乳无码精品aaa片蜜桃| 国产精品无码一区二区在线观一| 国产真实乱对白精彩久久老熟妇女 | 亚洲成在人线av| 成年毛片18成年毛片| 久久本道久久综合一人| 国产av久久在线观看| 久久天天躁狠狠躁夜夜av浪潮| 在线 | 一区二区三区四区| 四川老熟妇乱子xx性bbw| 欧美性videos高清精品| 亚洲AV无码成人精品区网页| 午夜福利不卡无码视频| 精品黑人一区二区三区| av在线不卡一区二区三区| 开心五月激情五月天天五月五月天| 美女露出奶头扒开内裤的视频| 中文字幕成人乱码熟女精品国50| 精品国产av色一区二区深夜久久| 久久久久亚洲av片无码v| 欧美丰满熟妇aaaaa片| 一本无码人妻在中文字幕|