亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        微博立場檢測研究綜述

        2017-02-23 06:50:18周耘立李珊珊
        現(xiàn)代計算機 2017年2期
        關(guān)鍵詞:監(jiān)督文本情感

        周耘立,李珊珊

        (四川大學計算機學院,成都 610065)

        微博立場檢測研究綜述

        周耘立,李珊珊

        (四川大學計算機學院,成都 610065)

        微博立場檢測是一個新興的研究課題,具有很大的研究價值和應用價值。鑒于此,該研究課題受到越來越多國內(nèi)外研究機構(gòu)的重視。首先針對立場檢測主流方法和前沿進展進行介紹;接著介紹國內(nèi)外主流的評測會議;最后,總結(jié)并展望立場檢測技術(shù)的發(fā)展趨勢。

        情感傾向性分析;立場檢測;微博

        0 引言

        立場檢測任務就是自動的檢測一段文本的作者對于給定的目標對象他的立場是支持、反對還是中立。近幾年,已經(jīng)在立場檢測建模方面進行了積極的研究工作[4-5,10]。Faulkne[4]使用目標信息和維基百科鏈接關(guān)系來自動的識別學生論文中的目標立場。由于微博文本簡短、非正式、充滿錯誤拼寫、簡寫以及俚語等特點,給研究界帶來了新的機遇和挑戰(zhàn)[2,5]。微博立場檢測任務旨在從一段微博中檢測作者對于給定目標的立場,而不依賴于在線討論中經(jīng)常出現(xiàn)的會話結(jié)構(gòu)。

        立場檢測與情感分析研究相關(guān),但是兩者有著顯著的差別。立場檢測通常可以看做是觀點挖掘和情感分析的一個子任務。在情感分析中,我們通過對文本中的觀點、態(tài)度的分析來判斷文本所表達的情感是正面的還是負面的。然而,在立場探測中,系統(tǒng)需要確定作者對于給定目標的偏好,是支持還是反對,或者是中立。這個目標可能并沒有在文本中顯式的出現(xiàn),而是被暗指。同時這個文本可能對其他實體對象表達觀點或者情感[6]。例如,考慮表1中的目標和微博文本。

        微博中并沒有直接提及目標對象,也沒有直接表對目標表達情感傾向,但是我們可以推斷出微博作者很可能是不支持目標對象的。立場檢測系統(tǒng)需要能自動識別出不存在于焦點文本中的相關(guān)信息。自動的立場檢測技術(shù)有著多方面的應用,如信息檢索、文本摘要和文本蘊涵等[11]。

        表1 樣本數(shù)據(jù)

        1 技術(shù)方法

        針對微博進行情感傾向性分析研究技術(shù)主要有三大類:第一類是采用情感詞典與規(guī)則結(jié)合的方法[1,3],根據(jù)文本中所包含的情感詞的個數(shù)與情感詞的傾向來進行立場檢測;第二類是采用機器學習的方法,選擇文本中的一些特征,標準訓練集和測試集,使用樸素貝葉斯、SVM[7,11]等分類器進行立場檢測;第三類是規(guī)則與機器學習結(jié)合的方法。

        微博立場檢測主要是考慮對于給定的目標對象微博作者的立場傾向,這個對象可能是事件、人或者物體。目前主要的研究方法是基于機器學習的方法。按照機器學習類型劃分,我們可以將機器學習方法分為兩類:第一類是有監(jiān)督學習方法;第二類是無監(jiān)督學習方法。

        1.1 有監(jiān)督方法

        有監(jiān)督方法將立場檢測問題看做是一個分類問題,使用機器學習方法從標注數(shù)據(jù)中學習分類器。當前大多數(shù)的語言學研究者把有監(jiān)督的立場檢測問題看做是文檔水平的立場分類問題,使用各種詞匯、語法和語義特征來識別特定目標的立場。針對微博文本的特點,Patra[12]使用了SentiWordNet、NRC Emotion Lexicon、Hashtag Emotion Lexicon三個情感詞典來提取詞級別的特征,同時借助于RitaWordNet外部詞典資源來創(chuàng)建目標相關(guān)主題詞袋此外,還結(jié)合依存分析和手工規(guī)則構(gòu)建特征,最后使用支持向量機來訓練分類器。Krejzl[13]通過使用hashtags的情感極性、n元語法、微博長度以及強烈表明一個特定立場的立場領(lǐng)域詞典等構(gòu)造特征,訓練一個最大熵分類器。Elfardy[14]試圖探究詞法和語法特征能多大程度上來幫助識別微博立場,提出在有監(jiān)督框架下,使用詞匯、語義字典和潛在語義情感來識別情感立場。

        1.2 無監(jiān)督方法

        有監(jiān)督方法主要缺點是依賴于人手工標注數(shù)據(jù),這是一項十分費時費力的工作。當沒有辦法獲取大規(guī)模的標注語料時,人們提出了無監(jiān)督學習方法,僅使用非標注數(shù)據(jù)進行建模。Turney通過計算文中候選單詞與種子情感詞之間的點互信息來計算文本的情感傾向性[7]。由于在線辯論語言使用上的復雜性,辯論雙方常常使用先褒后貶的方式來表達自己的觀點,Somasundaran[9]提出通過構(gòu)建約束條件利用整數(shù)線性規(guī)劃進行建模,幫助識別作者的立場。立場檢測中目標對象很可能并沒有出現(xiàn)在微博中,Augenstein[13]等人通過從無標注的微博數(shù)據(jù)中使用詞袋自編碼模型學習特征,提高模型在目標對象未出現(xiàn)微博上的泛化能力從而提高了立場檢測的效果。

        2 評測數(shù)據(jù)和評測指標

        微博用戶產(chǎn)生的大量評論性數(shù)據(jù)潛藏著巨大的研究價值和商業(yè)價值[7]。微博立場檢測首先引起國際語義評估研討會(SemEval-20161)的關(guān)注,2016年發(fā)布了“Detecting Stance in Tweets”評測任務。國內(nèi)第五屆自然語言處理與中文計算會議(NLPCC20162),發(fā)布了“中文微博立場檢測”評測任務。國內(nèi)外研究機構(gòu)都關(guān)注在兩個任務上,第一個任務是有監(jiān)督方法的立場探測;第二個是無監(jiān)督方法的立場檢測。下面針對SemEval-2016評測數(shù)據(jù)進行介紹。

        SemEval-2016立場檢測任務中,評測數(shù)據(jù)包含五個目標對象分別是“Atheism”,"Climate Change is a Real Concern","Feminist Movement","Hillary Clinton", "Legalization of Abortion",所有的數(shù)據(jù)都標注了立場。表2所示是訓練集上樣本的統(tǒng)計。

        表2 訓練集上樣本數(shù)據(jù)統(tǒng)計

        精確率、召回率和F度量值三種評價指標在自然語言處理領(lǐng)域被廣泛使用。其中精確率和召回率從不同的角度度量了分類器的好壞,F(xiàn)度量值綜合了精確率和召回率兩種指標[3]。

        表3 分類器輸出結(jié)果

        精確率(P)、召回率(R)、F值定義如下:

        3 結(jié)語

        微博作為主流的社交媒體具有重大的研究價值和商業(yè)價值,微博立場探測作為新興的研究課題,得到國內(nèi)外研究學者的廣泛重視,并成為研究熱點。本文主要從立場檢測前沿進展、主流方法以及相關(guān)評測進行介紹。目前基于神經(jīng)網(wǎng)絡(luò)的方法也開始在立場檢測任務中展露光芒,相信在未來會有更多的進展。由于微博文本本身的一些隨意性、不規(guī)范表達增加了立場檢測的

        [1]趙妍妍,秦兵,劉挺.文本情感分析[J].軟件學報,2010,21(8):1834-1848.

        [2]張劍峰,夏云慶,姚建民,等.微博文本處理研究綜述[J].中文信息學報,2012,26(4):21-27.

        [3]奉國和.文本分類性能評價研究[J].情報雜志,2011(8):66-70.

        [4]Faulkner A.Automated Classification of Stance in Student Essays:An Approach Using Stance Target Information and the Wikipedia Link-Based Measure[C]//2014.

        [5]Kiritchenko S,Zhu X,Mohammad S M.Sentiment Analysis of Short Informal Text[J].Journal of Artificial Intelligence Research,2014, 50:723-762..

        [6]Mohammad S M,Sobhani P,Kiritchenko S.Stance and Sentiment in Tweets[J],2016.

        [7]楊經(jīng),林世平.基于SVM的文本詞句情感分析[J].計算機應用與軟件,2011,28(9):225-228.

        [8]陳淵,林磊,孫承杰,等.一種面向微博用戶的標簽推薦方法[J].智能計算機與應用,2011,01(5):21-26.

        [9]Somasundaran S,Wiebe J.Recognizing Stances in Online Debates[J],2009.

        [10]Mohammad S,Kiritchenko S,Sobhani P,et al.SemEval-2016 Task 6:Detecting Stance in Tweets[C].International Workshop on Semantic Evaluation,2016.

        [11]Patra B G,Das D,Bandyopadhyay S.JU_NLP at SemEval-2016 Task 6:Detecting Stance in Tweets using Support Vector Machines [C].Semeval,2016.

        [12]Krejzl P,Steinberger J.UWB at SemEval-2016 Task 6:Stance Detection[C].International Workshop on Semantic Evaluation,2016.

        [13]Augenstein I,Vlachos A,Bontcheva K.USFD at SemEval-2016 Task 6:Any-Target Stance Detection on Twitter with Autoencoders [C].International Workshop on Semantic Evaluation,2016.

        [14]Elfardy H,Diab M.CU-GWU Perspective at SemEval-2016 Task 6:Ideological Stance Detection in Informal Text[C].International Workshop on Semantic Evaluation,2016.

        Summary of Micro-Blog Stance Detection

        ZHOU Yun-li,LI Shan-shan

        (College of Computer Science,Sichuan University,Chengdu 610065)

        Micro-blog stance detection is gaining importance due to various academic and commercial perspectives.For that reason,the subject of research receives increasingly attention at home and abroad in research institutions.Summarizes the author first the main stream stance detection approaches and the most recently research progress.Then introduces the main stream of evaluation meetings at home and abroad,finally,summarizes and forecasts the development trend of stance detection technology.

        Sentiment Analysis;Stance Detection;Micro-blog

        1007-1423(2017)02-0032-03

        10.3969/j.issn.1007-1423.2017.02.008

        周耘立(1990-),男,四川成都人,碩士研究生,研究方向為數(shù)據(jù)挖掘

        2016-11-15

        2017-01-05

        李珊珊(1989-),女,江蘇徐州人,碩士研究生,研究方向為自然語言處理

        猜你喜歡
        監(jiān)督文本情感
        如何在情感中自我成長,保持獨立
        突出“四個注重” 預算監(jiān)督顯實效
        失落的情感
        北極光(2019年12期)2020-01-18 06:22:10
        情感
        在808DA上文本顯示的改善
        基于doc2vec和TF-IDF的相似文本識別
        電子制作(2018年18期)2018-11-14 01:48:06
        如何在情感中自我成長,保持獨立
        監(jiān)督見成效 舊貌換新顏
        夯實監(jiān)督之基
        文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學隱喻
        久久久精品国产亚洲AV蜜| 日日摸天天碰中文字幕你懂的| 无码少妇精品一区二区免费动态| 天天av天天爽无码中文| 91精品国产无码在线观看| 亚洲婷婷久久播66性av| 亚洲无线一二三四区手机| 国产精品人妻一区夜夜爱| 尤物AV无码色AV无码麻豆| 国产无卡视频在线观看| 日日躁夜夜躁狠狠躁| 99久久免费精品高清特色大片| 丰满人妻AV无码一区二区三区| 日韩精品极视频在线观看免费| 狂野欧美性猛xxxx乱大交| 3344永久在线观看视频| 大胸美女吃奶爽死视频| 青青久在线视频免费视频| 国产一精品一av一免费| 色爱区综合激情五月综合小说| 人妻少妇精品系列一区二区| 久久久亚洲精品蜜桃臀| 日本在线一区二区免费| 乱人伦精品视频在线观看| 丝袜足控一区二区三区| 果冻蜜桃传媒在线观看| 久久国产成人午夜av免费影院| 中字幕人妻一区二区三区| 亚洲最大在线精品| 中文字幕乱码在线婷婷| 色综合久久久无码中文字幕| 亚洲成色在线综合网站| 女人被躁到高潮嗷嗷叫免费软| 手机久草视频福利在线观看| 国产女人高潮叫床免费视频| 国产成人啪精品午夜网站| 亚洲中文字幕高清在线视频一区 | 亚洲国产成人无码av在线影院| 日批视频免费在线观看| 天堂av国产一区二区熟女人妻| 国产丝袜美女|