亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        社會化在線評論情感因素測量與有用性分析

        2018-08-11 11:22:58田依林滕廣青黃微
        現(xiàn)代情報 2018年6期
        關(guān)鍵詞:在線評論情感因素

        田依林 滕廣青 黃微

        〔摘 要〕[目的/意義]社會化在線評論與傳統(tǒng)的專業(yè)性評論相比,具有更為顯著的傳播速度和影響力。文本評論中的情感因素并非單純的數(shù)量化評分能夠完全體現(xiàn)的。對本文評論中情感因素的測量與分析,能夠有助于在線評論的全角度識別與揭示,更加客觀準確地反映在線評論的價值。[過程/方法]通過提取用戶發(fā)布的在線文本評論數(shù)據(jù),采用有監(jiān)督機器學(xué)習的算法,分別計算文本評論的情感分類得分、情感傾向得分、綜合情感得分。從類型、地區(qū)、人數(shù)多個維度對情感得分與總評分進行交叉對比分析。[結(jié)果/結(jié)論]研究結(jié)果表明,文本評論蘊含的情感因素對總評分具有部分的影響作用。用戶的認知偏好、社會文化背景和評論人數(shù)占比會對情感因素的有用性產(chǎn)生影響。

        〔關(guān)鍵詞〕在線評論;情感因素;有用性;多維分析

        DOI:10.3969/j.issn.1008-0821.2018.06.003

        〔中圖分類號〕G203 〔文獻標識碼〕A 〔文章編號〕1008-0821(2018)06-0019-09

        〔Abstract〕[Purpose/Significance]Social online reviews have more prominence propagation spread and influence than traditional professional reviews.Emotional factors in text comments cannot be fully reflected by mere quantification scores.The measurement and analysis of the emotional factors in text comments can help full angle identify and reveal the online commentary,and reflect the values of online reviews more objectively and accurately.[Process/Method]By extracting the users text comment data,an algorithm of supervised machine learning was used to calculate the emotion classification score,emotion tendency score and comprehensive emotion score of text comment respectively.The emotion score and total score were cross-comparison analyzed from multiple dimensions of genre,area,number of participants.[Results/Conclusions]The results showed that the emotional factors contained in the text comments had a partial influence on the total score.Users cognitive preferences,social cultural background and the proportion of commentators would affect the usefulness of emotional factors.

        〔Key words〕online review;emotion factor;usefulness;multi-dimensional analysis

        在以互聯(lián)網(wǎng)為媒介的自媒體時代,社會化在線評論呈現(xiàn)出迅猛增長的態(tài)勢,且數(shù)量極為龐大。開放的社會化在線評論以簡潔表達、快捷分享、高速獲取的網(wǎng)絡(luò)時代傳播規(guī)律,大大提高了用戶參與評論、表達觀點的可能性,呈現(xiàn)出隨時隨地發(fā)布、開放的好友關(guān)系、裂變式的傳播機制。其中的文本評論雖然多采用非正規(guī)的語言表達形式或網(wǎng)絡(luò)流行語,但卻包含了豐富的情感因素以及相關(guān)信息,更能夠反映出網(wǎng)民用戶針對特定事件的真實情感和體驗。社會化在線評論中的文本評論作為用戶生成內(nèi)容(User Generated Content,UGC)中的一個重要組成部分,對于用戶信息決策過程具有傳統(tǒng)專業(yè)性評論無法比擬的積極的輔助作用?,F(xiàn)有的研究表明,社會化在線評論能夠在很大程度上影響用戶的信息決策行為[1]。

        本研究通過數(shù)據(jù)挖掘技術(shù)提取在線用戶撰寫的文本評論,采用機器學(xué)習的貝葉斯算法對其進行情感分類、計算正負情感概率值,并轉(zhuǎn)化為文本評論的情感得分。在此基礎(chǔ)上,將文本評論的綜合情感得分與實際總評分進行多維度對比分析,揭示社會化在線文本評論中的情感因素對實際總評分的影響作用和作用規(guī)律。

        1 相關(guān)研究

        出于充分發(fā)揮社會化在線評論的最大價值的目的,學(xué)術(shù)界在近年來對挖掘文本評論中蘊含的情感因素以及情感因素的有用性等問題展開了研究。目前學(xué)術(shù)界對社會化在線評論的相關(guān)研究主要圍繞基于文本評論的情感識別和情感因素的有用性分析兩個方面。

        在文本評論的情感識別方面,博客、論壇、微博以及在線電影網(wǎng)站中包含大量由用戶發(fā)布的帶有情感傾向因素的評論文本,當前主要采用基于語義的情感識別方法和機器學(xué)習中的分類方法,對主觀性文本中所包含的正面、負面、中立等情感傾向性進行判識?;谡Z義傾向的情感識別的基本原理是通過WordNet、HowNet等情感詞典與評論語料之間的匹配實現(xiàn)情感標注任務(wù)。Kim等[2]使用種子詞和WordNet擴展詞表,基于詞表匹配以及利用算法和規(guī)則計算情感傾向。Tong[3]通過人工添加和標注情感詞,基于詞表進行情感因素識別并構(gòu)建了在線評論跟蹤系統(tǒng)。Pang[4]等人則使用詞袋(Bag-of-Feature)框架選定文本的N元語法(N-Gram)和詞性等元素作為情感識別特征,將文本評論分為正面和負面兩類。Kennedy等[5]在擴展程度情緒詞的基礎(chǔ)上,將語義極性與機器學(xué)習算法相結(jié)合,對文本評論的情感因素進行分類。近年來,國內(nèi)學(xué)術(shù)界的張莉等[6]等學(xué)者利用隨機場模型和最鄰近方法對文本評論中的情感觀點進行抽取。郝玫[7]等人基于自建的領(lǐng)域情感詞典,綜合評價頻數(shù)和反轉(zhuǎn)語義等因素,計算文本評論的情感傾向。吉順權(quán)[8]及其合作者提出基于對象特征的關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘模型,對文本評論中的正向、負向因素進行識別。

        在情感因素的有用性研究方面,Kuan[9]等人基于文本評論的語句長度、可辨識程度、情感極性等因素,對文本評論的有用性進行分析,該研究表明具有特征的文本評論更容易被識別和發(fā)揮作用。Chintagunta[10]等人的研究表明,在考慮文本評論內(nèi)生性情感因素的情況下,評論數(shù)量不會對實際營銷產(chǎn)生影響。Mishne等[11]通過文本評論的情感傾向與實際營銷之間的相關(guān)性分析,發(fā)現(xiàn)積極或消極情感的評論內(nèi)容與實際營銷具有很強的相關(guān)性。Dellarocas[12]則從在線評論數(shù)量、平均情感傾向之間的關(guān)系維度出發(fā),發(fā)現(xiàn)含有極端內(nèi)容的評論更容易引發(fā)口碑交流行為,進而對實際營銷產(chǎn)生影響。與此同時,國內(nèi)學(xué)術(shù)界關(guān)于在線評論的作用及效果方面的研究也取得了相應(yīng)的進展[13]。馬松岳[14]等人研究發(fā)現(xiàn),文本評論的綜合情感值與打分評價具有較強的相關(guān)性,文本評論包含的情感因素能夠影響等級評分。王軍[15]等人的研究結(jié)果則表明,在不同時間跨度的情況下,含有情感因素的文本評論的有用性,在細節(jié)性信息和抽象性信息兩方面表現(xiàn)出差異。

        綜上所述,盡管學(xué)術(shù)界關(guān)于社會化在線評論的相關(guān)研究已經(jīng)取得了較為豐富的成果,但是其中也存在一些尚不明確的地方。特別是關(guān)于在線文本評論蘊含的情感因素的有用性問題,也有部分研究認為文本評論中情感因素的實際有用性效果并不顯著[16-17]。有鑒于此,本研究采用有監(jiān)督機器學(xué)習的數(shù)據(jù)挖掘方法,基于真實在線評論數(shù)據(jù),對文本評論中的情感因素進行測量與分析。通過評論內(nèi)容的情感分值與最終等級評分的多維度比較分析,嘗試探索在線文本評論中情感因素的影響程度和作用規(guī)律。

        2 研究方法與數(shù)據(jù)處理

        2.1 研究方法

        社會化在線評論既包括數(shù)值型(或等級型)評價,也包括文本型評論。數(shù)值型評價難以體現(xiàn)評論的情感因素;文本評論則能夠在文本語境中表達評論者的個人情感。因此,研究工作需要首先將文本評論中的情感因素進行形式化處理并提取,進而采用相應(yīng)的方法測量情感得分,并在此基礎(chǔ)上對評論文本中情感因素的有用性進行分析。

        本研究采用自然語言處理(NLP)中的有監(jiān)督機器學(xué)習方法,對在線文本評論進行情感分類測量。從獲取的全部文本評論中隨機抽取20%作為訓(xùn)練樣本,人工標注“很好”、“較好”、“一般”、“較差”、“很差”共計5種情感分類訓(xùn)練集。運用帶監(jiān)督的FastText文本分類算法,根據(jù)文本的語義和N-gram模型提取詞向量作為文本的情感特征。在此基礎(chǔ)上,通過訓(xùn)練得到文本分類器,再利用該分類器將其余80%評論文本輸入映射為相應(yīng)的輸出,計算每個評論對象對應(yīng)的文本評論的不同情感分類的概率。按照公式(1)獲得相應(yīng)的情感分類得分。

        公式(1)中,ECi為第i個評論對象評論文本的情感分類得分,(p1,…,p5)為不同情感分類的概率,n為情感分類數(shù)。同時,采用SnowNLP中文文本情感分析工具進行文本情感傾向測量。訓(xùn)練的數(shù)據(jù)主要是人工標注的正面、負面文本,通過訓(xùn)練模型得到一個介于0~1之間的情感值來表示該文本評論所包含的情感傾向值。情感值越接近于0,則負面情感傾向越強;情感值越接近于1,則正面情感傾向越強。根據(jù)訓(xùn)練模型計算每條文本評論的情感值,根據(jù)公式(2)得到代表評論對象的情感傾向得分。

        公式(2)中,ETi為第i個評論對象評論文本所包含情感傾向得分,m為所有評論的總數(shù),v為文本評論的集合,ui為第i個文本評論的情感值。將公式(1)與公式(2)兩種情感測量方法結(jié)合,獲取的綜合情感得分。最終得到評論對象相關(guān)評論文本的綜合情感得分如公式(3)所示。

        公式(3)中,Ei為第i個評論對象評論文本最終的綜合情感得分。研究中將基于公式(3)得到的情感得分從多個維度進行有用性分析。其中的有用性主要指文本評論蘊含的情感因素對總評分的影響作用。

        2.2 數(shù)據(jù)采集與預(yù)處理

        2.2.1 數(shù)據(jù)采集

        本研究采用自主研發(fā)的爬蟲工具,從國內(nèi)最大的用戶生成內(nèi)容(User Generated Content,UGC)網(wǎng)站豆瓣電影網(wǎng)(movie.douban.com)抓取社會化在線評論的原始數(shù)據(jù)。豆瓣電影網(wǎng)擁有高達1.5億個注冊用戶,3億個月活躍用戶,以及百萬部影片和影人資料的收錄,是目前中國最權(quán)威的電影分享與評論社區(qū)。該網(wǎng)站上不僅能夠獲得每部電影的在線推薦評分、各類型參評人數(shù),還可以獲得每部電影的評論文本、電影分類、評分占比等相關(guān)數(shù)據(jù)。抓取對象是2017年11月28日豆瓣電影熱度排行榜排名TOP100的電影的短文本評論數(shù)據(jù)。采集的具體內(nèi)容包括電影信息數(shù)據(jù),以及與之相對應(yīng)的評論信息數(shù)據(jù)。共計抓取到100部電影的2 704 635條短文本評論信息,構(gòu)成用于情感因素測量與分析的電影短文本評論數(shù)據(jù)集,如表1所示。

        表1中的原始數(shù)據(jù)包括電影名稱、影片類型、制作地區(qū)、評論信息等。每部電影的評論信息數(shù)據(jù)包括短文本評論內(nèi)容、短文本評論數(shù)量、總評論數(shù)量和總評論相關(guān)數(shù)據(jù)。其中,總評論包括文本評論和非文本評論(數(shù)值/等級評論)。這些數(shù)據(jù)是文本評論中情感因素測量與分析的基礎(chǔ)數(shù)據(jù)集。

        2.2.2 數(shù)據(jù)預(yù)處理

        表1中的數(shù)據(jù)包括社會化在線評論的數(shù)值型數(shù)據(jù)和文本型數(shù)據(jù)兩類。其中,社會化在線評論的數(shù)值型數(shù)據(jù)指豆瓣電影網(wǎng)中每部電影的短文本評論數(shù)量、總評論數(shù)量、總評分和評價等級占比(“力薦”、“推薦”、“還行”、“較差”、“很差”占總評價數(shù)的比重)等;文本型數(shù)據(jù)則是其中的全部短文本評論的文本內(nèi)容。

        使用Notepad++等文本處理工具對爬蟲抓取的原始數(shù)據(jù)進行清洗,去除帶有廣告性質(zhì)、鏈接信息、表情符號以及包含一些xml標簽的各種無意義字符。清洗后用于情感測量與分析的數(shù)據(jù)是與每部影片相對應(yīng)的短文本評論數(shù)據(jù)集合。研究中,采用自建的電影領(lǐng)域分詞詞典和停用詞詞典,對每條文本評論的內(nèi)容進行中文分詞和去除停用詞處理。在此基礎(chǔ)上,對文本評論的情感因素進行測量與分析。

        3 情感因素的測量與分析

        3.1 文本評論情感因素測量

        研究中,分別根據(jù)公式(1)及公式(2)得到每部影片短文本評論的情感分類得分(ECi)和情感傾向得分(ETi)。在此基礎(chǔ)上,根據(jù)公式(3)計算兩種情感因素測量方法的得分結(jié)果的算數(shù)平均數(shù),作為每部影片的綜合情感得分(Ei)。情感得分的計算結(jié)果與采集到的該部影片對應(yīng)的總評分(Si)詳見表2。

        3.2 測量結(jié)果的多重比較分析

        針對表2中情感因素得分的計算結(jié)果,分別采用LSD、Tamhanes T2、DuncanT3三種方法,對文本評論的情感分類得分(組1)、情感傾向得分(組2)和總評分(組3)進行多重比較。從情感得分與總評分的一致性方面,總體判斷文本評論中情感因素的有用性。比較結(jié)果如表3所示。

        表3中的比較結(jié)果顯示,3種比較方法分別得出的比較結(jié)果之間具有一致性。其中,文本評論的情感分類得分(ECi)與情感傾向得分(ETi)的計算結(jié)果之間不存在明顯差異(表3中,組1與組2之間僅有微小差異);而情感分類得分和情感傾向得分卻分別與總評分(Si)之間均存在顯著差異(表3中,組1、組2分別與組3有較大差異)。這一比較結(jié)果說明,總評分并不能直觀地表達文本評論中的情感因素,用戶文本評論語境中包含的情感因素難以通過單純的等級型或數(shù)值型的總評分充分展現(xiàn)。或者說,文本評論中的情感因素對總評分并非具有完全的影響作用??紤]到情感分類得分與情感傾向得分之間的微弱差異,以及二者與總評分之間的顯著差異,研究中進一步根據(jù)公式(3)計算短文本評論綜合情感得分(Ei)。在此基礎(chǔ)上,將綜合情感得分與總評分進行多個維度的比較,從多維細粒度層面對文本評論中的情感因素有用性展開分析。

        3.3 情感因素的有用性分析

        3.3.1 基于類型維度的分析

        社會化評論環(huán)境中,用戶對不同類型評論對象的主觀認知差異會對評論中的情感表達產(chǎn)生影響。研究中,參考各類電影網(wǎng)站的電影分類,對研究數(shù)據(jù)中的100部影片類型進行人工標注。將影片按照構(gòu)成影片的敘事元素的相似之處,如場景、情緒、形式等類型特征劃分為“恐怖\驚悚\懸疑”、“喜?。軔矍椋芗彝ァ?、“戰(zhàn)爭\歷史\傳記”、“劇情\犯罪\冒險”、“動作\冒險\犯罪”、“科幻\驚悚\動作”、“動畫\兒童”、“奇幻\冒險\動作”8個類型。通過影片分類對文本評論綜合情感得分和總評分之間的差異性進行分析。以總評分為橫坐標,以文本評論綜合情感得分為縱坐標構(gòu)建散點圖。8種類型影片的比較結(jié)果如圖1所示。

        圖1散點圖中大多數(shù)的點位于1∶1線以上。這一現(xiàn)象粗略說明文本評論的綜合情感得分在總體上略高于總評分。進一步通過圖中回歸線和1∶1直線進行對照,分析不同類型影片的文本評論的綜合情感得分與總評分的關(guān)系。圖1中顯示,“動畫\兒童”(g)類影片的用戶文本評論的情感得分與總評分最為接近,且回歸線的R2值為0.886。也就是說,文本評論的綜合情感得分與該類影片的總評分具有極大的相關(guān)性,情感因素能夠有效影響這類影片的總評分。“戰(zhàn)爭\歷史\傳記”(c)和“奇幻\冒險\動作”(h)兩類影片的文本評論的情感得分與總評分的接近程度次之。差異度較大的影片類型是“恐怖\驚悚\懸疑”(a)、“喜?。軔矍椋芗彝ァ保╞)、“劇情\犯罪\冒險”(d)、“動作\冒險\犯罪”(e)和“科幻\驚悚\動作”(f)5個類別?;貧w線與1∶1線的擬合情況最弱。對于這5類影片而言,文本評論中的情感因素對于總評分的影響微乎其微。由此可見,文本評論中的情感因素對于總評分的有用性并非可以一概而論,而是基于用戶認知偏好的不同存在差異。

        3.3.2 基于地區(qū)維度的分析

        不同的社會文化背景同樣能夠?qū)ξ谋驹u論中的情感因素產(chǎn)生影響。將研究數(shù)據(jù)中100部影片的制片地區(qū)歸納為“美國”、“中國大陸”、“日本”、“韓國”、“印度”、“港臺”和“聯(lián)合制作”7類。從影片制作地區(qū)數(shù)量上來看,美國制作影片在排行榜上占比最大,為37%。以制作地區(qū)作為分類依據(jù),對文本評論綜合情感得分與總評分進行對比分析。同樣以總評分為橫坐標,以文本評論綜合情感得分為縱坐標構(gòu)建散點圖。結(jié)果如圖2所示。

        圖2顯示,印度制作的影片(d)回歸線與1∶1線的擬合情況最好,文本評論綜合情感得分與總評分趨于一致,說明文本評論中表達的情感因素對總評分具有很大的影響作用。同時,印度制作的影片的回歸線相對1∶1線略位置略低,且回歸線R2值為0.911。這一現(xiàn)象說明,針對印度影片的文本評論的情感得分普遍略低于網(wǎng)站推薦評分。此外,中國大陸制作的影片(c)、日本制作的影片(e)、韓國制作的影片(f)的文本評論的情感因素對總評分的影響作用處于中等水平。盡管以中日韓為代表的東亞文化背景淵源,使得針對3類產(chǎn)地影片的文本評論的情感因素對總評分產(chǎn)生中等程度的影響,但是在細節(jié)上日本制作的影片的情感得分普遍略低于日本影片的總評分(圖2(e)數(shù)據(jù)點多位于1∶1線之下)。一定程度上反映了在線網(wǎng)絡(luò)用戶對日本制作的影片在進行評論時受到社會文化等背景因素的干擾,批判態(tài)度所產(chǎn)生的錨定效應(yīng)(Anchoring Effect)[18]導(dǎo)致情感得分較低。而美國制作(a)、聯(lián)合制作(b)、港臺制作(g)的電影的文本評論的情感得分與總評分之間的差異度非常明顯,且大多數(shù)的數(shù)據(jù)點位于1∶1線之上。說明此3類產(chǎn)地的影片在用戶中形成了一定的口碑效應(yīng),用戶對其期望值也越來越高,從而導(dǎo)致較高的情感得分。但是該類影片一旦未能達到觀眾期望值,勢必影響情感因素對總評分的作用。因此,盡管在文本評論中用戶以文字語言表達了對該系列影片的情感預(yù)期,但也導(dǎo)致了情感得分對總評分影響作用的下降。綜合上述情況,文本評論中包含的情感因素對于總評分的有用性,會受到社會文化背景因素的影響,不同背景下的有用性表現(xiàn)不同。

        3.3.3 基于人數(shù)維度的分析

        社會化評論系統(tǒng)中,參與數(shù)值/等級評價的用戶未必都會撰寫文本評論。參與豆瓣網(wǎng)總評分的用戶中同樣只有部分用戶撰寫了短文本評論。因此文本評論撰寫人數(shù)與總評分人數(shù)之間的穩(wěn)定性會對文本評論中情感因素的作用產(chǎn)生影響。研究數(shù)據(jù)中參與總評分的人數(shù)為5 852 471人,其中2 704 635人撰寫了短文本評論。由于文本評論撰寫者人數(shù)在總評分參與人數(shù)中的占比并不是嚴格的正態(tài)分布,且組間距過大,因此會出現(xiàn)同一部影片存在于不同組群的情況。為確保同一部影片在相同的組群中,根據(jù)評論人數(shù)在總評分人數(shù)中的占比(N),將100部影片分為G1~G5共5個組別,詳見表4。

        表4中,如果占比(N)較高,則說明參與總評分的用戶中有很大比例的用戶撰寫了文本評論,反之則僅有少數(shù)用戶撰寫了文本評論。通過對各組綜合情感得分和總評分數(shù)據(jù)的極差、方差和標準差等對分值數(shù)據(jù)的波動程度、離散程度及穩(wěn)定性進行分析。一般情況下,極差越大,則數(shù)據(jù)波動范圍越大;方差(或標準差)越大,數(shù)據(jù)的離散程度越大,穩(wěn)定性越??;反之,則離散程度越小,穩(wěn)定性越好。相關(guān)統(tǒng)計結(jié)果如表5所示。

        將G1~G5各組中的綜合情感得分與總評分轉(zhuǎn)化為標準化分值作為縱軸,以文本評論人數(shù)在總評分人數(shù)中的占比為橫軸,通過圖形呈現(xiàn)評分波動與離散程度,結(jié)果如圖3所示。

        圖3顯示,G1組(N≤0.4)中分值波動程度不大,而且綜合情感得分與總評分的曲線波動形態(tài)基本趨于一致;G2組(0.4

        上述基于評論人數(shù)占比的分析,在不同的人數(shù)占比條件下,先后得出兩種表面上似乎相反的結(jié)論。產(chǎn)生這一現(xiàn)象的原因在于,用戶在發(fā)表評論(包括文本評論和等級評分)之前,必然接觸到截至該時刻的總評分信息。而既有的總評分將會對后續(xù)用戶評分產(chǎn)生錨定效應(yīng),影響用戶的等級評分結(jié)果,從而產(chǎn)生信息的級聯(lián)效應(yīng)(Cascade Effect)[19]和群體極化(Group Polarization)[20]現(xiàn)象。而用戶撰寫的文本評論通過語言文字抒發(fā)用戶的個人觀點,雖然在等級評分中可能給出與既有總評分相似的結(jié)果,但其文本評論內(nèi)容中包含用戶的真實情感因素。文本評論語境中的情感因素更代表用戶個人的認知感受,受到既有總評分的干擾程度較低。因此,隨著撰寫文本評論的人數(shù)占比的增加,情感得分與總評之間的差異逐漸凸顯。即等級評分易受他人影響,文本情感表達則源自用戶自身。進而在用戶個體的主觀情感表達方面出現(xiàn)“低分高評”或“高分低評”的情況。

        4 結(jié)論與討論

        本研究采用有監(jiān)督的機器學(xué)習方法,從文本評論中提取詞特征來訓(xùn)練模型。使用模型對100部影片的270余萬條短文本評論的情感因素進行測量與分析,并將情感得分與總評分進行多維度比較,對文本評論中的情感因素的有用性進行分析。研究工作初步得出以下結(jié)論:

        1)文本評論蘊含的情感因素對總評分具有部分的影響作用。分析結(jié)果顯示,盡管情感分類得分(ECi)與情感傾向得分(ETi)的測量視角和方法不同,但是在不同方法的比較測試中,二者分別與總評分(Si)之間存在顯著差異(參見表3)。因此,基于二者算術(shù)平均值的綜合情感得分(Ei)也必然與總評分之間存在顯著差異。并且,在針對情感因素有用性的多維度分析中,評論對象的類別、制作地區(qū)、人數(shù)占比方面的不同,會使情感因素對總評分的影響作用表現(xiàn)出不同的效果(參見圖1~3)。部分比較結(jié)果顯出情感因素具有良好的影響作用(如,圖1(g)、圖2(d)等),而另一些比較結(jié)果則顯示情感因素對總評分的影響程度差強人意(如,圖1(e)、圖2(b)等)。因此,文本評論蘊含的情感因素的有用性不能簡單地確定為完全有用或完全無用,而是具有條件限制的部分有用性。

        2)用戶的認知偏好與社會文化背景對情感因素的有用性產(chǎn)生影響。在針對情感因素有用性的多維度分析中,不同種類、不同制作地區(qū)的評論對象在情感因素有用性方面表現(xiàn)差異巨大。如,“動畫\兒童”(g)類影片的情感得分與該類影片的總評分具有極大的相關(guān)性,情感因素能夠有效影響這類影片的總評分;而“恐怖\驚悚\懸疑”(a)、“喜?。軔矍椋芗彝ァ保╞)等類型影片的情感因素對于總評分的影響微乎其微(參見圖1)。由此可見,驚險程度、爆笑程度等明顯帶有情感色彩的評判是因人而異的,用戶認知偏好的差異無法單純依賴數(shù)值或等級進行表達。另一方面,在針對不同產(chǎn)地的評論對象的情感因素分析中,文本評論蘊含的情感因素的有用性同樣表現(xiàn)出明顯的差異(參見圖2)。這也從側(cè)面證明了社會因素、文化背景等外部環(huán)境能夠?qū)υu論者的預(yù)期產(chǎn)生錨定效應(yīng),從而造成文本評論的情感因素對總評分影響作用的差異性。

        3)評論人數(shù)占比對情感因素的有用性產(chǎn)生影響。一般意義上來講,如果每個用戶獨立給出等級評價,則參與人數(shù)越多,評價結(jié)果就越趨于合理。然而,人數(shù)維度的分析結(jié)果顯示,文本評論人數(shù)占比較低(≤50%)的情況下,文本評論中的情感因素對總評分具有較大的影響作用;當文本評論人數(shù)占比較高時,文本評論的情感因素對總評分的影響作用極?。▍⒁妶D3)。由于總評分是由文本評論用戶和非文本評論用戶共同給出的,用戶給出等級評分時難以避免地受到既有總評分的影響,從而產(chǎn)生群體決策中的級聯(lián)效應(yīng)和趨向既有總評分的群體極化現(xiàn)象。反之,文本評論則是通過語言文字抒發(fā)用戶個人的情感體驗,受到既有總評分影響的概率大大降低。因此,文本評論人數(shù)占比越高,則文本評論(受影響小)與等級評分(受影響大)之間的差異就會越明顯,文本評論中蘊含的情感因素相對于總評分的有用性就會被削弱。這一結(jié)果也從側(cè)面為社會化在線評論的研究工作提供了一個新的思路。

        本研究采用有監(jiān)督機器學(xué)習的數(shù)據(jù)挖掘方法,基于真實數(shù)據(jù)對在線文本評論中的情感因素進行測量與分析,并與網(wǎng)站的總評分進行了多維度比較分析。從類型維度、地區(qū)維度、人數(shù)維度3個層面,揭示出文本評論中蘊含的情感因素在用戶認知偏好、社會文化背景、群體決策效應(yīng)等方面的差異。研究中也存在一定的局限性,盡管研究中對獲取的數(shù)據(jù)中顯性的無意義信息進行了清洗,但是數(shù)據(jù)中仍然可能存有貌似合理,但卻出于商業(yè)目的的非正常評價,會影響數(shù)據(jù)的可靠性。在后續(xù)研究中,將選取更多領(lǐng)域和評論類型進行分析,進一步提高情感因素測算的精度,以期更全面準確地揭示文本評論中情感表達的模式與規(guī)律。

        參考文獻

        [1]Senecala S,Nantela J.The Influence of Online Product Recommendations on Consumers Online Choices[J].Journal of Retailing,2004,80(2):159-169.

        [2]Kim S M,Hovy E.Determining the Sentiment of Opinions[C]//Proceedings of the 20th International Conference on Computational Linguistics,Stroudsburg,Association for Computational Linguistics,2004:1367-1373.

        [3]Tong R M.An Operational System for Detecting and Tracking Opinions in Online Discussion[C]//Working Notes of the ACM SIGIR 2001 Workshop on Operational Text Classification.New York:ACM,2001:1-6.

        [4]Pang B,Lee L,Vaithyanathan S.Thumbs up?Sentiment Classification Using Machine Learning Techniques[C]//Proceedings of the ACL-02 Conference on Empirical Methods in Natural Language,Stroudsburg,2002,(10):79-86.

        [5]Kennedy A,Inkpen D.Sentiment Classification of Movie Reviews Using Contextual Valence Shifter[J].Computational Intelligence,2006,22(2):110-125.

        [6]張莉,蘇新寧,王東波.通用領(lǐng)域中文評論的意見挖掘研究[J].情報理論與實踐,2012,35(4):103-108.

        [7]郝玫,王道平.中文網(wǎng)絡(luò)評論的復(fù)雜語義傾向性計算方法研究[J].圖書情報工作,2014,58(22):105-110,129.

        [8]吉順權(quán),周毅.產(chǎn)品用戶評論在企業(yè)競爭情報中的應(yīng)用[J].現(xiàn)代情報,2015,35(6):114-121.

        [9]Kuan K K Y,Hui K-L,Prasarnphanich P,et al.What Makes a Review Voted?An Empirical Investigation of Review Voting in Online Review Systems[J].Journal of the Association for Information Systems,2015,16(1):48-71.

        [10]Chintagunta P K,Gopinath S,Venkataraman S.The Effects of Online User Reviews on Movie Box ofFice Performance:Accounting for Sequential Rollout and Aggregation Across Local Markets[J].Marketing Science,2010,29(5):944-957.

        [11]Mishne G,Glance N.Predicting Movie Sales from Blogger Sentiment[C]//AAAI Symposium on Computational Approaches to Analyzing Weblogs,AAAI Press,2006:155-158.

        [12]Dellarocas C.The Digitization of Word of Mouth:Promise and Challenges of Online Feedback Mechanisms[J].Management Science,2003,49 (10):1407-1424.

        [13]王倩倩.基于共詞分析的國內(nèi)在線商品評論研究熱點探討[J].現(xiàn)代情報,2017,37(10):158-164.

        [14]馬松岳,許鑫.基于評論情感分析的用戶在線評價研究——以豆瓣網(wǎng)電影為例[J].圖書情報工作,2016,60(10):95-102.

        [15]王軍,丁丹丹.在線評論有用性與時間距離和社會距離關(guān)系的研究[J].情報理論與實踐,2016,39(2):73-33,81.

        [16]Yong L.Word of Mouth for Movies:Its Dynamics and Impact on Box Office Revenue[J].Journal of Marketing,2006,70(7):74-89.

        [17]Duan W,Gu B,Whinston A B.Do Online Reviews Matter?An Empirical Investigation of Panel Data[J].Decision Support Systems,2008,45(4):1007-1016.

        [18]田依林,滕廣青,董立麗,等.基于概念格的虛擬社區(qū)信息甄別中錨定效應(yīng)的矯正[J].現(xiàn)代圖書情報技術(shù),2011,27(4):24-28.

        [19]滕廣青,姜航.社群用戶信息決策中級聯(lián)效應(yīng)判識的修正[J].情報科學(xué),2013,31(1):106-110,117.

        [20]Sunstein C R.The Law of Group Polarization[J].Journal of Political Philosophy,2002,10(2):175-195.

        (責任編輯:馬 卓)

        猜你喜歡
        在線評論情感因素
        在線評論情感屬性的動態(tài)變化
        預(yù)測(2016年5期)2016-12-26 17:16:57
        淺析品牌設(shè)計中體驗營銷的情感因素
        情感因素與外語教學(xué)
        在線評論對電子商務(wù)商品銷量的影響研究
        中文信息(2016年10期)2016-12-12 11:01:20
        情感因素對高校訓(xùn)練隊訓(xùn)練影響分析
        落實“兩個關(guān)注”,促使課堂評價走向有效
        關(guān)于小學(xué)英語教學(xué)中情感因素的應(yīng)用探討
        在線評論對消費者購買意圖的影響研究
        商(2016年10期)2016-04-25 10:03:58
        網(wǎng)絡(luò)學(xué)習社區(qū)中情感因素和社會因素分析
        在線評論與消費者行為的研究進展與趨勢展望
        軟科學(xué)(2015年6期)2015-07-10 02:32:49
        果冻国产一区二区三区| 国产精品多人p群无码| 久久青青草原亚洲av无码麻豆| 18禁无遮挡无码网站免费| 一区二区三区福利在线视频| 日本人妖一区二区三区| 亚洲国产天堂久久综合网| 99久久精品免费看国产| 狠狠噜天天噜日日噜视频麻豆| YW亚洲AV无码乱码在线观看| 视频一区二区三区中文字幕狠狠| 亚洲国产一区在线二区三区| 豆国产95在线 | 亚洲| 校花高潮一区日韩| 日韩国产自拍视频在线观看| 国产黄污网站在线观看| 国产欧美日韩一区二区三区| 伊人久久无码中文字幕| 国产成人一区二区三区影院免费| 国产av一区二区日夜精品剧情 | 精品无码久久久久久久动漫| 国产一级片内射在线视频| 日本一区二区不卡二区| 一本大道熟女人妻中文字幕在线 | 国产成人精品日本亚洲18 | 亚洲av午夜一区二区三| 少妇高潮无套内谢麻豆传| 吸咬奶头狂揉60分钟视频| 狠狠色丁香婷婷久久综合2021| 中文字幕精品一区二区三区av| 成年美女黄网站色大免费视频| 国产特级毛片aaaaaa| 欧美成人免费看片一区| 亚洲av日韩av天堂久久不卡| 国产内射一级一片内射视频| 久久久久人妻一区精品色欧美| 久久av高潮av喷水av无码| 区二区三区亚洲精品无| 色呦呦九九七七国产精品| 伊人久久大香线蕉av网禁呦| 久久精品免视看国产明星|