摘 要:近年來,博客與社交網(wǎng)絡(luò)已經(jīng)為客戶關(guān)系管理、公共輿論追蹤和文本過濾等領(lǐng)域的研究提供了寶貴的資源。從社交網(wǎng)站(如Twitter和Facebook)獲得的數(shù)據(jù)對市場營銷公司、輿論組織以及其他研究者具有重要價(jià)值。本研究的數(shù)據(jù)來源于社交網(wǎng)站Twitter中的文本數(shù)據(jù),隨機(jī)抽取了一段時(shí)期Twitter中的3516篇推文作為樣本評估消費(fèi)者對全球16個(gè)知名品牌(如Nokia,IBM,KLM)的情感態(tài)度。研究使用專家預(yù)定義的詞典進(jìn)行分析,詞典包括6800個(gè)已知態(tài)度傾向的種子形容詞。研究結(jié)果表明,消費(fèi)者對其中幾個(gè)知名品牌持積極態(tài)度,通過消費(fèi)者對品牌的情感態(tài)度分析可以為公司制定營銷策略提供可行性建議。文中運(yùn)用的定性與定量相結(jié)合的分析方法,為品牌情感態(tài)度分析拓寬了深度。
一、研究背景意義
互聯(lián)網(wǎng)信息時(shí)代,社交媒體的發(fā)展使人們在社交網(wǎng)絡(luò)表達(dá)的意見在購買產(chǎn)品、股票市場波動和總統(tǒng)選舉等公眾輿論方面有很大影響力。最新的一項(xiàng)針對Twitter的研究發(fā)現(xiàn),超過80%的用戶會發(fā)布自己日常的信息或轉(zhuǎn)發(fā)別人的信息,社交網(wǎng)絡(luò)成為人們表達(dá)意見或看法的重要途徑,因此分析社交網(wǎng)絡(luò)中的海量文本數(shù)據(jù)具有重要意義。
二、研究方法
情感分析法(sentiment analysis SA)被一些學(xué)者用來分析社交網(wǎng)絡(luò)中文本所表達(dá)的情感,這是一種自然語言處理程序,運(yùn)用計(jì)算語言學(xué)和文本挖掘來識別文本情感,文本情感通常分為積極、中立與消極三種,這項(xiàng)技術(shù)在文本挖掘文獻(xiàn)中也被稱為情感極性分析(EPA)、意見挖掘、文獻(xiàn)挖掘或評價(jià)提取。情感分析法(SA)是一種自動化的知識發(fā)現(xiàn)技術(shù),其目的是在大量的評論、博客或推文中找到一種隱藏模式,通過從文本中分析得出的情感與已有的詞典進(jìn)行比較,確定情感強(qiáng)度,進(jìn)而計(jì)算情緒得分,通過情感得分分布判斷總體的情感傾向。
三、研究內(nèi)容
以往學(xué)者對情感分析法(SA)的應(yīng)用研究大多集中于產(chǎn)品評論、電影評論、政治傾向分析和股票市場預(yù)測,比如從消費(fèi)者對產(chǎn)品的評論中提取意見,將評論中的積極情感與消極情感分類,追蹤在線論壇討論的情感趨勢,發(fā)現(xiàn)網(wǎng)絡(luò)熱點(diǎn)等。但沒有運(yùn)用此方法專門針對消費(fèi)者對全球知名品牌做情感分析的研究,文章的研究彌補(bǔ)了這一空白,對社交網(wǎng)站品牌相關(guān)文本數(shù)據(jù)的分析試圖解決以下兩個(gè)問題:
1.社交網(wǎng)絡(luò)意見挖掘是否可以分析出消費(fèi)者對全球品牌的情感傾向?
2.公司能否利用網(wǎng)絡(luò)博客有效制定營銷與廣告方案?
鑒于社交網(wǎng)站Twitter是最大、最受歡迎、用戶多且活躍度較高的社交網(wǎng)站,根據(jù)市場研究公司Semiocast.com(2012)的數(shù)據(jù)顯示Twitter大約有5億活躍用戶,代表性較強(qiáng),因此筆者使用了從Twitter獲取的文本數(shù)據(jù)進(jìn)行分析。文章數(shù)據(jù)來源于Twitter網(wǎng)站2012年7月18日至2012年8月17日的一組隨機(jī)帖子,包括16個(gè)品牌相關(guān)的3516篇推文,為了保證數(shù)據(jù)的代表性,樣本來自于不同的日期與一天中不同的時(shí)刻。情感分析法的關(guān)鍵一步是詞語分類,常用的有兩種情感傾向識別方法:一種是基于詞典,另一種基于語料,但基于語料的方法很少應(yīng)用于情感傾向分析,因此使用基于詞典的方法。這兩種方法都需要一個(gè)預(yù)先定義的詞典或主觀詞匯語料庫,情感傾向識別是通過比較推文與詞典中專家定義的條目來確定。之前的研究通常是包括182個(gè)類別超過11000個(gè)手工編碼的單詞的手工編碼詞典,例如LIWC詞典,SentiWordNet,Q-wordnet或主觀性線索詞典。隨著研究的深入,現(xiàn)已有自動編碼的詞典,其中包括基于情感的詞典。論文借鑒了成功運(yùn)用于此類研究的Hu and Liu (2004) 語料庫。語料庫包括大約6800個(gè)已知傾向的種子形容詞(2006個(gè)積極詞匯和4783個(gè)消極詞匯)。
將文本進(jìn)行詞語分類后,運(yùn)用QDA Miner4.0軟件對Twitter帖子的文本數(shù)據(jù)進(jìn)行定性分析,分別顯示了詞頻表和基于多維縮放(MDS)技術(shù)構(gòu)建的3-D概念圖。最后運(yùn)用R軟件進(jìn)行定量分析,計(jì)算整體的情感得分并顯示了品牌的情感得分分布。從品牌的得分分布中可以看出有些品牌的推文得分表現(xiàn)出積極情感,如Lufthansa和DHL,有些表現(xiàn)出消極情感,如T-Mobile,有些品牌則呈不對稱分布,并且大部分推文落在得分為0的區(qū)域或+1/-1的區(qū)域,這表明情感傾向?yàn)橹行裕瑳]有明確的積極或消極情感傾向。
基于大約20%的網(wǎng)絡(luò)博文提及品牌名稱的事實(shí),在Twitter和其他社交媒體上管理品牌形象應(yīng)該成為公司主動營銷策略的一部分,公司可以通過使用博客圈傳播客戶所需的信息,擴(kuò)大品牌的影響力。使用社交網(wǎng)絡(luò)監(jiān)控用戶和博主對其品牌的討論,及時(shí)與不滿意客戶進(jìn)行溝通,通過用戶的博文信息為公司提供反饋信息便于改進(jìn)產(chǎn)品和服務(wù)。
通過社交網(wǎng)絡(luò)文本數(shù)據(jù)分析消費(fèi)者對品牌的情感傾向可能存在偏差,但大量的文本信息為正確反映消費(fèi)者情感提供可能性。從互聯(lián)網(wǎng)獲得消費(fèi)者數(shù)據(jù),相對傳統(tǒng)的小組訪談和面對面市場調(diào)查節(jié)約了時(shí)間和成本。但需要注意的是,情感分析法(SA)也存在一些缺陷,運(yùn)用此方法對用戶意見進(jìn)行客觀分類的同時(shí)并不能揭示形成這些意見背后的原因,在未來的研究中,應(yīng)該使用情感話題識別技術(shù)(STR)確定每種情感背后的最具代表性的話題,進(jìn)而分析產(chǎn)生消極或積極情感的原因。另一方面,研究中所用方法只能識別出積極和消極基本情緒,并不能準(zhǔn)確識別出在諷刺、挑釁等情況下的語言表達(dá)的情感狀態(tài),在進(jìn)一步的研究中還要在這方面做改進(jìn)。最后,用戶在網(wǎng)絡(luò)上所表達(dá)的觀點(diǎn)可能受廠商的操縱,并沒有真正反映消費(fèi)者的真實(shí)情緒,可以通過企業(yè)財(cái)務(wù)數(shù)據(jù),如股價(jià)、利潤等進(jìn)行檢驗(yàn)。
作者簡介:
田少娟(1993-),女,山西長治人,碩士研究生,研究方向:經(jīng)濟(jì)統(tǒng)計(jì).