鄢慧麗 張小浩 熊 浩
(1.海南大學旅游學院,海南???570228;2.海南大學管理學院,海南???570228)
在線評論作為網絡口碑傳播的一種特殊形式,對減少信息不對稱性,輔助消費者決策起著重要作用(Muritala et al.,2020)。尤其在以體驗型商品為主的酒店業(yè),在線評論對消費者的產品評估、信息采納和購買意愿存在顯著影響(Yang et al.,2021;Li et al.,2020;Ismagilova et al.,2019),同時也與酒店的銷量和收入息息相關(Ai et al.,2019;Phillips et al.,2017)。然而,由于在線平臺缺乏信息審核機制,消費者可以隨意地發(fā)表評論,從而導致評論質量參差不齊。為幫助消費者從海量評論中篩選出有用信息,各大平臺推出有用性投票功能。當評論的有用票數(shù)越高,對消費者預訂決策的參考價值越大。在此背景下,探究什么樣的評論更有用成為營銷研究的熱點問題(史達 等,2020;Chatterjee,2020;Hu et al.,2021)。
在眾多影響評論有用性的因素中,評論效價(review valence)一直是研究者們研究的重點(Filieri et al.,2021;Luo et al.,2021)。它被定義為評論的正負情感極性,可分為正面評論和負面評論(Purnawirawan et al.,2015)。以往研究多采用星級評分對評論效價進行測量,但并未得出一致性結論(Liu et al.,2015;Srivastava et al.,2019)。一些研究認為正面評論提供的積極信息符合消費者在決策前對產品的預期和偏好,因此比負面評論更有用(Luo et al.,2021;Liu et al.,2015);而一些研究認為負面評論包含更多的診斷性信息,可以幫助消費者規(guī)避潛在的風險,因此比正面評論更有用(Filieri et al.,2021;Srivastava et al.,2019)。本文認為造成結論不一致的原因可能在于:僅以星級評分來劃分正面評論和負面評論,而不考慮評論內容的情感極性,存在一定的局限性。相關研究發(fā)現(xiàn)正面評論的內容并不都是積極的(李琪 等,2014),當消費者對購物體驗不滿時,即使給出了正面評分,也有可能發(fā)表消極的評論內容(陶曉波,2013)。反之,負面評論的內容也不一定都是消極的,較低的評分可能只是因為產品體驗沒有達到消費者的心理預期。此時,正面評論和負面評論之間的界限就變得較為模糊,因此僅采用星級評分對評論效價進行劃分,可能會導致研究結論不一致的情況發(fā)生。鑒于此,本文采用更嚴謹?shù)臏y量方法,通過構建酒店領域情感詞典,計算每條評論的情感強度值,當評論內容的情感強度值為負,且評分為一星或二星時,才被劃分為負面評論;相應地,當情感強度值為正,且評論為四星或五星時,則被劃分為正面評論,以期得到更為可靠的結論。
本文還考慮了情感強度的調節(jié)作用。現(xiàn)有研究中,除了將評論情感簡單劃分為正負兩種效價外,一些研究者還關注評論的情感強度問題。例如,Li等(2020)認為同樣是負面情感,相較于憤怒情緒,焦慮情緒對評論有用性的影響更大。蔡淑琴等(2017)以手機評論為例,證實強負面情感負向影響評論有用性,而中等負面情感顯著增強評論有用性。上述研究表明,不同強度的評論情感對評論有用性的影響存在顯著差異。同樣地,在酒店評論中,“房間異味很重”與“房間有些異味”都是對房間異味這一負面屬性的描述,但情感強度明顯不同,進而對消費者產生的影響可能存在差異?;诖?,本文引入情感強度作為調節(jié)變量,在厘清“哪種評論更有用”的基礎上,進一步探討評論效價對評論有用性影響的邊界條件。
此外,前景理論認為個體在決策過程中對損失的敏感程度遠高于對收益的敏感程度(Tversky et al.,1992),而消費者購買決策本質上是一種對風險的承受行為(Bauer,1960;Wang et al.,2019),因此感知風險成了理解評論效價作用機制的關鍵,即當消費者進行決策時,如果感知風險存在,則更加注重并傾向于規(guī)避感知的風險和損失,進而影響消費者的行為。鑒于此,本文引入感知風險作為中介變量,以揭示評論效價對消費者感知評論有用性的心理傳導機制。
綜上,本文利用大數(shù)據(jù)分析和情景實驗的混合方法對以下問題進行探討:(1)研究一:利用網絡爬蟲挖掘酒店評論數(shù)據(jù),并構建酒店領域的情感詞典,計算評論的情感強度,對評論效價進行更嚴謹?shù)貏澐?,初步探討評論效價對評論有用性的影響,以及情感強度在評論效價對評論有用性影響關系中的調節(jié)作用;(2)研究二:通過實驗法驗證感知風險是否在評論效價與評論有用性的影響關系中起中介作用,以及情感強度對上述中介路徑的調節(jié)作用。本文不僅有助于厘清關于“正面評論還是負面評論更有用”的分歧,揭示評論效價對評論有用性的作用機制,還為大數(shù)據(jù)研究提供了一定的方法論啟示,也對酒店在線平臺評論管理具有重要的實踐價值。
1.1.1 評論有用性的定義及測量
Chatterjee(2001)首次定義了在線評論有用性(review usefulness)這一概念,用于衡量消費者對在線評論信息的采納程度和感知價值。Mudambi等(2010)認為評論有用性是指消費者在閱讀評論過程中,對評論的價值衡量和對評論信息采納的意愿。高靜等(2016)將評論有用性定義為,用戶瀏覽在線評論時感知到其在多大程度上為自己提供了幫助。綜上,研究者們對評論有用性的界定較為一致,因此本文結合酒店預訂情境,將評論有用性定義為:消費者感知酒店評論幫助其了解產品信息,減少購買風險和不確定性,進而作出購買決策的有用性程度。
由于在線平臺缺乏信息審核機制,消費者可以隨意地發(fā)表評論,從而導致評論質量參差不齊。為幫助消費者從海量評論中篩選出有用信息,各大在線平臺,如Amazon、淘寶、攜程等網站均推出了有用性投票功能,允許消費者在瀏覽評論時對感知有用的評論進行點贊,因此評論獲得的有用票數(shù)常被用于衡量評論有用性(Chatterjee,2020;Hu et al.,2021;Srivastava et al.,2019)。此外,一些研究還利用成熟量表在問卷調研或情景實驗中對評論有用性進行測量(任小靜 等,2019;Hong et al.,2020;Ismagilova et al.,2020)。本文研究一的研究對象為去哪兒旅行網的酒店評論,故在后續(xù)數(shù)據(jù)處理時,我們利用評論獲得有用票數(shù)對評論有用性進行測量;研究二為情景實驗研究,我們利用成熟量表對評論有用性進行測量。
1.1.2 評論有用性的影響因素
目前國內外關于評論有用性影響因素的研究大致可以分為評論內容特征和評論者特征兩個維度。其中,評論內容特征包括評論效價、評論長度、評論可讀性、評論圖片等因素,而評論者特征包括評論者專業(yè)性、評論者類型等。例如,王亞妮等(2021)基于ELM模型從中心路徑和邊緣路徑探討了評論深度、評論極性、評論及時性和評論者專業(yè)性對評論有用性的影響。史達等(2020)將評論有用性的影響因素分為啟發(fā)式線索和系統(tǒng)式線索,考察了評論圖片、評論時間、評論者特征、評論情感等對評論有用性的影響。Liang等(2019)則證實了評論極端性、評論可讀性、評論者信息披露等因素對評論有用性的影響。
綜上,現(xiàn)有關于評論有用性影響因素的研究比較豐富,在評論效價對評論有用性的影響上并未得出一致性結論,且相關研究囿于二手數(shù)據(jù)回歸分析的局限性,無法給出評論效價影響評論有用性的作用機制的解釋。另外,對評論效價的量化研究大多僅利用星級評分,沒有考慮評論內容自身的情感極性,因此在評論效價的測量方式上仍然存在較大的改進空間。
在眾多影響評論有用性的因素中,評論效價一直是研究者們研究的重點。Purnawirawan等(2012)將評論效價定義為評論的情感極性,可分為正面評論、負面評論和中性評論。其中,正面評論是對產品或服務的積極評價,反之負面評論是對產品或服務的消極評價,而中性評論是指不帶任何感情色彩的評價。由于正負面評論直接反映消費者對產品的態(tài)度,相較于中性評論而言,對消費者更有說服力(Forman et al.,2008),因此在以往研究中,研究者們對評論效價的界定較為一致,即評論的正負情感方向,而不考慮中性評論,以此來考察評論效價對消費者行為的影響。例如:杜曉夢等(2015)將評論效價劃分為正面評論和負面評論,考察其對新產品在線評論有用性的影響。張軍等(2018)通過兩個實驗證實了評論效價(正面評論/負面評論)對出游意向的影響。Purnawirawan等(2015)則探討了正面和負面兩種效價對評論有用性和產品態(tài)度的影響。因此,本文將沿用這一定義,將評論效價劃分為負面評論和正面評論,探討其對酒店評論有用性的影響。
此外,對評論效價的測量方式也是學界關注的重點之一。以往研究主要是利用星級評分來衡量評論效價,即用一星或二星表征負面效價,四星或五星表征正面效價(Hong et al.,2020;De Pelsmacker et al.,2018)。盡管用星級評分量化評論效價的方式直觀易行,但精確性不足,因此研究者們開始轉向文本分析方法。例如,Srivastava等(2019)采用評論中的正面和負面詞匯占比,更準確地衡量評論內容的情感極性。Chatterjee(2020)則利用EmoLex詞典匹配評論中的情感詞匯,計算評論的情感得分,證實了評論效價對評論有用性的負面影響。基于此,本文將同時考慮評論內容和星級評分的情感極性,通過構建基于酒店領域的專屬情感詞典,計算評論內容的情感得分,同時結合評論的星級評分,得出最終的評論效價。具體而言,當星級評分為一星或二星,且情感強度小于0時,才被劃定為負面評論;而當星級評分為四星或五星,且情感強度大于0時,被劃定為正面評論,以此更加準確地衡量評論效價。
前景理論(Prospect Theory)最早由Tversky等(1992)提出,并被廣泛應用于心理學和行為科學領域,其關注個體在存在風險和不確定性情境下的決策過程。Tversky等(1992)發(fā)現(xiàn),與將人視為完全理性并追求最大利益的期望效用理論不同,前景理論認為非理性因素在個體行為決策過程中起著重要作用,并總結出兩條規(guī)律:一是個體在進行決策時,習慣性地選擇規(guī)避風險,希望以較小的風險獲得較大收益;二是個體對損失和收益的敏感程度不同,損失的痛苦要遠遠大于收益的快樂。據(jù)此,當消費者進行決策時,如果感知風險存在,則更加注重并傾向于規(guī)避感知的風險和損失,進而影響消費者行為。
感知風險(Percieved Risk)的概念最早由哈佛大學教授Bauer(1960)從心理學范疇引申到消費者行為,他認為消費者購買行為產生的后果是難以預測的,一旦沒有達到預期,就有可能會造成不愉快的消費經歷,因此消費者購買行為實際上是一種對風險的承受行為。一般認為,消費者的感知風險有不確定性和后果嚴重性兩個來源(Bettman,1973)。前者是指消費者購買前主觀感知不利后果出現(xiàn)的可能性;后者則是指不利結果導致?lián)p失的大小。在消費者行為研究領域,由于網購環(huán)境的虛擬性和匿名性,線上銷售的方式大大減少了消費者評估、試用產品或服務的機會,進而導致消費者對產品和服務質量的認知缺陷,即不確定性。同時,在弱連接的人際關系和虛擬組織的交易關系中,即使是有經驗的消費者,也會遇到欺詐、假貨等無法預知的情況,即后果嚴重性(潘煜 等,2010)。因此,本文將感知風險定義為消費者通過瀏覽酒店評論輔助決策時感知到可能會遭受損失的風險大小。
綜上,前景理論和感知風險理論從消費者心理及行為的角度,解釋了不確定性情境下消費者的感知風險及相應的規(guī)避行為。而在本研究情境中,消費者利用酒店評論輔助決策也是一次不確定情境下的風險承擔行為,因此本文基于上述理論,引入感知風險作為中介變量,探討評論效價影響評論有用性的作用機制。
現(xiàn)有關于評論效價對評論有用性影響的研究結論并不一致。一些研究認為正面評論提供的積極信息符合消費者在決策前對產品的預期和偏好,因此比負面評論更有用(Luo et al.,2021;Liu et al.,2015)。例如,Pan等(2011)發(fā)現(xiàn)評論效價對評論有用性存在顯著正向影響,且這種“正面效應”在功能型商品中更加明顯。Liu等(2015)也發(fā)現(xiàn),評論的星級評分越高,評論有用性越強。而另一些研究認為,負面評論包含更多的診斷性信息,可以幫助消費者規(guī)避潛在的風險,因此比正面評論更有用(Filieri et al.,2021;Srivastava et al.,2019)。例如,F(xiàn)ilieri等(2021)認為消費者可通過瀏覽負面評論增強對產品的感知風險,進而減小預期損失,因此,相較于正面評論,負面評論在消費者對商品質量進行評估和購買決策過程中的作用更大。Chen等(2013)基于歸因理論,發(fā)現(xiàn)正面評論被更多地歸因為評論者個人因素,而負面評論則被認為是產品自身因素引起的,因而負面評論有用性更高。任小靜等(2019)則以平臺認證型評論為研究對象,證實“負面偏見”效應依舊顯著,即負面評論比正面評論更有用。
基于以上討論,本文認為負面評論中提及酒店產品或服務的糟糕體驗,降低了消費者的不確定性。同時,根據(jù)前景理論,消費者對損失的敏感程度要遠遠高于對收益的敏感程度(Tversky et al.,1992),而負面評論激發(fā)了消費者更強烈的情緒反應和風險意識(Mizerski,1982),因此,為規(guī)避潛在損失,消費者在決策時會給予負面評論更高的權重(任小靜 等,2019;Fiske,1980),進而認為負面評論更有用。另外,從眾效應、網絡刷單及好評返現(xiàn)等現(xiàn)象的存在(鄭春東 等,2015;徐兵 等,2020),造成在線評論中正面評論的數(shù)量遠遠高于負面評論的數(shù)量,數(shù)量不多的負面評論反而獲得了消費者更多的關注和信賴,進一步增強了負面評論有用性。因此,本文提出以下假設:
H1:評論效價對評論有用性存在顯著的負向影響,即相較于正面評論,負面評論有用性更高。
酒店是一種典型的體驗型商品,消費者在購買前很難準確評估入住后的預期收益(呂興洋 等,2018)。根據(jù)前景理論,消費者在不確定情境下對風險的敏感程度遠高于對收益的敏感程度(Tversky et al.,1992),因此在決策時偏好于規(guī)避風險的保守策略(杜曉夢 等,2015)。不確定性降低理論認為,當消費者無法預估潛在的收益時,會積極搜尋其他信息以減輕和消除這種不確定性(Berger et al.,1974)。由于評論效價直接反映消費者對酒店產品體驗的主觀情感,而對產品的好惡分別對應著消費者在進行購買決策時預估的收益和損失,因此消費者對正面評論和負面評論的感知風險存在差異。
具體而言,負面評論中可能包含消費者對產品功能和質量的負面評價,增強了消費者對于購買決策的感知風險。同時,研究發(fā)現(xiàn)負面評論會激發(fā)消費者更高的自我相關刺激,即消費者更傾向于在負面評論中尋找與自身負面體驗相關的內容(王陽 等,2018)。而心理學實驗表明,人腦在加工高自我相關刺激時會投入更多的認知和控制加工資源,導致個體的感知風險加深(鐘毅平 等,2014)。因此,負面評論通過增強消費者的感知風險,幫助消費者規(guī)避潛在的損失,即消費者認為負面評論有用性更高。反之,正面評論很少提及酒店產品可能帶來的不利后果,導致消費者的感知風險較小,因此認為正面評論有用性較低。也就是說,感知風險是消費者在瀏覽正負評論時是否采納信息及評估信息有用性的關鍵因素,因此本文認為感知風險在評論效價與評論有用性之間起中介作用,并提出以下假設:
H2:感知風險在評論效價與評論有用性影響關系中起中介作用。
情感強度是指文本褒貶情感的強弱程度(鄭麗娟 等,2014),它常見于情感分析中,旨在對用戶發(fā)表的帶有不同情感傾向的評論、觀點等文本數(shù)據(jù)進行強度測量。在情感分析早期,研究者對情感的分類局限于正面和負面的粗粒度二分法(Watson et al.,1985)。隨著研究深入,研究者們認為將情感極性劃分為正面和負面兩個維度的做法過于片面,難以準確刻畫評論者的真實情感,所以進一步細化了不同情感之間的關系(劉魯川 等,2020)。而情感強度是評論情感的基本特征,也是影響消費者態(tài)度和行為的重要因素。在不確定性較高的情境下,消費者受主觀感知的影響,往往會采取訴諸情感的方式來處理信息(李宏 等,2011),而評論中的情感表達必然存在強弱之分,因此對評論有用性的影響也存在差異。例如,Li等(2020)發(fā)現(xiàn),同樣是負面情緒,相較于焦慮情緒,憤怒情緒對評論有用性的影響更強。史達等(2020)利用機器學習方法進行情感分析,發(fā)現(xiàn)評論的負面程度越強,評論有用性越高。因此,本文在劃分正面評論和負面評論的基礎上,計算出每條評論的情感強度值,著重分析不同評論在情感表達上的強度差異,以及由此引起的對評論有用性影響的差異,從而厘清評論效價對評論有用性影響的邊界條件。
在酒店預訂情境下,負面評論中往往包含評論者對酒店產品或服務質量的不滿,如“體驗很糟糕”“與宣傳嚴重不符”等內容。根據(jù)前景理論,消費者決策時對損失的敏感程度遠遠高于對收益的敏感程度(Tversky et al.,1992),因此消費者會格外留意負面評論反饋的問題,并相信這些問題確實存在,從而導致消費者無意識地放大負面評論的風險效應,忽略正面評論的推薦效應,進而做出風險規(guī)避行為。例如,寧連舉等(2014)發(fā)現(xiàn),在線評論的負面程度對感知風險存在顯著的正向影響。王陽等(2018)認為負面評論的不確定性使消費者產生了認知失調感,從而增強了對產品的感知風險。本文認為,負面情感強度越高,消費者的感知風險就越強,為了避免潛在損失,消費者會給予負面評論更高的權重(任小靜 等,2019),進而認為負面評論更有用。反之,盡管正面評論描述了酒店產品或服務的正面評價,但由于負面評論在消費者預訂決策中占有極高權重,因此正面情感強度高低對評論有用性的影響差異并不顯著?;诖耍疚奶岢鲆韵录僭O:
H3:對于負面評論,情感強度越高,評論有用性越強。
H4:對于正面評論,情感強度高低對評論有用性的影響無明顯差異。
由前述可知,感知風險在評論效價與評論有用性之間起著中介作用,且情感強度對評論效價和評論有用性的影響關系具有調節(jié)作用。由此進一步推論,情感強度不僅可以調節(jié)評論效價對評論有用性的直接影響,還可以調節(jié)評論效價與評論有用性影響關系的中介路徑,即對于負面評論,情感強度越強,消費者的感知風險越強,進而對評論有用性的感知越強。而對于正面評論,情感強度的高低對消費者的感知風險影響無明顯差異,因此對評論有用性的影響也不顯著?;诖耍疚奶岢鲆韵录僭O:
H5:負面評論的情感強度可通過增強消費者的感知風險,進而提高評論有用性。
H6:正面評論情感強度的高低對消費者的感知風險影響并不明顯,從而對評論有用性的影響也不顯著。
綜上,本文的理論模型如圖1所示。為驗證該模型,本文將采用大數(shù)據(jù)回歸分析(研究一)和情景實驗(研究二)的混合研究方法,原因在于:盡管在去哪兒旅行網采集的二手數(shù)據(jù)具有較好的外部效度,反映了真實客觀的消費者行為,但二手數(shù)據(jù)呈現(xiàn)的結果可能受到多個因素的影響,難以清晰地剝離各個因素的作用,導致研究的內部效度不足(吳繼飛 等,2019)。此外,二手數(shù)據(jù)的回歸分析難以揭示評論效價對評論有用性的作用機制,而基于情景描述的實驗研究優(yōu)勢在于能夠對實驗過程和諸多因素進行有效地控制,便于明確核心變量之間的因果關系,增強研究結論的內部效度(Podsakoff et al.,2019)。因此,本文將兩種方法相結合,提升了研究結論的科學性和穩(wěn)健性。
圖1 有調節(jié)的中介模型
本研究通過采集去哪兒旅行網的酒店評論數(shù)據(jù),構建酒店領域的情感詞典,計算評論的情感強度,初步探討評論效價對酒店評論有用性的影響(H1),并驗證情感強度的調節(jié)效應(H3、H4)。之所以選擇酒店作為研究對象,一是因為酒店作為體驗型產品,關于酒店的評論是影響消費者感知風險和有用性的重要因素;二是因為酒店產品質量和體驗評價有多個維度,情感內容較為豐富,有利于驗證情感強度的調節(jié)作用。
本研究利用自行開發(fā)的Java程序,歷時9天,抓取了去哪兒旅行網上三亞市的458家三星級及以上酒店的519750條評論數(shù)據(jù),所有評論數(shù)據(jù)均在2017年7月26日至2020年7月26日之間生成。采集的主要內容包括酒店評論總數(shù)、評論評分、評論有用票數(shù)、點評時間、評論文本、評論圖片等。為減小樣本噪聲,本文首先剔除缺少正文內容、重復評論及非中文評論的樣本,得到512035條評論;其次,為保證數(shù)據(jù)具備統(tǒng)計學意義,參考丁于思等(2014)的研究,本文剔除評論總數(shù)小于200的酒店樣本,得到496352條評論;再次,本研究僅考察正面評論和負面評論的有用性,故刪除樣本中的三星評論,得到482698條評論;另外,考慮到評論中存在星級評分與評論內容情感極性不一致的評論(李琪 等,2014),因此本文在進行情感分析后剔除該部分評論,得到478833條評論;最后,為保證回歸結果的準確性,刪除有用票數(shù)為0的評論(Filieri et al.,2021),最終共得到313家酒店的52107條評論作為有效樣本。
本研究的因變量為評論有用性,選擇評論獲得的有用票數(shù)進行表征(Chatterjee,2020;Hu et al.,2021;Srivastava et al.,2019)。自變量為評論效價,選擇評分為一星或二星,同時情感強度小于0的評論作為負面評論,編碼為0;選擇評分為四星或五星,同時情感強度大于0的評論作為正面評論,編碼為1。調節(jié)變量為情感強度,通過構建面向酒店評論領域的情感詞典,利用Python計算每一條評論的情感強度值。此外,本研究還選取了評論深度、時間間隔和評論圖片等可能影響評論有用性的因素作為控制變量(Hu et al.,2021;Srivastava et al.,2019;史達 等,2020)。具體變量及測度指標見表1。
表1 變量測度指標
首先構建本文的情感詞典,包含通用情感詞典、專有情感詞以及程度副詞與否定詞詞典。以大連理工中文情感詞匯本體庫作為本文的基本情感詞典,該詞典是基于Ekman的六大類情感體系構建的,共分為7大類21小類情感,包含0(中性),1(正面),2(負面)三種情感傾向和1、3、5、7、9五種情感強度等級,共收錄情感詞27466個,其中褒義詞11229個,貶義詞10782個(徐琳宏 等,2008)。為了根據(jù)詞匯的情感強度值計算酒店評論的情感強度,本文將正面極性值記為1,負面極性值記為-1。
在特定的研究領域只通過基礎情感詞典識別評論中的情感詞往往是不夠的,因為不同領域中有著不同的情感特征詞,比如酒店領域內的“隔音”“整潔”“好吃”等并不會出現(xiàn)在對電腦、衣服等商品的評價中。因此,本文利用Python中的Jieba分詞工具對酒店評論文本進行分詞和詞性標注。Jieba支持中文分詞、詞性標注、關鍵詞提取、加載自定義詞典等多個功能,并被多次應用于中文文本挖掘與情感分析研究中,具有良好的可行性和通用性(張彬 等,2020)。在經過篩選、整理后,得到酒店領域情感詞典。該詞典包含2156個情感詞,其中褒義詞1184個,貶義詞972個。此外,本研究還參照唐曉波等(2016)的研究,構建了情感調整詞典。情感調整詞包括否定詞和程度詞,否定詞的出現(xiàn)次數(shù)為奇數(shù)時會改變情感極性,程度詞的出現(xiàn)則會改變情感強度。
在構建完酒店評論情感詞典后,本文對評論文本進行情感計算以提取文本的情感傾向與強度。通過Python編寫的文本分析程序,對評論文本進行分句與分詞處理,獲取特征詞所包含情感詞、否定詞、程度副詞對應的權重,評論中所有特征詞情感強度數(shù)值之和,即該條評論的情感強度值。計算公式如下:
式(1)中,score為該評論的情感強度值,DegWeight為程度副詞的權重,wordi為情感詞Oi為否定詞的個數(shù)。如果情感強度值大于0,則為正面情感極性;如果情感強度值小于0,則為負面情感極性。
本研究因變量評論有用性的取值為評論獲得的有用票數(shù),屬于計數(shù)變量,而非連續(xù)變量,且不呈正態(tài)分布,不滿足普通最小二乘回歸模型(OLS)的基本要求。對于計數(shù)變量,常見的回歸模型有泊松回歸模型和負二項回歸模型,前者對于樣本特征有特殊的強假設,即樣本的均值和方差相等。而在本研究中,評論有用性的樣本方差大于均值(方差為4.61,均值為2.43),存在一定的過度離勢現(xiàn)象。負二項回歸適用于因變量過度離散的回歸分析,是泊松回歸的擴展形式。因此,本文利用負二項回歸模型進行實證研究。此外,本研究還將利用泊松回歸模型進行重新估計,比較兩種回歸模型的擬合結果,以檢驗負二項回歸模型的適用性和研究結論的穩(wěn)健性。具體表達式如下:
式(2)中,Usefulness表示評論有用性,Valence表示評論效價,Emotion_intensity表示情感強度,Controls則表示控制變量,β為回歸系數(shù),δ為隨機干擾項。
3.5.1 描述性統(tǒng)計與相關性分析
本研究利用Stata 16.0對總樣本進行描述性統(tǒng)計分析,結果如表2所示。因變量評論有用性的平均值為2.43,標準差為4.61,說明評論有用性的數(shù)據(jù)分布比較離散。自變量評論效價為二分變量,其樣本均值為0.83,說明樣本中大部分評論(83%)為正面評論。情感強度的均值為49.68,說明樣本總體的情感傾向比較積極,且不同評論之間情感強度差值很大,因此在回歸時,對其作對數(shù)化處理??刂谱兞恐校u論圖片的均值為0.58,說明有超過半數(shù)的評論是帶有圖片的。而評論深度和時間間隔等變量的極差也很大,在模型回歸時也對其作對數(shù)化處理。
表2 描述性統(tǒng)計
如表3所示,本研究所有自變量相關系數(shù)的絕對值均在0.300以下,說明它們之間的相關關系很弱。為排除多重共線性的干擾,進一步對方差膨脹因子(VIF)分析后發(fā)現(xiàn),VIF值介于1.26至2.47之間,小于臨界值3.00,說明各自變量之間不存在多重共線性問題(O’brien,2007)。
表3 相關性分析
3.5.2 回歸分析
本研究利用Stata16.0實現(xiàn)3個模型的回歸分析,其中模型1只包含控制變量。首先,利用模型1對所有數(shù)據(jù)進行回歸,驗證評論效價對評論有用性的影響;其次,為驗證情感強度對評論效價和評論有用性影響關系的調節(jié)作用,將所有評論數(shù)據(jù)劃分為負面評論和正面評論2個子數(shù)據(jù)集,并通過模型2和模型3分別驗證情感強度對負面評論有用性和正面評論有用性的影響;然后,通過調整模型回歸方法,進一步檢驗研究結論的穩(wěn)健性;最后,參考池毛毛等(2020)和李進華等(2018)的研究,利用泊松回歸模型對負二項回歸模型的模型1、模型2和模型3進行重新估計,并利用赤池信息量準則(AIC)和貝葉斯信息準則(BIC)對比負二項回歸和泊松回歸的擬合結果,當AIC、BIC值越小,模型擬合度越高(Akaike,1973;Schwarz,1978)。具體結果如表4所示。
表4 模型回歸結果
在模型1中,評論效價對評論有用性存在顯著的負向影響(β=-0.538,p<0.001),即相較于正面評論,負面評論有用性更高,H1得到驗證??刂谱兞恐校u論深度、時間間隔和評論圖片對評論有用性的影響均是正面且顯著的,與已有研究結論相吻合(Hu et al.,2021;史達 等,2020)。
在模型2中,對于負面評論情感強度,首先取其絕對值的對數(shù)再進行回歸分析。結果顯示,情感強度對負面評論有用性存在顯著的正向影響(β=1.172,p<0.001),即負面評論的情感強度越高,消費者對評論的感知有用性越強,H3得到驗證。而模型3的回歸結果顯示,正面評論情感強度的高低對評論有用性的影響差異并不顯著(β=0.080,p=0.247>0.100),H4得到驗證。
穩(wěn)健性檢驗結果顯示,泊松回歸各個模型的AIC和BIC均小于負二項回歸模型的結果,說明負二項回歸更適合本研究。此外,在泊松回歸模型中,盡管各個變量的回歸系數(shù)大小與負二項回歸結果略有差異,但它們的作用方向與負二項回歸結果保持一致,說明本研究結果具有較好的穩(wěn)健性。
研究一通過對去哪兒旅行網的酒店評論數(shù)據(jù)分析后發(fā)現(xiàn),評論效價對評論有用性存在顯著的負向影響,假設H1得到驗證。同時,情感強度對上述關系起調節(jié)作用。具體而言,對于負面評論,情感強度越強,評論有用性越強,H3得到驗證。對于正面評論,情感強度的高低對評論有用性的影響差異并不明顯,H4得到驗證。盡管本研究為假設H1、H3和H4提供了支持證據(jù),且研究結論具有良好的外部效度,但無法完全排除一些干擾因素對結論的影響,也尚未檢驗評論效價對評論有用性影響的內在作用機制。因此,需要更為嚴謹?shù)难芯吭O計來彌補上述局限性。
本研究利用情景實驗重復驗證H1、H3和H4,以增強實驗結果的穩(wěn)健性,并在此基礎上,重點考察評論效價對評論有用性影響的中介效應(H2),以及情感強度對中介路徑的調節(jié)作用(H5、H6)。
本實驗采取2(評論效價:正面和負面)×2(情感強度:高和低)組間實驗設計,形成正-強、正-弱、負-強、負-弱4組實驗情景,實驗參與人員被隨機分配到上述4組情景中。被試為海南大學的在校大學生,之所以選擇大學生作為被試,一是大學生閑暇時間較多,有一定的酒店預訂經歷,便于情景融入;二是大學生的人口統(tǒng)計特征具有一定的同質性,避免無關統(tǒng)計變量對實驗的干擾;三是便于招募,收集數(shù)據(jù)方便。
4.2.1 實驗材料
為選擇合適的刺激材料,本研究需要進行前測實驗,以提高正式實驗成功的概率。(1)前測1:選擇20名被試并要求其想象在去哪兒旅行網預訂酒店的情境;然后實驗選取足夠多的酒店評論呈現(xiàn)給被試,并要求其基于現(xiàn)實情境閱讀這些評論;最后,要求被試填寫閱讀的評論數(shù)量。結果顯示,被試在作出購買決定之前平均閱讀3.1條評論,因此本文選取3條評論作為實驗材料。(2)前測2:在去哪兒旅行網平臺選取10條典型的正面評論(每條150字左右),評論內容主要包括舒適度、衛(wèi)生和服務等屬性的相關描述(Banerjee et al.,2019)。隨后要求前測1中的被試回答“這條評論的正面情感很強烈”(“1”表示“完全不同意”,“7”表示完全同意),選取3條均分最高的正面評論作為實驗材料。另外,還需要基于真實的網頁排版對實驗材料進行模擬,比如各組評論網頁的大小、排版、色調需保持一致,酒店名稱使用統(tǒng)一的虛擬品牌,且包含相同的基本信息,如客房設施、餐飲、交通等。最后,為排除外部因素對實驗結果的干擾,對評論中的無關要素進行刪除,如評論者ID、評論者等級、入住時間等。
4.2.2 變量操縱
實驗需要對評論效價和情感強度進行操縱。首先,對評論效價進行操縱,參考Chen等(2008)的研究,實驗選取前測2中的3條均分最高的正面評論,對評論中表明評論者態(tài)度的形容詞進行詞義反轉,同時盡量排除語言風格和文字數(shù)量等因素的干擾,如“環(huán)境很好”改為“環(huán)境很差”,同時相應地將其調整為1星負面評論。其次對情感強度進行操縱,對于“正-強”和“正-弱”兩組,在保證情感極性不變的情況下,實驗對評論中出現(xiàn)的情感特征詞進行替換,比如將“太棒了”替換成“還可以”,同時將星級評分由5星替換成4星;同樣,對“負-強”和“負-弱”兩組也進行類似的替換,比如將“極差”替換為“不好”,同時將星級評分由1星替換成2星。
本實驗需要測量的變量包括評論有用性和感知風險,均采用現(xiàn)有文獻中開發(fā)的成熟量表,并通過李克特7級量表進行打分,其中,“1”表示“非常不同意”,“7”表示“非常同意”。借鑒Park等(2009)和Ismagilova等(2020)的評論有用性量表,并結合實驗具體情境,提出4個題項。根據(jù)Dai等(2014)的研究,感知風險一般可劃分為經濟風險、功能風險、安全風險、時間風險、社會風險和心理風險6個維度。本實驗借鑒Ariffin等(2018)和Yang等(2016)的感知風險量表,并結合酒店具體情境和消費者行為特征,在表述上進行簡單的修訂,提出6個題項。
此外,為了確保題項更加貼近本研究的實驗情景,首先,本文嚴格遵循問卷的修訂程序,對英文題項進行翻譯和回譯;其次,邀請多名營銷領域專家對語義不詳、難以理解的測量題項進行審核和修訂;最后,邀請海南大學67名MTA學生進行了試填。對問卷進行信度和效度檢驗時發(fā)現(xiàn),感知風險的第5個題項“我的朋友或家人可能會因為我預訂該酒店的錯誤決定而取笑我”的因子載荷系數(shù)小于0.5,因此刪除該題項,最終的測量題項如表5所示。
表5 量表的測量題項
實驗設定如下情景:“您正打算在網上預訂酒店,于是在去哪兒旅行網上搜索了某酒店的基本屬性信息以及在線評論信息?!比缓蠓謩e向4組被試呈現(xiàn)不同的在線評論頁面,在被試閱讀完評論信息后,要求他們回答關于評論有用性和感知風險的測量題項,接著填寫對評論效價和情感強度的感知作為操縱檢驗,最后填寫被試者的人口統(tǒng)計信息。
本實驗利用SPSS 26.0軟件進行數(shù)據(jù)處理和分析,主要內容包括獨立樣本T檢驗、可靠性分析、因子分析以及回歸分析。
4.5.1 樣本特征和操縱檢驗
本實驗共招募276名大學生作為實驗對象,剔除不完整填寫和規(guī)律性填寫的問卷后,共得到232份有效樣本,有效率達84.1%。其中男性100人,占比43.1%。性別(t=0.195,p=0.846>0.050)、預訂頻率(F(3,228)=1.893,p=0.132>0.050)變量對評論有用性無顯著影響。
結果顯示,M負面=2.82,M正面=5.11,t=-16.63,p<0.001,評論效價差異水平顯著;M低情感強度=3.13,M高情感強度=5.13,t=-12.05,p<0.001,情感強度差異水平顯著。因此,實驗對評論效價和情感強度的操縱有效。
4.5.2 信度和效度檢驗
對問卷進行信度和效度檢驗,結果顯示評論有用性和感知風險的Cronbach’sα系數(shù)分別為0.713和0.859,均大于0.700,說明問卷具有良好的信度。同時,評論有用性和感知風險量表的KMO值均在0.600以上,Bartlett球形檢驗結果顯著,且各測量題項的因子載荷均大于0.700,C.R.值均大于0.700,AVE值均大于0.500,說明各變量具有良好的聚合效度。此外,各變量AVE值的均方根大于其他變量之間的相關系數(shù),說明各變量之間具有良好的區(qū)分效度。
4.5.3 假設檢驗
首先,使用逐步回歸的方法檢驗評論效價對評論有用性的影響,以及消費者對產品感知風險的中介作用,結果如表6所示。對感知風險進行回歸發(fā)現(xiàn),評論效價對感知風險存在顯著的負向影響(β=-2.093,p<0.001),即相對于正面評論,消費者對負面評論的感知風險更高。對評論有用性進行回歸,結果表明,評論效價對評論有用性也存在顯著的負向影響(β=-1.480,p<0.001),即主效應顯著,H1得到驗證。在主效應檢驗中加入感知風險進行回歸,結果顯示評論效價(β=-0.862,p<0.001)和感知風險(β=0.298,p<0.001)對評論有用性的影響均顯著。相較于方程2,方程3中加入感知風險后評論效價主效應回歸系數(shù)的絕對值更小,說明感知風險的中介效應顯著,且為部分中介效應,H2得到驗證。
表6 感知風險的中介作用
其次,對樣本數(shù)據(jù)進行多因素ANOVA分析,以檢驗情感強度是否對評論效價與評論有用性的直接關系起調節(jié)作用,結果如表7所示。評論效價對評論有用性的影響存在顯著性差異(M負面=4.838,M正面=3.670,F(xiàn)(1,228)=565.601,p=0.000<0.050),即消費者對負面評論的感知有用性高于正面評論,H1再次得到驗證。評論效價和情感強度之間存在顯著的交互作用(F(1,228)=94.874,p=0.000<0.050),即情感強度會調節(jié)評論效價對評論有用性的影響,二者的交互作用如圖2所示。對于負面評論,情感強度高低對評論有用性的影響差異顯著(M負-高=5.26,M負-低=4.41,p=0.000<0.050),即負面評論的情感強度越高,消費者的感知有用性越強,H3再次得到驗證。而對于正面評論,盡管低情感強度的評論有用性略高于高情感強度的評論有用性,但差異并不明顯(M正-高=3.62,M正-低=3.72,p=0.174>0.050),H5再次得到驗證。
圖2 評論效價和情感強度交互作用對評論有用性的影響
表7 評論效價和情感強度對評論有用性的影響
最后,盡管實驗已證實評論效價對評論有用性存在直接影響,且情感強度在這一直接路徑中起調節(jié)作用。同時,實驗也證實了感知風險中介了評論效價與評論有用性之間的關系,但情感強度對這一中介路徑是否起調節(jié)作用還無從得知。因此,本研究采用Hayes(2013)開發(fā)的Process程序中的模型7進行有調節(jié)的中介效應分析。由于情感強度對正面評論和負面評論調節(jié)效應的方向不同,因此本文參考任小靜等(2019)的變量設置方法,將情感強度設為自變量,低情感強度取值為0,高情感強度取值為1;將評論效價設置為調節(jié)變量,負面評論取值為0,正面評論取值為1;分別將感知風險和評論有用性設置為中介變量和因變量。實驗采用偏差校正的Boostrap方法估計95%的置信區(qū)間,若區(qū)間不包含0,則說明情感強度在評論效價→感知風險→評論有用性這一中介路徑中起調節(jié)作用。另外,Hayes(2015)進一步提出檢驗有調節(jié)的中介效應的判定指標Index,該方法相較于傳統(tǒng)分組條件間接效應檢驗優(yōu)勢明顯。
檢驗結果表明,評論效價與情感強度的交互項對感知風險的影響顯著(β=-0.816,p<0.001),說明情感強度越高,評論效價對感知風險的負面影響越強。進一步由Process程序得到在調節(jié)變量不同取值下的中介效應,結果如表8所示。對于負面評論,情感強度越高,消費者對評論的感知風險越強,進而對評論的感知有用性越強(95%置信區(qū)間:LLCI=0.31,ULCI=0.48,不包括0),且中介效應值為0.39,H4得到驗證。而對于正面評論,情感強度高低對消費者感知風險的影響差異不顯著(95%置信區(qū)間:LLCI=-0.11,ULCI=0.02,包括0),即情感強度不能通過提高消費者的感知風險進而提高正面評論的感知有用性,H6得到驗證。此外,有調節(jié)的中介效應的判定指標Index為-0.44,95%的置信區(qū)間為[-0.55,-0.33],不包括0,再次說明上述有調節(jié)的中介效應是顯著的。
表8 有條件的間接效應分析
本實驗彌補了研究一中大數(shù)據(jù)分析的不足,通過情景實驗方法,進一步檢驗并揭示了評論效價影響評論有用性的作用機制和邊界條件;再次檢驗了評價效價主效應,即評論效價負向影響評論有用性(H1),也再次驗證了情感強度在評論效價與評論有用性影響關系中起調節(jié)作用(H3和H4)。另外,本實驗證實了感知風險在評論效價與評論有用性關系中的中介作用(H2),以及情感強度對上述中介作用的調節(jié)效應(H5和H6)。具體而言,評論效價還會通過影響消費者對產品的感知風險進而對評論有用性產生影響。同時,情感強度在這一過程中起著調節(jié)作用,即對于負面評論,情感強度越高,消費者對產品的感知風險越強,進而對評論有用性的感知越強。而對于正面評論,由于情感強度的高低對消費者感知風險的影響差異并不明顯,因此對評論有用性的影響也不顯著。
本研究構建了一個有調節(jié)的中介模型,并通過大數(shù)據(jù)分析和情景實驗的混合方法考察了評論效價對評論有用性的影響,以及感知風險的中介作用和情感強度的調節(jié)作用。具體結論如下:
(1)評論效價對評論有用性存在顯著的負向影響,即相較于正面評論,負面評論更有用。盡管在線評論中的“負面偏見”效應已被多次證實(Chen et al.,2013;任小靜 等,2019),但仍有研究者通過實證發(fā)現(xiàn)正面評論有用性比負面評論有用性更高(Luo et al.,2021;Liu et al.,2015)。本文認為出現(xiàn)矛盾性結論的原因可能在于對評論效價定義得不夠嚴謹,認為評論評分與評論內容的情感極性是一致的,而忽視了“好評下的差評”以及同一條評論中同時包含負面和正面評價的情況(李琪 等,2014;石文華 等,2018)。因此,本文通過構建酒店領域的情感詞典,計算每條評論內容的情感極性,從評論評分和情感極性兩個方面對評論效價進行重新定義,證實了評論效價對評論有用性存在負向影響。
(2)感知風險在評論效價與評論有用性的影響關系中起中介作用,即評論效價不僅可以直接影響評論有用性,也可以通過感知風險的中介效應影響評論有用性。前景理論認為消費者在不確定情境下對損失的敏感程度要遠高于對收益的敏感程度(Tversky et al.,1992),因此在決策時偏好于規(guī)避風險的保守策略(杜曉夢等,2015)。由于評論效價直接反映消費者對酒店產品體驗的主觀情感,而對產品的好惡分別對應著消費者在進行購買決策時預估的收益和損失,因此評論效價會通過影響消費者的感知風險,進而影響評論有用性。
(3)情感強度調節(jié)了評論效價對評論有用性的主效應和中介效應。具體而言,對于負面評論,情感強度越高,評論有用性越高。對于正面評論,情感強度高低對評論有用性的影響無明顯差異。進一步地,本文檢驗了情感強度對感知風險中介效應的調節(jié)作用。結果顯示,對于負面評論,情感強度越高,消費者對酒店產品的感知風險越強,評論有用性也就越強;而對于正面評論,由于情感強度高低對消費者感知風險的影響差異并不明顯,因此對評論有用性的影響也不顯著。究其原因,負面評論中包含大量對酒店產品的負面評價,而消費者對損失的敏感程度遠遠高于對收益的敏感程度,因此在決策時會給予負面評論極高的權重,導致無意識地放大負面評論的風險效應,進而做出風險規(guī)避行為,即負面情感強度越高,消費者的感知風險就越強,進而對負面評論有用性的感知越強。反之,盡管正面評論描述了酒店產品或服務的正面評價,但由于負面評論在消費者預訂決策中占有極高權重,因此負面評論大大削弱了不同情感強度引起的評論有用性差異,即情感強度高低對評論有用性的影響并不明顯。
第一,考慮了評論內容的情感極性及強度,在自變量的判定上更加嚴謹。已有研究通常以星級評分將評論劃分為正、負兩種效價,而此類通過單一指標反映情感極性的數(shù)字評級方法,難以準確衡量評論的真實情感,因此本文通過構建面向酒店領域的情感詞典,得出每一條評論的情感極性及強度,提升了研究結論的科學性和可靠性。在此基礎上,本文還考察了情感強度的調節(jié)作用,進一步細化不同情感之間的差異,厘清了不同情感強度下評論效價對評論有用性的影響的邊界條件,拓寬了在線評論情感研究的廣度和深度,也為酒店大數(shù)據(jù)情感分析提供了一定的方法論啟示。
第二,深化了對評論效價影響機制的理解。以往研究重點關注了評論效價對評論有用性的直接影響,忽略了兩者之間可能存在的中介路徑。同時,關于評論效價與評論有用性之間的影響關系還存在“負面偏見”和“正面偏見”的分歧。而本文基于前景理論和感知風險理論,引入感知風險作為中介變量,證實了評論效價不僅可以直接影響評論有用性,還可以通過消費者的感知風險,對評論有用性產生間接影響。研究結論對評論效價的影響機制給出了可靠的證據(jù),也對現(xiàn)有研究中存在的分歧給出了可能的解釋。
第三,研究方法的多元化提升了結論的穩(wěn)健性。以往對評論效價的相關研究局限于大數(shù)據(jù)分析或情景實驗的單一方法。而本文將大數(shù)據(jù)分析與情景實驗相結合,通過兩項研究驗證了本文所提假設。兩項研究的結果既有一致部分,如兩項研究均證實了情感強度對評論效價主效應的調節(jié)作用,進一步強化了研究結果的穩(wěn)健性;同時又相互補充,尤其是研究二通過情景實驗方法驗證了感知風險的中介效應,從而彌補了研究一難以明確評論效價與評論有用性的強因果關系且無法解釋評論效價主效應的影響機制的不足。
盡管在線評論中正面評論的數(shù)量遠高于負面評論,但在實際決策中,出于風險規(guī)避的心理,消費者會給予負面評論更高的權重。且負面評論的情感強度越高,消費者對酒店產品的感知風險越強,對評論有用性的影響也越強。因此,酒店應高度重視對負面口碑的及時管理甚至是危機管理。
第一,做好補救措施。服務補救悖論認為,相較于未遭遇服務失敗的消費者,遭遇服務失誤并獲得有效服務補救的消費者對商家有更高的滿意度,并傾向于向其他消費者進行正面口碑傳播(Krishna et al.,2014)。因此,在面對負面評論時,尤其當消費者的措辭較為激烈時,酒店應第一時間作出回應,積極主動地與消費者溝通,解釋服務失敗的原因,補償服務失敗造成的損失,以安撫消費者的不滿情緒,防止消費者的直接抱怨演變成酒店形象的公關危機。
第二,傾聽消費者的反饋。酒店應認識到消費者的負面評價可以幫助酒店發(fā)現(xiàn)管理缺陷,因此與消費者進行溝通時要積極聽取他們的意見,針對酒店產品服務中存在的問題,向消費者傳達酒店持續(xù)改進質量的強烈意愿。例如,明確酒店顧客投訴的賠付承諾,全面展示酒店產品的真實信息,完善在線酒店預訂的信用和支付體系,從而降低消費者在經濟、產品與服務、安全等方面的感知風險,贏得消費者的青睞。
第三,鼓勵消費者追加評論,尤其是獲得良好消費體驗及得到有效補救的消費者,這樣不僅可以增加消費者與酒店之間的良性互動,也可以向潛在消費者傳達酒店以顧客為中心的經營理念,在遇到服務失敗的情境時,酒店不僅不會逃避責任,反而是主動與消費者進行協(xié)商,必要時進行補償。通過展示成功的服務案例以及補救案例,消除潛在消費者的后顧之憂。
首先,圖片是在線評論的重要信息載體,現(xiàn)有研究僅從圖片有無、圖片數(shù)量等維度探討其對評論有用性的影響(史達 等,2020;張艷輝 等,2017),僅有鄧寧等(2019)利用深度學習對圖片內容和情感進行了解析,因此后續(xù)研究既可單獨考察圖片情感對在線評論有用性的影響,也可就評論文本情感與圖片情感是否一致展開研究。其次,本文在自變量的選取上剔除了評論評分與評論內容情感極性不一致的評論,未來可重點考察當評論評分與情感極性矛盾時,對在線評論有用性的影響及作用機制進行研究。最后,本文僅選取感知風險作為中介變量,后續(xù)研究可從新的理論視角,探討評論效價影響在線評論有用性的其他中介機制。