王夢瑤
(成都理工大學)
特殊時期的持續(xù)演變,在給全球經(jīng)濟帶來巨大挑戰(zhàn)的同時也帶來了機遇。在特殊背景催化下,生鮮電商蓬勃發(fā)展,為特殊時期人民群眾的基本生活提供了保障和便利。但生鮮電商未來的發(fā)展不能僅依靠這短暫的訂單量高速增長,期間暴露出的問題值得深入思考。微博平臺為此提供了一個窗口,作為國內最大的社交平臺,消費者樂于在平臺發(fā)布其日常生活體驗,這其中就包括關于以生鮮電商平臺為內容的評論,這些微博評論可以成為研究消費者生鮮平臺購物意愿的重要參考依據(jù)。
生鮮產品與人民日常生活密切相關,必須要保證一定的生鮮農產品攝入量才能夠保證充足的營養(yǎng)。生鮮電商自2005年開始蓬勃發(fā)展,不同經(jīng)營模式的電商紛紛涌現(xiàn)。在特殊時期,由于封城、交通管制等方面的原因,生鮮產品的運輸和銷售受到了較大阻礙,也因此刺激了生鮮電商的發(fā)展。艾瑞咨詢發(fā)布的《2021年中國生鮮電商行業(yè)研究報告》顯示[1]:2020年中國生鮮電商行業(yè)規(guī)模超4千億元,較2019年增長64.0%。隨著入局者不斷增加,市場競爭加劇。2020年中國生鮮電商TOP5平臺的市場份額之和為49.9%,較2018年下降了13.2個百分點。
文本情感分析技術是指利用自然語言處理和文本挖掘技術,對帶有情感色彩的主觀性文本進行分析、處理和抽取的過程。[2]情感分析任務按照其分析的粒度可以分為詞或短語級、句子級和篇章級;按處理的任務類型,可分為情感分類、情感檢索和情感抽取等幾大問題。主要的流程包括原始文本爬取、文本清洗、情感詞庫與語料庫構建以及情感分析結果等幾大流程。大數(shù)據(jù)技術的不斷發(fā)展為研究者捕獲數(shù)量級空前增長的輿情數(shù)據(jù),并從中萃取有價值的情緒信息提供了方法支撐。目前應用于網(wǎng)絡情緒分析的主流方法可分為基于詞典的方法和基于機器學習的方法兩大類[3],前者依托情緒詞典,將文本與詞典中表達情緒的關鍵詞加以匹配,通過所提取的情緒關鍵詞進行情緒類型的劃分或情緒傾向的計算;后者主要采用有監(jiān)督學習算法,訓練機器學習模型來測定輿情文本的情緒類型或情緒傾向。
傳統(tǒng)的生鮮電商指的是利用互聯(lián)網(wǎng)技術將生鮮產品通過電商大倉和分倉等傳統(tǒng)快遞方式配送給消費者,一般為用戶下單后,1~2天送達,例如天貓生鮮、京東生鮮等。隨著時代的發(fā)展,生鮮電商的形式也在不斷更新,目前有以下四種:以每日優(yōu)鮮為代表的“到家”模式生鮮電商,以盒馬鮮生為代表的“到店+到家”模式生鮮電商,以美團優(yōu)選為代表的社區(qū)團購模式生鮮電商和以食行生鮮為代表的“到柜”模式生鮮電商。本文主要研究對象為B2C生鮮電商,生鮮品類的B2B及C2C交易不包含在研究范圍內。
新浪微博因其信息開放式傳播、用戶主體類型多元、互動功能強等突出特點,成為了特殊時期重要的信息傳播平臺。本研究在總結國內外相關研究的基礎上,以“盒馬”“樸樸”“每日優(yōu)鮮”等生鮮電商品牌關鍵詞為檢索目標,爬取了微博平臺2020年1月1日至2021年12月31日相關微博評論共 68605 條為本文實驗的原始語料。為提高數(shù)據(jù)可用性,對其進行了文本去重、分詞、去停用詞以及去高頻無關詞等預處理,共得到41418條有效微博評論數(shù)據(jù)。
鑒于不同中文情感分析的原理、適用、效果的差異,本文最終選擇 SnowNLP 進行對微博評論文本的分析,實現(xiàn)主觀文本的客觀量化以便進行不同維度居民生鮮電商平臺消費意愿傾向的比較,并且該庫可以根據(jù)需要替換成不同的語料庫,能夠提高分類的準確性。
SnowNLP 的訓練和預測過程共分為三個階段:
第一階段:準備工作階段。在這一階段中,將會對正、負評論兩個樣本語料庫分詞統(tǒng)計,為后面得到先驗概率做準備。由于原始語料庫主要為商品評論、書評、影評,不適用于微博評論[4],因此本文使用第九屆全國社會媒體處理大會(https://smp2020.aconf.cn/index.html)微博情緒分類評測任務中已標注好的兩個測試集。采取50%通用微博數(shù)據(jù)集+50%特殊時期微博數(shù)據(jù)集方式,共抽取20000條微博數(shù)據(jù),并根據(jù)SnowNLP 原始語料庫的格式對該語料進行清洗和整理。
第二階段:訓練模型。針對第一階段的語料庫,通過兩層循環(huán)分別計算每條語料的先驗概率即兩個類別的概率以及后驗概率,最后形成一個新的貝葉斯模型。
第三階段:應用。這一階段使用重新訓練的模型對每條評論進行判斷,并以(0,1)的取值輸出結果。部分情感值計算結果如表1所示。
表1 部分評論情感得分表
從表1可以看到,該模型對于微博評論的情感傾向分析具有一定準確性,在總體上得分能夠反映出網(wǎng)友的生鮮電商平臺消費意愿,比如同樣存在購買行為的評論,當網(wǎng)友對生鮮電商平臺購物表現(xiàn)出焦慮、無奈的時候,情感得分偏低,表明該網(wǎng)友雖然有生鮮電商平臺購買意愿但對其中的一些環(huán)節(jié)仍存在不滿。當網(wǎng)友表達對生鮮電商平臺購買體驗較好的時候,其情感得分相對較高;比如同樣存在無法購買所需特定生鮮產品時,有的評論傾向歸因于平臺騎手運力不足導致不能成功購買,得分較低,有的評論表示雖然沒有買到部分所需物資,但依然感謝平臺能夠在特殊時期保證基本物資需求,得分較高。
在完成情感分析后,本文對每周相關微博數(shù)量和情感均值進行了統(tǒng)計,結果如圖1所示。
圖1 微博評論數(shù)量與情感均值統(tǒng)計圖
如圖1所示,在評論采集期間每周都有相關評論產生,在2020年第6周左右討論量最多,2021年 第 2、31、47、50周達到了小高峰。在2020年,整體情緒均值有3個劇烈變化時期。特殊時期的前期階段,面對日益嚴峻的形勢,居民生鮮平臺消費滿意度逐漸降低。在2020年,周討論量前5的周數(shù)集中于2020年第3周到第8周,其中第5周新冠肺炎病毒正式進入大眾視野,1月23日,湖北暫時關閉離鄂通道,武漢封城,因此第5、6、7三周對于生鮮電商購物的討論量都達到一個較高的水平;第10周除湖北外,其他各省的形勢得到了控制,部分省市下調應急響應等級,因而討論量也強烈變化,情感均值有所上升;第12周,首批國家援鄂醫(yī)療隊撤離武漢,人們的生鮮電商消費欲望有所提升,第16周時火神山、雷神山醫(yī)院相繼關閉,武漢住院病例數(shù)量快速減少,讓大眾看到了形勢初步可控的可能性。第24周,北京新發(fā)地特情爆發(fā),引起人們對生鮮電商安全性的廣泛關注與討論。第25周北京新發(fā)地菜市場發(fā)生聚集性感染事件,疑似與進口生鮮食品有關,平臺討論量激增,居民情感均值下降。第26周,北京一名餓了么配送員確診新冠,此前曾在每日優(yōu)鮮店內接單,無接觸配送和配送員的健康問題進入了生鮮電商平臺消費的討論范疇。第29周,江蘇進口生鮮食品新冠病毒檢測結果公布,結果全部為陰性,在一定程度上穩(wěn)定了生鮮市場情緒。同時,江西萍鄉(xiāng)在南美凍蝦包裝上檢出新冠病毒陽性,居民消費意愿進一步下降。第53周,在因元旦臨近居民生鮮購買欲上升和北京一確診病例到訪盒馬門店雙重因素的作用下,相關微博討論量有所上升。進入2021年后,第3周和第4周,本地新增連續(xù)3天破百,北京石家莊多地爆發(fā)特情,同時春節(jié)臨近,生鮮電商相關微博量再次上升。第32周,南京祿口機場特殊時期爆發(fā),并擴散至揚州、張家界等多地,大量人員被隔離或封閉管理,生鮮電商作為日常生活用品購買渠道之一,相關微博熱度因此上升。第41周,由于國慶假期來臨,人們的生鮮電商平臺討論度也隨之上升,居民消費熱情增加。2020年第53周,隨著西安特情逐漸嚴重,相關討論量再攀高峰。
總體上看,居民生鮮電商平臺消費意愿變化確與特殊時期存在一定相關度。從武漢封城到除湖北外多省陸續(xù)控制特情再到當前的全國多處小規(guī)模爆發(fā),全國形勢的每一次重大變動與轉折,都會影響到民眾對于生鮮電商平臺購物的討論度和消費意愿。同時,特情的反復提高了居民對生鮮電商的熟悉度,在日常生活尤其是節(jié)假日期間,人們更習慣于在生鮮電商平臺消費。從整體上看,2021年整體討論量遠高于2020年,居民的整體生鮮電商消費意愿有所提升。
詞云圖的原理是通過使每個詞的大小與其出現(xiàn)頻率成正比,顯示不同詞語在給定文本中的出現(xiàn)頻率,然后將所有的詞語排在一起,形成云狀圖案。經(jīng)過SnowNLP情感分析后,本文分別繪制了情感值大于0.7的積極評論和情感值小于0.3的消極評論數(shù)據(jù)的詞云圖(word cloud chart),以進一步了解居民生鮮平臺消費意愿。
如圖2、圖3所示,生鮮電商平臺消費滿意度高的評論的高頻詞為感謝、快樂、喜歡等,反映出居民心態(tài)良好,對特情防控充滿信心,對當下的生鮮電商消費環(huán)境感到安全,因此特情防控程度是促使居民生鮮電商平臺消費的重要因素。相對地,生鮮電商平臺消費滿意度低的評論的高頻詞則為沒有、配送、發(fā)現(xiàn)、不能等,體現(xiàn)出居民對目前平臺消費有所不滿,這些高頻詞反映了因配合特殊時期防控政策,居民對當前生鮮電商平臺的品類和配送服務存在不滿,在訂單售后方面有怨言。
圖2 積極情感詞云
圖3 消極情感詞云
本研究通過情感分析、詞云等方法對微博平臺發(fā)布的生鮮電商相關評論進行文本挖掘,研究生鮮電商用戶特殊時期消費意愿的變化,發(fā)現(xiàn)特情作為刺激因素確能影響居民的生鮮電商平臺消費意愿,其因素多與特情之下的平臺自身服務相關,如商品價格、品質、售后等。特殊時期培養(yǎng)了消費者的習慣,提高了用戶黏性,因此對于未來生鮮電商的發(fā)展應持續(xù)看好?;诖耍疚膶ιr電商企業(yè)有如下建議:
(1)嚴控生鮮產品質量,不打無效價格戰(zhàn)。在消極微博評論的研究中,多次出現(xiàn)了“便宜”這個關鍵詞,商家通過降低價格來吸引用戶無可厚非,但如果不能注重質量,沒有讓消費者感到物有所值,將嚴重磨損品牌形象,造成消費者流失。(2)優(yōu)化配送流程,提高配送效率。生鮮產品本身具有易腐性,消費者在購買時更加注重品質和新鮮度,多希望在下單后能盡快取貨。當前大部分生鮮電商的配送環(huán)節(jié)既然存在高峰期運力不足,無法按時配送等問題,各平臺應該注重發(fā)揮生鮮電商數(shù)據(jù)量大的特點,展開數(shù)據(jù)挖掘,優(yōu)化采購配送算法,提升用戶體驗。(3)發(fā)展多元化經(jīng)營,推動線上線下融合發(fā)展?!暗降辍?“到家”模型的生鮮電商可以覆蓋到更多的用戶人群,線下門店可以在一定程度消除消費者的不確定性,而線上可以滿足消費者足不出戶完成消費的愿望,為當前特殊時期的購物提供了便利。雙向引流的同時提高了消費者的購物頻率和對平臺的忠誠度與黏性。