朱道平,張燦鳳
(廣東工業(yè)大學(xué)管理學(xué)院,廣東 廣州510520)
隨著人們的消費(fèi)升級(jí),價(jià)格儼然不再是影響需求的唯一因素,產(chǎn)品銷(xiāo)量到底受到哪些因素的影響,一直是學(xué)者們研究的熱點(diǎn)。 電商交易存在著信息不對(duì)稱(chēng)問(wèn)題,信息較少的消費(fèi)者為了減少交易風(fēng)險(xiǎn),在做出購(gòu)買(mǎi)決策之前通常會(huì)在網(wǎng)絡(luò)平臺(tái)收集產(chǎn)品的相關(guān)信息。 根據(jù)社會(huì)認(rèn)同原則,Trusov 等發(fā)現(xiàn),電子商務(wù)活動(dòng)中歷史消費(fèi)者體驗(yàn)后生成的信息在消費(fèi)者決策中起著至關(guān)重要的作用。 此外,學(xué)者們研究也發(fā)現(xiàn)歷史購(gòu)買(mǎi)記錄、在線(xiàn)評(píng)論和買(mǎi)家的反饋評(píng)分等消費(fèi)者行為的統(tǒng)計(jì)結(jié)果,會(huì)對(duì)產(chǎn)品銷(xiāo)量產(chǎn)生影響。 相關(guān)數(shù)據(jù)顯示,98%的客戶(hù)在消費(fèi)前會(huì)參考不同網(wǎng)絡(luò)平臺(tái)的評(píng)論內(nèi)容。 可見(jiàn),用戶(hù)評(píng)論在消費(fèi)者購(gòu)買(mǎi)決策中占據(jù)重要地位。
在線(xiàn)客戶(hù)評(píng)論是消費(fèi)者使用產(chǎn)品后發(fā)表的感想,形式可以是圖片、文字甚至視頻。 在線(xiàn)客戶(hù)評(píng)論來(lái)源可以分成兩類(lèi):一類(lèi)是電商網(wǎng)站,例如京東商城、淘寶、亞馬遜商城等;另一類(lèi)是第三方網(wǎng)站,這類(lèi)網(wǎng)站不銷(xiāo)售商品,但是提供產(chǎn)品資訊和用戶(hù)交流信息,比如中關(guān)村在線(xiàn)、太平洋電腦網(wǎng)等,也包括社交媒體平臺(tái)如微博。 有學(xué)者指出這兩類(lèi)網(wǎng)站對(duì)于產(chǎn)品的評(píng)論存在內(nèi)容、數(shù)量、可信度的差異。 當(dāng)前關(guān)于在線(xiàn)客戶(hù)評(píng)論對(duì)銷(xiāo)量影響的研究主要集中于電商平臺(tái),如崔香梅和黃京華通過(guò)采集淘寶數(shù)據(jù),使用相關(guān)性分析和多元線(xiàn)性回歸,發(fā)現(xiàn)好評(píng)數(shù)對(duì)交易數(shù)有顯著的正向影響。 何喜軍等針對(duì)京東商城的聯(lián)想ZUK Z2 手機(jī)產(chǎn)品,綜合考慮影響電商產(chǎn)品銷(xiāo)量的多維指標(biāo)(在線(xiàn)搜索、在線(xiàn)評(píng)論、情緒指數(shù)等)并利用熵值法融合同類(lèi)指標(biāo),進(jìn)行銷(xiāo)量預(yù)測(cè)。 除此之外,少量學(xué)者把第三方網(wǎng)站與電商平臺(tái)的在線(xiàn)客戶(hù)評(píng)論進(jìn)行整合研究,如袁海霞等對(duì)比電商平臺(tái)評(píng)論與微博口碑對(duì)新產(chǎn)品銷(xiāo)售的動(dòng)態(tài)影響,雖然較單一電商平臺(tái)研究進(jìn)行了補(bǔ)充,但僅從評(píng)論數(shù)量上進(jìn)行研究,沒(méi)有探索評(píng)論內(nèi)容的影響。
梳理現(xiàn)有電商銷(xiāo)量預(yù)測(cè)研究可以發(fā)現(xiàn),學(xué)者們除了關(guān)注傳統(tǒng)預(yù)測(cè)因子外,也逐漸把在線(xiàn)客戶(hù)評(píng)論作為影響因子。 在線(xiàn)客戶(hù)評(píng)論作為預(yù)測(cè)因子,主要是利用了電商平臺(tái)評(píng)論的數(shù)量特征,也嘗試?yán)迷u(píng)論情緒,但是很少探索第三方平臺(tái)評(píng)論情緒對(duì)銷(xiāo)量的影響。 因此,論文在銷(xiāo)量預(yù)測(cè)時(shí),加入第三方平臺(tái)的評(píng)論情緒指標(biāo)。 同時(shí),考慮到電商銷(xiāo)量的影響因素眾多,論文也選取了傳統(tǒng)的預(yù)測(cè)因子,探索這些因素對(duì)于銷(xiāo)量預(yù)測(cè)的重要性。 論文選取了回歸分析和神經(jīng)網(wǎng)絡(luò)算法進(jìn)行對(duì)比和預(yù)測(cè),以期尋找到合適的電商銷(xiāo)量預(yù)測(cè)模型。
在線(xiàn)客戶(hù)評(píng)論的數(shù)量龐大、非結(jié)構(gòu)化,處理起來(lái)煩瑣,有時(shí)會(huì)被研究者忽略,將關(guān)注點(diǎn)放在評(píng)分、評(píng)論數(shù)量及長(zhǎng)度、價(jià)格等顯性因素上,較少考慮評(píng)論情緒這種隱性因素對(duì)銷(xiāo)售預(yù)測(cè)的作用。 論文將把電商平臺(tái)和第三方平臺(tái)的評(píng)論情緒作為影響因素,進(jìn)行銷(xiāo)量預(yù)測(cè)。 具體的研究路線(xiàn)如圖1 所示:
圖1 研究路線(xiàn)
論文選擇手機(jī)作為實(shí)驗(yàn)對(duì)象,因?yàn)殡娚啼N(xiāo)售預(yù)測(cè)研究主要集中在電子產(chǎn)品類(lèi)別上。 依據(jù)論文研究假設(shè),數(shù)據(jù)集來(lái)源于兩部分:一部分是電商平臺(tái)內(nèi)部數(shù)據(jù),選取京東商城上銷(xiāo)量前300 的手機(jī),并使用八爪魚(yú)采集器提取其銷(xiāo)售詳情頁(yè)的價(jià)格、促銷(xiāo)、評(píng)論、產(chǎn)品上市時(shí)長(zhǎng)等信息;另一部分是第三方平臺(tái)的外部數(shù)據(jù),論文選用了新浪網(wǎng)微熱點(diǎn)提供的熱度指數(shù)和情緒指數(shù),該平臺(tái)實(shí)時(shí)分析海量數(shù)據(jù),可以客觀(guān)反映某事的熱度和情緒傾向。 研究采集了2020 年6 月1 日至6 月30日為期30 天數(shù)據(jù)量。
收集的原始數(shù)據(jù)存在諸多噪音或不可量化,需要經(jīng)過(guò)預(yù)處理,才能用于預(yù)測(cè)建模。 去除缺失值和異常值,有效數(shù)據(jù)集有3973 條記錄。 進(jìn)一步,還需對(duì)數(shù)值數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理以及對(duì)文本數(shù)據(jù)進(jìn)行情感指數(shù)計(jì)算。
對(duì)于數(shù)值數(shù)據(jù),如價(jià)格、促銷(xiāo)等,變量之間的量差非常大,為了減小數(shù)據(jù)的可變性,論文采取了標(biāo)準(zhǔn)化處理,經(jīng)過(guò)處理的數(shù)據(jù)的均值為0,標(biāo)準(zhǔn)差為1,這是目前用得最多的數(shù)據(jù)標(biāo)準(zhǔn)化方法,其公式為:
其中,和sj分別為第j指標(biāo)觀(guān)測(cè)值的均值和標(biāo)準(zhǔn)差。
對(duì)于文本數(shù)據(jù),如評(píng)論屬于非結(jié)構(gòu)化數(shù)據(jù),需要轉(zhuǎn)換成可以計(jì)算的數(shù)值。 論文利用文本處理工具Python 中的Jieba進(jìn)行預(yù)處理,具體步驟包括:文本去重、句子切分、文本分詞、去停用詞等內(nèi)容。 評(píng)論文本經(jīng)過(guò)預(yù)處理后,利用知網(wǎng)HowNet情感詞典的擴(kuò)充版本對(duì)文本進(jìn)行情感分析,并計(jì)算出每條評(píng)論的情緒評(píng)分。 對(duì)于每條評(píng)論,首先計(jì)算分句的情感得分,具體公式如下:
其中,Di為程度副詞得分;Sj為程度副詞后的情感詞得分;Nk為否定詞得分。
得到分句的評(píng)論情緒得分后,將這條評(píng)論的所有分句得分求和,得出此評(píng)論的總得分scroet,然后將一款產(chǎn)品一天采集的T條評(píng)論進(jìn)行匯總并求均值
對(duì)收集的數(shù)據(jù)進(jìn)行適當(dāng)?shù)奶幚砗?,最終選擇的變量有:當(dāng)前價(jià)格、促銷(xiāo)金額、上市時(shí)長(zhǎng)、好評(píng)率、好評(píng)數(shù)、差評(píng)數(shù)、差評(píng)回復(fù)占比、會(huì)員占比、好評(píng)情緒得分、差評(píng)情緒得分(來(lái)源于京東商城),以及微博熱度、微博情緒(來(lái)源于微博),這些基礎(chǔ)變量與現(xiàn)有電商和在線(xiàn)銷(xiāo)售研究相吻合。
首先探索各因素對(duì)銷(xiāo)量的影響,同時(shí)也分析這些變量之間的交互效應(yīng)對(duì)銷(xiāo)量的影響,論文分別用線(xiàn)性回歸、BP 神經(jīng)網(wǎng)絡(luò)兩種方法進(jìn)行九組實(shí)驗(yàn),具體的實(shí)驗(yàn)設(shè)計(jì)如表1。
表1 實(shí)驗(yàn)方案
以上的差評(píng)情緒得分×好評(píng)數(shù)、好評(píng)情緒得分×差評(píng)數(shù)、價(jià)格×好評(píng)數(shù)、會(huì)員數(shù)×差評(píng)數(shù)和促銷(xiāo)金額×差評(píng)數(shù)5 個(gè)交互效應(yīng)新變量是通過(guò)參考相關(guān)文獻(xiàn)研究結(jié)論并進(jìn)行變量間的相關(guān)性分析得到的,表2 為部分變量之間的相關(guān)性。 其中價(jià)格、促銷(xiāo)金額、好評(píng)情緒得分、差評(píng)情緒得分、會(huì)員數(shù)與銷(xiāo)量和好評(píng)數(shù)及差評(píng)數(shù)的相關(guān)性都很小,于是在這幾個(gè)獨(dú)立變量的基礎(chǔ)上構(gòu)造5 個(gè)交互效應(yīng)新變量。
表2 部分變量之間的相關(guān)性分析結(jié)果
1. 線(xiàn)性回歸分析是采取逐步的方式,首先僅考慮電商平臺(tái)的預(yù)測(cè)因素,接下來(lái)引入微博平臺(tái)采集的微博情緒和微博熱度兩個(gè)預(yù)測(cè)因素,最后添加交互效應(yīng)的五個(gè)因素,具體的回歸結(jié)果如表3 所示。
表3 線(xiàn)性回歸中各變量的表現(xiàn)情況(回歸系數(shù))
續(xù)表
2. BP 神經(jīng)網(wǎng)絡(luò)進(jìn)行商品銷(xiāo)售預(yù)測(cè)前,將數(shù)據(jù)集的70%作為訓(xùn)練集,剩余的30%作為測(cè)試集。 首先將12 個(gè)基礎(chǔ)變量作為BP 神經(jīng)網(wǎng)絡(luò)的輸入,訓(xùn)練出第一個(gè)人工神經(jīng)網(wǎng)絡(luò)模型。 然后將五個(gè)交互項(xiàng)引入第一個(gè)人工神經(jīng)網(wǎng)絡(luò)模型,圖2給出了基于人工神經(jīng)網(wǎng)絡(luò)模型輸入變量的預(yù)測(cè)重要性排行。
圖2 BP 神經(jīng)網(wǎng)絡(luò)模型中各變量的重要性排名
研究的主要目的:一是探索不同平臺(tái)評(píng)論情緒對(duì)銷(xiāo)量的影響情況,同時(shí)探索其他變量的重要性;二是探索線(xiàn)性回歸、BP 神經(jīng)網(wǎng)絡(luò)對(duì)銷(xiāo)量的預(yù)測(cè)能力。 表4 總結(jié)了兩類(lèi)模型的實(shí)驗(yàn)結(jié)果,除了R2以外,還選用了均方根誤差RMSE,對(duì)9 個(gè)模型進(jìn)行比較,結(jié)果如表4 所示。
表4 兩種預(yù)測(cè)模型的結(jié)果對(duì)比
比較實(shí)驗(yàn)一和二可以發(fā)現(xiàn),R2和RMSE 都有所改善,說(shuō)明第三方社交平臺(tái)的評(píng)論情緒對(duì)銷(xiāo)量具有一定的影響。 其次在實(shí)驗(yàn)二模型的基礎(chǔ)上加入交互項(xiàng),R2和RMSE 也同樣發(fā)生了改變并優(yōu)化,說(shuō)明這幾個(gè)變量本身雖然對(duì)銷(xiāo)量的影響不顯著,但是其可能會(huì)通過(guò)調(diào)節(jié)其他重要預(yù)測(cè)因子與銷(xiāo)售的相互作用來(lái)影響銷(xiāo)售。 這一現(xiàn)象通過(guò)對(duì)比加入5 個(gè)交互項(xiàng)的BP 神經(jīng)網(wǎng)絡(luò)模型所帶來(lái)的RMSE 改善得到證實(shí)。
除了比較銷(xiāo)量與預(yù)測(cè)因子的關(guān)系和重要性以外,從表4可以發(fā)現(xiàn),機(jī)器學(xué)習(xí)模型在自變量維度較復(fù)雜的時(shí)候會(huì)顯現(xiàn)一定的優(yōu)越性(BP 神經(jīng)網(wǎng)絡(luò)模型的RMSE 小于線(xiàn)性回歸模型),并且可以解決線(xiàn)性和非線(xiàn)性問(wèn)題,不會(huì)受變量相關(guān)性影響。
論文對(duì)線(xiàn)性回歸、人工神經(jīng)網(wǎng)絡(luò)兩種建模技術(shù)進(jìn)行比較分析,探討電子商務(wù)背景下,不同平臺(tái)評(píng)論情緒和其他預(yù)測(cè)變量及其相互作用的重要性、建模技術(shù)的適用性等問(wèn)題,首先通過(guò)比較各種預(yù)測(cè)因素的重要性,得出了如下的一些結(jié)論:
第一,論文的研究重點(diǎn)是調(diào)查評(píng)論情緒與銷(xiāo)量的關(guān)系,然而線(xiàn)性回歸模型中,電商平臺(tái)的情緒因子都沒(méi)有被視為重要的預(yù)測(cè)指標(biāo),BP 神經(jīng)網(wǎng)絡(luò)模型也只是將它們的重要性劃分在0~0.05 之間。 與之前不少學(xué)者指出的差評(píng)比好評(píng)更重要的結(jié)論相矛盾。 關(guān)于評(píng)論情緒對(duì)銷(xiāo)量預(yù)測(cè)的重要性,結(jié)合現(xiàn)有的一些研究結(jié)論,論文給出了兩點(diǎn)解釋:
(1)因?yàn)榇嬖谝恍┧巍⑺⒃u(píng)論的操作,買(mǎi)家對(duì)評(píng)論的真實(shí)性懷有半信半疑的態(tài)度,所以他們不太在意這些評(píng)論的情緒。
(2)京東商城自營(yíng)的商品可能因?yàn)槠放菩?yīng)收獲了客戶(hù)一定的信任,就不會(huì)過(guò)多地考慮評(píng)論情緒。
盡管與情感相關(guān)的因素不能作為獨(dú)立因素,但是在兩類(lèi)模型中好評(píng)情緒得分×差評(píng)數(shù)、差評(píng)情緒得分×好評(píng)數(shù)的回歸系數(shù)顯示其為銷(xiāo)量的重要交互預(yù)測(cè)因子。 這表明,積極的情緒會(huì)緩和差評(píng)數(shù)帶來(lái)的負(fù)面影響,而消極的情緒也會(huì)干擾好評(píng)數(shù)對(duì)銷(xiāo)售的促進(jìn)作用,所以店鋪不能忽視評(píng)論內(nèi)容的重要性,而且需要鼓勵(lì)買(mǎi)家撰寫(xiě)好評(píng)來(lái)提高評(píng)論數(shù)量。
第二,第三方平臺(tái)的微博熱度和微博情緒是兩類(lèi)模型的預(yù)測(cè)變量,這說(shuō)明第三方平臺(tái)也會(huì)傳播產(chǎn)品的正負(fù)面信息。實(shí)驗(yàn)二比實(shí)驗(yàn)一的R2增大了0.005,可見(jiàn)加入第三方平臺(tái)的預(yù)測(cè)變量后預(yù)測(cè)效果更好,因此適當(dāng)?shù)膮⒖计渥兓部梢詫?duì)銷(xiāo)量預(yù)測(cè)帶來(lái)幫助,熱度越高,銷(xiāo)量越高,積極情緒越強(qiáng),銷(xiāo)量越高。
第三,觀(guān)察其他變量顯示,價(jià)格與好評(píng)數(shù)、促銷(xiāo)金額與差評(píng)數(shù)的相互作用被認(rèn)為是兩類(lèi)預(yù)測(cè)模型的重要預(yù)測(cè)因子,因此證明了好評(píng)數(shù)和差評(píng)數(shù)的效果,在三個(gè)回歸模型中,這兩個(gè)變量均被認(rèn)為是重要的獨(dú)立預(yù)測(cè)因子,而價(jià)格和促銷(xiāo)金額對(duì)它們與銷(xiāo)量的關(guān)系產(chǎn)生了調(diào)節(jié)效應(yīng),并是不可忽視的指標(biāo)。