童仕寬,高 越,郭嘉祺,余雅霖
(1.武漢理工大學 理學院,湖北 武漢 430070;2.武漢理工大學 計算機科學與技術學院,湖北 武漢 430063)
隨著電子商務與現(xiàn)代物流行業(yè)的蓬勃發(fā)展,網(wǎng)上購物因其安全、便捷、價格低廉、選擇多樣等優(yōu)點逐漸得到廣大消費者的青睞。不同于線下購物的低互動性,消費者在線上購物后可以對商品進行評級和評論。調查研究顯示,線上評級與評論已成為消費者在購買商品前了解商品與服務信息的重要渠道。因此,通過挖掘商品評論信息的潛在價值,厘清消費者的顯性和隱性需求,從而幫助企業(yè)優(yōu)化產(chǎn)品設計、制定銷售策略、開拓新興市場,具有深遠的研究意義與應用價值。
近年來,一些學者對提取商品評論中蘊含信息的方法進行了深入研究,搭建了多種理論模型??紤]到商品評論信息的多樣性與復雜性,多數(shù)學者將評價狀況總結為單一評價指標。如張野[1]以商品聲譽作為衡量電子商務中商品信譽的標準,得到衡量商品聲譽的評價模式。CARRILLO-DE-ALBORNOZ等[2]通過識別評論中的商品相關特征,以預測模型的形式對商品的總體評分進行預測,得到了更完善、更準確的商品評論狀況指標。王乾等[3]提出綜合文本評論與數(shù)值評分的綜合評分計算方法,針對矛盾性評價引入LSTM-AE神經(jīng)網(wǎng)絡與支持向量機,得到了既可中和矛盾性評價差異,又不影響非矛盾性評價的評分結果。在對評論信息單一化整合的基礎上,也有學者對評論具體信息及其之間的關系進行了討論。如HU等[4]通過建立多元方程模型,得到了評論與銷售狀況之間的相關關系與具體的影響模式。袁海霞等[5]結合新產(chǎn)品擴散理論,采用動態(tài)線性模型,對消費者產(chǎn)品評論和微博口碑在新產(chǎn)品擴散過程中的動態(tài)對比影響進行研究。徐硼等[6]采用多元回歸模型和結構方程,得到了藝術品網(wǎng)購中消費者感知風險影響因素的作用機理,以及在線評論顯著正向調節(jié)感知藝術品信息的不對稱性對感知風險的關系。關于評論的動態(tài)變化方面,周莎莎[7]采用回歸分析方法,從評論者與評論環(huán)境各因素的調節(jié)效應及其前后各指標交互效應的角度,對過去與后續(xù)產(chǎn)品評論之間的影響進行討論。聞超[8]對酒店在線評分的動態(tài)變化進行了研究,將評論區(qū)分為前期和后期,得出了不同時期評論相互之間的影響機制。
目前的評論信息整合主要關注指標的提取,極少考慮不同評價者之間的差異。同時已有研究多側重于直接研究評論數(shù)據(jù),忽略了評論與評級之間的關系。因此,筆者對商品評論信息進行整合,考慮到不同評價者的可信度差異,基于模糊綜合評價模型得出商品評論信息的評價方案。由詞頻推測出商品成功的預示信號,并采用斷點回歸、相關性分析等方法,對評論與星級之間的關系進行進一步的分析,使得結論更具有現(xiàn)實性和可用性。
數(shù)據(jù)來源于2020年美國大學生數(shù)學建模競賽C題中給出的數(shù)據(jù),該數(shù)據(jù)為亞馬遜市場2003年3月至2015年8月吹風機、微波爐和奶嘴3類產(chǎn)品的客戶評價數(shù)據(jù),由亞馬遜網(wǎng)站提供,包括產(chǎn)品編號、用戶評價星級(1~5星)、“有幫助”投票數(shù)、總投票數(shù)、是否為“vine”用戶、是否購買、評論標題、評論內容等。
需要說明的是:亞馬遜市場為用戶提供了評價星級,表達對產(chǎn)品的滿意程度,星級越大表示對產(chǎn)品越滿意,同時可以在評論中表達對產(chǎn)品的意見和建議。另外,用戶可以對其他用戶的評價進行投票,表達該評論是否對其有幫助。亞馬遜市場還基于用戶已發(fā)表的有效評論,邀請一些用戶成為“vine”用戶,向其免費提供產(chǎn)品樣例以幫助他們給出更準確的、有見地的評論。
收集到的評論數(shù)據(jù)具有數(shù)據(jù)量大、數(shù)據(jù)類型復雜的特點,無法直接用于統(tǒng)計分析。因此,在系統(tǒng)研究之前對收集到的數(shù)據(jù)進行預處理。
1.2.1 缺失與異常數(shù)據(jù)的處理
針對缺失數(shù)據(jù),將該數(shù)據(jù)的其余項與數(shù)據(jù)組中的完整數(shù)據(jù)進行比較,選擇最相似的一條進行補全;針對異常數(shù)據(jù),對檢索到的不符合定義的數(shù)據(jù)條目做刪除處理;針對部分文字型數(shù)據(jù)含有的表情符號信息,選擇與該表情含義相似的單詞進行替換。
1.2.2 研究對象的初步提取
經(jīng)過初步處理后,得到了便于分析的數(shù)據(jù)形式。為增強數(shù)據(jù)的有效性,對研究對象進行初步提取,具體操作如下:①刪除數(shù)據(jù)組中研究價值與區(qū)分度不高的冗余項,包括銷售市場、產(chǎn)品所屬目錄、產(chǎn)品系列編號等。②根據(jù)產(chǎn)品名稱項中對產(chǎn)品名稱的描述,刪除不屬于該類產(chǎn)品的數(shù)據(jù)。③不考慮同一客戶對兩件商品進行評分的情況,且由于產(chǎn)品系列編號對后續(xù)研究意義不大,僅選取產(chǎn)品編號作為研究對象。④由于評論標題和評論內容兩項數(shù)據(jù)類型相同且相似度較高,因而將其合并為一項進行研究。
1.2.3 自然語言數(shù)據(jù)的處理
由于自然語言數(shù)據(jù)難以進行計算和分析,筆者采用了自然語言處理算法,使用工具包NLTK[9]內置的情感分析模塊nltk.sentiment.vader,從評論中提取出語言的情感分數(shù),基于該數(shù)據(jù)進行后續(xù)研究。
1.2.4 數(shù)據(jù)的標準化
對所有數(shù)據(jù)進行標準化處理:將是否為“vine”用戶和是否購買中的“N”與“Y”分別用0和1替代;對星級、“有幫助”投票數(shù)、總投票數(shù)均使用最大最小值法進行標準化處理。
模糊綜合評價[10]是在模糊環(huán)境或模糊系統(tǒng)中基于模糊數(shù)學設計多個元素或指標的綜合評價方法。運用該方法建立模糊綜合評價模型,具體步驟如下:
(1)確定因素集。確定用于評判評價對象的因素,即確定評價指標集合U={u1,u2,…,um}。
(2)確定評價集。評價者對評價問題進行評價,形成評價集V={v1,v2,…,vn}。
(3)求解模糊關系矩陣。因素集中各指標隸屬于評價集中不同評價的程度稱為隸屬度。計算各因素對各評價的隸屬度,得到從U到V的模糊關系矩陣R:
(1)
其中,rij(i=1,2,…,m,j=1,2,…,n)為評價系統(tǒng)中因素ui對vj等級模糊子集的隸屬度。
(5)多因素模糊評價。選擇合適的合成算子合成權重集A與模糊關系矩陣R,得到模糊綜合評價結果B。
B=A·R=(b1,b2,…,bn)
(2)
其中,bj為評價對象對vj等級模糊子集的綜合隸屬程度。
(6) 分析模糊綜合評價結果。將綜合評價結果B轉換為綜合分值,根據(jù)分值大小對多個評價問題進行排序和對比分析。
由于不同評論的可信度具有一定差異,筆者基于評論的“有幫助”投票數(shù)、總投票數(shù)、是否為“vine”用戶和是否購買定義了評論可信度Reliability和綜合評論情緒RE。
Reliability=w1z1+w2z2+w3z3+w4z4
(3)
RE=Reliability×e
(4)
式中:z1、z2、z3、z4分別為評論的“有幫助”投票數(shù)、總投票數(shù)、是否為“vine”用戶、是否購買經(jīng)預處理后的值;w1、w2、w3、w4分別為各項權重,筆者采用主觀定權與熵權法[11]相結合的方法確定指標權重;e為評論情緒分數(shù)。
以星級RA與綜合評論情緒分數(shù)RE作為指標,建立模糊評價模型,得到因素集U={RA,RE}。產(chǎn)品的星級和綜合評論情緒分數(shù)決定了評語集,由產(chǎn)品的星級和綜合評價組成評價矩陣R,結合權重矩陣得到綜合評價結果,取其中數(shù)值最大的隸屬度對應的評語作為最終產(chǎn)品的評價結果。
基于上述模糊綜合評價模型,得到衡量商品評論狀況的綜合評價方案。使用該方案對吹風機、微波爐、奶嘴3類產(chǎn)品的評論數(shù)據(jù)進行評價。3類產(chǎn)品的“有幫助”投票數(shù)、總投票數(shù)、是否為“vine”用戶、是否購買4項指標的權重如表1所示。3類產(chǎn)品的評價結果分別如表2~表4所示。
化學和生活情境相結合并不意味著化學本身只需要理論作指導.我們要看到其實踐性的本質,盡可能地發(fā)掘化學實驗和生活的結合之處,比如在焰色反應的化學實驗中,不同顏色的金屬會產(chǎn)生的顏色也不一樣.煙花就是其在生活中具體應用的一個例子.可以通過讓學生觀看煙花的視頻,分析化學其本身存在的化學原理,也可以根據(jù)煙花的顏色試分析煙花中存在的化學成分.讓學生理解化學是如何來源于生活卻又高于生活的,化學反應中可以應用這些化學原理,但是又不能完全應用,讓學生自己探索發(fā)現(xiàn)生活和課本中知識運用上的差距,從而讓學生對化學學習有一個更為深刻的領悟.
表1 指標權重
表2 吹風機產(chǎn)品評價結果(部分)
表3 微波爐產(chǎn)品評價結果(部分)
表4 奶嘴產(chǎn)品評價結果(部分)
新產(chǎn)品上市后,對產(chǎn)品在市場中呈現(xiàn)的信息進行追蹤,將有利于后續(xù)產(chǎn)品與銷售策略的改進。
3.1.1 初步指標提取
考慮未處理的評論數(shù)據(jù),根據(jù)各指標的權重提取出重要性較強的評論指標用于初步研究。由表1可知:①對于吹風機產(chǎn)品而言,是否為“vine”用戶和“有幫助”投票數(shù)的權重之和占總權重的80%以上。其主要原因可能是:“vine”用戶的評論往往更加客觀且具有專業(yè)性;“有幫助”投票數(shù)常被作為網(wǎng)站評論排序的依據(jù),越高者往往越易受到消費者的支持與認可。②對于微波爐產(chǎn)品而言,微波爐因其功能的多樣性,對評價者的專業(yè)水準要求更高,是否為“vine”用戶的權重達到了51%,權重最高,“有幫助”投票數(shù)次之,總投票數(shù)與是否購買的權重最低且相差不大。③對于奶嘴產(chǎn)品而言,受使用舒適程度的影響,是否為“vine”用戶與“有幫助”投票數(shù)的權重最高且較為相近;由于奶嘴屬于涉及嬰兒安全的產(chǎn)品,未購買者的評論更不受信任,因而是否購買的權重極低。
綜上所述,“有幫助”投票數(shù)和是否為“vine”用戶對評論重要性的影響最大。故新產(chǎn)品上市后應著重追蹤“有幫助”投票數(shù)較多和“vine”用戶的評論。
3.1.2 新指標提取
(1)即時聲譽與累積聲譽。評論情緒在整個產(chǎn)品的銷售周期中會不斷發(fā)生變化,僅考慮給定條件及上述研究指標得出的結果是不全面的。因此,筆者定義了t時刻的即時聲譽Reputation(t)和累積聲譽Reputation*(t):
(6)
其中,Score(t)為t時刻產(chǎn)品評論的即時綜合評分。
對收集到的評論數(shù)據(jù)求解即時聲譽和累計聲譽,發(fā)現(xiàn)整體上產(chǎn)品的即時聲譽波動較大,而累計聲譽變化相對穩(wěn)定。對于優(yōu)質產(chǎn)品,其即時聲譽波動范圍小,累積聲譽幾乎呈線性增長;對于劣質產(chǎn)品,因不合格率較高,購得良品與劣品的可能性都顯著存在,即時聲譽的波動極大,累積聲譽上升速度較慢。
(2)成功水平。為進一步提出綜合考量產(chǎn)品狀況的指標,將產(chǎn)品評論綜合評分與累計銷量進行組合,作為衡量產(chǎn)品是否成功的標準,定義t時刻的成功水平Success(t)為:
Success(t)=Score(t)×Sale(t)
(7)
其中,Sale(t)為產(chǎn)品在t時刻的累計銷量。
對收集到的評論數(shù)據(jù)求解成功水平,發(fā)現(xiàn)優(yōu)質產(chǎn)品的成功水平曲線總體穩(wěn)中有進,且存在較多的激增段,即擁有更多的聲譽和銷量急劇增長的機會;而弱勢產(chǎn)品的成功機會很少,即時聲譽或銷量稍有增長很快又會跌落至初值附近。
為發(fā)掘產(chǎn)品的未來發(fā)展狀態(tài),初步預測產(chǎn)品潛在成功的可能性,對成功水平曲線峰值附近的數(shù)據(jù)進行挖掘。以優(yōu)質產(chǎn)品B00132ZG3U為例,其80個月內的成功水平如圖1所示,可以看出在第50個月成功水平出現(xiàn)了較高峰值。筆者將分別考慮星級和評語暗示與潛在成功的關系。
圖1 80個月內產(chǎn)品B00132ZG3U的成功水平
圖2 80個月內產(chǎn)品B00132ZG3U的累計星級
(1)星級與潛在成功的關系。產(chǎn)品B00132ZG3U的第一條評論后80個月內累計星級的變化如圖2所示,由圖2可以看出累積星級一直處于穩(wěn)步上升的狀態(tài),沒有可以反映有效信息的顯著變化,無法將其用于預測產(chǎn)品的潛在成功可能性。
(2)評語暗示與潛在成功的關系。統(tǒng)計產(chǎn)品B00132ZG3U第一條評論后0~40月、40~50 月評論中各單詞詞頻,繪制直方圖,如圖3所示。
圖3 產(chǎn)品B00132ZG3U的評論詞頻
由圖3(a)可以看出,部分包含積極情感的單詞雖有較高的詞頻,但與包含不確定性或中性含義單詞的詞頻無明顯差異,如“好”與“產(chǎn)品”的詞頻相近,“將會”的詞頻比圖3(b)中高,“喜歡”的詞頻比圖3(b)中低。不同單詞的詞頻分布更均勻,情感積極的單詞并未展現(xiàn)出顯著的高詞頻狀態(tài)。這說明長期時間以后的成功更不容易通過評論內容的詞頻狀況得到,穩(wěn)定性與可靠性相較于短期成功均相對減弱。
由圖3(b)可以看出,在成功水平峰值前的短期時間內,“喜歡”“好”等單詞的詞頻最高,此類單詞為情感較溫和的、積極的動詞或形容詞。而“愛”“極好的”等包含強烈情感的積極單詞,相較于情感溫和的單詞詞頻較低。這可能是由于當包含強烈情感的積極單詞出現(xiàn)時,往往意味著成功水平已經(jīng)到達了峰值點。因此,情感較溫和的、積極的單詞有較大的可能預示短期內潛在成功的可能性。
3.3.1 過去星級的影響
相關研究顯示,過去星級狀況會給后續(xù)客戶的評論產(chǎn)生積極或消極的心理暗示??紤]到瀏覽網(wǎng)站時的實際狀況,客戶在查看星級時容易看到一定時間內的星級狀況,同時“vine”用戶和“有幫助”投票數(shù)較多的評價星級更容易被客戶看到。因此,筆者選取t時刻前一周內評級狀況的加權平均值來表示過去星級的影響,記為star_past(t)。
(8)
式中:zk1、zk3、RAk分別為第k條評論的“有幫助”投票數(shù)、是否為“vine”用戶和星級標準化處理后的值;ω1、ω3為采用熵權法計算得到的權重;nt為t時刻前一周內的總評論數(shù)。
3.3.2 基于斷點回歸的因果分析
斷點回歸[12]是僅次于隨機實驗的一種經(jīng)驗方法,可以利用現(xiàn)實約束條件有效地分析變量間因果關系,其主要原理為:當一個變量大于某個臨界值時,處置效應被接受,否則不接受處置效應。斷點回歸包括確定型和模糊型兩類,確定型斷點回歸有確定的臨界值,而模糊型斷點回歸,臨界值附近的觀測值以單調隨機的概率接受處置效應。
筆者采用確定型斷點回歸,對過去星級與后續(xù)評論之間的因果關系進行分析。將過去星級與后續(xù)評論分別記為x,y,設斷點為常數(shù)c,則分組規(guī)則和斷點回歸方程分別為:
(9)
y=α+β(x-c)+δD+γ(x-c)D+ε
(10)
選取3類商品中銷量較高的產(chǎn)品(吹風機產(chǎn)品B003V264WW、微波爐產(chǎn)品B0052G14E8、奶嘴產(chǎn)品B0045I6IAY)進行分析,確定過去星級的斷點c=0.5,斷點回歸的結果如圖4所示,求得δ的估計值分別為0.148 0,0.059 2,0.095 9,可以看出過去星級與后續(xù)評論之間存在顯著的因果關系。
圖4 3種產(chǎn)品的斷點回歸結果
3.4.1 情感程度分的定義
考慮評論中出現(xiàn)的如“enthusiastic”、“ disappointed”等情緒特征詞,筆者對情緒特征詞與星級之間的相關性進行研究,以期為企業(yè)有效提高商品星級提供幫助。選擇Github平臺中的情緒詞典,挑選出其中表達情緒的12個詞語,分別對其情感程度進行分級,如表5所示。
表5 情緒特征詞情感程度表
在產(chǎn)品評論中進行情緒特征詞的篩選,將情緒特征詞的情感程度分進行疊加,便可得到該條評論的特征詞情緒水平。
3.4.2 相關性分析
采用斯皮爾曼相關系數(shù)對已求得的特征詞情緒水平與星級進行相關分析。
(11)
式中:ρ為斯皮爾曼相關系數(shù);h為同一位置兩個變量由大到小排列的秩次差;np為評論的樣本容量。
以吹風機產(chǎn)品B000R80ZTQ、奶嘴產(chǎn)品B0045I6IA4、微波爐產(chǎn)品B0058CLNBU為例,采用SPSS軟件,對特征詞情緒水平與星級的相關性進行分析,結果如表6所示,可以看出吹風機產(chǎn)品B000R80ZTQ的特征詞情緒水平與星級在0.05水平下顯著相關,而奶嘴產(chǎn)品B0045I6IA4和微波爐產(chǎn)品B0058CLNBU的特征詞情緒水平與星級在0.05水平下不具有相關性。
表6 特征詞情緒水平與星級相關性
為進一步分析上述結果產(chǎn)生的原因,更直觀地判斷情緒特征詞與星級之間的相關性,筆者基于上述3個產(chǎn)品的不同特征,分別繪制評論情緒特征詞與星級的散點圖,如圖5所示。
圖5 評論情緒特征詞與星級的散點圖
(1)評價適中的產(chǎn)品。吹風機產(chǎn)品B000R80ZTQ的綜合評分適中,各類評論比例較為均勻,因此散點圖呈現(xiàn)出平行四邊形。情緒水平較低的客戶會打出低星,情緒水平較高的客戶會打出高星,較多數(shù)據(jù)集中在情緒水平與星級均居中的位置,可以直觀地看出情緒特征詞與星級呈近似的正相關關系。
(2)評價較好的產(chǎn)品。奶嘴產(chǎn)品 B0045I6IA4的散點圖呈現(xiàn)出倒三角形。這是由于該奶嘴產(chǎn)品的綜合評分較高,客戶情緒水平較低且星級較低的狀況較少,因此其散點圖左下角相較于平行四邊形存在一定缺失,導致了斯皮爾曼相關系數(shù)較低。但在未缺失部分中,除星級與特征詞情緒水平均較高處的散點較多外,整體散點分布與圖5(a)相近,表明了情緒特征詞與星級的近似正相關關系。
(3)評價較差的產(chǎn)品。微波爐產(chǎn)品B0058CLNBU的散點圖呈現(xiàn)出正三角形。這是由于該微波爐產(chǎn)品的綜合評分較低,客戶情緒水平較高且星級較高的狀況較少,因此散點圖右上角相較于平行四邊形存在一定的缺失,導致了斯皮爾曼相關系數(shù)較低。但在未缺失部分中,雖散點數(shù)較少,但整體散點分布與圖5(a)中相近,表明了情緒特征詞與星級的近似正相關關系。
(1)筆者對亞馬遜網(wǎng)站提供的產(chǎn)品評論數(shù)據(jù)進行分析,建立了模糊綜合評價模型,得出了可以代表商品評論狀況的綜合評分?;谠摼C合評價模型的參數(shù)與結果,指出新產(chǎn)品上市后應著重追蹤“有幫助”投票數(shù)較多和“vine”用戶的評論。定義即時聲譽、累計聲譽,提出了成功水平作為不同商品潛在成功的衡量標準,并研究了評語暗示作為預測產(chǎn)品成功與否指標的可行性,發(fā)現(xiàn)“喜歡”“好”等褒義詞以較高頻率出現(xiàn)時,將在短期內顯著提高商品成功的可能性,但長期預測效果穩(wěn)定性較差。此外,通過斷點回歸和相關性分析發(fā)現(xiàn),過去星級與后續(xù)評價存在顯著的因果關系,情緒特征詞與商品星級有顯著的相關關系。
(2)根據(jù)上述結果,筆者提出如下建議:①新產(chǎn)品上市后,應重點關注“有幫助”投票數(shù)較多和“vine”用戶的評論,基于評論內容對相應的產(chǎn)品設計問題進行有針對性的改進。②關注即時聲譽、累計聲譽與成功水平的變化,當即時聲譽的波動較大、累積聲譽上升速度較慢時,表明該產(chǎn)品亟待改進,應加強質量管理,降低次品率,放大產(chǎn)品優(yōu)勢點,優(yōu)化產(chǎn)品設計與功效,合理定位目標客戶,適當調整產(chǎn)品價格。③當評論中情感較溫和的積極情緒詞頻繁出現(xiàn)時,表明該產(chǎn)品有較大的成功可能性,可適當加大產(chǎn)品的生產(chǎn)與宣傳投入。④過去星級狀況較好或較差時,應根據(jù)后續(xù)評價對商品評估結果進行適當調整,避免過分高估或低估,同時基于該因果關系對客戶評論進行積極的引導。⑤考慮情緒特征詞與商品星級之間的相關性,在提高商品星級的規(guī)劃中,應關注消費者情緒的變化,適當加大廣告設計投入,加強服務環(huán)節(jié)的質量把控,提高服務意識。
(3)筆者的研究為線上商品評論信息提取與分析提供了方法指導,以評分結果與客觀指標呈現(xiàn)商品的評論狀況,避免了分析的主觀性。通過對各項指標間關系的分析,可為企業(yè)有針對性地完善管理與決策提供理論依據(jù),提高優(yōu)化效率。