冒小棟, 范 濤
(華東交通大學(xué) 經(jīng)濟(jì)管理學(xué)院, 南昌 330013)
近年來(lái), 網(wǎng)絡(luò)口碑以用戶評(píng)論真實(shí)客觀的優(yōu)點(diǎn)逐漸替代了傳統(tǒng)的口碑. 相比于通過(guò)線下調(diào)研方法獲取消費(fèi)者對(duì)產(chǎn)品的態(tài)度, 網(wǎng)絡(luò)口碑能夠幫助企業(yè)在更短時(shí)間內(nèi)以更低成本獲取到目標(biāo)消費(fèi)群體的反饋信息.隨著互聯(lián)網(wǎng)經(jīng)濟(jì)的迅猛發(fā)展, 滴滴等網(wǎng)約車平臺(tái)解決了人們打車難的問(wèn)題, 共享單車無(wú)樁車的出現(xiàn)有效地解決了“最后一公里”難題. 共享單車是共享經(jīng)濟(jì)的模式創(chuàng)新, 它正處于“青春期”, 仍然面臨著眾多挑戰(zhàn). 通過(guò)網(wǎng)絡(luò)口碑研究共享單車用戶滿意度, 有助于把握用戶真實(shí)和潛在的需求及期望, 并為改進(jìn)單車的服務(wù)水平提供依據(jù).
目前, 對(duì)于網(wǎng)絡(luò)口碑的研究, 李剛等學(xué)者利用依存句法分析設(shè)計(jì)情感標(biāo)簽抽取模型, 通過(guò)情感極性對(duì)情感標(biāo)簽進(jìn)行過(guò)濾, 獲得具有較高的抽取準(zhǔn)確率和召回率的情感標(biāo)簽抽取方法[1]. 魏慧玲通過(guò)構(gòu)建情感詞典,并結(jié)合語(yǔ)義相似度算法, 對(duì)小米手機(jī)的在線評(píng)論進(jìn)行情感分類, 實(shí)現(xiàn)對(duì)人工匯總的主要商品特征的情感判斷[2]. 徐勇等人借鑒相關(guān)學(xué)者的研究結(jié)果, 建立電子商務(wù)商品評(píng)價(jià)指標(biāo)結(jié)構(gòu)模型; 通過(guò)機(jī)器學(xué)習(xí), 利用文本情感分析中語(yǔ)句情感標(biāo)簽抽取與標(biāo)注的方法, 對(duì)淘寶網(wǎng)站商品進(jìn)行模糊綜合評(píng)價(jià)[3]. 吳江等學(xué)者采用LDA模型對(duì)小米、華為和Fitbit智能手環(huán)在線評(píng)論的主題進(jìn)行挖掘, 了解用戶對(duì)不同品牌的關(guān)注點(diǎn); 通過(guò)對(duì)網(wǎng)站上三種品牌智能手環(huán)的評(píng)論分值進(jìn)行獨(dú)立樣本t檢驗(yàn)來(lái)比較三種品牌智能手環(huán)的用戶滿意度[4]. 李勇敢等學(xué)者基于依存句法和無(wú)監(jiān)督主題情感模型設(shè)計(jì)出一個(gè)可自動(dòng)批處理中文微博信息的情感分析系統(tǒng), 并且驗(yàn)證該方法具有準(zhǔn)確率高、自動(dòng)化程度高、系統(tǒng)效率高的優(yōu)點(diǎn)[5]. 對(duì)于共享單車的研究, 譚袁學(xué)者提出了共享單車的各種違規(guī)現(xiàn)象與運(yùn)營(yíng)商之間的“底線競(jìng)爭(zhēng)”有直接的關(guān)系, 并要求運(yùn)營(yíng)商制定自律性規(guī)范并嚴(yán)格執(zhí)行來(lái)解決該問(wèn)題[6]. 黃國(guó)清, 陳雪兩位學(xué)者將UTAUT模型與情景感知理論相結(jié)合, 通過(guò)問(wèn)卷調(diào)查的方式, 探究共享單車用戶使用意愿的影響因素[7].
查閱相關(guān)文獻(xiàn), 發(fā)現(xiàn)鮮少有學(xué)者通過(guò)網(wǎng)絡(luò)口碑研究用戶滿意度, 利用LDA模型和文本情感分析相結(jié)合對(duì)用戶滿意度進(jìn)行模糊綜合評(píng)價(jià)的文獻(xiàn)更少. “摩拜”單車為目前較受歡迎的共享單車. 因此, 本文基于LDA模型構(gòu)建“摩拜”共享單車用戶滿意度結(jié)構(gòu)模型, 設(shè)計(jì)情感標(biāo)簽抽取算法, 利用HowNet情感詞典和語(yǔ)義相似度算法判斷評(píng)價(jià)對(duì)象的情感傾向, 并利用模糊綜合評(píng)價(jià)法探究“摩拜”單車的用戶滿意度.
圖1 探索共享單車用戶滿意度流程圖
本文以“摩拜”單車評(píng)論為研究對(duì)象, 從360手機(jī)助手、應(yīng)用寶以及華為手機(jī)助手三個(gè)網(wǎng)站上利用網(wǎng)絡(luò)爬蟲(chóng)獲取“摩拜”單車2017年8月至9月共23 306條評(píng)論數(shù)據(jù). 為了保證數(shù)據(jù)的有效性, 除去包含特殊符號(hào)、英文字符、與評(píng)論無(wú)關(guān)以及重復(fù)的數(shù)據(jù). 通過(guò)對(duì)清洗后的評(píng)論數(shù)據(jù)進(jìn)行觀察分析, 利用“摩拜”評(píng)論中出現(xiàn)的專屬詞匯及新型詞匯構(gòu)建用戶詞典, 然后進(jìn)行jiebeR中文分詞及詞性標(biāo)注, 進(jìn)而建立“摩拜”單車用戶滿意度的網(wǎng)絡(luò)評(píng)論語(yǔ)料庫(kù).
本文用LDA模型對(duì)網(wǎng)絡(luò)評(píng)論語(yǔ)料庫(kù)中的文本數(shù)據(jù)進(jìn)行挖掘, 識(shí)別出文本數(shù)據(jù)中蘊(yùn)含的共同主題信息,建立共享單車用戶滿意度結(jié)構(gòu)模型. LDA是一種無(wú)監(jiān)督的文檔主題生成模型, 用來(lái)識(shí)別大規(guī)模文檔的潛在主題信息. LDA模型可視為一個(gè)三層貝葉斯概率模型,將每一篇文檔表示為一個(gè)主題的概率分布, 又將每一個(gè)主題表示為一個(gè)詞語(yǔ)的概率分布, 形成文檔-主題-詞語(yǔ)三層概率分布, 即:
文檔主題分布P(topic|document), 指不同主題在同一個(gè)文檔中所占比重. 文檔詞語(yǔ)分布P(word|topic), 指每個(gè)主題中不同詞語(yǔ)出現(xiàn)的概率. 文檔詞語(yǔ)分布P(word|document),指每個(gè)文檔中不同詞語(yǔ)出現(xiàn)的概率.在計(jì)算LDA模型的相關(guān)分布時(shí), 我們需要剔除網(wǎng)絡(luò)評(píng)論語(yǔ)料庫(kù)中的停用詞. 在應(yīng)用LDA模型時(shí), 需要確定三個(gè)參數(shù): 主題數(shù)量K, 超參數(shù)α和β. 我們通過(guò)計(jì)算困惑度及多次實(shí)驗(yàn)對(duì)比, 最終設(shè)定K=16,α=0.1,β=0.05,循環(huán)迭代次數(shù)為5000次, LDAvis可視化展示見(jiàn)圖2.圖中的參數(shù)λ用來(lái)調(diào)整詞語(yǔ)與主題之間的相關(guān)性, 如果λ越接近1, 則會(huì)顯示在該主題下出現(xiàn)最頻繁的詞語(yǔ), 可通過(guò)這種方式了解該主題下用戶討論的熱點(diǎn)詞匯; 如果λ越接近0, 那么結(jié)果中會(huì)顯示在該主題下更特殊、更獨(dú)有的詞語(yǔ), 則可以了解到該主題下區(qū)別于其他主題的獨(dú)有詞語(yǔ). 本文設(shè)置λ=0, 顯示主題下更獨(dú)有的特殊詞語(yǔ), 更好地體現(xiàn)主題之間的差異.
圖2 LDA模型挖掘文本主題
文本情感分析, 就是對(duì)產(chǎn)品評(píng)論中的文本數(shù)據(jù)進(jìn)行挖掘, 識(shí)別出消費(fèi)者對(duì)評(píng)論信息的觀點(diǎn)、喜惡、情感等. 情感標(biāo)簽抽取的任務(wù)就是識(shí)別產(chǎn)品網(wǎng)絡(luò)評(píng)論語(yǔ)句中意見(jiàn)持有者對(duì)于一個(gè)或多個(gè)評(píng)論對(duì)象的具體評(píng)價(jià),并將其按照對(duì)應(yīng)的關(guān)系細(xì)粒度地抽取出來(lái)[2]. 情感標(biāo)簽由評(píng)價(jià)對(duì)象、程度副詞、否定詞和情感詞組成. 情感標(biāo)簽的抽取規(guī)則如下:
規(guī)則一. 通過(guò)依存句法分析抽取產(chǎn)品評(píng)論語(yǔ)句中的評(píng)價(jià)對(duì)象詞及情感詞. 依存句法分析能夠識(shí)別句子中各單位成分之間的修飾關(guān)系. 從生成的句法依賴關(guān)系樹(shù), 篩選出符合條件的修飾關(guān)系[3], 并依據(jù)評(píng)價(jià)對(duì)象與情感詞抽取規(guī)則(表1), 提取評(píng)價(jià)對(duì)象詞及相應(yīng)的情感詞.
表1 評(píng)價(jià)對(duì)象與情感詞抽取規(guī)則
規(guī)則二. 查找產(chǎn)品評(píng)價(jià)語(yǔ)句中依賴于情感詞的否定詞及程度副詞. 為了避免分詞時(shí)將部分情感詞中的否定詞與情感詞分開(kāi), 如可能將“不喜歡”分為“不”和“喜歡”, 導(dǎo)致情感發(fā)生錯(cuò)亂. 因此, 我們建立否定詞庫(kù)V, 依據(jù)否定詞抽取規(guī)則 (表2), 若存在否定詞修飾情感詞時(shí), 應(yīng)該給予“評(píng)價(jià)對(duì)象—情感詞”對(duì)否定標(biāo)記. 同時(shí),篩選出HowNet情感詞典程度集中類別為“極其、最”、“很”下的程度副詞, 建立程度副詞庫(kù)G, 依據(jù)程度副詞抽取規(guī)則(表2)判斷是否有程度副詞依存于情感詞, 并給予“評(píng)價(jià)對(duì)象—情感詞”對(duì)相應(yīng)的程度副詞標(biāo)記.
表2 否定詞與程度副詞抽取規(guī)則
按照規(guī)則一、規(guī)則二抽取出語(yǔ)句情感標(biāo)簽, 接下來(lái), 需要判斷用戶對(duì)評(píng)價(jià)對(duì)象的情感傾向值. 用戶對(duì)評(píng)價(jià)對(duì)象的情感傾向值由情感詞、程度副詞及否定詞三部分組成. 其中, 情感詞的分值采用HowNet情感詞典和基于同義詞林的詞語(yǔ)相似度算法[8]來(lái)判斷. 如果情感詞為褒義, 情感詞值為“1”; 如果情感詞為貶義, 它為“-1”. 當(dāng)存在程度副詞修飾情感詞時(shí), 用戶對(duì)評(píng)價(jià)對(duì)象的情感強(qiáng)度被加強(qiáng), 變?yōu)樵瓉?lái)的2倍. 若“評(píng)價(jià)對(duì)象—情感詞”對(duì)存在否定標(biāo)記, 用戶對(duì)評(píng)價(jià)對(duì)象的情感極性發(fā)生變化. 最后, 用戶對(duì)評(píng)價(jià)對(duì)象的情感傾向值有4 種可能, 分別為-2, -1, 1 和 2.
本文選取模糊綜合評(píng)價(jià)法來(lái)評(píng)價(jià)共享單車的用戶滿意度. 模糊綜合評(píng)價(jià)法是以模糊數(shù)學(xué)為基礎(chǔ), 應(yīng)用模糊關(guān)系合成的原理, 能夠?qū)⒍ㄐ栽u(píng)價(jià)定量化, 依據(jù)用戶對(duì)評(píng)價(jià)指標(biāo)滿意程度的隸屬度建立模糊評(píng)價(jià)矩陣, 結(jié)合層次分析法確定用戶的整體滿意度. 模糊綜合評(píng)價(jià)法的建模步驟如下:
(1)確定模糊綜合評(píng)價(jià)指標(biāo)體系. 在對(duì)LDA挖掘出的文本主題進(jìn)行命名時(shí), 我們發(fā)現(xiàn)主題間并不是完全獨(dú)立的, 存在多個(gè)主題描述單車特征不同方面的情況. 因此需要先對(duì)文本主題進(jìn)行歸納, 然后進(jìn)行主題命名, 建立共享單車用戶滿意度評(píng)價(jià)指標(biāo)體系, 如圖3. 其中, 用后心情描述了用戶在使用單車后的整體體驗(yàn), 不是針對(duì)具體的某個(gè)方面, 是整個(gè)使用過(guò)程的一種總結(jié)性感受; 單車押金反響包括用戶對(duì)使用共享單車所需交付的押金的金額、退還速度的反響情況; 軟件整體性能指用戶使用共享單車APP的整體感受, 涉及的情感標(biāo)簽如: “操作簡(jiǎn)單”, “界面流暢”, “軟件不錯(cuò)”等.
圖3 共享單車用戶滿意度結(jié)構(gòu)模型
(2)確定評(píng)語(yǔ)集. 在評(píng)價(jià)共享單車的用戶滿意度時(shí),將產(chǎn)品特征的情感傾向得分: “-2”、“-1”、“1”、“2”,與“很低”、“較低”、“較高”、“很高”4 個(gè)水平等級(jí)對(duì)應(yīng). 評(píng)語(yǔ)集可表示為:V={很低、較低、較高、很高}.
(3)確定評(píng)價(jià)指標(biāo)的權(quán)重. 共享單車用戶滿意度模糊綜合評(píng)價(jià)是基于多指標(biāo)、多層次的綜合性評(píng)價(jià), 是由10個(gè)指標(biāo)形成的評(píng)價(jià)體系. 綜合性評(píng)價(jià)最重要的環(huán)節(jié)就是決策每層的每一個(gè)指標(biāo)對(duì)共享單車用戶滿意度的影響程度, 并將各指標(biāo)的影響程度作為該指標(biāo)的權(quán)重.本文選擇層次分析法[9]確定各指標(biāo)的權(quán)重, 其步驟如下:
第一步: 構(gòu)建兩兩比較判斷矩陣. 層次分析法的計(jì)算基礎(chǔ)是兩兩比較判斷矩陣, 判斷矩陣體現(xiàn)了各指標(biāo)的相對(duì)重要程度, 對(duì)決策結(jié)果的影響至關(guān)重要. 本文決定采用共享單車用戶滿意度評(píng)價(jià)指標(biāo)體系中每個(gè)指標(biāo)提取的特征情感詞對(duì)數(shù)量, 作為構(gòu)建兩兩比較判斷矩陣的依據(jù).
第二步: 計(jì)算指標(biāo)權(quán)重及一致性檢驗(yàn). 首先, 計(jì)算兩兩比較判斷矩陣的最大特征根 λmax及其對(duì)應(yīng)的特征向量x=(x1,x2,···,xn)T, 對(duì)該特征向量進(jìn)行歸一化處理, 得到評(píng)價(jià)指標(biāo)的權(quán)重向量. 其中, 所有的兩兩判斷矩陣的CR值均接近于0<0.1, 說(shuō)明一致性檢驗(yàn)通過(guò).
(4)確定模糊評(píng)價(jià)矩陣
本文在確定模糊評(píng)價(jià)矩陣時(shí)選用模糊統(tǒng)計(jì)的方法,與其他學(xué)者選用主觀確定、比較法、專家法等方法來(lái)確定模糊評(píng)價(jià)矩陣相比, 這里提出的方法可以更好的反映客觀事實(shí). 采用模糊統(tǒng)計(jì)的方法, 若某指標(biāo)下的評(píng)價(jià)對(duì)象數(shù)為n, 該指標(biāo)隸屬于V中某等級(jí)評(píng)語(yǔ)的隸屬度:
隸屬度rm表示對(duì)于某個(gè)指標(biāo), 有1 0 0rm%的用戶將它評(píng)為m等級(jí). 最后, 依據(jù)隸屬度確定若干指標(biāo)對(duì)應(yīng)的模糊評(píng)價(jià)矩陣.
(5)共享單車用戶滿意度綜合評(píng)價(jià)值
在模糊評(píng)價(jià)矩陣和權(quán)重向量確定之后, 用模糊評(píng)價(jià)矩陣和權(quán)重向量進(jìn)行綜合, 即可得到“摩拜”單車用戶滿意度評(píng)價(jià)體系的準(zhǔn)則層和目標(biāo)層下各指標(biāo)的模糊評(píng)價(jià)矩陣. 假設(shè)準(zhǔn)則層下的各指標(biāo)的模糊評(píng)價(jià)矩陣為(i=1,2,3,4), 指標(biāo)層下的指標(biāo)權(quán)重向量為Wi(i=1,2,3,4),準(zhǔn)則層下各指標(biāo)的模糊評(píng)價(jià)矩陣為Ri(i=1,2,3,4). 其中,i表示準(zhǔn)則層的第i個(gè)指標(biāo);由準(zhǔn)則層下各指標(biāo)對(duì)應(yīng)的指標(biāo)層下各指標(biāo)的隸屬度組成. 本文的模糊算子均采用加權(quán)平均算子, 則假設(shè)“摩拜”單車用戶滿意度評(píng)價(jià)體系的目標(biāo)層的模糊評(píng)價(jià)矩陣為S.W代表準(zhǔn)則層下指標(biāo)的權(quán)重向量,R代表目標(biāo)層的模糊評(píng)價(jià)矩陣. 其中評(píng)價(jià)體系中指標(biāo)Aij的用戶滿意度為:指標(biāo)的得分為:; 單車用戶滿意度的綜合得分
對(duì)“摩拜”單車的用戶滿意度進(jìn)行實(shí)證分析. 首先,利用情感標(biāo)簽抽取算法識(shí)別產(chǎn)品網(wǎng)絡(luò)評(píng)論語(yǔ)料庫(kù)中的評(píng)價(jià)對(duì)象及其相對(duì)應(yīng)的程度副詞、否定詞和情感詞.將HoweNet情感詞典與語(yǔ)義相似度算法相結(jié)合, 判斷評(píng)價(jià)對(duì)象的情感傾向值. 然后, 將情感標(biāo)簽中的評(píng)價(jià)對(duì)象與“摩拜”用戶滿意度結(jié)構(gòu)模型的10個(gè)指標(biāo)對(duì)應(yīng)的關(guān)聯(lián)詞語(yǔ)進(jìn)行匹配并歸類, 對(duì)未成功歸并的詞語(yǔ)再進(jìn)行人工判斷. 接下來(lái), 結(jié)合用戶對(duì)評(píng)價(jià)對(duì)象的情感傾向,采用模糊綜合評(píng)價(jià)法對(duì)共享單車用戶滿意度進(jìn)行評(píng)價(jià).
(1)共享單車用戶滿意度評(píng)價(jià). “摩拜”單車的用戶滿意度綜合分值為0.6877. 其中, 用戶的整體體驗(yàn)、單車的性能、用戶使用單車的經(jīng)濟(jì)成本、摩拜公司的運(yùn)營(yíng)服務(wù)四個(gè)指標(biāo)的分值依次是1.1651、0.5791、0.5880和0.1062. 這里的整體體驗(yàn)不針對(duì)具體的某方面, 是用戶使用單車后的總結(jié)性感受. 從整體看, 四個(gè)指標(biāo)值都是正向的, 且用戶使用單車的整體體驗(yàn)分值最高, 表明用戶對(duì)“摩拜”單車總體較滿意. 具體表現(xiàn)為:
第一, 在單車性能方面, 單車硬件在10個(gè)指標(biāo)中的排名第二, 用戶滿意度較高. 這里的單車硬件主要指除車鎖外, 自行車的各個(gè)組成部件、騎行的舒適度、外觀及質(zhì)量. 然而, “摩拜”單車的車鎖得分接近于 0, 滿意度較差, 問(wèn)題主要集中在掃描二維碼時(shí)出現(xiàn)閃退, 開(kāi)鎖失敗等.
第二, 在經(jīng)濟(jì)成本方面, 單車費(fèi)用及優(yōu)惠指標(biāo)的滿意度較高, 表明對(duì)于消費(fèi)者來(lái)說(shuō), “摩拜”的使用費(fèi)用合理, 深受用戶的青睞. 但是消費(fèi)者對(duì)單車所需支付押金的反響不好, 支付押金多及不能及時(shí)退還致使用戶的滿意度較差.
第三, 在公司運(yùn)營(yíng)服務(wù)方面, 用戶的滿意度排名居后. 其中, 單車投放量、單車維修情況及軟件的定位三個(gè)指標(biāo)的得分值為負(fù), 表明“摩拜”公司仍應(yīng)注意用戶對(duì)單車的需求量, 加強(qiáng)工作人員對(duì)車輛的定期維護(hù)工作. 同時(shí), 公司要在APP上加大科技投入, 加強(qiáng)對(duì)GPS定位系統(tǒng)的維護(hù), 除去不存在定位系統(tǒng)的車型. 這里的單車維修情況主要體現(xiàn)在消費(fèi)者使用單車時(shí), 故障車出現(xiàn)的頻率; 客服對(duì)用戶的回應(yīng)指客服咨詢電話是否通暢及服務(wù)態(tài)度; 軟件整體性能指“摩拜”APP的操作流暢性以及軟件界面設(shè)計(jì).
圖4 用戶對(duì)“摩拜”單車各項(xiàng)指標(biāo)的滿意度
(2)結(jié)果可靠性的驗(yàn)證分析. 為了驗(yàn)證結(jié)果的可靠性, 本文對(duì)“摩拜”單車用戶滿意度結(jié)構(gòu)模型指標(biāo)層中表現(xiàn)突出的指標(biāo)進(jìn)行反查, 即分析10個(gè)指標(biāo)中分值較低和較高的指標(biāo)所對(duì)應(yīng)的具體評(píng)論內(nèi)容. 結(jié)果表明表現(xiàn)突出的指標(biāo)所對(duì)應(yīng)的評(píng)論內(nèi)容與滿意度結(jié)果一致.以“摩拜”單車硬件為例, 圖 5 中, 字?jǐn)?shù)越大, 說(shuō)明其出現(xiàn)的頻率越高. 從圖中可以看出, 從整體來(lái)看, 單車硬件指標(biāo)下的的評(píng)價(jià)對(duì)象情感傾向值大多為正向的, 且出現(xiàn)頻率較高的評(píng)價(jià)對(duì)象的情感得分值都為正, 得分為2的情感標(biāo)簽也比較多, 表明驗(yàn)證結(jié)果可以通過(guò).
圖5 “摩拜”單車硬件的情感標(biāo)簽及情感傾向值
網(wǎng)絡(luò)口碑保證了用戶評(píng)論的真實(shí)性和客觀性, 能夠幫助企業(yè)在更短時(shí)間內(nèi)以更低成本獲取到消費(fèi)群體的反饋信息, 通過(guò)網(wǎng)絡(luò)口碑來(lái)研究用戶滿意度為我們帶來(lái)了極大的便利. 本文將文本挖掘與模糊綜合評(píng)價(jià)法相結(jié)合來(lái)分析用戶滿意度, 這種方法同樣適合于其他領(lǐng)域基于網(wǎng)絡(luò)口碑的用戶滿意度研究. 針對(duì)本次研究, 提出以下幾方面的展望: ① 進(jìn)一步優(yōu)化分詞方案;② 進(jìn)一步完善共享單車用戶滿意度結(jié)構(gòu)模型, 適當(dāng)加入一些評(píng)論內(nèi)容之外的指標(biāo), 比如: 網(wǎng)絡(luò)評(píng)論的數(shù)量;③ 研究不同時(shí)間段的用戶滿意度, 并進(jìn)行顯著性分析來(lái)檢驗(yàn)它們之間的差異; ④ 將不同品牌共享單車的用戶滿意度進(jìn)行橫向比較研究, 以期各品牌能夠相互借鑒、取長(zhǎng)補(bǔ)短.