【摘 要】本文提出一種基于商品評論的顧客滿意度指標(biāo)體系構(gòu)建方法,通過對網(wǎng)購顧客的評論文本的標(biāo)注和挖掘,抽取指稱關(guān)鍵詞和描述關(guān)鍵詞,將其提煉為網(wǎng)購顧客滿意度指標(biāo)體系,并利用中文信息處理相關(guān)技術(shù),對各指標(biāo)進(jìn)行了詞頻統(tǒng)計,分析了各指標(biāo)在顧客關(guān)注程度和使用方面的一些特點(diǎn)。本文的研究為電子商務(wù)運(yùn)營活動提高產(chǎn)品質(zhì)量和服務(wù)水平提供決策依據(jù),也為商品評論特征、觀點(diǎn)和情感傾向等內(nèi)容挖掘研究提供基礎(chǔ)資源。
【關(guān)鍵詞】網(wǎng)絡(luò)購物;顧客滿意度;評價
1.引言
隨著電子商務(wù)發(fā)展的日益成熟,關(guān)于網(wǎng)上購物顧客滿意度的評價逐漸成為衡量產(chǎn)品質(zhì)量和服務(wù)水平的一個重要途經(jīng)。無論是產(chǎn)品生產(chǎn)企業(yè)、電子商務(wù)運(yùn)營商還是物流企業(yè),都希望了解到顧客購物的真實感受,從而有的放矢地改善其生產(chǎn)方式及服務(wù),以增強(qiáng)其市場競爭力。
筆者認(rèn)為顧客網(wǎng)購體驗與其所購買的產(chǎn)品本身的屬性是密不可分的,要想全面、深入地反映其心理評價,商品評論是最能體現(xiàn)這一要求的。通過對網(wǎng)購顧客的評論文本的標(biāo)注和挖掘,構(gòu)建網(wǎng)購顧客滿意度指標(biāo)體系,分析各指標(biāo)在顧客關(guān)注程度和使用方面的一些特點(diǎn),以更加全面、更加具體地反映顧客購物的心理體驗。
2.基于商品評論的顧客滿意度指標(biāo)體系構(gòu)建
2.1 研究對象的選取
本文選取部分手機(jī)產(chǎn)品作為研究對象,所構(gòu)建的滿意度指標(biāo)體系既涵蓋適用于通用領(lǐng)域的屬性,也有針對手機(jī)產(chǎn)品的具體特征。
2.2 數(shù)據(jù)來源及處理
2.2.1 數(shù)據(jù)來源
本文數(shù)據(jù)來源于京東商城網(wǎng)站,選取部分手機(jī)類商品,收集其中的商品評論語句。京東商城的每一條評論信息均包含優(yōu)點(diǎn)、缺點(diǎn)和心得三部分,全部作為本文的數(shù)據(jù)收集對象。本文數(shù)據(jù)收集的起點(diǎn)是2013年1月31日,向前截取滿足一定數(shù)量的評論語句。使用C#語言編寫爬蟲軟件,共抓取評論數(shù)據(jù)60,600條,既包含部分銷量高的商品,又包含部分銷量居中的商品,以避免優(yōu)點(diǎn)和缺點(diǎn)描述的不平衡。
2.2.2 數(shù)據(jù)處理
本文通過采用部分?jǐn)?shù)據(jù)對網(wǎng)購顧客的評論文本的標(biāo)注和挖掘,抽取出相應(yīng)的指稱關(guān)鍵詞和描述關(guān)鍵詞,將其提煉為網(wǎng)購顧客滿意度指標(biāo)體系。利用中文信息處理相關(guān)技術(shù),針對大量數(shù)據(jù)對各指標(biāo)進(jìn)行詞頻統(tǒng)計,驗證網(wǎng)購顧客滿意度指標(biāo)體系的準(zhǔn)確性,及分析各指標(biāo)在顧客關(guān)注程度和使用方面的一些特點(diǎn)。通過分析顧客對各指標(biāo)的關(guān)注程度,預(yù)測產(chǎn)品將來的技術(shù)攻關(guān)方向和競爭要素,以使企業(yè)準(zhǔn)確定位顧客關(guān)注焦點(diǎn),推出深受顧客滿意的產(chǎn)品,進(jìn)而增強(qiáng)企業(yè)的競爭能力。本文數(shù)據(jù)來源中有600條采用人工分析,抽取出相關(guān)的特征及描述,構(gòu)建顧客滿意度指標(biāo)體系,另60,000條采用中文信息處理工具進(jìn)行統(tǒng)計,將統(tǒng)計結(jié)果用于對指標(biāo)體系的量化分析。具體所選的產(chǎn)品及評論條數(shù)見表1。
2.3 網(wǎng)購顧客滿意度指標(biāo)體系的構(gòu)建
2.3.1 商品評論特征抽取
筆者對600條手機(jī)商品評論進(jìn)行了人工標(biāo)注,標(biāo)注內(nèi)容包括指稱關(guān)鍵詞和描述關(guān)鍵詞,從這些關(guān)鍵詞中提煉出評價指標(biāo)。提煉的原則如下:
(1)剔除關(guān)于表示商品型號和商品品牌的名詞,如“N70”,“諾基亞”。
(2)剔除一些常見的口語化的名詞,如“機(jī)子”,“東西”。
(3)剔除一些常見的人稱名詞,如“朋友”,“老人”。
(4)合并同義詞和表示同一類所指對象的詞語。
據(jù)此得出所得評價指標(biāo)及其描述詞,受篇幅所限,這里僅列出部分,見表2。
圖1 網(wǎng)購顧客滿意度指標(biāo)層級體系
從手機(jī)商品評論抽取結(jié)果中可以發(fā)現(xiàn),指稱詞、描述詞集合與評價指標(biāo)并不是一一對應(yīng)的,存在一些詞語對應(yīng)多個指標(biāo)的情況,這是因為有些語義內(nèi)容并不是由詞一級語言單位表達(dá)的,而是由短語或句子整體表示的,需要結(jié)合上下文信息才能確定這些詞語的所指。
2.3.2 指標(biāo)體系的生成
筆者基于手機(jī)商品評論抽取結(jié)果的評價指標(biāo),通過整理、歸納,構(gòu)建網(wǎng)購顧客滿意度指標(biāo)層級體系。第一層為顧客網(wǎng)購滿意度;第二層分為網(wǎng)站滿意度、產(chǎn)品滿意度、物流滿意度、售后服務(wù)滿意度,同時,借鑒Lee(2001)[1]的研究成果,增加了交易安全滿意度指標(biāo);第三層及以下是對這些指標(biāo)的細(xì)分類,共19個指標(biāo),其中有17項是對各類商品通用的,另外兩項產(chǎn)品性能和產(chǎn)品外觀,其下層分類指標(biāo)是僅針對手機(jī)類商品的,見圖1。
2.4 商品評論詞頻分析
本文對自動抓取的京東商城諾基亞(NOKIA)
N1280 GSM手機(jī)(黑)和華為U8860兩類手機(jī)的6萬條評論進(jìn)行詞頻統(tǒng)計,對本文給出的顧客滿意度指標(biāo)體系進(jìn)行檢驗和量化分析。詞頻分析采用山西大學(xué)開發(fā)的中文分詞工具FC2000[2],共獲得24.4萬詞。首先對詞表進(jìn)行預(yù)處理,去掉語料中的句子“暫時沒有缺點(diǎn)”,因為該句是京東網(wǎng)用戶評論撰寫頁面關(guān)于商品缺點(diǎn)部分給出的默認(rèn)評價,相當(dāng)多的用戶直接使用該句作為缺點(diǎn)評價的內(nèi)容,導(dǎo)致其頻率過高,而又不含有價值;其次,根據(jù)停用詞表[3],去掉高頻詞中出現(xiàn)的停用詞;再去掉高頻詞中的動詞,如“幫”,“說”,“算”,“看”等;去掉程度副詞,如“很”,“挺”,“非常”等;去掉常見的人稱名詞,如“朋友”,“老人”等;最后,截取詞頻超過100次的詞匯,共235個。將這些高頻詞與圖4中的指標(biāo)進(jìn)行匹配,對于一個詞對應(yīng)多個指標(biāo)的情況,如“滿意”對應(yīng)總體滿意度、網(wǎng)站滿意度和產(chǎn)品滿意度三個指標(biāo),暫將其次數(shù)平均分配給各指標(biāo);對于一個指標(biāo)對應(yīng)多個詞的情況,取每個詞次數(shù)的和,統(tǒng)計結(jié)果見表3。
從表3中可以看出,本文給出的網(wǎng)購顧客滿意度指標(biāo)體系54個指標(biāo)中有43個指標(biāo)有相應(yīng)高頻詞與之對應(yīng),占指標(biāo)總數(shù)的80%,證明這些指標(biāo)是顧客經(jīng)常評論的內(nèi)容,的確是顧客關(guān)心的問題。11個沒有相應(yīng)詞匯的指標(biāo)分別是頁面布局、頁面反應(yīng)速度、網(wǎng)站信息質(zhì)量、產(chǎn)品價格、物流滿意度、配送方式、交易安全滿意度(及下屬3個指標(biāo))和個性化服務(wù)。其中,產(chǎn)品價格(二級指標(biāo))和物流滿意度(一級指標(biāo))是上層指標(biāo),其下位指標(biāo)對應(yīng)有具體的詞匯,且詞頻較高,因此實際上用戶評論是涵蓋這方面信息的;網(wǎng)站信息質(zhì)量和配送方式兩個指標(biāo)屬于低頻詞匯對應(yīng)的指標(biāo),在表3高頻詞匯中沒有出現(xiàn);而個性化服務(wù)指標(biāo)在顧客評論中不是用詞表述的,是用短語或句子表達(dá)的,如“還附贈了一次性的貼紙章,用來給保修卡蓋章的”,因此就詞匯層面的分析來說看不到這方面信息;頁面布局、頁面反應(yīng)速度及交易安全滿意度(及下屬3個指標(biāo))指標(biāo)在顧客評論高頻詞中沒有出現(xiàn),從一定程度上說明這些方面對于當(dāng)前電子商務(wù)的技術(shù)和服務(wù)發(fā)展水平來說,已經(jīng)能夠滿足用戶需求,不需要過多探討。
圖2 三級以上指標(biāo)詞頻排序圖
從圖2中可見,詞頻超過1萬次的指標(biāo)為顧客總體滿意度、產(chǎn)品滿意度、定價、產(chǎn)品信譽(yù)度、手感、(手機(jī))實用性,說明了顧客在網(wǎng)購過程中最關(guān)注的仍然是產(chǎn)品本身的性能、質(zhì)量和價格因素。詞頻在5000到1萬之間的兩個指標(biāo)為易操作性和產(chǎn)品外觀,說明用戶對手機(jī)的這兩方面性能關(guān)注度較高。值得注意的是,表3中有兩個四級指標(biāo)詞頻超過9000次,即音效和待機(jī)時間。說明對于手機(jī)類產(chǎn)品來說,音效是首要引起用戶關(guān)注的問題之一,而待機(jī)時間短恰是當(dāng)前智能機(jī)普遍存在的缺陷,這兩個指標(biāo)的高頻出現(xiàn),也給手機(jī)制造商以一定的啟示。三級指標(biāo)中排在后三位的是真?zhèn)?、硬件配置和重量。用戶對于商品的真?zhèn)侮P(guān)注度比較低,說明目前網(wǎng)購顧客對京東商城這樣的大型B2C購物平臺的信賴程度較高。用戶對硬件配置和重量關(guān)注度低,說明對于當(dāng)前的手機(jī)類產(chǎn)品來說,硬件方面已經(jīng)不是主要的技術(shù)攻關(guān)方向和競爭要素,而與外觀設(shè)計、特色服務(wù)等有關(guān)的指標(biāo)則更重要一些。
3.結(jié)語
本文通過對網(wǎng)購顧客的評論文本的標(biāo)注和挖掘,構(gòu)建了網(wǎng)購顧客滿意度指標(biāo)體系,并通過詞頻統(tǒng)計,分析了各指標(biāo)在顧客關(guān)注程度和使用方面的一些特點(diǎn)。對比目前存在的一些網(wǎng)購顧客滿意度指標(biāo)體系,本文提出的指標(biāo)體系層級和指標(biāo)數(shù)量多,使得體系的語義深度大大加強(qiáng),在反映顧客購物的心理體驗方面更加全面和具體。由于本文在滿意度指標(biāo)體系的構(gòu)建方法上主要基于商品評論的關(guān)鍵詞抽取,使得每一個指標(biāo)有確定詞匯集合與之對應(yīng),該成果可以為商品評論文本挖掘方面的研究提供基礎(chǔ)資源,利用詞表進(jìn)行特征、觀點(diǎn)抽取和情感傾向方面的研究,這也是本文下一步研究的方向。
參考文獻(xiàn):
[1]Lee.Comprehensive Model of Internet Consumer Satisfaction[J].HongKong:City University of Hong Kong,2001:207-210.
[2]劉開瑛.中文文本自動分詞和標(biāo)注[M].北京:商務(wù)印書館,2000:23-45.
[3]熊文新,宋柔.信息檢索用戶查詢語句的停用詞過濾[J].計算機(jī)工程,2007(6):195-197.
基金項目:本文系教育部人文社會科學(xué)研究規(guī)劃基金項目“面向精確語言理解的中文介詞短語語義角色識別技術(shù)研究”(項目編號:12YJA740095)的研究成果之一。