張書月
摘要:電商的興起逐步改變現(xiàn)代人購物的方式,目前,隨著電子商務(wù)市場的發(fā)展壯大,競爭壓力也逐漸變大,電商平臺以及商家都面臨極大的競爭壓力。對于電商而言,除了保障產(chǎn)品質(zhì)量外,如何精準(zhǔn)把握用戶的需求是影響自身發(fā)展的關(guān)鍵性因素,大數(shù)據(jù)技術(shù)的優(yōu)勢在于可以通過對海量用戶信息數(shù)據(jù)的挖掘分析,把握用戶的購物體驗以及實際需求,可以為調(diào)整和改進(jìn)營銷策略提供有價值的參考。本文簡要對數(shù)據(jù)挖掘技術(shù)及其優(yōu)勢進(jìn)行闡述,并具體探討數(shù)據(jù)挖掘技術(shù)在電商情感規(guī)律分析中的應(yīng)用。
關(guān)鍵詞:情感分析;電商;數(shù)據(jù)挖掘技術(shù);應(yīng)用
目前,我國的電商經(jīng)過最初的紅利期之后,基本進(jìn)入了平穩(wěn)發(fā)展的階段,這一階段由于電商平臺以及商家數(shù)量的增加,市場競爭更加激烈,稍有不慎就會被市場淘汰。電商平臺要獲得發(fā)展,其需要吸引更多的商家入駐以及用戶注冊;商家要獲取更高的利潤,則需要提高銷售量。而這些問題歸根結(jié)底是要如何準(zhǔn)確把握用戶的動向,只有了解用戶的需求才能實現(xiàn)精準(zhǔn)營銷,從而才能使電商平臺的用戶數(shù)量以及商家的盈利增加。要解決這一問題,就要求電商必須要充分利用獲取的數(shù)據(jù)資源,從中挖掘出有價值的信息,通過這些信息分析不同用戶的需求,從而為其提供更加優(yōu)質(zhì)的商品或者服務(wù)。
1 數(shù)據(jù)挖掘技術(shù)概述及優(yōu)勢分析
1.1 數(shù)據(jù)挖掘技術(shù)
數(shù)據(jù)挖掘技術(shù)本質(zhì)上是一種處理數(shù)據(jù)的技術(shù),是從海量、不完整的、隨機的以及模糊的數(shù)據(jù)當(dāng)中,提取出隱含的有價值的知識或者信息[1]。應(yīng)用數(shù)據(jù)挖掘技術(shù)需要根據(jù)數(shù)據(jù)信息的類型選擇合適挖掘技術(shù),其中比較常用的技術(shù)包括統(tǒng)計技術(shù)、遺傳算法、連接分析、給予歷史的分析、關(guān)聯(lián)規(guī)則、決策樹、回歸分析、概念描述、粗糙集、神經(jīng)網(wǎng)絡(luò)、概念描述以及模糊集等。
1.2 數(shù)據(jù)挖掘技術(shù)的優(yōu)勢分析
近年來,隨著信息產(chǎn)業(yè)的快速發(fā)展,所產(chǎn)生的數(shù)據(jù)資源呈指數(shù)增長,而要將這些數(shù)據(jù)資源轉(zhuǎn)化為有價值的知識或者信息,就需要使用某種工具對這些數(shù)據(jù)資源進(jìn)行識別與分析。數(shù)據(jù)挖掘技術(shù)就是一種利用多種數(shù)據(jù)分析工具在大量數(shù)據(jù)資源中識別有價值信息的技術(shù)手段,利用數(shù)據(jù)挖掘技術(shù)可以尋找出數(shù)據(jù)之間潛在的聯(lián)系,發(fā)掘出其中被忽略的因素,是現(xiàn)階段解決海量數(shù)據(jù)分析與處理問題的重要技術(shù)手段[2]。
電商平臺的用戶信息以及與之相關(guān)的數(shù)據(jù)是電商的主要數(shù)據(jù)來源,對于電商而言,用戶每天所產(chǎn)生的數(shù)據(jù)信息規(guī)模極為龐大,其中既包含對電商發(fā)展有價值的數(shù)據(jù)信息,也有無價值的數(shù)據(jù)信息,電商要留存這些數(shù)據(jù)資源需要付出較高的成本,如果無法有效識別這些數(shù)據(jù)信息當(dāng)中有價值的部分,無疑會大幅增加電商運營成本,對于電商長期發(fā)展不利[3]。
數(shù)據(jù)挖掘技術(shù)的優(yōu)勢在于可以通過對用戶的購買記錄、訪問時間、瀏覽記錄、瀏覽內(nèi)容以及在每個商品停留的時間等信息分析出用戶潛在意愿表達(dá)以及當(dāng)下現(xiàn)實需求,從而充分把握用戶需求,制定出針對性的營銷策略。通過這種形式可以將商品瀏覽者轉(zhuǎn)化為購買者,可以有效提升商品銷售量,并且也有助于優(yōu)化用戶的購物體驗,提高用戶滿足度,增加用戶對于品牌的忠誠度,對于電商平臺長遠(yuǎn)發(fā)展有積極作用。此外,對于電商而言,數(shù)據(jù)挖掘技術(shù)可以將原本無價值的數(shù)據(jù)信息轉(zhuǎn)化為有價值的資源,不僅可以為營銷活動提供參考以及有價值的建議,同時也能剔除掉其中無用的數(shù)據(jù)信息,降低電商的運營成本,提高其經(jīng)濟收益。
2 數(shù)據(jù)挖掘技術(shù)在電商情感規(guī)律分析中的應(yīng)用
數(shù)據(jù)挖掘技術(shù)是宏觀層面的概念,要具體到實際應(yīng)用當(dāng)中,其根據(jù)實際需求不同,需要采用不同的挖掘技術(shù),在電商情感規(guī)律分析中一般主要采用關(guān)聯(lián)規(guī)則、聚類分析、演化分析以及分類和預(yù)測這幾種技術(shù)。
2.1 關(guān)聯(lián)規(guī)則
如果兩個或者兩個以上的變量中存在著某種規(guī)律性,即稱之為關(guān)聯(lián),具體可以分為時序關(guān)聯(lián)、因果關(guān)聯(lián)以及簡單關(guān)聯(lián)。進(jìn)行關(guān)聯(lián)分析的主要目的是尋找數(shù)據(jù)庫當(dāng)中隱含的關(guān)聯(lián)規(guī)則,由于在分析之前對于數(shù)據(jù)庫當(dāng)中數(shù)據(jù)之間的關(guān)聯(lián)性并不清楚,即使了解也存在一定的不確定性,而通過關(guān)聯(lián)分析得出的關(guān)聯(lián)規(guī)則可信度更高[4]。對電商平臺數(shù)據(jù)庫中的數(shù)據(jù)關(guān)聯(lián)性進(jìn)行分析,可以發(fā)掘兩個或者兩個以上商品之間有價值的關(guān)聯(lián),比如購物車分析以及購買記錄分析,通過分析可以發(fā)現(xiàn)大部分用戶在購買某種商品的同時也會購買另一種商品,比如購買面包時大概率會購買牛奶。這種關(guān)聯(lián)在很大程度上反映出了用戶的消費習(xí)慣,如果電商平臺通過關(guān)聯(lián)分析明確了用戶的這種消費習(xí)慣,就可以有目的的將兩種或者兩種以上商品捆綁銷售,從而增加商品銷售量以及盈利水平。
2.2 聚類分析
這也是數(shù)據(jù)挖掘技術(shù)在實際應(yīng)用當(dāng)中比較常用的技術(shù)手段之一,其基本原理是將數(shù)據(jù)集合分為若干類別或者若干簇,并使每個類別或者每個簇當(dāng)中的數(shù)據(jù)呈現(xiàn)出最大程度的相似,使不同類別或者不同簇當(dāng)中的數(shù)據(jù)呈現(xiàn)明顯的區(qū)別,進(jìn)而挖掘出數(shù)據(jù)集當(dāng)中新穎的、可理解的以及有價值的數(shù)據(jù)分布。電商平臺中具體的應(yīng)用主要有兩種,分別是頁聚類與用戶聚類,其中頁聚類是把頁面內(nèi)容相關(guān)網(wǎng)頁構(gòu)成一個網(wǎng)頁組,一般多用于搜索功能以及幫助功能,當(dāng)用戶搜索某種商品或者服務(wù)時,可以為用戶提供更多的信息或者選擇。用戶聚類是把購物喜好具有相似性的用戶歸到一起,以便有針對性地為用戶提供瀏覽建議或者定制瀏覽內(nèi)容,以實現(xiàn)精準(zhǔn)營銷。聚類分析的價值在于可以為用戶提供更為便捷的搜索服務(wù)和瀏覽服務(wù),不僅可以強化廣告效果,同時也能優(yōu)化用戶購物體驗,充分滿足用戶的需求。
2.3 分類和預(yù)測
預(yù)測也可以稱之為基于歷史的分析,即根據(jù)指示經(jīng)驗尋找數(shù)據(jù)庫當(dāng)中相類似的情況,并將與這種情況相關(guān)的信息用于在當(dāng)前的案例當(dāng)中。預(yù)測一般首先會尋找和檔案案例相似的鄰居,然后利用這些鄰居對新數(shù)據(jù)進(jìn)行分類和估值,使用預(yù)測有三個主要問題,尋找確定的歷史數(shù)據(jù);決定表示歷史數(shù)據(jù)的最有效的方法[5];決定距離函數(shù)、聯(lián)合函數(shù)和鄰居的數(shù)量。在電商平臺中通過對用戶以往購買記錄以及瀏覽記錄的挖掘分析,可以在很大程度上預(yù)測用戶在當(dāng)前階段或者下一階段的購買傾向,從而把握用戶的需求變化,以提供精準(zhǔn)的商品或者服務(wù)。分析是將數(shù)據(jù)庫黨總的數(shù)據(jù)映射至既定的類別上,其可以反映出同類別事物的共同性質(zhì)以及不同事物的差異性特征,其特點在于可以搭建數(shù)據(jù)分類模型,將數(shù)據(jù)庫中的數(shù)據(jù)進(jìn)行分類。這種方式多與用戶聚類結(jié)合使用,可以精準(zhǔn)實現(xiàn)對用戶的分類,不同群體的購買需求存在明顯差異,利用分類模型可以對用戶群體進(jìn)行進(jìn)一步的細(xì)分,而并不僅僅是以男女或者老幼區(qū)分用戶。用戶細(xì)分不僅可以實現(xiàn)精準(zhǔn)投放,同時也有助于延伸產(chǎn)業(yè)鏈條。
2.4 演化分析
演化分析主要是描述研究對象或者行為隨著時間推移而變化的規(guī)律或者趨勢,并據(jù)此搭建數(shù)據(jù)模型,演化分析包括序列模式匹配、時間序列數(shù)據(jù)分析以及給予類似性數(shù)據(jù)分析。演化分析的核心內(nèi)容是分析數(shù)據(jù)之間的因果關(guān)系或者時間關(guān)系,從在某種程度上預(yù)測研究對象下一階段的變化[6]。對于電商平臺而言,可以采用這種方式對用戶的購買記錄進(jìn)行挖掘分析,以序列模式匹配為例,比如在某個時間區(qū)間,用戶先購買了商品1,隨后購買了商品2,最后又購買了商品3,則商品1、商品2、商品3就形成了一個序列,若這個序列出現(xiàn)的頻率比較高,則表明三者之間存在某種聯(lián)系,基于此,可以預(yù)測用戶下一階段的消費意向,進(jìn)而適時調(diào)整營銷策略。
3 基于數(shù)據(jù)挖掘技術(shù)的電商情感分析工作流程
數(shù)據(jù)挖掘技術(shù)是一個相對宏觀的概念,其又可以細(xì)分為多種不同的技術(shù),這些技術(shù)的應(yīng)用場景各不相同。在電商情感規(guī)律分析中,針對不同的需求需要采用不同的數(shù)據(jù)挖掘技術(shù),但是其工作的流程基本一致,大致可以分為四個環(huán)節(jié),分別是數(shù)據(jù)采集、數(shù)據(jù)預(yù)處理、數(shù)據(jù)挖掘以及結(jié)果顯示,具體如下所述。
首先是數(shù)據(jù)采集,目前而言數(shù)據(jù)采集主要分為隱式采集與顯式采集兩種方式,其中隱式采集是采集用戶在瀏覽或者購物過程中留存在數(shù)據(jù)庫中的相關(guān)信息,比如購物記錄、瀏覽記錄等等,不需用戶自行輸入。顯式采集是采集用戶在平臺或者系統(tǒng)中輸入的信息,比如性別、年齡、所處區(qū)域以及商品評價等等,需要用戶自行輸入。
其次是數(shù)據(jù)預(yù)處理,這指的是對采集的數(shù)據(jù)進(jìn)行清洗,以解決數(shù)據(jù)當(dāng)中存在的冗余、缺值以及數(shù)據(jù)值不一致等相關(guān)問題,以便進(jìn)行下一步數(shù)據(jù)挖掘操作。比較常用的數(shù)據(jù)預(yù)處理方法包括數(shù)據(jù)集成、數(shù)據(jù)清洗、數(shù)據(jù)歸約以及數(shù)據(jù)變換等。經(jīng)過預(yù)處理可以有效提高數(shù)據(jù)挖掘的準(zhǔn)確性。
再次是數(shù)據(jù)挖掘,此環(huán)節(jié)主要是根據(jù)實際需求選擇相應(yīng)的數(shù)據(jù)挖掘技術(shù),從海量的數(shù)據(jù)信息中提取或者識別其中有價值、新穎以及可理解的數(shù)據(jù)信息,從而分析出用戶當(dāng)前或者下一階段的購物需求以及用戶的購物體驗變化等。常用的數(shù)據(jù)挖掘技術(shù)包括關(guān)聯(lián)規(guī)則、聚類分析、回歸分析、差別分析以及演化分析等。
最后是結(jié)果顯示,這一環(huán)節(jié)包含兩方面,一是將數(shù)據(jù)挖掘的結(jié)果進(jìn)行整理歸納,從中得出對于目前更有價值的信息,以便有針對性的調(diào)整當(dāng)前的營銷策略;二是根據(jù)數(shù)據(jù)挖掘的結(jié)果,對用戶進(jìn)行定向營銷,即選擇恰當(dāng)?shù)臅r機以及恰當(dāng)?shù)姆绞酵ㄟ^電商平臺向用戶推薦相應(yīng)的商品或者服務(wù),從而有效,滿足用戶的購物需求,進(jìn)一步優(yōu)化用戶的購物體驗。
4 結(jié)語
綜上所述,合理運用數(shù)據(jù)挖掘技術(shù),可以實現(xiàn)對海量數(shù)據(jù)資源的有效利用,可以幫助電商平臺對用戶的情感變化、消費意愿進(jìn)行分析,進(jìn)而準(zhǔn)確把握用戶的需求,有針對性的調(diào)整營銷策略,使用戶獲得良好的購物體驗,并充分滿足用戶需求。這對于電商的長遠(yuǎn)發(fā)展具有重要作用。事實上,這會逐步建立良性循環(huán),電商利用數(shù)據(jù)挖掘技術(shù)可以優(yōu)化用戶體驗,吸引更多用戶瀏覽或者購買,在此過程中又會獲得新的數(shù)據(jù)信息,從這些新的數(shù)據(jù)信息中又可以發(fā)掘出新的有價值的東西,為電商提供更多價值的信息,最終用戶的購物體驗不斷優(yōu)化,電商收益不斷增加,可以實現(xiàn)雙贏。
參考文獻(xiàn):
[1] 石國燕,馬坤.淺析數(shù)據(jù)挖掘在電子商務(wù)中的應(yīng)用——以淘寶網(wǎng)為例[J].大眾投資指南,2018(17):131-132.
[2] 蔣桂黎.基于數(shù)據(jù)挖掘與智能計算的情感數(shù)據(jù)分析與心理預(yù)警系統(tǒng)[J].電子設(shè)計工程,2020,28(7):45-49.
[3] 蘇兵杰,周亦鵬,梁勛鴿.基于XGBoost算法的電商評論文本情感識別模型[J].物聯(lián)網(wǎng)技術(shù),2018,8(1):54-57.
[4] 李涵昱, 錢力, 周鵬飛. 面向商品評論文本的情感分析與挖掘[J].情報科學(xué),2017,35(1):51-55.
[5] 霍紅,張晨鑫.考慮信息熵的在線評論特征觀點詞對購買意愿的影響[J].商業(yè)經(jīng)濟研究,2018(23):67-72.
[6] 張娜,柳運昌,王若男.基于文本情感分析的社交媒體數(shù)據(jù)挖掘[J].河南城建學(xué)院學(xué)報,2019,28(5):74-79.
【通聯(lián)編輯:李雅琪】