摘要:隨著電子商務(wù)蓬勃發(fā)展,數(shù)據(jù)挖掘逐漸應(yīng)用在電子商務(wù)需求的方方面面。本文在分析了電商平臺(tái)中在線咨詢功能的不足后,利用數(shù)據(jù)挖掘技術(shù),提出一種基于關(guān)聯(lián)規(guī)則挖掘的電子商務(wù)在線答疑模型。
Abstract: With the prosperous development of the E-Commerce, data mining technology has been utilized in various aspects for E-Commerce requirements. This paper analyzed the inadequacies of online answering functions in existing E-Commerce platforms, then proposed a novel E-Commerce online-answering model based on the association rules, utilizing the data mining technology.
關(guān)鍵詞:電子商務(wù);數(shù)據(jù)挖掘;關(guān)聯(lián)規(guī)則;在線答疑
Key words: E-Commerce;data mining;association rule;online answering
中圖分類號(hào):TP391.1 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1006-4311(2016)09-0169-02
0 引言
電子商務(wù)是利用互聯(lián)網(wǎng)、電子數(shù)據(jù)交換、電子資金轉(zhuǎn)賬等信息技術(shù)在國家、企業(yè)及個(gè)人之間進(jìn)行的以經(jīng)濟(jì)效益為中心,以商品及訂購信息、資金及支付信息、安全及認(rèn)證信息為載體,以實(shí)現(xiàn)商務(wù)活動(dòng)的電子化、網(wǎng)絡(luò)化與智能化為目標(biāo)的現(xiàn)代商業(yè)運(yùn)轉(zhuǎn)模式。
電子商務(wù)是在開放的網(wǎng)絡(luò)環(huán)境中,買賣雙方互不謀面,所有的活動(dòng)在網(wǎng)上進(jìn)行。這也造成了買家對商品質(zhì)量、功能、用法等形形色色的的問題無法通過實(shí)物接觸來獲得,而商家疲于應(yīng)付無數(shù)買家大量相同或不同的問題咨詢,耗費(fèi)了大量精力、時(shí)間。因此,利用數(shù)據(jù)挖掘技術(shù)設(shè)計(jì)一個(gè)較高智能的電子商務(wù)在線自動(dòng)答疑系統(tǒng),使得電子商務(wù)運(yùn)營中的大量客戶隨機(jī)咨詢問題時(shí),無需電商客服在線解答,系統(tǒng)自動(dòng)實(shí)時(shí)解答,就可以較好的解決這個(gè)不足。
1 數(shù)據(jù)挖掘概述
數(shù)據(jù)挖掘是從大量的、不完全的、模糊的、隨機(jī)的數(shù)據(jù)中,提取隱藏其中的、有潛在價(jià)值的信息的過程,其主要步驟如圖1所示。
數(shù)據(jù)挖掘的常用方法有分類、聚類、關(guān)聯(lián)規(guī)則發(fā)現(xiàn)、回歸分析、特征、變化與偏差發(fā)現(xiàn)等。分類就是找出一組描述已有數(shù)據(jù)集合共性的模型或函數(shù),以便來分類未知數(shù)據(jù)的類別,即將未知事例對應(yīng)到某個(gè)給定的類別。關(guān)聯(lián)規(guī)則發(fā)現(xiàn)是為了挖掘出隱含在數(shù)據(jù)中的相互關(guān)系,即根據(jù)一個(gè)事務(wù)中某些數(shù)據(jù)項(xiàng)的出現(xiàn)可導(dǎo)出另一些數(shù)據(jù)項(xiàng)在同一事務(wù)中也出現(xiàn),即隱藏在數(shù)據(jù)間的關(guān)聯(lián)或相互關(guān)系。
2 電子商務(wù)在線答疑系統(tǒng)模型功能介紹
電子商務(wù)在線答疑系統(tǒng)模型是針對消費(fèi)者問題的普遍性和共性而提出的。簡單而言,首先由電商客服將大量常見問題答案對保存在系統(tǒng)問題庫中,當(dāng)客戶隨機(jī)地在線咨詢問題時(shí),系統(tǒng)在問題庫中查找相同問題或高度相關(guān)的問題提交給客戶進(jìn)行參考,客戶認(rèn)為問答一致時(shí),在線咨詢完成;客戶認(rèn)為不一致時(shí),該問題才會(huì)發(fā)給電商客服,客服解答該問題并添加入系統(tǒng)問題庫。
例如,客戶通過互聯(lián)網(wǎng)上的電子商務(wù)平臺(tái)(如淘寶、京東等)向商家提出問題時(shí),系統(tǒng)首先去理解問題,之后調(diào)用問題匹配算法對問題庫中所有問題計(jì)算其相對新問題的匹配程度,比較每個(gè)問題匹配程度值和相同問題閥值得出相同問題,并按照匹配程度高低順序且參照相關(guān)問題閥值得出相關(guān)問題,最后將最相關(guān)的匹配結(jié)果序列(數(shù)量可控且少量)發(fā)送給客戶端,由客戶從提供的答案中選出和提交問題吻合的答案。如果推薦問題答案序列中存在和新問題吻合的答案,則此推薦問題訪問頻度值自動(dòng)加1;如果不存在,系統(tǒng)就認(rèn)為問題庫中無相似問題。系統(tǒng)將該新問題發(fā)往電商客服,客服在系統(tǒng)中向提問的客戶回答該問題,并將該問題答案對保存入問題庫,這樣特殊性的問題回答也得到保證。
3 電子商務(wù)在線答疑系統(tǒng)模型的理論基礎(chǔ)
針對客戶提出的初始問題Q,系統(tǒng)分析后會(huì)產(chǎn)生一系列相關(guān)問題(Q1…Qm)。再依次對問題Q和其中的一個(gè)相關(guān)問題Qp分解為各自的知識(shí)點(diǎn)和語義詞的序列(K1…Km,Y1…Yn)和(Kp1…Kp(mi),Yp1…Yp(ni))。把序列(K1…Km,Y1…Yn)轉(zhuǎn)換為m*n個(gè)兩兩由知識(shí)點(diǎn)和語義詞組成的模式(Ki,Yj)。分別把每一對{Q,Qp}分解和轉(zhuǎn)換,就可以得到相關(guān)模式項(xiàng)集Ti={(Ki,Yj),(Kpi,Ypj)}。這樣就把問題轉(zhuǎn)換為模式。
然后,對相關(guān)模式進(jìn)行關(guān)聯(lián)規(guī)則挖掘。因?yàn)楦鱾€(gè)模式所在問題的訪問順序不同,在對問題的次序概化處理后,所得到的每個(gè)模式都有對應(yīng)的相關(guān)程度的類別。而相關(guān)程度的類別都有類別系數(shù),這樣就產(chǎn)生一系列包含有相關(guān)系數(shù)的模式。對各個(gè)有相關(guān)系數(shù)的模式應(yīng)用關(guān)聯(lián)規(guī)則的挖掘,得到一些列在一定模式層次上的規(guī)則,應(yīng)用調(diào)整算法進(jìn)行合并、刪除這些規(guī)則就得到比較理想的規(guī)則。上述過程如圖2所示。
■
4 電子商務(wù)在線答疑系統(tǒng)模型
在線答疑模型簡要概括為:①分解初始問題Q的知識(shí)點(diǎn)及語義詞;②產(chǎn)生相關(guān)問題過程(Q1…Qm);③相關(guān)問題(Q1…Qm)相關(guān)度的計(jì)算和排序;④利用規(guī)則庫等匹配出最相關(guān)問題或在無相關(guān)問題條件下將該問題存入問題庫;⑤電商客服非實(shí)時(shí)維護(hù)問題庫。
利用關(guān)聯(lián)規(guī)則挖掘的結(jié)果,可以提出一個(gè)較先進(jìn)的電子商務(wù)在線答疑系統(tǒng)模型,如圖3所示。
■
在分解初始問題的基礎(chǔ)上,對初始問題和規(guī)則庫中的規(guī)則模式進(jìn)行匹配,對應(yīng)初始問題的相關(guān)度計(jì)算由下式得出:
F(Qi)=G(ki)+M(Li1,Lik)+N(ri)=ki+Li1+……Lik+5*ri
5 電子商務(wù)在線答疑模型應(yīng)用效果分析
采用電子商務(wù)在線答疑模型可以更實(shí)時(shí)的為消費(fèi)者提供快捷高效的咨詢服務(wù),對比目前電子商務(wù)客服利用網(wǎng)上通訊軟件在線應(yīng)答時(shí)頻繁出現(xiàn)中斷或延時(shí),浪費(fèi)了消費(fèi)者的寶貴時(shí)間,預(yù)計(jì)可以節(jié)省60%的時(shí)間,可以節(jié)省80%以上的客服人員及客服設(shè)備。當(dāng)大量消費(fèi)者同時(shí)咨詢時(shí),會(huì)造成客服人數(shù)不夠而增加人力,同時(shí)也束縛客服必須時(shí)刻在線守候,極大浪費(fèi)了人力資源,因此在線答疑模型的實(shí)際應(yīng)用會(huì)大大提高電子商務(wù)運(yùn)營的效率。
但是,畢竟在線自動(dòng)答疑模型的智能性還不能完全與客服人工媲美,當(dāng)遇到一些較難以理解的問題或較特殊的問題時(shí)無疑會(huì)導(dǎo)致消費(fèi)者無法得到滿意的答案,此時(shí)還需客服來人工完成咨詢回復(fù),所以筆者認(rèn)為在電子商務(wù)運(yùn)營中采用在線答疑系統(tǒng)模型處理客戶咨詢?yōu)橹?,客服人工答疑為輔的模式最為理想。
6 結(jié)束語
電子商務(wù)擺脫了時(shí)空的限制,省掉了很多人力成本,實(shí)現(xiàn)了各類資源全球性的共享,正以無可比擬的優(yōu)勢迅猛發(fā)展。電子商務(wù)中商家與消費(fèi)者的交流可以通過各式各樣的數(shù)據(jù)。只要充分發(fā)揮數(shù)據(jù)挖掘技術(shù)的優(yōu)勢,即可對瞬息萬變的電商運(yùn)營環(huán)境作出最快最好的反應(yīng),以此達(dá)到商家和消費(fèi)者雙贏。
參考文獻(xiàn):
[1]Pang-Ning Tan,Michael Steinbach,Vipin Kumar. 數(shù)據(jù)挖掘?qū)д揫M].人民郵電出版社,2010.
[2]潘曉輝. 數(shù)據(jù)挖掘在智能答疑模型中的應(yīng)用[J].微電子與計(jì)算機(jī),2006.
[3]蘇群,申瑞民,王武.改進(jìn)型智能答疑模型的設(shè)計(jì)和實(shí)現(xiàn)[J].計(jì)算機(jī)仿真,2003.
[4]張同珍,申瑞民.基于web的自動(dòng)答疑系統(tǒng)問題匹配算法研究與實(shí)現(xiàn)[J].計(jì)算機(jī)工程與應(yīng)用,2003.