張 莉
(合肥工業(yè)大學,安徽 合肥 230009;淮北職業(yè)技術學院,安徽 淮北 235000)
近年來,網(wǎng)絡技術的不斷進步,使得電子商務也隨之快速發(fā)展,在這一環(huán)境下許多商業(yè)開始選擇電子商務作為其企業(yè)的發(fā)展道路,同時電子商務網(wǎng)站的競爭也在不斷加劇.在電子商務的經(jīng)營模式中,要從大量的數(shù)據(jù)信息中提取出對企業(yè)有用的信息,來使客戶對企業(yè)的滿意度有所提高,那么需要進行解決的主要問題就是要對此類網(wǎng)站的設計進行改進、對客戶關系進行改善[1].而數(shù)據(jù)挖掘是在計算機技術的不斷發(fā)展中研究而來的一種信息的數(shù)據(jù)處理與分析的方法,具體來講,數(shù)據(jù)挖掘是可以從海量數(shù)據(jù)中進行目標信息提取的工具.站在企業(yè)的角度來說,數(shù)據(jù)挖掘這項技術在很大程度上能夠更加容易發(fā)現(xiàn)業(yè)務發(fā)展趨勢.對企業(yè)的決策提供有力的依據(jù),從而提高企業(yè)在發(fā)展過程中的競爭力.所以說完整的電子商務網(wǎng)絡系統(tǒng)不應僅僅是支持在線交易,同時也需要可以利用商業(yè)智能分析及其相關技術來為企業(yè)與用戶之間的關系管理、企業(yè)營銷等提供一個全面的輔助,特別是在現(xiàn)在這個信息化的時代,相當一部分的企業(yè)已經(jīng)擁有了大量信息數(shù)據(jù),而它需要的就是可以從中得到有用的方法或者規(guī)律用來指導企業(yè)經(jīng)營實踐、改善與客戶之間的關系.正是這樣一種需求更加推動了電子商務中的數(shù)據(jù)挖掘技術的更深層次的研究.
(1)所謂的電子商務指的是單位或者個人利用因特網(wǎng)等工具,以數(shù)字電子方式來完成商務中的數(shù)據(jù)交換或者開展相關的業(yè)務活動.當前在國內(nèi)已經(jīng)進行使用的有網(wǎng)上廣告業(yè)務、網(wǎng)上訂購與支付業(yè)務、電子銀行業(yè)務等各種各樣的電子商務模式.就當前的形式而言,電子商務由于它成本低、使用方便、不會受到時間或者空間的限制等特點開始在全球的范圍內(nèi)快速發(fā)展.如果對其服務的范圍進行歸類,那么可以分為三種類別,第一種是商業(yè)與商業(yè)(B2B)模式,第二種是商業(yè)與消費者(B2C)模式,第三種是商業(yè)與政府(B2G)的模式.
(2)數(shù)據(jù)挖掘是一種新型的數(shù)據(jù)信息處理技術,其主要是利用數(shù)據(jù)倉庫中的大量數(shù)據(jù)信息,采用一定的方法,從中獲得有意義的信息或者發(fā)現(xiàn)新的關聯(lián)模式或者發(fā)展趨勢的過程.如果從電子商務中的企業(yè)角度來講,數(shù)據(jù)挖掘技術簡稱為DM技術屬于一種新興的數(shù)據(jù)處理方式,簡單的說就是對長期積累起來的數(shù)據(jù)進行抽取、轉(zhuǎn)換并最終進行分析等處理,經(jīng)過處理之后提取出能夠輔助商業(yè)決策的關鍵性信息.數(shù)據(jù)挖掘的主要優(yōu)點在于它可以創(chuàng)建一個預測模型,改變了以往只能夠創(chuàng)建一種回顧性的模型狀況.同時利用強大的數(shù)據(jù)挖掘技術,能夠使相關的商戶將數(shù)據(jù)信息轉(zhuǎn)化成為有意思的具有參考價值的信息來幫助進行經(jīng)營決策,從而提高自己的市場競爭力[2].
在電子商務進行應用的數(shù)據(jù)挖掘技術的實現(xiàn)過程大致要劃分為三個不同的階段:第一部分對需要挖掘的數(shù)據(jù)信息的準備階段,第二部分對數(shù)據(jù)信息的挖掘階段,第三部分的主要任務是對數(shù)據(jù)挖掘的結(jié)果進行解釋與評價.
準備部分又可以分成數(shù)據(jù)的選取、數(shù)據(jù)信息的預處理.對數(shù)據(jù)進行選取的主要目的就是對操作對象進行確定,即是對目標數(shù)據(jù)進行確定,所謂的目標數(shù)據(jù)是在經(jīng)過對用戶的需要進行細致分析之后,對最有可能得到有利用價值的信息的那些從數(shù)據(jù)庫中抽取出來的數(shù)據(jù).獲取到這些數(shù)據(jù)以后需要進行預處理,主要包含數(shù)據(jù)的去噪、計算缺值數(shù)據(jù)的推導、數(shù)據(jù)類型的轉(zhuǎn)換,數(shù)據(jù)類型轉(zhuǎn)換舉個例子來說比如把連續(xù)型數(shù)據(jù)轉(zhuǎn)化成離散數(shù)據(jù),以方便進行符號的歸納.
數(shù)據(jù)信息的挖掘階段是在上一步的基礎之上,即在目標數(shù)據(jù)已經(jīng)確定,并且已經(jīng)完成了初始化的基礎之上,需要確定數(shù)據(jù)挖掘的目的與挖掘的類型.在對挖掘任務的目標確定之后,要根據(jù)數(shù)據(jù)挖掘的知識類型選取合適的數(shù)據(jù)挖掘方法,最終完成數(shù)據(jù)挖掘具體操作即采用特定的數(shù)據(jù)挖掘方法從數(shù)據(jù)倉庫中抽取所需的挖掘目標.
數(shù)據(jù)挖掘的結(jié)果的解釋和評價是在完成數(shù)據(jù)挖掘階段之后對發(fā)現(xiàn)的知識,進行評估,對于冗余或者無關的知識要進行刪除;對于獲得的知識不符合用戶的要求的要進行重新的挖掘.與此同時,因為數(shù)據(jù)挖掘需要面臨用戶,所以,在得到目標知識以后還需要對所挖掘的知識附加相關解釋,來用一種便于用戶理解的方式供用戶使用[3].
綜上所述,整個數(shù)據(jù)信息的挖掘在實際情況下是一個不斷地循環(huán)與反復的過程,所以要對所挖掘出來的知識不斷求精和深化,最終要獲得用戶所需要的結(jié)果.
由于電子商務自身的某些獨特的特點,同其他的應用于普通商業(yè)領域中的數(shù)據(jù)挖掘相比,應用于電子商務的數(shù)據(jù)挖掘具有如下幾個特點:
(1)應用于電子商務的數(shù)據(jù)挖掘的最終目的主要表現(xiàn)在企業(yè)與客戶之間的關系管理方面,電子商務利用因特網(wǎng)的技術能夠使企業(yè)和客戶之間的關系處理變得更加方便.所以,其主要的功能是怎樣使企業(yè)采用這些頻繁的交流信息,快速的掌握客戶的趨向、改善與客戶交流情況或者獲取交流方向等[4];
(2)電子商務本身就是一個信息化程度比較高的系統(tǒng),其自身累積的數(shù)據(jù)信息會存放在電子商務數(shù)據(jù)庫內(nèi),用戶可以比較便捷地得到這些信息,所以對于電子商務的數(shù)據(jù)挖掘的數(shù)據(jù)信息的準備階段的相關工作就變得相對容易;
(3)電子商務領域的數(shù)據(jù)挖掘的主要目標一般是使電子商務系統(tǒng)得到有效的改進.例如為客戶提供個性化頁面、把用戶比較感興趣的信息展現(xiàn)在網(wǎng)站首頁或得到哪一些商品比較受到客戶的歡迎等.
首先要講的是關聯(lián)規(guī)則在電子商務中的運用,利用比較通俗的語言來講,從一個事件的發(fā)生與否方面進行解釋,所謂的關聯(lián)規(guī)則法在大量的事件發(fā)生或者不發(fā)生的條件下,對這些事件中的任意兩個或者多個事件提取出來,通過一定的統(tǒng)計分析算法,最終確定兩個或者多個事件的發(fā)生與否是否存在著某種關系,而這種可能存在的管理,我們稱之為關聯(lián)規(guī)則[5].
列舉一個有趣的故事,就是在一個超市里面,店家把小孩的尿布同啤酒放到了一起,來供購買者進行購買,結(jié)果是二者的銷量都提升了一倍,其實這就是因為二者之間有著某種潛在聯(lián)系,店家通過數(shù)據(jù)挖掘的方法發(fā)現(xiàn)的這個規(guī)則,并對這一關聯(lián)規(guī)則進行了實際的運用,從中得到了益處.同樣在電子商務中通過數(shù)據(jù)挖掘得到關聯(lián)規(guī)則,有著類似的意義.
其次在電子商務中數(shù)據(jù)挖掘聚類分析方法的應用.在大量數(shù)據(jù)倉庫中,數(shù)據(jù)與數(shù)據(jù)之間,往往會有某些性質(zhì)的類型相似,同樣也會有某些性質(zhì)或者特點相異,我們把這些性質(zhì)或者特點稱為觀察指標,聚類分析就是對于某一個特點指標而言,把指標相差不多的數(shù)據(jù)劃分為同一個類型,若相差較大則要劃分為不同的類型、這種操作的主要意義就是將具有某種特定的相似特性的客戶或者數(shù)據(jù)分成一個類.在電子商務活動中,這一方法的應用主要集中在市場細分的工作之中.
分類分析系統(tǒng)的建立以生物的遺傳算法為基礎,屬于其中的自學習的一種,它一般會包含三個子系統(tǒng),第一個是以串規(guī)則為基礎的并行生成子系統(tǒng)、第二個是規(guī)則評價子系統(tǒng).第三個是遺傳算法子系統(tǒng).
分類分析可以說是電子商務中運用到數(shù)據(jù)挖掘最多的一種挖掘方式.主要原因就是在于其能夠形成一種預測模型能夠?qū)σ恍I銷方式或者其他的一些商業(yè)措施做出正確的預測.
更高效的利用企業(yè)現(xiàn)有資源以及開發(fā)新資源是當代企業(yè)發(fā)展的關鍵.電子商務通過采用數(shù)據(jù)挖掘的技術,能夠更加及時和正確的獲得企業(yè)當前所有資源的具體使用情況,而且通過數(shù)據(jù)挖掘的技術可以分析以往的各種企業(yè)數(shù)據(jù),比如說企業(yè)財務數(shù)據(jù)、企業(yè)庫存數(shù)據(jù)或者企業(yè)交易數(shù)據(jù),能夠較為及時的發(fā)現(xiàn)企業(yè)資源過度消耗的主要問題所在,或者能夠得到各種商務活動的投入與產(chǎn)出的比例,來為企業(yè)領導進行經(jīng)營決策提供有力的根據(jù)[6].
另外在企業(yè)的經(jīng)營過程中,人們不斷推崇“以客戶為中心”的經(jīng)營理念,在這一趨勢下,如何正確快速的分析和了解客戶的需求已成為企業(yè)提高自身市場競爭力的一大課題.通過把數(shù)據(jù)挖掘應用到電子商務之中,能夠使企業(yè)最準確的分析客戶資源并最有效的利用企業(yè)客戶資源,通過對已有客戶行為進行相關性分析,可以形成潛在客戶資源的預測模型.
除此之外在企業(yè)經(jīng)營過程中,利用數(shù)據(jù)挖掘可以解決另外一個嚴重影響了商業(yè)正常秩序的重要問題.即當前時區(qū)商務活動中的地下的信用狀況問題,這一問題的嚴重程度已經(jīng)引起了人們的廣泛關注.在電子商務經(jīng)營過程中,因為網(wǎng)上詐騙公司或者企業(yè)財務的現(xiàn)象屢見不鮮,信用危機已經(jīng)成為影響其快速正常發(fā)展的一個重要因素.而通過在電子商務中采用數(shù)據(jù)挖掘技術實現(xiàn)對企業(yè)經(jīng)營活動的跟蹤,在此基礎上實現(xiàn)企業(yè)的資產(chǎn)評估、利潤收益分析以及發(fā)展?jié)摿︻A測分析等,為電子商務在經(jīng)營過程中提供了完善的安全保障體系,同時利用數(shù)據(jù)挖掘?qū)崿F(xiàn)企業(yè)網(wǎng)上全程監(jiān)控.另外通過實現(xiàn)基于數(shù)據(jù)挖掘的信用評估模型,可以在很大程度上進行防范或者化解信用風險,從而提高企業(yè)的信用度以及應對風險能力.
電子商務是而今信息化時代進步的產(chǎn)物,在未來的幾年內(nèi)電子商務必將會成為商業(yè)中存在的主要運營模式.隨著時間的積累,各種電子商務都會得到巨大的數(shù)據(jù)信息資源,這也是數(shù)據(jù)挖掘在電子商務中應用的基本條件.從另外一方面而言,隨著數(shù)據(jù)挖掘在電子商務方面中的不斷深入研究與發(fā)展,已經(jīng)能夠向電子商務系統(tǒng)提供必不可少的技術支持,促進了電子商務的發(fā)展與普及.
〔1〕謝丹夏.Web上的數(shù)據(jù)挖掘技術和工具設計[J].計算機工程與應用,2001(6):85-87.
〔2〕王繼成,潘金貴,張福炎.Web挖掘技術研究[J].計算機研究與發(fā)展,2000,37(5):513-520.
〔3〕凌傳繁.Web挖掘技術在電子商務中的應用[J].情報雜志,2006(01):22-25.
〔4〕吳九雄.Web挖掘在電子商務中的應用研究[J].信息系統(tǒng)工程,2010(01):15-18.
〔5〕陳文偉.數(shù)據(jù)倉庫與數(shù)據(jù)挖掘教程[M].北京:清華大學出版社,2006.
〔6〕張吉善,胡曉棠,尤惠.數(shù)據(jù)挖掘在電子商務中的應用[D].東北大學工商管理學院,2007.