[摘要] 數(shù)據(jù)挖掘作為一種系統(tǒng)地檢查和理解大量數(shù)據(jù)的工具,能有效地幫助企業(yè)從不斷積累與更新的數(shù)據(jù)中提取有價值的信息。因此,數(shù)據(jù)挖掘被引入到企業(yè)信息化研究領(lǐng)域,并日益受到重視。本文從數(shù)據(jù)挖掘技術(shù)特點入手,分析了數(shù)據(jù)挖掘在企業(yè)信息化中的應(yīng)用。
[關(guān)鍵詞] 數(shù)據(jù)挖掘 信息化 電子商務(wù)
一、概述
上世紀80年代末,隨著個人計算機的普及,計算機逐步進入我國企業(yè),從基本的文字處理到簡單的工資管理軟件的應(yīng)用,逐漸到日常管理工作,企業(yè)在自覺與不自覺中踏上了信息化建設(shè)的征途,到了信息時代的今天,各企業(yè)紛紛建立向已的信息化系統(tǒng),以提高企業(yè)生產(chǎn)效率.確保企業(yè)的競爭,ERP(企業(yè)資源計劃)、CRM(客戶關(guān)系管理系統(tǒng))、SCM(供應(yīng)鏈管理系統(tǒng)) 等多種系統(tǒng)在不少企業(yè)已經(jīng)發(fā)揮出重要的作用。這些系統(tǒng)一般都具有各自的數(shù)據(jù)庫,信息量也是驚人的。隨著Intemet的普及,電子商務(wù)已成為企業(yè)發(fā)展的趨勢。它以lnternet為商務(wù)媒介,非常有效地把有價值的信息和需要這些信息的人聯(lián)系起來,實現(xiàn)B2B、B2C等模式,形成了價值增值鏈和增值網(wǎng).推動企業(yè)的進一步發(fā)展。由此企業(yè)的數(shù)據(jù)量將變得更加龐大。數(shù)據(jù)量增長速度呈現(xiàn)指數(shù)上升,開發(fā)應(yīng)用變得越來越復(fù)雜和耗費力;使得數(shù)據(jù)庫變得越來越難于訪問、管理和用于決策支持。原有的決策支持系統(tǒng)(DSs)和領(lǐng)導(dǎo)執(zhí)行系統(tǒng)(EIs)已不能滿足需要,這時出現(xiàn)數(shù)據(jù)挖掘技術(shù),它能夠去粗存精、去偽存真,從海量的數(shù)據(jù)信息中提取知識和有用信息的技術(shù)。
數(shù)據(jù)挖掘是一種新興的信息處理技術(shù),它通過對企業(yè)中的商業(yè)數(shù)據(jù)進行分析處理,可以發(fā)現(xiàn)蘊藏在數(shù)據(jù)中的商業(yè)知識,挖掘數(shù)據(jù)的內(nèi)在聯(lián)系規(guī)則和模式,輔助企業(yè)進行商業(yè)決策數(shù)據(jù)挖掘已廣泛應(yīng)用于電信,金融,零售與批發(fā)等各企事業(yè)單位。數(shù)據(jù)挖掘一方面將數(shù)據(jù)轉(zhuǎn)化為信息和知識,在此基礎(chǔ)上做出正確的決策;另一方面提供一種機制,將知識融入到運營系統(tǒng)中,進行正確的運作。
二、數(shù)據(jù)挖掘所采用的主要技術(shù)
數(shù)據(jù)挖掘主要采用的技術(shù)和方法包括決策樹、神經(jīng)網(wǎng)絡(luò)技術(shù)、遺傳算法、粗糙與模糊集方法。
1.決策樹
這一方法需要建立分類向?qū)P?,并使模型看起來像樹狀。把問題分成若干子問題,按規(guī)則分配到樹的不同結(jié)點,然后對樹進行分析。決策樹常用于分類和預(yù)測。
2.神經(jīng)網(wǎng)絡(luò)技術(shù)
被稱為有學習能力的商業(yè)智能系統(tǒng)。 它具有和人類大腦相似的功能,經(jīng)過對神經(jīng)網(wǎng)絡(luò)系統(tǒng) 進行一段時間的訓(xùn)練以后,該系統(tǒng)可以在沒有人干預(yù)的情況下進行模擬識別,以解決特定領(lǐng)域中的問題。很多公司都將銷售信息保存在大型的數(shù)據(jù)倉庫中,然后應(yīng)用神經(jīng)網(wǎng)絡(luò)軟件分析并找出最好的銷售模式。
3.遺傳算法
模擬進行化,適者生存的過程,逐漸產(chǎn)生出優(yōu)化的問題解決方案。它通過選擇、交叉和變異等進化概念,產(chǎn)生出解決問題的新方法和策略。選擇是指挑選出好的解決方案,交叉是將各個好的方案中的部分進行組合連接,而變異則是隨機的改變解決方案的某些部分,這樣當提供了一系列可能的解決方案。
4.智能代理
是將計算機和網(wǎng)絡(luò)中許多重復(fù)的工作獨立出來,自動的適應(yīng)人們的愛好和習慣,按照人們的要求完成工作、融合了許多現(xiàn)代的軟件技術(shù)。它的典型應(yīng)用是在Web上為清費商品進行篩選或監(jiān)測拍賣,在競價時提醒用戶。另外一種有名的采用代理技術(shù)的電子商務(wù)應(yīng)用是合作篩選,即將用戶采購?fù)渌M者的購買習慣相比較進行推薦,它被Amazon所采用。
三、數(shù)據(jù)挖掘在企業(yè)信息化的應(yīng)用流程
從應(yīng)用流程圖一,數(shù)據(jù)挖掘在企業(yè)信息處理中的應(yīng)用是一個將信息轉(zhuǎn)化為企業(yè)商業(yè)知識的過程。首先,明確數(shù)據(jù)挖掘的對象,確定企業(yè)的商業(yè)主題,如:分析企業(yè)客戶特征,產(chǎn)品市場需求等。其次,圍繞商業(yè)主題收集數(shù)據(jù)源,并對數(shù)據(jù)進行清理、轉(zhuǎn)換,集成等技術(shù)處理,裝載進入數(shù)據(jù)倉庫并選取合適的數(shù)據(jù)挖掘算法,構(gòu)建數(shù)據(jù)挖掘模型,從目標數(shù)據(jù)庫中提取有價值的商業(yè)知識,包括商業(yè)規(guī)則、模式模型和報表等對結(jié)果進行分析和驗證,調(diào)整數(shù)據(jù)挖掘模型,從而保證結(jié)果的可靠性和實用性。再次,將商業(yè)知識集成到企業(yè)信息化平臺,融合專家知識與領(lǐng)域規(guī)則,利用友好的人機界面為企業(yè)的商業(yè)活動提供決策支持、商業(yè)評估等功能??梢?,數(shù)據(jù)挖掘技術(shù)具有高技術(shù)性,并且與企業(yè)業(yè)務(wù)密切相關(guān),所以需要企業(yè)各個方面與數(shù)據(jù)挖掘技術(shù)專家緊密合作。首先,需要企業(yè)管理層、決策層認知,數(shù)據(jù)挖掘不僅是一項新興的技術(shù),也是一個在資金、技術(shù)上高投入的過程。然后,從技術(shù)層面上應(yīng)用數(shù)據(jù)挖掘技術(shù),并不斷優(yōu)化改進,為企業(yè)運營提供高效、優(yōu)質(zhì)的服務(wù)。
四、數(shù)據(jù)挖掘在企業(yè)信息化中的應(yīng)用
由于企業(yè)業(yè)務(wù)操作流程的自動化,產(chǎn)生了大量的業(yè)務(wù)數(shù)據(jù),這樣為數(shù)據(jù)挖掘的應(yīng)用提供了豐富的數(shù)據(jù)資源數(shù)據(jù)挖掘的應(yīng)用將大大提高企業(yè)獲取分析信息的能力,有利于促進企業(yè)開拓市場,優(yōu)化企業(yè)資源,提高企業(yè)的運營效率和管理質(zhì)量,充分發(fā)揮企業(yè)的競爭力。體現(xiàn)了企業(yè)以產(chǎn)品為中心向用戶和服務(wù)為中心轉(zhuǎn)變的現(xiàn)代經(jīng)營管理理念數(shù)據(jù)挖掘主要用于企業(yè)的決策支持,客戶管理,市場分析營銷策略和趨勢預(yù)測等方面。
1.數(shù)據(jù)挖掘在客戶關(guān)系管理中的應(yīng)用
利用數(shù)據(jù)挖掘來分析客戶的數(shù)據(jù),找出客戶的購買模式,不斷地滿足客戶的需求,把客戶當作企業(yè)重要資源來進行管理,是成功應(yīng)用客戶關(guān)系管理搞好企業(yè)經(jīng)營管理工作的關(guān)鍵。
有統(tǒng)計表明,企業(yè)爭取—個新客戶的成本是保留一個老客戶成本的7倍~l0倍。而流失一個老客戶的損失,只有爭取l0個新客戶才能彌補。可見保持現(xiàn)有的客戶、提高他們對企業(yè)的忠誠度對企業(yè)來講至關(guān)重要。對于客戶保持,企業(yè)可通過數(shù)據(jù)挖掘?qū)蛻魯?shù)據(jù)庫中大量的客戶歷史交易記錄、客戶統(tǒng)計信息及其他相關(guān)資料進行分析和處理,有針對性地對流失客戶群進行深入研究,分析其特征,研究哪些要素會導(dǎo)致客戶流失,并由此建立流失客戶模型,識別導(dǎo)致客戶流失的模式。然后根據(jù)分析結(jié)果到現(xiàn)有客戶資料中找出可能轉(zhuǎn)移的客戶,并結(jié)合流失客戶模型,分析模型和結(jié)果,預(yù)測哪些客戶會離開,并建立潛在離開者模型,以便使企業(yè)制訂一些可以誘使這些潛在離開者留下來的最適宜的計劃和方案,改善客戶關(guān)系,爭取保持客戶并提高收益。也有些企業(yè)利用神經(jīng)網(wǎng)絡(luò)根據(jù)客戶的消費行為與交易記錄對客戶的忠誠度進行計算和排隊,在此基礎(chǔ)上排出流失率的等級,針對不同客戶采用不同的客戶保持策略。在客戶保持中首先建立模型用來預(yù)測和識別潛在的流失者,然后通過數(shù)據(jù)挖掘識別潛在的流失者中的“黃金客戶”,最后利用聚類分析等方法對“黃金客戶”中的潛在流失者的數(shù)據(jù)進行分析挖掘,識別其行為模式,從而有針對性地對客戶采取相應(yīng)的措施。
2.數(shù)據(jù)挖掘在企業(yè)營銷策略中的應(yīng)用
數(shù)據(jù)挖掘技術(shù)在企業(yè)市場營銷中得到了比較普遍的應(yīng)用,它是以市場營銷學的市場細分原理為基礎(chǔ),其基本假定是“消費者過去的行為是其今后消費傾向的最好說明”。通過收集、加工和處理涉及消費者消費行為的大量信息,確定特定消費群體或個體的興趣、消費習慣、消費傾向和消費需求,進而推斷出相應(yīng)消費群體或個體下一步的消費行為,然后以此為基礎(chǔ),對所識別出來的消費群體進行特定內(nèi)容的定向營銷,這與傳統(tǒng)的不區(qū)分消費者對象特征的大規(guī)模營銷手段相比,大大節(jié)省了營銷成本,提高了營銷效果,從而為企業(yè)帶來更多的利潤。這些來自各種渠道的數(shù)據(jù)信息被組合,應(yīng)用超級計算機、并行處理、神經(jīng)元網(wǎng)絡(luò)、模型化算法和其他信息處理技術(shù)手段進行處理,從中得到商家用于向特定消費群體或個體進行定向營銷的決策信息。
五、結(jié)束語
企業(yè)的信息系統(tǒng)中積累了大量的數(shù)據(jù),充分利用這些數(shù)據(jù)制定正確的決策對企業(yè)的發(fā)展尤為重要。數(shù)據(jù)挖掘是企業(yè)信息化的靈魂所在。從數(shù)據(jù)中尋找知識和思想、發(fā)現(xiàn)決策依據(jù)、發(fā)現(xiàn)業(yè)務(wù)發(fā)展的趨勢,利用數(shù)據(jù)挖掘揭示已知的事實,預(yù)測未知的結(jié)果,幫助企業(yè)分析出完成任務(wù)所需的關(guān)鍵因素,以達到增加收入、降低成本,使企業(yè)處于更有利的競爭位置。這些正是數(shù)據(jù)挖掘?qū)ζ髽I(yè)的直接貢獻,也是企業(yè)信息化的重要體現(xiàn)。
參考文獻:
[1]王珊:數(shù)據(jù)倉庫技術(shù)與聯(lián)機分析處理[M].北京科學出版社,1998
[2]邵峰晶:數(shù)據(jù)挖掘一原理與算法[M].北京:中國水利水電出版社,2003
[3]徐科杰:淺談我國企業(yè)信息化[J].集團經(jīng)濟研究,2007(3z)
[4]李海華吳中元:我國企業(yè)信息化問題與對策研究[J].商場現(xiàn)代化,2006(01s)
注:本文中所涉及到的圖表、注解、公式等內(nèi)容請以PDF格式閱讀原文。