[摘要] 先進的商業(yè)管理理念離不開技術(shù)的支持。面對企業(yè)激增的海量數(shù)據(jù),應(yīng)運而生的數(shù)據(jù)挖掘技術(shù)可使商業(yè)決策的制定更及時、更準(zhǔn)確。本文從數(shù)據(jù)挖掘的功能、典型商業(yè)應(yīng)用、管理流程及所面臨的問題等方面討論如何應(yīng)用數(shù)據(jù)挖掘技術(shù)助力商業(yè)決策。
[關(guān)鍵詞] 數(shù)據(jù)挖掘 商業(yè)決策 數(shù)據(jù)分析
一、應(yīng)用數(shù)據(jù)挖掘技術(shù)支撐商業(yè)管理理念的實施
商業(yè)管理理論及理念的研究一直沒有停歇,那面是“二八原則”,這面又是“藍平長二”,無論是什么,其宗旨都是為使企業(yè)能在激烈的商業(yè)競爭中審時度勢,迅速出擊,知己知彼,百戰(zhàn)不殆。任何好的商業(yè)決策都必須及時、準(zhǔn)確,有真實可靠的事實與數(shù)據(jù)為依據(jù)。商業(yè)組織如果感覺不靈敏,很容易陷入“夜半臨深池”的危險境地卻不自知,有先進的管理理念也無濟于事。面對日益復(fù)雜的競爭環(huán)境,數(shù)據(jù)挖掘技術(shù)應(yīng)運而生。
數(shù)據(jù)挖掘技術(shù)基于人工智能、機器學(xué)習(xí)、統(tǒng)計學(xué)等技術(shù),可高度自動化地從深層次上分析商業(yè)組織在運營過程中積累的海量業(yè)務(wù)數(shù)據(jù),抽取重要信息,使商業(yè)組織大大提高認知其組織內(nèi)外環(huán)境的能力,靈活應(yīng)對突發(fā)事件,迅速制定合理決策,使先進的商業(yè)管理理念落到實處。
二、數(shù)據(jù)挖掘功能及其所能解決的典型商業(yè)問題
1.關(guān)聯(lián)分析
關(guān)聯(lián)分析是從大量的數(shù)據(jù)中發(fā)現(xiàn)項集之間相關(guān)關(guān)系或因果結(jié)構(gòu)的數(shù)據(jù)分析方法。通過對大量銷售數(shù)據(jù)的分析,可以發(fā)現(xiàn)兩種或多種商品之間存在的關(guān)聯(lián)關(guān)系,據(jù)此可改變商品的擺放位置,制定捆綁銷售等策略。亞馬遜及當(dāng)當(dāng)?shù)荣徫锞W(wǎng)站在用戶選擇商品后及時給出的其他商品的推介就是利用關(guān)聯(lián)分析得到的。
2.分類與預(yù)測
分類與預(yù)測是通過對當(dāng)前數(shù)據(jù)集合的描述以識別未知數(shù)據(jù)的歸屬或預(yù)測未來數(shù)據(jù)的發(fā)展趨勢。通過對大量銷售數(shù)據(jù)的分析,可以確定特定客戶的興趣、消費習(xí)慣、消費傾向和消費需求,進而推斷其下一步的消費行為,據(jù)此進行定向營銷和推送服務(wù),必將大大節(jié)省營銷成本,獲得良好的營銷收益。
3.聚類分析
聚類就是按照事物的某些屬性把事物聚集成類。聚類之前類的數(shù)量及類的特征都是未知的。應(yīng)用聚類技術(shù)能發(fā)現(xiàn)不同客戶群并刻畫出客戶群的特征,據(jù)此制定營銷策略和客戶服務(wù)策略,如超市根據(jù)客戶聚集地中心點制定班車路線,制定商品宣傳策略等。
4.孤立點分析
數(shù)據(jù)庫中包含的與其他數(shù)據(jù)行為或模型不一致的數(shù)據(jù)對象稱為孤立點,在數(shù)據(jù)庫中查找識別孤立點的技術(shù)即為孤立點分析。在銀行、電信等行業(yè)的業(yè)務(wù)數(shù)據(jù)中發(fā)現(xiàn)的孤立點可能預(yù)示著欺詐行為,盡早識別,可以為企業(yè)減少不必要的經(jīng)濟損失。另外可用于網(wǎng)絡(luò)的入侵檢測,生態(tài)系統(tǒng)的失調(diào)檢測,特殊病種檢測等。
5.時序演變分析
時序演變分析是建立事件或?qū)ο笮袨殡S時間變化的規(guī)律或趨勢的模型。據(jù)此方法利用股市交易信息可分析股市的波動趨勢,利用商業(yè)交易信息可分析出產(chǎn)品的銷量變化趨勢、目標(biāo)市場發(fā)展趨勢等,利用天氣狀況數(shù)據(jù)可分析天氣的變化趨勢等。
6.文本信息抽取
文本信息抽取是從非結(jié)構(gòu)化的文本中提取重要信息的過程。利用該技術(shù)可獲取競爭情報,可從新聞等文本中動態(tài)抽取日期、地點和人物等信息,并借助關(guān)聯(lián)分析方法進一步識別出產(chǎn)品、企業(yè)、人、事件和地點之間的關(guān)系,使企業(yè)對競爭環(huán)境的感知更敏銳。
7.Web挖掘
Web挖掘是指從網(wǎng)絡(luò)環(huán)境中提取有價值信息的過程。如搜索引擎的應(yīng)用;如分析網(wǎng)站的參觀者和購買者的高頻率瀏覽路徑,以確定用戶對某產(chǎn)品的需求,發(fā)現(xiàn)用戶的個人喜好,發(fā)現(xiàn)用戶的去留傾向……據(jù)此可改變網(wǎng)頁的設(shè)置,為用戶提供個性化服務(wù),改變受歡迎產(chǎn)品的經(jīng)營和宣傳策略等。
三、數(shù)據(jù)挖掘流程及所面對的問題
數(shù)據(jù)挖掘流程可描述為“數(shù)據(jù)選擇→數(shù)據(jù)預(yù)處理→數(shù)據(jù)挖掘→模式評估→知識表示”。
數(shù)據(jù)挖掘首先根據(jù)分析目標(biāo)從數(shù)據(jù)源中選取與業(yè)務(wù)相關(guān)的數(shù)據(jù)。數(shù)據(jù)源是存儲業(yè)務(wù)數(shù)據(jù)的數(shù)據(jù)庫或數(shù)據(jù)倉庫。選取的數(shù)據(jù)通常會存在不完整、含噪聲(錯誤數(shù)據(jù))、不一致等問題,需要預(yù)處理數(shù)據(jù)使數(shù)據(jù)適合于挖掘。在這一過程中元數(shù)據(jù)起了非常重要的作用。
數(shù)據(jù)挖掘之前必須選定數(shù)據(jù)挖掘模型,即先做出某種假定,關(guān)聯(lián)分析、聚類分析及分類與預(yù)測為不同的挖掘模型。分析商品銷售數(shù)據(jù)時假定其中某些商品具有相關(guān)性,則選擇關(guān)聯(lián)分析模型,若挖掘的結(jié)果找到了產(chǎn)品A的購買帶來產(chǎn)品B的購買則是具體的模式。最終需要評測這種模式是不是真實有效且對商業(yè)決策有指導(dǎo)意義(模型評估,利用興趣度度量加人的識別),保留有意義的模型,并用一種用戶容易理解的方式表達出來(知識表示)。
數(shù)據(jù)的選擇和預(yù)處理會直接影響數(shù)據(jù)挖掘的結(jié)果。另外任何一種挖掘模型和挖掘算法都不是萬能的,不同的商業(yè)問題需要用不同的方法去解決。對于特定的商業(yè)問題和特定數(shù)據(jù)可能有多種算法,需要評估以選取最佳算法。
四、總結(jié)
數(shù)據(jù)挖掘作為正在興起并得到廣泛應(yīng)用的信息技術(shù)具有巨大的商業(yè)價值,特別是在銀行、電信、保險、交通、網(wǎng)上商城、超市等商業(yè)領(lǐng)域都有很好的表現(xiàn)。數(shù)據(jù)挖掘技術(shù)可以組織并深層次分析企業(yè)積累的海量業(yè)務(wù)數(shù)據(jù),預(yù)測客戶行為,預(yù)測產(chǎn)品狀況,預(yù)測市場走勢,幫助決策者正確判斷即將出現(xiàn)的機會,調(diào)整策略,減少風(fēng)險。因此利用數(shù)據(jù)挖掘技術(shù)必將大大提高商業(yè)組織利用信息的能力,使得信息更好地為決策服務(wù)。
但數(shù)據(jù)挖掘不是萬能的,在實際應(yīng)用中還要受到許多限制。有足夠的合適的數(shù)據(jù),選擇恰當(dāng)?shù)哪P秃退惴ǎ袥Q策者的支持等都是有效應(yīng)用數(shù)據(jù)挖掘技術(shù)的必要條件。
參考文獻:
[1]李佩鈺等:藍平長二 商業(yè)理論洛陽紙貴,http://biz.163.com
[2]欒世武:數(shù)據(jù)挖掘給企業(yè)應(yīng)用帶來什么,http://www.cnki.com.cn
[3]韓嘉偉等:數(shù)據(jù)挖掘概念與技術(shù).機械工業(yè)出版社,2001
[4]蘇新宇等:數(shù)據(jù)倉庫和數(shù)據(jù)挖掘.清華大學(xué)出版社,2006.10