譚蘭蘭 曾瑩
摘 要:數(shù)據(jù)挖掘技術(shù)是目前一項重要的、具有廣闊應(yīng)用前景和富有挑戰(zhàn)性的綜合技術(shù)。文章介紹了數(shù)據(jù)挖掘技術(shù),闡述了數(shù)據(jù)挖掘在電子商務(wù)中的應(yīng)用流程,并探討了其在電子商務(wù)各方面的應(yīng)用,最后總結(jié)了數(shù)據(jù)挖掘存在的問題及其未來的發(fā)展。
關(guān)鍵詞:數(shù)據(jù)挖掘;電子商務(wù);數(shù)據(jù)預處理;可視化技術(shù)
引言
數(shù)據(jù)挖掘技術(shù)主要是指利用各種智能語言、數(shù)據(jù)庫以及統(tǒng)計分析來綜合化、智能化地分析數(shù)據(jù)的相關(guān)技術(shù),它在提取以及利用數(shù)據(jù)方面都有著至關(guān)重要的作用。電子商務(wù)是通過計算機網(wǎng)絡(luò)技術(shù)將商務(wù)過程電子化和虛擬化。如今電子商務(wù)在經(jīng)濟活動中得到了廣泛應(yīng)用,它在整個社會經(jīng)濟運行結(jié)構(gòu)中都是不可忽視的。隨著電子商務(wù)系統(tǒng)開發(fā)平臺的不斷改進與完善,數(shù)據(jù)挖掘技術(shù)將為電子商務(wù)的運行和發(fā)展提供強有力支持;是一項非常重要的技術(shù)[1]。運用數(shù)據(jù)挖掘技術(shù)能夠很好的解決當前電子商務(wù)主要存在的信用、配送和支付三個方面的問題,從而提高商業(yè)信譽和完善物流體系。
1 數(shù)據(jù)挖掘技術(shù)
數(shù)據(jù)挖掘(Data Mining)就是從隨機而又不完整的龐大數(shù)據(jù)中提取人們不知道、但又具有一定價值的信息的過程。提取的知識可以用來辨別和關(guān)聯(lián)數(shù)據(jù)庫記錄,為被挖掘的數(shù)據(jù)庫產(chǎn)生摘要,形成預報系統(tǒng),然后進行分類,最終將這些知識傳送給決策系統(tǒng)[2]。特別要明確的是,起初數(shù)據(jù)挖掘技術(shù)只是傾向于應(yīng)用方面的,一方面它是面向數(shù)據(jù)庫的簡單檢索和調(diào)用,另一方面要從各個角度全面地分析這些數(shù)據(jù),然后統(tǒng)計和綜合所有信息,最后得出最終結(jié)論。根據(jù)結(jié)論聯(lián)系實際來解決相關(guān)問題和嘗試尋找事件之間的聯(lián)系,甚至根據(jù)現(xiàn)有的數(shù)據(jù)預測未來的活動趨勢。
2 電子商務(wù)中數(shù)據(jù)挖掘的應(yīng)用流程
2.1 數(shù)據(jù)準備
數(shù)據(jù)選取和數(shù)據(jù)預處理是數(shù)據(jù)準備必不可少的兩部分。數(shù)據(jù)選取的意義在于根據(jù)用戶的需求從原來的數(shù)據(jù)系統(tǒng)中抽取所需要的特定數(shù)據(jù)。數(shù)據(jù)預處理一般包括數(shù)據(jù)清理、數(shù)據(jù)集成、數(shù)據(jù)變換和數(shù)據(jù)規(guī)約等多種方法,在實施數(shù)據(jù)挖掘之前,根據(jù)數(shù)據(jù)挖掘的需要與數(shù)據(jù)本身存在的特點,一一對應(yīng)地使用這些預處理技術(shù)可以在很大程度上提高數(shù)據(jù)挖掘的效率和質(zhì)量[3]。
2.2 數(shù)據(jù)挖掘
數(shù)據(jù)挖掘的目標和知識類型是挖掘時的首要明確點,然后根據(jù)目標和類型確定相應(yīng)的挖掘算法,最后結(jié)合選定的挖掘算法實施數(shù)據(jù)挖掘技術(shù),從而在數(shù)據(jù)庫中提煉出所需的知識。
2.3 數(shù)據(jù)模式的解釋與評價
對數(shù)據(jù)挖掘發(fā)掘的模式進行解釋和評價,篩選出有利用價值的知識。 具體包括除去多余的且沒有價值的模式,提取出要呈現(xiàn)給用戶的信息;部分模式因難以理解而不被用戶認可,而采取利用圖形學和圖像處理技術(shù)轉(zhuǎn)化數(shù)據(jù)的可視化技術(shù),可以將這些晦澀難懂的模式轉(zhuǎn)化成用戶樂于接受的簡易語言。完整數(shù)據(jù)挖掘技術(shù)的使用能夠讓用戶更明確的理解數(shù)據(jù)之間的關(guān)系。此外還包括判定當前模式是否需要重復操作和處理結(jié)果與知識存在的矛盾沖突來優(yōu)化以得到最合理的模式[4]。
3 數(shù)據(jù)挖掘在電子商務(wù)中的應(yīng)用
3.1 數(shù)據(jù)挖掘在營銷方面的應(yīng)用
數(shù)據(jù)挖掘通過收集客戶的消費信息對其進行加工和處理后確定特定消費者的興趣、消費習慣和消費需求,進而猜測消費者下一步的消費行為。通過分析產(chǎn)品銷售產(chǎn)量來制定商品的優(yōu)惠方案以及促銷活動的開展時間[5];為了及時做好信息反饋工作,必須要了解客戶的消費傾向,這就需要通過數(shù)據(jù)挖掘獲取客戶的點擊流信息;盡管相同類型的客戶之間具有許多相似的消費喜好,但也存在一定的需求差距,利用客戶聚類分析技術(shù)可以縮小這種差距從而更細的劃分客戶群體,然后提供相對應(yīng)的服務(wù);通過不定時與老客戶交流介紹和推送新的產(chǎn)品和服務(wù)模式;還可以通過分析客戶數(shù)據(jù)對市場層次做詳細地劃分,為電子商務(wù)打下基礎(chǔ)。
3.2 數(shù)據(jù)挖掘在客戶關(guān)系管理方面的應(yīng)用
客戶關(guān)系管理利用現(xiàn)代信息技術(shù)從客戶信息中挖掘有用的商業(yè)知識來指引企業(yè)的發(fā)展和管理,它是一種以客戶至上為理念的經(jīng)營方式,通過這種方式可以提高企業(yè)的市場競爭能力[6]。數(shù)據(jù)挖掘能為企業(yè)提供相關(guān)信息讓其預測客戶的消費行為從而進行分類。分類可以幫助企業(yè)尋找有價值的客戶,通過提供讓客戶滿意的個性服務(wù),提高客戶對企業(yè)的信任。隨著商業(yè)的發(fā)展,數(shù)據(jù)挖掘的地位越來越重要。數(shù)據(jù)挖掘可以通過跟蹤市場活動,不斷研發(fā)新的產(chǎn)品,進一步加強企業(yè)對客戶的管理,促進企業(yè)與客戶之間的聯(lián)系。利用客戶評價模型可以讓企業(yè)根據(jù)對客戶的評價來完善方案,不斷改進企業(yè)與客戶的關(guān)系從而提高收益[7]。企業(yè)可以通過挖掘客戶數(shù)據(jù)發(fā)掘中心客戶,與此同時對市場進行評估,制定合理的銷售方案,拓寬消費市場的范圍。通過不斷改善和增加與客戶聯(lián)系和溝通的方式,多渠道獲取客戶對企業(yè)的評價信息,不斷提高對客戶的服務(wù)質(zhì)量和效率,優(yōu)化客戶關(guān)系管理方式。
3.3 數(shù)據(jù)挖掘在網(wǎng)絡(luò)設(shè)計中的應(yīng)用
在網(wǎng)絡(luò)設(shè)計中也廣泛涉及了數(shù)據(jù)挖掘的應(yīng)用,例如挖掘網(wǎng)站建設(shè)中的相關(guān)內(nèi)容來組織網(wǎng)站信息;為了更好的優(yōu)化網(wǎng)站的結(jié)構(gòu),可以通過分析客戶對某個位置的訪問頻率來確定用戶的理想位置,從而在理想位置和實際位置之間建立導航鏈接;利用路徑分析技術(shù)搜索和優(yōu)化被訪問最多的路徑,從而設(shè)計出的更完美的頁面和網(wǎng)站結(jié)構(gòu),吸引更多的客戶;通過清除垃圾郵件改善用戶在網(wǎng)站中的檢索效果[8]。
4 結(jié)束語
數(shù)據(jù)挖掘技術(shù)目前仍然還存在一些問題,如如何選擇合適的分析變量、如何得到更精確的數(shù)據(jù)結(jié)果以及如何確保數(shù)據(jù)的私有性和安全性等問題。這就需要專業(yè)人員切實做好對數(shù)據(jù)挖掘技術(shù)的應(yīng)用研究工作。在科技迅猛發(fā)展的今天,數(shù)據(jù)挖掘技術(shù)得到了前所未有的重視和期待,而電子商務(wù)是現(xiàn)代信息技術(shù)發(fā)展的必然結(jié)果,這將使得各種數(shù)據(jù)挖掘技術(shù)源源不斷地運用到電子商務(wù)中去,從而在很大程度上促進電子商務(wù)的發(fā)展與普及。
參考文獻
[1]朱蔚恒,陳健.數(shù)據(jù)挖掘在電子商務(wù)中的應(yīng)用[J].計算機工程,2002,23(8):51-53.
[2]袁溪.數(shù)據(jù)挖掘技術(shù)及其應(yīng)用[J].科技資訊,2010(10).
[3]姚淼.數(shù)據(jù)挖掘在電子商務(wù)中的應(yīng)用[J].高校圖書情報論壇,2009,8(1).
[4]劉先花.淺談數(shù)據(jù)挖掘技術(shù)及其研究現(xiàn)狀[J].現(xiàn)代情報,2010(3).
[5]汪洪濤,劉文才,瞿中.數(shù)據(jù)挖掘在營銷策略中的應(yīng)用[J].微機發(fā)展,2003,13(6):32-34.
[6]郭大寧,王磊,陳成.數(shù)據(jù)挖掘在電子商務(wù)環(huán)境中的應(yīng)用研究[J].信息技術(shù),2004,28(10).
[7]鐘曉.數(shù)據(jù)挖掘綜述[J].模式識別與人工智能,2001,14(1):40-42.
[8]胡德森.數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的應(yīng)用[J].電子制作,2011,10(6):28-30.
作者簡介:譚蘭蘭(1995-),女,湖南攸縣人,湖南農(nóng)業(yè)大學東方科技學院,學生,本科,研究方向:數(shù)據(jù)庫技術(shù)。