曲小納
摘 要 隨著互聯(lián)網(wǎng)技術(shù)的不斷發(fā)展,“時(shí)間就是金錢”的市場(chǎng)規(guī)則下,如何主動(dòng)獲知客戶喜好并開發(fā)其購買潛力,從中獲取一定的信息以提高電子商務(wù)企業(yè)的競(jìng)爭(zhēng)力是一個(gè)迫在眉睫的問題。本文使用數(shù)據(jù)挖掘中的關(guān)聯(lián)分析方法,找出真正有價(jià)值的信息,來指導(dǎo)商業(yè)者的決策。
關(guān)鍵詞 電子商務(wù) 數(shù)據(jù)挖掘 關(guān)聯(lián)分析
中圖分類號(hào):TP311.13 文獻(xiàn)標(biāo)識(shí)碼:A
1 電子商務(wù)
電子商務(wù)指交易當(dāng)事人或參與人利用現(xiàn)代信息技術(shù)和計(jì)算機(jī)網(wǎng)絡(luò)(主要是因特網(wǎng))所進(jìn)行的各類商業(yè)活動(dòng),包括貨物貿(mào)易、服務(wù)貿(mào)易和知識(shí)產(chǎn)權(quán)貿(mào)易。①它的飛速發(fā)展,促使經(jīng)銷商和客戶之間通過互聯(lián)網(wǎng)進(jìn)行交易,節(jié)省了大量的費(fèi)用和時(shí)間。幫助企業(yè)經(jīng)銷商收集了大量的數(shù)據(jù),隨著電子商務(wù)的不斷發(fā)展,將這些大量數(shù)據(jù)轉(zhuǎn)化成有價(jià)值的信息,以達(dá)到企業(yè)增加收入,降低成本,使企業(yè)處于有利的競(jìng)爭(zhēng)位置的目的。
2 基于關(guān)聯(lián)分析的數(shù)據(jù)挖掘
數(shù)據(jù)挖掘是從大規(guī)模的數(shù)據(jù)中抽取非平凡的、隱含的、事先未知的、有潛在使用價(jià)值的信息的技術(shù),是屬于發(fā)現(xiàn)型的技術(shù)。它為解決此類各種應(yīng)用問題提供了強(qiáng)有力的計(jì)算支持。數(shù)據(jù)挖掘所涉及的學(xué)科領(lǐng)域和方法很多,關(guān)聯(lián)分析是最常見的數(shù)據(jù)挖掘之一。
關(guān)聯(lián)規(guī)則就是從一種行為中發(fā)現(xiàn)與之相關(guān)聯(lián)的另一種行為,及A→B,并用一定的概率度加以保證。關(guān)聯(lián)分析發(fā)現(xiàn)的主要對(duì)象是交易型數(shù)據(jù)庫,一個(gè)交易一般有交易處理時(shí)間,一組顧客購買的物品,有時(shí)也有顧客標(biāo)識(shí)號(hào)組成。由于電子商務(wù)的發(fā)展,銷售商可以方便地收集存儲(chǔ)大量的售貨數(shù)據(jù)。對(duì)這些歷史交易型數(shù)據(jù)進(jìn)行關(guān)聯(lián)分析,則可對(duì)客戶的購買行為提供極有價(jià)值的信息。例如,可以幫助零售商(怎樣相互搭配銷售),通過關(guān)聯(lián)分析發(fā)現(xiàn)交易數(shù)據(jù)中常常隱含形式的規(guī)律,對(duì)于改進(jìn)銷售業(yè)績(jī)等商業(yè)活動(dòng)的決策是非常重要的。
3 關(guān)聯(lián)分析在電子商務(wù)中的應(yīng)用
本文對(duì)關(guān)聯(lián)規(guī)則在電子商務(wù)中的應(yīng)用進(jìn)行討論,提出了關(guān)聯(lián)規(guī)則在電子商務(wù)中應(yīng)用的步驟,得出了基于關(guān)聯(lián)規(guī)則的商品銷售模式。②電子商務(wù)中的數(shù)據(jù)不僅十分龐大、復(fù)雜,而且包含著許多有用信息。隨著數(shù)據(jù)挖掘技術(shù)的發(fā)展以及各種數(shù)據(jù)挖掘方法的應(yīng)用,從電子商務(wù)數(shù)據(jù)庫中可以發(fā)現(xiàn)一些潛在的、有用的、有價(jià)值的信息來。通過對(duì)所積累的銷售數(shù)據(jù)的分析,可以得出各種商品的銷售信息。從而更合理地制定各種商品的定貨情況,對(duì)各種商品的庫存進(jìn)行合理地控制。另外根據(jù)各種商品銷售的相關(guān)情況,可分析商品的銷售關(guān)聯(lián)性,從而可以進(jìn)行商品的組合管理,以更加有利于商品銷售。
關(guān)聯(lián)規(guī)則挖掘問題就是首先確定所要挖掘規(guī)則的最小支持度與最小置信度,然后在交易數(shù)據(jù)庫D中找出具有用戶給定的最小支持度minsup和最小置信度minconf的關(guān)聯(lián)規(guī)則。③
3.1關(guān)聯(lián)規(guī)則發(fā)現(xiàn)算法描述
關(guān)聯(lián)規(guī)則挖掘問題可以劃分成兩個(gè)子問題:(1)發(fā)現(xiàn)頻繁項(xiàng)目集和生成關(guān)聯(lián)規(guī)則。相對(duì)于第一個(gè)子問題而言;(2)子問題相對(duì)簡(jiǎn)單。因此,第一個(gè)子問題是近年來關(guān)聯(lián)規(guī)則算法研究的重點(diǎn)。
3.2數(shù)據(jù)描述及預(yù)處理
在電子商務(wù)中通過分類分析,得到客戶分類模式后,就可以針對(duì)不同類客戶的特點(diǎn)展開不同的商務(wù)活動(dòng),提供有針對(duì)性的個(gè)性化的信息服務(wù);得到客戶的分類模式后,還可以對(duì)新的客戶進(jìn)行分析,分析新的客戶屬于哪一個(gè)類別,從而有針對(duì)性的開展商務(wù)活動(dòng)。
3.4 進(jìn)一步計(jì)算置信度得出關(guān)聯(lián)規(guī)則
進(jìn)一步計(jì)算置信度,如表4,中Lk為k-頻繁項(xiàng)目集,y為L(zhǎng)k的非空子集。
根據(jù)以上關(guān)聯(lián)規(guī)則,商家可以將牛奶、火腿、面包放在同一網(wǎng)頁上進(jìn)行銷售,而果啤則應(yīng)該放到另一個(gè)網(wǎng)頁上銷售,可以幫助管理者規(guī)劃市場(chǎng),確定商品的種類,價(jià)格、質(zhì)量等。
4 結(jié)束語
電子商務(wù)過程中的各種信息和數(shù)據(jù)是電子商務(wù)活動(dòng)能夠更好的進(jìn)行的基礎(chǔ),通過選擇合適的數(shù)據(jù)挖掘技術(shù)來挖掘電子商務(wù)中有價(jià)值的信息,從而使企業(yè)在激烈的市場(chǎng)競(jìng)爭(zhēng)中做出正確的決策,保持有力的競(jìng)爭(zhēng)優(yōu)勢(shì)。隨著數(shù)據(jù)挖掘技術(shù)的不斷發(fā)展,相信它在電子商務(wù)中的應(yīng)用將促使其得到更快更高效的發(fā)展。
注釋
① 孫海峰.促進(jìn)我國(guó)電子商務(wù)發(fā)展的思考.經(jīng)濟(jì)師, 2007.
② 張愛國(guó),數(shù)據(jù)挖掘在超級(jí)市場(chǎng)中的應(yīng)用[J].農(nóng)業(yè)網(wǎng)絡(luò)信息,2005(1):43-44
③ 薛薇,SPSS統(tǒng)計(jì)分析方法及應(yīng)用[M].北京:電子工業(yè)出版社,2004.
④ 王國(guó)君,段立娟,王實(shí),等.數(shù)據(jù)挖掘原理與算法[M],北京:清華大學(xué)出版社,2005.