郭德超+胡昌盛
【摘要】市場營銷學(xué)是經(jīng)濟管理類學(xué)生的專業(yè)基礎(chǔ)課程,在授課過程中,不僅要教授學(xué)生理論知識,更有教會學(xué)生融入現(xiàn)實經(jīng)濟管理活動中,為了激發(fā)學(xué)生的學(xué)習(xí)興趣,提升學(xué)生的實踐動手能力,本文探討了在課堂教學(xué)中引入開源數(shù)據(jù)挖掘軟件WEKA的教學(xué)方法,并給出了實訓(xùn)教學(xué)實例,對提升市場營銷學(xué)課程的實訓(xùn)質(zhì)量進行了有益的嘗試,課堂效果良好。
【關(guān)鍵詞】WEKA 市場營銷學(xué)教學(xué) Apriori關(guān)聯(lián)算法 購物籃分析
一、引言
市場營銷學(xué)是經(jīng)濟管理類專業(yè)學(xué)生的專業(yè)基礎(chǔ)課,隨著信息技術(shù)的飛速發(fā)展,無論是商品信息還是客戶信息均是海量的,如何在大數(shù)據(jù)中挖掘有用的營銷信息然后應(yīng)用到我們的營銷中去就是市場營銷專業(yè)學(xué)生需要解決的課題。計算機科學(xué)中的數(shù)據(jù)挖掘技術(shù)就是解決在大型數(shù)據(jù)庫中自動分析發(fā)現(xiàn)有用信息的技術(shù),其中Apriori關(guān)聯(lián)算法主要用于發(fā)現(xiàn)隱藏在大型數(shù)據(jù)中的有意義聯(lián)系,本文試圖在市場營銷學(xué)中以開源軟件WEKA為例,講解Apriori關(guān)聯(lián)算法在超市數(shù)據(jù)分析中的應(yīng)用,以此來引導(dǎo)學(xué)生用數(shù)據(jù)挖掘的方法來解決實際問題。
二、開源軟件WEKA簡介
WEKA[1]的全名是懷卡托智能分析環(huán)境(Waikato Environment for Knowledge Analysis),它的源代碼可通過http://www.cs.waikato.ac.nz/ml/WEKA得到。在第11屆ACM SIGKDD國際會議上,懷卡托大學(xué)的WEKA小組榮獲了數(shù)據(jù)挖掘和知識探索領(lǐng)域的最高服務(wù)獎,WEKA系統(tǒng)得到了廣泛的認(rèn)可,成為現(xiàn)今較完備的數(shù)據(jù)挖掘工具之一。WEKA作為一個開源的數(shù)據(jù)挖掘工作平臺,集合了大量能承擔(dān)數(shù)據(jù)挖掘任務(wù)的機器學(xué)習(xí)算法,包括對數(shù)據(jù)進行預(yù)處理、分類、回歸、聚類、關(guān)聯(lián)規(guī)則以及在新的交互式界面上的可視化[2],在現(xiàn)代商業(yè)社會,企業(yè)的數(shù)據(jù)一般是海量的,如果學(xué)生在進行營銷數(shù)據(jù)管理中能借助于先進軟件WEKA進行分析,從海量數(shù)據(jù)中挖掘出其背后隱藏的種種關(guān)系,肯定對于營銷數(shù)據(jù)的挖掘利用、商機的發(fā)現(xiàn)大有好處。
三、開源軟件WEKA在市場營銷學(xué)教學(xué)的應(yīng)用
在教學(xué)過程中我們選擇的是購物籃分析實驗,購物籃分析是將關(guān)聯(lián)技術(shù)用于交易過程,特別是分析超市收銀數(shù)據(jù),找出那些以成組出現(xiàn)的商品。對于營銷者來說,這是主要的用于數(shù)據(jù)挖掘的銷售信息來源,比如自動分析收銀數(shù)據(jù)后發(fā)現(xiàn):買啤酒的客戶也同時購買了薯片,對超市管理人員來說這個發(fā)現(xiàn)意義非常大,這些信息可以用于多種目的,比如規(guī)劃貨架的擺放位置、僅對會同時購買的商品中的一種進行打折銷售、提供與單獨銷售的產(chǎn)品相匹配的產(chǎn)品贈券等,商家還可以從顧客的購買行為中鑒別特殊客戶,不但可以分析其歷史購買模式,而且還能精確地針對潛在用戶提供特殊的極其可能感興趣的購買信息。
教學(xué)實驗中我們的實驗數(shù)據(jù)采用Weka自帶的一個超市購物籃分析數(shù)據(jù)集,文件名為supermarket.arff,這個數(shù)據(jù)集是從新西蘭的一個真實超市里搜集而來的,數(shù)據(jù)集屬性有217個,實例數(shù)量有4627個,很適合用來做購物籃分析實驗,首先使用Weka的Explorer界面的預(yù)處理面板,加載data目錄下的supermarket.arff文件,在Current relation子面板下,我們可以看到這個數(shù)據(jù)集的基本信息,由于數(shù)據(jù)集屬性比較多,數(shù)據(jù)量也比較大,因此此時會讓學(xué)生單擊預(yù)處理面板上部的Edit按鈕,打開數(shù)據(jù)集的Viewer窗口,查看數(shù)據(jù)文件,通過適當(dāng)?shù)闹v解讓學(xué)生理解數(shù)據(jù)的屬性和結(jié)構(gòu)。然后切換至關(guān)聯(lián)面板,選擇Apriori算法,保持選項為默認(rèn)值,單擊Start按鈕,啟動Apriori算法,運行結(jié)果如圖示。
運算結(jié)果得到的十條關(guān)聯(lián)規(guī)則中,多項商品多次出現(xiàn),而且總金額都很高。我們從中可以分析出:第一,購買餅干、冷凍食品等速食的顧客,會順便采購水果、蔬菜,以補充身體所需的維生素;第二,購買餅干、冷凍食品以及水果、蔬菜的顧客,會順便購買面包和蛋糕;第三,購買上述食品的顧客,一次購買量都很大,總金額會很高;第四,總金額較高的交易,一般都會購買面包和蛋糕等等。這些信息如果提供給超市方面,可以根據(jù)挖掘到的知識重新安排貨架、重新布局超市、提供快速付款通道以及安排送貨等附加服務(wù),以提升市場競爭力。
對以上結(jié)果進行分析以后,可以引導(dǎo)學(xué)生嘗試Apriori算法的不同參數(shù),然后分析其運算結(jié)果,看能否得到一些有價值的營銷信息。
四、結(jié)論
為了激發(fā)出學(xué)生學(xué)習(xí)市場營銷學(xué)課程的興趣,我們嘗試在教學(xué)過程中應(yīng)用了一個開源工具——WEKA,并借助它的可視化環(huán)境、典型算法,在課堂上為學(xué)生演示了一個實際問題的解決過程,通過這些教學(xué)步驟,讓學(xué)生循序漸進的做到了解開源軟件WEKA,掌握典型算法的使用,利用WEKA處理和分析商業(yè)數(shù)據(jù),提高數(shù)據(jù)處理能力,挖掘出對市場營銷有價值的信息來。同時WEKA軟件是開源軟件,對于有編程基礎(chǔ)的同學(xué)可以分析其算法的原理,也可以通過自己編程來優(yōu)化算法,進一步提升自己解決問題的能力。
參考文獻
[1]I.Witten,E.Frank.WEKA Machine Learning Algorithms in Java[D]. Data Mining:Practical Machine Learning Tools and Techniques with Java Implementations, Morgan Kaufmann Publishers, 2000.
[2]Kirkby R,F(xiàn)rank E.WEKA explorer user guide.[2007].http://www.cs.waikato.ac.nz/ml/WEKA/2004.
作者簡介:郭德超(1978-),男,碩士,研究方向:信息管理。