摘 ?要:本文針對某餐飲商家提供的客戶數(shù)據(jù)和菜品數(shù)據(jù),進行了數(shù)據(jù)預處理,并對處理后的數(shù)據(jù)進行建模分析。對客戶信息進行K-means(K均值)聚類,識別出高低價值的客戶群,為商家維系與客戶之間的關系提供參考。對菜品數(shù)據(jù)利用Apriori算法進行關聯(lián)規(guī)則挖掘,找出菜品之間的關聯(lián)關系,為菜品的促銷和推薦提供依據(jù)。
關鍵詞:聚類算法;關聯(lián)規(guī)則;餐飲服務;數(shù)據(jù)挖掘
中圖分類號:TP311.13 ? ? ?文獻標識碼:A 文章編號:2096-4706(2019)16-0010-04
Abstract:This paper conducts data preprocessing for customer data and dish data provided by a catering business,and models and analyzes the processed data. K-means clustering of customer information,identify high-low value customer groups,and provide reference for the relationship between merchants and customers. Use the Apriori algorithm to mine the association rules for the food data,find out the relationship between the dishes,and provide the basis for the promotion and recommendation of the dishes.
Keywords:clustering algorithm;association rules;catering;data mining
0 ?引 ?言
在數(shù)據(jù)暴增的當今時代,數(shù)據(jù)中含有大量有價值的信息,如何利用相關技術發(fā)現(xiàn)這些信息,并為商家和客戶帶來便利,是數(shù)據(jù)挖掘研究的熱點內(nèi)容。數(shù)據(jù)挖掘技術越來越廣泛地應用在各個行業(yè):徐毅佳[1]利用關聯(lián)規(guī)則挖掘輔助壽險公司的經(jīng)營策略,利用聚類算法和可視化技術分析理賠案件并發(fā)現(xiàn)欺詐案件。孫小川等人[2]將聚類算法應用在犯罪數(shù)據(jù)分析上,通過對數(shù)據(jù)進行加權優(yōu)化和機器學習方法,預測犯罪案由。駱赟韻等人[3]利用關聯(lián)規(guī)則技術發(fā)現(xiàn)當代中醫(yī)婦科名家痛經(jīng)用藥規(guī)律。楊柏丞等人[4]以事故類型為K-中心點算法的聚類中心,與關聯(lián)規(guī)則Apriori[5]算法進行融合,實現(xiàn)對海事事故數(shù)據(jù)的致因分析。郭振玉[6]提出一種改進的聚類分析與關聯(lián)規(guī)則方法,建立用戶行為模式庫,用于監(jiān)測用戶的異常行為分析。王斯鋒等人[7]在協(xié)同過濾推薦系統(tǒng)中,采用關聯(lián)規(guī)則挖掘用戶與項目之間的隱式交互記錄,利用聚類進行數(shù)據(jù)降維,減少數(shù)據(jù)的大小和項目空間的維度。餐飲行業(yè)的商家有著大量的客戶數(shù)據(jù)和菜品數(shù)據(jù),很多商家對于這些數(shù)據(jù)非常不敏感,白白浪費了很多有意義的隱含信息。周宇等人[8]提供了一種新型的電子餐飲服務解決方法,主要是利用網(wǎng)上訂餐平臺,來規(guī)范餐飲服務模式。韓建軍等人[9]基于餐飲服務的痛點,詳細探討了影響客戶滿意度的要素。
對于餐飲行業(yè)來說,商家要獲取長期的利潤,必須具有穩(wěn)定的、高質(zhì)量的客戶。保持客戶對于企業(yè)是至關重要的,不僅因為爭取一個新客戶的成本遠遠高于維持老客戶的成本,更重要的是客戶流失會造成企業(yè)收益的直接損失。因此商家應努力維系客戶關系,將在生命周期內(nèi)與客戶的互動價值最大化,并盡可能地保持這樣的高水平。
1 ?基于聚類的客戶價值分析
1.1 ?數(shù)據(jù)預處理
某餐廳提供的近三個月的部分客戶數(shù)據(jù)信息和菜品信息,其中包含客戶姓名、性別、消費次數(shù)、消費金額、最后一次消費時間、菜品名稱、被點次數(shù)等數(shù)據(jù)信息。數(shù)據(jù)集中有部分缺失值和異常值,如圖1所示,需要對這些值進行處理。
由關聯(lián)規(guī)則結果可得,當客戶點了e這道菜,我們會推薦a和c這兩道菜給客戶,或者捆綁a、e和a、c進行出售。同理,客戶點了c這道菜,我們會推薦a和b這兩道菜給客戶,或者捆綁c、b和a、c進行出售。用Apriori進行關聯(lián)規(guī)則挖掘,挖掘出來的結果可給商家提供推薦菜品和捆綁銷售的依據(jù)。
2 ?結 ?論
利用商家提供的客戶數(shù)據(jù)和菜品數(shù)據(jù),對數(shù)據(jù)進行預處理之后再建模。對于客戶數(shù)據(jù),用K-means聚類模型,將客戶分為不同價值的群體。對于菜品數(shù)據(jù),利用Apriori進行關聯(lián)規(guī)則挖掘,輸出菜品之間的關聯(lián)性。商家可針對客戶的不同價值進行客戶管理。比如給高價值客戶群提供關聯(lián)菜品推薦,并給出相應的折扣,保持這些客戶的忠誠度。對于“挽留”性質(zhì)的客戶,提醒近期的優(yōu)惠活動,優(yōu)惠活動依據(jù)關聯(lián)菜品的捆綁銷售等等。由此在提高客戶滿意度的同時,也能夠增加商家的利益。本文在菜品推薦部分利用關聯(lián)規(guī)則算法,該算法產(chǎn)生關聯(lián)規(guī)則的過程比較難,可以結合協(xié)同過濾及其改進的方法進行推薦,先構建用戶畫像,找出用戶的特征向量,并結合菜品的特征向量,進行準確率較高的推薦,這也是后續(xù)即將展開的研究。
參考文獻:
[1] 徐毅佳.商業(yè)智能數(shù)據(jù)挖掘技術提升客戶服務能力研究 [D].杭州:浙江工業(yè)大學,2019.
[2] 孫小川,蘆天亮.基于聚類的數(shù)據(jù)加權優(yōu)化在犯罪預測中的應用 [J].計算機與現(xiàn)代化,2019(6):55-59.
[3] 駱赟韻,李佳陽,黎小斌.基于關聯(lián)規(guī)則的當代中醫(yī)婦科名家痛經(jīng)用藥規(guī)律數(shù)據(jù)挖掘 [J].世界中醫(yī)藥,2019,14(5):1188-1191+1197.
[4] 楊柏丞,馬建斌,王哲凱,等.海事事故的聚類與關聯(lián)規(guī)則 [J].中國航海,2018,41(3):63-67.
[5] Agrawal R,Srikant R.Fast Algorithms for Mining Association Rules in Large Databases [C]//Proceedings of the 20th International Conference on Very Large Data Bases. IEEE,1994:487-499.
[6] 郭振玉.基于聚類分析和關聯(lián)規(guī)則的數(shù)據(jù)庫用戶行為模式分析的研究 [D].武漢:武漢理工大學,2016.
[7] 王斯鋒,朱玉佳,祝永志.使用隱式數(shù)據(jù)中的聚類和關聯(lián)規(guī)則挖掘提高協(xié)同過濾建議的準確性 [J].通信技術,2019,52(5):1108-1113.
[8] 周宇,張振軍,胡啟超,等.專注校園餐飲電子商務服務解決方案 [J].現(xiàn)代營銷(信息版),2019(6):76.
[9] 韓建軍,黃佩,俞華.餐飲行業(yè)服務對象分析 [J].質(zhì)量與認證,2019(5):54-56.
[10] Han J,Pei J,Yin Y.Mining Frequent Patterns Without Candidate Generation [A].Proceedings of 2000 ACM SIGMOD International Conference on the Management of Data [C].New York,USA:ACM Press,2000:1-12.
作者簡介:黎丹雨(1990-),女,漢族,湖北棗陽人,助教,碩士,研究方向:數(shù)據(jù)挖掘、機器學習。