亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于Apriori算法的購物籃分析

        2020-09-04 08:58:24司鳳娟
        科學與信息化 2020年21期
        關鍵詞:Apriori算法數(shù)據(jù)挖掘

        摘 要 采用數(shù)據(jù)挖掘技術中的Apriori算法,對購物籃進行關聯(lián)規(guī)則的分析。本文首先介紹了關聯(lián)規(guī)則算法的基本概念,然后運用R軟件中arules包中的函數(shù)Apriori對選取的數(shù)據(jù)進行分析,找到商品之間的關聯(lián),并根據(jù)模型結果給商場提出銷售建議,提高商場的競爭力。

        關鍵詞 數(shù)據(jù)挖掘;Apriori算法;R軟件

        引言

        隨著科學技術的不斷發(fā)展 ,各個行業(yè)都產生了大量的各種形式的數(shù)據(jù)。這些數(shù)據(jù)看起來復雜抽象,好像無任何規(guī)律,但是如果對數(shù)據(jù)進行分析,會發(fā)現(xiàn)其背后隱藏著很多有價值的重要信息,因此數(shù)據(jù)挖掘應運而生。數(shù)據(jù)挖掘是從大量的、不完全的、有噪聲的、模糊的、隨機的實際應用數(shù)據(jù)中,通過應用聚類、分類、回歸和關聯(lián)規(guī)則等技術,挖掘潛在價值的過程[1]。

        購物籃分析是零售行業(yè)最關注、最具有挑戰(zhàn)性的問題。本文應用關聯(lián)規(guī)則算法對顧客購買商品的種類、消費金額以及整個賣場的銷售數(shù)據(jù)進行分析,從而得到顧客的消費特征,這些特征包括顧客對商品的喜好、消費能力、品牌忠誠度以及潛在的消費需求,并根據(jù)這些特征制定行之有效的方案。

        1關聯(lián)規(guī)則算法

        1.1 關聯(lián)規(guī)則算法的相關概念

        關聯(lián)規(guī)則的支持度和置信度是用于度量關聯(lián)規(guī)則強度的兩個指標。

        支持度表示A和B同時發(fā)生的概率,如式(1)所示。

        置信度為A發(fā)生的條件下B發(fā)生的概率。提升度是A發(fā)生的條件下B發(fā)生的概率和B無條件下發(fā)生的概率之比。若lift>1,則說明A對B 具有提升作用;若lift<1,則作用相反。

        設I={i1,i2…i3}是二進制的集合,表示的是購物籃中商品的類別數(shù)為,其中每類商品稱為項。項的集合稱為項集,包含k項的集合為k-項集[2],其中()。每個項集都是的子集,項集的頻率等于所有包含此項集的購物籃個數(shù)與購物籃總數(shù)之比,它被稱為支持度。若項集的支持度大于或是等于預先規(guī)定的最小支持度的閾值,則此項集為頻繁項集,含有k項的頻繁項集記為Lk[1]。

        1.2 Apriori算法步驟

        假設共十個購物籃:{a,c,e},{b,d},{b,c},{a,b,c,d},{a,b},{b,c},{a,b},{a,b,c,e},{a,b,c},{a,c,e},運用Apriori算法步驟如下:

        步驟一:確定最小支持度為0.2,最小置信度為0.5;

        步驟二:確定I={a,b,c,d,e},以每樣商品為一項得到候選一項集的集合C1,根據(jù)式(1)計算每項的支持度,掃描C1,如果商品的支持度小于0.2,則刪除,得到一項頻繁項集L1;

        步驟三:L1和L1連接得到候選2項集C2,這步稱為連枝。然后計算C2中每項的支持度,然后是剪枝,如果支持度小于0.2,則刪除。頻繁項集還有一項要求是:頻繁項集的子集也必須是頻繁項集。根據(jù)這兩條原則得到二項頻繁項集L2;

        步驟四:L1和L2連接得到候選3項集C3,再掃描所有事務集,計算C3中每項的支持度,然后剪枝,得到三項頻繁項集L3;

        步驟五:以此類推L1和L3連接得到候選項集C4,再計算支持度,得到最終的頻繁項集;

        步驟六:應用R軟件求解,得到關聯(lián)規(guī)則。

        2應用Apriori算法分析購物籃

        某大型超市存儲了一段時間的購物籃數(shù)據(jù),共包括4835個購物籃的數(shù)據(jù),售出商品總數(shù)為22309件,包括168種不同的商品。首先應用R軟件對商品的銷售情況排序,全脂牛奶銷量最高,銷量為1278件,占比約為5.7%,其次為面包卷銷量為972,占比約為4.4%等。前20種商品的銷量占比約為50%,基本符合“二八原則”。通過對商品占比的分析,可以確定那些商品為主力商品,那些為輔助商品,初步確定商品的擺放順序。

        R語言中的arules包中的函數(shù)apriori可以對數(shù)據(jù)集進行關聯(lián)規(guī)則分析,經過多次分析,發(fā)現(xiàn)運用Aprior算法,當最小支持度取0.02,最小置信度取0.35時得到的關聯(lián)規(guī)則數(shù)目適中,結果良好。已提升度從高到低排列的前5條規(guī)則如表1所示,

        通過關聯(lián)規(guī)則分析,我們可以知道顧客在購買其他商品時會購買全脂牛奶,其次是購買其他蔬菜,這也和我們分析的熱銷商品相符合。因此,超市應該把這些熱銷商品放在顧客購買商品的必經之路,或是商場的中心位置,方便顧客購買。通過關聯(lián)規(guī)則還可以知道顧客會同時購買豬肉、根莖類蔬菜、其他蔬菜、蛋類等的可能性較高,因此這些物品應當放的位置比較接近,或是捆綁銷售,這樣方便了顧客,提升顧客的購物體驗,也會提高顧客對超市的忠誠度。

        3結束語

        隨著計算機技術和機器學習技術的不斷發(fā)展,數(shù)據(jù)挖掘技術有著廣闊的發(fā)展前景。關聯(lián)規(guī)則分析除了可以對購物籃進行分析,還可以應用到銀行客戶行為分析、學生成績關聯(lián)分析、試卷知識點關聯(lián)分析、醫(yī)療保險分析等。隨著電子商務的發(fā)展,關聯(lián)規(guī)則技術還被應用到電商平臺,根據(jù)客戶以往的購買記錄,分析他可能感興趣的商品。它還可以和其他的算法相結合運用,比如協(xié)同過濾算法 ,兩者結合,就可以向顧客推薦他們可能感興趣的商品。隨著對關聯(lián)規(guī)則認識的不斷加深,我們可以將更多的因素融入其中,來拓展關聯(lián)規(guī)則的應用廣度,讓其為更多的領域提供決策支持。

        參考文獻

        [1] 韓寶國,張良均.R語言商務數(shù)據(jù)分析實戰(zhàn)[M].北京:人民郵電出版社,2018:109.

        [2] 李毅.基于Apriori算法的試卷知識點關聯(lián)分析[J].新校園,2018(7):52.

        作者簡介

        司鳳娟(1979-),女,山東菏澤人;學歷:碩士,職稱:講師,現(xiàn)就職單位:菏澤學院,研究方向:概率論與數(shù)理統(tǒng)計。

        猜你喜歡
        Apriori算法數(shù)據(jù)挖掘
        探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
        基于并行計算的大數(shù)據(jù)挖掘在電網中的應用
        電力與能源(2017年6期)2017-05-14 06:19:37
        基于Hadoop平臺的并行DHP數(shù)據(jù)分析方法
        基于Apriori算法的高校學生成績數(shù)據(jù)關聯(lián)規(guī)則挖掘分析
        基于云平臺MapReduce的Apriori算法研究
        數(shù)據(jù)挖掘技術在中醫(yī)診療數(shù)據(jù)分析中的應用
        關聯(lián)規(guī)則挖掘Apriori算法的一種改進
        中國市場(2016年36期)2016-10-19 04:10:44
        基于RFID的汽車零件銷售策略支持模型
        關聯(lián)規(guī)則在高校評教系統(tǒng)中的應用
        一種基于Hadoop的大數(shù)據(jù)挖掘云服務及應用
        日韩精品免费观看在线| 色一情一乱一伦一区二区三区日本| 国产精品一区二区 尿失禁| 欧美1区二区三区公司| 色婷婷在线一区二区三区| 深夜放纵内射少妇| 久久久久久久久久久国产| 精品国产精品国产偷麻豆| 国产福利姬喷水福利在线观看| 人妻无码人妻有码不卡| 中文字幕人妻互换激情| 国产精品久久久久久| 亚洲精品久久无码av片软件| 欧美日韩国产高清| 日本韩国亚洲三级在线| 午夜男女很黄的视频| 97超级碰碰人妻中文字幕| 国产精品一区成人亚洲| 国产真实一区二区三区| 久久香蕉国产线看观看精品yw| 国产精品无需播放器| 日韩av在线不卡观看| 国产成年人毛片在线99| аⅴ资源天堂资源库在线| 囯产精品无码一区二区三区| 久久综合九色综合久久久 | 国模精品一区二区三区| 成人国产精品免费视频| 亚洲美女国产精品久久久久久久久 | 动漫在线无码一区| 免费蜜桃视频在线观看| 亚洲熟女综合色一区二区三区 | 国产成人精品免费久久久久| 国产av无码专区亚洲av中文| 91青青草在线观看视频| 久久精品国产亚洲av电影| 日韩精品一区二区三区中文| 亚洲一区二区三区99| 白白白色视频在线观看播放| 国产一级片毛片| 躁躁躁日日躁|