亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        關(guān)聯(lián)規(guī)則在醫(yī)藥銷售行業(yè)的研究

        2014-10-27 16:51:20張峰吳辰曦
        無線互聯(lián)科技 2014年9期
        關(guān)鍵詞:關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘

        張峰 吳辰曦

        摘 要:本文通過對(duì)關(guān)聯(lián)規(guī)則挖掘的研究,探討了關(guān)聯(lián)規(guī)則在醫(yī)藥零售業(yè)中應(yīng)用,以期找出不同藥品間的銷售相關(guān)程度,提高藥品的營銷力度,挖掘頻繁項(xiàng)目集是關(guān)聯(lián)規(guī)則挖掘應(yīng)用中的核心技術(shù)。

        關(guān)鍵詞:數(shù)據(jù)挖掘;關(guān)聯(lián)規(guī)則;頻繁項(xiàng)集;醫(yī)藥營銷

        1 引言

        如今,數(shù)據(jù)挖掘已被各行各業(yè)所廣泛關(guān)注,關(guān)聯(lián)規(guī)則(Association Rules)挖掘是數(shù)據(jù)挖掘的一個(gè)重要分支,自從Agrawal于1993年提出了關(guān)聯(lián)規(guī)則挖掘的概念,吸引了越來越多的學(xué)者對(duì)其進(jìn)行研究。關(guān)聯(lián)規(guī)則是如下形式的邏輯蘊(yùn)涵:A→B,其中A,B是項(xiàng)集,A∈I,B∈I,A∩B=Ф,一般用來分析和發(fā)現(xiàn)數(shù)據(jù)事務(wù)集中不同變量或個(gè)體之間是否存在著某種關(guān)系,例如利用這些關(guān)系找出顧客購買行為模式。關(guān)聯(lián)規(guī)則源于購物籃分析,即購買A產(chǎn)品會(huì)不會(huì)刺激購買B產(chǎn)品,例如購買藥品A對(duì)購買其它藥品的相關(guān)影響,這時(shí)我們可以表示為“在購買了藥品A的顧客中,有K%的顧客又購買了B藥品”。發(fā)現(xiàn)這樣的規(guī)則可以應(yīng)用于藥品的貨架分類、庫存安排及根據(jù)購買行為模式對(duì)患者進(jìn)行分類??傊P(guān)聯(lián)規(guī)則通過對(duì)歷史數(shù)據(jù)進(jìn)行分析找出“哪些藥品會(huì)被顧客同時(shí)購買”。挖掘頻繁項(xiàng)目集是關(guān)聯(lián)規(guī)則挖掘應(yīng)用中的核心技術(shù),主要研究的關(guān)聯(lián)規(guī)則算法有搜索算法、深度優(yōu)先算法等,其中最為經(jīng)典的是Apriori算法[1]。

        2 關(guān)聯(lián)規(guī)則的基本概念

        關(guān)聯(lián)規(guī)則挖掘的主要任務(wù)是在歷史數(shù)據(jù)中發(fā)現(xiàn)所有強(qiáng)關(guān)聯(lián)規(guī)則,即在歷史數(shù)據(jù)中挖掘出所有滿足最小支持度min_support和最小置信度min_confidence的關(guān)聯(lián)規(guī)則。每一條被挖掘出來的關(guān)聯(lián)規(guī)則可以用一個(gè)蘊(yùn)含式,兩個(gè)閥值來進(jìn)行標(biāo)識(shí)。

        定義1:I={I1,I2…,Im},由m個(gè)項(xiàng)目組成的集合。其中I為有m個(gè)項(xiàng)目的集合(itemset),即項(xiàng)目集,Im為購買的第m件藥品。

        定義2:D={t1,t2,…,tn},由n項(xiàng)組成的集合,代表n位顧客的交易集合,其中tj={ ij1,ij2…,ijk},其中tj代表第j位顧客的交易清單,共購買了k項(xiàng)物品,ijk表示第j位顧客購買的第k件商品。

        定義3:關(guān)聯(lián)規(guī)則一般是形如A->B的蘊(yùn)涵式,它有兩個(gè)重要參數(shù),支持度sup和可信度conf。其中,sup(I1->I2)=P(I1∩I2),表示I1和I2同時(shí)購買的概率;conf(I1->I2)=P(I1|I2),表示在購買了I2的情況下購買I1的概率。

        定義4:若sup(I1->I2)>=min_support,conf(I1->I2)>= min_confidence,則(I1->I2)稱為強(qiáng)關(guān)聯(lián)規(guī)則,其中min_support稱為最小可信閾值,min_confidence稱為最小支持閾值,一般可以根據(jù)應(yīng)用經(jīng)驗(yàn)設(shè)定。

        定義5:若有項(xiàng)目集S,sup(S)>=min_support,則S就是一個(gè)頻繁項(xiàng)集,頻繁K-項(xiàng)集,通常記為LK。如果一個(gè)項(xiàng)目集S不滿足最小支持度,則稱為非頻繁項(xiàng)集。

        定義6:作用度(lift)是可信度與期望可信度的比值。作用度描述項(xiàng)目集X的出現(xiàn)對(duì)項(xiàng)目集Y的出現(xiàn)有多大影響。

        在藥品銷售中,“購買藥品A的同時(shí)也會(huì)購買藥品B”,類似的自然語言可以用如下規(guī)則表示:藥品A-->藥品B[sup=7%, conf=89%]。這個(gè)規(guī)則的含義是:在所有交易中,藥品A和藥品B有7%的概率會(huì)同時(shí)購買,并且在購買藥品B時(shí)會(huì)有89%的概率購買藥品A。

        3 關(guān)聯(lián)規(guī)則算法研究

        Apriori[2]算法是關(guān)聯(lián)規(guī)則挖掘中比較有影響力的算法,該算法利用了一個(gè)層次順序搜索的循環(huán)方法來完成頻繁項(xiàng)集的挖掘工作。這一循環(huán)方法就是利用k-項(xiàng)集來產(chǎn)生(k+1)-項(xiàng)集。具體做法就是[3]:首先找出頻繁1-項(xiàng)集,記為L1;然后利用L1來挖掘L2,即頻繁2-項(xiàng)集;不斷如此循環(huán)下去直到無法發(fā)現(xiàn)更多的頻繁k-項(xiàng)集為止。每挖掘一層Lk就需要掃描整個(gè)數(shù)據(jù)庫一遍[4]。

        (1)頻繁項(xiàng)集的所有非空子集也必須是頻繁的。

        (2)非頻繁項(xiàng)集的所有超集一定是非頻繁的。

        下面通過一個(gè)例子來研究Apriori算法是如何對(duì)一個(gè)事務(wù)數(shù)據(jù)庫進(jìn)行頻繁項(xiàng)集挖掘的。數(shù)據(jù)庫中有4個(gè)事務(wù),交易數(shù)據(jù)庫D中共有4條記錄,如表1所示,假設(shè)支持度閾值50%(即最小支持度計(jì)數(shù)為2)。

        掃描數(shù)據(jù)庫,得到候選1-項(xiàng)集C1 ,如表2所示。

        比較C1中各項(xiàng)的支持度計(jì)數(shù)與最小支持度計(jì)數(shù),得到頻繁1-項(xiàng)集L1,如表3所示。

        使用L1⊕L1生成候選2-項(xiàng)集C2,掃描數(shù)據(jù)庫,得到C2各項(xiàng)的支持度計(jì)數(shù),如表4所示。

        比較C2中各項(xiàng)的支持度計(jì)數(shù)與最小支持度計(jì)數(shù),得到頻繁2-項(xiàng)集L2,如表5所示。

        使用L2⊕L2生成候選3-項(xiàng)集C3,同時(shí)根據(jù)Apriori性質(zhì)剪枝,并掃描數(shù)據(jù)庫,得到C3各項(xiàng)的支持度,如表6所示。

        比較C3中各項(xiàng)的支持度計(jì)數(shù)與最小支持度計(jì)數(shù),得到頻繁3-項(xiàng)集L3,如表7所示。

        因?yàn)樵诶又袩o法產(chǎn)生候選4-項(xiàng)集,即C4= ,所以Apriori算法停止連接,得出頻繁項(xiàng)集BCE。

        4 結(jié)論

        通過利用Apriori算法對(duì)事物數(shù)據(jù)庫挖掘,最終得出了頻繁項(xiàng)集,根據(jù)該結(jié)論便可對(duì)藥品貨架分類、庫存安排及根據(jù)購買行為模式對(duì)患者進(jìn)行分類。Apriori過程需要完成兩種操作,一是連接操作,二是消減操作,可能產(chǎn)生大量的候選集和重復(fù)掃描數(shù)據(jù)庫。

        [參考文獻(xiàn)]

        [1]J.HanandM.Kamber著,范明,孟小峰,等,譯.數(shù)據(jù)挖掘概念技術(shù).北京:機(jī)械工業(yè)出版社,2001:149-178.

        [2]楊君銳.關(guān)于最大頻繁項(xiàng)集的增量式挖掘方法研究.計(jì)算機(jī)研究與發(fā)展,2004,41:270-275.

        [3]歐陽為民,蔡慶生.數(shù)據(jù)庫中的時(shí)態(tài)數(shù)據(jù)發(fā)掘研究[J].計(jì)算機(jī)科學(xué),1998,25(4):60-63.

        [4]楊炳儒.多最小支持度規(guī)則的挖掘算法[J].計(jì)算機(jī)工程.2003.Vol.29 No.6.40-41.151.

        猜你喜歡
        關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘
        探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢(shì)
        基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
        電力與能源(2017年6期)2017-05-14 06:19:37
        基于Apriori算法的高校學(xué)生成績數(shù)據(jù)關(guān)聯(lián)規(guī)則挖掘分析
        基于關(guān)聯(lián)規(guī)則和時(shí)間閾值算法的5G基站部署研究
        關(guān)聯(lián)規(guī)則,數(shù)據(jù)分析的一把利器
        數(shù)據(jù)挖掘在高校課堂教學(xué)質(zhì)量評(píng)價(jià)體系中的應(yīng)用
        數(shù)據(jù)挖掘技術(shù)在中醫(yī)診療數(shù)據(jù)分析中的應(yīng)用
        關(guān)聯(lián)規(guī)則挖掘Apriori算法的一種改進(jìn)
        基于關(guān)聯(lián)規(guī)則的計(jì)算機(jī)入侵檢測(cè)方法
        一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
        区一区二区三区四视频在线观看 | 蜜桃av噜噜一区二区三区9| 无码人妻丰满熟妇区五十路| 欧美粗大无套gay| a级国产精品片在线观看| 综合久久加勒比天然素人| 91精品亚洲成人一区二区三区| 999国内精品永久免费观看| 欧美亚洲日本在线| 成年女人18毛片毛片免费| 久久精品国产亚洲av成人文字| 国产成年女人毛片80s网站| 久久国产精品久久精品国产| 无码 免费 国产在线观看91| 一区二区在线观看日本视频| 黄桃av无码免费一区二区三区| 国产成人无码区免费网站| 亚欧免费无码AⅤ在线观看| 国内精品国产三级国产| 一本大道无码人妻精品专区| 亚洲av之男人的天堂| 日韩狼人精品在线观看| 富婆猛男一区二区三区| 漂亮人妻被中出中文字幕久久| 欧美韩日亚洲影视在线视频| 黄色中文字幕视频网站| 亚洲一区二区女搞男| 亚洲高潮喷水无码av电影| 国产在线视频h| 免费在线亚洲视频观看| 午夜男女很黄的视频| 无码中文字幕在线DVD| 精品日产一区2区三区| 亚洲最近中文字幕在线 | 中文字幕 人妻熟女| av毛片在线播放网址| 手机在线观看免费av网站| 亚洲爆乳精品无码一区二区| 国产在线视欧美亚综合| 少妇熟女天堂网av天堂| 少妇熟女天堂网av|