亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        動態(tài)環(huán)境下多個時期的客戶購物模式變化挖掘

        2012-06-28 03:56:10朱慧云陳森發(fā)張麗杰
        關(guān)鍵詞:置信度購物關(guān)聯(lián)

        朱慧云 陳森發(fā) 張麗杰

        (1東南大學(xué)經(jīng)濟(jì)管理學(xué)院,南京210096)

        (2南京信息工程大學(xué)經(jīng)濟(jì)管理學(xué)院,南京210044)

        隨著數(shù)據(jù)收集技術(shù)和數(shù)據(jù)庫技術(shù)的發(fā)展,企業(yè)積累了海量的客戶購物數(shù)據(jù),關(guān)聯(lián)規(guī)則挖掘可以從中挖掘出經(jīng)常被一起購買的商品的信息,從而幫助管理者進(jìn)行貨架陳設(shè)、交叉銷售等,以獲得更多的利潤.傳統(tǒng)的關(guān)聯(lián)規(guī)則挖掘算法將數(shù)據(jù)集看作是靜態(tài)的,從中挖掘出滿足最小支持度閾值和最小置信度閾值的強(qiáng)關(guān)聯(lián)規(guī)則,并不考慮時間因素.然而,購物數(shù)據(jù)通常具有時間特性,客戶的購物模式可能會隨時間而改變,同一個購物模式在不同時期可能會發(fā)生很大變化.例如,每年新學(xué)年開學(xué)前有更多客戶會同時購買書包和文具,這種關(guān)聯(lián)規(guī)則“購買書包的同時也購買文具”的支持度就會遠(yuǎn)遠(yuǎn)大于平時.挖掘客戶購物模式變化的目的在于:①發(fā)現(xiàn)變化的趨勢并及時調(diào)整企業(yè)的管理策略,提供適當(dāng)?shù)漠a(chǎn)品或服務(wù);②及時發(fā)現(xiàn)不良的變化模式,以便采取補(bǔ)救措施減緩變化.因此,研究客戶購物模式隨時間發(fā)生變化的規(guī)律具有重要的現(xiàn)實(shí)意義,是企業(yè)重要的競爭優(yōu)勢.

        為了理解客戶行為變化模式,Song等[1]定義了3種不同的變化類型,對2個不同時期數(shù)據(jù)集的關(guān)聯(lián)規(guī)則進(jìn)行比對,根據(jù)規(guī)則的相似度和相異度找出不同類型的變化;然而,這種方法比較的關(guān)聯(lián)規(guī)則后件僅為1個.Chen等[2]對此方法進(jìn)行了擴(kuò)展,從而可以比較后件為2個或者更多個時的關(guān)聯(lián)規(guī)則.Liu 等[3]和 Shih 等[4]分別將這種方法應(yīng)用于企業(yè)事件變化探測和臺灣半導(dǎo)體工業(yè)專利的變化分析中,進(jìn)一步證明了該方法的有效性.

        上述研究均針對的是2個不同時期的數(shù)據(jù)集的變化挖掘問題,近年來多個時期的變化分析也引起了研究者們的興趣.相關(guān)研究可以分為以下2類:①建立更有效的動態(tài)關(guān)聯(lián)規(guī)則算法.戴群達(dá)[5]提出了一種挖掘多個時期數(shù)據(jù)集模式變化的方法,直接將模式的成長幅度作為篩選標(biāo)準(zhǔn),以此選出所有符合變化趨勢的模式;沈斌等[6]提出了2種新的動態(tài)關(guān)聯(lián)規(guī)則挖掘算法(ITS算法和EFP-growth算法),均具有較好的挖掘性能和可擴(kuò)展性.② 分析關(guān)聯(lián)規(guī)則或頻繁項(xiàng)集隨時間發(fā)生的變化.Liu等[7]從時間維的角度分析關(guān)聯(lián)規(guī)則的興趣度,考察關(guān)聯(lián)規(guī)則的支持度(或置信度)的穩(wěn)定或趨勢變化;B?ttcher等[8]使用非參量統(tǒng)計(jì)檢驗(yàn)的方法發(fā)現(xiàn)了頻繁項(xiàng)集支持度序列的穩(wěn)定或趨勢變化傾向,分析了客戶群體隨時間推移而發(fā)生的變化.然而,這些研究只說明了變化的模式,未能評估變化的程度,且僅分析了穩(wěn)定和趨勢變化2種情況,未考慮其他變化類型.

        本文針對第2類研究的不足,提出了一種挖掘多個時期客戶購物變化模式的方法.在已有的穩(wěn)定和趨勢變化2種變化類型基礎(chǔ)上,提出了突變規(guī)則的概念,使用格拉布斯檢驗(yàn)發(fā)現(xiàn)突變規(guī)則,繼而提出評估變化程度的度量方法.這樣不僅能說明變化模式,還能告訴用戶變化的程度.

        1 變化類型

        進(jìn)行變化挖掘,首先需要定義所有可能的變化類型.具體描述如下:數(shù)據(jù)集D被分割成若干個不同時期 Ti(i=1,2,…,n)的數(shù)據(jù)集 Di(D=D1∪D2∪…∪Dn);Ri為Ti時期發(fā)現(xiàn)的規(guī)則集合,且規(guī)則集合R=R1∪R2∪…∪Rn;規(guī)則r為R中的一個規(guī)則;si為規(guī)則r在Ti時期的支持度;ci為規(guī)則r在Ti時期的置信度.

        定義1(支持度(或置信度)穩(wěn)定規(guī)則)對于集合R中的任一條規(guī)則r,如果r的支持度(或置信度)在 T1,T2,…,Tn時期基本保持不變(沒有顯著性差異),那么規(guī)則r是一個支持度(或置信度)穩(wěn)定規(guī)則.

        定義2(支持度(或置信度)增強(qiáng)趨勢規(guī)則)對于集合R中的任一條規(guī)則r,如果規(guī)則的支持度(或置信度)滿足 si≤si+1或ci≤ci+1,那么規(guī)則 r是一個支持度(或置信度)增強(qiáng)趨勢規(guī)則.

        定義3(支持度(或置信度)下降趨勢規(guī)則)對于集合R中的任一條規(guī)則r,如果規(guī)則的支持度(或置信度)滿足 si≥si+1或ci≥ci+1,那么規(guī)則 r是一個支持度(或置信度)下降趨勢規(guī)則.

        增強(qiáng)趨勢規(guī)則和下降趨勢規(guī)則都是趨勢規(guī)則,分別對應(yīng)支持度(或置信度)隨時間呈增長的趨勢和下降的趨勢.

        定義4(支持度(或置信度)突變規(guī)則)對于集合R中的任一條規(guī)則r,如果支持度(或置信度)序列中存在孤立點(diǎn),那么規(guī)則r是一個支持度(或置信度)突變規(guī)則.

        現(xiàn)有研究[7-8]已發(fā)現(xiàn)穩(wěn)定規(guī)則和趨勢規(guī)則,但沒有考慮支持度序列中存在孤立點(diǎn)的情況,而這一情況在進(jìn)行客戶購物變化模式分析時是不可忽略的,如前述的關(guān)聯(lián)規(guī)則“購買書包的同時也購買文具”的支持度在新學(xué)期開學(xué)前會遠(yuǎn)遠(yuǎn)高于平時.考慮到這一情況,本文定義了突變規(guī)則.

        2 規(guī)則發(fā)現(xiàn)

        從上述定義可以看出,客戶購物模式變化挖掘的關(guān)鍵是對規(guī)則的支持度(或置信度)序列進(jìn)行有效分析,分別采用χ2檢驗(yàn)、Mann-Kendall檢驗(yàn)和格拉布斯檢驗(yàn)來發(fā)現(xiàn)穩(wěn)定規(guī)則、趨勢規(guī)則和突變規(guī)則.

        穩(wěn)定規(guī)則是支持度(或置信度)不隨時間變化的規(guī)則,用χ2檢驗(yàn)發(fā)現(xiàn)穩(wěn)定規(guī)則.由于χ2檢驗(yàn)有時會將有趨勢的時間序列誤判為穩(wěn)定的,因此,將穩(wěn)定規(guī)則的判定放在趨勢規(guī)則發(fā)現(xiàn)之后進(jìn)行.趨勢規(guī)則發(fā)現(xiàn)實(shí)質(zhì)上是一個時間序列的趨勢分析問題,Mann-Kendall檢驗(yàn)常用來解決這一問題.Mann-Kendall檢驗(yàn)是一種非參數(shù)檢驗(yàn)方法,不需要樣本遵從一定分布,也不受異常值干擾,非常適合客戶購物趨勢規(guī)則的發(fā)現(xiàn).

        突變規(guī)則是支持度(或置信度)序列中存在孤立點(diǎn)的規(guī)則,這是本文提出的一個新概念.客戶購物的突變規(guī)則反映出客戶在某一時期的購物模式和平時大不相同.格拉布斯檢驗(yàn)是在未知標(biāo)準(zhǔn)差情形下判斷一個數(shù)據(jù)是否為孤立點(diǎn)的常用方法,國際計(jì)量標(biāo)準(zhǔn)(GB 4883—85)推薦檢驗(yàn)一個可疑值時以格拉布斯檢驗(yàn)法為準(zhǔn),因此本文選擇格拉布斯檢驗(yàn)作為識別突變規(guī)則的方法.

        客戶購物模式變化挖掘可以分為以下3個步驟:

        ①選擇合適的關(guān)聯(lián)規(guī)則挖掘算法以挖掘多個不同時期的數(shù)據(jù)集,得到多個關(guān)聯(lián)規(guī)則集以及規(guī)則的支持度(或置信度),掃描數(shù)據(jù)庫,補(bǔ)充缺失的支持度(或置信度)信息;

        ② 用Mann-Kendall檢驗(yàn)發(fā)現(xiàn)趨勢規(guī)則,用χ2檢驗(yàn)發(fā)現(xiàn)穩(wěn)定規(guī)則,用格拉布斯檢驗(yàn)發(fā)現(xiàn)突變規(guī)則;

        ③評估規(guī)則變化的程度,進(jìn)行冗余檢測,并輸出顯著變化的規(guī)則.

        3 興趣度度量

        3.1 變化程度的評估

        經(jīng)過規(guī)則發(fā)現(xiàn)步驟,可以發(fā)現(xiàn)多種的穩(wěn)定規(guī)則、趨勢規(guī)則和突變規(guī)則,這些模式不是同樣重要的,用戶對其中的部分模式可能更感興趣.對挖掘出來的穩(wěn)定規(guī)則、趨勢規(guī)則和突變規(guī)則進(jìn)行興趣度的客觀度量是本文方法中的一個重要步驟;據(jù)筆者所知,這在現(xiàn)有文獻(xiàn)中未見報道.

        挖掘出的穩(wěn)定規(guī)則可能有多個,用戶一般對支持度(或置信度)較大的穩(wěn)定規(guī)則更感興趣,這是因?yàn)橹С侄?或置信度)較大的穩(wěn)定規(guī)則對應(yīng)的是覆蓋面較大或確定性較大的規(guī)則.因此,將規(guī)則r的支持度(或置信度)均值sm(或cm)作為穩(wěn)定規(guī)則興趣度的客觀度量,根據(jù)支持度(或置信度)的大小輸出穩(wěn)定規(guī)則.

        對于趨勢規(guī)則,需要度量規(guī)則的變化程度,變化程度較大的模式更有趣.Mann-Kendall檢驗(yàn)中的Kendall斜率β表示趨勢的顯著程度,即變化的顯著程度,計(jì)算公式如下:

        式中,median()表示取中位數(shù)函數(shù).將β作為趨勢規(guī)則興趣度的客觀度量,可根據(jù)β的絕對值大小輸出趨勢規(guī)則.

        突變規(guī)則的支持度(或置信度)序列中存在孤立點(diǎn),將孤立點(diǎn)的偏離程度作為模式興趣度的度量.對于支持度序列,若so是序列中偏離最大的孤立點(diǎn)(即用格拉布斯檢驗(yàn)法檢出的第1個孤立點(diǎn))的支持度,則興趣度度量可表示為同理,置信度突變規(guī)則的興趣度度量可表示為

        3.2 冗余檢測

        對于支持度變化規(guī)則,需要考慮冗余的問題.例如,關(guān)聯(lián)規(guī)則“Candy and Snack Foods? Vegetables”和規(guī)則“Vegetables and Snack Foods? Candy”雖然不同,但是這2個規(guī)則對應(yīng)的頻繁項(xiàng)集相同,都是{Vegetables,Snack Foods,Candy},因此這2條規(guī)則的支持度相同.在輸出支持度變化規(guī)則時,僅輸出其中一個規(guī)則,其余規(guī)則作為冗余并不輸出.對于置信度變化規(guī)則的輸出,不考慮冗余過濾的問題.

        4 實(shí)證分析

        分析數(shù)據(jù)來自于Microsoft SQL Sever 2000軟件的一個示例數(shù)據(jù)庫Foodmart.該數(shù)據(jù)庫中存儲福特馬食品連鎖經(jīng)銷商店的產(chǎn)品數(shù)據(jù)、客戶數(shù)據(jù)和銷售數(shù)據(jù).選取1997年的銷售數(shù)據(jù),將同一客戶在同一時間購買的商品視為同一購物籃,并將底層商品概化到商品類的層次.首先將數(shù)據(jù)集按照月份劃分為12個數(shù)據(jù)子集,以識別多個時期客戶的購物模式變化.利用Clementine軟件中的Carma算法,挖掘12個不同時期的數(shù)據(jù)集(設(shè)置最小規(guī)則支持度閾值為1%),得到12個關(guān)聯(lián)規(guī)則集合以及規(guī)則的支持度序列集合,并補(bǔ)充缺失的支持度數(shù)據(jù).

        利用Matlab7.0工具建立變化挖掘模型,對于規(guī)則集的支持度序列集合,使用Mann-Kendall檢驗(yàn)、χ2檢驗(yàn)和格拉布斯檢驗(yàn)分別發(fā)現(xiàn)趨勢規(guī)則、穩(wěn)定規(guī)則和突變規(guī)則,所有檢驗(yàn)的顯著水平α均取為0.05,挖掘出的變化規(guī)則數(shù)目見表1.在 Matlab7.0中,對去除孤立點(diǎn)的支持度序列進(jìn)行正態(tài)分布檢驗(yàn),結(jié)果符合正態(tài)分布,說明采用格拉布斯檢驗(yàn)發(fā)現(xiàn)突變規(guī)則是可行的.用式(1)評估規(guī)則變化程度,并去除冗余的規(guī)則,得到的變化規(guī)則及其興趣度見表2~表6.

        表1 變化規(guī)則的數(shù)目(支持度)

        表2 支持度穩(wěn)定規(guī)則

        表3 支持度增強(qiáng)趨勢規(guī)則

        表4 支持度下降趨勢規(guī)則

        表5 支持度突變規(guī)則

        從表1可以看出,在所有的變化規(guī)則中穩(wěn)定規(guī)則的數(shù)目占了絕大多數(shù),反映出1997年福特馬食品連鎖經(jīng)銷商店的客戶購物模式基本不變.對于表2中支持度較大的穩(wěn)定規(guī)則而言,管理者在制定相應(yīng)措施時不必考慮時間因素.

        表3和表4分別是支持度增強(qiáng)趨勢規(guī)則和支持度下降趨勢規(guī)則,這些規(guī)則的支持度隨時間分別呈現(xiàn)出增強(qiáng)和下降趨勢,即相應(yīng)的商品更多或更少地被客戶購買.管理者應(yīng)針對這些規(guī)則進(jìn)行具體分析,發(fā)現(xiàn)變化的趨勢并及時調(diào)整企業(yè)的客戶關(guān)系管理策略,提供適當(dāng)?shù)漠a(chǎn)品和服務(wù)或及時發(fā)現(xiàn)不良的變化模式以便采取補(bǔ)救措施減緩變化.

        表5和表6分別為支持度突變規(guī)則及其支持度序列.由表6可知,支持度突變規(guī)則的支持度序列中存在孤立點(diǎn),反映出客戶購物行為的突變,如季節(jié)變化.

        根據(jù)現(xiàn)有研究成果[7-8],僅能發(fā)現(xiàn)表2~表4中的穩(wěn)定規(guī)則和趨勢規(guī)則,無法推導(dǎo)出表5中的突變規(guī)則.如規(guī)則“Bathroom Products and Vegetables?Snack Foods”在6月的支持度遠(yuǎn)大于在其他月份,這可能是一個季節(jié)性變化,決策者可以在6月份增加相關(guān)產(chǎn)品的庫存以適應(yīng)變化.表2~表5中的興趣度也是本文的一個貢獻(xiàn),用規(guī)則的興趣度衡量規(guī)則的重要程度,可以幫助決策者在多個變化模式中找出重要的模式.

        表6 支持度突變規(guī)則的支持度序列

        5 結(jié)語

        客戶的購物模式可能會隨時間而變化,前一個時期的客戶購物模式可能在后一個時期中無效,因此,動態(tài)環(huán)境下的客戶購物模式變化挖掘具有重要的現(xiàn)實(shí)意義.本文提出了一種挖掘多個時期客戶購物模式變化的方法,將Mann-Kendall檢驗(yàn)、χ2檢驗(yàn)和格拉布斯檢驗(yàn)分別用于發(fā)現(xiàn)趨勢規(guī)則、穩(wěn)定規(guī)則和突變規(guī)則,并評估規(guī)則變化的程度,進(jìn)行冗余檢測,最后輸出顯著變化的規(guī)則.實(shí)證分析的結(jié)果表明,所提方法可以發(fā)現(xiàn)多個時期的穩(wěn)定規(guī)則、趨勢規(guī)則和突變規(guī)則,不僅能說明變化的模式,還能對變化模式進(jìn)行興趣度評估.

        References)

        [1]Song H S,Kim J K,Kim S H.Mining the change of customer behavior in an internet shopping mall[J].Expert Systems with Applications,2001,21(3):157-168.

        [2]Chen M C,Chiu A L,Chang H H.Mining changes in customer behavior in retail marketing[J].Expert Systems with Applications,2005,28(4):773-781.

        [3]Liu D R,Shih M J,Liau C J,et al.Mining the change of event trends for decision support in environmental scanning[J].Expert Systems with Applications,2009,36(2):972-984.

        [4]Shih M J,Liu D R,Hsu M L.Discovering competitive intelligence by mining changes in patent trends[J].Expert Systems with Applications,2010,37(4):2882-2890.

        [5]戴群達(dá).探勘多期資料下樣式變化之研究[D].中國臺南:國立成功大學(xué)資訊管理研究所,2007.

        [6]沈斌,姚敏.一種新的動態(tài)關(guān)聯(lián)規(guī)則及其挖掘算法[J].控制與決策,2009,24(9):1310-1315.Shen Bin,Yao Min.A new kind of dynamic association rule and its mining algorithms[J].Control and Decision,2009,24(9):1310-1315.

        [7]Liu B,Ma Y M,Lee R.Analyzing the interestingness of association rules from the temporal dimension[C]//Proceedings of 2001 IEEE International Conference on Data Mining.San Jose,CA,USA,2001:377-384.

        [8]B?ttcher M,Spott M,Nauck D,et al.Mining changing customer segments in dynamic markets[J].Expert Systems with Applications,2009,36(1):155-164.

        猜你喜歡
        置信度購物關(guān)聯(lián)
        硼鋁復(fù)合材料硼含量置信度臨界安全分析研究
        “一帶一路”遞進(jìn),關(guān)聯(lián)民生更緊
        正負(fù)關(guān)聯(lián)規(guī)則兩級置信度閾值設(shè)置方法
        奇趣搭配
        圣誕購物季
        智趣
        讀者(2017年5期)2017-02-15 18:04:18
        快樂六一,開心購物!
        不可錯過的“購物”APP
        Coco薇(2015年5期)2016-03-29 23:34:28
        置信度條件下軸承壽命的可靠度分析
        軸承(2015年2期)2015-07-25 03:51:04
        多假設(shè)用于同一結(jié)論時綜合置信度計(jì)算的新方法?
        毛片大全真人在线| 午夜视频手机在线免费观看| 手机在线观看av资源| 国产免费又爽又色又粗视频| 最近最好的中文字幕2019免费 | 中文天堂国产最新| 亚洲的天堂av无码| 亚洲一区不卡在线导航| 男女深夜视频网站入口| 疯狂做受xxxx高潮视频免费| 国产999精品久久久久久| 国产精品日本天堂| 亚洲av手机在线播放| 久久精品国产精品亚洲| 国产mv在线天堂mv免费观看| 国产视频不卡在线| 韩国日本一区二区在线| 亚洲va欧美va日韩va成人网 | 一级午夜视频| 国产白浆精品一区二区三区| 久久久精品人妻一区二区三区妖精| 少妇私密会所按摩到高潮呻吟| 久久狠狠第一麻豆婷婷天天| 青青草免费在线视频导航 | 欧美精品无码一区二区三区| 欧美饥渴熟妇高潮喷水水| 久久这里只精品国产2| 亚洲熟女少妇精品久久| 欧美丰满少妇xxxx性| 性一乱一搞一交一伦一性 | 99久久国产精品网站| 中文字幕无码日韩专区免费| 欧洲一区在线观看| aa日韩免费精品视频一| 24小时日本在线视频资源| 国产喷水福利在线视频| 99熟妇人妻精品一区五一看片| 日本高清乱码中文字幕| 日本高清视频www| 日本丰满老妇bbw| 蜜乳一区二区三区亚洲国产|