張勇杰,楊鵬飛,段 群,韓麗娜
(咸陽師范學院計算機學院,咸陽 712000)
?
基于關聯(lián)規(guī)則的商品智能推薦算法
張勇杰,楊鵬飛,段群,韓麗娜
(咸陽師范學院計算機學院,咸陽712000)
摘要:目前越來越多的消費者通過電子商務平臺購買商品,但是網絡購物系統(tǒng)提供大量的商品信息,這使得顧客無法快速地找到自己所需的商品。利用關聯(lián)規(guī)則算法完成商品的智能推薦,通過對用戶的歷史購買記錄進行分析,挖掘出客戶的購買興趣,向用戶推薦相應的關聯(lián)購買商品。實驗仿真結果表明,該文提出的算法是有效的、可行的,為用戶購買商品提供一定的輔助決策作用。
關鍵詞:關聯(lián)規(guī)則;商品推薦;數(shù)據挖掘
隨著互聯(lián)網和電子商務平臺的廣泛應用,通過網絡購物已經成為廣大消費者購買商品的主要形式之一[1-2]。但是,網絡信息過量給用戶帶來了很多不便,用戶不得不面對不同購物網站產生的大量信息,花費大量時間瀏覽或購買所需的商品?;谏鲜鰡栴},用戶急需購物網站或系統(tǒng)具有商品智能推薦服務[3-4]。因此,本文給出了一個基于關聯(lián)規(guī)則的商品智能推薦算法,算法通過對用戶瀏覽和購買的商品信息進行分析,利用關聯(lián)規(guī)則中的Apriori算法挖掘商品之間的關聯(lián)關系,為用戶推薦喜歡的商品,達到輔助用戶決策的作用。
關聯(lián)規(guī)則概念[5]是由Agrawal、Imielinski和Swami等人提出的,是為了尋找大量商務數(shù)據庫中項集之間的有趣聯(lián)系,用來發(fā)現(xiàn)在同一事件中出現(xiàn)的不同項的相關性,即找出事務中頻繁發(fā)生的項或屬性的所有子集,以及項目之間的相互關聯(lián)性。它的原理可描述為:設項目集合I={i1,i2,…,im}由m個不同的項目組成,D是一個事務數(shù)據庫,D中的每個事務是I的一個子集。一個項目的集合稱為項集,包含k個項目的集合稱為k項集,項集X的支持度,記為s(X),表示包含該項集的交易數(shù)據的條數(shù),如果一個項集的支持度大于用戶指定的最小支持度(min_sup),則稱它是頻繁的,長度為k的頻繁項集稱為頻繁k項集,一個頻繁項集也稱為頻繁模式。關聯(lián)規(guī)則是形如A=>B的蘊涵式,其中A∈I, B∈I,并且A∩B=?,規(guī)則A=>B的支持度s(A=>B)定義為中包含A∪B的事務所占的百分比,表示項集A∪B在D中出現(xiàn)的概率。規(guī)則A=>B的置信度c(min_con)定義為D中包含項集A∪B的事務數(shù)和包含項集A的事務數(shù)的比值,表示當項集A出現(xiàn)時,項集B出現(xiàn)的概率。置信度大于用戶指定的最小置信度值的規(guī)則是可信的。
關聯(lián)規(guī)則挖掘的任務是找到事務數(shù)據庫D中支持度和置信度分別滿足用戶指定的最小支持度min_sup和最小置信度min_con的規(guī)則A=>B。關聯(lián)規(guī)則挖掘問題分為兩個子問題:(1)找出D中所有的頻繁項集;(2)從頻繁項集中產生關聯(lián)規(guī)則。
Apriori算法是基于關聯(lián)規(guī)則常用的方法,此方法在分析的同時需要產生候選項集。此算法發(fā)現(xiàn)關聯(lián)規(guī)則的過程分為兩步:第一步是通過迭代,檢索出需測試的源數(shù)據中所有頻繁項集,即支持度不低于用戶設置閾值的項集;第二步是利用第一步中檢索出的頻繁項集構造出滿足用戶最小置信度的規(guī)則。
本文從測試商品購物系統(tǒng)中選取了部分顧客購買記錄,如表1所示,其中I1為香蕉,I2為梨,I3為嬰兒服飾,I4為拖把,I5為蘋果。設定最小支持度min_sup閾值為0.2,最小置信度min_con閾值為0.7。
表1 部分顧客購買記錄
利用Apriori算法發(fā)現(xiàn)關聯(lián)規(guī)則的實現(xiàn)過程為:
(1)進行第一次迭代,首先產生候選項集C1。然后計算每一個候選項集的出現(xiàn)次數(shù),計算支持度。最后選擇支持度>=0.2的項目,生成頻繁項集L1,共含5個項,如表2所示。
表2 候選項集C1、頻繁項集L1
(2)進行第二次迭代,使用L1×L1產生候選項集C2。然后計算每一個候選項集的出現(xiàn)次數(shù),計算支持度。最后選擇支持度>=0.2的項目,生成頻繁項集L2,共含8個項,如表3所示。
表3 候選項集C2、頻繁項集L2
(3)進行第三次迭代,使用L2×L2產生候選項集C3。然后計算每一個候選項集的出現(xiàn)次數(shù),計算支持度。最后選擇支持度>=0.2的項目,生成頻繁項集L3,共含2個項,如表4所示。因為要產生一個頻繁4的項集,需要至少有3個長度為3的子集,而在L3中只有2個子集,無法產生L4,所有算法停止迭代。
表4 候選項集C3、頻繁項集L3
(4)從頻繁項集產生關聯(lián)規(guī)則。對L3中的任意一個頻繁項集,首先計算它的子集,然后計算規(guī)則的置信度,最后選擇置信度大于置信度閾值0.7的規(guī)則就是關聯(lián)規(guī)則,計算結果如表5所示。
表5 關聯(lián)規(guī)則結果表
其中,推薦結果顯示,香蕉、梨、蘋果三種水果之間的存在關聯(lián)規(guī)則,置信度為0.75,所有當顧客在購買這三種水果之一時,系統(tǒng)要幫用戶推薦其他另外兩種水果,尤其是當顧客購買了香蕉和蘋果時,一定要幫用戶推薦梨,因為置信度為100%。
本文提出的基于關聯(lián)規(guī)則的商品智能推薦算法經仿真實驗,推薦準確率程度較高,不用建立復雜的用戶度量模型,可行性較高,為商家的管理決策提供數(shù)據支持,有利于提高服務水平和質量,也為顧客購買商品提供了一定的依據。
參考文獻:
[1]趙耀,薛貴榮. Web Service下的商品推薦系統(tǒng)的研究與實現(xiàn)[J].臨沂師范學院學報,2003,25(6):131-134.
[2]李煊,汪曉研,莊鎮(zhèn)泉.基于關聯(lián)規(guī)則挖掘的個性化智能推薦服務[J].計算機工程與應用,2002,11:200-204.
[3]謝厚亮,鄧衛(wèi)紅.基于Java的商品智能推薦系統(tǒng)設計[J].電腦編程技巧與維護,2014,20:42-44.
[4]丁雪.基于關聯(lián)規(guī)則的圖書智能推薦系統(tǒng)研究[J].圖書情報論壇,2010,4:48-52.
[5]張興會.數(shù)據倉庫與數(shù)據挖掘技術[M].北京:清華大學出版社,2014,8:94-101.
楊鵬飛(1995-),男,陜西人,本科,研究方向為系統(tǒng)設計與開發(fā)
段群(1980-),女,陜西人,碩士研究生,講師,研究方向為圖像處理
韓麗娜(1976-),女,陜西人,碩士研究生,講師,研究方向為圖像處理
An Algorithm of Intelligent Recommendation Based on Association Rules
ZHANG Yong-jie,YANG Peng-fei,DUAN Qun,HAN Li-na
(College of Computer Science, Xianyang Normal University,Xianyang 712000)
Abstract:At present, more and more consumers buy goods through the electronic commerce platform, but the online shopping system provides a large of information, which makes the customer can not quickly find their desired goods. Proposes an algorithm of intelligent recommendation based on the association rule. That through the analysis of the user's historical purchase records, mining the customer's purchase interest, to the user to recommend appropriate related to buy goods. Experiments demonstrate that algorithm is applicable and effective, and it provides a certain assistant decision for the purchase of goods.
Keywords:Association Rules; Commodity Recommendation; Data Mining
收稿日期:2015-12-22修稿日期:2016-03-05
作者簡介:張勇杰(1995-),男,河南人,本科,研究方向為系統(tǒng)設計與開發(fā)
文章編號:1007-1423(2016)10-0025-03
DOI:10.3969/j.issn.1007-1423.2016.10.006
基金項目:咸陽師范學院大學生創(chuàng)新訓練項目(No.2015005)、陜西省大學生創(chuàng)新訓練項目(No.2097)