周麗莉 王寶軍 梁文敏 袁秋萍 梁鈺娟
摘 要:本文針對(duì)電子商務(wù)產(chǎn)品銷售組合的智能化構(gòu)建開展研究,將關(guān)聯(lián)規(guī)則融入PDCA循環(huán)之中,利用其螺旋上升、持續(xù)優(yōu)化的機(jī)制,不斷提升和改進(jìn)關(guān)聯(lián)規(guī)則的生成,并將隨著時(shí)間推移不斷變化的消費(fèi)者需求因素引入到產(chǎn)品組合的構(gòu)建之中,從而幫助電商企業(yè)智能化動(dòng)態(tài)構(gòu)建和優(yōu)化產(chǎn)品組合。
關(guān)鍵詞:關(guān)聯(lián)規(guī)則;PDCA;產(chǎn)品組合;電子商務(wù)
一、引言
隨著電子商務(wù)的高速發(fā)展,企業(yè)的競(jìng)爭(zhēng)不斷加劇,如何為消費(fèi)者有效地推送產(chǎn)品組合,成為電商企業(yè)提升客單價(jià)與盈利能力的重要手段。傳統(tǒng)的產(chǎn)品銷售組合往往依賴于企業(yè)經(jīng)營(yíng)者的個(gè)人經(jīng)驗(yàn)以及靜態(tài)的統(tǒng)計(jì)分析,時(shí)效滯后且精準(zhǔn)度不足。本文將PDCA戴明循環(huán)與關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘方法相結(jié)合,幫助企業(yè)開展產(chǎn)品組合的智能化構(gòu)建研究,利用企業(yè)歷史交易數(shù)據(jù),動(dòng)態(tài)地、精準(zhǔn)地智能化構(gòu)建產(chǎn)品組合。
二、研究背景與相關(guān)理論
1.研究背景
國(guó)內(nèi)外學(xué)者針對(duì)大數(shù)據(jù)、數(shù)據(jù)挖掘技術(shù)與電子商務(wù)的結(jié)合開展了大量研究,但數(shù)據(jù)挖掘與電商產(chǎn)品組合相關(guān)的研究較少,與管理方法融合的研究更為缺乏。本文將PDCA循環(huán)的管理思想與關(guān)聯(lián)規(guī)則融合應(yīng)用,通過計(jì)劃、執(zhí)行、檢查、處理的迭代思想,不斷循環(huán)調(diào)整與優(yōu)化,實(shí)時(shí)、動(dòng)態(tài)、精準(zhǔn)的生成產(chǎn)品組合。
2.相關(guān)理論
(1)關(guān)聯(lián)規(guī)則
關(guān)聯(lián)規(guī)則是數(shù)據(jù)挖掘的重要技術(shù),其反映一個(gè)事物與其他事物之間的相互依存性和關(guān)聯(lián)性。關(guān)聯(lián)規(guī)則挖掘目的是發(fā)現(xiàn)強(qiáng)關(guān)聯(lián)規(guī)則,也就是從數(shù)據(jù)中挖掘出滿足用戶需要設(shè)定的最小支持度和最小置信度的規(guī)則。
關(guān)聯(lián)規(guī)則的一般表示形式為:X->Y(S=s%,C=c%)
其中:X表示前項(xiàng)可以是一個(gè)項(xiàng)目或者項(xiàng)集,Y表示后項(xiàng)一般為一個(gè)項(xiàng)目。
支持度Support(X->Y)=P(X∪Y)是X與Y同時(shí)被消費(fèi)者購(gòu)買的概率。
置信度Confidence(X->Y)=P(Y|X)是消費(fèi)者在購(gòu)買X之后再購(gòu)買Y的條件概率。
提升度Lift(X->Y)=P(Y|X)/P(X)P(Y)是判斷關(guān)聯(lián)規(guī)則實(shí)用性的指標(biāo),當(dāng)提升度大于1,表示X出現(xiàn)對(duì)Y的正向促進(jìn),如果小于1,則X與Y為負(fù),等于1則表示不相關(guān)。
本文將選取Apriori作為關(guān)聯(lián)規(guī)則的挖掘算法,該算法具有單維、單層、布爾型的特點(diǎn),是經(jīng)典的關(guān)聯(lián)規(guī)則算法。
(2)PDCA循環(huán)
PDCA循環(huán)將管理分為四個(gè)階段,是一個(gè)不斷前進(jìn)的工作循環(huán),每通過一次PDCA循環(huán),就要進(jìn)行檢查總結(jié),分析仍存在問題,提出新目標(biāo),再進(jìn)行循環(huán)優(yōu)化。
(3)產(chǎn)品組合
產(chǎn)品組合指某個(gè)銷售商所能提供給消費(fèi)者整套的或者搭配銷售的產(chǎn)品或項(xiàng)目組合,產(chǎn)品之間往往具有相關(guān)性,能夠引導(dǎo)消費(fèi)者同時(shí)購(gòu)買,通過產(chǎn)品組合的設(shè)計(jì),可以幫助企業(yè)優(yōu)化客戶體驗(yàn)、提升客戶轉(zhuǎn)化率與客單價(jià)。
三、模型設(shè)計(jì)
企業(yè)在經(jīng)營(yíng)過程中,都會(huì)積累客戶消費(fèi)的歷史記錄,這些歷史記錄包含著不同消費(fèi)者的購(gòu)物清單,關(guān)聯(lián)規(guī)則的通過分析這些歷史購(gòu)物清單,發(fā)現(xiàn)產(chǎn)品之間的聯(lián)系,進(jìn)而挖掘出一系列產(chǎn)品組合。模型可以按固定時(shí)間段或者固定銷售量,對(duì)樣本數(shù)據(jù)進(jìn)行分組,實(shí)施多次基于PDCA循環(huán)的數(shù)據(jù)分析與挖掘。本文兩輪PDCA分組如下:
2020年11月01日-2020年12月13日A組樣本數(shù)據(jù)1641條,A組校驗(yàn)組數(shù)據(jù)652條。
2020年12月14日-2021年01月28日B組樣本數(shù)據(jù)1975條,B組校驗(yàn)組數(shù)據(jù)1248條。
并按照以下流程進(jìn)行兩輪P-D-C-A循環(huán)數(shù)據(jù)挖掘,分析模型如下圖:
(1)Plan:實(shí)施目標(biāo)與計(jì)劃的制定;(2)Do:關(guān)聯(lián)規(guī)則模型設(shè)定與運(yùn)行;
(3)Check:計(jì)算效驗(yàn)組概率值,執(zhí)行結(jié)果檢查;(4)Act:效果評(píng)估與優(yōu)化參數(shù)。
四、數(shù)據(jù)準(zhǔn)備與實(shí)驗(yàn)分析
1.數(shù)據(jù)準(zhǔn)備
(1)數(shù)據(jù)來源
本文選取具有較高銷售量的某化妝品天貓旗艦店作為研究對(duì)象,通過八爪魚數(shù)據(jù)采集軟件爬取全店所有商品上述時(shí)間段的評(píng)論內(nèi)容,結(jié)合購(gòu)買用戶信息、購(gòu)買時(shí)間和商品SKU模擬還原交易訂單。本文采集該店鋪全店共約5萬(wàn)條評(píng)論數(shù)據(jù),模擬還原交易訂單5516條。
(2)數(shù)據(jù)預(yù)處理
本文選取用戶標(biāo)識(shí)和商品標(biāo)識(shí)信息兩個(gè)數(shù)據(jù)項(xiàng),然后對(duì)數(shù)據(jù)實(shí)行轉(zhuǎn)換、清洗等預(yù)處理操作,得到如表1形式的購(gòu)物籃數(shù)據(jù),在依據(jù)確準(zhǔn)的數(shù)據(jù)類型通過關(guān)聯(lián)規(guī)則挖掘算法實(shí)行數(shù)據(jù)挖掘,分析評(píng)估挖掘結(jié)果。
①Plan:實(shí)施目標(biāo)與計(jì)劃的制定
在第一輪環(huán)節(jié),企業(yè)可以通過智能化產(chǎn)品組合的構(gòu)建,提升產(chǎn)品推送的精準(zhǔn)度,促進(jìn)消費(fèi)者關(guān)聯(lián)購(gòu)買,提升消費(fèi)者體驗(yàn)和提高企業(yè)客單價(jià),利用歷史交易數(shù)據(jù)的關(guān)聯(lián)規(guī)則挖掘,為企業(yè)自動(dòng)化推送產(chǎn)品組合。
②Do:關(guān)聯(lián)規(guī)則模型設(shè)定與運(yùn)行
運(yùn)用R語(yǔ)言對(duì)采集的數(shù)據(jù)進(jìn)行處理,根據(jù)綜合分析本輪參數(shù)設(shè)定為:最小支持度為1.1%,最小置信度為50%,通過R語(yǔ)言導(dǎo)入A組交易樣本數(shù)據(jù)1641條,運(yùn)行Apriori算法如下:
共生成的關(guān)聯(lián)規(guī)則共24條,經(jīng)過對(duì)關(guān)聯(lián)規(guī)則的提升度進(jìn)行排序,表2展示了前8條關(guān)聯(lián)規(guī)則。
生產(chǎn)的24條規(guī)則置信度在50%以上且提升度都遠(yuǎn)大于1,說明規(guī)則有效且有實(shí)用價(jià)值,即購(gòu)買左側(cè)商品項(xiàng)的買家有非常大的可能性會(huì)同時(shí)購(gòu)買右側(cè)商品項(xiàng),如“氣墊BB霜&凍感水光唇釉->絲絨霧面口紅”的支持度與置信度都較高且提升度達(dá)到了9.72,此三個(gè)商品非常適合作為關(guān)聯(lián)產(chǎn)品同時(shí)展現(xiàn),也適合作為套餐進(jìn)行捆綁銷售。
根據(jù)生成的關(guān)聯(lián)規(guī)則,企業(yè)可以以此為依據(jù)來對(duì)生成產(chǎn)品組合,在關(guān)聯(lián)營(yíng)銷推送產(chǎn)品組合,讓客戶能夠更加方便地瀏覽到所需的產(chǎn)品,獲取需要的組合套餐,促進(jìn)客戶的捆綁銷售、增加銷售額和提升購(gòu)物體驗(yàn)。
③Check:計(jì)算效驗(yàn)組概率值,執(zhí)行結(jié)果檢查
接下來將A組樣本數(shù)據(jù)產(chǎn)生的關(guān)聯(lián)規(guī)則在A組校驗(yàn)組數(shù)據(jù)中進(jìn)行核查檢驗(yàn),計(jì)算關(guān)聯(lián)規(guī)則在校驗(yàn)數(shù)據(jù)中出現(xiàn)的置信度,挖掘生成的關(guān)聯(lián)規(guī)則,在校驗(yàn)集中有較高的置信度,說明規(guī)則有可靠性高,表3展示了前8條關(guān)聯(lián)規(guī)則在校驗(yàn)組中的置信度。
④Act:效果評(píng)估與優(yōu)化參數(shù)
本輪執(zhí)行過程產(chǎn)生了評(píng)估指標(biāo)較好的關(guān)聯(lián)規(guī)則,并且驗(yàn)證了這些規(guī)則的有效性與實(shí)用性,企業(yè)可以將這些規(guī)則運(yùn)用于產(chǎn)品組合關(guān)聯(lián)營(yíng)銷、產(chǎn)品套餐設(shè)計(jì)和客戶接觸點(diǎn)優(yōu)化等領(lǐng)域,但也存在關(guān)聯(lián)規(guī)則數(shù)量偏少,所能覆蓋的產(chǎn)品種類偏少的不足。
(2)第二輪P-D-C-A
①Plan:實(shí)施目標(biāo)與計(jì)劃的制定
經(jīng)過上一輪PDCA的運(yùn)行,企業(yè)能夠高質(zhì)量挖掘出一系列關(guān)聯(lián)規(guī)則,但數(shù)量偏少,覆蓋產(chǎn)品較少。因此本輪需對(duì)支持度、置信度參數(shù)進(jìn)行調(diào)整,另在結(jié)果分析過程需考慮消費(fèi)者需求變化因素。
②Do:關(guān)聯(lián)規(guī)則模型設(shè)定與運(yùn)行
本輪最小支持度為0.7%,最小置信度為35%,通過R語(yǔ)言導(dǎo)入B組交易樣本數(shù)據(jù)1975條,運(yùn)行Apriori算法如下:
共生成的關(guān)聯(lián)規(guī)則共36條,經(jīng)過對(duì)關(guān)聯(lián)規(guī)則的提升度進(jìn)行排序,表4展示了前8條關(guān)聯(lián)規(guī)則。本輪關(guān)聯(lián)規(guī)則數(shù)量得到了一定提升,規(guī)則的支持度雖然有所調(diào)低,但仍有較高的頻數(shù),置信度處于較高水平,規(guī)則提升度均遠(yuǎn)大于1,規(guī)則具有較高的有效性與實(shí)用性。
③Check:計(jì)算效驗(yàn)組概率值,執(zhí)行結(jié)果檢查
通過計(jì)算規(guī)則在B組校驗(yàn)數(shù)據(jù)中的置信度,均得到的較高的置信度,因此驗(yàn)證了生成的關(guān)聯(lián)規(guī)則結(jié)果具有較高的可信度,表5展示了前8條關(guān)聯(lián)規(guī)則在校驗(yàn)組的置信度。
④Act:效果評(píng)估與優(yōu)化參數(shù)
根據(jù)本輪的執(zhí)行產(chǎn)生了更多的關(guān)聯(lián)規(guī)則,且均有較高的有效性與實(shí)用性,能夠覆蓋更多的產(chǎn)品,企業(yè)可以運(yùn)用該方法智能化產(chǎn)品組合構(gòu)建。此外企業(yè)需根據(jù)第一輪與第二輪產(chǎn)品的關(guān)聯(lián)規(guī)則的差異變化,了解季節(jié)性、活動(dòng)性及流行趨勢(shì)等因素影響對(duì)產(chǎn)品組合的影響,與時(shí)俱進(jìn),不斷優(yōu)化與更新產(chǎn)品組合。
3.實(shí)驗(yàn)結(jié)果分析
(1)雖然本文兩輪PDCA過程都獲得了優(yōu)質(zhì)的關(guān)聯(lián)規(guī)則,但支持度與置信度的設(shè)定會(huì)較大的影響關(guān)聯(lián)規(guī)則生成,將關(guān)聯(lián)規(guī)則支持度與置信度的調(diào)整融入到PDCA循環(huán)中,將能實(shí)現(xiàn)參數(shù)的精細(xì)化、動(dòng)態(tài)調(diào)整。
(2)將數(shù)據(jù)源根據(jù)時(shí)間維度或銷量維度進(jìn)行合理的劃分,能夠有效地幫助企業(yè)挖掘貼近市場(chǎng)需求變化的關(guān)聯(lián)規(guī)則。
(3)企業(yè)可根據(jù)支持度、置信度的以及提升度的變化趨勢(shì)對(duì)生成關(guān)聯(lián)規(guī)則的發(fā)展趨勢(shì)跟蹤,幫助企業(yè)較早地捕捉到產(chǎn)品及產(chǎn)品組合的需求和生命周期變化。
(4)企業(yè)可以對(duì)多輪PDCA循環(huán)產(chǎn)生的規(guī)則進(jìn)行統(tǒng)計(jì)分析,根據(jù)關(guān)聯(lián)規(guī)則隨時(shí)間的變化程度的大小,區(qū)別性地實(shí)施不同的營(yíng)銷策略。
五、總結(jié)
本文將PDCA管理方法與關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘算法相結(jié)合,實(shí)現(xiàn)了數(shù)據(jù)挖掘算法在企業(yè)商務(wù)應(yīng)用的規(guī)范規(guī)設(shè)計(jì),通過PDCA循環(huán)迭代,螺旋上升的機(jī)制,動(dòng)態(tài)地調(diào)整關(guān)聯(lián)規(guī)則算法應(yīng)用,保證了數(shù)據(jù)挖掘效果的可靠性與實(shí)用性,企業(yè)通過多輪的PDCA循環(huán)迭代,能夠有效積累具有時(shí)間維度的關(guān)聯(lián)規(guī)則,幫助企業(yè)識(shí)別產(chǎn)品及產(chǎn)品組合的變化趨勢(shì)與生命周期,進(jìn)而幫助企業(yè)更加全面系統(tǒng)地實(shí)現(xiàn)產(chǎn)品組合的智能化構(gòu)建。
參考文獻(xiàn):
[1]李冬云.利用關(guān)聯(lián)規(guī)則挖掘技術(shù)實(shí)現(xiàn)數(shù)字圖書館個(gè)性化推薦服務(wù)[J].蘭臺(tái)內(nèi)外,2020(34):40-42.
[2]郝海濤,馬元元.基于加權(quán)關(guān)聯(lián)規(guī)則挖掘算法的電子商務(wù)商品推薦系統(tǒng)研究[J].現(xiàn)代電子技術(shù),2016,39(15):133-136.
[3]菲利普.科特勒,加里.阿姆斯特朗.營(yíng)銷學(xué)導(dǎo)論[M].華夏出版社,1998.
[4]朱晴.融合關(guān)聯(lián)規(guī)則挖掘算法的信息化教學(xué)管理系統(tǒng)設(shè)計(jì)[J].現(xiàn)代電子技術(shù),2020,43(23):159-163.
作者簡(jiǎn)介:周麗莉(1999.07- ),女,漢族,籍貫:廣東省揭陽(yáng)市,本科在讀,研究方向:電子商務(wù);通訊作者:王寶軍(1985.08- ),男,漢族,籍貫:江西省景德鎮(zhèn)市,研究生,工程師,研究方向:電子商務(wù)、數(shù)據(jù)挖掘