亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于ID3算法的商務(wù)網(wǎng)站客戶分類研究

        2020-03-20 03:42:37鄭焱
        軟件工程 2020年3期

        鄭焱

        摘? 要:ID3算法作為最經(jīng)典的決策樹分類方法,因其直觀、簡(jiǎn)單、容易實(shí)現(xiàn)等優(yōu)點(diǎn),在電子商務(wù)領(lǐng)域得到了廣泛應(yīng)用。文章首先分析了ID3算法的基本原理與流程,然后以某商務(wù)網(wǎng)站為例,以其客戶交易數(shù)據(jù)為研究對(duì)象,深入探討了該算法在客戶分類中的具體應(yīng)用。通過(guò)該算法的使用,可對(duì)商務(wù)網(wǎng)站的客戶進(jìn)行準(zhǔn)確分類,從而為其開展個(gè)性化服務(wù)及精準(zhǔn)營(yíng)銷提供重要的理論依據(jù)。

        關(guān)鍵詞:決策樹分類方法;ID3算法;客戶分類

        中圖分類號(hào):TP305? ? ?文獻(xiàn)標(biāo)識(shí)碼:A

        Abstract:ID3 algorithm is the most classical decision tree classification method.Because it is simple and easy to implement,it has been widely applied in EC.This paper first analyzes the basic principle and process of ID3 algorithm. Then this paper uses a business website as an example and takes its customer transaction data as the research object to discuss the specific application of ID3 algorithm in customer classification.With this algorithm,we can accurately classify the customers of business websites to provide an important theoretical basis for personalized service and precision marketing.

        Keywords:the classification method of the decision tree;ID3 algorithm;customer classification

        1? ?引言(Introduction)

        ID3算法是最典型的決策樹分類算法之一,通過(guò)該算法可實(shí)現(xiàn)對(duì)樣本的精確分類,方便進(jìn)一步進(jìn)行精細(xì)化處理。因ID3算法的實(shí)用性,近年來(lái)許多專家學(xué)者對(duì)該算法的優(yōu)化及應(yīng)用進(jìn)行了探討與研究,如趙克新等[1]針對(duì)無(wú)人機(jī)空戰(zhàn)態(tài)勢(shì)估計(jì)中存在的多參數(shù)、非線性、實(shí)時(shí)性等問(wèn)題,提出了一種改進(jìn)決策樹思想的態(tài)勢(shì)估計(jì)推理方法,并驗(yàn)證了該方法的效率及準(zhǔn)確性;徐兵等[2]提出了一種基于梯度提升決策樹的車輛換道融合決策模型,并以NGSIM車輛軌跡數(shù)據(jù)集為基礎(chǔ),對(duì)支持向量機(jī)(SVM)、隨機(jī)森林(RF)、GBDT及基于GBDT的融合決策模型進(jìn)行了訓(xùn)練及性能測(cè)試,驗(yàn)證了本文所提出方法的準(zhǔn)確率;柴宏濤[3]針對(duì)作戰(zhàn)體系中信息資源分類過(guò)程中存在的問(wèn)題,提出了一種基于ID3算法的分類映射模型,并應(yīng)用算例進(jìn)行了模擬;陳茜等[4]通過(guò)調(diào)查問(wèn)卷收集了湖北省相關(guān)高校及其他單位的人才需求信息,使用ID3算法構(gòu)建決策樹模型,分析了影響相關(guān)人才留在某二線城市和留在武漢主客觀因素,并據(jù)此提出了武漢市引進(jìn)、留住人才的對(duì)策建議;羅計(jì)根等[5]針對(duì)ID3算法的局限性提出了一種融合GINI指數(shù)的ID3改進(jìn)算法,較好地解決了信增益偏好屬性值多的問(wèn)題,并應(yīng)用六組UCI數(shù)據(jù)集進(jìn)行效果驗(yàn)證等??梢?jiàn),目前該領(lǐng)域的研究仍然比較活躍,方法的改進(jìn)及應(yīng)用領(lǐng)域的拓展依然是研究的重點(diǎn)。

        2? ID3算法的基本理論(The basic theory of ID3 algorithm)

        2.1? ?相關(guān)定義

        信息量(熵):用來(lái)反映決策樹一個(gè)結(jié)點(diǎn)的信息容量。設(shè)為樣本集合,,類別屬性。假設(shè)為類別中的樣本個(gè)數(shù),則該集合S所包含的信息量(熵)為[6]:

        可見(jiàn),是對(duì)給定對(duì)象進(jìn)行分類的信息量與利用屬性劃分當(dāng)前樣本集合信息量的差值。在構(gòu)建決策樹的過(guò)程中,可利用的值來(lái)對(duì)各屬性的重要性進(jìn)行評(píng)估。

        2.2? ?ID3算法流程

        ID3算法的核心是基于“信息熵”理論,其構(gòu)建決策樹的過(guò)程是:首先根據(jù)式(3)計(jì)算出每個(gè)屬性的值,然后將各屬性的值按由大到小排序,取出值最大的屬性作為劃分標(biāo)準(zhǔn),不斷重復(fù)該過(guò)程,直至生成一個(gè)決策樹。具體算法流程如圖1所示。

        圖1 ID3算法流程

        Fig.1 ID3 algorithm flow chart

        3 ID3算法在商務(wù)網(wǎng)站客戶分類中的應(yīng)用(Application of ID3 algorithm in customer classification of business website)

        隨著電子商務(wù)的高速發(fā)展,其經(jīng)營(yíng)管理的復(fù)雜程度也越來(lái)越大,尤其是客戶關(guān)系管理變得越來(lái)越復(fù)雜。因此,本文將ID3算法應(yīng)用到商務(wù)網(wǎng)站的客戶管理中,以決策樹方法來(lái)構(gòu)造模型,進(jìn)行客戶價(jià)值分析,找到最有價(jià)值的客戶,從而開展有針對(duì)性的促銷活動(dòng),更好地提供個(gè)性化的服務(wù)及精準(zhǔn)營(yíng)銷。

        下面以某商務(wù)網(wǎng)站為例,詳細(xì)分析ID3算法在客戶分類中的具體應(yīng)用。

        3.1? ?構(gòu)造訓(xùn)練集

        根據(jù)某商務(wù)網(wǎng)站的數(shù)據(jù)倉(cāng)庫(kù)的用戶信息和日志,從中提取部分客戶交易信息構(gòu)建數(shù)據(jù)集,如表1所示。

        3.2? ?計(jì)算信息增益

        應(yīng)用ID3算法生成決策樹算法的過(guò)程如下:

        (1)在表1的訓(xùn)練集S中,類別屬性集C有兩個(gè)不同取值,即{是,否},因此類別個(gè)數(shù)m=2。假設(shè)類C1對(duì)應(yīng)于“是”,而C2對(duì)應(yīng)于“否”,類C1有7個(gè)樣本,類C2的有三個(gè)樣本。根據(jù)公式(1)可計(jì)算出相應(yīng)樣本分類所需的信息熵:

        其后,ID3算法利用的值對(duì)各屬性的重要程度進(jìn)行排序,取出值最大的屬性構(gòu)造決策樹的第一個(gè)結(jié)點(diǎn),并對(duì)該結(jié)點(diǎn)所代表的全部屬性值進(jìn)行測(cè)試,從而得到該結(jié)點(diǎn)的各個(gè)分支,依據(jù)這些分支將原有數(shù)據(jù)集分為若干個(gè)子數(shù)據(jù)集。若某結(jié)點(diǎn)所包含的所有數(shù)據(jù)類別相同,那么該結(jié)點(diǎn)就是就不用再細(xì)分,標(biāo)記為決策樹的葉結(jié)點(diǎn)。

        3.3? ?構(gòu)建決策方案

        根據(jù)計(jì)算結(jié)果可知,屬性“消費(fèi)金額”所獲得的信息增益最大,因此該屬性將作為測(cè)試屬性產(chǎn)生當(dāng)前分支結(jié)點(diǎn)。因該屬性有三個(gè)不同取值,故產(chǎn)生三個(gè)不同分支,則將當(dāng)前樣本集合劃分成三個(gè)不同子集。劃分結(jié)果如圖2所示。

        從圖2可知,“消費(fèi)金額”<50的樣本類別的取值均為“是”,因此在該分支結(jié)果標(biāo)記為“是”,并產(chǎn)生一個(gè)葉結(jié)點(diǎn)。根據(jù)訓(xùn)練樣本集合,依據(jù)以上處理過(guò)程,最終所產(chǎn)生的決策樹如圖3所示。

        通過(guò)ID3算法的分析,可知“消費(fèi)金額”是決策樹分支的最重要因素,其次為“購(gòu)買方式”“商品種類”“是否女性”等。根據(jù)圖3所示的決策樹,得出如下結(jié)論:

        (1)易流失客戶為以下三類:

        ①消費(fèi)金額在50—100,購(gòu)買方式采用普通方式的客戶;

        ②消費(fèi)金額大于等于100,參加團(tuán)購(gòu),不是女性的客戶;

        ③消費(fèi)金額大于等于100,采用普通方式購(gòu)買的客戶。

        (2)忠實(shí)客戶為以下三類:

        ①消費(fèi)金額小于50的客戶;

        ②消費(fèi)金額在50—100,參加促銷的客戶;

        ③消費(fèi)金額大于等于100,參加團(tuán)購(gòu),是女性的客戶。

        根據(jù)分析結(jié)果,可對(duì)易流失的客戶有針對(duì)性地推出優(yōu)惠、促銷等活動(dòng),從而達(dá)到吸引客戶、留住客戶的目的。同時(shí),進(jìn)一步分析客戶流失的原因,找出商務(wù)網(wǎng)站經(jīng)營(yíng)管理過(guò)程中存在的問(wèn)題,并針對(duì)問(wèn)題制定出切實(shí)可行的解決對(duì)策,從而提高客戶的忠誠(chéng)度;對(duì)于忠實(shí)客戶,可進(jìn)一步分析其特征,挖掘其深層次的需求,做到比客戶更了解客戶,從而提供更好的個(gè)性化服務(wù)。

        4? ?結(jié)論(Conclusion)

        ID3算法是一種歸納分類算法,采用自頂向下的遞歸方式構(gòu)造決策樹,具有簡(jiǎn)單、便于實(shí)現(xiàn)等優(yōu)點(diǎn)。將該算法應(yīng)用于商務(wù)網(wǎng)站的客戶管理中,可以挖掘出大量的潛在的、隱含的、有價(jià)值的客戶信息,并在此基礎(chǔ)上構(gòu)建預(yù)測(cè)模型,對(duì)客戶進(jìn)行準(zhǔn)確分類,方便進(jìn)一步為客戶提供針對(duì)性更強(qiáng)的個(gè)性化服務(wù),或者精準(zhǔn)營(yíng)銷策略的深入開展。

        參考文獻(xiàn)(References)

        [1] 趙克新,黃長(zhǎng)強(qiáng),魏政磊,等.改進(jìn)決策樹的無(wú)人機(jī)空戰(zhàn)態(tài)勢(shì)估計(jì)[J].哈爾濱工業(yè)大學(xué)學(xué)報(bào),2019(4):66-73.

        [2] 徐兵,劉瀟.采用梯度提升決策樹的車輛換道融合決策模型[J].浙江大學(xué)學(xué)報(bào)(工學(xué)版),2019(4):1-10.

        [3] 柴宏濤,李建華,沈迪.基于ID3算法的信息資源分類管理映射模型研究[J].計(jì)算機(jī)工程與設(shè)計(jì),2013(3):1082-1086.

        [4] 陳茜,馬向平.基于決策樹ID3算法的人才留漢吸引政策研究[J].武漢理工大學(xué)學(xué)報(bào)(信息與管理工程版),2019(4):148-153.

        [5] 羅計(jì)根,杜建強(qiáng).融合GINI指數(shù)的ID3改進(jìn)算法[J].南昌大學(xué)學(xué)報(bào)(工科版),2019(3):80-84.

        [6] 朱明.數(shù)據(jù)挖掘[M].合肥:中國(guó)科學(xué)技術(shù)大學(xué)出版社,2002.

        作者簡(jiǎn)介:

        鄭? 焱(1998-),男,本科生.研究領(lǐng)域:計(jì)算機(jī)科學(xué)與技術(shù).

        福利视频在线一区二区三区| 日产精品久久久久久久蜜臀| 国产精品短视频| 久久麻豆精亚洲av品国产蜜臀| 亚洲天堂av在线免费观看| 欧美乱大交xxxxx潮喷| 无码国产精品一区二区vr老人| 亚洲三级在线播放| 久久影院最新国产精品| 久久精品夜色噜噜亚洲a∨| 欧美操逼视频| 亚洲AⅤ无码片一区二区三区| 亚洲产在线精品亚洲第一页| 精品亚洲麻豆1区2区3区| 国产精品亚洲一区二区三区在线| 亚洲av无码片在线播放| 最新国产成人自拍视频| 嗯啊好爽高潮了在线观看| 日本道精品一区二区三区| 国产va免费精品高清在线观看| 亚洲福利视频一区二区三区| 亚洲欧洲av综合色无码| 成人性做爰aaa片免费看| 亚洲先锋影院一区二区| 一本色道久久综合亚洲精品不| 爱情岛论坛亚洲永久入口口| 激情97综合亚洲色婷婷五| 国产精品亚洲婷婷99久久精品| 黄色国产一区二区99| 国产成人精品久久一区二区三区| 夜夜综合网| 97超碰国产一区二区三区| 深夜爽爽动态图无遮无挡| 国产真实乱人偷精品人妻| 亚洲一区二区三区中文视频 | 免费国产在线视频自拍白浆| 撕开奶罩揉吮奶头视频| 美女超薄透明丝袜美腿| 国产熟女白浆精品视频二| 亚洲va中文字幕无码毛片| 精品亚洲午夜久久久久|