亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于C4.5決策樹的大學(xué)生筆記本電腦購買行為的數(shù)據(jù)挖掘

        2015-12-07 02:53:18毛乾任王朝斌
        關(guān)鍵詞:數(shù)據(jù)挖掘規(guī)則消費(fèi)者

        毛乾任,王朝斌

        (西華師范大學(xué)計(jì)算機(jī)學(xué)院,四川南充 637000)

        當(dāng)代大學(xué)生在筆記本消費(fèi)方面存在巨大的潛在市場。考慮到筆記本市場的影響力和獨(dú)特性,有必要將其作為一個(gè)獨(dú)特的細(xì)分市場來加以重視和研究[1]。目前針對這方面的研究多局限于問卷調(diào)查分析的結(jié)果。C4.5決策樹是ID3樹的改進(jìn),能處理離散型和連續(xù)性屬性,并且分類精度高,分類規(guī)則易于理解[2-3]。本文采用問卷調(diào)查得到原始數(shù)據(jù)后,經(jīng)K-均值聚類,用C4.5決策樹算法提取特征規(guī)則,可更加具體和直觀地得到大學(xué)生筆記本購買行為的規(guī)律。

        1 購買行為研究過程與方法

        根據(jù)筆記本電腦行業(yè)消費(fèi)者的行為特征設(shè)計(jì)問卷,并進(jìn)行問卷調(diào)查。通過問卷調(diào)查分析,對所收集的信息數(shù)據(jù)進(jìn)行挖掘建模,進(jìn)而提取有意義的特征和規(guī)律。具體包括確定分析指標(biāo)、設(shè)計(jì)問卷調(diào)查、模型構(gòu)建和模型評估4個(gè)方面。

        圖1 分析過程與方法

        1.1 影響大學(xué)生購買行為的分析

        大學(xué)生消費(fèi)者對筆記本的購買決策因素細(xì)分為主觀和客觀2個(gè)方面,細(xì)分結(jié)果見表1。

        表1 影響購買行為的因素細(xì)分結(jié)果

        客觀因素是筆記本電腦商品本身對大學(xué)生電腦消費(fèi)者的影響;主觀因素則是從消費(fèi)者對產(chǎn)品的滿意度方面來進(jìn)行分析,是顧客的實(shí)際使用感受、需求和期望[4-6]。

        1.2 問卷調(diào)查設(shè)計(jì)

        通過在線問卷調(diào)查平臺發(fā)出問卷,共收回128份來自全國各地的問卷。隨機(jī)選取100份問卷作為研究對象。問卷設(shè)計(jì)的目的在于將消費(fèi)調(diào)查的問題具體化,并把問卷結(jié)果保存為excel文檔作為建模的數(shù)據(jù)輸入。問卷設(shè)計(jì)主要從影響購買行為的指標(biāo)入手,采用提問選答的形式。針對影響購買行為的客觀因素,設(shè)置的問題如下:Q2你中意的 CPU 型號:Q2.1 酷睿 i7、Q2.2 酷睿 i5、Q2.3 酷睿 i3、Q2.4 四代 i7、Q2.5 四代 i5、Q2.6 四代 i3、Q2.7奔騰/賽揚(yáng)雙核、Q2.8等。針對影響購買行為的主觀因素,設(shè)置的問題如下:Q12下列筆記本的產(chǎn)品定位中,你會優(yōu)先考慮購買哪一種:Q12.1超極本、Q12.22合1電腦、Q12.3游戲影音本、Q12.4 輕薄便攜本、Q12.5 全能學(xué)生本、Q12.6 家庭娛樂本、Q12.7時(shí)尚麗人本、Q12.8商務(wù)辦公本等。

        1.3 樣本數(shù)據(jù)的挖掘建模

        TipDM在線平臺數(shù)據(jù)挖掘?qū)儆谑褂猛诰虻囊环N。整個(gè)挖掘過程可以分為3個(gè)相依賴的階段[7-9]:數(shù)據(jù)收集和預(yù)處理、K-均值聚類分析和C4.5決策樹特征規(guī)則提取。

        1.4 數(shù)據(jù)收集和預(yù)處理

        對于采用問卷調(diào)查收集到的數(shù)據(jù)資料,必須對其進(jìn)行預(yù)處理,轉(zhuǎn)換成可被數(shù)據(jù)挖掘工具分析處理的數(shù)據(jù)類型[10]。在K均值建模時(shí),提取的數(shù)據(jù)全部轉(zhuǎn)換為二進(jìn)制1,0。1代表屬性值Yes,0代表屬性值No。在進(jìn)行特征規(guī)則的提取時(shí),excel格式文檔中的數(shù)據(jù)將全部轉(zhuǎn)換為字符型后再作為特征規(guī)則提取的輸入。

        1.5 數(shù)據(jù)建模

        1.5.1 K均值聚類

        TipDM系統(tǒng)將樣本聚成2類:第一類(A類)有42個(gè)樣本;第二類有(B類)有58個(gè)樣本。表2列舉了聚類輸出結(jié)果的部分列和行。

        表2 聚類結(jié)果部分列和行

        1.5.2 C4.5決策樹的特征規(guī)則提取

        C4.5決策樹算法通過學(xué)習(xí)數(shù)據(jù)建立決策樹,用于提取每一聚類類別的特征[11]。在輸入聚類數(shù)據(jù)之前,要將導(dǎo)入的樣本數(shù)據(jù)全部轉(zhuǎn)換為字符型數(shù)據(jù)作為特征規(guī)則挖掘的數(shù)據(jù)輸入,分別選取訓(xùn)練集和測試集的樣本數(shù)據(jù),生成規(guī)則列表。通過多次交換重設(shè)的數(shù)據(jù)樣本的訓(xùn)練集和檢測集,重復(fù)執(zhí)行可挖掘出列表所給出的所有規(guī)則[12-13]。以聚類結(jié)果B類的特征規(guī)則1為例:

        特征規(guī)則提取:

        規(guī)則1:C4.5決策樹

        聚類結(jié)果為2類,0類即A類,1類即B類。聚類完成后,借助特征規(guī)則的提取進(jìn)行詳細(xì)的聚類分析。

        規(guī)則2:C4.5決策樹

        可以看出采用規(guī)則1劃分的正確分類百分比為100%。如果sex的屬性值為W即性別為女,且Price值為No,如果Brand值為Yes,輸出A類,占A類13個(gè)樣本的百分比為30.95%;否則Brand值為No,如果After service值為No,輸出B類,占B類15個(gè)樣本,百分比為25.86%,由此可找到?jīng)Q定行為的特征屬性。

        在10個(gè)正確樣本百分比為85%及以上的決策樹中,A類的特征規(guī)則決定因素主要有品牌、操作系統(tǒng)、外殼設(shè)計(jì)以及攝像頭像素。B類的特征規(guī)則決定因素主要有CPU、顯卡、硬盤容量和電池續(xù)航時(shí)間和價(jià)格。下面用分層交叉進(jìn)行具體驗(yàn)證。

        2 大學(xué)生消費(fèi)者的行為特征分析

        交叉分析用于分析2個(gè)變量之間的關(guān)系[7]。在導(dǎo)出聚類結(jié)果后,把聚類的A類和B類作為自變量。而把要研究分析的其他屬性作為因變量。這里的因變量分別是影響購買行為的主觀因素、客觀因素。輸出結(jié)果如下:

        表3 客觀因素交叉分析

        表4 主觀因素交叉分析

        表5 購買途徑交叉分析

        表6 影響購買的其他因素交叉分析

        2.1 兩類消費(fèi)行為趨于理性

        總體來看,A、B類消費(fèi)者對CPU的要求是所有因素中最高的,分別占到了各自客觀考慮因素的74.29%,84.48%;其次,兩類消費(fèi)者購買因素所占比例超過50%的還有使用需求,散熱和內(nèi)存容量。大學(xué)生在購買因素中,可以根據(jù)自己的使用需求,依次參考CPU型號、散熱和內(nèi)存容量。這幾個(gè)因素也是生產(chǎn)商應(yīng)該考慮的重心。

        2.2 A類消費(fèi)者購買行為

        從客觀因素可以看出:A類消費(fèi)者在操作系統(tǒng)、外殼材質(zhì)以及攝像頭像素、散熱幾個(gè)因素方面的要求普遍高于B類消費(fèi)者。在購買途徑中,A類消費(fèi)者絕大部分(85.71%)去電腦城購買,少部分選擇大型商場購買,基本不在二手市場和網(wǎng)上購買。并且這類消費(fèi)者比較看重筆記本電腦的獨(dú)特功能以及售后服務(wù),分別高出B類消費(fèi)者27.33個(gè)百分點(diǎn)和18.73個(gè)百分點(diǎn)。

        從主觀因素分析,A類消費(fèi)者在品牌和促銷活動方面的考慮因素分別高出B類消費(fèi)者25.60個(gè)百分點(diǎn)和26.70個(gè)百分點(diǎn),并在筆記本獨(dú)特的新功能要求上超出B類27.29個(gè)百分點(diǎn)。這類消費(fèi)者大部分選擇在線下電腦城購買,在線上的購買幾率很低。可見,此類大學(xué)生消費(fèi)者追逐個(gè)性化的獨(dú)特風(fēng)格,并且對價(jià)格的看重遠(yuǎn)不及B類高,消費(fèi)大頭已經(jīng)從實(shí)用化趨向時(shí)尚化。

        商家對于這類消費(fèi)者在抓品牌效應(yīng)的同時(shí),可以經(jīng)營便攜性較強(qiáng),外觀設(shè)計(jì)時(shí)尚的筆記本,并且可以適當(dāng)延長售后服務(wù)期,在實(shí)體店里開展一些促銷活動,從而在很大程度上吸引A類消費(fèi)者。而對于生產(chǎn)商,產(chǎn)品要保證很好的便攜性、外殼材質(zhì)和外觀設(shè)計(jì)。一些新功能的推出會更加吸引這部分消費(fèi)者。家庭娛樂本、輕薄便攜本、時(shí)尚麗人本、超極本將受到這類消費(fèi)者的青睞,同時(shí)在產(chǎn)品配置上,生產(chǎn)商可以適當(dāng)調(diào)低成本。

        2.3 B類消費(fèi)者購買行為

        從客觀因素分析,B類消費(fèi)者對CPU、顯卡類型、硬盤容量和電池續(xù)航時(shí)間的要求遠(yuǎn)高于A類消費(fèi)者。B類消費(fèi)者對CPU的要求高出A類消費(fèi)者約10個(gè)百分點(diǎn),對顯卡類型要求高出A類消費(fèi)者約24個(gè)百分點(diǎn),電池續(xù)航時(shí)間和硬盤容量以及接口數(shù)量高出A類消費(fèi)者約12個(gè)百分點(diǎn),而對操作系統(tǒng)、筆記本厚度、便攜和外殼材質(zhì)的要求較低。

        從主觀因素來看,B類消費(fèi)者只在價(jià)格要求方面高于A類消費(fèi)者14.86個(gè)百分點(diǎn),而對于外觀設(shè)計(jì)、材質(zhì)、品牌要求和是否促銷,并不是主要的考慮因素。

        在購買途徑中,B類消費(fèi)者在網(wǎng)上購買的需求遠(yuǎn)遠(yuǎn)大于A類。這類消費(fèi)者在購機(jī)過程中可以選擇市面上一些配置較好的游戲影音本、商務(wù)辦公本、2合1電腦等;品牌上可以考慮如宏基、華碩、聯(lián)想及ThinkPad等配置較好、價(jià)格不高的品牌。B類大學(xué)生消費(fèi)者在購買筆記本時(shí)青睞商家降價(jià)促銷和贈送購機(jī)禮包。商家在營銷上可以抓住這一點(diǎn),在經(jīng)營模式上可以選擇線上實(shí)行購買優(yōu)惠禮品套機(jī)的策略,在線下開展降價(jià)促銷活動,或者采用贈送購機(jī)禮包的方式來吸引B類消費(fèi)者。對于生產(chǎn)商,則要根據(jù)這類消費(fèi)者看重配置如CPU、顯卡、電池、硬盤容量的特點(diǎn),均衡配置、外觀設(shè)計(jì)和價(jià)格三方面的成本。

        3 分層交叉進(jìn)行誤差驗(yàn)證

        用分層交叉技術(shù)評估期望泛化能力,即預(yù)測模型對新鮮樣本的適應(yīng)能力[14-15]。模型泛化能力驗(yàn)證結(jié)果如下:

        從決策樹的混淆矩陣中可以看出:在大學(xué)生類別A的實(shí)例中,39個(gè)被正確預(yù)測為A類,3個(gè)被錯(cuò)誤預(yù)測。在類別為B的實(shí)例中,57個(gè)被正確預(yù)測為B類,正確分類百分比為96%,錯(cuò)誤分類百分比為4%,驗(yàn)證說明模型具有較高的新樣本數(shù)據(jù)適應(yīng)能力。

        [1]榮曉華,何成義.大學(xué)生自我概念與購買決策關(guān)系的實(shí)證研究——以筆記本電腦市場為例[J].吉林工商學(xué)院學(xué)報(bào),2012(1):48-51.

        [2]Honkanen P,Olsen S,Myrland O.Preference-based Segmentation:A study of meal preferences among Norweigian teenager[J].Journal of consumer Behavior,2004,3(3):235-250.

        [3]Mobasher B.Web Usage Mining In John Wang,Encyclopedia of Data Warehousing and Mining[M].Idea Group,2006.

        [4]Jefrey Lijffijt,Panagiotis Papapetrou.A statistical significance testing approach to mining the most informative set of patterns[J].Data Mining and Knowledge Discovery,2014,28(1):238-263.

        [5]林嘉.系統(tǒng)設(shè)計(jì)和基于用戶行為分析[D].廣州:中州大學(xué),2013.

        [6]俞勇,薛貴榮,韓定一,等.Web數(shù)據(jù)挖掘[M].北京:清華大學(xué)出版社,2009.322-324.

        [7]樊寧.K均值聚類算法在銀行客戶細(xì)分中的研究[J].計(jì)算機(jī)仿真,2011(3):369-372.

        [8]瞿小寧.K均值聚類算法在商業(yè)銀行客戶分類中的應(yīng)用[J].計(jì)算機(jī)仿真,2011,06:357-360.

        [9]關(guān)云鴻.改進(jìn)K-均值聚類算法在電信客戶分類中的應(yīng)用[J].計(jì)算機(jī)仿真,2011,08:138-140.

        [10]Menardi G,Torelli N.Training and assessing classification rules with imbalanced data[J].Data Mining and Knowledge Discovery,2014,28(1):92-122.

        [11]Sathyadevan S,Remya R Nair.Comparative Analysis of Decision Tree Algorithms:ID3,C4.5 and Random Forest[J].Computational Intelligence in Data Mining-Volume 1Smart Innovation,Systems and Technologies Volume,2015,31:549-562.

        [12]Iwata T,Sawada H.Topic model for analyzing purchase data with price information[J].Data Mining and Knowledge Discovery,2013,26(3):559-573.

        [13]湯克明.不確定數(shù)據(jù)流中頻繁數(shù)據(jù)挖掘研究[D].南京:南京航空航天大學(xué),2012.

        [14]王萍.基于數(shù)據(jù)挖掘技術(shù)的消費(fèi)者行為研究[D].長春:吉林大學(xué),2004.

        [15]李軍.基于用戶行為挖掘的數(shù)據(jù)流管理技術(shù)研究[D].北京:北京郵電大學(xué),2012.

        猜你喜歡
        數(shù)據(jù)挖掘規(guī)則消費(fèi)者
        撐竿跳規(guī)則的制定
        數(shù)獨(dú)的規(guī)則和演變
        探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
        消費(fèi)者網(wǎng)上購物六注意
        讓規(guī)則不規(guī)則
        Coco薇(2017年11期)2018-01-03 20:59:57
        知識付費(fèi)消費(fèi)者
        基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
        電力與能源(2017年6期)2017-05-14 06:19:37
        TPP反腐敗規(guī)則對我國的啟示
        悄悄偷走消費(fèi)者的創(chuàng)意
        悄悄偷走消費(fèi)者的創(chuàng)意
        少妇高潮精品正在线播放| 亚洲日本精品一区久久精品| 欧美熟妇与小伙性欧美交| 免费人成黄页网站在线观看国产| 久久综合伊人有码一区中文字幕 | 最新日本久久中文字幕| 免费观看全黄做爰大片| 亚洲一区二区精品在线| 久久国产精品亚洲va麻豆| 国产免费久久精品99久久| 看黄a大片日本真人视频直播| 黄色视频在线免费观看| 欧美亚洲国产另类在线观看| mm在线精品视频| 一级黄片草逼免费视频| 精品人妻一区二区三区视频| 日日噜噜夜夜狠狠久久丁香五月 | 精品含羞草免费视频观看| 99精品久久精品一区二区| 国产成人精品一区二区三区免费| 日韩无码视频淫乱| 天天中文字幕av天天爽| 日本一区二区三区在线观看视频| 华人在线视频精品在线| 国产激情无码视频在线播放性色| 欧美人和黑人牲交网站上线| 免费大片黄在线观看| 久久亚洲日本免费高清一区| 精品人妻久久av中文字幕| 日产一区日产2区日产| 色狠狠色狠狠综合天天| 国产精品无码久久久久| 免费人成黄页在线观看视频国产| 91亚洲欧洲日产国码精品| 熟女人妻一区二区三区| 久久久久无码国产精品一区| 亚洲一区精品无码色成人| 国产欧美另类精品久久久| 国语对白三级在线观看| 亚洲中文字幕久久精品一区| 少妇人妻综合久久中文字幕|