亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        Web數(shù)據(jù)挖掘在淘寶網(wǎng)玩具市場(chǎng)的應(yīng)用

        2012-12-31 00:00:00馮觀強(qiáng)

        摘要:本文詳細(xì)探討了Web數(shù)據(jù)挖掘技術(shù)在淘寶網(wǎng)玩具市場(chǎng)的應(yīng)用。通過(guò)爬取淘寶網(wǎng)玩具市場(chǎng)的網(wǎng)頁(yè)數(shù)據(jù)信息,并應(yīng)用數(shù)據(jù)挖掘技術(shù)對(duì)這些數(shù)據(jù)進(jìn)行分析、挖掘,發(fā)現(xiàn)了一些對(duì)賣家決策有指導(dǎo)意義的知識(shí)。

        關(guān)鍵詞:Web數(shù)據(jù)挖掘;淘寶網(wǎng);網(wǎng)絡(luò)爬蟲(chóng)

        中圖分類號(hào):F274.6 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1007-9599 (2012) 22-0000-02

        1 概述

        Web數(shù)據(jù)挖掘是從Web的超鏈接結(jié)構(gòu)、網(wǎng)頁(yè)內(nèi)容和使用日志中挖掘有用的信息。根據(jù)在挖掘過(guò)程中使用的Web數(shù)據(jù)類型,Web數(shù)據(jù)挖掘可以被劃分為三種主要類型:Web結(jié)構(gòu)挖掘(Web Structure Mining)、Web內(nèi)容挖掘(Web Content Mining)和Web使用挖掘(Web Usage Mining)[1]。

        本文將探討在淘寶網(wǎng)玩具市場(chǎng)中Web數(shù)據(jù)挖掘技術(shù)的應(yīng)用,整個(gè)Web數(shù)據(jù)挖掘的流程是利用網(wǎng)絡(luò)爬蟲(chóng)程序采集淘寶網(wǎng)玩具市場(chǎng)上的大量數(shù)據(jù),并對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,然后運(yùn)用數(shù)據(jù)分析和數(shù)據(jù)挖掘的各種技術(shù)發(fā)現(xiàn)知識(shí)、模式,最后將數(shù)據(jù)分析和數(shù)據(jù)挖掘的結(jié)果展現(xiàn)出來(lái),幫助淘寶網(wǎng)賣家做出正確的決策。

        2 數(shù)據(jù)收集和預(yù)處理

        雖然說(shuō)數(shù)據(jù)作為可挖掘知識(shí)的金庫(kù),理應(yīng)是多多益善。然而考慮到淘寶網(wǎng)電子商務(wù)平臺(tái)上的數(shù)據(jù)量極為龐大,因此本課題將選定淘寶網(wǎng)玩具市場(chǎng)的前20名大賣家(按季度總交易金額降序排名)的相關(guān)數(shù)據(jù)信息作為數(shù)據(jù)準(zhǔn)備模塊的爬取對(duì)象。這些數(shù)據(jù)信息主要有:賣家店鋪信息、賣家商品信息、商品歷史成交記錄信息、歷史賣家詳細(xì)信息。

        爬取到的數(shù)據(jù)存在兩個(gè)問(wèn)題:1、包含噪音和異常情況,需要經(jīng)過(guò)過(guò)濾。2、數(shù)據(jù)量非常大,其中包含了很多不相關(guān)的數(shù)據(jù)信息。因此,需要按照數(shù)據(jù)分析和數(shù)據(jù)挖掘的具體需要,通過(guò)選擇特定屬性相關(guān)的數(shù)據(jù)進(jìn)行抽取,并清理掉噪音數(shù)據(jù)[3]。

        將數(shù)據(jù)收集部分爬取到的網(wǎng)頁(yè)資源作為Web數(shù)據(jù)挖掘的源頭,通過(guò)數(shù)據(jù)預(yù)處理模塊對(duì)這些網(wǎng)頁(yè)資源中的數(shù)據(jù)進(jìn)行抽取、清理、轉(zhuǎn)換和匯總,最終加載到筆者自己搭建的小型數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)庫(kù)中,為后續(xù)的數(shù)據(jù)分析和數(shù)據(jù)挖掘工作提供數(shù)據(jù)支持。

        3 數(shù)據(jù)挖掘和結(jié)果可視化

        淘寶網(wǎng)買家信用級(jí)別會(huì)隨著買家網(wǎng)購(gòu)次數(shù)的增多而逐漸升高,它代表了淘寶買家的網(wǎng)齡。平均每次交易金額這一參數(shù)代表了淘寶買家的單次網(wǎng)購(gòu)消費(fèi)能力。是否買家網(wǎng)購(gòu)次數(shù)越多,越傾向于接受價(jià)格偏高的商品呢?帶著這個(gè)疑問(wèn),本章將以買家信用級(jí)別和買家的平均每次交易金額為研究參數(shù),來(lái)探討買家的單次消費(fèi)能力是否和買家的網(wǎng)齡之間的關(guān)系。研究結(jié)果將指導(dǎo)淘寶賣家制定網(wǎng)店經(jīng)營(yíng)策略。

        用聚類方法分析買家信用級(jí)別和平均每次交易金額的關(guān)系,從而確定出每個(gè)買家信用級(jí)別所對(duì)應(yīng)的網(wǎng)購(gòu)消費(fèi)能力,以區(qū)別出高消費(fèi)網(wǎng)購(gòu)人群和低消費(fèi)網(wǎng)購(gòu)人群。本文采用TwoStep算法進(jìn)行聚類分析,必要的時(shí)候采用K-Means聚類算法做為補(bǔ)充進(jìn)行驗(yàn)證,以得到最佳的研究結(jié)論。

        經(jīng)過(guò)TwoStep(兩步)算法和K-Means算法的聚類分析,得到聚類分析結(jié)果,將分析結(jié)果用可視化技術(shù)導(dǎo)出的分布圖如圖1所示:

        將每個(gè)聚類的主要買家信用級(jí)別和平均每次交易金額均值匯總,按買家信用級(jí)別升序排列,如表1所示:

        通過(guò)表1,可以得出以下3點(diǎn)結(jié)論:

        3.1 在淘寶網(wǎng)市場(chǎng)中,中低檔(單價(jià)100元以內(nèi))依然是主打,購(gòu)買人數(shù)最多。因此,建議淘寶賣家選擇中低價(jià)格的進(jìn)貨售賣,單價(jià)最好控制在100元以內(nèi)。

        3.2 買家的信用級(jí)別代表了該買家的網(wǎng)購(gòu)次數(shù)、網(wǎng)齡,但是隨著買家的網(wǎng)購(gòu)次數(shù)、網(wǎng)齡的增加,買家在購(gòu)買時(shí)的單筆消費(fèi)能力并不會(huì)隨著提升。相反,反而有略微下降。這種略微下降可能是因?yàn)榫W(wǎng)齡大的買家網(wǎng)購(gòu)經(jīng)驗(yàn)豐富,在網(wǎng)購(gòu)時(shí)可以找到更合理價(jià)格的進(jìn)行購(gòu)買。淘寶賣家在對(duì)網(wǎng)齡較大的買家進(jìn)行網(wǎng)絡(luò)營(yíng)銷時(shí),應(yīng)考慮到這類買家網(wǎng)購(gòu)經(jīng)驗(yàn)豐富,在價(jià)格選擇上會(huì)更加理性這一點(diǎn),應(yīng)重點(diǎn)突出自身價(jià)格優(yōu)勢(shì),做到真正的價(jià)廉物美,而不是單純利用信息不對(duì)稱而標(biāo)注虛高價(jià)格。

        3.3 11-40(淘寶兩顆心買家)和41-90(淘寶三顆心買家)的交易數(shù)最多,且具有較高的平均每次交易金額。淘寶玩具產(chǎn)品賣家應(yīng)重點(diǎn)把握這部分買家,加強(qiáng)對(duì)這兩類買家的網(wǎng)絡(luò)營(yíng)銷活動(dòng),如優(yōu)先向其發(fā)送新品上架通知等,增加促銷活動(dòng)等。以及特別提升對(duì)于這兩類買家的整體服務(wù),保證以較合理的交易價(jià)促成這類買家更多的交易。

        4 結(jié)論與展望

        本文詳細(xì)探討了Web數(shù)據(jù)挖掘技術(shù)在淘寶網(wǎng)玩具市場(chǎng)的應(yīng)用。通過(guò)爬取淘寶網(wǎng)玩具市場(chǎng)的網(wǎng)頁(yè)數(shù)據(jù)信息,并應(yīng)用數(shù)據(jù)挖掘技術(shù)對(duì)這些數(shù)據(jù)進(jìn)行分析、挖掘,發(fā)現(xiàn)了一些對(duì)賣家決策有指導(dǎo)意義的知識(shí)。

        本文的研究雖然取得了初步的成功,但尚存在一些地方有待進(jìn)一步的深入研究,這里擇其要者簡(jiǎn)要討論如下:

        4.1 數(shù)據(jù)收集部分的爬蟲(chóng)算法優(yōu)化

        數(shù)據(jù)收集部分的淘寶網(wǎng)爬蟲(chóng)程序中的爬取算法在并發(fā)處理方面尚存在一些缺陷,有待進(jìn)一步的算法改進(jìn)。

        4.2 結(jié)果可視化部分完善

        結(jié)果可視化部分,是以直觀的,易被用戶理解的方式展現(xiàn)給淘寶網(wǎng)上的商品類賣家,幫助賣家在店鋪運(yùn)營(yíng)過(guò)程中正確把握買家需求,做出正確的運(yùn)營(yíng)決策。在后續(xù)的研究工作中,該模塊的部分功能將進(jìn)一步的完善。

        參考文獻(xiàn):

        [1]俞勇,薛貴榮.Web數(shù)據(jù)挖掘.北京:清華大學(xué)出版社,2009.6-7

        [2]徐禾芳.基于數(shù)據(jù)挖掘的數(shù)據(jù)庫(kù)營(yíng)銷的實(shí)現(xiàn).中國(guó)管理信息化,2010,Vol.13(10):100-101

        [3]沈鈞毅,宋擒豹.Web數(shù)據(jù)挖掘:將客戶數(shù)據(jù)轉(zhuǎn)化為客戶價(jià)值.北京:電子工業(yè)出版社,2004:14

        国产无套乱子伦精彩是白视频| 人妻中文字幕一区二区二区| 久久国产女同一区二区| 一区二区三区视频在线观看免费| 国产精品久久人妻无码| 日韩无码视频淫乱| 亚洲人妻中文字幕在线视频| 99久久精品一区二区国产| 国产午夜福利精品一区二区三区| 国产第19页精品| 亚洲一区二区情侣| 国产精品一二三区亚洲| 色五月丁香五月综合五月| 亚洲av无码一区二区乱子伦as| 狠狠色噜噜狠狠狠狠97俺也去| 一本色道久久综合亚洲精品不| 在线播放真实国产乱子伦| 国产精品人妻一区夜夜爱| 亚洲AV无码一区二区三区精神| 人妻精品久久一区二区三区| 一区二区三区视频| 色狠狠色狠狠综合一区| 日韩精品中文字幕人妻系列| 精品在线视频在线视频在线视频 | 亚洲欧美日本| 久久99精品久久久久久国产人妖| 国产高清人肉av在线一区二区| 特级精品毛片免费观看| 三级网址在线| 久久久亚洲精品蜜臀av| 亚洲免费观看视频| 欧美性开放bbw| 超碰观看| 91九色最新国产在线观看| 风韵多水的老熟妇| 亚洲第一无码精品久久| 国产激情小视频在线观看| 亚洲国产成人一区二区精品区 | 国产一区二区三区精品成人爱| 欧美肥妇毛多水多bbxx水蜜桃| 国产香蕉97碰碰视频va碰碰看|