亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        計(jì)算機(jī)應(yīng)用新領(lǐng)域—數(shù)據(jù)挖掘前景及應(yīng)用探究

        2012-12-31 00:00:00劉臻

        摘要:本文首先介紹了數(shù)據(jù)挖掘的發(fā)展背景和數(shù)據(jù)挖掘的概念及應(yīng)用價(jià)值;然后對(duì)數(shù)據(jù)挖掘中的價(jià)值實(shí)現(xiàn)難點(diǎn)進(jìn)行分析;在此基礎(chǔ)上結(jié)合化妝品企業(yè)數(shù)據(jù)挖掘的具體案例進(jìn)行分析,驗(yàn)證了數(shù)據(jù)挖掘的商業(yè)價(jià)值;最后在此基礎(chǔ)上分析對(duì)數(shù)據(jù)挖掘的發(fā)展進(jìn)行展望,指出未來數(shù)據(jù)挖掘發(fā)展的三大趨勢。

        關(guān)鍵詞:數(shù)據(jù)挖掘;商業(yè)智能;關(guān)聯(lián)規(guī)則;Apriori算法

        中圖分類號(hào):TP391 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1007-9599 (2012) 17-0000-02

        1 數(shù)據(jù)挖掘概念

        數(shù)據(jù)挖掘(Data Mining)是指基于一定業(yè)務(wù)目標(biāo)下從海量數(shù)據(jù)中挖取潛在的、合理的并能被人理解的模式的高級(jí)處理過程。與傳統(tǒng)的數(shù)據(jù)分析最大本質(zhì)區(qū)別是數(shù)據(jù)分析所得到的信息具有先前未知、有效和實(shí)用三個(gè)特征,即數(shù)據(jù)挖掘是發(fā)現(xiàn)那些不能靠直覺發(fā)現(xiàn)的信息或知識(shí),甚至違背直覺的信息或知識(shí),挖掘出來的信息越出乎意料越有價(jià)值。

        2 數(shù)據(jù)挖掘的價(jià)值實(shí)現(xiàn)難點(diǎn)分析

        數(shù)據(jù)挖掘是數(shù)據(jù)庫中的知識(shí)發(fā)現(xiàn),從知識(shí)發(fā)現(xiàn)到知識(shí)應(yīng)用、再到價(jià)值評(píng)估是一條數(shù)據(jù)挖掘價(jià)值變現(xiàn)的過程,雖然數(shù)據(jù)挖掘重要性毋庸置疑;但事實(shí)上其轉(zhuǎn)變商業(yè)價(jià)值之路仍有較多困難。

        2.1 知識(shí)發(fā)現(xiàn)。知識(shí)發(fā)現(xiàn)是這條路的始端,直接決定了最終價(jià)值的高度。挖掘的方法是通用的,但難度不在挖掘技術(shù),而在于實(shí)施人員對(duì)數(shù)據(jù)業(yè)務(wù)的理解,在于數(shù)據(jù)的質(zhì)量。實(shí)施人員必須清楚的知道數(shù)據(jù)回收的場景和原理,稍有溝通缺失,都會(huì)影響知識(shí)的質(zhì)量度。

        2.2 知識(shí)應(yīng)用。發(fā)現(xiàn)了知識(shí),只是邁出第一步,需要將相關(guān)的知識(shí)發(fā)現(xiàn)交給業(yè)務(wù)部門進(jìn)行運(yùn)營使用。不管是以甲方公司還是乙方公司的形式存在,難點(diǎn)在于語言的翻譯轉(zhuǎn)發(fā)。數(shù)據(jù)挖掘的語言形式是概率形式,類如“連續(xù)三天內(nèi)在站內(nèi)搜索超過10次,瀏覽搜索結(jié)果相關(guān)頁面20次以上的用戶最終購買概率為42%”,因此需要實(shí)施人員深諳運(yùn)營知識(shí),將挖掘結(jié)果語言轉(zhuǎn)化成運(yùn)營結(jié)果語言,最終成為友好的商業(yè)運(yùn)營智慧。應(yīng)用的過程還需要及時(shí)跟蹤、分析、調(diào)整,畢竟市場是多變的,分析與執(zhí)行就像左腦和右腦,兩者距離的遠(yuǎn)近,影響結(jié)果的優(yōu)劣。

        2.3 價(jià)值評(píng)估。數(shù)據(jù)挖掘的效果評(píng)估決定最終的話語和地位。從結(jié)果來看,如果結(jié)果有效,如何界定是知識(shí)有效還是執(zhí)行有效;如果結(jié)果無效,如何界定是知識(shí)無效還是執(zhí)行無效;如果知識(shí)有效,如何界定是通過挖掘發(fā)現(xiàn)還是已知發(fā)現(xiàn)。如果不能很清晰的界定,數(shù)據(jù)挖掘的存在價(jià)值都會(huì)大打折扣。曾經(jīng)有個(gè)笑話,“通過我們海量數(shù)據(jù)發(fā)現(xiàn),中國的15-20歲的男性網(wǎng)民最喜歡使用QQ即時(shí)通訊工具”,這樣的知識(shí)發(fā)現(xiàn)雖然是個(gè)笑話,但在現(xiàn)實(shí)行業(yè)里是個(gè)不爭的事實(shí)。數(shù)據(jù)挖掘的價(jià)值應(yīng)當(dāng)是顯現(xiàn)的、直觀的、令人信服的,不在于挖掘的技術(shù)多么高深,而在于整個(gè)體系的搭建和成果的展現(xiàn),做的再好,看不到效果,等于無效。

        以上三點(diǎn)就像三座大山,壓在了數(shù)據(jù)挖掘的變現(xiàn)之路,下面筆者將論述數(shù)據(jù)挖掘的商業(yè)應(yīng)用價(jià)值。

        3 數(shù)據(jù)挖掘應(yīng)用—關(guān)聯(lián)規(guī)則在化妝品營銷當(dāng)中運(yùn)用

        3.1 關(guān)聯(lián)規(guī)則概念。關(guān)聯(lián)規(guī)則指通過分析發(fā)現(xiàn)數(shù)據(jù)庫中不同變量或個(gè)體(例如商品間的關(guān)系及年齡與購買行為上關(guān)系)之間的關(guān)系程度,用以找出顧客購買行為模式。

        3.2 Apriori算法步驟。(1)首先設(shè)定最小支持度及最小依賴度。(2)Apriori算法使用了候選物項(xiàng)集合的概念;首先產(chǎn)生候選項(xiàng)集合,若候選物集合的支持度大于或等于最小支持度,則候選物項(xiàng)集合為高頻物項(xiàng)集合。(3)在數(shù)據(jù)庫中讀取所有交易,得出候選單物項(xiàng)集合的支持度,再找出高頻單物項(xiàng)集合,并利用這些高頻單物項(xiàng)集合的結(jié)合,產(chǎn)生候選2物項(xiàng)集合。(4)再次掃描數(shù)據(jù)庫,得出候選2物項(xiàng)集合的支持度,接著找出高頻2物項(xiàng)集合,并利用這些高頻2物項(xiàng)集合的結(jié)合,產(chǎn)生候選3物項(xiàng)集合。(5)重復(fù)掃描數(shù)據(jù)庫,與最小支持度比較,產(chǎn)生高頻物項(xiàng)集合,再結(jié)合下一級(jí)候選物項(xiàng)集合,直到不再結(jié)合出新的候選物項(xiàng)集合為止。

        當(dāng)然在采用Apriori算法時(shí),因計(jì)算物項(xiàng)太多而造成運(yùn)行緩慢,主要原因是高頻物項(xiàng)集合產(chǎn)生過多的物項(xiàng)集合,尤其是候選2物項(xiàng)集合的情況最為嚴(yán)重。

        3.3 關(guān)聯(lián)規(guī)則在零售行業(yè)營銷處理的思路。采用Apriori算法掃描企業(yè)數(shù)據(jù)庫,得出最終頻繁產(chǎn)品集合。假定最終頻繁產(chǎn)品集合為{1,2,3,4,5,6},此時(shí)總共可以找到類似啤酒尿布的組合共計(jì)6+45+140+225=416種關(guān)聯(lián)產(chǎn)品推薦組合,營銷人員可以制定相應(yīng)規(guī)劃,即當(dāng)某顧客購買任意兩個(gè)或三個(gè)或四個(gè)或五個(gè)產(chǎn)品推出相應(yīng)產(chǎn)品進(jìn)行關(guān)聯(lián)銷售,提高銷售機(jī)會(huì)。根據(jù)企業(yè)數(shù)據(jù)庫可以得到相應(yīng)的置信度;進(jìn)而提出商業(yè)建議進(jìn)行關(guān)聯(lián)產(chǎn)品銷售,提高產(chǎn)品銷售概率。

        3.4 案例分析:關(guān)聯(lián)規(guī)則在化妝品行業(yè)營銷實(shí)踐。化妝品企業(yè)中會(huì)有很多交易,那么如何發(fā)現(xiàn)其中規(guī)律進(jìn)行關(guān)聯(lián)營銷提高銷售機(jī)會(huì)呢?為了計(jì)算機(jī)識(shí)別方便,我們化妝品企業(yè)的需要分析的1000種化妝品進(jìn)行排序,分別用1-1000代替,建立顧客的交易數(shù)據(jù)庫,找出客戶交易數(shù)據(jù)矩陣,通過Matlab關(guān)聯(lián)規(guī)則運(yùn)算箱運(yùn)行結(jié)果如下。

        我們可以看到客戶買110產(chǎn)品顧客再買94號(hào)產(chǎn)品概率為94.4%,可以把兩者進(jìn)行組合銷售;同樣買122的產(chǎn)品再買94號(hào)產(chǎn)品概率為47.6%,也就是說顧客買122號(hào)產(chǎn)品時(shí)可以推薦94號(hào)產(chǎn)品提高銷售機(jī)率;同樣我們也發(fā)現(xiàn)94產(chǎn)品出現(xiàn)概率特別高,可以認(rèn)定這是顧客非常喜歡的產(chǎn)品,得到商業(yè)建議。

        (1)玫瑰全日保濕乳和玫瑰保濕柔膚水兩個(gè)產(chǎn)品組合銷售。(2)銀杏果勻膚隔離霜和玫瑰保濕柔膚水兩個(gè)產(chǎn)品系列交叉購買情況。(3)玫瑰保濕柔膚水該產(chǎn)品為明星產(chǎn)品。

        該企業(yè)采取上述商業(yè)建議后,到目前為止連續(xù)幾個(gè)月實(shí)現(xiàn)銷售額增長10%以上,給企業(yè)帶來較大的收益,再次驗(yàn)證數(shù)據(jù)挖掘商業(yè)價(jià)值。

        (注:110號(hào)代表玫瑰全日保濕乳;94號(hào)代表玫瑰保濕柔膚水;122代表銀杏果勻膚隔離霜)

        4 數(shù)據(jù)挖掘的趨勢

        4.1 趨勢一:大數(shù)據(jù),大分析。近兩年關(guān)于數(shù)據(jù)挖掘出現(xiàn)了“大數(shù)據(jù)”這個(gè)概念,一些電子商務(wù)網(wǎng)站的數(shù)據(jù)量增長尤其明顯。大數(shù)據(jù)會(huì)影響數(shù)據(jù)挖掘的工具以及方法。針對(duì)這種情況,SAS提出“大分析”的概念。光有大數(shù)據(jù),沒有一套匹配的技術(shù)來配合也不行。SAS基于大分析的趨勢提出高性能計(jì)算的解決策略。

        4.2 趨勢二:非結(jié)構(gòu)化數(shù)據(jù)的海洋。非結(jié)構(gòu)化數(shù)據(jù)的數(shù)據(jù)量增加越來越快,筆者認(rèn)為它與結(jié)構(gòu)化數(shù)據(jù)就像海洋和陸地的比例。在非結(jié)構(gòu)化數(shù)據(jù)發(fā)展中,要點(diǎn)是如何從非結(jié)構(gòu)化向結(jié)構(gòu)化轉(zhuǎn)變,做結(jié)構(gòu)化處理。這里面涉及了文本挖掘、自然語言處理等更細(xì)化的技術(shù)實(shí)現(xiàn)手段。此外,非結(jié)構(gòu)化數(shù)據(jù)與結(jié)構(gòu)化數(shù)據(jù)結(jié)合也將是一個(gè)發(fā)展熱點(diǎn),單純依靠其一都不可靠。

        4.3 趨勢三:社會(huì)化分析。社會(huì)化分析主要涉及社會(huì)媒體分析和社會(huì)網(wǎng)絡(luò)分析。在微博上,熟人和陌生人都可以彼此互相關(guān)注,信息被評(píng)論、轉(zhuǎn)發(fā)又會(huì)不斷擴(kuò)展、發(fā)散,逐漸放大。企業(yè)會(huì)關(guān)注人們在微博上的動(dòng)向,政府也會(huì)關(guān)心言論的走向。對(duì)于普通用戶,也會(huì)涉及到自己交往圈、關(guān)系圈。在圈子里面哪些人是影響者,哪些是跟隨者,哪些是邊緣人,找到這些關(guān)鍵點(diǎn),對(duì)營銷會(huì)有很大幫助,從中可以未來數(shù)據(jù)挖掘場景圖。

        5 結(jié)論

        數(shù)據(jù)挖掘技術(shù)是一新興的研究領(lǐng)域,商業(yè)利益的驅(qū)動(dòng)將會(huì)促使其不停地發(fā)展,每年都有新的數(shù)據(jù)挖掘方法和模型問世,人們對(duì)它的研究正日益廣泛和深入,其商業(yè)價(jià)值也日益突顯。盡管對(duì)數(shù)據(jù)挖掘的研究仍面臨著諸多問題和挑戰(zhàn),還存在很多問題值我們?nèi)ヌ剿餮芯?,但我們有理由相信在不久將來?shù)據(jù)挖掘發(fā)揮的作用和價(jià)值會(huì)越來越大。

        參考文獻(xiàn):

        [1]朱世武.數(shù)據(jù)挖掘運(yùn)用的理論與技術(shù)[J].統(tǒng)計(jì)研究,2003.

        [2]鄭繼剛.數(shù)據(jù)挖掘研究的現(xiàn)狀與發(fā)展趨勢[J].紅河學(xué)院學(xué)報(bào),2010.

        全国一区二区三区女厕偷拍| 亚洲AV无码一区二区三区性色学| 免费观看国产短视频的方法| 亲少妇摸少妇和少妇啪啪 | 免费人成视频网站在在线| 国产成人久久精品激情91| 亚洲av永久无码精品网址| 日本高清视频一区二区| 久久免费大片| 亚洲国产成人精品无码区二本| 日本乱熟人妻中文字幕乱码69| 亚洲国产欧美另类va在线观看| 青春草在线视频免费观看| 青青草久久久亚洲一区| av一区无码不卡毛片| 国产成熟人妻换╳╳╳╳| 三上悠亚亚洲精品一区| 亚洲精品美女久久久久99| 八戒网站免费观看视频| 欧美最猛黑人xxxx| 久久国产精品国语对白| 精品国偷自产在线不卡短视频| 99精品国产一区二区三区| 国产亚洲精品90在线视频| 美女福利一区二区三区在线观看| 少妇邻居内射在线| 免费视频成人片在线观看 | 毛片在线视频成人亚洲| 久久午夜伦鲁鲁片免费| 99精品国产在热久久国产乱| 亚洲欧美日韩成人高清在线一区| 亚洲国产精品国自产拍性色| 水蜜桃视频在线观看免费18| 一本大道久久精品 东京热| 久久伊人色av天堂九九| 无码av中文一区二区三区桃花岛| 91久久国产香蕉熟女线看| 亚洲国产精品免费一区| 亚洲中文av一区二区三区| 99精品视频在线观看| 漂亮人妻被中出中文字幕久久 |