胡曉超
【摘要】 本文首先對數(shù)據(jù)挖掘技術(shù)進(jìn)行了分析,重點對數(shù)據(jù)挖掘技術(shù)中的協(xié)同過濾技術(shù)在電子商務(wù)推薦系統(tǒng)中的應(yīng)用與實現(xiàn)進(jìn)行了介紹與分析。希望能為促進(jìn)電子商務(wù)推薦系統(tǒng)的發(fā)展提供一定的借鑒。
【關(guān)鍵詞】 數(shù)據(jù)挖掘技術(shù);電子商務(wù);推薦系統(tǒng);研究
隨著計算機(jī)互聯(lián)網(wǎng)技術(shù)在社會工作與生活中的普及,電子商務(wù)產(chǎn)業(yè)也獲得了快速的發(fā)展。為了進(jìn)一步擴(kuò)大電子商務(wù)的市場,提高電子商務(wù)企業(yè)的經(jīng)濟(jì)效益,電子商務(wù)推薦系統(tǒng)被開發(fā)出來。而數(shù)據(jù)挖掘技術(shù)作為支持該系統(tǒng)運行的重要技術(shù),對電子商務(wù)推薦系統(tǒng)的發(fā)展具有重要意義。本文將主要對其進(jìn)行分析與研究。
一、數(shù)據(jù)挖掘技術(shù)概述
數(shù)據(jù)挖掘技術(shù)至今還沒有一個統(tǒng)一的、確定的概念定義。歸結(jié)起來,筆者認(rèn)為數(shù)據(jù)挖掘的概念應(yīng)主要包括以下三方面內(nèi)容:①未知。一些學(xué)者也將其表述為新穎。這一方面內(nèi)容強(qiáng)調(diào)的是數(shù)據(jù)挖掘技術(shù)能夠清楚的揭示出許多數(shù)據(jù)之間的相互關(guān)聯(lián)關(guān)系,并對于隱藏在這些數(shù)據(jù)信息后的隱含信息也能隨之被呈現(xiàn)。通常來說,被挖掘出的信息越隱秘,那么其價值也就越大[1]。②可用。一些學(xué)者也將其表述為有效、支持決策等。數(shù)據(jù)挖掘技術(shù)的這一內(nèi)容主要強(qiáng)調(diào)對數(shù)據(jù)信息可用性價值的需求。因為只有挖掘出了有價值的、能夠被人們利用的數(shù)據(jù)信息,才能滿足人們的需求,推動某些事物的發(fā)展。③可理解。一些學(xué)者也將這一內(nèi)容解釋為可解釋。然而無論表述之間存在著怎樣的差異,這一內(nèi)容都主要對被挖掘出的數(shù)據(jù)信息的可理解狀況提出了要求。只有那些通被商家與客戶理解的數(shù)據(jù)信息才能夠被最終應(yīng)用,發(fā)揮其自身的價值,帶動相關(guān)利益主體的進(jìn)步與發(fā)展。
二、協(xié)同過濾技術(shù)
數(shù)據(jù)挖掘技術(shù)有許多種類,如關(guān)聯(lián)規(guī)則、聚類、貝葉斯網(wǎng)絡(luò)和協(xié)同過濾技術(shù)等[2]。其中協(xié)同過濾技術(shù)作為數(shù)據(jù)挖掘技術(shù)中最具有價值的一種技術(shù),被廣泛的應(yīng)用到了現(xiàn)如今的電子商務(wù)推薦系統(tǒng)之中。
2.1協(xié)同過濾技術(shù)的實現(xiàn)
協(xié)同過濾技術(shù)的實現(xiàn)并不是一步就可以完成的,而需要經(jīng)過多個步驟。經(jīng)過歸納,筆者將其分為三個主要步驟:第一,人們需要事先對用戶進(jìn)行調(diào)查,以記錄和收集他們對企業(yè)商品項目的評價信息;第二,對企業(yè)項目集的搜索結(jié)果進(jìn)行生成操作;第三,對企業(yè)項目集推薦結(jié)果進(jìn)行生成操作[3]。在進(jìn)行第一個步驟時,人們經(jīng)常使用顯示評價法與人工調(diào)查法對商品項目的評價信息進(jìn)行收集。在電子商務(wù)時代,傳統(tǒng)的人工走訪方式已經(jīng)逐漸被取代,更多的是應(yīng)用顯示評價法對商品項目信息進(jìn)行收集。
2.2基于用戶的協(xié)同過濾技術(shù)
此種協(xié)同過濾技術(shù)主要通過慣性分析方式將電子商務(wù)企業(yè)的用戶作為研究對象,這種數(shù)據(jù)挖掘技術(shù)是以用戶為研究對象的。也就是說當(dāng)電子商務(wù)企業(yè)的某兩個用戶對于某一商品的評價信息趨于一致時,那么系統(tǒng)就會推斷這兩個用戶對商品的喜好品味是相同的,而商務(wù)推薦系統(tǒng)在以后的工作中在對某一商品進(jìn)行推薦評價等工作時就會認(rèn)為這兩個用戶也會對此商品有著同樣的喜愛程度。
將基于用戶的協(xié)同過濾技術(shù)應(yīng)用到電子商務(wù)的推薦系統(tǒng)中,電子商務(wù)推薦系統(tǒng)能夠更加輕松的對商品項目用戶的喜好傾向進(jìn)行搜集與挖掘,從而為相關(guān)的商家提供一定的數(shù)據(jù)信息支持其新產(chǎn)品的研發(fā)設(shè)計等。并且通過這一技術(shù)電子商務(wù)推薦系統(tǒng)還能夠?qū)Σ⑽促徺I過某商品的用戶,但是與其有著相同喜好的用戶已經(jīng)購買過的關(guān)聯(lián)用戶進(jìn)行商品推薦,以發(fā)掘更多的潛在購買用戶,擴(kuò)大企業(yè)的市場,增加產(chǎn)品的銷量,從而獲取更高的利益。
2.3基于項目的協(xié)同過濾技術(shù)
基于項目的協(xié)同過濾技術(shù)主要將商品項目作為其作用對象。若電子商務(wù)推薦系統(tǒng)要想將某件商品Y推薦給某個用戶S。就應(yīng)該首先將用戶S已經(jīng)購買并評價過的商品(Y1、Y2……Yn)進(jìn)行統(tǒng)計,然后對電子商務(wù)企業(yè)需要推薦的商品Y和這n個已經(jīng)評價過的商品之間的相似度進(jìn)行計算與對比。找出這n個評價過商品中與待推薦商品Y相似度最大的商品項目,從而建立起與待推薦商品Y相似的商品集合(n1、n2……nk)。由于商品用戶S對待推薦的商品Y的評價情況與用戶S對(n1、n2……nk)中商品集合的評價情況相似度較高,因此電子商務(wù)推薦系統(tǒng)會用用戶S對(n1、n2……nk)商品集合的評價值進(jìn)行加權(quán)的方式來得出用戶S對待推薦商品Y的評價值F。當(dāng)F大于推薦平均值w時,電子商務(wù)推薦系統(tǒng)就會對用戶S推薦商品Y。
三、結(jié)束語
本文主要對基于數(shù)據(jù)挖掘技術(shù)的電子商務(wù)推薦系統(tǒng)進(jìn)行了研究,并重點對協(xié)同過濾技術(shù)對電子商務(wù)推薦系統(tǒng)的重要性作用進(jìn)行了分析,希望能夠進(jìn)一步推動電子商務(wù)推薦系統(tǒng)的發(fā)展。
參 考 文 獻(xiàn)
[1] 韓家煒.數(shù)據(jù)挖掘——概念與技術(shù)(范明,孟小峰譯)[M].機(jī)械工業(yè)出版社,2011.
[2] 郭萌,王玨.數(shù)據(jù)挖掘與數(shù)據(jù)庫知識發(fā)現(xiàn):綜述[J].模式識別與人工智能,2010,11(3):292-299.
[3] 卞榮兵.基于網(wǎng)格密度的數(shù)據(jù)挖掘的研究與應(yīng)用[D].南京氣象學(xué)院碩士論文,2013,14(2):12-19.