亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于云計算的電子商務(wù)推薦系統(tǒng)研究

        2014-07-10 11:43:27江雨燕邵源李平李常訓(xùn)趙文輝
        關(guān)鍵詞:存儲系統(tǒng)引擎分布式

        江雨燕,邵源,李平,李常訓(xùn),趙文輝

        (安徽工業(yè)大學(xué)a.管理科學(xué)與工程學(xué)院;b.外國語學(xué)院,安徽馬鞍山243032)

        基于云計算的電子商務(wù)推薦系統(tǒng)研究

        江雨燕a,邵源a,李平a,李常訓(xùn)a,趙文輝b

        (安徽工業(yè)大學(xué)a.管理科學(xué)與工程學(xué)院;b.外國語學(xué)院,安徽馬鞍山243032)

        通過對云計算系統(tǒng)架構(gòu)、平臺開發(fā)、用戶行為分析、電子商務(wù)應(yīng)用等方面的研究,提出了一種新型的分布式存儲系統(tǒng),并在此基礎(chǔ)上構(gòu)建了一種新的智能化電子商務(wù)個性化推薦系統(tǒng)。該推薦系統(tǒng)有效解決了大型日志數(shù)據(jù)存儲、無法實時推薦、算法伸縮性低等問題,為用戶提供動態(tài)、實時的個性化服務(wù),實現(xiàn)了商務(wù)推薦引擎的個性化和智能化。

        云計算;電子商務(wù);用戶行為分析;推薦系統(tǒng)

        隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,電子商務(wù)的應(yīng)用越來越廣泛。但互聯(lián)網(wǎng)數(shù)據(jù)和內(nèi)容的不斷增長,使得電子商務(wù)的發(fā)展瓶頸日益凸顯[1]。作為電子商務(wù)的重要工具,推薦引擎的發(fā)展也受到了限制。云計算的提出和發(fā)展為電子商務(wù)推薦引擎處理海量數(shù)據(jù),以及在集群上的應(yīng)用奠定了基礎(chǔ)。

        分布式系統(tǒng)能有效解決高性能計算系統(tǒng)的海量數(shù)據(jù)存儲和I/O瓶頸問題[2]。分布式網(wǎng)絡(luò)存儲系統(tǒng)采用可擴展的系統(tǒng)結(jié)構(gòu),利用多臺存儲服務(wù)器分擔(dān)存儲負(fù)荷,利用位置服務(wù)器定位存儲信息,為海量數(shù)據(jù)的存儲提供了條件?;ヂ?lián)網(wǎng)中的大量數(shù)據(jù)可以通過分布式文件系統(tǒng),存儲在多個數(shù)據(jù)節(jié)點上。MapReduce[3]是分布式的計算模型,它與分布式存儲系統(tǒng)由于其優(yōu)秀的性能已經(jīng)廣泛應(yīng)用于科學(xué)計算、互聯(lián)網(wǎng)服務(wù)、海量數(shù)據(jù)處理等任務(wù)中。

        1 云計算概念

        云計算是并行計算、分布式計算和網(wǎng)格計算的延伸,是這些計算科學(xué)概念的商業(yè)化,是一種能夠動態(tài)伸縮的虛擬化資源,該資源在互聯(lián)網(wǎng)上通過服務(wù)的形式來提供給客戶,同時客戶無需知道如何管理支持云計算的這些基礎(chǔ)設(shè)施。

        1.1 云計算系統(tǒng)的定義

        云計算系統(tǒng)是由一組內(nèi)部互聯(lián)的虛擬機組成的并行和分布式計算系統(tǒng),該系統(tǒng)能夠根據(jù)服務(wù)提供商和客戶之間協(xié)商的服務(wù)等級協(xié)議動態(tài)提供計算資源。云計算系統(tǒng)是以付費使用的形式向用戶提供各種服務(wù)的分布式計算系統(tǒng),系統(tǒng)對用戶來說是透明的,其本質(zhì)是對虛擬化的計算和存儲資源池進(jìn)行動態(tài)部署、動態(tài)分配/重分配、實時監(jiān)控的系統(tǒng)。從而向用戶提供滿足Qos要求的計算服務(wù)、數(shù)據(jù)存儲服務(wù)以及平臺服務(wù)[4]。它為用戶屏蔽了底層異構(gòu)的軟硬件資源,為其提供服務(wù)和資源,各種不同類型的資源經(jīng)過層層的虛擬化技術(shù)后,針對虛擬資源的分配、共享和使用。

        1.2 分布式文件系統(tǒng)

        分布式文件系統(tǒng)(Distributed File System)是指文件系統(tǒng)管理的物理存儲資源并不是直接連接在本地節(jié)點上,而是通過計算機網(wǎng)絡(luò)與節(jié)點相連。分布式文件系統(tǒng)的設(shè)計基于客戶機/服務(wù)器模式。一個典型的網(wǎng)絡(luò)可能包括多個供多用戶訪問的服務(wù)器。另外,對等特性允許一些系統(tǒng)扮演客戶機和服務(wù)器的雙重角色。分布式文件系統(tǒng)Distributed File System(DFS)采用主從架構(gòu),一個分布式文件系統(tǒng)由唯一一個目錄節(jié)點NameNode(主節(jié)點),和多個數(shù)據(jù)節(jié)點DataNode(子節(jié)點)組成。分布式文件系統(tǒng)對外表現(xiàn)為一個普通的文件系統(tǒng),用戶可以用文件名去存取文件,而實際上這個文件是被分成不同的數(shù)據(jù)塊,這些數(shù)據(jù)塊就是存儲在數(shù)據(jù)節(jié)點上面[5]。

        1.3 分布式計算

        MapReduce是一種用于大規(guī)模數(shù)據(jù)集(大于1 TB)的并行運算的編程模型,其起源于函數(shù)式編程模型主要包含兩項核心操作:Map和Reduce。Map是把一組數(shù)據(jù)一對一的映射為另外的一組數(shù)據(jù),其映射的規(guī)則由一個Map函數(shù)來指定。Reduce是對一組數(shù)據(jù)進(jìn)行規(guī)約,這個規(guī)約由一個Reduce函數(shù)指定。Map是一個把數(shù)據(jù)分開的過程,Reduce則是把數(shù)據(jù)合并的過程。

        2.1 推薦引擎定義

        推薦引擎利用特殊的信息過濾[6](IF,Information Filtering)技術(shù),將不同的內(nèi)容(例如電影、音樂、書籍、新聞、圖片、網(wǎng)頁等)推薦給可能感興趣的用戶[7]。通常情況下,推薦引擎的實現(xiàn)是通過將用戶的個人喜好與特定的參考特征進(jìn)行比較,并試圖預(yù)測用戶對一些未評分項目的喜好程度。參考特征的選取可能是從項目本身的信息中提取的,或是基于用戶所在的社會或社團環(huán)境。

        電子商務(wù)推薦系統(tǒng)(E-Commence Recommendation System)向客戶提供商品信息和購買建議,模擬銷售人員幫助客戶完成購買過程。智能推薦系統(tǒng)的作用可以概括為:將電子商務(wù)網(wǎng)站的瀏覽者轉(zhuǎn)變?yōu)橘徺I者,提高電子商務(wù)網(wǎng)站的交叉銷售能力,提高客戶對電子商務(wù)網(wǎng)站的忠誠度。

        2.2 推薦引擎現(xiàn)狀

        1)隨著電子商務(wù)網(wǎng)站規(guī)模的擴大,一般大型電子商務(wù)系統(tǒng)擁有百萬數(shù)量級的產(chǎn)品和用戶,用戶和產(chǎn)品數(shù)的增長都會導(dǎo)致算法運行的性能下降?;趙eb的推薦算法面臨嚴(yán)重的伸縮性問題。

        2)電子商務(wù)推薦系統(tǒng)是和電子商務(wù)應(yīng)用服務(wù)系統(tǒng)相結(jié)合的,由于瀏覽者的耐心有限,因此推薦系統(tǒng)的實時性和它的推薦效果直接關(guān)系。但在大型電子商務(wù)推薦系統(tǒng)中,由于數(shù)據(jù)量日結(jié)越累,并快速增長,推薦系統(tǒng)的實時性越來越難以保證。這對推薦計數(shù)和推薦系統(tǒng)架構(gòu)提出了新的挑戰(zhàn)。

        圖1 主流的電子商務(wù)推薦系統(tǒng)架構(gòu)Fig.1 M ainstream architecture ofe-commerce recommendation system

        3)數(shù)據(jù)存儲面臨的問題。當(dāng)前主流的電子商務(wù)推薦系統(tǒng)構(gòu)架如圖1所示。從圖1中可以看目前電子商務(wù)企業(yè)使用的推薦引擎基本采用B/S架構(gòu),一般部署于一臺或幾臺Web應(yīng)用服務(wù)器上,對用戶輸入數(shù)據(jù)和服務(wù)器日志及統(tǒng)計數(shù)據(jù)進(jìn)行挖掘處理。

        隨著數(shù)據(jù)的膨脹,單臺服務(wù)器的存儲已無法滿足存儲需求。同時隨著客戶端的增加,單位時間內(nèi)并發(fā)用戶不斷增加,這會給服務(wù)器帶來巨大壓力,響應(yīng)給客戶端的時間會大大增加。雖然以上瓶頸可以通過增加硬盤的方式擴大存儲,甚至采用磁盤陣列,負(fù)載均衡等方式解決,但仍然存在I/O讀寫瓶頸,硬件設(shè)備過于集中,硬件成本過高,網(wǎng)絡(luò)帶寬消耗過大等問題。

        3 云計算環(huán)境下電子商務(wù)推薦系統(tǒng)設(shè)計

        3.1 云計算環(huán)境下推薦系統(tǒng)架構(gòu)設(shè)計

        針對云計算環(huán)境下數(shù)據(jù)存儲的形式和分布式算法的特點,設(shè)計基于云計算的電子商務(wù)推薦引擎的系統(tǒng)架構(gòu),如圖2,包括持久層、控制層和表示層。

        其中持久層即云計算平臺的分布式存儲系統(tǒng),由分布式文件系統(tǒng)和分布式數(shù)據(jù)庫系統(tǒng)組成。由于互聯(lián)網(wǎng)中用戶眾多,而每個用戶都有其對應(yīng)的日志數(shù)據(jù),普通的存儲系統(tǒng)挖掘存儲數(shù)量巨大的用戶數(shù)據(jù),因此分布式存儲系統(tǒng)是構(gòu)建電子商務(wù)推薦系統(tǒng)的基礎(chǔ),其為推薦系統(tǒng)的用戶行為分析、關(guān)聯(lián)規(guī)則產(chǎn)生等任務(wù)提供重要的基礎(chǔ)支撐??刂茖油ㄟ^分布式計算即MapReduce程序建立資源模型和索引,其中包含大量復(fù)雜的智能推薦算法和信息處理過程。普通用戶和系統(tǒng)用戶通過開發(fā)的表示層與推薦引擎進(jìn)行交互。這種架構(gòu)為用戶屏蔽所有的底層數(shù)據(jù)存儲結(jié)構(gòu)和業(yè)務(wù)處理程序。

        圖2 基于云計算的商務(wù)推薦引擎架構(gòu)Fig.2 A rchitecture of recomm endation system based on cloud computing

        3.2 分布式存儲系統(tǒng)設(shè)計

        隨著互聯(lián)網(wǎng)上數(shù)據(jù)和內(nèi)容的不斷增長,互聯(lián)網(wǎng)上的數(shù)據(jù)量變得非常巨大,用戶難以找到自己想要的信息,通過提供簡單的基于單臺服務(wù)器或者小集群不能滿足用戶需求。海量數(shù)據(jù)的存儲已成為制約推薦引擎發(fā)展的關(guān)鍵因素。推薦引擎的系統(tǒng)性能極大地依賴于底層的文件系統(tǒng)。如果單純依賴操作系統(tǒng)提供文件系統(tǒng)基本功能,將無法獲得理想的性能。分布式文件系統(tǒng)具有高吞吐量、高I/O寬帶擴展特點,它可以將多個節(jié)點的硬盤組織成為全局的存儲系統(tǒng),提供聚合的存儲容量和I/O寬帶,并易于隨系統(tǒng)規(guī)模擴展而擴展。

        本文設(shè)計的分布式存儲系統(tǒng)中數(shù)據(jù)被分成單位大小的分塊(block),可以被存儲在集群的任意一個磁盤上。同時一個分塊被復(fù)制成多份并且分布在不同的磁盤上,這就保證了容錯性和并行復(fù)制。對于用戶來說對文件的讀寫等操作完全透明,用戶可以像操作個人計算機上的文件一樣操作分布式系統(tǒng)中的文件。分布式存儲系統(tǒng)的架構(gòu)如圖3所示,其中名稱結(jié)點(Namenode)提供整個分布式存儲系統(tǒng)的命名空間管理,塊管理等所有服務(wù),而與元數(shù)據(jù)(metadata)所有的相關(guān)服務(wù)都是由名稱結(jié)點提供??蛻舳耍–lient)可以通過名稱結(jié)點獲得相應(yīng)的數(shù)據(jù)節(jié)點(Datenodes)存儲的數(shù)據(jù)塊(Blocks),并對它們進(jìn)行相應(yīng)的讀寫操作。

        圖3 DFS系統(tǒng)架構(gòu)Fig.3 Architectureof distributed file system

        3.3 智能推薦過程設(shè)計

        從海量數(shù)據(jù)中尋找有用的模式,已成為推薦引擎的重要任務(wù)。MapReduce編程模型的提出無疑是對海量數(shù)據(jù)處理方法提供了強有力的工具。海量數(shù)據(jù)挖掘的關(guān)鍵問題為數(shù)據(jù)挖掘算法的并行化。云計算系統(tǒng)主要采用MapReduce等新型計算模型,這意味著現(xiàn)有的數(shù)據(jù)挖掘算法和并行化策略不能直接應(yīng)用于云計算平臺,需要進(jìn)行一定改造。目前已經(jīng)有許多優(yōu)秀的數(shù)據(jù)挖掘算法被移植到了云計算平臺。如,PFPGrow th算法[8],K-means算法[9],決策樹算法[10]等。本文設(shè)計中采用MapReduce作為分布式并行計算模型,將大型任務(wù)分成很多細(xì)粒度的子任務(wù),這些子任務(wù)分布式且并行地在多個計算節(jié)點上進(jìn)行調(diào)度和計算,從而在云平臺上獲得對海量數(shù)據(jù)的處理能力。其中Map操作和Reduce操作被包裹為任務(wù)(task),而任務(wù)又以Map-Reduce對的形式被包裹為作業(yè)(job)。負(fù)責(zé)在集群節(jié)點上安排任務(wù)執(zhí)行的軟件被稱作TaskTracker,每個計算節(jié)點上部署一個。負(fù)責(zé)在集群范圍內(nèi)調(diào)度作業(yè)和任務(wù)執(zhí)行的軟件被稱作JobTracker,在集群內(nèi)挑選獨立的機器來部署。

        本文將個性化推薦方法與云計算相關(guān)技術(shù)進(jìn)行結(jié)合提出一種新的智能商務(wù)推薦過程模型,該模型可以有效解決智能推薦方法無法與實際的云計算平臺相結(jié)合的問題,并可充分利用云計算環(huán)境中的各種計算資源同時為用戶提供精確的個性化推薦服務(wù)。模型的基本結(jié)構(gòu)如圖4。

        圖4源數(shù)據(jù)采集主要功能為收集和整理客戶端的日志數(shù)據(jù),并對這些數(shù)據(jù)進(jìn)行整理;數(shù)據(jù)預(yù)處理部分主要功能為對原始的粗糙數(shù)據(jù)去噪、降維,是推薦系統(tǒng)精確性的主要影響因素。模塊主要包含數(shù)據(jù)清洗、用戶鑒定、序列鑒定、會話鑒定4個子模塊;模式發(fā)現(xiàn)模塊的主要功能為通過智能推薦算法對數(shù)據(jù)進(jìn)行分析,并且發(fā)現(xiàn)其中的模式,產(chǎn)生頻繁項集。模式發(fā)現(xiàn)層實現(xiàn)聚類、分類、協(xié)同過濾、進(jìn)化編程等數(shù)據(jù)挖掘算法,并且允許擴展,根據(jù)客戶端的業(yè)務(wù)需求定制算法庫,并且以服務(wù)方式供模式分析調(diào)用;模式分析部分可以利用各種各樣的模式分析工具進(jìn)行處理,并將最終推薦結(jié)果反饋給用戶。

        圖4 智能商務(wù)推薦過程模型Fig.4 M odelof intelligent recommendation process

        4 結(jié)語

        云計算強大的存儲、運算和安全功能,以及理想的資源分配和共享模式,為電子商務(wù)推薦引擎的發(fā)展奠定了良好的基礎(chǔ),從而產(chǎn)生了全新的商務(wù)推薦模式。本文通過對當(dāng)前主流的電子商務(wù)推薦系統(tǒng)研究,詳細(xì)分析了當(dāng)前電子商務(wù)推薦系統(tǒng)的不足,構(gòu)建了一種新的分布式文件存儲系統(tǒng)結(jié)構(gòu)。該分布式存儲系統(tǒng)通過將大型文件分塊并存儲在不同的計算機節(jié)點上,實現(xiàn)了大型日志文件的分布式存儲。并在此基礎(chǔ)上構(gòu)建了基于云計算環(huán)境的電子商務(wù)推薦系統(tǒng),為用戶提供動態(tài)、實時的個性化服務(wù),實現(xiàn)了商務(wù)推薦引擎的個性化和智能化。

        [1] 吳衛(wèi)華. 云計算環(huán)境下電子商務(wù)發(fā)展模式研究[J]. 情報雜志,2011, 30(5):147-151.

        [2] 董守斌, 趙鐵柱. 面向搜索引擎的分布式文件系統(tǒng)性能分析[J]. 華南理工大學(xué)學(xué)報:自然科學(xué)版,2011, 39(4):7-14.

        [3] Dean J, Ghemawat S. MapReduce: simplified data processing on large clusters[J]. Communications of the ACM, 2008, 51(1): 107-113.

        [4] 張建勛, 古志民, 鄭超. 云計算研究進(jìn)展綜述[J]. 計算機應(yīng)用研究,2010, 27(2):430-433. [5] 林樂然, 陳德龍. 基于云計算的分布式企業(yè)搜索引擎研究[J]. 電腦知識與技術(shù),2009, 33(5):9429-9430.

        [6] Shardanand U, Maes P. Social information filtering: algorithms for automating“word of mouth”[C]// Proceedings of the SIGCHI conference on Human factors in computing systems. ACM Press/Addison-Wesley Publishing Co., 1995:210-217. [7] 余力, 劉魯. 電子商務(wù)個性化推薦系統(tǒng)研究[J]. 計算機集成制造, 2004, 10(10):1036-1313.

        [8] Li H, Wang Y, Zhang D, et al. Pfp: parallel fp-growth for query recommendation[C]//Proceedings of the 2008 ACM conference on Recommender systems. ACM, 2008: 107-114.

        [9] 雷小鋒, 謝昆青, 林帆. 一種基于K-Means局部最優(yōu)性的高效聚類算法[J]. 軟件學(xué)報, 2008, 19(7):1683-1692.

        [10] Safavian S R, Landgrebe D. Asurvey of decision tree classifier methodology[J]. Systems, Man and Cybernetics, IEEE Transactions on, 1991, 21(3):660-674.

        責(zé)任編輯:丁吉海

        Research on Recommendation System of E-commerce Based on Cloud Computing

        JIANG Yuyana,SHAO Yuana,LIPinga,LIChangxuna,ZHAOWenhuib
        (a.SchoolofManagementScience&Engineering;b.Schoolof Foreign Langnage,AnhuiUniversity of Technology, Ma'anshan 243032,China)

        Based on the study of the system architecture of cloud computing,Platform Developer,user log analysis and the application of E-commerce,a new distributed file system is proposed which can solve problems ofmassive data storage,non-real-time recommendation and low scalability.On the basis of this,an intelligent recommendation system is built which can provide users with dynam ic,real-time personalized services and achievea individualization and intellectualization of the recommendation engine.

        cloud computing;E-commerce;user log analysis;recommendation system

        F716

        A

        10.3969/j.issn.1671-7872.2014.02.020

        1671-7872(2014)02-0199-04

        2013-04-22

        安徽省高校自然科學(xué)研究項目(KJ2011Z039,KJ2013A053)

        江雨燕(1966-),女,安徽宣城人,副教授,研究方向為物流信息化、M IS、計算機系統(tǒng)。

        猜你喜歡
        存儲系統(tǒng)引擎分布式
        分布式存儲系統(tǒng)在企業(yè)檔案管理中的應(yīng)用
        哈爾濱軸承(2020年2期)2020-11-06 09:22:36
        天河超算存儲系統(tǒng)在美創(chuàng)佳績
        分布式光伏熱錢洶涌
        能源(2017年10期)2017-12-20 05:54:07
        藍(lán)谷: “涉藍(lán)”新引擎
        商周刊(2017年22期)2017-11-09 05:08:31
        分布式光伏:爆發(fā)還是徘徊
        能源(2017年5期)2017-07-06 09:25:54
        基于DDS的分布式三維協(xié)同仿真研究
        華為震撼發(fā)布新一代OceanStor 18000 V3系列高端存儲系統(tǒng)
        無形的引擎
        河南電力(2015年5期)2015-06-08 06:01:46
        一種基于STM32的具有斷電保護(hù)機制的采集存儲系統(tǒng)設(shè)計
        基于Cocos2d引擎的PuzzleGame開發(fā)
        妇女性内射冈站hdwwwooo| 中文字幕人妻在线少妇| 国产欧美精品aaaaaa片| 精品区2区3区4区产品乱码9| 国产婷婷一区二区三区| 一区二区韩国福利网站| 中文乱码字幕在线中文乱码| 亚洲无人区乱码中文字幕动画| 五月激情综合婷婷六月久久| 精品国产性色无码av网站| 亚洲欧美日韩国产精品专区 | 99麻豆久久久国产精品免费| 开心五月激情综合婷婷| 99久久综合九九亚洲 | 在线视频精品少白免费观看| 日本激情网站中文字幕| 亚洲热妇无码av在线播放| 毛茸茸性xxxx毛茸茸毛茸茸| Jizz国产一区二区| 免费人妻精品一区二区三区| 亚洲精品无码不卡在线播he| 亚洲国产精品va在线播放| 无码一区久久久久久久绯色AV| 亚洲精品国产精品系列| 亚洲国产成人久久精品不卡| 成人欧美日韩一区二区三区| 中文字幕人妻中文av不卡专区| 99久久久久久亚洲精品 | 日韩美女亚洲性一区二区 | 一边吃奶一边摸做爽视频| 国产精品一区二区久久乐下载| 日本大胆人体亚裔一区二区| 日韩av毛片在线观看| 7m精品福利视频导航| 久久精品岛国av一区二区无码| 亚洲在线视频一区二区| 97中文字幕精品一区二区三区 | 欧美最猛性xxxxx免费| 亚洲综合日韩中文字幕| 在线观看二区视频网站二区| 亚洲s色大片在线观看|