亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        大數(shù)據(jù)下的圖書館個性化推薦研究

        2017-07-13 12:14:16何波章宏遠
        新世紀圖書館 2017年6期
        關(guān)鍵詞:個性化推薦數(shù)據(jù)挖掘大數(shù)據(jù)

        何波?章宏遠

        摘 要 隨著大數(shù)據(jù)時代的來臨,針對所有的用戶都采用同一種方法的圖書館個性化推薦,已經(jīng)無法滿足圖書館用戶的需要。論文利用基于大數(shù)據(jù)的數(shù)據(jù)挖掘預(yù)處理技術(shù),將圖書館用戶細分為新用戶和一般用戶,然后利用數(shù)據(jù)挖掘與mapreduce技術(shù),提出大數(shù)據(jù)下的圖書館個性化推薦方法和策略。

        關(guān)鍵詞 大數(shù)據(jù) 數(shù)據(jù)挖掘 個性化推薦

        分類號 G250.7

        DOI 10.16810/j.cnki.1672-514X.2017.06.015

        Abstract The traditional recommendation strategy adopts the same recommendation method for all users. It is not able to satisfy the library users needs in the era of big data. This paper divides library users into new users and ordinary users by data mining preprocessing technology based on big data. Also, it proposes the library personalized recommendation strategy based on data mining and mapreduce.

        Keywords Big data. Data mining. Personalized recommendation.

        大數(shù)據(jù)時代,圖書館在個性化推薦服務(wù)中應(yīng)用數(shù)據(jù)挖掘[1]和Mapreduce[2]技術(shù),將圖書館的海量數(shù)據(jù)優(yōu)勢[3-4] 充分發(fā)揮出來,大幅提升圖書館的個性化推薦服務(wù)水平。國內(nèi)外研究人員和研究機構(gòu)對大數(shù)據(jù)下的圖書館個性化服務(wù)進行了初步的研究和應(yīng)用。代表性的有楊亮的“大數(shù)據(jù)環(huán)境下圖書館個性化服務(wù)研究”[5]、陳臣的“基于大數(shù)據(jù)的圖書館個性化智慧服務(wù)體系構(gòu)建”[6]、Cassidy R. Sugimoto的“Library and information science in the big data era:funding, projects, and future”[7]等研究成果。但是這些研究成果對圖書館全體用戶采用同樣的推薦方法,沒有考慮圖書館新用戶和一般用戶的不同。與一般用戶相比,圖書館新用戶被收集的個人信息較少,需要使用有針對性的個性化推薦方法。因此,對于海量圖書館數(shù)據(jù),需要根據(jù)圖書館新用戶和一般用戶的不同特點,提出有針對性的大數(shù)據(jù)下的圖書館個性化推薦方法和策略。

        1 大數(shù)據(jù)下的圖書館個性化用戶模式

        個性化用戶模式[8]是圖書館個性化推薦服務(wù)的基礎(chǔ)。利用大數(shù)據(jù)的數(shù)據(jù)挖掘預(yù)處理技術(shù),對圖書館訪問數(shù)據(jù)進行預(yù)處理挖掘,形成大數(shù)據(jù)下的圖書館個性化用戶模式。圖書館個性化用戶模式定義為三元組,形式化的具體表示如下所示:

        其中ipt為用戶IP地址,idt為用戶ID,URLt為訪問的圖書館網(wǎng)頁的URL,u為一條用戶訪問圖書館網(wǎng)頁的記錄,u.time為訪問圖書館網(wǎng)頁的時間戳,u.timelength為訪問圖書館網(wǎng)頁的時長。u.timelength=u.time- u.time,1 ≤ k ≤ m-1.

        2 大數(shù)據(jù)下的圖書館用戶細分

        圖書館新用戶被收集的個人信息較少,不適合和一般用戶采用同樣的推薦方法。大數(shù)據(jù)下圖書館用戶細分的目的是針對不同的用戶來提供不同的個性化推薦服務(wù)。

        針對圖書館用戶的特點,將其分為新用戶(newuser)和一般用戶(domesticuser)。新用戶和一般用戶的確定需要考慮多個因素,包括圖書館訪問時長(duration)、圖書館新鮮度(new)以及圖書館訪問頻率(Frequent)。

        (1)圖書館訪問時長(duration)為用戶多次訪問圖書館的時長之和

        其中count是用戶訪問圖書館的次數(shù),durationi是用戶第i次訪問圖書館所花費的時間。

        (2)圖書館新鮮度(new)表示用戶對圖書館的訪問時間的新鮮程度

        其中userstart是用戶首次訪問圖書館的日期,usercurrency是現(xiàn)在的日期, userend是用戶最近一次訪問圖書館的結(jié)束日期。

        (3)圖書館訪問頻率(Frequent)表示用戶訪問圖書館的頻率

        其中count是用戶訪問圖書館的次數(shù)。

        對于以上各個公式計算出來的值,利用模糊函數(shù)轉(zhuǎn)換到[0,1]范圍;Frequent的權(quán)重最大,設(shè)定為;duration的權(quán)重較大,都設(shè)為;new的權(quán)重最小,都設(shè)為;用戶閾值設(shè)定為。

        if (*Frequent +*duration +*new>),表明該用戶為一般用戶(domesticuser); else 該用戶為新用戶(newuser);

        3 大數(shù)據(jù)下的圖書館個性化推薦方法和策略

        通過利用大數(shù)據(jù)的數(shù)據(jù)挖掘與mapreduce技術(shù),針對新用戶和一般用戶的不同,分別提出有針對性的圖書館個性化推薦方法。推薦策略描述如下。

        針對圖書館個人信息較少的新用戶,提出基于用戶模式聚類與mapreduce的圖書館個性化推薦方法。該方法利用大數(shù)據(jù)的mapreduce技術(shù),首先采用map分解任務(wù),對相似的圖書館個性化用戶模式聚類;然后匹配圖書館個性化用戶聚類模式與圖書館用戶當前訪問路徑;最后采用reduce進行歸并,將匹配度高的推薦集推薦給用戶。該方法對相似的圖書館個性化用戶模式聚類,利用興趣相似的圖書館個性化用戶聚類模式獲得推薦集,擴大了推薦范圍,非常適合圖書館新用戶。

        一般用戶是圖書館的主要用戶。為了吸引并留住一般用戶,提出基于關(guān)聯(lián)規(guī)則挖掘與mapreduce的圖書館個性化推薦方法。該方法利用大數(shù)據(jù)的mapreduce技術(shù),首先采用map分解任務(wù),從圖書館個性化用戶模式中挖掘出頻繁訪問路徑,然后從頻繁訪問路徑中挖掘與圖書館用戶當前訪問路徑匹配的關(guān)聯(lián)規(guī)則;最后采用reduce進行歸并,根據(jù)關(guān)聯(lián)規(guī)則和推薦度閾值將推薦集推薦給用戶。該方法推薦速度快,準確度高,非常適合圖書館一般用戶。

        4 個性化推薦方法相關(guān)實驗

        測試設(shè)備為Lenove服務(wù)器。實驗數(shù)據(jù)來自重慶理工大學校圖書館一個月的訪問記錄。選擇100位新用戶和100位一般用戶,第1次實驗采用基于用戶模式聚類與mapreduce的圖書館個性化推薦方法進行推薦準確度測試,第2次實驗采用基于關(guān)聯(lián)規(guī)則挖掘與mapreduce的圖書館個性化推薦方法進行推薦準確度測試。圖書館用戶推薦準確度如圖1所示。

        第1次實驗采用基于用戶模式聚類與mapreduce的圖書館個性化推薦方法,實驗結(jié)果是圖書館新用戶的推薦平均準確度為83%,圖書館一般用戶的推薦平均準確度為72%。第2次實驗采用基于關(guān)聯(lián)規(guī)則挖掘與mapreduce的圖書館個性化推薦方法,實驗結(jié)果是圖書館新用戶的推薦平均準確度為68%,圖書館一般用戶的推薦平均準確度為92%。從實驗結(jié)果可以看出,第1次實驗采用的方法適合圖書館新用戶,第2次實驗采用的方法非常適合一般用戶。

        將提出的基于用戶模式聚類與mapreduce的圖書館個性化推薦方法、基于關(guān)聯(lián)規(guī)則挖掘與mapreduce的圖書館個性化推薦方法應(yīng)用到學校圖書館。對200位新用戶采用基于用戶模式聚類與mapreduce的圖書館個性化推薦方法進行推薦,對200位一般用戶采用基于關(guān)聯(lián)規(guī)則挖掘與mapreduce的圖書館個性化推薦方法進行推薦。讓用戶30天后進行推薦滿意度調(diào)查。圖書館用戶推薦滿意度如圖2所示。

        圖書館用戶推薦滿意度調(diào)查結(jié)果是:200位新用戶對基于用戶模式聚類與mapreduce的圖書館個性化推薦方法的推薦滿意度為88%,200位一般用戶對基于關(guān)聯(lián)規(guī)則挖掘與mapreduce的圖書館個性化推薦方法的推薦滿意度為94%。從實驗結(jié)果可以看出,有針對性的、準確的圖書館個性化推薦能夠滿足不同用戶的推薦需求,吸引并留住圖書館用戶。

        5 結(jié)語

        圖書館新用戶被收集的個人信息較少,不適合采用和一般用戶同樣的推薦方法。圖書館應(yīng)積極利用大數(shù)據(jù)的數(shù)據(jù)挖掘預(yù)處理技術(shù),將圖書館用戶細分為新用戶和一般用戶,并通過數(shù)據(jù)挖掘與mapreduce技術(shù),形成大數(shù)據(jù)下的圖書館個性化推薦方法和策略。實驗結(jié)果表明,這一大數(shù)據(jù)下的圖書館個性化推薦方法和策略是有效的。

        參考文獻:

        [ 1 ] HAM J W, KAMBER M, PEI J. Data mining: concepts and techniques third edition[M].San Francisco: Morgan Kaufmann, 2011.

        [ 2 ] 李建江,崔健,王聃,等. Mapreduce并行編程模型研究綜述[J].電子學報, 2011,39(11):2635-2642.

        [ 3 ] Science. Special online collection: dealing with Data [EB/OL].[2015-12-20].http://www.sciencemag.org/site/special/data/,2011.

        [ 4 ] 李國杰.大數(shù)據(jù)研究的科學價值[J].中國計算機學會通訊,2012,9(8):8-15.

        [ 5 ] 楊亮.大數(shù)據(jù)環(huán)境下圖書館個性化服務(wù)研究[J]. 現(xiàn)代情報,2014,34(4):74-77.

        [ 6 ] 陳臣.基于大數(shù)據(jù)的圖書館個性化智慧服務(wù)體系構(gòu)建[J].情報資料工作, 2013,34(6):75-79.

        [ 7 ] CASSIDY R. SUGIMOTO, YING DING, THELWALL M. Library and information science in the big data era: funding, projects, and future[J].Proceedings of the American Society for Information Science and Technology, 2012,49(1):1-3.

        [ 8 ] 張潼.互聯(lián)網(wǎng)大數(shù)據(jù)發(fā)展趨勢[J].重慶理工大學學報(自然科學). 2015(10):3-4.

        猜你喜歡
        個性化推薦數(shù)據(jù)挖掘大數(shù)據(jù)
        探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
        基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
        電力與能源(2017年6期)2017-05-14 06:19:37
        基于鏈式存儲結(jié)構(gòu)的協(xié)同過濾推薦算法設(shè)計與實現(xiàn)
        軟件導刊(2016年11期)2016-12-22 21:40:40
        個性化推薦系統(tǒng)關(guān)鍵算法探討
        基于協(xié)同過濾算法的個性化圖書推薦系統(tǒng)研究
        無線定位個性化導覽關(guān)鍵技術(shù)在博物館中的運用
        基于大數(shù)據(jù)背景下的智慧城市建設(shè)研究
        科技視界(2016年20期)2016-09-29 10:53:22
        一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
        基于GPGPU的離散數(shù)據(jù)挖掘研究
        内射囯产旡码丰满少妇| 亚洲成人激情深爱影院在线| 色视频网站一区二区三区| gv天堂gv无码男同在线观看| 热99re久久精品这里都是免费| 高跟丝袜一区二区三区| 高清少妇二区三区视频在线观看 | 人妻无码第一区二区三区| 男同gay毛片免费可播放| 欧美成人看片一区二区三区尤物 | 欧美亚洲国产片在线播放| 无码精品色午夜| 日本一区不卡在线观看| 国产成人综合久久久久久| 日本爽快片18禁免费看| 在线免费欧美| 国产福利一区二区三区在线观看| 欧美xxxxx在线观看| 亚洲乱码国产一区三区| 国产精品反差婊在线观看| av在线免费观看男人天堂| 狠狠躁日日躁夜夜躁2020| 亚洲AV永久无码制服河南实里| 亚洲一码二码在线观看| 国产精品一区二区三区免费视频| 久久精品免费观看国产| 亚洲春色AV无码专区在线播放| 亚洲天堂av在线一区| 亚洲无av在线中文字幕| 亚洲碰碰人人av熟女天堂| 日韩午夜在线视频观看| 亚洲av毛片在线免费观看| 久久久久亚洲av无码专区首| www国产亚洲精品久久网站| 国产免费又色又爽又黄软件| 麻豆国产成人AV网| 李白姓白白又白类似的套路| 亚洲avav天堂av在线网毛片| 国产成人国产在线观看| 免费女女同黄毛片av网站| 亚洲精品久久久久久久蜜桃|