亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        500 Internal Server Error

        500 Internal Server Error


        nginx
        500 Internal Server Error

        500 Internal Server Error


        nginx
        500 Internal Server Error

        500 Internal Server Error


        nginx

        大數(shù)據(jù)技術(shù)在圖書流通數(shù)據(jù)分析中的應(yīng)用研究

        2021-06-18 02:44:18劉海峰
        信息記錄材料 2021年5期
        關(guān)鍵詞:關(guān)聯(lián)用戶

        高 艷,劉海峰

        (山西農(nóng)業(yè)大學(xué)信息學(xué)院 山西 太谷 030800)

        1 引言

        高校圖書館擁有大量的學(xué)生圖書流通數(shù)據(jù),具體包含圖書借閱時間、學(xué)生姓名、學(xué)生專業(yè)、學(xué)生所在院系、借閱圖書名稱、圖書索引號等,充分利用這些數(shù)據(jù),集合大數(shù)據(jù)技術(shù),可以發(fā)現(xiàn)學(xué)生借閱圖書之間的關(guān)系,預(yù)測學(xué)生對圖書的需求情況,有效進(jìn)行學(xué)生個性化圖書的推薦,從而更好地確定圖書館圖書的購置方向,加大圖書館圖書的流通效率,創(chuàng)新圖書館管理服務(wù),更好地發(fā)揮圖書館的作用。下面具體介紹大數(shù)據(jù)相關(guān)算法在圖書流通數(shù)據(jù)中的應(yīng)用。

        2 Apriori關(guān)聯(lián)規(guī)則算法在圖書流通數(shù)據(jù)中的應(yīng)用

        Apriori算法是最有影響力的關(guān)聯(lián)規(guī)則算法,由Agrawal等[1]在1993年提出。主要應(yīng)用于零售行業(yè)的購物行為分析,如著名的沃爾瑪超市的根據(jù)顧客的購物行為,發(fā)現(xiàn)啤酒和尿布之間的關(guān)聯(lián)關(guān)系。同理,在圖書的流通數(shù)據(jù)中也可以應(yīng)用Apriori關(guān)聯(lián)規(guī)則算法發(fā)現(xiàn)學(xué)生借閱圖書之間的關(guān)聯(lián)關(guān)系。

        Apriori算法是基于兩階段頻集思想實(shí)現(xiàn)的。第一步,尋找所有滿足用戶預(yù)先設(shè)定最小支持度的頻繁項(xiàng)集。第二步,根據(jù)頻繁項(xiàng)集產(chǎn)生強(qiáng)關(guān)聯(lián)規(guī)則,并繼續(xù)尋找滿足用戶設(shè)定最小置信度的強(qiáng)關(guān)聯(lián)規(guī)則[2]。在此應(yīng)用中,支持度是指兩類圖書A和B在總的借閱次數(shù)(N)中同時出現(xiàn)的概率,即A類與B類圖書同時被借閱的概率。置信度是指借閱A類圖書同時借閱B類圖書的概率[3]。

        例如:如表1所示5條學(xué)生借閱圖書的數(shù)據(jù),ID為2019533123的學(xué)生同時借閱了H、K兩類圖書,ID為2019533226的學(xué)生同時借閱了B、H、K兩類圖書…,利用Apriori規(guī)則就可以算出這些學(xué)生所借圖書類別之間的關(guān)聯(lián)規(guī)則,將支持度設(shè)置為0.5,最后得出關(guān)聯(lián)規(guī)則如表2所示。從表2可以看出,H類圖書和I類圖書以及H類圖書和K類圖書之間有很大的關(guān)聯(lián)關(guān)系,即借閱了K類圖書的學(xué)生一定會借閱H類圖書,借閱了H類圖書再借閱K類圖書的概率為60%,借閱了I類圖書的學(xué)生一定會借閱H類圖書,借閱了H類圖書再借閱I類圖書的概率為60%。(注:由于數(shù)據(jù)集只選擇了一少部分?jǐn)?shù)據(jù),所以在計(jì)算出的關(guān)聯(lián)規(guī)則中會出現(xiàn)置信度為1的結(jié)果,在真實(shí)的大量數(shù)據(jù)集中一般不會出現(xiàn)置信度為1即100%的情況,即不會出現(xiàn)借閱了一類圖書一定會借閱另外一類圖書的情況。另外,圖書類別根據(jù)實(shí)際情況也可以進(jìn)行進(jìn)一步的細(xì)分)。

        表1 學(xué)生借閱圖書數(shù)據(jù)集

        表2 關(guān)聯(lián)規(guī)則表

        得到關(guān)聯(lián)規(guī)則后,圖書館人員在圖書擺放的位置方面可以進(jìn)行一定的調(diào)整,另外也可以根據(jù)關(guān)聯(lián)規(guī)則進(jìn)行圖書的個性化推薦。

        3 K-means聚類算法對圖書流通數(shù)據(jù)的分析

        聚類方法包含基于密度的聚類、基于層次的聚類、基于距離的聚類算法等。K-Means算法是典型的基于距離的聚類算法。即該算法通過評價兩個對象的距離來確定是否聚為一類。

        K-means算法的具體步驟是:

        (1)隨機(jī)選取K個對象作為初始的聚類中心。

        (2)分別計(jì)算樣本中其他樣本對象到K個對象的距離,按照最小距離分配原則進(jìn)行聚類。

        (3)根據(jù)聚類結(jié)果,重新計(jì)算K個聚類中心

        (4)重復(fù)上述(2)(3)步驟,直到聚類中心不再發(fā)生變化。

        3.1 基于圖書流通數(shù)據(jù)的讀者聚類

        在圖書的流通數(shù)據(jù)中,記錄著讀者的借閱數(shù)量以及讀者借閱圖書的類型信息,利用這些信息可以進(jìn)行K-Means聚類,將讀者分為不同的類別(如可分為經(jīng)常借閱圖書的讀者,借閱圖書量一般的讀者,不經(jīng)常借閱圖書的讀者,根據(jù)實(shí)際情況類別還可以進(jìn)一步細(xì)分),根據(jù)聚類的結(jié)果針對不同的讀者進(jìn)行不同的服務(wù)[4]。如針對經(jīng)常借閱和借閱量一般的讀者,進(jìn)一步根據(jù)這些讀者喜歡借閱圖書的類型,圖書館可以在有一些相關(guān)類別新書的時候,針對這些讀者進(jìn)行個性化的推薦,以及針對現(xiàn)在借用圖書的情況推薦相關(guān)的圖書。針對不經(jīng)常借閱圖書的讀者,圖書館應(yīng)該加強(qiáng)自身的宣傳和服務(wù),引導(dǎo)更多的讀者走進(jìn)圖書館。

        3.2 基于圖書流通數(shù)據(jù)的圖書聚類

        根據(jù)圖書流通數(shù)據(jù)中,可以得到不同種類的圖書被借閱的次數(shù)。根據(jù)圖書被借閱的次數(shù)進(jìn)行K-means聚類,可以將圖書分為不同的類別(如經(jīng)常被借閱的圖書;借閱次數(shù)一般的圖書;不經(jīng)常被借閱的圖書,也可以根據(jù)實(shí)際情況將圖書類別進(jìn)行進(jìn)一步細(xì)分)。針對經(jīng)常借閱的圖書類別可以在之后的圖書購置中加大該類圖書的購置,加強(qiáng)這些類別圖書的建設(shè)。針對不經(jīng)常借閱的圖書還需要圖書管理人員對其原因進(jìn)行分析,是因?yàn)檫@些圖書出版的時間比較早,還是其他一些因素,以便做進(jìn)一步的處理。

        4 圖書推薦算法在圖書流通數(shù)據(jù)分析中的應(yīng)用

        推薦算法主要包含基于內(nèi)容的推薦算法、基于協(xié)同過濾的推薦算法以及混合推薦算法。

        4.1 基于內(nèi)容的推薦算法

        基于內(nèi)容的推薦系統(tǒng)在圖書推薦中的應(yīng)用表現(xiàn)為從圖書流通數(shù)據(jù)中分析用戶之前喜歡的圖書類別,進(jìn)而推薦同樣類別的其他圖書?;趦?nèi)容的推薦算法的原理如圖1所示。根據(jù)圖書流通數(shù)據(jù),分析得出用戶U1喜歡TP(計(jì)算機(jī)技術(shù))類別的圖書B1,于是將TP類別的圖書B2推薦給用戶U1,F(xiàn)0類別的圖書就不推薦給用戶U1了。

        圖1 基于內(nèi)容的推薦算法原理

        4.2 協(xié)同過濾算法

        協(xié)同過濾算法包含基于用戶的協(xié)同過濾和基于物品的協(xié)同過濾,基于用戶的協(xié)同過濾在圖書推薦中的應(yīng)用原理如圖2所示,具體表現(xiàn)為如果用戶U1借閱了圖書B1,跟用戶U1興趣一致的用戶U2、U3借閱了圖書B2,則可以把圖書B2推薦給用戶U1。這里怎么得到U1和U2興趣一致,可根據(jù)上面介紹的聚類算法,也可以通過讀者借閱圖書的情況,應(yīng)用余弦公式或者皮爾遜相關(guān)系數(shù)計(jì)算讀者之間的相似度?;谖锲返膮f(xié)同過濾在圖書推薦中的應(yīng)用原理如圖3所示,表現(xiàn)為如果用戶U1借閱了圖書B1,同時根據(jù)圖書流通數(shù)據(jù)發(fā)現(xiàn)借閱了圖書B1的讀者還有用戶U2、U3,同時U2、U3用戶都借閱了圖書B2,則可以把圖書B2推薦給用戶U1。根據(jù)以上描述會發(fā)現(xiàn)基于用戶的協(xié)同過濾主要是根據(jù)跟用戶自己興趣一致的人喜歡的圖書進(jìn)行推薦,而基于物品的協(xié)同過濾是根據(jù)都喜歡同一個圖書的其他用戶喜歡的圖書進(jìn)行推薦。

        圖2 基于用戶的協(xié)同過濾原理

        圖3 基于物品的協(xié)同過濾原理

        4.3 混合推薦算法

        混合推薦算法,即在實(shí)際的應(yīng)用中可以將基于內(nèi)容的推薦算法以及基于用戶和基于物品的推薦算法一起使用給用戶進(jìn)行推薦。

        推薦算法是大數(shù)據(jù)技術(shù)在互聯(lián)網(wǎng)中最廣泛的應(yīng)用,將推薦算法應(yīng)用到圖書流通數(shù)據(jù)分析中,可以更好地提高圖書館的個性化服務(wù)水平,也能提高圖書的流通效率,對有效利用圖書資源有很重大的作用。

        5 結(jié)語

        文章在介紹關(guān)聯(lián)規(guī)則原理的基礎(chǔ)上介紹了學(xué)生借閱圖書之間的關(guān)聯(lián)規(guī)則,在實(shí)際的圖書流通數(shù)據(jù)中還可能存在學(xué)生專業(yè)與圖書之間的關(guān)聯(lián)規(guī)則,可以進(jìn)行進(jìn)一步的研究。在聚類算法方面文章只介紹了K-Means算法,還可以具體研究其他聚類算法在圖書流通數(shù)據(jù)分析中的應(yīng)用。在個性化推薦方面,除了可以根據(jù)圖書流通數(shù)據(jù)進(jìn)行圖書推薦,還可以根據(jù)讀者相關(guān)查詢的日志記錄進(jìn)行進(jìn)一步的推薦。另外這些算法的實(shí)現(xiàn)可以直接應(yīng)用軟件Weka進(jìn)行實(shí)現(xiàn),也可以用編程語言及相關(guān)庫來完成(如用python語言及sklearn庫),如果實(shí)際中圖書流通數(shù)據(jù)量特別大,還可以在hadoop大數(shù)據(jù)平臺基礎(chǔ)上應(yīng)用Mahout組件來完成[5]。

        猜你喜歡
        關(guān)聯(lián)用戶
        不懼于新,不困于形——一道函數(shù)“關(guān)聯(lián)”題的剖析與拓展
        “苦”的關(guān)聯(lián)
        “一帶一路”遞進(jìn),關(guān)聯(lián)民生更緊
        奇趣搭配
        智趣
        讀者(2017年5期)2017-02-15 18:04:18
        關(guān)注用戶
        商用汽車(2016年11期)2016-12-19 01:20:16
        關(guān)注用戶
        商用汽車(2016年6期)2016-06-29 09:18:54
        關(guān)注用戶
        商用汽車(2016年4期)2016-05-09 01:23:12
        Camera360:拍出5億用戶
        100萬用戶
        500 Internal Server Error

        500 Internal Server Error


        nginx
        500 Internal Server Error

        500 Internal Server Error


        nginx
        500 Internal Server Error

        500 Internal Server Error


        nginx
        500 Internal Server Error

        500 Internal Server Error


        nginx
        500 Internal Server Error

        500 Internal Server Error


        nginx
        日本在线 | 中文| 女人被躁到高潮嗷嗷叫| 国产喷白浆精品一区二区豆腐| 国产视频激情在线观看| 91九色播放在线观看| 日韩精品视频免费网站| 久久久精品人妻一区二区三区四区| 精品少妇无码av无码专区| 91精品一区国产高清在线gif| 一本一道波多野结衣av中文| 99香蕉国产精品偷在线观看| 精品免费人伦一区二区三区蜜桃| 97精品国产高清自在线看超 | 精品黄色av一区二区三区| 亚洲av产在线精品亚洲第三站 | 午夜精品久久99蜜桃| 国产丶欧美丶日本不卡视频| 国产极品美女高潮无套在线观看 | 无码人妻精品一区二区三区蜜桃| 国产乱子伦在线观看| 激情 一区二区| 免费精品人妻一区二区三区| 无码中文字幕日韩专区| 蜜桃日本免费观看mv| 亚洲最大中文字幕无码网站| 国模无码人体一区二区| 啊v在线视频| 人妖啪啪综合av一区| 亚洲色大成网站www永久网站| 国产av影片麻豆精品传媒| 免费高清日本中文| 蜜桃视频一区二区三区| 亚洲av无码偷拍在线观看| 久久精品一区二区三区av| 亚洲无码图| 久久久麻豆精亚洲av麻花| 亚洲国产精品成人久久| 在线观看精品视频网站| 欧美成人久久久免费播放| 久久久精品中文无码字幕| 伊人久久综合狼伊人久久|