亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于流通日志和協(xié)同過濾的個性化資源推薦

        2015-12-28 03:46:40夏文忠單長吉
        關(guān)鍵詞:資源用戶

        夏文忠 單長吉

        (昭通學(xué)院物理與電子信息工程學(xué)院,云南 昭通 657000)

        隨著信息技術(shù)與計算機技術(shù)的發(fā)展,數(shù)據(jù)資源呈幾何數(shù)量級增長,為解決用戶復(fù)雜需求與龐大數(shù)據(jù)資源之間的矛盾,個性化的推薦系統(tǒng)隨之出現(xiàn)。個性化推薦技術(shù)通過研究用戶的喜好和興趣,為用戶推薦所需的各種資源,最初應(yīng)用于電子商務(wù)個性化服務(wù)中[1]。

        目前,高校圖書館的館藏資源大幅增長。本次研究采用協(xié)同過濾的余弦相似度計算等方法[2]主動為用戶推薦館藏圖書或其他信息資源,從而提升圖書館的服務(wù)水平與資源利用。

        1 基于流通日志的用戶興趣偏好與資源相似性計算

        1.1 流通日志分析

        圖書館館藏圖書建設(shè)是高校辦學(xué)的硬指標(biāo)之一,每年學(xué)校都大量投入經(jīng)費購置紙質(zhì)圖書資源與數(shù)字電子資源。隨之而來的是,各種資源大幅增加與原有資源利用率低的矛盾也顯現(xiàn)出來。在經(jīng)過十多年的圖書館數(shù)字化建設(shè)后,已有多種提升資源利用率解決方案。本次研究思路首先是從讀者流通借閱歷史數(shù)據(jù)中分析總結(jié)相關(guān)專業(yè)領(lǐng)域知識,通過協(xié)同過濾算法查找讀者興趣相似度,然后根據(jù)讀者興趣相似度把相關(guān)知識推薦給相應(yīng)的讀者。

        目前,昭通學(xué)院館藏圖書50多萬冊,自2003年數(shù)字化回溯建庫實現(xiàn)館藏資源數(shù)字管理至今,已擁有歷史流通借閱數(shù)據(jù)131萬多條。我們通過流通借閱數(shù)據(jù)的分析與挖掘,利用館藏圖書MARC記錄的結(jié)構(gòu)化特性,根據(jù)讀者借閱頻次和借閱種類分別分析統(tǒng)計,最后形成分析統(tǒng)計結(jié)果集。當(dāng)新讀者查詢相應(yīng)信息資源后,根據(jù)先前讀者的借閱歷史記錄,分析當(dāng)前讀者和以前讀者的歷史借閱記錄興趣相似度。預(yù)先設(shè)定一個推薦閥值,如兩者間相似度低于設(shè)置閥值,則做出個性化信息資源推薦,返回結(jié)果。返回結(jié)果的呈現(xiàn)可以采用電腦客戶端、瀏覽器、手機WAP、手機短信[3]、郵件、微信[4]等形式。昭通學(xué)院圖書館當(dāng)前館藏數(shù)據(jù)如表1所示。

        表1 昭通學(xué)院館藏圖書種類統(tǒng)計

        1.2 資源相似性計算

        協(xié)同過濾(collaborative filtering)概念由Goldberg等研究人員于1992年提出[5],是目前廣泛應(yīng)用的信息系統(tǒng)推薦技術(shù)。協(xié)同過濾的基本思想是,根據(jù)計算機用戶間偏好的相似度,在用戶群中尋找目標(biāo)用戶的相似用戶,在相似用戶的基礎(chǔ)上自動地為目標(biāo)用戶進行信息資源的推薦和預(yù)測。在基于流通日志的協(xié)同過濾系統(tǒng)中,通過結(jié)構(gòu)化的流通借閱數(shù)據(jù)聚類來形成結(jié)果集,再通過計算讀者間的興趣相似度來實現(xiàn)結(jié)果的個性化推薦。其基本流程如圖1所示。

        圖1 信息協(xié)同過濾推薦算法流程

        信息協(xié)同過濾推薦算法流程包含構(gòu)建“用戶-資源”評分矩陣、最近鄰搜索和產(chǎn)生推薦列表這3個階段?!坝脩?資源”評分矩陣主要收集到用戶信息資源的評分、評價行為等,并進行數(shù)據(jù)清理和轉(zhuǎn)換,最終給出用戶Ui∈U對各種資源Ij(1≤j≤n)的評分Rij,形成用戶對資源的評分矩陣。當(dāng)用戶輸入對信息資源的評價并形成評分矩陣后,系統(tǒng)就需要利用推薦算法進行最近鄰選擇。最近鄰數(shù)據(jù)可以來自當(dāng)前目標(biāo)用戶,也可以來自當(dāng)前目標(biāo)資源。產(chǎn)生推薦列表的過程是協(xié)同過濾推薦算法的輸出過程,系統(tǒng)通過推薦算法的選擇,在最近鄰?fù)扑]集的基礎(chǔ)上產(chǎn)生推薦結(jié)果集。

        2 基于流通日志和協(xié)同過濾的推薦算法

        推薦系統(tǒng)的效率來源于適合的算法及恰當(dāng)?shù)臄?shù)據(jù)源。下面以一個效用矩陣來闡述余弦相似性算法在流通日志和協(xié)同過濾系統(tǒng)中的應(yīng)用。將效用矩陣分1—5級,5級為最高級,矩陣中數(shù)字代表讀者對圖書的評級結(jié)果,無評級用0表示;空白表示讀者目前沒有對當(dāng)前圖書評分,圖書用 S1,S2,S3,…,Sn,讀者對每本書的評級分別用A,B,C,D,…,N表示。每本圖書都可以用一個所謂的詞頻向量表示,詞頻向量通常很長,并且是稀疏的,即它們有許多0值,在這里需要忽略0匹配的數(shù)值數(shù)據(jù)。

        圖2 讀者對圖書評級效用矩陣圖

        根據(jù)圖2所示的效用矩陣提供的數(shù)據(jù),使用余弦相似性來驗證讀者間的相似性。余弦相似性通過測量兩個向量內(nèi)積空間的夾角的余弦值來度量它們之間的相似性。

        兩個向量a,b間的余弦值可以很容易地通過使用歐幾里得點積和量級公式推導(dǎo):

        鑒于2個向量的屬性,A和B的余弦相似性θ用一個點積形式來表示,Ai和Bi表示矩陣中讀者評價結(jié)果,于是有下式:

        ‖A‖ 是向量 A=(A1,A2,A3,…,An)的歐幾里得范數(shù),定義為從概念上講,它就是向量的氏度。類似地,‖B‖是向量B的歐幾里得范數(shù),該度量計算向量A和B之間夾角的余弦。余弦值0意味著2個向量90°夾角(正交),沒有匹配。余弦值越接近于1,夾角越小,向量之間的匹配越大。

        據(jù)圖2所示數(shù)列,有:A×B=4×5+0×5+0×4+5×0+1×0+0×0=20,結(jié)合余弦相似性公式,A和B的夾角余弦為:

        A和C的夾角余弦為:

        在這種距離計算方式下,將會得到A和C,而不是和B更接近??梢酝ㄟ^對評分?jǐn)?shù)據(jù)的舍入處理去掉高分和低分的圖書之間表面上的相似度。如對評分進行歸一化處理,即將每個評分減去某個用戶的平均評分值,然后將低分值轉(zhuǎn)換為負(fù)數(shù)而高評分值轉(zhuǎn)換為正數(shù)。再采用余弦距離,將發(fā)現(xiàn)對所見同一圖書評價相反的用戶的向量方向幾乎相反,即是說距離可以看成盡可能的遠(yuǎn)。但是,對所看同一圖書評價類似的用戶向量之間的夾角相對很小,結(jié)果符合推薦閥值。

        3 結(jié)果分析

        本次實驗數(shù)據(jù)來源于昭通學(xué)院圖書館2003—2014年流通借閱數(shù)據(jù)。該數(shù)據(jù)包括2 621位讀者,流通借閱數(shù)據(jù)1 314 367條。實驗以中圖法分類基礎(chǔ)結(jié)合我?,F(xiàn)有專業(yè),給出分專業(yè)和學(xué)校類別的推薦結(jié)果集。以當(dāng)前數(shù)據(jù)借閱流通次數(shù)前20的圖書為例進行分析。

        如讀者甲喜歡金庸的小說《鹿鼎記》和《神雕俠侶》,讀者乙在借閱讀者甲喜歡的這兩本書的其中一本時,根據(jù)余弦相似定理,把另外一本圖書也推薦給讀者乙,從而達到個性化推薦的目的。再比如,讀者甲是中文專業(yè)的同學(xué),對昭通文學(xué)作品《好大一對羊》、《云興街》等文學(xué)作品有深入獨到的見解。又如,讀者甲在昭通文學(xué)作品的時候,對這些文學(xué)作品寫了相關(guān)的圖書評論,其他讀者通過圖書業(yè)務(wù)系統(tǒng)瀏覽館藏書目信息時,如恰好訪問了與昭通文學(xué)作品相關(guān)的作品,系統(tǒng)就會根據(jù)余弦相似定理自動把與昭通文學(xué)作品相關(guān)的評論與圖書信息推送到這些讀者訪問的頁面,從而提高資源的利用率及好書的推薦率。

        通過對流通日志數(shù)據(jù)的分析與挖掘,利用協(xié)同過濾算法,查找多個讀者之間的興趣相似度,從而實現(xiàn)圖書館資源的個性化推薦。通過使用現(xiàn)有歷史流通日志數(shù)據(jù),改善了協(xié)同過濾的冷啟動問題,對拓展和改善圖書館的信息服務(wù)水平,提高館藏紙質(zhì)資源的利用具有重要意義。

        [1]吳顏,沈潔,顧天竺,等.協(xié)同過濾推薦系統(tǒng)中數(shù)據(jù)稀疏問題的解決[J].計算機應(yīng)用研究,2007,24(6):94-97.

        [2]陳華,李仁發(fā),劉鈺峰,等.個性化搜索引擎推薦算法研究[J].計算機應(yīng)用研究,2010,27(1):48-50.

        [3]夏文忠,楊智明.一種基于MVC模式的圖書短信管理系統(tǒng)設(shè)計[J].電腦知識與技術(shù),2011,7(20):4790-4793.

        [4]黃浩波,何衛(wèi)華,葉青,等.微信及其在圖書館信息服務(wù)中的應(yīng)用[J].圖書館學(xué)刊,2013(1):62-64.

        [5]Goldberg D,Nichols D,Brian M O,et al.Using Collaborative Filtering to Weave an Information Tapestry[J].Communications of the ACM,1992,35(12):61-70.

        猜你喜歡
        資源用戶
        讓有限的“資源”更有效
        基礎(chǔ)教育資源展示
        一樣的資源,不一樣的收獲
        資源回收
        資源再生 歡迎訂閱
        資源再生(2017年3期)2017-06-01 12:20:59
        關(guān)注用戶
        商用汽車(2016年11期)2016-12-19 01:20:16
        關(guān)注用戶
        商用汽車(2016年6期)2016-06-29 09:18:54
        關(guān)注用戶
        商用汽車(2016年4期)2016-05-09 01:23:12
        Camera360:拍出5億用戶
        100萬用戶
        亚洲综合极品美女av| 亚洲一区二区情侣| 国产精品亚洲精品专区| av熟妇一区二区三区| 久久精品无码av| 中文字幕第一页亚洲| 日韩久久免费精品视频| 少妇被黑人嗷嗷大叫视频| 各种少妇正面着bbw撒尿视频| 亚洲最大中文字幕无码网站| 国产AV秘 无码一区二区三区 | 久久精品无码中文字幕| 精品国产高清a毛片| 久久精品国产在热亚洲不卡| 又粗又黑又大的吊av| 婷婷成人基地| 四虎成人精品国产永久免费| 在线国人免费视频播放| 欧美熟妇性xxx交潮喷| 亚洲精品免费专区| 性感人妻av在线播放| 精品国产一区二区三区不卡在线| 国产精品第一国产精品| 中文人妻无码一区二区三区信息| 亚洲伊人伊成久久人综合| 色欲av永久无码精品无码蜜桃| 国产成人午夜精华液| 久久久综合九色合综国产| 国产黄片一区二区三区| 国内少妇毛片视频| 亚洲国产区男人本色| 久久精品国产亚洲av成人擦边| 蜜桃av人妻精品一区二区三区 | 国产亚洲视频在线播放| 精品一区二区三区免费播放 | 蜜桃视频高清在线观看| 一二三四五区av蜜桃| 亚洲男人的天堂在线播放| 最新国产美女一区二区三区| 青青草手机在线观看视频在线观看| 成 人 免费 在线电影|