亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        用戶畫像技術在圖書個性化推薦中的應用

        2021-06-30 01:43:50遵義醫(yī)科大學陳錦秋狄思思
        電子世界 2021年11期
        關鍵詞:畫像向量社交

        遵義醫(yī)科大學 陳錦秋 狄思思

        在大數據環(huán)境下,如何利用用戶數據提高服務質量是圖書館面臨的重要課題。用戶畫像技術是挖掘用戶需求、實現精準服務的重要技術手段。本文在圖書推薦中引入用戶畫像技術,基于高校圖書館用戶數據構建用戶畫像,將用戶畫像和協同過濾算法相結合,實現精準的個性化圖書資源推薦。

        隨著信息技術的高速發(fā)展,傳統(tǒng)的圖書館逐漸向智慧圖書館轉型。智慧圖書館將物聯網、云計算、人工智能等智能化技術運用到圖書館的建設中,實現智慧化的服務和管理,為讀者提供更加高效、便捷、全面、精準的資源獲取方式。

        高校圖書館是學生和教師獲取信息資源的重要來源之一,是高校辦學的重要支柱。構建順應信息時代發(fā)展和讀者需求變化的高校圖書館智慧服務體系是高校圖書館建設面臨的新挑戰(zhàn)。在圖書推薦和資源建設中引入智能化技術,能為讀者提供更加精準、快捷和個性化的服務,能全方位提升用戶體驗,提高學習和工作效率,促進教學和科研工作的開展。

        1 用戶畫像相關研究

        用戶畫像這一概念最早由交互設計之父A.Cooper提出,他指出用戶畫像是基于與用戶相關的真實數據建立起來的虛擬模型,是對真實用戶的虛擬化。大數據時代背景下,用戶的上網行為數據、交易數據、偏好數據等信息數據被各種信息系統(tǒng)記錄、收集,利用這些數據信息去刻畫用戶的特征,挖掘不同類型用戶的需求,從而實現精準的服務。圖書館的各種信息設備和信息平臺收集、存儲著讀者的數據信息,這些數據信息反映讀者閱讀習慣和閱讀需求等,利用這些讀者數據構建虛擬用戶模型,將用戶標簽化,從而實現智能化、個性化館內服務。

        目前,用戶畫像技術已被廣泛應用于高校圖書館的智慧化服務領域。許鵬程等從自然維度、興趣維度和社交維度等3個維度構建用戶畫像模型,并提出了圖書館用戶畫像的框架模型。劉漫等將用戶畫像模型與聚類、關聯算法結合,探索閱讀精準推廣服務新模式。潘宇光從讀者的屬性信息、行為信息、興趣偏好、社交關系等4個方面刻畫用戶畫像模型,并生成可視化用戶畫像。

        基于用戶畫像提升圖書館個性化服務的基本流程為數據采集、數據預處理、數據特征分析、用戶畫像模型構建、數據挖掘算法、服務應用,即首先通過圖書館的信息設備、信息平臺和管理系統(tǒng)等采集讀者的基本屬性數據和行為數據。其中,基本屬性數據指讀者的年齡、性別、年級、專業(yè)、院系、借書證號、聯系方式、所屬校區(qū)等基本信息;行為數據指讀者的借閱信息,如借閱時長、圖書的書名、圖書作者、圖書分類等。收集數據后,需要對數據進行一些預處理,對數據的準確性、適用性進行判斷和審核,篩選不符合要求的數據或有明顯錯誤的數據,并予以清除。然后,基于用戶數據對用戶的自然屬性特征、興趣特征、社交關系等進行分析,并構建用戶畫像模型。最后,將用戶畫像模型應用于具體的服務。

        在構建用戶畫像模型的過程中,需要利用數據挖掘算法對用戶間的潛在聯系進行深入挖掘,常用的算法有協同過濾算法、聚類、關聯規(guī)則等。挖掘用戶間的聯系是分析用戶需求、實現精準服務的關鍵。

        圖書推薦是圖書館最重要的服務之一,本文基于協同過濾算法構建用戶畫像模型,以期實現圖書個性化推薦。協同過濾算法分為基于用戶相似度協同過濾算法和基于物品相似度協同過濾算法,本文采用基于用戶相似度的協同過濾算法。其原理是通過對目標用戶的興趣偏好進行分析、挖掘,找到與目標用戶具有相似愛好的相似用戶,根據相似用戶的喜好向目標用戶進行物品推薦。

        2 構建用戶畫像模型

        本文選取西南地區(qū)某高校圖書館2019年圖書借閱量排名前300的讀者,通過圖書館的用戶管理系統(tǒng)和信息化設備獲取讀者的基本屬性數據和行為數據,以及相關圖書的基本屬性數據,從自然屬性、興趣屬性、社交屬性三個維度構建用戶畫像模型。

        2.1 自然屬性模型構建

        2.1.1 自然屬性

        用戶的自然屬性由基本屬性數據刻畫,本文選取性別、年齡、專業(yè)、讀者類型作為自然屬性模型構建的基礎數據。如表1所示。

        表1 部分讀者及其基本屬性數據

        2.1.2 自然屬性相似度計算

        本文將每個用戶的自然屬性看作一個n維的向量,該向量被稱為自然屬性向量,向量不同的分量代表著不同的屬性,第1和第2個分量代表用戶的性別屬性;由于用戶的年齡在17-55之間,筆者按照3歲一個年齡段將用戶年齡劃分為13個區(qū)間,向量的第3至15個分量代表年齡屬性;向量的第16至18個分量代表讀者類型屬性,分別為本科生、研究生和教師;向量的第19至n個分量代表專業(yè)屬性。用戶自然屬性對應的分量值為1,其余的分量值為0。例如,向量的前2個分量代表用戶的性別屬性,如果用戶性別為男,則向量第1個分量值為1,第2個分量值為0,如果用戶的性別為女,則向量第1個分量值為0,第2個分量值為1。

        本文采用余弦相似度方法計算自然屬性的相似度,其計算公式如下:

        其中,A和B分別表示兩個用戶的自然屬性向量,Ai和Bi分別代表向量A和B的各分量。sim1代表兩個用戶間自然屬性的相似度,其范圍在0至1之間,其值越接近1,向量A和向量B間的夾角越接近0°,表明兩個用戶的自然屬性相似度越大。

        根據公式(1)計算不同用戶間自然屬性的相似度,得到的結果如表2所示。

        表2 部分讀者自然屬性相似度

        2.2 興趣屬性相似度計算

        用戶對圖書的常規(guī)操作有借閱、續(xù)借、歸還、預約等,這些操作會被圖書館的信息系統(tǒng)記錄,形成用戶行為數據。用戶的行為數據蘊含著用戶對不同圖書的興趣偏好,本文對用戶的圖書借閱記錄進行分析,基于興趣屬性特征計算用戶間的相似度,從興趣屬性維度構建用戶畫像。

        用戶進行一次圖書借閱操作將會在系統(tǒng)中產生一條借閱記錄,如表3所示,每條借閱記錄包含的字段有讀者編號、題名、責任者、索書號等。300名讀者2019年共形成了6511條借閱記錄。

        表3 部分讀者借閱記錄

        筆者根據中國圖書館分類法將圖書館的藏書分為22大類,每本圖書依據索書號被歸為不同的類別,然后統(tǒng)計每個用戶借閱不同圖書類別的數量。將每個用戶的借閱情況用一個向量表示,該向量被稱為興趣屬性向量,該向量的維數為22,向量不同的分量代表著不同的圖書類別,分量的值表示用戶借閱該類別圖書的數量。采用余弦相似度方法計算興趣屬性的相似度,其計算公式如下:

        其中,M和N分別表示兩個用戶的興趣屬性向量,Mi,Ni分別代表向量M和N的各分量。sim2代表兩個用戶興趣屬性的相似度,其范圍在0至1之間,其值越接近1,向量M和向量N間的夾角越接近0°,表明兩個用戶的興趣屬性相似度越大。

        根據公式(2)計算不同用戶興趣屬性的相似度,得到的結果如表4所示。

        表4 部分讀者興趣屬性相似度

        2.3 社交屬性相似度計算

        社交屬性是指兩個用戶借閱行為的關聯性。通過觀察用戶行為數據可以發(fā)現,不同的用戶之間可能存在著相似的借閱行為:不同的用戶借閱同一類別的圖書。若兩個用戶的借閱記錄中有同一類別的圖書就說明他們的借閱行為有著關聯性。社交屬性相似度刻畫了用戶借閱行為關聯性的高低。本文通過計算用戶社交屬性相似度來發(fā)掘用戶間的關聯性,從社交屬性維度構建用戶畫像。采用Jaccard系數來計算用戶社交屬性相似度,其計算公式如下:

        其中集合A表示讀者A的圖書借閱記錄,集合B表示讀者B的圖書借閱記錄,A∩B表示讀者A和讀者B借閱同一類別圖書的數量,A∪B表示讀者A和讀者B借閱圖書類別數的總和。

        根據公式(3)計算不同用戶之間社交屬性的相似度,得到的結果如表5所示。

        表5 部分讀者社交屬性相似度

        2.4 用戶相似度計算

        在計算用戶的綜合相似度時,為了能同時考慮用戶的自然屬性特征、興趣屬性特征和社交屬性特征,本文采用一種改進的相似度度量方法,其計算公式如下:

        其中,sim1是根據公式(1)計算得出的用戶自然屬性相似度,sim2是根據公式(2)計算得出的用戶興趣屬性相似度,sim3是根據公式(3)計算得出的用戶社交屬性相似度。參數α、β表示權重,取值范圍在0至1之間,本文認為在計算用戶相似度時,自然屬性的貢獻度小于興趣屬性和社交屬性,因此設定參數α的值為0.2,參數β的值為0.4。根據公式(4)計算得出用戶的相似度,如表6所示。

        表6 部分讀者的綜合相似度

        3 基于用戶畫像的圖書推薦

        根據用戶相似度計算結果,得到目標用戶與其他用戶的相似度集合U,然后將集合U中的相似度排序,找出與目標用戶相似度最高的5個用戶。

        在興趣屬性相似度計算過程中,對目標用戶借閱不同圖書類別的數量進行了統(tǒng)計,選取數量排名前3名TOP-3的圖書類別作為目標用戶最喜歡的前3類圖書。最后,找出與目標用戶相似度最高的5個用戶的借閱記錄中屬于TOP-3類的圖書,并將這些圖書推薦給目標用戶。

        本文隨機選取編號為43的用戶為目標用戶,展示基于用戶畫像的圖書推薦過程。

        根據表6得到與目標用戶相似度最高的5個用戶編號分別為268、257、35、297和107.目標用戶借閱不同圖書類別數量排名前3名TOP-3的圖書類別為I(文學)、B(哲學、宗教)、H(語言、文字)。相似度排名前5用戶的借閱記錄中屬于TOP-3類的圖書如表7所示。最后,將表中的圖書推薦給目標用戶。

        表7 推薦結果

        在傳統(tǒng)基于協同過濾算法的圖書推薦研究中,大多數研究僅僅根據讀者的歷史行為數據計算用戶相似度,只利用了讀者的興趣屬性特征,而忽略了用戶的自然屬性特征和社交屬性特征。本文在構建用戶畫像時,使用一種改進的用戶相似度計算方法,從不同的維度刻畫用戶畫像,旨在準確把握用戶閱讀習慣和偏好,實現個性化圖書推薦。

        猜你喜歡
        畫像向量社交
        社交之城
        英語世界(2023年6期)2023-06-30 06:28:28
        威猛的畫像
        社交牛人癥該怎么治
        意林彩版(2022年2期)2022-05-03 10:25:08
        向量的分解
        聚焦“向量與三角”創(chuàng)新題
        “00后”畫像
        畫像
        社交距離
        第一財經(2020年4期)2020-04-14 04:38:56
        你回避社交,真不是因為內向
        文苑(2018年17期)2018-11-09 01:29:28
        向量垂直在解析幾何中的應用
        av免费在线播放视频| 娇柔白嫩呻吟人妻尤物| 久久精品国产亚洲av热九| 在线播放国产自拍av| 插我一区二区在线观看| 色老汉免费网站免费视频| 中国产无码一区二区三区| 国产成人av三级在线观看韩国 | 久久久噜噜噜久久| 精品国产v无码大片在线观看| 国产精品日日摸夜夜添夜夜添| 99蜜桃在线观看免费视频| 人妻无码一区二区三区| a级黑人大硬长爽猛出猛进 | 男人j进女人j啪啪无遮挡| 亚洲电影一区二区三区| 亚洲伊人av综合福利| 久久99精品久久久大学生| 成年无码av片完整版| 天天插天天干天天操| 亚洲精品在线一区二区| 女人色熟女乱| 亚洲精品免费专区| 亚洲色图视频在线观看,| 久久伊人这里都是精品| 亚洲av无码不卡久久| 精品免费一区二区三区在| 美女视频黄a视频全免费网站色 | 加勒比日韩视频在线观看| 久久精品人妻无码一区二区三区| 伊人色网站| 黄页免费人成网址大全| 高h小月被几个老头调教| 国产精品.xx视频.xxtv| 日本一区二区三区在线播放| 91精品国产综合久久久蜜| 无码国产伦一区二区三区视频| 亚洲色欲Aⅴ无码一区二区| 国产精品亚洲二区在线| 久久不见久久见免费影院| 99在线播放视频|