亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于Apriori算法的圖書館用戶行為模式分析研究

        2022-06-15 15:31:38劉璐璐陳志飚黃勇熊章遠
        現代信息科技 2022年2期
        關鍵詞:Apriori算法用戶行為關聯規(guī)則

        劉璐璐?陳志飚?黃勇?熊章遠

        摘? 要:以某高校圖書館信息管理系統用戶數據為研究對象,對圖書館用戶借閱行為進行研究。充分利用業(yè)務系統海量數據優(yōu)勢,使用K-means算法對用戶數據進行聚簇,將用戶群體細分形成相似群,然后構造用戶行為指標體系,再選用Apriori關聯規(guī)則算法,根據借閱行為數據特點構造用戶行為分析模型,同時在聚類群體數據的基礎上進一步深入挖掘,最后得到用戶行為規(guī)則和模式。研究結論可為圖書館合理豐富館藏、圖書采編、書架擺放、業(yè)務系統流程優(yōu)化等提供參考。

        關鍵詞:圖書館;用戶行為;關聯規(guī)則;數據挖掘;Apriori算法

        中圖法分類號:TP391;G252? ? ? ? ? ?文獻標識碼:A文章編號:2096-4706(2022)02-0009-04

        Abstract: Taking the user data of the information management system of a university library as the research object, this paper studies the borrowing behavior of library users. Make full use of the massive data advantages of the business system, cluster the user data by using the K-means algorithm, subdivide the user group into similar groups, and then construct the user behavior index system, and then select the Apriori association rule algorithm to construct the user behavior analysis model according to the characteristics of borrowing behavior data. At the same time, further mining is carried out on the basis of clustering group data, Finally, the user behavior rules and patterns are obtained. The research conclusion can provide reference for the library to reasonably enrich the collection, book collection and editing, bookshelf placement, business system process optimization and so on.

        Keywords: library; user behavior; association rule; data mining; Apriori algorithm

        0? 引? 言

        大數據技術的不斷成熟,掀起了新時代信息化發(fā)展又一波高潮,高校圖書館數字化智能化發(fā)展與研究也逐漸成為時下研究熱點。隨著高校圖書信息管理系統的用戶數據的不斷積累,如用戶的專業(yè)、課程、學科、年級、查詢關鍵詞等信息,為圖書館用戶行為的研究提供了難得的一手實驗數據。目前,這些海量的數據除了用于記錄圖書的借閱信息之外,大多僅用于統計日常業(yè)務數據,而數據的真正價值往往被圖書管理者忽略。

        圖書館用戶在專業(yè)課程學習或進行科研活動過程中,往往需要到圖書館借閱圖書、期刊等書籍,跨學科或專業(yè)等交叉式學習研究已成為常態(tài),用戶的這些借閱行為往往會存在一定的行為特征,用戶群體之間存在共性,借閱書目之間存在關聯[1]。一般來說,圖書建設管理方可以根據用戶的專業(yè)或者研究方向等信息,利用自身圖書管理經驗來判定用戶借閱圖書類別需求[2]。但客觀來說,很多用戶行為之中隱藏的關聯性很難憑借圖書管理人員的常識或經驗去獲取。本文利用圖書館信息系統產生的借閱數據,通過數據挖掘技術來進行深度挖掘,借此發(fā)現這種“隱藏的關聯性”,以推動高校圖書館的服務工作向智能化方向邁進。

        如何根據用戶的個人信息(如專業(yè)、課程、年級等)、借閱記錄(如借閱時間、頻度、學科等)、查詢關鍵詞記錄等數據,發(fā)現不同用戶的借閱行為是否有關聯?不同的專業(yè)與書目之間是否存在關聯?用戶的借閱圖書種類會出現什么樣的趨勢?用戶的借閱習慣存在什么樣的規(guī)律?挖掘出這些數據之間規(guī)律,有利于合理配置圖書資源和提高資源利用率,合理分布圖書館館藏書籍,為師生用戶主動提供個性化的服務。

        1? 總體思路

        傳統的圖書館用戶數據分析是基于數據統計的基礎上,實現數據的檢索、分類等功能[3]。圖書館數據庫中大量借閱數據,通過數據挖掘可以很好地反映出用戶的需求,找出用戶借閱圖書之間存在的關聯規(guī)則、不同學科圖書之間存在的關聯規(guī)則、不同專業(yè)用戶借閱圖書的規(guī)律等等[4,5]。

        如圖1所示。本文通過利用高校圖書館信息管理系統,對從用戶查詢、采編、流通、借閱、圖書訂購、用戶信息數據中抽取學生、教師等用戶信息建立用戶行為數據庫。通過數據清洗、轉換、集約化處理等預處理過程,建立用戶借閱記錄、興趣和習慣等維度的數據標準體系。通過聚類分析將用戶標記分類,使用Apriori關聯規(guī)則分析用戶行為關聯規(guī)則和規(guī)律,識別分析出發(fā)現用戶特征與他們借閱行為的規(guī)律性,最后論述用戶的隱形需求、行為習慣以及未來的借閱趨勢,最終從真正意義上實現個性化信息服務的目的,為高校圖書館用戶服務、科學豐富館藏,圖書采編行為,書架擺放設置,圖書信息系統業(yè)務流程優(yōu)化等提供實踐參考。E5787314-7492-4389-B566-4A8809DEA7D0

        2? 用戶行為分析模型

        圖書館用戶借閱行為模式研究主要包括四大過程數據抽取、數據預處理、聚類分析、關聯規(guī)則分析,最后形成用戶行為規(guī)則集,如圖2所示。

        2.1? 收集用戶基礎數據

        本文通過某高校圖書館信息管理系統數據庫抽取2019年到2020年為期一學年的數據,主要包括用戶基本信息(學號、年級、專業(yè)、學科課程等字段)和借閱圖書信息(題名、索書號、中國圖書館分類號、作者、出版等字段),通過這些數據來描述用戶的借閱行為。本文研究獲得的未經處理的原始數據有用戶基礎信息18 565條記錄,借閱圖書信息595 153條記錄。

        2.2? 數據預處理

        清洗收集到的數據中既有噪聲數據、空缺數據、分散數據[6];整合歸并不同數據源的數據文件;使用如采用分箱、聚類和回歸等方法對數據進行規(guī)格化處理。

        我們將數據表中每一行記錄定義為一個事務,包含一個唯一的標識TID(學號或教師號)和用戶的基礎信息(用戶類型、學院、專業(yè)、圖書名稱、圖書分類等)和借閱圖書信息,其中為了分析用戶基礎信息和圖書借閱信息之間的關聯,為更好地開展實驗,本文根據中圖法對所借閱圖書進行分類,以此來整合歸并用戶借閱圖書信息。實驗中,取到第四類,如分類號為TP3的圖書,按照中圖法分類,就是計算技術、計算機技術類圖書。然后將每一用戶借閱的書目放在同一個項集中,若該用戶借閱了該類書目,則通過借閱數量來進行標記。其處理結果如表1所示(部分代表數據),每條借閱記錄中包含著諸如以下幾個信息:用戶號(TID)、用戶類型(type)、用戶所在院系(dep)、用戶專業(yè)(major)、用戶借閱圖書名稱(title)及用戶對每本書的借閱情況(books)。

        2.3? 用戶群體聚類分析

        利用用戶借閱事務數據表,使用K-means聚類算法用戶進行細分生成用戶相似群。本文對用戶借閱各類書目的次數聚類,將用戶分成行為具備共性聚簇,在各簇之間用戶借閱書目的類型和數量構成比較接近,表現為對用戶借閱數量上不同,以及用戶借閱頻率的高低。在實際K-means聚類過程中,通過對K值的不斷調整,最終將K值確定為5,即將用戶細分為5個大類。用戶群體聚類分析結果如圖3所示。

        在本次聚類分析中,用戶群體總計為11 305個用戶。從圖中聚類結果可以看出,用戶最多的為類1,占比52.5%,有5 935個用戶,該年度借閱圖書數量4.7本;聚類2中用戶數為3 742,占比33.10%,該年度借閱數量為12.3本;聚類3中用戶數為1 587,占比14.04%,該年度借閱數量為22.4本,聚類4中用戶數為36,占比0.32%,該年度借閱數量為42.6本。可以到聚類1、聚類2、聚類3、聚類4包括絕大分用戶,占比99.9%,表現為絕大部用戶年度借閱書目在4.7~42.6本,該校圖書總體利用率較低。聚類5中用戶數為5,屬于極個別情況,實際上由于方差太大,為52.04%,說明該類用戶的借閱行為在數據上體現為比較離散,不具備普適性。

        2.4? 用戶行為模式分析

        傳統的用戶行為屬性研究都是將全部信息作為產生規(guī)則的數據源或是主觀性的根據用戶的自身屬性特征(用戶所在院系,性別等因素)對用戶進行分類,以每個類中的借閱信息作為產生規(guī)則的數據源,然后對每位用戶實行關聯[7]。本文利用Apriori關聯規(guī)則算法,根據借閱行為數據特點構造用戶行為分析模型,同時在聚類群體數據的基礎上用戶類型、專業(yè)、學科等基礎信息等與書目之間進一步深入挖掘,最后得到用戶行為規(guī)則和模式。如在數據挖掘過程中,發(fā)現大部分用戶借閱了“人工智能”的同時也借閱“統計學”這本書,我們認為這兩本書存在一定關聯,可以作為用戶借閱行為模式。圖4是本文構建的用戶借閱行為模式關聯規(guī)則挖掘的模型。在此基礎找出有效的借閱規(guī)則,然后根據用戶的借閱興趣,向用戶推薦可能會感興趣的圖書。

        本文進行的用戶行為模式分析,主要包括兩個部分,一是利用用戶借閱圖書信息進行關聯規(guī)則分析,二是在上文聚類出的5類相似群內容進一步進行關聯規(guī)則挖掘。

        2.5? 結果分析

        在用戶行為模式反復挖掘過程中,我們調試試驗參數,最后將最小支持度設置為52%,最小的置信度設置為60%,最后共生成126條關聯規(guī)則,部分結果如表2所示。如首條關聯規(guī)則顯示,借閱H和B類書目的用戶去借閱I類書目的概率為99.361%,借閱H、B、I類書目的事項的概率為65.199,其他關聯規(guī)則可類比解釋。在聚類出的5類相似群內容進一步進行關聯規(guī)則挖掘,去掉一部分無效的關聯規(guī)則,我們發(fā)現了24條關聯規(guī)則。這些關聯規(guī)則可以作為用戶的行為規(guī)律和模式,可為圖書館合理豐富館藏、圖書采編、書架擺放、業(yè)務系統流程優(yōu)化等提供參考。

        3? 結? 論

        本文利用用戶圖書借閱行為數據,使用K-means算法對用戶進行聚簇形成相似群,然后選用Apriori關聯規(guī)則算法,并根據借閱行為數據特點構造用戶行為分析模型,同時在聚類數據的基礎上進一步深入挖掘,最后得到用戶行為規(guī)則和模式。目前的圖書館管理系統大多缺乏數據挖掘功能,本文研究有利于圖書館建設管理方全面掌握用戶的閱讀習慣和行為模式,通過對用戶的閱讀規(guī)律進行分析,可為圖書館合理豐富館藏、圖書采編、書架擺放、業(yè)務系統流程優(yōu)化等提供參考,積極向用戶提供更加個性化的服務。

        參考文獻:

        [1] 李寶.基于用戶畫像的高校圖書館個性化資源推薦服務設計 [J].新世紀圖書館,2021(4):68-75.

        [2] 陳東華.計算機技術進行圖書分類的問題探討 [J].中外企業(yè)家,2019(29):124.

        [3] 喬鑫鑫.信息化技術在圖書管理中的應用 [J].電子技術與軟件工程,2021(2):235-236.

        [4] 張媛玲.互聯網時代的圖書管理信息化建設探索 [J].漢字文化,2018(17):119-120.

        [5] MAURI M,ELLI T,CAVIGLIA G,et al. Rawgraphs:a visualisation platform to create open outputs [C]//CHItaly17:Proceedings of the 12th Biannual Conference on Italian SIGCHI Chapter.Cagliari:Association for Computing Machinery,2017:1-5.

        [6] 姜云龍.基于數據挖掘的高校大學生讀者閱讀趨向研究 [D].東北師范大學,2016.

        [7] 李文華.基于Apriori關聯分析與協同過濾的圖書推薦算法 [J].電腦知識與技術,2017,13(33):32-33+35.

        作者簡介:劉璐璐(1991—)女,漢族,安徽宿州人,館員,碩士研究生,研究方向:計算機。E5787314-7492-4389-B566-4A8809DEA7D0

        猜你喜歡
        Apriori算法用戶行為關聯規(guī)則
        電力高校圖書館轉型智庫服務的研究
        基于Hadoop平臺的并行DHP數據分析方法
        基于Apriori算法的高校學生成績數據關聯規(guī)則挖掘分析
        社會化媒體用戶使用動機與行為探析
        基于云平臺MapReduce的Apriori算法研究
        關聯規(guī)則,數據分析的一把利器
        數據挖掘在高校課堂教學質量評價體系中的應用
        新媒體用戶行為模式分析
        關聯規(guī)則挖掘Apriori算法的一種改進
        中國市場(2016年36期)2016-10-19 04:10:44
        基于關聯規(guī)則的計算機入侵檢測方法
        日本一二三四高清在线| 人妻少妇av无码一区二区| 国产在线播放一区二区不卡| 日韩精品无码一区二区三区四区| 揄拍成人国产精品视频| 五月天中文字幕mv在线| 国内少妇毛片视频| 永久黄网站免费视频性色| 国产无遮挡又黄又爽在线视频| 九九九精品成人免费视频小说| 无码精品人妻一区二区三区影院 | 一区二区三区国产在线网站视频| 久久久久一| 美女被内射很爽的视频网站| 亚洲综合日韩一二三区| 国产成人精品无码一区二区三区 | 国产av久久在线观看| 99久久久无码国产精品秋霞网| 精品国产av色一区二区深夜久久| 丰满人妻熟妇乱又伦精品软件 | 亚洲大胆美女人体一二三区| 激情五月我也去也色婷婷| 国产精品无码素人福利不卡| 国产精品免费看久久久8| 丝袜AV在线一区二区三区| 精品一二区| 成人av一区二区三区四区| av无码精品一区二区三区| 在线视频观看免费视频18| 精品久久综合亚洲伊人| 草莓视频在线观看无码免费| 99国语激情对白在线观看| 亚洲不卡高清av网站| 狠狠躁日日躁夜夜躁2020| 午夜精品久久久久久毛片| 欧美日本国产va高清cabal| 视频国产精品| 日本女同视频一区二区三区| 国产在线无码精品无码| 中文字幕人妻被公上司喝醉| 一本色道久久99一综合|