亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于數(shù)據(jù)挖掘技術(shù)的數(shù)字圖書館個性化服務(wù)發(fā)展研究

        2021-03-10 11:37:13陳佩欣
        科技資訊 2021年36期
        關(guān)鍵詞:數(shù)據(jù)挖掘

        作者簡介:陳佩欣(1991—):女,本科,助理工程師,研究方向圖書情報。

        摘要:隨著互聯(lián)網(wǎng)技術(shù)的不斷發(fā)展,數(shù)據(jù)爆炸性的整體發(fā)展緊隨其后。人們每天都在處理各式各樣的數(shù)字化信息,如何在眾多的信息中快速得到人們所需要的信息尤為重要。數(shù)字圖書館作為人們獲取信息的重要渠道之一,在幫助用戶找到所需要信息方面不斷進行探索,應(yīng)用各種信息挖掘技術(shù)方法,實現(xiàn)數(shù)字資源的個性化建設(shè),是新時期數(shù)字圖書館發(fā)展的必然服務(wù)趨勢。該文將從數(shù)字圖書館和數(shù)字圖書館的個性化服務(wù)發(fā)展的現(xiàn)狀展開研究,主要研究了數(shù)據(jù)挖掘的相關(guān)技術(shù)、數(shù)據(jù)探索技術(shù)在數(shù)字圖書館的發(fā)展、促進圖書館的互聯(lián)網(wǎng)技術(shù)的應(yīng)用服務(wù)提供方面發(fā)現(xiàn)的問題,并在此基礎(chǔ)上提出了解決對策。

        關(guān)鍵詞:數(shù)據(jù)挖掘 數(shù)字圖書館 個性化 服務(wù)建設(shè)

        中圖分類號: G25 ????文獻標識碼:A???文章編號:1672-3791(2021)12(c)-0000-00

        Abstract: With the development of IT, digital information developed explosively. People are dealing with all kinds of digital information, how to get the information we need is particularly important. As one of the important ways for people to obtain information, the digital library is constantly exploring in helping users to find the information they need. This article starts from the current status of the development of digital library and digital library's personalized service, mainly researches the related technology of data mining and promotes the service of library's Internet technology. The countermeasures have been proposed to solve problems at the moment.

        Key Words: Data mining; Digital library; Personalization; Service construction

        在信息技術(shù)的飛速發(fā)展下,一方面大量的信息內(nèi)容給現(xiàn)代人的生活帶來了便利,另一方面數(shù)量巨大且冗雜的信息也為人們帶來了搜尋上的不便。數(shù)字圖書館使用者增加的同時,人們對數(shù)字圖書館個性化服務(wù)的需求也隨之增加。為了在大量的信息中得到用戶真正需要的信息,數(shù)據(jù)挖掘技術(shù)應(yīng)運而生。在數(shù)字圖書館中應(yīng)用各種深度數(shù)據(jù)挖掘技術(shù),可以增強在數(shù)字圖書館中篩選相關(guān)圖書信息的效率。在數(shù)字圖書館的基礎(chǔ)上豐富個性化服務(wù),更能滿足用戶的信息檢索和圖書閱讀的需求,提高用戶的閱讀效率[1]。為用戶提供更優(yōu)質(zhì)的個性化服務(wù),已然成為每個數(shù)字圖書館管理者需要考慮的主要問題,也是和同類網(wǎng)絡(luò)信息資源建設(shè)產(chǎn)品競爭的重要手段。

        1數(shù)字圖書館的概述

        1.1數(shù)字圖書館的概念

        美國密歇根大學于1990年提出建立電子圖書館,并將與閱覽室密切相關(guān)的各部門建立的館藏標準定義為數(shù)字化圖書館。該文對數(shù)字化圖書館的標準定義沒有研究不做過多闡述,將其具體定義為利用數(shù)字的含義、各種技術(shù)流程以內(nèi)部存儲各種相關(guān)信息的軟件系統(tǒng)[2]。

        1.2數(shù)據(jù)挖掘及相關(guān)技術(shù)

        數(shù)據(jù)挖掘是指從數(shù)據(jù)中找出隱藏的、具有市場價值的信息內(nèi)容,通過各種知識的刪除和選擇、提取以及尋找數(shù)據(jù)規(guī)律,使用統(tǒng)計、檢索信息數(shù)據(jù)庫以及多種模型識別等在數(shù)據(jù)庫中查找可用數(shù)據(jù),然后尋找數(shù)據(jù)規(guī)則并運用規(guī)則,它能輸入特定名詞進行驅(qū)動查詢,挖掘信息中的規(guī)律[3]。數(shù)據(jù)進行深度挖掘的主要方式有聚類、分類與預(yù)測、關(guān)聯(lián)和偏差檢測。主要技術(shù)有決策樹、回歸分析、人工神經(jīng)網(wǎng)絡(luò)等。建設(shè)數(shù)字圖書館只有綜合運用以上技術(shù),才能建設(shè)好具有個性化特點的數(shù)字圖書館。

        2個性化數(shù)字圖書館系統(tǒng)模型的設(shè)計與實施

        2.1模型設(shè)計思路

        數(shù)字圖書館個性化系統(tǒng)模型的設(shè)計應(yīng)以用戶為中心,重點考慮數(shù)字圖書館的操作性,結(jié)構(gòu)性以及可更新性,并對用戶、圖書資源進行分析挖掘。數(shù)據(jù)挖掘的個性化數(shù)字圖書館系統(tǒng)模型的設(shè)計就是要挖掘數(shù)字圖書館用戶的個人信息、上網(wǎng)行為,并從中分析出用戶的興趣愛好、學習關(guān)注點以及行為習慣,這樣才能向用戶提供優(yōu)質(zhì)的個性化服務(wù),并為圖書館文獻的錄入提供依據(jù)[4]。

        2.2對資源的分析

        對用戶行為分析,根據(jù)用戶的注冊信息,借閱、瀏覽記錄進行聚類分析,劃分類別,針對不同的群組提供不同的服務(wù)方式和推薦模式;對被借閱書籍分析,被借閱次數(shù)多的圖書受眾面大,可作為圖書館的熱門圖書放在用戶登錄首頁或推送圖書板塊處。

        2.3個性化系統(tǒng)結(jié)構(gòu)模型設(shè)計

        系統(tǒng)根據(jù)用戶在數(shù)字圖書館的注冊、登錄信息,建立用戶模型,根據(jù)用戶的檢索記錄形成信息庫。將用戶模型與信息庫進行匹配,通過匹配結(jié)果向用戶提供個性化信息服務(wù)。

        2.4系統(tǒng)工作流程

        根據(jù)用戶的注冊信息、檢索信息以及閱讀信息建立用戶信息庫和信息資源庫,個性化系統(tǒng)會調(diào)用用戶資源庫及信息資源庫,把用戶歸類并建立借閱行為模型,利用數(shù)據(jù)挖掘技術(shù)找出用戶意向資源,把信息推送給用戶。

        2.5數(shù)字圖書館數(shù)據(jù)挖掘數(shù)據(jù)源選取

        以中國國家數(shù)字圖書館為研究對象,中國國家數(shù)字圖書館館書藏書990多萬冊,電子文獻日瀏覽量非常大,瀏覽量越大其隱形價值信息就越豐富,該文選擇中國國家數(shù)字圖書館2016年1月到2019年12月的用戶借閱數(shù)據(jù)為個性化服務(wù)研究展開說明。

        2.5.1用戶基本信息

        序號、用戶編號、用戶名、注冊時間、讀者類型、借書狀態(tài)等信息、為用戶分類、借閱意向分類提供依據(jù)。

        2.5.2借閱數(shù)據(jù)的處理

        刪除用戶的重復(fù)信息以及已經(jīng)注銷賬號的用戶信息、補全用戶信息表用戶屬性缺失的部分;借閱信息的清洗是數(shù)據(jù)集的核心部分,可以選擇借閱數(shù)量大的用戶群體為研究對象,清除借閱數(shù)量少的用戶群體數(shù)據(jù)[5]。數(shù)據(jù)挖掘要挖掘的兩個信息表中存儲字段的形式不同,需要進行數(shù)據(jù)轉(zhuǎn)換,在設(shè)計目標時,要了解用戶借閱圖書的次數(shù)以及感興趣的圖書類別,將圖書進行劃分,為縮短數(shù)據(jù)挖掘處理時間,還需處理用戶借閱次數(shù)、表名、用戶類型、字段名等方面[6]。

        2.6數(shù)據(jù)集成

        除了用戶信息表和借閱信息表,還需組織統(tǒng)計數(shù)據(jù)表,如圖書借閱次數(shù)集成表和用戶借閱次數(shù)集成表。圖書借閱次數(shù)集成表應(yīng)包含以下字段屬性:圖書所屬類別、圖書館圖書借閱情況;用戶借閱次數(shù)集成表應(yīng)包含以下字段屬性:用戶名、用戶編號、借閱次數(shù)。

        關(guān)聯(lián)規(guī)則的分析過程中,將數(shù)字圖書館的借閱數(shù)據(jù)處理集成,把用戶對該類圖書有過借閱行為的取值為“1”,沒有過借閱行為的取值為“0”[7]。其用戶借閱事務(wù)數(shù)據(jù)如圖1所示。

        從圖1數(shù)據(jù)可以看出,用戶編號為21324234與32141757的兩位用戶,從用戶圖書借閱量上來看,用戶21324234圖書借閱量為34,用戶32141757圖書借閱量為274;從借閱圖書類別上看,用戶21324234借閱類別偏向O類和U類的圖書,而對于用戶編號為32141757來說,他在圖書分類O類與U類處為0,則說明32141757對這兩類圖書不感興趣,它對P類與V類的圖書感興趣。將原數(shù)據(jù)進行清洗、轉(zhuǎn)換和集成,得到了滿足用戶需求的數(shù)據(jù)。

        3數(shù)據(jù)挖掘在數(shù)字圖書館上個性化服務(wù)的應(yīng)用

        3.1信息定制與信息推送

        數(shù)字圖書館的個性化服務(wù)就是數(shù)字圖書館針對不同用戶在不同的時間、地點,提供量身定制的服務(wù)。主要體現(xiàn)在用戶的個性化信息定制和信息推送服務(wù),都是利用用戶的注冊信息以及用戶的網(wǎng)頁訪問行為形成用戶個人數(shù)據(jù)庫,然后系統(tǒng)利用數(shù)據(jù)挖掘技術(shù)及其他信息處理技術(shù)挖掘用戶關(guān)注的信息,并發(fā)送給用戶。根據(jù)數(shù)字圖書館可更新性原則,系統(tǒng)會在未來的工作中實時更新用戶個人數(shù)據(jù)庫滿足用戶實時的信息獲取需求。

        3.2優(yōu)化信息檢索服務(wù)

        信息檢索是用戶與數(shù)字信息建立聯(lián)系的紐帶,在數(shù)字圖書館中應(yīng)用數(shù)據(jù)挖掘技術(shù),利用聚類算法將搜尋到的結(jié)果聚類分析,將提高信息檢索的效率。數(shù)據(jù)挖掘技術(shù)根據(jù)用戶的注冊信息、行為活動數(shù)據(jù),分析出用戶的數(shù)據(jù)需求,然后搜索引擎將用戶檢索的相關(guān)信息呈現(xiàn)給用戶。

        3.3優(yōu)化個性化服務(wù)系統(tǒng)流程

        用戶進入數(shù)字圖書館首先進行用戶信息注冊、登錄,這些與用戶的檢索記錄共同構(gòu)成用戶數(shù)據(jù)庫。系統(tǒng)對用戶數(shù)據(jù)庫進行數(shù)據(jù)挖掘,構(gòu)建“我的數(shù)字圖書館”。

        3.4促進信息資源的管理

        目前數(shù)字圖書館的文獻資源主要是電子圖書期刊,可利用聚類、關(guān)聯(lián)技術(shù)將圖書劃分為多組不同的類中,用戶在查閱圖書時,可關(guān)注和圖書處于同類的圖書,提高檢索效率;分析并歸納文獻資料里的最能概括文獻的關(guān)鍵詞及關(guān)鍵句作為文獻檢索的檢索詞,可快速檢索到同類別的資料;把文獻貼合主題的文本進行提取作為文獻的摘要,用戶可以通過摘要了解文章。

        4數(shù)字圖書館個性化服務(wù)存在的問題及對策

        4.1個性化信息的獲取來源少

        目前主要的數(shù)字圖書館信息來源有:用戶的注冊信息表、搜索時的關(guān)鍵詞、瀏覽、服務(wù)器日志信息等。信息獲取來源太少,可綜合應(yīng)用隱式獲取和顯示獲取收集個性化信息,建立完善的用戶評估及信息反饋機制。

        4.2用戶信息研究不深入

        用戶信息是個性化服務(wù)的基礎(chǔ),需要收集用戶的背景資料以及信息需求,然后對這些信息進行全面的分析,才能真正促進數(shù)字圖書館的個性化服務(wù)建設(shè)。

        4.3信息資源整合力度不足

        信息資源整合力度不足指的是信息資源處于無序狀態(tài),不能進行高效的信息結(jié)構(gòu)建設(shè)。需要以用戶為中心,針對用戶數(shù)據(jù)需求和用戶注冊信息來進行館內(nèi)資源建設(shè),通過整理用戶所有信息,提高信息資源的利用率。

        4.4信息安全存在隱患

        加強用戶隱私及網(wǎng)絡(luò)信息安全的建設(shè),提升用戶信任度并提交更多的個人信息,這些數(shù)據(jù)可支持數(shù)字圖書館為用戶提供更全面、更精確的個性化服務(wù)。

        4.5不斷創(chuàng)新信息檢索方式

        傳統(tǒng)的信息檢索方式得到的結(jié)果缺乏交互性、準確性、指向性,聯(lián)網(wǎng)信息內(nèi)容數(shù)據(jù)庫的各種檢索模式可以完全支持新概念系統(tǒng)檢索、關(guān)鍵詞檢索數(shù)據(jù)庫檢索、關(guān)聯(lián)數(shù)據(jù)檢索和句子數(shù)據(jù)庫檢索,并且可以使用聚類優(yōu)化算法來分析和聚類實際結(jié)果,使結(jié)果清晰條理的推送到用戶面前。

        4.6完善個性化推薦技術(shù)

        我國絕大多數(shù)數(shù)字圖書館仍以文獻搜索為主,這種非主動的服務(wù)方式為用戶提供的個性化服務(wù)是有限的,針對這一現(xiàn)象應(yīng)該完善個性化推薦技術(shù),將被動的提供搜索服務(wù)轉(zhuǎn)化為主動的提供推送服務(wù)。

        5結(jié)語

        在數(shù)字圖書館領(lǐng)域應(yīng)用數(shù)據(jù)挖掘技術(shù)使個性化服務(wù)建設(shè)又上了一個新臺階。數(shù)據(jù)挖掘技術(shù)在數(shù)字圖書館中的應(yīng)用,改變了數(shù)字圖書館被動服務(wù)的狀態(tài),為用戶提供了更多個性化信息服務(wù)和行動支持,推動了數(shù)字圖書館的現(xiàn)代化、個性化服務(wù)建設(shè)。

        參考文獻

        [1] ELIZABETH B. Integrating Digital Stewardship into Library Instruction: An Argument for Student (and Librarian) Success[J]. The Journal of Academic Librarianship,2020,46(1):102099.

        [2] 蔣秀麗.論高校圖書館個性化服務(wù)[J].中國多媒體與網(wǎng)絡(luò)教學學報,2020(3):108-109.

        [3] 王慧娜.數(shù)字圖書館個性化交互服務(wù)行為信息挖掘系統(tǒng)設(shè)計[J].現(xiàn)代電子技術(shù),2020,43(10):153-155,159.

        [4] 范宇.基于大數(shù)據(jù)的高校圖書館個性化服務(wù)路徑[J].吉林化工學院學報,2019,6(12):67-70.

        [5] 薩支斌,許震.基于個性化推送服務(wù)的數(shù)字圖書館學習資源提取[J].圖書與情報,2019(5):103-108.

        [6] ?李冬云.利用關(guān)聯(lián)規(guī)則挖掘技術(shù)實現(xiàn)數(shù)字圖書館個性化推薦服務(wù)[J].蘭臺內(nèi)外,2020(34):40-42.

        [7] 陳越.數(shù)字圖書館個性化信息服務(wù)模式分析[J].山西檔案,2019(3):94-96.

        3662500338241

        猜你喜歡
        數(shù)據(jù)挖掘
        基于數(shù)據(jù)挖掘的船舶通信網(wǎng)絡(luò)流量異常識別方法
        探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
        數(shù)據(jù)挖掘技術(shù)在打擊倒賣OBU逃費中的應(yīng)用淺析
        基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
        電力與能源(2017年6期)2017-05-14 06:19:37
        數(shù)據(jù)挖掘技術(shù)在中醫(yī)診療數(shù)據(jù)分析中的應(yīng)用
        一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
        數(shù)據(jù)挖掘在高校圖書館中的應(yīng)用
        數(shù)據(jù)挖掘的分析與探索
        河南科技(2014年23期)2014-02-27 14:18:43
        基于GPGPU的離散數(shù)據(jù)挖掘研究
        利用數(shù)據(jù)挖掘技術(shù)實現(xiàn)LIS數(shù)據(jù)共享的開發(fā)實踐
        成人影院视频在线免费观看| 在线看片国产免费不卡| 国产极品美女到高潮视频| 亚洲av成人永久网站一区| 亚洲自偷自拍另类第1页| 黑人巨大av在线播放无码| 2021年国产精品每日更新| 成年人视频在线播放麻豆| 国产乱人伦偷精品视频免观看| 亚洲人午夜射精精品日韩 | 7878成人国产在线观看| 亚洲人成无码网站十八禁| 国产精品毛片av毛片一区二区| 97se亚洲国产综合在线| 少妇被爽到高潮动态图| 日本高清色惰www在线视频| 97人妻中文字幕总站| 欧美噜噜久久久xxx| 国产真人无码作爱视频免费| 亚洲国产成人精品激情| 亚洲精品中文字幕乱码无线| 乱码1乱码2美美哒| 日韩精品无码久久久久久| 亚洲图片第二页| 麻神在线观看免费观看| 国内精品卡一卡二卡三| 精品国产AⅤ无码一区二区| 日本一区二区三区精品不卡| 亚洲国产精品成人久久久| 欧美freesex黑人又粗又大| 免费va国产高清不卡大片| 亚洲中文字幕第15页| 成年女人a毛片免费视频| 国产乱视频| 青青草视频在线免费观看91| 久久久久亚洲精品男人的天堂| 欧美老熟妇欲乱高清视频| 亚欧视频无码在线观看| 国产一区二区三区在线大屁股| 欧美寡妇xxxx黑人猛交| 亚洲精品美女久久久久久久|