亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        數(shù)據(jù)挖掘技術(shù)在圖書館中的應(yīng)用研究

        2023-04-05 07:55:03王偉聰
        科技資訊 2023年3期
        關(guān)鍵詞:數(shù)據(jù)挖掘圖書圖書館

        王偉聰

        (三亞學院圖書館 海南三亞 572000)

        就圖書館發(fā)展歷程而言,其經(jīng)歷了印刷紙張、自動化集成到數(shù)字化等發(fā)展階段。圖書館作為信息存儲、信息服務(wù)的中心,在信息化浪潮中逐步累積了海量的信息資源。隨著社會的不斷發(fā)展,圖書館需要不斷創(chuàng)新發(fā)展,為讀者提供更為優(yōu)質(zhì)的服務(wù),滿足讀者不斷提升的圖書借閱、信息獲取需求。數(shù)據(jù)挖掘技術(shù)是一項新興的計算機信息技術(shù),可依托相應(yīng)方式分析出有價值的信息,因而近年來在眾多行業(yè)領(lǐng)域得到廣泛推廣,其中也包括在圖書館中的應(yīng)用。數(shù)據(jù)挖掘技術(shù)的出現(xiàn),讓圖書館各項管理服務(wù)工作得到了有效改善,通過數(shù)據(jù)挖掘技術(shù)可從數(shù)據(jù)庫中提煉出未知的、有價值的信息,進而為讀者提供更優(yōu)質(zhì)的服務(wù),讓讀者可以結(jié)合自身需求高效便捷地獲取信息資源,并推動圖書館資源的有效利用[1]。因此,該文將對數(shù)據(jù)挖掘技術(shù)在圖書館中的應(yīng)用進行研究分析。

        1 圖書館工作相關(guān)概述

        圖書館工作主要涉及館藏系統(tǒng)、工作系統(tǒng)、讀者系統(tǒng)等多個方面。隨著現(xiàn)代信息技術(shù)的不斷發(fā)展與應(yīng)用,圖書館各系統(tǒng)可集成至一個共有系統(tǒng)中,并產(chǎn)生大量的數(shù)據(jù)信息,基于這些數(shù)據(jù)信息開展圖書館工作,將使圖書館工作質(zhì)量、效率得到有效提升。需要注意的是,現(xiàn)階段圖書館各項工作開展中仍存在一系列問題,如圖書館圖書管理、利用效率不足;不少書目、文獻缺乏實用性或大部分讀者喜愛的書目數(shù)量有限,難以滿足讀者的需求等。因此,有必要引入先進技術(shù),為圖書館各項工作提供支持,提升圖書館整體的管理質(zhì)量、服務(wù)水平。

        2 數(shù)據(jù)挖掘技術(shù)相關(guān)概述

        2.1 數(shù)據(jù)挖掘技術(shù)

        隨著科學技術(shù)的飛速發(fā)展,信息加工處理逐漸成為信息化的重要技術(shù)支撐?,F(xiàn)如今,眾多行業(yè)領(lǐng)域的問題均可通過數(shù)據(jù)挖掘技術(shù)進行解決,數(shù)據(jù)挖掘技術(shù)在人們生產(chǎn)生活中得到越來越廣泛的應(yīng)用。數(shù)據(jù)挖掘技術(shù)主要是指基于海量的數(shù)據(jù)信息,依托一系列技術(shù)應(yīng)用及模型構(gòu)建以開展既有數(shù)據(jù)分析處理,進而建立起一個預(yù)測性的模型及相關(guān)系統(tǒng)。作為一項新興的計算機信息技術(shù),數(shù)據(jù)挖掘技術(shù)通過對數(shù)據(jù)信息的加工處理,可為相關(guān)人員做出合理的工作選擇及決策提供有效幫助。

        2.2 數(shù)據(jù)挖掘技術(shù)類型

        依據(jù)數(shù)據(jù)結(jié)構(gòu)方式不同,可將數(shù)據(jù)挖掘技術(shù)劃分為以下幾種類型。

        2.2.1 文本數(shù)據(jù)挖掘

        文本數(shù)據(jù)挖掘指的是利用計算機技術(shù)從文本數(shù)據(jù)中挖掘出有價值的數(shù)據(jù)信息。文本數(shù)據(jù)挖掘一般可分為文本信息挖掘、文檔類信息挖掘這兩種,對于文本數(shù)據(jù)挖掘而言,主要涉及對文本信息特征的提取、對文本信息進行分類以及對文本數(shù)據(jù)進行分析等。在對文本數(shù)據(jù)挖掘開展應(yīng)用過程中,通常會應(yīng)用到詞串表示法、詞集合算法、貝葉斯分類算法等技術(shù)手段,以此為數(shù)據(jù)信息相關(guān)工作提供有力支持[2]。

        2.2.2 Web數(shù)據(jù)挖掘

        根本上而言,Web 數(shù)據(jù)挖掘即為數(shù)據(jù)挖掘技術(shù)在Web頁面的應(yīng)用,主要涉及了對Web數(shù)據(jù)等數(shù)據(jù)信息,諸如用戶信息、Web 頁面結(jié)構(gòu)等數(shù)據(jù)信息,開展提煉、優(yōu)化頁面設(shè)置,了解訪問用戶行為、內(nèi)容。通過Web數(shù)據(jù)挖掘,可為用戶提供一系列更為優(yōu)質(zhì)的服務(wù),并基于服務(wù)目的及服務(wù)內(nèi)容的不同,對不同個體開展差異化挖掘,主要包括Web日志挖掘、Web內(nèi)容挖掘以及Web架構(gòu)挖掘等。

        2.2.3 數(shù)值數(shù)據(jù)挖掘

        數(shù)值數(shù)據(jù)挖掘主要是指對數(shù)值數(shù)據(jù)進行挖掘,主要作用于描述數(shù)值數(shù)據(jù)、預(yù)測數(shù)值數(shù)據(jù)。數(shù)值數(shù)據(jù)挖掘可實現(xiàn)概念描述功能,并著重開展分類分析、預(yù)測分析,常見應(yīng)用方法包括有遺傳算法、歸納法以及模糊數(shù)學方法等。

        3 數(shù)據(jù)挖掘技術(shù)在圖書館中的應(yīng)用優(yōu)勢

        3.1 助力圖書館資源建設(shè)管理

        長期以來,資源建設(shè)管理一直是圖書館工作中的重要一環(huán),其對圖書館所提供資源的質(zhì)量有重要影響,決定著圖書館資源可否滿足讀者的實際需求。隨著如今圖書館信息化建設(shè)的不斷推進,不論是傳統(tǒng)紙質(zhì)資源還是數(shù)字資源,都需要通過信息化管理??傮w而言,圖書館資源建設(shè)管理重中之重在于滿足讀者閱讀需求,保障資源管理質(zhì)量、效率兩大方面。通過對數(shù)據(jù)挖掘技術(shù)的應(yīng)用,圖書館資源建設(shè)管理在以下兩方面均得到有效優(yōu)化,進一步為圖書館可持續(xù)健康發(fā)展提供有力支持。首先,在滿足讀者閱讀需求方面,圖書館應(yīng)建立起對讀者閱讀需求的有效認識,除了要滿足大多數(shù)讀者的閱讀需求,還應(yīng)就少許讀者提供相應(yīng)資源,盡可能讓每位讀者都可獲取到自身需求的資源[3]。數(shù)據(jù)挖掘技術(shù)在圖書館中的應(yīng)用,可幫助圖書館更為全面深入、高效便捷地挖掘讀者相關(guān)信息,有效了解讀者閱讀需求,有針對性地進行圖書采購、數(shù)字資源購置等工作,推進圖書館資源建設(shè)管理。其次,在提升圖書館資源管理質(zhì)量、效率方面,數(shù)據(jù)挖掘技術(shù)同樣有著十分突出的應(yīng)用優(yōu)勢。在當前信息化時代下,圖書館資源數(shù)量不斷增多,同時資源類型不斷趨于多元化、復(fù)雜化,由此一定程度上加大了資源管理難度,傳統(tǒng)管理模式不足以實現(xiàn)對各項資源的高質(zhì)高效管理。數(shù)據(jù)挖掘技術(shù)的應(yīng)用可深入分析資源內(nèi)在聯(lián)系,繼而完善資源管理邏輯,實現(xiàn)對資源的高質(zhì)高效管理。

        3.2 提升圖書館服務(wù)水平

        提升圖書館服務(wù)水平不僅是如今圖書館發(fā)展的大方向,還是圖書館充分秉持人本理念,使廣大讀者獲得更優(yōu)質(zhì)借閱體驗的重中之重。特別是隨著近年來個性化服務(wù)的不斷發(fā)展應(yīng)用,可就不同讀者提供更為滿足他們需求的服務(wù),全面提升讀者的滿意度。在圖書館傳統(tǒng)服務(wù)管理模式下,個性化服務(wù)并不易于實現(xiàn),究其原因主要在于缺乏對讀者信息、需求等的有效了解,難以為每位讀者提供有針對性的服務(wù)。圖書館通過對數(shù)據(jù)挖掘技術(shù)的有效應(yīng)用,針對在圖書館開展借閱或使用網(wǎng)上圖書館的讀者開展全面采集挖掘,全面深入了解每位讀者的實際需求,并為每位讀者建立特定的個性化數(shù)據(jù)庫,進一步依托個性化消息推送等方式,為讀者提供更有針對的、個性化的借閱服務(wù)[4]。

        4 新時期圖書館面臨的主要問題

        4.1 圖書資源利用率不足

        圖書資源利用率不足作為現(xiàn)階段圖書館廣泛存在的問題,一些地方在建設(shè)圖書館時,一味地追求增加圖書館館藏圖書數(shù)量,但對其基本職能,也就是服務(wù)讀者的職能,卻缺乏有效關(guān)注。比如:對一項熱門的書籍或前沿的技術(shù)資料,往往在最初上架時便被借閱一空,而一些冷門書籍在書架上則常年無人問津?,F(xiàn)如今,圖書館已然成為學生的自習室,學生在圖書館占位并非為了借閱圖書進行閱讀,而更多是進行與自身學業(yè)相關(guān)的學習,這一定程度上違背了圖書館建設(shè)的初衷。除此之外,圖書館工作人員在采購圖書時,由于缺乏對讀者反饋信息的有效掌握,因而難以有效滿足讀者需求。雖然有讀者會進行反饋,但因為信息反饋不及時,造成該工作難以進行及時調(diào)整。

        4.2 管理技術(shù)難以跟上時代腳步

        在圖書館運營發(fā)展中,表現(xiàn)出管理技術(shù)難以跟上時代前進腳步的問題。新時期,網(wǎng)絡(luò)信息技術(shù)、移動終端設(shè)備迅猛發(fā)展,為圖書館管理工作提出了更為嚴格的要求。一些圖書館還未能實現(xiàn)圖書信息管理數(shù)字化,讀者需要在圖書館進行圖書檢索,難以通過網(wǎng)絡(luò)平臺進行檢索,同時也難以通過網(wǎng)絡(luò)獲取最新的圖書信息及文獻資料。除此之外,圖書借閱、歸還仍偏向于人工方式,自動借閱及歸還功能不完善,讀者獲得的閱讀體驗不佳。

        4.3 圖書館個性化服務(wù)水平不足

        現(xiàn)階段,圖書館大多采用的是匯文文獻信息服務(wù)系統(tǒng),可為讀者提供相應(yīng)的推薦服務(wù),系統(tǒng)也配有數(shù)據(jù)挖掘工具,可通過算法為讀者推送相應(yīng)的全文鏈接、專題報告等,還可通過數(shù)據(jù)分析及相關(guān)算法,對當前系統(tǒng)中的數(shù)據(jù)開展簡單統(tǒng)計。然而其數(shù)據(jù)挖掘、統(tǒng)計分析仍停留在相對淺層次的階段,在實際應(yīng)用及讀者體驗中仍缺乏充分體現(xiàn),同時對信息檢索能力的提升也不明顯。數(shù)據(jù)挖掘在這一系統(tǒng)中的價值并未得到充分發(fā)揮,如今一些圖書館的管理系統(tǒng)還具備集成數(shù)據(jù)分析功能。

        5 數(shù)據(jù)挖掘技術(shù)在圖書館中的應(yīng)用路徑

        5.1 在圖書館圖書管理中的應(yīng)用

        數(shù)據(jù)挖掘技術(shù)在圖書館圖書管理中的應(yīng)用,主要可從以下幾方面工作入手。

        (1)在圖書館圖書采購管理中的應(yīng)用。圖書采購管理作為圖書館資源建設(shè)的重要一環(huán),唯有依托科學合理的采購管理,圖書館資源方可切實滿足廣大讀者的多元需求,讓每位讀者均可在圖書館獲取到自身需求的信息資源??傮w而言,圖書館圖書采購管理一般需要考慮讀者需求、自身發(fā)展方向兩方面內(nèi)容,在此過程中,圖書館應(yīng)借助數(shù)據(jù)挖掘技術(shù)對讀者相關(guān)信息進行全面充分挖掘,進而從海量數(shù)據(jù)信息中有效掌握讀者需求,為圖書采購管理工作開展提供可靠依據(jù)。同時,圖書館還應(yīng)借助數(shù)據(jù)挖掘技術(shù)對政策信息、市場進行深度挖掘,綜合分析為自身建設(shè)特色圖書館提供可靠數(shù)據(jù)支持,進一步以頗具特色的資源打造獨特的圖書館品牌。

        (2)在圖書館文獻管理中的應(yīng)用。通過對數(shù)據(jù)挖掘技術(shù)的有效應(yīng)用,可顯著提升圖書館文獻利用效率,依托對文獻的優(yōu)化管理,以提升文獻重復(fù)利用效率,同時對于使用率偏低的文獻資源,可依托結(jié)構(gòu)性優(yōu)化對相關(guān)文獻資源采取收藏、淘汰等手段,做到恰當處理[5]。

        (3)在圖書館文獻排架工作中的應(yīng)用。圖書館傳統(tǒng)排架方式大多為依據(jù)書目的分類號開展排架,該種排架方式為圖書使用帶來了一定便利,但并非最佳的書目排架方式。基于數(shù)據(jù)挖掘技術(shù)可實現(xiàn)圖書排架方式的有效創(chuàng)新,讓讀者閱讀圖書變得更為便捷。實踐表明,基于數(shù)據(jù)挖掘技術(shù)開展圖書排架,可為提供趨于個性化的閱讀選擇,提升圖書資源的使用效率。

        5.2 在圖書館信息化建設(shè)中的應(yīng)用

        信息化時代背景下,圖書館不斷提高對信息化建設(shè)的重視度,并通過投入大量的人力、物力、財力,以推進圖書館信息化建設(shè)。圖書館信息化建設(shè)一項復(fù)雜的系統(tǒng)工作,不僅體現(xiàn)在硬件設(shè)備建設(shè)方面,還體現(xiàn)在信息化資源及信息化功能的建設(shè)完善。數(shù)據(jù)挖掘技術(shù)在圖書館中的應(yīng)用,同樣可為圖書館信息化建設(shè)管理提供有力支持,并重要體現(xiàn)于硬件設(shè)備、數(shù)字資源、信息化功能等方面。首先,圖書館應(yīng)加大數(shù)據(jù)挖掘力度,對圖書館信息化發(fā)展、傳統(tǒng)管理模式進行全面比較研究,綜合分析并建立科學合理的發(fā)展規(guī)劃,開展好硬件設(shè)備建設(shè)工作,為圖書館信息化建設(shè)提供基礎(chǔ)支持。其次,圖書館還應(yīng)加大數(shù)字資源建設(shè)管理力度,一方面要從網(wǎng)絡(luò)渠道購置引入更多樣、更豐富的數(shù)字資源,還應(yīng)加強途徑傳統(tǒng)紙質(zhì)資源向數(shù)字資源的轉(zhuǎn)化,并借助數(shù)據(jù)挖掘技術(shù)對該過程進行全面管理,有效發(fā)現(xiàn)數(shù)字資源中存在的不足并進行改進。再次,圖書館還應(yīng)借助數(shù)據(jù)挖掘技術(shù)對圖書館信息化功能予以建設(shè)完善,深度挖掘全球范圍內(nèi)優(yōu)秀圖書館信息化功能、讀者需求及數(shù)字圖書館相關(guān)數(shù)據(jù)信息,不斷優(yōu)化圖書館信息化功能。比如:利用數(shù)據(jù)挖掘技術(shù),打造科學適用的Web導(dǎo)航平臺。Web信息量有著繁雜、無序的特征,對Web中的信息開展全面充分篩選存在不小的難題?;诖?,對讀者搜索的關(guān)鍵詞、瀏覽資源類型與大小及瀏覽時長等,Web 日志應(yīng)對其開展全面分析并提煉其中的聯(lián)系,同時,借助authority方法對相應(yīng)學科的權(quán)威頁面開展挖掘,以提取Web站點訪問路徑,接著對圖書館網(wǎng)頁鏈接予以有效調(diào)整,為讀者有效了解學科發(fā)展趨勢及獲取學科前沿知識創(chuàng)造有效便利[6]。

        5.3 在圖書館個性化服務(wù)中的應(yīng)用

        新時期,圖書館已經(jīng)不再局限于為讀者提供信息查詢、信息反饋等單一服務(wù),而需要結(jié)合讀者的實際需求、興趣偏好等,主動向讀者提供個性化的信息服務(wù)。對于數(shù)據(jù)挖掘技術(shù)在圖書館個性化服務(wù)中的應(yīng)用,可從以下幾方面內(nèi)容入手。

        (1)確立數(shù)據(jù)挖掘目標,并建立數(shù)據(jù)庫。確立數(shù)據(jù)挖掘目標使開展數(shù)據(jù)挖掘的首要環(huán)節(jié),依托分析讀者的實際需求,建立有效且合理的數(shù)據(jù)挖掘目標。在確立完畢數(shù)據(jù)挖掘目標后,即轉(zhuǎn)投數(shù)據(jù)準備工作,即為從海量數(shù)據(jù)信息中提煉一個與目標相關(guān)聯(lián)的樣板數(shù)據(jù)子集,并基于此建立一個儲存各類數(shù)據(jù)挖掘需求數(shù)據(jù)的數(shù)據(jù)庫。將數(shù)據(jù)挖掘技術(shù)應(yīng)用于圖書館個性化服務(wù)中,首要步驟即為建立兩個數(shù)據(jù)庫,分別為讀者數(shù)據(jù)庫和圖書館特色資源數(shù)據(jù)庫,例如:讀者接受圖書館服務(wù)時,會留下借閱記錄、網(wǎng)站訪問痕跡等數(shù)據(jù),這些數(shù)據(jù)蘊藏著大量有用的信息[7]。

        (2)分析調(diào)整數(shù)據(jù)庫中的數(shù)據(jù)。在數(shù)據(jù)庫建立完畢后,需要對兩個數(shù)據(jù)庫中的數(shù)據(jù)進行分析調(diào)整。如果原始數(shù)據(jù)質(zhì)量偏低,則盡管建立的數(shù)據(jù)模型很可靠,也會對最終預(yù)測結(jié)果造成不利影響。因此,需要對數(shù)據(jù)庫中的數(shù)據(jù)開展抽取、清洗、轉(zhuǎn)換等工作。其中,數(shù)據(jù)抽取即為搜索出與數(shù)據(jù)挖掘目標相關(guān)的各類數(shù)據(jù)信息,數(shù)據(jù)清洗是指對數(shù)據(jù)重復(fù)記錄等予以消除,并對計算缺值數(shù)據(jù)開展推到。數(shù)據(jù)轉(zhuǎn)換是指對數(shù)據(jù)維數(shù)開展精減,由數(shù)據(jù)初始特征中提煉有價值的部分特征,以此有效縮減在數(shù)據(jù)挖掘中要考慮的變量數(shù)。

        (3)選取適用的算法,建立相關(guān)數(shù)據(jù)挖掘模型。針對挖掘中的某項任務(wù),往往可采用不同的算法。為此,應(yīng)結(jié)合數(shù)據(jù)特征及實際運行系統(tǒng)要求或讀者需求,來進行算法選擇,比如:有的讀者需求的是預(yù)成型知識,有的讀者需求的是描述型知識或者易于理解的知識等。在選擇完畢算法后,繼而要建立相關(guān)的數(shù)據(jù)挖掘模型,也就是依托聚類、分類且采用時序模型,提煉出讀者個性化、普遍性需求,接著對關(guān)聯(lián)規(guī)則模型開展構(gòu)建。需要注意的是,對于建立的相關(guān)模型,還應(yīng)開展必要的驗證、試用,以此選定能有效解決目標問題的最理想模型[8]。

        (4)數(shù)據(jù)挖掘結(jié)果處理。在采用算法規(guī)則建立數(shù)據(jù)挖掘模型后,還應(yīng)利用這一算法再開展計算,進一步獲取數(shù)據(jù)挖掘結(jié)果。圖書館應(yīng)當對結(jié)果開展可視化處理,即為將抽象的數(shù)據(jù)結(jié)果轉(zhuǎn)化成易于理解的結(jié)果,進而一方面為圖書館制定管理決策提供依據(jù),另一方面為讀者提供更優(yōu)質(zhì)的服務(wù)。

        6 結(jié)語

        綜上所述,圖書館作為一項公共基礎(chǔ)設(shè)施,是教育事業(yè)中不可或缺的部分,是公眾獲取信息資源的重要方式,依托數(shù)據(jù)挖掘技術(shù)有效發(fā)現(xiàn)圖書館各項管理服務(wù)工作中存在的問題,將其應(yīng)用于圖書館管理,應(yīng)用于圖書館信息化建設(shè)中,應(yīng)用于圖書館個性化服務(wù)中,對推動圖書館的可持續(xù)健康發(fā)展具有十分積極的意義。

        猜你喜歡
        數(shù)據(jù)挖掘圖書圖書館
        探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
        圖書推薦
        南風(2020年22期)2020-09-15 07:47:08
        歡迎來到圖書借閱角
        圖書館
        小太陽畫報(2018年1期)2018-05-14 17:19:25
        班里有個圖書角
        基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
        電力與能源(2017年6期)2017-05-14 06:19:37
        飛躍圖書館
        一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
        去圖書館
        基于GPGPU的離散數(shù)據(jù)挖掘研究
        久久久精品网站免费观看| 99久久超碰中文字幕伊人| 欧美 国产 综合 欧美 视频| 88国产精品视频一区二区三区| 波多野结衣一区二区三区视频| 中文字幕国内一区二区| 国产成人亚洲精品91专区高清 | 欧洲美女黑人粗性暴交视频| 丁香六月久久婷婷开心| 美女大量吞精在线观看456| 综合久久久久6亚洲综合| 国产精品亚洲精品专区| 丝袜美腿福利一区二区| 337p人体粉嫩胞高清视频| 精品国精品无码自拍自在线| 国产成人一区二区三区高清| 日韩产的人妻av在线网 | 亚洲av午夜精品无码专区| 成人爽a毛片在线视频| 人妻AV无码一区二区三区奥田咲| 免费观看成人稀缺视频在线播放 | 九九久久精品大片| 日本一区二区在线播放| av网站在线观看入口| 日韩视频中文字幕精品偷拍| 中文幕无线码中文字蜜桃| 青青草一级视频在线观看| 久久综合精品国产丝袜长腿| 国产精品无码一区二区三区电影 | 视频在线观看一区二区三区| 色婷婷亚洲一区二区在线| 国产剧情一区二区三区在线 | 欧美日韩色另类综合| 国产成人av在线影院无毒| 欧美黑人巨大xxxxx| 午夜国产精品视频免费看电影| 亚洲精品456在线播放狼人| 老妇高潮潮喷到猛进猛出| 全部孕妇毛片丰满孕妇孕交| 欧美精品偷自拍另类在线观看| 少妇av免费在线播放|