亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        數(shù)據(jù)挖掘技術(shù)在高校圖書(shū)館管理中的應(yīng)用探討

        2018-09-03 03:47:26王承忠
        智富時(shí)代 2018年7期
        關(guān)鍵詞:聚類分析數(shù)據(jù)挖掘

        王承忠

        【摘 要】對(duì)于高校而言,圖書(shū)館不僅是學(xué)生和教師閱讀、查閱各類文獻(xiàn)資料的地方,同時(shí)也承擔(dān)著學(xué)校教學(xué)和科研服務(wù)的重要任務(wù)。數(shù)據(jù)挖掘技術(shù)對(duì)數(shù)據(jù)信息的深加工作用在傳統(tǒng)圖書(shū)館向數(shù)字化圖書(shū)館的轉(zhuǎn)型過(guò)程中發(fā)揮了重要作用,其不僅可提高高校圖書(shū)館的服務(wù)質(zhì)量,同時(shí)還可促進(jìn)資源配置利用率的提高,于圖書(shū)館自身管理的完善也十分有利。

        【關(guān)鍵詞】數(shù)據(jù)挖掘;聚類分析;讀者群體;借閱排名

        一、數(shù)據(jù)挖掘技術(shù)概述

        數(shù)據(jù)挖掘是從特定形式的數(shù)據(jù)集中提煉知識(shí)的過(guò)程,其在各行各業(yè)中均取得了良好的應(yīng)用效果,且已然成為了國(guó)內(nèi)外的研究熱點(diǎn)。目前常用的挖掘技術(shù)有數(shù)據(jù)挖掘、Web數(shù)據(jù)挖掘、文本挖掘這三個(gè)類型。

        (一)數(shù)據(jù)挖掘

        面向數(shù)值數(shù)據(jù)的挖掘技術(shù)稱之為數(shù)據(jù)挖掘,關(guān)聯(lián)分析、聚類分析、分類、預(yù)測(cè)、時(shí)序模式和偏差分析等稱之為數(shù)據(jù)挖掘。數(shù)據(jù)挖掘技術(shù)的水平對(duì)所發(fā)現(xiàn)知識(shí)的質(zhì)量有著最直接的影響,目前應(yīng)用較廣泛的數(shù)據(jù)挖掘方法有關(guān)聯(lián)分析法,人工神經(jīng)元網(wǎng)絡(luò)、決策樹(shù)和遺傳算法等,對(duì)這些方法的研究主要集中在算法與其具體應(yīng)用等領(lǐng)域。

        (二)Web數(shù)據(jù)挖掘

        Web數(shù)據(jù)挖掘的主要對(duì)象是包括Web頁(yè)面內(nèi)容、頁(yè)面之間結(jié)構(gòu)、用戶訪問(wèn)信息、商務(wù)交易信息等在內(nèi)的各種Web數(shù)據(jù),人們借助這一技術(shù)可短不僅可從萬(wàn)維網(wǎng)中有效提取知識(shí),還可改進(jìn)站點(diǎn)設(shè)計(jì),為電子商務(wù)的更好開(kāi)展提供服務(wù)。

        (三)文本數(shù)據(jù)挖掘

        文本數(shù)據(jù)的挖掘?qū)ο笾饕俏谋拘畔?,主要工作?nèi)容包括特征提取、文本摘要、文本分類與聚類、概念操作以及探索新數(shù)據(jù)分析等,具體技術(shù)手段則有詞頻反文獻(xiàn)頻率向量表示法、詞串表示法以及貝葉斯分類算法、詞集合算法和文本聚類算法、K-最近鄰參照分類算法等。

        二、數(shù)據(jù)挖掘技術(shù)的應(yīng)用對(duì)高校圖書(shū)館的意義

        擴(kuò)招使得高校生源不斷擴(kuò)大,高校圖書(shū)館的讀者數(shù)量也日益龐大。與此同時(shí),高校圖書(shū)館的借閱記錄以及館藏?cái)?shù)據(jù)的存儲(chǔ)積累均呈不斷增加的發(fā)展趨勢(shì)。然而,這些海量數(shù)據(jù)的質(zhì)量魚(yú)龍混雜,不僅包含對(duì)管理者與決策者真正有價(jià)值的信息,同時(shí)也有不少落后的、無(wú)用的、錯(cuò)誤的信息,因此數(shù)據(jù)分析和挖掘工作十分重要。

        (一)數(shù)據(jù)挖掘可提高高校圖書(shū)館的決策能力

        借助數(shù)據(jù)挖掘技術(shù),高校圖書(shū)館管理者可對(duì)挖掘出的有用數(shù)據(jù)信息進(jìn)行進(jìn)一步分析與研究,進(jìn)而可促進(jìn)自身決策能力的提高。例如,我們可利用數(shù)據(jù)挖掘技術(shù)來(lái)分析圖書(shū)借閱情況,進(jìn)而可探究出讀者的讀書(shū)喜好和借閱習(xí)慣,并在此基礎(chǔ)上總結(jié)出讀者的借閱規(guī)律,如此即可為日后的圖書(shū)館管理工作提供有效的依據(jù)。

        (二)數(shù)據(jù)挖掘可為圖書(shū)采購(gòu)工作提供指導(dǎo)性意見(jiàn)

        通過(guò)數(shù)據(jù)挖掘技術(shù)分析讀者的喜好,我們可對(duì)圖書(shū)館的下一步采購(gòu)工作進(jìn)行科學(xué)預(yù)測(cè),圖書(shū)采購(gòu)行為將更加科學(xué)合理。傳統(tǒng)圖書(shū)館管理中,采購(gòu)人員都是通過(guò)主觀判斷來(lái)決定采購(gòu)什么類型的圖書(shū),這無(wú)疑不利于圖書(shū)館的運(yùn)行與發(fā)展。

        (三)數(shù)據(jù)挖掘可為讀者提供更為個(gè)性化的服務(wù)

        不同的讀者有不同的閱讀需求,這要求高校圖書(shū)館為其提供不同的閱讀服務(wù)。數(shù)據(jù)挖掘技術(shù)可通過(guò)數(shù)據(jù)分析設(shè)置不同的服務(wù)標(biāo)準(zhǔn),進(jìn)而可為讀者提供更為個(gè)性化的服務(wù)。這樣一來(lái),高校圖書(shū)館的服務(wù)質(zhì)量得以提升,讀者的閱讀興趣也更為濃厚。

        三、數(shù)據(jù)挖掘技術(shù)在高校圖書(shū)館管理中的應(yīng)用設(shè)計(jì)

        基于上述章節(jié)對(duì)數(shù)據(jù)挖掘技術(shù)應(yīng)用對(duì)高校圖書(shū)館意義的分析,我們應(yīng)進(jìn)一步重視數(shù)據(jù)挖掘技術(shù)在高校圖書(shū)館管理中的應(yīng)用。本章節(jié)筆者將重點(diǎn)介紹基于數(shù)據(jù)挖掘技術(shù)的高校圖書(shū)館管理系統(tǒng)設(shè)計(jì)。

        (一)信息系統(tǒng)總體框架

        高校圖書(shū)館管理系統(tǒng)在應(yīng)用數(shù)據(jù)挖掘技術(shù)時(shí),可以高校圖書(shū)館的網(wǎng)站系統(tǒng)為基礎(chǔ)。從北郵、銀博等現(xiàn)有的圖書(shū)管理系統(tǒng)來(lái)看,基本都采用三層結(jié)構(gòu)體系設(shè)計(jì),即用戶界面層、業(yè)務(wù)邏輯層與數(shù)據(jù)訪問(wèn)層。由一系列交互頁(yè)面組成的用戶界面層的主要功能在于幫助用戶實(shí)現(xiàn)對(duì)圖書(shū)館網(wǎng)站的訪問(wèn)以及幫助管理者獲取訪問(wèn)者的實(shí)際需求信息。我們常用的用戶注冊(cè)與登錄、圖書(shū)資源搜索與預(yù)定、圖書(shū)智能推薦等等模塊均屬于業(yè)務(wù)邏輯層的內(nèi)容,其主要功能在于實(shí)現(xiàn)應(yīng)用程序的業(yè)務(wù)功能。數(shù)據(jù)訪問(wèn)則不僅可提供外部數(shù)據(jù)庫(kù)的訪問(wèn)服務(wù),同時(shí)還具備查詢、插入、刪除和修改數(shù)據(jù)庫(kù)中各類型數(shù)據(jù)的作用。

        (二)圖書(shū)館管理數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì)

        數(shù)據(jù)庫(kù)是信息管理系統(tǒng)實(shí)現(xiàn)數(shù)據(jù)挖掘功能的基礎(chǔ),因此其設(shè)計(jì)在高校圖書(shū)館信息管理系統(tǒng)中至關(guān)重要。注冊(cè)認(rèn)證庫(kù)與圖書(shū)館信息庫(kù)共同組成了高校圖書(shū)館數(shù)據(jù)庫(kù),而圖書(shū)館信息庫(kù)又包括圖書(shū)信息、讀者信息、圖書(shū)借閱歷史列表、出版信息實(shí)體以及管理員采購(gòu)圖書(shū)清單、用戶圖書(shū)預(yù)定需求單和新購(gòu)圖書(shū)單等內(nèi)容。因此,高校圖書(shū)館數(shù)據(jù)庫(kù)里的數(shù)據(jù)十分龐雜。為提高圖書(shū)館管理系統(tǒng)的數(shù)據(jù)能力,所有SQL的調(diào)用都應(yīng)使用存儲(chǔ)過(guò)程來(lái)完成,使用參數(shù)進(jìn)行數(shù)據(jù)傳遞可為系統(tǒng)安全提供重要保障。

        (三)聚類分析應(yīng)用

        高校圖書(shū)館管理系統(tǒng)中的數(shù)據(jù)挖掘模塊在挖掘出有用信息后可將數(shù)據(jù)結(jié)構(gòu)存儲(chǔ)下來(lái),這就是數(shù)據(jù)挖掘技術(shù)在高校圖書(shū)館聚類分析中的具體應(yīng)用,該技術(shù)手段可為圖書(shū)館采購(gòu)資金的合理分配提供科學(xué)依據(jù)。通常而言,我們?cè)谠O(shè)計(jì)高校圖書(shū)館管理系統(tǒng)的聚類分析時(shí)需實(shí)現(xiàn)讀者聚類與圖數(shù)聚類這兩個(gè)方面。所謂讀者聚類,也就是依據(jù)讀者的使用情況進(jìn)行讀者群劃分;圖書(shū)聚類獲得有價(jià)值信息的方式則是根據(jù)圖書(shū)被借閱的次數(shù)進(jìn)行聚類分析。

        四、數(shù)據(jù)挖掘技術(shù)對(duì)高校圖書(shū)館帶來(lái)的挑戰(zhàn)

        如前文所述,數(shù)據(jù)挖掘技術(shù)的應(yīng)用與發(fā)展有利于高校圖書(shū)館決策能力的提高,同時(shí)還可為圖書(shū)采購(gòu)提供科學(xué)依據(jù),為讀者提供更為個(gè)性化的服務(wù)。但在實(shí)際應(yīng)用中,數(shù)據(jù)挖掘技術(shù)仍給高校圖書(shū)館帶來(lái)了諸多挑戰(zhàn)。

        (一)從異構(gòu)數(shù)據(jù)源中挖掘信息

        異構(gòu)數(shù)據(jù)源也就是多個(gè)不同的相關(guān)的數(shù)據(jù)源系統(tǒng)的集合。數(shù)據(jù)挖掘技術(shù)需從高校圖書(shū)館中繁雜的信息中挖掘出所需的信息,然后再對(duì)其進(jìn)行分析與綜合,經(jīng)過(guò)這一系列過(guò)程方可得出真正有價(jià)值的信息與知識(shí)?;ヂ?lián)網(wǎng)時(shí)代的到來(lái)使得信息技術(shù)更新速度不斷加快,各種高新技術(shù)日新月異、層出不窮,這一現(xiàn)實(shí)背景對(duì)圖書(shū)館管理者及信息系統(tǒng)技術(shù)人員的專業(yè)素養(yǎng)提出了更高的要求,只有掌握多種新興技術(shù)才能有效構(gòu)建起具有多種數(shù)據(jù)源構(gòu)成的分布式異構(gòu)數(shù)據(jù)庫(kù),才能有效完成數(shù)據(jù)挖掘工作。

        (二)不同表現(xiàn)形式的數(shù)據(jù)挖掘結(jié)果

        從目前來(lái)看,高校圖書(shū)館通過(guò)數(shù)據(jù)挖掘技術(shù)所獲得的數(shù)據(jù)仍具有較大的不確定性,因此數(shù)據(jù)挖掘所獲得的結(jié)果類型諸多,表現(xiàn)形式也不盡相同。在系統(tǒng)應(yīng)用中,用戶極有可能會(huì)提出要挖掘不同信息與知識(shí)的要求,此時(shí)就需要系統(tǒng)技術(shù)人員從更大規(guī)模的數(shù)據(jù)集中挖掘出更多的不同形式的結(jié)果。

        (三)在不同抽象層次上進(jìn)行交互式挖掘

        我們?cè)趶囊粋€(gè)大規(guī)模的數(shù)據(jù)庫(kù)挖掘數(shù)據(jù)前,要想預(yù)測(cè)出能挖掘什么內(nèi)容的信息具有較大的難度。對(duì)此,高校圖書(shū)館信息系統(tǒng)的開(kāi)發(fā)人員應(yīng)以一個(gè)搜索過(guò)程來(lái)處理復(fù)雜的數(shù)據(jù)挖掘與查詢,但為了完成數(shù)據(jù)的進(jìn)一步挖掘,務(wù)必保留所有的中間結(jié)果。在進(jìn)行數(shù)據(jù)挖掘時(shí),用戶可通過(guò)不斷地修改自己的查詢請(qǐng)求來(lái)動(dòng)態(tài)調(diào)整此次數(shù)據(jù)挖掘的目標(biāo),以保障挖掘過(guò)程的有效推進(jìn)。所以信息管理系統(tǒng)需從不同角度觀察挖掘數(shù)據(jù)的中間結(jié)果,如此才可為用戶提供靈活的觀察數(shù)據(jù)。

        五、結(jié)束語(yǔ)

        信息時(shí)代,我國(guó)逐漸開(kāi)始普及數(shù)字校園、數(shù)字圖書(shū)館等先進(jìn)理念,基于數(shù)據(jù)挖掘技術(shù)的圖書(shū)館管理系統(tǒng)隨之得到廣泛應(yīng)用。在不久的將來(lái),數(shù)據(jù)挖掘這一新型智能信息處理技術(shù)將得到業(yè)界學(xué)者更多的重視,其具體技術(shù)與手段也將得到進(jìn)一步完善與發(fā)展。

        【參考文獻(xiàn)】

        [1]王玉珍.基于Web挖掘的數(shù)字圖書(shū)館個(gè)性化服務(wù)體系研究[J].情報(bào)科學(xué),2014,32(04):96-100.

        猜你喜歡
        聚類分析數(shù)據(jù)挖掘
        探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢(shì)
        基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
        電力與能源(2017年6期)2017-05-14 06:19:37
        數(shù)據(jù)挖掘技術(shù)在中醫(yī)診療數(shù)據(jù)分析中的應(yīng)用
        基于聚類分析研究貴州省各地區(qū)經(jīng)濟(jì)發(fā)展綜合評(píng)價(jià)
        商情(2016年39期)2016-11-21 08:45:54
        新媒體用戶行為模式分析
        農(nóng)村居民家庭人均生活消費(fèi)支出分析
        基于省會(huì)城市經(jīng)濟(jì)發(fā)展程度的實(shí)證分析
        基于聚類分析的互聯(lián)網(wǎng)廣告投放研究
        科技視界(2016年20期)2016-09-29 12:32:48
        “縣級(jí)供電企業(yè)生產(chǎn)經(jīng)營(yíng)統(tǒng)計(jì)一套”表輔助決策模式研究
        一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
        伊人久久大香线蕉av波多野结衣| 99成人无码精品视频| 久久人人爽人人爽人人片av东京热 | 国产又湿又爽又猛的视频| 国产乱人精品视频av麻豆网站| av免费在线播放视频| 日本一区二区三级在线观看| 国产人妻高清国产拍精品| 婷婷综合另类小说色区| 99久久超碰中文字幕伊人| 亚洲免费网站观看视频| 日韩人妻无码一区二区三区久久99 | 欧美黑人xxxx又粗又长| 国产成年女人特黄特色毛片免| 国产国拍亚洲精品午夜不卡17| 91精品国产91久久综合桃花| 亚洲一区二区一区二区免费视频| 蜜桃av人妻精品一区二区三区| 亚洲av无码国产精品色午夜字幕 | 亚洲三级在线播放| 精品国产麻豆免费人成网站| 极品粉嫩嫩模大尺度视频在线播放| 很黄很色的女同视频一区二区| 久久伊人精品一区二区三区| 亚洲日韩精品欧美一区二区| 日本a级特黄特黄刺激大片| 无码制服丝袜中文字幕| 日韩色久悠悠婷婷综合| 美女被男人插得高潮的网站| 久久国产色av免费观看| 国内精品久久久久影院一蜜桃| 亚洲av无码一区二区乱子伦as| 91精品国产免费青青碰在线观看 | 中国熟妇人妻xxxxx| 日本少妇按摩高潮玩弄| 岛国av一区二区三区| 亚洲大胆视频在线观看| 国产一区二区三区四色av| 人人鲁人人莫人人爱精品| 一二三四在线视频观看社区| 国产精品自产拍在线观看免费|