亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        暗數(shù)據(jù)視角下高校圖書館數(shù)據(jù)治理策略研究*

        2024-05-17 09:06:40董京祥
        圖書館 2024年4期
        關(guān)鍵詞:圖書館服務(wù)

        董京祥

        (東北林業(yè)大學(xué)圖書館 哈爾濱 150040)

        0 引言

        近年來,隨著大數(shù)據(jù)、云計(jì)算、人工智能、物聯(lián)網(wǎng)等信息技術(shù)的不斷發(fā)展,各類數(shù)據(jù)呈爆炸式增長(zhǎng)態(tài)勢(shì),將科學(xué)研究推向通過數(shù)據(jù)采集、存儲(chǔ)、分析尋求相關(guān)性規(guī)律的科學(xué)知識(shí)發(fā)現(xiàn)新模式,科學(xué)研究第四范式“數(shù)據(jù)密集型科學(xué)發(fā)現(xiàn)(Data-Intensive Scientific Discovery)”理論日趨成熟,人類社會(huì)進(jìn)入一個(gè)以數(shù)據(jù)驅(qū)動(dòng)的嶄新時(shí)代[1]。數(shù)據(jù)不再滿足于被存儲(chǔ),而是被挖掘、分析和管理,用以揭示事物之間的相關(guān)關(guān)系、預(yù)測(cè)發(fā)展趨勢(shì)、制定合理策略,在為社會(huì)生活的方方面面帶來發(fā)展機(jī)遇的同時(shí)也帶來了巨大挑戰(zhàn)。如何以最有效的方式管理、利用數(shù)據(jù)已成為學(xué)界、業(yè)界專家研究探討的重要課題。

        圖書館作為人類文化傳遞中心和知識(shí)交流中心,一直都是信息技術(shù)應(yīng)用的先行者。當(dāng)前,新技術(shù)不斷改變著圖書館服務(wù)模式,傳統(tǒng)的知識(shí)存儲(chǔ)與獲取方式已發(fā)生巨大變化,圖書館進(jìn)入數(shù)字化建設(shè)的轉(zhuǎn)型發(fā)展階段。數(shù)字化技術(shù)的運(yùn)用為圖書館積累了大量數(shù)據(jù),涵蓋了從信息資源角度描述資源本身的文獻(xiàn)數(shù)據(jù),以及從空間、設(shè)備、人力資源角度構(gòu)成資源本身的內(nèi)容數(shù)據(jù)。但實(shí)際上這其中的大部分?jǐn)?shù)據(jù)都因其復(fù)雜性、不可見性或其他原因而不能或不易被訪問,并沒有得到及時(shí)有效的開發(fā)利用,雖然這些數(shù)據(jù)可能非常有價(jià)值,但也有可能成為隱藏或暗數(shù)據(jù)。

        為使圖書館能夠更好地管理和利用暗數(shù)據(jù),文章以國內(nèi)外暗數(shù)據(jù)相關(guān)研究為基礎(chǔ),從暗數(shù)據(jù)的視角對(duì)高校圖書館的數(shù)據(jù)構(gòu)成進(jìn)行概括總結(jié),梳理圖書館大數(shù)據(jù)、小數(shù)據(jù)與暗數(shù)據(jù)之間的關(guān)系,分析圖書館暗數(shù)據(jù)的成因、潛在價(jià)值和可能存在的風(fēng)險(xiǎn),提出高校圖書館暗數(shù)據(jù)治理策略,并以實(shí)際案例闡述了暗數(shù)據(jù)對(duì)高校圖書館創(chuàng)新發(fā)展的重要性,以期為我國圖情領(lǐng)域的暗數(shù)據(jù)研究提供參考與借鑒。

        1 高校圖書館暗數(shù)據(jù)的內(nèi)涵、成因與價(jià)值

        1.1 高校圖書館暗數(shù)據(jù)的內(nèi)涵

        目前,學(xué)界對(duì)“暗數(shù)據(jù)”的研究尚處于初始階段,其概念和范圍并沒有統(tǒng)一的界定,其定義主要來自于科研機(jī)構(gòu)的學(xué)術(shù)文章以及IT公司的行業(yè)報(bào)告。

        有學(xué)者認(rèn)為,暗數(shù)據(jù)是科學(xué)長(zhǎng)尾中“一種無形的、被忽視的數(shù)據(jù)”,沒有經(jīng)過仔細(xì)索引和存儲(chǔ),用戶幾乎看不到,且大概率會(huì)保持未充分利用狀態(tài)直至最終丟失[2]。與科學(xué)和工程研究中存儲(chǔ)在高性能計(jì)算(HPC)設(shè)施上“未經(jīng)仔細(xì)標(biāo)記的數(shù)據(jù)”相同,暗數(shù)據(jù)是可靠信息的潛在豐富來源卻被遺忘,基本沒有任何使用的可能性[3]。對(duì)于物聯(lián)網(wǎng)技術(shù)產(chǎn)生的暗數(shù)據(jù),研究者將其定義為“具有創(chuàng)造新價(jià)值潛力的未使用和隱藏的數(shù)據(jù)”[4];制造業(yè)的暗數(shù)據(jù)則被假設(shè)為“未編目或結(jié)構(gòu)不充分、組織可能不知道的數(shù)據(jù)”,是組織在常規(guī)業(yè)務(wù)活動(dòng)中生成、收集和存儲(chǔ)來自不同異構(gòu)源的不同類型的數(shù)據(jù),但由于缺乏先進(jìn)的分析工具而無法對(duì)之進(jìn)行分析[5]。這與針對(duì)暗數(shù)據(jù)的非結(jié)構(gòu)化數(shù)據(jù)部分(如系統(tǒng)日志和社交媒體圖像)將其描述為“組織收集并存儲(chǔ),但無法利用傳統(tǒng)分析工具處理的數(shù)據(jù)”的觀點(diǎn)部分一致[6-8]。

        國內(nèi)對(duì)暗數(shù)據(jù)的研究較少,一般認(rèn)為暗數(shù)據(jù)是“沒有掌握和收集但已產(chǎn)生影響的數(shù)據(jù)或沒有開發(fā)挖掘的數(shù)據(jù)”[9],或“凡是存儲(chǔ)(無論是否感知其存在)但目前尚未開發(fā)使用的數(shù)據(jù)”,主要是從圖書館拓展服務(wù)的需求角度進(jìn)行的探索實(shí)踐[10]。

        以Gartner、Intel、IBM和Deloitte等為代表的信息技術(shù)咨詢機(jī)構(gòu)或數(shù)據(jù)管理服務(wù)公司從商業(yè)應(yīng)用的視角對(duì)暗數(shù)據(jù)進(jìn)行了相關(guān)探討,其中國際權(quán)威信息咨詢機(jī)構(gòu)Gartner的定義獲得的認(rèn)可度最高。Gartner認(rèn)為暗數(shù)據(jù)是組織在常規(guī)業(yè)務(wù)活動(dòng)中收集、處理和存儲(chǔ)的,但通常無法用于其他目的的信息資產(chǎn)[11]。其他機(jī)構(gòu)或公司多是在Gartner定義的基礎(chǔ)上,根據(jù)各行業(yè)的不同特點(diǎn)對(duì)暗數(shù)據(jù)的概念予以進(jìn)一步明確,是“不可訪問的、低質(zhì)量的、未開發(fā)的”數(shù)據(jù)[12-14]。

        通過歸納總結(jié)國內(nèi)外科研和商業(yè)等不同領(lǐng)域、不同學(xué)者對(duì)暗數(shù)據(jù)的定義,同時(shí)結(jié)合圖書館數(shù)據(jù)的特點(diǎn),文章將圖書館暗數(shù)據(jù)概括為:圖書館在日常業(yè)務(wù)活動(dòng)中生成、收集和存儲(chǔ)但從未進(jìn)行分析與利用的數(shù)據(jù),包括沒有經(jīng)過組織或編目的資源數(shù)據(jù)、已存檔但不再使用的業(yè)務(wù)數(shù)據(jù)以及因缺少元數(shù)據(jù)而無法定位的非結(jié)構(gòu)化數(shù)據(jù),無論其格式如何、是否可見以及有無價(jià)值。

        1.2 高校圖書館暗數(shù)據(jù)的成因

        首先,理論研究的缺失。關(guān)于暗數(shù)據(jù)的理論研究始于2010年前后,國外的專家學(xué)者們從不同角度對(duì)暗數(shù)據(jù)的概念進(jìn)行了定義,但其概念至今未能統(tǒng)一,研究領(lǐng)域涉及多方面并在商業(yè)領(lǐng)域中得到了更多關(guān)注。然而關(guān)于學(xué)術(shù)圖書館中存在的未使用數(shù)據(jù)的問題,目前少有學(xué)者研究。國內(nèi)部分學(xué)者在2015年前后基于國外研究進(jìn)行過少量探討,但并沒有形成明確的觀點(diǎn)。同一時(shí)間,國內(nèi)圖書館界關(guān)于圖書館小數(shù)據(jù)的研究開展得如火如荼,但鮮少談及小數(shù)據(jù)與暗數(shù)據(jù)之間的關(guān)系,其實(shí)從本質(zhì)上看,圖書館小數(shù)據(jù)在被充分開發(fā)利用之前,同樣屬于暗數(shù)據(jù)范疇,利用小數(shù)據(jù)其實(shí)就是在“點(diǎn)亮”暗數(shù)據(jù)??梢哉f,國內(nèi)外圖書館領(lǐng)域并沒有給予暗數(shù)據(jù)研究應(yīng)有的重視,對(duì)暗數(shù)據(jù)在圖書館領(lǐng)域應(yīng)用的理論基礎(chǔ)與實(shí)踐運(yùn)用缺乏必要的探索,還沒有形成較為系統(tǒng)、成熟的理論體系,暗數(shù)據(jù)理論在圖書館中的應(yīng)用還要經(jīng)歷一個(gè)漫長(zhǎng)而曲折的過程。

        其次,應(yīng)用價(jià)值的忽視。多年的數(shù)字化建設(shè)為圖書館積累了大量數(shù)據(jù),但其中大部分?jǐn)?shù)據(jù)只是作為業(yè)務(wù)數(shù)據(jù)進(jìn)行必要存儲(chǔ),少部分?jǐn)?shù)據(jù)應(yīng)用(如圖書館年度報(bào)告)也多以簡(jiǎn)單的描述性統(tǒng)計(jì)為主,很少對(duì)數(shù)據(jù)的內(nèi)在關(guān)聯(lián)進(jìn)行深度分析。近年來隨著圖書館的轉(zhuǎn)型發(fā)展,讀者的個(gè)性化服務(wù)逐漸成為圖書館的主要服務(wù)方向,與讀者相關(guān)的數(shù)據(jù)研究得到重視,其中對(duì)各類讀者小數(shù)據(jù)的應(yīng)用尤為明顯,但各類新信息技術(shù)應(yīng)用產(chǎn)生的數(shù)據(jù)大多是非結(jié)構(gòu)化數(shù)據(jù),圖書館進(jìn)行數(shù)據(jù)挖掘的難度與成本會(huì)不斷提高。對(duì)于這些大量未揭示的暗數(shù)據(jù)的價(jià)值,圖書館并沒有明確的認(rèn)知,缺乏將數(shù)據(jù)轉(zhuǎn)換成知識(shí)的思維意識(shí),而組織架構(gòu)與職責(zé)權(quán)限的模糊更是導(dǎo)致了對(duì)數(shù)據(jù)可能包含的價(jià)值的忽視,使得數(shù)據(jù)長(zhǎng)期處于未使用狀態(tài)。

        最后,挖掘能力的不足。挖掘暗數(shù)據(jù)的主要挑戰(zhàn)在于缺少有效的工具和技術(shù)來訪問暗數(shù)據(jù)。新技術(shù)給圖書館帶來不斷上漲的數(shù)據(jù)量,但技術(shù)的應(yīng)用并沒有顯著提高圖書館的數(shù)據(jù)挖掘能力,圖書館能夠處理的數(shù)據(jù)比例反而不斷下降,其中非結(jié)構(gòu)化數(shù)據(jù)占據(jù)了主要部分。受限于數(shù)據(jù)來源、類型、時(shí)間等因素,非結(jié)構(gòu)化數(shù)據(jù)缺少固定結(jié)構(gòu),數(shù)據(jù)特征與格式各不相同,需采用不同的數(shù)據(jù)采集、存儲(chǔ)、組織和分析技術(shù),如數(shù)據(jù)管理系統(tǒng)、分析軟件和其他專用工具(人工智能和機(jī)器學(xué)習(xí))等進(jìn)行處理。但這些技術(shù)對(duì)于軟硬件條件都有著較高的要求,一般的高校圖書館很難滿足,尤其是具有數(shù)據(jù)分析與軟件開發(fā)能力的復(fù)合型館員更是少之又少,導(dǎo)致圖書館空有大量數(shù)據(jù)卻沒有相應(yīng)的挖掘分析能力。

        1.3 高校圖書館暗數(shù)據(jù)的重要性

        數(shù)據(jù)挖掘在高校圖書館有著廣泛的應(yīng)用,通過對(duì)數(shù)據(jù)資源進(jìn)行信息挖掘,以提供優(yōu)質(zhì)和個(gè)性化的服務(wù)、擴(kuò)展信息服務(wù)的廣度和深度、作為科學(xué)決策的參考依據(jù)等,必須以高質(zhì)量的數(shù)據(jù)為基礎(chǔ),對(duì)圖書館各類數(shù)據(jù)(尤其是暗數(shù)據(jù))進(jìn)行精確管理與分類,進(jìn)而實(shí)現(xiàn)高效合理的利用。因此,暗數(shù)據(jù)有著巨大的應(yīng)用潛力,如可通過分析用戶行為數(shù)據(jù),了解用戶的需求內(nèi)容、行為偏好,為其提供個(gè)性化特色服務(wù),增強(qiáng)用戶黏性;統(tǒng)計(jì)館藏資源的使用情況,可提高信息資源的利用率與質(zhì)量,規(guī)劃資源部署、優(yōu)化館藏布局,為資源建設(shè)提供支撐;構(gòu)建面向?qū)ο蟮姆?wù)模型,分析評(píng)估用戶價(jià)值與流失原因,可為圖書館的整體發(fā)展提供決策支持。

        在肯定暗數(shù)據(jù)價(jià)值的同時(shí),也要注意到其存在的問題。一方面,隨著各種新設(shè)備(傳感器與監(jiān)控器)被廣泛使用,圖書館每天產(chǎn)生的數(shù)據(jù)量大幅度增加,其中不乏一些冗余的、過時(shí)的和錯(cuò)誤的無用數(shù)據(jù),這些數(shù)據(jù)的存在不僅增加了數(shù)據(jù)檢索與利用的難度,也造成了存儲(chǔ)空間和維護(hù)成本的巨大浪費(fèi)。另一方面,暗數(shù)據(jù)的存在會(huì)導(dǎo)致很大一部分圖書館數(shù)據(jù)被忽視,難以被有效發(fā)現(xiàn)、保護(hù)與利用,尤其是敏感數(shù)據(jù)可能會(huì)因?yàn)闆]有進(jìn)行有效的技術(shù)隔離,而存在一定的安全隱患。如果數(shù)據(jù)被竊取、篡改或者丟失,圖書館服務(wù)的可行性和讀者的隱私保護(hù)將面臨威脅,直接影響圖書館的服務(wù)質(zhì)量與讀者滿意度[15]。要有效管理這些暗數(shù)據(jù),須定期分析與整理各類數(shù)據(jù)、刪除無用數(shù)據(jù)并對(duì)敏感數(shù)據(jù)進(jìn)行必要的安全加密。

        2 高校圖書館暗數(shù)據(jù)的構(gòu)成

        2.1 高校圖書館數(shù)據(jù)的分類與格式

        受益于數(shù)字圖書館的建設(shè)成果,圖書館積累了大量、各類型的數(shù)據(jù),呈現(xiàn)出較強(qiáng)的多源性、異構(gòu)性。根據(jù)來源的不同,一般可將數(shù)據(jù)分為資源數(shù)據(jù)、業(yè)務(wù)數(shù)據(jù)、用戶數(shù)據(jù)和管理數(shù)據(jù)四個(gè)大類[16-19]。

        這其中既有結(jié)構(gòu)化數(shù)據(jù),也有半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),并以半結(jié)構(gòu)化和非結(jié)構(gòu)化異構(gòu)數(shù)據(jù)為主(見表1)。從近年對(duì)圖書館數(shù)據(jù)的相關(guān)研究中可以看到,已有的數(shù)據(jù)應(yīng)用多是基于傳統(tǒng)業(yè)務(wù)數(shù)據(jù)等結(jié)構(gòu)化數(shù)據(jù)的統(tǒng)計(jì)分析,對(duì)音視頻資源數(shù)據(jù)、環(huán)境數(shù)據(jù)、科研數(shù)據(jù)等半結(jié)構(gòu)化和非結(jié)構(gòu)數(shù)據(jù)缺乏有效的管理與應(yīng)用。高校圖書館在數(shù)據(jù)的保存與利用方面存在一定的盲目性,數(shù)據(jù)應(yīng)用的目的不明確、數(shù)據(jù)的來源不清晰、數(shù)據(jù)統(tǒng)計(jì)的標(biāo)準(zhǔn)不一致,加之受限于各館的軟硬件條件,部分?jǐn)?shù)據(jù)有意或無意地被忽視、遺忘,導(dǎo)致數(shù)據(jù)缺失成為“暗”數(shù)據(jù)。數(shù)據(jù)的不完整、不準(zhǔn)確將直接影響圖書館對(duì)于數(shù)據(jù)的利用率,因此,優(yōu)化高校圖書館的數(shù)據(jù)管理工作尤為重要。

        2.2 高校圖書館的大數(shù)據(jù)、小數(shù)據(jù)和暗數(shù)據(jù)

        隨著信息技術(shù)的不斷發(fā)展與應(yīng)用,圖書館在實(shí)現(xiàn)自動(dòng)化、網(wǎng)絡(luò)化、信息化、智能化的同時(shí),積累了大量的各類數(shù)據(jù),逐漸具備了“大數(shù)據(jù)”的特征,館藏?cái)?shù)據(jù)、業(yè)務(wù)數(shù)據(jù)、用戶數(shù)據(jù)和管理數(shù)據(jù)構(gòu)成了圖書館大數(shù)據(jù)的主要部分。對(duì)這些數(shù)據(jù)進(jìn)行深度分析,挖掘其潛藏價(jià)值,并將之應(yīng)用于圖書館的資源建設(shè)、業(yè)務(wù)重組和服務(wù)改進(jìn)等創(chuàng)新實(shí)踐當(dāng)中,可提高圖書館的服務(wù)質(zhì)量并提供決策支持,使圖書館擁有更強(qiáng)的洞察力、決策力和執(zhí)行力。

        圖書館小數(shù)據(jù)主要是指圖書館大數(shù)據(jù)中與用戶群體密切相關(guān)的數(shù)據(jù),包括基本特征數(shù)據(jù)、圖書館活動(dòng)數(shù)據(jù)、第三方開放數(shù)據(jù)、行為感知數(shù)據(jù)以及這些數(shù)據(jù)之間的關(guān)聯(lián)數(shù)據(jù)等。對(duì)此類數(shù)據(jù)進(jìn)行分析與利用,圖書館可提供比以往更具個(gè)性化、精準(zhǔn)化和智慧化的服務(wù)[20]。

        圖書館大數(shù)據(jù)與圖書館小數(shù)據(jù)相輔相成,圖書館大數(shù)據(jù)可被理解為圖書館的全部數(shù)據(jù),圖書館小數(shù)據(jù)則是所有數(shù)據(jù)中與讀者個(gè)體或某一群體特征及行為相關(guān)的數(shù)據(jù),是圖書館開展個(gè)性化服務(wù)的基礎(chǔ)。

        為保證數(shù)據(jù)決策的科學(xué)性和可靠性,有關(guān)主體在利用數(shù)據(jù)進(jìn)行決策分析時(shí),應(yīng)保證數(shù)據(jù)的完整性與準(zhǔn)確性,需要將其中被忽視的暗數(shù)據(jù)點(diǎn)亮,盡可能使決策具有針對(duì)性與實(shí)時(shí)性,以提高決策的可靠性與可用性。對(duì)服務(wù)數(shù)據(jù)、行為數(shù)據(jù)、科研數(shù)據(jù)以及運(yùn)行數(shù)據(jù)中的未開發(fā)數(shù)據(jù)進(jìn)行挖掘分析,了解用戶需求、完善館藏資源、提升服務(wù)能力,為用戶提供更好的個(gè)性化服務(wù);追蹤研究熱點(diǎn)、預(yù)測(cè)前沿發(fā)展、開展人才評(píng)價(jià),為學(xué)校的科研工作和人才引進(jìn)提供支持;優(yōu)化業(yè)務(wù)流程、調(diào)整組織架構(gòu)、提高工作效率,為圖書館的發(fā)展決策和戰(zhàn)略規(guī)劃提供有效的數(shù)據(jù)支持[21]。

        3 高校圖書館暗數(shù)據(jù)的管理與應(yīng)用

        3.1 數(shù)據(jù)治理框架

        數(shù)據(jù)的規(guī)模和質(zhì)量是影響圖書館大數(shù)據(jù)分析與應(yīng)用有效性的兩個(gè)關(guān)鍵因素,無序化的數(shù)據(jù)只是一種信息資源而非知識(shí)或情報(bào),圖書館作為知識(shí)的中介機(jī)構(gòu)具有對(duì)數(shù)據(jù)進(jìn)行組織并將之提供給用戶的職能[22]。這需要圖書館加強(qiáng)對(duì)各類數(shù)據(jù)完整性與準(zhǔn)確性的掌控,進(jìn)一步提升數(shù)據(jù)的質(zhì)量和安全性,以保證數(shù)據(jù)的價(jià)值密度和可用性。

        當(dāng)前圖書館各類數(shù)據(jù)中存在著大量未被使用或未被發(fā)現(xiàn)的暗數(shù)據(jù),且可能具有一定的潛在價(jià)值,如何發(fā)揮出這些暗數(shù)據(jù)的活力是圖書館數(shù)據(jù)管理的重要內(nèi)容。圖書館可通過建立系統(tǒng)化的數(shù)據(jù)中心、采用智能技術(shù)對(duì)數(shù)據(jù)進(jìn)行自動(dòng)化提取、設(shè)立專門的數(shù)據(jù)館員崗位、制定并健全數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范等措施,根據(jù)高校圖書館數(shù)據(jù)的特點(diǎn)構(gòu)建高校圖書館暗數(shù)據(jù)治理框架(見圖1)??蚣芤灾卫韺訛楹诵?,數(shù)據(jù)層的各類數(shù)據(jù)匯總到數(shù)據(jù)中心后,保障層的數(shù)據(jù)館員在數(shù)據(jù)標(biāo)準(zhǔn)的規(guī)范下,利用智能化工具對(duì)數(shù)據(jù)進(jìn)行分類提取,實(shí)現(xiàn)數(shù)據(jù)的收集、索引、訪問、挖掘和歸檔,從數(shù)據(jù)層、保障層、治理層到應(yīng)用層四個(gè)層面對(duì)圖書館數(shù)據(jù)進(jìn)行全生命周期的統(tǒng)一管理,將暗數(shù)據(jù)充分組織起來,在保證數(shù)據(jù)質(zhì)量與安全的同時(shí)確保數(shù)據(jù)的完整性與準(zhǔn)確性,進(jìn)而對(duì)數(shù)據(jù)進(jìn)行有效的分析與揭示,為圖書館的服務(wù)創(chuàng)新與決策支持提供參考。

        圖1 高校圖書館暗數(shù)據(jù)治理框架

        3.1.1 數(shù)據(jù)中心的建立

        數(shù)據(jù)的完整性和準(zhǔn)確性是數(shù)據(jù)應(yīng)用的前提與基礎(chǔ),直接關(guān)系到圖書館數(shù)據(jù)決策的科學(xué)性、實(shí)用性與可靠性。數(shù)字化發(fā)展至今,圖書館的很多業(yè)務(wù)都需要多部門協(xié)作完成,無論是資源建設(shè)還是信息服務(wù),越來越多的工作需要整體規(guī)劃、統(tǒng)一部署,因此應(yīng)對(duì)圖書館的各類數(shù)據(jù)進(jìn)行統(tǒng)一收集、管理和分析,整合不同業(yè)務(wù)信息,以促進(jìn)業(yè)務(wù)融合、加強(qiáng)數(shù)據(jù)管理,進(jìn)而滿足讀者日益增長(zhǎng)的個(gè)性化需求。

        這需要圖書館有系統(tǒng)化的數(shù)據(jù)管理機(jī)構(gòu)——數(shù)據(jù)中心,專門負(fù)責(zé)數(shù)據(jù)的采集、存儲(chǔ)、整合、分析與利用,制定統(tǒng)一的數(shù)據(jù)獲取、分類和使用策略,確定數(shù)據(jù)存儲(chǔ)標(biāo)準(zhǔn)、加強(qiáng)數(shù)據(jù)質(zhì)量控制、完善硬件環(huán)境建設(shè),協(xié)調(diào)館內(nèi)各部門間數(shù)據(jù)的交換與共享,實(shí)現(xiàn)對(duì)數(shù)據(jù)全生命周期的統(tǒng)一組織與管理(見圖2),以更有效地使用數(shù)據(jù)、分析數(shù)據(jù),最大化地揭示數(shù)據(jù)的潛在價(jià)值。

        圖2 數(shù)據(jù)全生命周期管理模型

        圖書館的數(shù)據(jù)中心不是簡(jiǎn)單的數(shù)據(jù)存儲(chǔ)、查詢部門,而是需要構(gòu)建語義級(jí)業(yè)務(wù)模型和信息資源服務(wù)目錄,對(duì)不同業(yè)務(wù)系統(tǒng)的數(shù)據(jù)建立索引并進(jìn)行關(guān)聯(lián)整合,使用戶能夠自行定義所需信息資源,為其提供信息服務(wù)。實(shí)施的關(guān)鍵環(huán)節(jié)是元數(shù)據(jù)管理,應(yīng)采用不同的元數(shù)據(jù)規(guī)范對(duì)不同類型的數(shù)據(jù)進(jìn)行標(biāo)引,制定合理的元數(shù)據(jù)戰(zhàn)略,并保證戰(zhàn)略能得到貫徹執(zhí)行。通過元數(shù)據(jù)管理,使數(shù)據(jù)得到有效整合,確保數(shù)據(jù)資源能夠在不同部門、不同服務(wù)平臺(tái)、不同用戶之間保持高度的流動(dòng)性、連續(xù)性、開放性與共享性,并在此基礎(chǔ)上開展數(shù)據(jù)的深度分析與挖掘工作。

        3.1.2 數(shù)據(jù)信息的提取

        數(shù)據(jù)信息的提取是暗數(shù)據(jù)治理的重要組成部分,是從大量結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)中收集和提取相關(guān)信息的過程。圖書館可用智能化數(shù)據(jù)提取技術(shù)來提高工作效率,因?yàn)閿?shù)據(jù)的智能化提取比手動(dòng)收集更準(zhǔn)確、有效和安全,需要的時(shí)間和資源更少,可最大程度降低數(shù)據(jù)丟失或錯(cuò)誤處理的風(fēng)險(xiǎn),使圖書館對(duì)數(shù)據(jù)的管理更為經(jīng)濟(jì)、高效。

        對(duì)于圖書館來說,確保數(shù)據(jù)提取流程正確非常重要,智能化提取一般包括以下步驟。首先,圖書館必須確定需要收集哪些數(shù)據(jù)以及如何使用這些數(shù)據(jù),進(jìn)而評(píng)估需要收集的信息類型,如書目數(shù)據(jù)和元數(shù)據(jù)以及數(shù)據(jù)的來源;其次,在確定了數(shù)據(jù)的來源與用途之后,就可以開始數(shù)據(jù)提取,通過創(chuàng)建程序、算法和其他數(shù)據(jù)提取方法(自然語言處理、機(jī)器學(xué)習(xí)等)從所識(shí)別的數(shù)據(jù)源中檢索、歸納所需數(shù)據(jù);最后,通過質(zhì)量管理和安全管理保證數(shù)據(jù)信息在數(shù)據(jù)中心被正確地存儲(chǔ)、組織并加以利用。

        3.1.3 數(shù)據(jù)館員的培養(yǎng)

        高校圖書館作為服務(wù)于高校教學(xué)、科研的主要機(jī)構(gòu),其開展的各類服務(wù)均是以數(shù)據(jù)為基礎(chǔ),尤其是近年來以大數(shù)據(jù)技術(shù)為核心提供的創(chuàng)新服務(wù)(如學(xué)科服務(wù)、數(shù)據(jù)服務(wù)等)更是對(duì)館員的數(shù)據(jù)分析、挖掘能力提出了更高的要求,迫切需要設(shè)置專門的數(shù)據(jù)館員崗位[23]。數(shù)據(jù)館員是數(shù)據(jù)治理的核心,是防止數(shù)據(jù)變暗的實(shí)際執(zhí)行者,在數(shù)據(jù)管理中的作用主要是圍繞數(shù)據(jù)生命周期管理數(shù)據(jù)資源,制定數(shù)據(jù)管理政策,對(duì)圖書館的各類數(shù)據(jù)資源進(jìn)行選擇、存儲(chǔ)、組織、分析與維護(hù)等;開展數(shù)據(jù)服務(wù)工作,提供數(shù)據(jù)素養(yǎng)教育、數(shù)據(jù)服務(wù)咨詢和數(shù)據(jù)資源共享等創(chuàng)新服務(wù);組織協(xié)調(diào)不同部門間的數(shù)據(jù)應(yīng)用,提升圖書館大數(shù)據(jù)的利用率,進(jìn)一步揭示數(shù)據(jù)的潛在價(jià)值,為圖書館服務(wù)的創(chuàng)新發(fā)展提供方向與依據(jù)。

        圖書館應(yīng)重視數(shù)據(jù)館員的作用,設(shè)置相關(guān)崗位,明確崗位職責(zé)與任職條件。數(shù)據(jù)館員需要有較高的綜合素質(zhì)與學(xué)習(xí)能力,應(yīng)具備圖書館學(xué)和信息學(xué)等相關(guān)學(xué)科的專業(yè)背景,具有資源組織能力和機(jī)構(gòu)庫建設(shè)經(jīng)驗(yàn),掌握文獻(xiàn)計(jì)量知識(shí)和信息處理技術(shù),了解科學(xué)研究流程、熟悉科研管理政策,并擁有良好的團(tuán)隊(duì)合作與溝通能力,此外還要對(duì)數(shù)據(jù)版權(quán)、數(shù)據(jù)隱私、數(shù)據(jù)倫理等問題有一定的了解[24]。圖書館應(yīng)更加注重對(duì)數(shù)據(jù)館員的培養(yǎng),建立數(shù)據(jù)館員職業(yè)發(fā)展規(guī)劃,確定相應(yīng)的培養(yǎng)要求與目標(biāo),通過網(wǎng)絡(luò)研討、在線課程、系統(tǒng)化培訓(xùn)和學(xué)術(shù)會(huì)議等多途徑為數(shù)據(jù)館員提供學(xué)習(xí)交流的機(jī)會(huì),持續(xù)強(qiáng)化數(shù)據(jù)館員的數(shù)據(jù)意識(shí)與數(shù)據(jù)道德,不斷提高數(shù)據(jù)館員的數(shù)據(jù)處理能力與數(shù)據(jù)素養(yǎng),加快培養(yǎng)與圖書館創(chuàng)新服務(wù)相匹配的數(shù)據(jù)管理與服務(wù)人才[25]。

        3.1.4 數(shù)據(jù)標(biāo)準(zhǔn)的規(guī)范

        數(shù)據(jù)標(biāo)準(zhǔn)的規(guī)范化是數(shù)據(jù)治理的有效保障,是指在數(shù)據(jù)質(zhì)量、數(shù)據(jù)管理、數(shù)據(jù)安全、數(shù)據(jù)隱私和數(shù)據(jù)監(jiān)管等方面制定相關(guān)規(guī)則和制度,用于管理和維護(hù)數(shù)據(jù)的質(zhì)量、完整性和安全性。圖書館應(yīng)根據(jù)數(shù)據(jù)決策的對(duì)象、方式和目標(biāo),針對(duì)具體的數(shù)據(jù)內(nèi)容與業(yè)務(wù)類型,制定相應(yīng)的數(shù)據(jù)收集、存儲(chǔ)與使用策略,以實(shí)現(xiàn)數(shù)據(jù)的有效管理。鑒于圖書館組織結(jié)構(gòu)復(fù)雜、業(yè)務(wù)類型多樣,為保證數(shù)據(jù)的安全與有效利用,應(yīng)明確劃分圖書館員可訪問的數(shù)據(jù)范圍,做到不同部門館員身份和數(shù)據(jù)訪問權(quán)限的合理設(shè)定;制定數(shù)據(jù)保留標(biāo)準(zhǔn)與規(guī)則,對(duì)數(shù)據(jù)進(jìn)行審查與分析,決定其是否有價(jià)值,進(jìn)而對(duì)數(shù)據(jù)實(shí)行有效保存與定期刪除;組織數(shù)據(jù)治理團(tuán)隊(duì),負(fù)責(zé)監(jiān)督圖書館的數(shù)據(jù)管理流程,確保圖書館的數(shù)據(jù)利用在達(dá)到預(yù)期目標(biāo)的同時(shí)也符合法律、法規(guī)的監(jiān)管與審計(jì)要求。

        3.1.5 數(shù)據(jù)安全的加強(qiáng)

        數(shù)據(jù)安全包括數(shù)據(jù)的安全存儲(chǔ)與訪問以及讀者隱私保護(hù)兩個(gè)方面,不當(dāng)?shù)臄?shù)據(jù)存儲(chǔ)會(huì)導(dǎo)致暗數(shù)據(jù)的產(chǎn)生,從而引發(fā)個(gè)人隱私安全問題。數(shù)據(jù)安全存儲(chǔ)是指數(shù)據(jù)得到長(zhǎng)期安全完整的存儲(chǔ),包括如何防止數(shù)據(jù)在保存、使用和傳輸過程中被非法修改、復(fù)制與刪除,可通過制定數(shù)據(jù)容災(zāi)備份策略與嚴(yán)格的數(shù)據(jù)管理制度來保證數(shù)據(jù)的安全存儲(chǔ)。同時(shí)要防止未經(jīng)授權(quán)的訪問,應(yīng)基于用戶的角色分工、業(yè)務(wù)要求,通過適當(dāng)?shù)南到y(tǒng)和協(xié)議來控制不同人員對(duì)數(shù)據(jù)的訪問權(quán)限,確保數(shù)據(jù)訪問的合規(guī)性。

        由于圖書館數(shù)據(jù)中有很大一部分是關(guān)于用戶的個(gè)人信息以及行為數(shù)據(jù),涉及用戶的個(gè)人隱私數(shù)據(jù),故如何保證相關(guān)數(shù)據(jù)不被濫用與泄露非常關(guān)鍵。高校圖書館不同于公共圖書館,其讀者主要為學(xué)生,學(xué)生畢業(yè)后圖書館會(huì)對(duì)讀者賬戶進(jìn)行注銷,注銷后的讀者數(shù)據(jù)如何處理是必須認(rèn)真思考的問題。圖書館應(yīng)從讀者隱私管理、權(quán)限設(shè)置、法律規(guī)范、技術(shù)應(yīng)用和保護(hù)意識(shí)等方面制定數(shù)據(jù)隱私保護(hù)策略,利用先進(jìn)的技術(shù)手段加強(qiáng)數(shù)據(jù)中心的安全防護(hù),對(duì)數(shù)據(jù)進(jìn)行分類分級(jí)管理和脫敏處理,確保數(shù)據(jù)采集、存儲(chǔ)、分析和處理等流程的規(guī)范性與安全性,防止信息泄露;應(yīng)增強(qiáng)相關(guān)人員的法律意識(shí)并提高職業(yè)素養(yǎng),保證數(shù)據(jù)管理行為符合相關(guān)法律與道德規(guī)范,避免用戶隱私數(shù)據(jù)被過度挖掘與使用;要制定合理的數(shù)據(jù)刪除策略,對(duì)注銷后的讀者數(shù)據(jù)進(jìn)行妥善處理,清除冗余、過時(shí)的無用信息。

        3.2 數(shù)據(jù)應(yīng)用實(shí)踐

        數(shù)據(jù)挖掘的相關(guān)概念自本世紀(jì)初圖書館進(jìn)入數(shù)字化建設(shè)伊始便受到了重點(diǎn)關(guān)注,至今已積累了一定的研究成果,大數(shù)據(jù)技術(shù)的發(fā)展與應(yīng)用更是將數(shù)據(jù)挖掘推到了一個(gè)新的研究層次,理論研究日趨成熟。但實(shí)踐方面的應(yīng)用探索仍相對(duì)薄弱,大多是對(duì)某類業(yè)務(wù)數(shù)據(jù)的常規(guī)統(tǒng)計(jì),僅是對(duì)圖書館日常業(yè)務(wù)服務(wù)中產(chǎn)生的大部分?jǐn)?shù)據(jù)進(jìn)行的簡(jiǎn)單存儲(chǔ),其潛在價(jià)值并沒有得到充分挖掘與利用。隨著暗數(shù)據(jù)理念的不斷普及與深入,以及各種信息技術(shù)的廣泛應(yīng)用,國內(nèi)部分圖書館及學(xué)者已開始嘗試?yán)脠D書館業(yè)務(wù)數(shù)據(jù)開展個(gè)性化推薦、科學(xué)數(shù)據(jù)管理、決策支持等創(chuàng)新服務(wù)[26-27]。

        當(dāng)圖書館進(jìn)入以“用戶為中心”的發(fā)展階段,由于“小數(shù)據(jù)”的概念更加契合以用戶需求為核心的個(gè)性化服務(wù)理念,以小數(shù)據(jù)為切入點(diǎn)的各類應(yīng)用實(shí)踐得到了充分研究,如基于用戶小數(shù)據(jù)的個(gè)性化知識(shí)服務(wù)、推送服務(wù)[28-29],基于科研小數(shù)據(jù)的學(xué)科知識(shí)服務(wù)、科研服務(wù)[30-31],以及小數(shù)據(jù)思維驅(qū)動(dòng)下的文獻(xiàn)資源建設(shè)與信息服務(wù)建設(shè)等[32-33]。小數(shù)據(jù)作為用戶數(shù)據(jù)中具有個(gè)性化特征的數(shù)據(jù),在沒有被利用之前也成為了圖書館大數(shù)據(jù)中的“暗數(shù)據(jù)”,對(duì)其進(jìn)行分析與利用正是使這些數(shù)據(jù)由“暗”轉(zhuǎn)“亮”的具體實(shí)踐。

        此外,由于高校圖書館的讀者主要以學(xué)生為主,故對(duì)于讀者相關(guān)數(shù)據(jù)的分析利用必須考慮到時(shí)效性,過期數(shù)據(jù)只能成為無效數(shù)據(jù),不再具有挖掘參考的價(jià)值。因此對(duì)于有時(shí)效性的暗數(shù)據(jù),應(yīng)盡可能定期、及時(shí)地進(jìn)行統(tǒng)計(jì)分析,以利于數(shù)據(jù)價(jià)值的發(fā)揮。

        4 結(jié)語

        大數(shù)據(jù)時(shí)代,現(xiàn)代信息技術(shù)的發(fā)展對(duì)社會(huì)、經(jīng)濟(jì)和文化都產(chǎn)生了深遠(yuǎn)影響,圖書館的發(fā)展環(huán)境也發(fā)生了根本性變化,如何在新技術(shù)環(huán)境下充分發(fā)揮自己的資源優(yōu)勢(shì),為學(xué)校的雙一流建設(shè)提供更好的信息服務(wù),這是每個(gè)圖書館都要面臨的挑戰(zhàn)。

        目前,圖書館正邁入智慧圖書館發(fā)展階段,作為智慧圖書館建設(shè)基礎(chǔ)設(shè)施的下一代圖書館服務(wù)平臺(tái)也已提出多年,其最主要的兩項(xiàng)功能就是中央知識(shí)庫與大數(shù)據(jù)分析,這與暗數(shù)據(jù)治理建立數(shù)據(jù)中心以及設(shè)置專職數(shù)據(jù)館員的規(guī)劃相契合。雖然國內(nèi)已有部分圖書館上線了相應(yīng)的服務(wù)平臺(tái),但大多數(shù)圖書館還未有升級(jí)至智慧圖書館服務(wù)平臺(tái)的計(jì)劃,更不用說實(shí)現(xiàn)對(duì)數(shù)據(jù)的有效管理。對(duì)大數(shù)據(jù)的利用還大多停留在單純的數(shù)據(jù)存儲(chǔ),少數(shù)的分析與運(yùn)用也是基于結(jié)構(gòu)化數(shù)據(jù)進(jìn)行的簡(jiǎn)單統(tǒng)計(jì),對(duì)于日常業(yè)務(wù)運(yùn)行產(chǎn)生的半結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)則關(guān)注甚少甚至遺忘。圖書館應(yīng)積極利用大數(shù)據(jù)相關(guān)技術(shù),對(duì)各類數(shù)據(jù)進(jìn)行采集、存儲(chǔ)、管理與分析,充分利用各類被忽視的“暗”數(shù)據(jù),通過挖掘數(shù)據(jù)背后的潛在價(jià)值,創(chuàng)新服務(wù)內(nèi)容、提升服務(wù)效能,為提高圖書館的管理與服務(wù)水平、拓展智慧化服務(wù)內(nèi)容、預(yù)測(cè)未來發(fā)展趨勢(shì)提供數(shù)據(jù)支撐,更好地服務(wù)于學(xué)校的教學(xué)和科研工作。

        現(xiàn)階段對(duì)暗數(shù)據(jù)相關(guān)理念及技術(shù)的研究還未得到國內(nèi)圖書館界專家的重點(diǎn)關(guān)注,圖情領(lǐng)域僅有的幾篇研究文獻(xiàn)也主要集中在理論層面,對(duì)于圖書館實(shí)際運(yùn)行中遇到的問題涉及不多,實(shí)踐研究不夠深入。今后業(yè)界應(yīng)加強(qiáng)與暗數(shù)據(jù)相關(guān)的理論研究,同時(shí)注重與實(shí)踐相結(jié)合,將圖書館暗數(shù)據(jù)的開發(fā)與利用工作提上日程,通過完善數(shù)據(jù)管理策略、提高數(shù)據(jù)分析的效率,有效點(diǎn)亮暗數(shù)據(jù)并從源頭上抑制暗數(shù)據(jù)的產(chǎn)生,以此充分挖掘利用圖書館大數(shù)據(jù)的潛在價(jià)值。

        猜你喜歡
        圖書館服務(wù)
        圖書館
        文苑(2019年20期)2019-11-16 08:52:12
        服務(wù)在身邊 健康每一天
        服務(wù)在身邊 健康每一天
        服務(wù)在身邊 健康每一天
        服務(wù)在身邊 健康每一天
        服務(wù)在身邊 健康每一天
        時(shí)間重疊的圖書館
        文苑(2018年17期)2018-11-09 01:29:40
        圖書館
        招行30年:從“滿意服務(wù)”到“感動(dòng)服務(wù)”
        商周刊(2017年9期)2017-08-22 02:57:56
        飛躍圖書館
        欧美xxxx色视频在线观看| 亚洲av日韩av高潮潮喷无码| 艳妇乳肉豪妇荡乳av无码福利| 囯产精品无码一区二区三区AV| 久久国产女同一区二区| 国产亚洲成性色av人片在线观| 久久人人爽人人爽人人片av东京热| 香蕉视频一级| 日韩av中文字幕亚洲天| 国产成年人毛片在线99| 少妇高潮惨叫久久久久久电影| 国产不卡一区二区三区免费视| 男女上床视频免费网站| 夜夜高潮夜夜爽免费观看| 黑人巨大精品欧美一区二区免费| 国产精品后入内射日本在线观看| 色优网久久国产精品| 中文国产乱码在线人妻一区二区| 国产一区内射最近更新| 久草视频福利| 超短裙老师在线观看一区二区| 久久久99精品免费视频| 草草久久久无码国产专区| 精品不卡久久久久久无码人妻| 国产一区二区三区在线爱咪咪| 隔壁老王国产在线精品| 欧美人妻精品一区二区三区| 亚洲无线码1区| 久久亚洲中文字幕精品二区| 久久久国产乱子伦精品作者| 秋霞影院亚洲国产精品| 日本人妻系列一区二区| 国产女人好紧好爽| 久久青青草原精品国产app| 国产人妖视频一区二区| 亚洲乱码中文字幕综合| 日本高清一级二级三级 | 激情五月开心五月麻豆| 久久久精品人妻无码专区不卡| 国产成人精品一区二区视频| 天堂网av在线|