李新亮 徐家毅 張建華(上海商學院圖書館 上海 201400)
?
大數(shù)據(jù)背景下高校圖書館的生態(tài)重構
李新亮 徐家毅 張建華(上海商學院圖書館 上海 201400)
隨著互聯(lián)網(wǎng)技術的發(fā)展,“大數(shù)據(jù)”對作為信息技術主要應用場所的圖書館提出了生態(tài)體系重構的要求,本文從高校圖書館的發(fā)展理念、資源、平臺、服務、館舍、架構等方面提出了重構高校圖書館生態(tài)體系的設想。
大數(shù)據(jù) 高校圖書館 生態(tài)重構
大數(shù)據(jù)已經(jīng)深入到我們生活的各個方面。2011年,全球著名的咨詢公司——麥肯錫公司在《McKinsey-Big data The next frontier for innovation, competition, and productivity》報告中,最早提出了“大數(shù)據(jù)時代的到來”[1]。自此,“大數(shù)據(jù)”逐漸成為新時代的主題詞,大數(shù)據(jù)帶來的信息風暴正在變革我們的生活、工作和思維,大數(shù)據(jù)開啟了一次重大的時代轉型[2]。
高校圖書館,如何在大數(shù)據(jù)背景下,通過數(shù)據(jù)的收集、管理和應用,更加洞察用戶,建立共享協(xié)作機制,提供更精確、主動的服務,從而改變高校圖書館原有的生態(tài)系統(tǒng),就成為一個值得研究的問題。
高校圖書館是信息技術的主要應用場所。在關注高校圖書館結構化信息資源需求的同時,大數(shù)據(jù)技術在高校圖書館中的應用則意味著可以經(jīng)濟高效地分析非結構化數(shù)據(jù)。將大數(shù)據(jù)引入并應用到圖書館服務中,需要以下幾個流程:
1.1數(shù)據(jù)采集
高校圖書館的存儲資源豐富、數(shù)據(jù)種類繁多,不僅有紙質資源、數(shù)據(jù)庫資源、光盤資源等結構化信息,還有論文、課件、讀者信息、服務信息等半結構化和非結構化數(shù)據(jù)。即使是一所高校圖書館內(nèi)部,這些數(shù)據(jù)的編碼方式、數(shù)據(jù)格式、應用特征都無法統(tǒng)一。為了更好地利用這些數(shù)據(jù),必須對這些數(shù)據(jù)進行抽取和集成,并對抽取和集成后的數(shù)據(jù)進行清洗。另外,隨著用戶獲取信息方式的不斷變化,圖書館的信息服務功能也在相應地不斷提高,高校圖書館為了滿足用戶的需求,必須對大數(shù)據(jù)進行有效的采集。
1.2數(shù)據(jù)管理
大數(shù)據(jù)應用的關鍵不在于擁有數(shù)據(jù)量的大小,而是對數(shù)據(jù)價值的再發(fā)現(xiàn)。數(shù)據(jù)價值再發(fā)現(xiàn)的前提則是高效的數(shù)據(jù)管理。由于高校圖書館數(shù)據(jù)庫中包含大量信息,且信息間價值密度低,因此,對大數(shù)據(jù)的管理要根據(jù)不同的應用目的進行不同分類。
現(xiàn)在高校圖書館數(shù)據(jù)一般可分為結構化數(shù)據(jù)和非結構化數(shù)據(jù)。結構化數(shù)據(jù)可以利用傳統(tǒng)的關系型數(shù)據(jù)庫進行管理,非結構化數(shù)據(jù)則可以依據(jù)數(shù)據(jù)價值建立分級管理。把數(shù)據(jù)的來源、格式、流向、信息等方面的差異性作為非結構化數(shù)據(jù)分類管理的依據(jù),并依賴搜索引擎技術、智能分類技術、分詞技術、大眾分類技術以及影像分析、檢索、識別技術等,對非結構化數(shù)據(jù)進行自動提取檢索信息,建立非結構化數(shù)據(jù)的索引表,實現(xiàn)對非結構化數(shù)據(jù)的管理[3]。
1.3數(shù)據(jù)應用
大數(shù)據(jù)背景下,高校圖書館的海量數(shù)據(jù)并沒有形成真正的知識源以供研究人員利用,還需要數(shù)據(jù)化的過程。大數(shù)據(jù)的應用可以分為三個層面:收集信息;把信息轉化為知識;借助于分析工具和其他子系統(tǒng)獲得預測和判斷的智慧。通過數(shù)據(jù)清洗、抽取、集成、組織、備份等方式對大數(shù)據(jù)進行管理,通過數(shù)據(jù)挖掘、統(tǒng)計分析、機器學習等分析技術對高校圖書館海量數(shù)據(jù)進行深層次的挖掘和分析,甄選出隱藏在這些數(shù)據(jù)里的有價值的信息,利用數(shù)據(jù)挖掘技術對大規(guī)模的海量數(shù)據(jù)進行分析并提煉出用戶需要的、真正有價值的知識,要能夠把知識轉化為決策智慧,找到大數(shù)據(jù)和高校圖書館信息服務的契合點。例如:一個高校圖書館的數(shù)據(jù)來源有很多,既有來自于高校圖書館本身館藏文獻的基礎信息、指導圖書文獻進行組織和分類等有序化工作的方法和技術的信息、根據(jù)圖書文獻有序化的指導信息產(chǎn)生的衍生信息等內(nèi)部數(shù)據(jù),還有通過學校各種信息系統(tǒng)收集的用戶個人的外部數(shù)據(jù)。但這些數(shù)據(jù)一方面相對孤立,使用率不高,使高校圖書館的資源利用遠遠低于購買的價值。另一方面,師生用戶對高校圖書館的信息化要求不斷提高,這種張力就是現(xiàn)在高校圖書館面臨的嚴峻課題。
在這種情況下就需要把這些海量數(shù)據(jù)通過統(tǒng)計分析提煉出“規(guī)律”,把這些繁雜數(shù)據(jù)轉化為知識。利用這些提煉出的知識,學校和圖書館管理層就可以獲得預測和研判的能力,為其提供決策的依據(jù),把知識轉化為智慧。例如:可以通過門禁系統(tǒng)、圖書借閱系統(tǒng)、教務系統(tǒng)等多個系統(tǒng)對接交互而提供的多維度數(shù)據(jù)進行分析,找出學生成績與來圖書館的次數(shù)的關系,圖書購置、電子資源購置與圖書館資源的利用頻率之間的關系,為管理層在“圖書館在學校中的定位”、“高校圖書館資源的購置范圍”等問題的決策提供依據(jù);再如:將館藏信息、新購置圖書信息、電子資源應用信息與用戶行為信息結合分析后,可以對某個專業(yè)、科研方向,甚至某一個特定用戶進行有效的信息推送、私人定制等進行決策。總之,在大數(shù)據(jù)背景下,基于大量結構和非結構數(shù)據(jù)的收集、管理和應用,不僅能推進高校圖書館數(shù)字化建設,而且可以為高校圖書館帶來極大的輔助決策價值。
2.1洞察用戶
大數(shù)據(jù)的使用,使高校圖書館精確掌握用戶的信息需求和實現(xiàn)個性化服務成為可能。通過對用戶年齡、性別、工作性質、知識結構、教育背景等基本信息的搜集和整理,并與用戶的行為信息如瀏覽信息的方式、發(fā)表的學術成果、使用的社交工具等相結合,高校圖書館能夠為用戶建立用戶專門信息庫,利用大數(shù)據(jù)挖掘技術對用戶信息經(jīng)過發(fā)現(xiàn)、采集、去重等處理后,發(fā)現(xiàn)用戶真實和潛在的信息需求,為用戶提供頁面定制、信息推送服務、學術信息導航服務和參考咨詢服務等個性化的信息服務。
2.2協(xié)作共享
大數(shù)據(jù)背景下,高校圖書館為網(wǎng)絡用戶提供信息服務,它的內(nèi)部業(yè)務和對外服務都需要網(wǎng)絡。換句話說,高校圖書館的運轉依附于數(shù)字通信網(wǎng)絡,圖書館的數(shù)字化信息是通過網(wǎng)絡來流通的。另外,每一個高校圖書館都有自己的特色,而單個高校圖書館無法采集到全部的文獻資源。這樣,高校圖書館就可以通過跨地域、甚至跨國界的虛擬聯(lián)合體提供資源共建的協(xié)作化與資源共享的快速化,這種協(xié)作共享模式將會突破原先信息資源共享的壁壘,打破“數(shù)字鴻溝”,優(yōu)化了傳統(tǒng)高校圖書館那種用戶泛在式、嵌入式、無縫服務的模式,使高校圖書館用戶無時間、地域、空間的限制對資源進行訪問,開創(chuàng)了信息無障礙共享的新時代,實現(xiàn)了信息資源共享無處不在的目的,成為全社會圖書館服務現(xiàn)代化進程的推動力。
2.3精準式主動服務
對用戶行為信息如瀏覽的網(wǎng)站、檢索的痕跡、下載的數(shù)字化信息資源、分享的信息資源、評價信息等的挖掘,是發(fā)現(xiàn)用戶信息需求的基礎。在此基礎上,再結合用戶按照學科、職業(yè)等細分的專門數(shù)據(jù)庫,為用戶建立與其需求相匹配的專門資源庫,幫助用戶從海量的信息中迅速找到其所需的信息,從而可以探索個性化、精確化和智能化地進行推送服務,使得高校圖書館傳統(tǒng)的被動式信息服務變?yōu)橹鲃邮叫畔⒎眨簿褪且杂脩魹橹行?、以用戶需求和行為習慣為主導、根據(jù)用戶的信息需求提供個性化信息服務的全新服務模式,從而提高高校圖書館服務水平和用戶的滿意度。此舉能夠幫助圖書館贏得更多和更準確的用戶群,大大提高高校圖書館的核心競爭力。
3.1用戶理念
首先,在傳統(tǒng)高校圖書館中,“為讀者服務”、“讀者第一”是圖書館不斷強調(diào)的宗旨,但“讀者”更多地體現(xiàn)了“以自我為中心”的理念。通過大數(shù)據(jù),高校圖書館能夠洞察用戶及其需求,樹立“用戶為中心”的理念,從根本上轉變了“圖書館本位”的舊觀念。
其次,在傳統(tǒng)高校圖書館中,圖書館和讀者之間是單向的關系,讀者僅作為信息需求者。在大數(shù)據(jù)背景下,用戶則變成了信息的重要貢獻者,甚至是信息的管理者。
第三,傳統(tǒng)高校圖書館的服務對象相對固定,這種固定讀者群的形成與讀者的年齡、性別、興趣愛好、教育背景、知識結構、閱讀習慣等有關。其一,通過大數(shù)據(jù)應用,改變了用戶獲取信息的需求和方式,用戶獲取圖書館的信息資源受時空限制變小,信息服務對象的范圍更廣;其二,圖書館對用戶的理解是立體、全方位的,可以依據(jù)不同標準來進行用戶群體細分,便于提供更為準確和精細化的服務,也會吸引更多的用戶;其三,由于用戶不僅是信息的需求者,還是信息的提供者和管理者,在高校圖書館統(tǒng)一的平臺上,不同時空的用戶可以根據(jù)不同的維度自行組織成一個虛擬團體,使用戶的范圍得以擴大。
3.2資源
傳統(tǒng)高校圖書館的資源主要是紙質版書本、報刊等文獻資料。大數(shù)據(jù)背景下,高校圖書館資源種類繁多、形式多樣:不僅包含館藏紙質文獻、數(shù)字資源等的信息資源,還包括構建于云上的存儲資源、網(wǎng)絡資源等;用戶上網(wǎng)產(chǎn)生的信息,包括瀏覽圖書館網(wǎng)站,檢索圖書館的數(shù)據(jù)庫等信息資源也會成為高校圖書館資源的重要組成部分,網(wǎng)絡上的資源都可以成為高校圖書館的信息對象。
“開放”是高校圖書館迎接大數(shù)據(jù)時代的最佳選擇,增加多觸點及外部通路是大數(shù)據(jù)時代高校圖書館的生存之道。資源的分享將會成為高校圖書館資源再生產(chǎn)的主要方式,分享第三方數(shù)據(jù)、同時向第三方開放數(shù)據(jù),才可避免自己變成“信息孤島”。
隨著計算機技術的發(fā)展,高校圖書館的數(shù)字化信息資源會越來越多,資源的收集和儲存在大數(shù)據(jù)背景下不再是一件很困難的事情。高校圖書館資源的提供者也不僅僅限于專業(yè)的信息供應商,甚至用戶本身也可變成資源的提供者。孤立的數(shù)據(jù)缺少價值,因此,把非結構化的信息進行挖掘才是最重要的工作。
3.3平臺
大數(shù)據(jù)時代,平臺為王。在大數(shù)據(jù)背景下,數(shù)據(jù)量快速增長、個性化信息推送服務、智能搜索引擎、智能化交互共享等都是基于大數(shù)據(jù)技術的智能平臺,所以,高校圖書館必須通過云計算環(huán)境把分散的圖書館軟硬件設備、信息資源、圖書館管理、業(yè)務處理與用戶聯(lián)系在一起,為用戶提供一個統(tǒng)一界面的高校圖書館服務平臺。
3.4人才
傳統(tǒng)高校圖書館館員主要搜集、整理和保存信息資源以滿足讀者的信息需求,是資料保管員。但大數(shù)據(jù)時代,除了平臺等硬件要跟上之外,數(shù)據(jù)挖掘與深度分析的專業(yè)人員更不可缺,這要求高校圖書館員除了要像傳統(tǒng)圖書館員那樣,熟練掌握圖書館學、情報學、信息管理學等專業(yè)知識,還要具有數(shù)據(jù)開發(fā)和分析的能力。其次,隨著高校圖書館用戶理念的樹立,圖書館也從“館藏為主”過渡到“參與為主”,需要圖書館館員具備相關學科專業(yè)背景和知識基礎,這也對大數(shù)據(jù)分析具有幫助作用。最后,高校圖書館館員負責知識推廣和用戶信息的維護等工作,需要其具有一定的法律背景,能夠處理知識產(chǎn)權和用戶隱私等法律問題。
總之,高校圖書館的人才建設觀念要發(fā)生變革,要建立具有大數(shù)據(jù)思維的“云館員”隊伍。
3.5服務
大數(shù)據(jù)背景下,高校圖書館的服務對象、服務模式和服務技術都是對傳統(tǒng)圖書館的提高和完善。隨著計算機、智能手機、平板電腦的普及,人們更傾向于通過網(wǎng)絡終端、移動設備來閱讀信息,這就使高校圖書館的用戶打破了時空限制,也改變了用戶的年齡結構、學科結構、學歷結構等。在這種情況下,高校圖書館信息服務的對象有所改變。
高校圖書館服務模式也在不斷變化,從傳統(tǒng)的“以圖書館館員為中心”、“以資源產(chǎn)品為中心”的服務模式向“以用戶為中心”的服務模式轉變;從傳統(tǒng)的根據(jù)館藏為讀者提供信息服務到根據(jù)用戶個性化信息需求而進行的信息服務。大數(shù)據(jù)數(shù)量大、結構復雜、類型繁多、生命周期短,所以,建立在大數(shù)據(jù)技術上的高校圖書館信息服務模式要從數(shù)據(jù)、信息、知識、智慧四個層次展開,包括:基于數(shù)據(jù)整合的一站式資源服務、基于數(shù)據(jù)分析的學科知識服務、基于數(shù)據(jù)應用的信息可視化服務和基于數(shù)據(jù)挖掘的智慧服務[4]。
大數(shù)據(jù)背景下高校圖書館服務主是建立在對大數(shù)據(jù)分析、處理基礎上挖掘出用戶的實際信息需求和潛在的信息需求,然后有針對性的為用戶提供信息服務。這需要服務技術上有所革新,第一需要客觀的技術,也就是需要數(shù)據(jù)化的技術和數(shù)據(jù)分析、挖掘技術;第二需要館員的服務技術,也就是館員要掌握這些新技術和服務專業(yè)技能,滿足用戶的各種信息需求,并能夠應用到服務實踐中。
3.6館舍
高校圖書館的館舍是圖書館主要的硬件構成,傳統(tǒng)高校圖書館館舍設計考慮的重要功用是文獻資料的儲存。大數(shù)據(jù)時代,由于資料的易得性和交互的虛擬性,高校圖書館在某種程度從固定的館舍、館藏轉變成云圖書館,因此高校圖書館館舍的功用也應更多地考慮互動(包括網(wǎng)絡互動)和分享空間的設計。
3.7機構
傳統(tǒng)高校圖書館的組織架構基本是基于紙質文獻的采購、編目和流通而設置的,大數(shù)據(jù)時代下則應圍繞著數(shù)據(jù)的采集、分析和應用而設置,這就要求負責大數(shù)據(jù)的“數(shù)據(jù)管理與分析”部門位于圖書館的核心地位,以“數(shù)據(jù)驅動”來實現(xiàn)對現(xiàn)有組織架構進行重組。傳統(tǒng)架構將被“數(shù)據(jù)采集部門、平臺維護部門、數(shù)據(jù)分析部門、數(shù)據(jù)應用部門”四大類取代。在實際的操作中要防止各部門間組織結構的割裂情形,以免數(shù)據(jù)呈現(xiàn)離散與孤立狀態(tài),要盡力打通數(shù)據(jù),讓數(shù)據(jù)自由流動,發(fā)揮多重效能,這是組織架構很重要的方面。
數(shù)字信息的爆炸式增長催生出“大數(shù)據(jù)”概念。在大數(shù)據(jù)背景下,也催生了高校圖書館數(shù)據(jù)的搜集、管理與應用的全新技術體系。在“數(shù)據(jù)驅動”下,高校圖書館生態(tài)也將漸漸得以重構,這將對高校圖書館的知識服務的拓展和深化帶來重大影響。
[1] James Manyika, Michael Chui, Brad Brown, et al. Big data: The next frontier for innovation,competition, and productivity[R]. McKinsey Global Institute,2011.
[2] 維克托·邁爾-舍恩伯格.大數(shù)據(jù)時代[M].周濤,譯.杭州:浙江人民出版社,2012.
[3] 王紅.圖書館大數(shù)據(jù)管理與分析[J].現(xiàn)代情報,2014(8).
[4] 蘇蓉.基于大數(shù)據(jù)的數(shù)字圖書館信息服務研究[D].武漢:華中師范大學,2014.
李新亮 館員,上海商學院圖書館。