陸茹
摘 要:大數(shù)據(jù)時代的到來給各行各業(yè)帶來了根本性的變革,數(shù)據(jù)的種類和規(guī)模呈現(xiàn)爆發(fā)式增長,使高校圖書館面臨前所未有的考驗。本文在對大數(shù)據(jù)概念與研究意義闡述的基礎上,指出了大數(shù)據(jù)時代高校圖書館面臨的挑戰(zhàn),并在總結(jié)分析的基礎上給出了相應的發(fā)展對策。
關(guān)鍵詞:大數(shù)據(jù) 高校圖書館 挑戰(zhàn) 發(fā)展對策
中圖分類號:G25 文獻標識碼:A 文章編號:1003-9082(2018)01-00-02
前言
近年來,隨著互聯(lián)網(wǎng)技術(shù)的迅猛發(fā)展和智能終端的大量普及,無論數(shù)據(jù)的種類還是規(guī)模都不可同日而語,數(shù)據(jù)的快速增長成了許多行業(yè)共同面對的嚴峻挑戰(zhàn),人類社會已經(jīng)邁入大數(shù)據(jù)(Big Data)時代。高校圖書館是當前知識社會中的重要的知識信息服務中心,如何利用大數(shù)據(jù)技術(shù)去挖掘、分析隱含在數(shù)據(jù)背后的信息,解讀讀者的隱藏訴求,進而改進高校圖書館的服務,是當代高校圖書館面臨的重大難題。
一、大數(shù)據(jù)的概述
1.大數(shù)據(jù)的概念
對于大數(shù)據(jù)的概念,企業(yè)和學術(shù)界目前尚未形成統(tǒng)一的定義。不同的定義基本是從大數(shù)據(jù)的特征出發(fā),通過這些特征的闡述和歸納試圖給出其定義。在這些定義中,比較有代表性的是3V定義[1],即認為大數(shù)據(jù)需滿足3個特點:規(guī)模性(Volume)、多樣性(Velocity)和高速性(Variety)。除此之外,還有提出4V定義的,即嘗試在3V的基礎上增加一個新的特性。關(guān)于第4個V的說法并不統(tǒng)一,國際數(shù)據(jù)公司(International Data Corporation,IDC)認為大數(shù)據(jù)還應當具有價值性(Value)[2],而IBM認為大數(shù)據(jù)必然具有真實性(Veracity)[3]。維基百科對大數(shù)據(jù)的定義[4]則簡單明了:大數(shù)據(jù)是指利用常用軟件工具捕獲、管理和處理數(shù)據(jù)所耗時間超過可容忍時間的數(shù)據(jù)集。
2.大數(shù)據(jù)的研究意義
2015年,隨著國務院印發(fā)《促進大數(shù)據(jù)發(fā)展行動綱要》,大數(shù)據(jù)已經(jīng)上升為國家戰(zhàn)略。大數(shù)據(jù)為高校圖書館服務和發(fā)展趨勢帶來重大影響,從整體學術(shù)關(guān)注度和用戶關(guān)注度、主要研究內(nèi)容和研究方向、研究論文數(shù)量和基金分布等方面分析了近十年來大數(shù)據(jù)對圖書館全面而深入的影響。[5]圖書館即將從“數(shù)字圖書館”邁入“大數(shù)據(jù)圖書館[6]”時代,如何有效利用大數(shù)據(jù),更好地服務讀者,為其創(chuàng)造更加智能、高效、個性化的圖書服務對高校圖書館具有重要的研究意義。
二、大數(shù)據(jù)環(huán)境下高校圖書館面臨的挑戰(zhàn)
1.大數(shù)據(jù)需求不明確
由于大數(shù)據(jù)的概念是近些年才普遍興起,這就導致高校的主管部門對大數(shù)據(jù)的認識不夠深刻,對其發(fā)展的必要性和應用前景了解不多,因此很難對圖書館的大數(shù)據(jù)建設提出準確的需求。主管部門的需求不清晰,圖書館的大數(shù)據(jù)建設就舉步維艱。
2.專項建設資金不足
圖書館的信息基礎設施決定了圖書館的數(shù)據(jù)處理和存儲的能力,在大數(shù)據(jù)時代,圖書館的圖書已不再局限于紙質(zhì)書籍,非結(jié)構(gòu)化數(shù)據(jù)的大量增長,導致原有的軟硬件設施已經(jīng)不能滿足發(fā)展的需求,需要更多的資金投入。然而,很多高校在大數(shù)據(jù)發(fā)展上猶豫不決,這從根本上影響了高校圖書館在大數(shù)據(jù)方向的發(fā)展。
3.數(shù)據(jù)缺乏采集和整合
圖書館大數(shù)據(jù)的采集具有數(shù)據(jù)海量、來源廣泛的特點,半結(jié)構(gòu)化與非結(jié)構(gòu)化數(shù)據(jù)占據(jù)大數(shù)據(jù)總量的85%以上,大幅度增加了圖書館對大數(shù)據(jù)存儲、查找、定位、修改、分析和挖掘的難度,難以滿足圖書館大數(shù)據(jù)即時處理、實時挖掘和動態(tài)決策的需求[7]。
4.大數(shù)據(jù)隱私保護問題
圖書館大數(shù)據(jù)的建設需要采集巨量的讀者和圖書的信息,這些共享的數(shù)據(jù)會越來越多,讀者密碼泄露、系統(tǒng)漏洞都會導致個人資料被盜,這無時無刻不在提醒我們要加強大數(shù)據(jù)網(wǎng)絡安全的建設。[8]對圖書館大數(shù)據(jù)服務環(huán)境下用戶隱私泄露容忍度進行了研究,研究結(jié)果表明:圖書館用戶對隱私泄露容忍度并不高。因此,圖書館在開展大數(shù)據(jù)服務時,應注意在不侵犯用戶隱私權(quán)益的情況下,合法、合理、有節(jié)制地獲取并使用用戶個人信息數(shù)據(jù)。
5.大數(shù)據(jù)人才匱乏
大數(shù)據(jù)建設的每個環(huán)節(jié)都需要依靠專業(yè)的人員來完成,相關(guān)職位需要的更是復合型人才,能夠?qū)?shù)學、統(tǒng)計學、數(shù)據(jù)分析、機器學習和自然語言處理等多方面知識綜合掌控,如此高的門檻導致大數(shù)據(jù)人才的匱乏。
三、大數(shù)據(jù)環(huán)境下高校圖書館的發(fā)展對策
1.政府繼續(xù)出臺指導和扶持政策
為解決高校圖書館發(fā)展大數(shù)據(jù)需求不明確問題,作為教育的主管部門有必要繼續(xù)出臺一系列指導政策,讓大數(shù)據(jù)從業(yè)者和專家一起推動和分享大數(shù)據(jù)在圖書館建設中的應用場景,讓更多的高校教育工作者了解大數(shù)據(jù)的價值,重視大數(shù)據(jù)在未來高校信息化建設中至關(guān)重要的作用。
2.技術(shù)創(chuàng)新
技術(shù)創(chuàng)新正在成為大數(shù)據(jù)時代的發(fā)展關(guān)鍵詞,在大數(shù)據(jù)時代,技術(shù)創(chuàng)新更多的是不同技術(shù)的組合式的創(chuàng)新。中國科學技術(shù)發(fā)展戰(zhàn)略研究院的許曄[9]提出:應在大數(shù)據(jù)的關(guān)鍵技術(shù)領(lǐng)域加強研發(fā),如在大數(shù)據(jù)的分析方法、應用技術(shù)及可視化技術(shù)等方面加大研發(fā)力度。目前,對大數(shù)據(jù)處理的技術(shù)方案幾乎已經(jīng)形成一套通用的技術(shù)架構(gòu)[10]。高校圖書館的大數(shù)據(jù)平臺搭建過程中,應該在已有的大數(shù)據(jù)技術(shù)架構(gòu)的基礎上進行定制開發(fā),解決數(shù)據(jù)采集和整合的難題。
3.企業(yè)與高校數(shù)據(jù)共享
當前許多企業(yè)在大數(shù)據(jù)應用方面已有初步成效,以圖書銷售領(lǐng)域為例,京東、當當、亞馬遜等電商已經(jīng)讓讀者體驗到大數(shù)據(jù)帶來的便利。電商的大數(shù)據(jù)應用已經(jīng)走在了高校前面,高??梢詰闷浼夹g(shù),并與其建立共享的數(shù)據(jù)平臺。圖1以高校圖書館圖書采購為例,簡單闡述了企業(yè)和高校大數(shù)據(jù)共享帶來的變革。
4.企業(yè)與高校聯(lián)合培養(yǎng)人才
為了在新形勢下進一步助力高校培養(yǎng)高科技人才,推動科研成果的應用和轉(zhuǎn)化,需要企業(yè)與高校緊密合作,協(xié)助高校聯(lián)合培養(yǎng)大數(shù)據(jù)人才??陀^來說,目前我國對于大數(shù)據(jù)人才的培養(yǎng)還處于探索階段,對跨學科和交叉復合人才的需求缺口越來越大,企業(yè)和高校聯(lián)手培養(yǎng)大數(shù)據(jù)人才將是必然趨勢。
2015年,阿里云聯(lián)合慧科集團正式啟動了阿里云大學合作計劃AUCP,該計劃已陸續(xù)落地北京航空航天大學、浙江大學、復旦大學等40多家全國高校,并開設云計算與數(shù)據(jù)科學專業(yè)方向,旨在共建互聯(lián)網(wǎng)+教育的新生態(tài)。
2017年北京大學等7所院校的“聯(lián)合培養(yǎng)倡議書”中說,開展跨校、跨學科聯(lián)合培養(yǎng)模式,大力培養(yǎng)有統(tǒng)計、計算機、經(jīng)濟管理等多學科知識的復合型人才,建立與企業(yè)崗位匹配的人才培養(yǎng)標準,為高校畢業(yè)生和大數(shù)據(jù)企業(yè)搭建橋梁。
結(jié)語
大數(shù)據(jù)時代的到來,改變了人們對數(shù)據(jù)的傳統(tǒng)看法與認知,技術(shù)的創(chuàng)新讓人們看到隱藏在大量數(shù)據(jù)背后的世界,然而大數(shù)據(jù)的應用是技術(shù)難度極高的集成應用,需要多個跨學科領(lǐng)域的技術(shù)成果。高校圖書館在面臨除上述主要的挑戰(zhàn)外,圖書館員的數(shù)據(jù)素養(yǎng)的培養(yǎng)[11]、管理體制的限制都會是不得不面對的挑戰(zhàn)因素。互聯(lián)網(wǎng)企業(yè)與信息服務機構(gòu)的大數(shù)據(jù)研究已經(jīng)走在前列,高校圖書館在大數(shù)據(jù)的服務競爭中已經(jīng)落后。盡管圖書館有資源的優(yōu)勢,但高校圖書館在技術(shù)等方面的劣勢限制其難以在短期內(nèi)追趕上,如何避免在大數(shù)據(jù)浪潮中被邊緣化,將是高校圖書館必須考慮的一大問題。
參考文獻
[1]Grobelnik M.Big-data computing: Creating revolutionary breakthroughs in commerce, science and society[R/OL].[2012-10-02].http://videolectures.net/eswc2012_grobelnik_big_data/
[2]Barwick H.The ‘four Vsof Big Data. Implementing Information Infrastructure Symposium [EB/OL].[2012-10-02]. http://www.computerworld.com.au/article/396198/iiis_four_vs_big_data/
[3]IBM.Big Data Analytics [EB/OL].[2012-10-02].http://www-01.ibm.com/software/data/bigdata/
[4]Big data[EB/OL].[2012-l0-02].http://en.wikipedia.org/wiki/Big-data
[5]王丹.大數(shù)據(jù)影響圖書館服務與發(fā)展趨勢的調(diào)查研究[J].圖書館工作與研究,2017,1(6):76-80.
[6]張凱,郭健棲.圖書館主題大數(shù)據(jù)調(diào)查及前瞻性構(gòu)想——基于百度指數(shù)的分析[J].中國圖書館學報, 2016,42(06):51-66.
[7]馬曉亭.基于情景大數(shù)據(jù)的圖書館個性化服務推薦系統(tǒng)研究[J].現(xiàn)代情報,2016(4):90-94.
[8]易紅,任競.圖書館大數(shù)據(jù)服務環(huán)境下用戶隱私泄露容忍度的實證研究[J].圖書館論壇,2016, 36(4):57-64.
[9]許曄.大數(shù)據(jù)時代中國面臨的挑戰(zhàn)與對策[J].中國科技論壇,2015(3):24-29.
[10]孟小峰,慈祥.大數(shù)據(jù)管理:概念、技術(shù)與挑戰(zhàn)[J].計算機研究與發(fā)展,2013,50(01):146-169.
[11]張晨.大數(shù)據(jù)時代的圖書館與數(shù)據(jù)素養(yǎng)教育[J].圖書與情報,2014(4):117-119.