徐升華 王 琪
(江西財(cái)經(jīng)大學(xué)信息管理學(xué)院,江西 南昌 330000)
?
大數(shù)據(jù)時(shí)代數(shù)字圖書館信息服務(wù)研究與發(fā)展*
徐升華1王琪2
(江西財(cái)經(jīng)大學(xué)信息管理學(xué)院,江西 南昌 330000)
[摘要]基于大數(shù)據(jù)時(shí)代的視角,敘述了大數(shù)據(jù)背景下數(shù)字圖書館信息服務(wù)的概念與內(nèi)涵,說(shuō)明將大數(shù)據(jù)和數(shù)字圖書館有機(jī)結(jié)合的必要性,梳理國(guó)內(nèi)外大數(shù)據(jù)背景下數(shù)字圖書館信息服務(wù)的相關(guān)研究和發(fā)展脈絡(luò),采用SWOT分析法總結(jié)國(guó)內(nèi)數(shù)字圖書館信息服務(wù)領(lǐng)域的優(yōu)劣勢(shì)以及所面臨的外部機(jī)遇和挑戰(zhàn),指出大數(shù)據(jù)技術(shù)應(yīng)用于數(shù)字圖書館的發(fā)展方向以及值得進(jìn)一步探討和研究的領(lǐng)域。
[關(guān)鍵詞]大數(shù)據(jù)數(shù)字圖書館信息服務(wù)發(fā)展方向
云計(jì)算、物聯(lián)網(wǎng)、社交網(wǎng)絡(luò)等新興技術(shù)的發(fā)展引發(fā)數(shù)據(jù)的爆炸式增長(zhǎng),為了描述和定義信息爆炸時(shí)代產(chǎn)生的海量數(shù)據(jù),“大數(shù)據(jù)”一詞應(yīng)運(yùn)而生。知名咨詢公司麥肯錫最先提出大數(shù)據(jù)時(shí)代已經(jīng)到來(lái),龐大的數(shù)據(jù)量成為企業(yè)和社會(huì)重要的戰(zhàn)略資源,促使各個(gè)領(lǐng)域都開始了量化進(jìn)程,2013年更是被稱為“大數(shù)據(jù)元年”。在圖書館領(lǐng)域,迅速發(fā)展的數(shù)字圖書館實(shí)現(xiàn)跨越區(qū)域、面向?qū)ο蟮木W(wǎng)絡(luò)查詢和傳播,使人們?cè)谌魏螘r(shí)間和地點(diǎn)通過網(wǎng)絡(luò)獲取所需的信息變?yōu)楝F(xiàn)實(shí),擴(kuò)展了傳統(tǒng)圖書館面向讀者最重要的功能——信息服務(wù)功能,所以在大數(shù)據(jù)時(shí)代,數(shù)字圖書館相較傳統(tǒng)圖書館其信息服務(wù)功能更加突出,極大地促進(jìn)了資源的共享與利用,甚至有觀點(diǎn)認(rèn)為未來(lái)數(shù)字圖書館將會(huì)全面替代傳統(tǒng)圖書館,因此大數(shù)據(jù)時(shí)代的數(shù)字圖書館信息服務(wù)成為學(xué)者研究的新熱點(diǎn)。
1.1大數(shù)據(jù)時(shí)代的概念與內(nèi)涵
2008年,在Google成立10周年之際,《自然》雜志出版的??惺状翁岬健癇ig Data”的概念,討論了未來(lái)大數(shù)據(jù)處理相關(guān)的一系列技術(shù)問題和挑戰(zhàn)。2013年美國(guó)互聯(lián)網(wǎng)數(shù)據(jù)中心指出,互聯(lián)網(wǎng)上的數(shù)據(jù)每年以50%的速度增長(zhǎng),每?jī)赡瓯銓⒎?,而目前世界上九成以上的?shù)據(jù)是近幾年才產(chǎn)生的,所以信息爆炸時(shí)代關(guān)于大數(shù)據(jù)難以有一個(gè)定量的定義,麥肯錫公司給出的定性描述是:一種規(guī)模大到在獲取、存儲(chǔ)、管理、分析方面大大超出了傳統(tǒng)數(shù)據(jù)庫(kù)軟件工具能力范圍的數(shù)據(jù)集合,具有海量的數(shù)據(jù)規(guī)模、快速的數(shù)據(jù)流轉(zhuǎn)、多樣的數(shù)據(jù)類型和價(jià)值密度低四大特征。
進(jìn)一步來(lái)說(shuō),當(dāng)今“大數(shù)據(jù)”一詞的重點(diǎn)不僅僅在于數(shù)據(jù)規(guī)模的定義,它更代表著信息技術(shù)發(fā)展進(jìn)入了一個(gè)新的時(shí)代,代表著大數(shù)據(jù)處理所需的新的技術(shù)和方法,也代表著大數(shù)據(jù)分析和應(yīng)用所帶來(lái)的新發(fā)明、新服務(wù)和新的發(fā)展機(jī)遇。麥肯錫表示“數(shù)據(jù),已經(jīng)滲透到當(dāng)今每一個(gè)行業(yè)和業(yè)務(wù)職能領(lǐng)域,成為重要的生產(chǎn)因素。人們對(duì)于海量數(shù)據(jù)的挖掘和運(yùn)用,預(yù)示著新一波生產(chǎn)率增長(zhǎng)和消費(fèi)者盈余浪潮的到來(lái)”。
1.2數(shù)字圖書館信息服務(wù)的概念與內(nèi)涵
數(shù)字圖書館是傳統(tǒng)圖書館在信息時(shí)代的產(chǎn)物,它不但包含了傳統(tǒng)圖書館的功能——向社會(huì)公眾提供相應(yīng)的服務(wù),還融合了其他信息資源(如博物館、檔案館等)的一些功能,提供綜合的公共信息訪問服務(wù)[1]。通俗地說(shuō),數(shù)字圖書館就是虛擬的、沒有圍墻的圖書館,是基于網(wǎng)絡(luò)環(huán)境下共建共享的可擴(kuò)展的知識(shí)網(wǎng)絡(luò)系統(tǒng),是超大規(guī)模的、分布式的、便于使用的、沒有時(shí)空限制的、可以實(shí)現(xiàn)跨庫(kù)無(wú)縫鏈接與智能檢索的知識(shí)中心。數(shù)字圖書館信息服務(wù)是指利用各種技術(shù)對(duì)信息資源進(jìn)行采集、組織、檢索和傳播等業(yè)務(wù)進(jìn)行處理的一種活動(dòng)[2],其服務(wù)內(nèi)容是提供電子出版物、數(shù)據(jù)庫(kù)、Internet上的各種信息。
1.3大數(shù)據(jù)應(yīng)用于數(shù)字圖書館信息服務(wù)的必要性
隨著信息技術(shù)的飛速發(fā)展和數(shù)字圖書館信息服務(wù)研究的深入,用戶對(duì)數(shù)字圖書館信息服務(wù)需求也從傳統(tǒng)服務(wù)轉(zhuǎn)向“大數(shù)據(jù)”信息服務(wù)。數(shù)字圖書館館藏資源豐富,不僅有結(jié)構(gòu)化數(shù)據(jù),如數(shù)目信息、聲像數(shù)據(jù)等,還有用戶信息、訪問信息等半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù),可以說(shuō)數(shù)字圖書館本身就帶有大數(shù)據(jù)特征。大數(shù)據(jù)時(shí)代使數(shù)字圖書館面臨信息存儲(chǔ)量的大數(shù)據(jù)化,其信息資源的管理、存儲(chǔ)需要建立全新的模式[3]。用戶使用數(shù)字圖書館的信息服務(wù)功能時(shí),都期望反饋到相關(guān)且個(gè)性化的信息,而傳統(tǒng)圖書館提供的信息服務(wù)是有什么就提供什么”,數(shù)字圖書館信息服務(wù)則是愈加趨于強(qiáng)調(diào)個(gè)性化,滿足用戶需求的同時(shí)主動(dòng)推薦相關(guān)信息,這是一種主動(dòng)服務(wù),為了滿足用戶個(gè)性化信息服務(wù)的需要,將大數(shù)據(jù)的數(shù)據(jù)處理技術(shù)應(yīng)用于數(shù)字圖書館可謂水到渠成。
總而言之,大數(shù)據(jù)時(shí)代中科學(xué)數(shù)據(jù)的產(chǎn)生和積累呈指數(shù)級(jí)增長(zhǎng),大數(shù)據(jù)信息服務(wù)體系的開發(fā)和利用將會(huì)是數(shù)字圖書館發(fā)展必不可少的前提條件[4],大數(shù)據(jù)時(shí)代數(shù)字圖書館信息服務(wù)的研究與發(fā)展均大有可為。
2.1國(guó)外大數(shù)據(jù)時(shí)代的數(shù)字圖書館信息服務(wù)研究
國(guó)外對(duì)數(shù)字圖書館研究起步較早,目前已漸趨成熟。對(duì)大數(shù)據(jù)的研究也處在領(lǐng)先水平,將大數(shù)據(jù)和數(shù)字圖書館聯(lián)系在一起研究主要集中在網(wǎng)絡(luò)計(jì)量學(xué)和文獻(xiàn)計(jì)量學(xué)[5]。美國(guó)加州大學(xué)伯克利分校圖書館的Huwe[6]指出:大數(shù)據(jù)與數(shù)字圖書館是完美搭檔,大數(shù)據(jù)十分有益于圖書館員對(duì)用戶進(jìn)行研究的項(xiàng)目,數(shù)字圖書館對(duì)用戶行為信息采集的領(lǐng)域十分值得探索。2003年于哥本哈根舉辦的第五屆世界圖書館聯(lián)盟歐洲會(huì)議討論了聯(lián)盟建立、成本分配、評(píng)估等聯(lián)盟內(nèi)部管理問題以及Elsevier Science的“Big Deals”和未來(lái)發(fā)展問題[7], 2011年第三次世界圖書館聯(lián)盟歐洲會(huì)議,電子信息資源的采購(gòu)問題以及如何更好地提供數(shù)字圖書館信息服務(wù)成為會(huì)議重點(diǎn)[8]。由此看出如何從大數(shù)據(jù)時(shí)代海量的信息資源中提取有用信息以提供更好的信息服務(wù)成為國(guó)外數(shù)字圖書館的重要發(fā)展方向。加州大學(xué)爾灣分校的Renaud、麻省理工學(xué)院的Britton等人[9]借助大數(shù)據(jù)技術(shù)分析挖掘數(shù)字圖書館的用戶行為信息,進(jìn)而輔助學(xué)校關(guān)聯(lián)分析學(xué)生的閱讀行為。加州大學(xué)洛杉磯分校的Christine等人[10]利用嵌入式技術(shù),在數(shù)字圖書館系統(tǒng)中嵌入傳感器,采集有關(guān)數(shù)據(jù),為研究人員開展研究提供數(shù)據(jù),為數(shù)字圖書館增添了新功能。還有其他眾多學(xué)者將研究觸角伸向數(shù)字圖書館對(duì)大數(shù)據(jù)中學(xué)術(shù)信息的采集、處理、關(guān)聯(lián)[11],從而幫助數(shù)字圖書館通過利用大數(shù)據(jù)提供更人性化的信息服務(wù)。
2.2國(guó)外大數(shù)據(jù)時(shí)代的數(shù)字圖書館信息服務(wù)發(fā)展
美國(guó)是信息技術(shù)領(lǐng)域的領(lǐng)先國(guó)家,其非常重視數(shù)字圖書館資源的開發(fā)、利用、共享和信息服務(wù)能力的提升。1967年美國(guó)成立總部位于俄亥俄州的聯(lián)機(jī)計(jì)算機(jī)圖書館中心OCLC (Online Computer Library Center),作為提供數(shù)字資源信息服務(wù)的機(jī)構(gòu)之一,不僅面向國(guó)內(nèi)開放信息資源,更將世界范圍內(nèi)的數(shù)字資源加以共享,時(shí)至今日該中心仍是世界上最大的圖書情報(bào)服務(wù)機(jī)構(gòu)之一。20世紀(jì)90年代美國(guó)實(shí)行數(shù)字圖書館先導(dǎo)計(jì)劃,該計(jì)劃由美國(guó)國(guó)家科學(xué)基金會(huì)負(fù)責(zé),其一期計(jì)劃為1994~1998年,實(shí)現(xiàn)了推動(dòng)收集、存儲(chǔ)、組織數(shù)字化資源的技術(shù)手段的發(fā)展,使數(shù)字化信息能夠通過網(wǎng)絡(luò)進(jìn)行查詢、存儲(chǔ)和管理的目標(biāo)。1999~2004的二期計(jì)劃參與計(jì)劃的大學(xué)數(shù)量由一期的6所增加到二期的20所,并進(jìn)行了以人文和系統(tǒng)為中心的信息服務(wù)研究。其他國(guó)家如德國(guó)、澳大利亞、新西蘭、日本等也紛紛效仿開展了本國(guó)的數(shù)字圖書館信息服務(wù)發(fā)展計(jì)劃。由此看出,政府的支持力度是影響數(shù)字圖書館發(fā)展的重要因素之一。
除政府引導(dǎo)的項(xiàng)目之外,國(guó)外數(shù)字圖書館推進(jìn)信息服務(wù)的大數(shù)據(jù)實(shí)踐主要還有以下幾種方式:一是傳統(tǒng)圖書館建立信息服務(wù)社區(qū)實(shí)體行為智能分析引擎。例如20世紀(jì)90年代數(shù)字圖書館的個(gè)性化信息服務(wù)功能開始興起,美國(guó)康奈爾大學(xué)圖書館、弗吉尼亞公共健康大學(xué)、華盛頓大學(xué)圖書館以及亞洲的新加坡國(guó)立圖書館等都逐漸提供此項(xiàng)服務(wù),其中比較具有代表性的數(shù)字圖書館個(gè)性化信息服務(wù)系統(tǒng)是MyLibrary[12],該系統(tǒng)通過采集用戶數(shù)據(jù)分析挖掘用戶行為習(xí)慣,建立實(shí)體行為智能分析數(shù)據(jù)庫(kù)引擎。二是數(shù)據(jù)資源服務(wù)公司積極利用大數(shù)據(jù)技術(shù)拓展業(yè)務(wù)。美國(guó)俄亥俄州OverDrive公司和大量不同類型的圖書館有長(zhǎng)期合作進(jìn)而收集大量相關(guān)數(shù)據(jù),并將這些數(shù)據(jù)提供給出版商和其他跟自己圖書館有合作關(guān)系的圖書館。與此同時(shí),OverDrive公司還通過其他途徑如Buy ItNow網(wǎng)上商店為圖書館提供圖書館不具備的讀者瀏覽下載書目信息,也為讀者提供了新的發(fā)現(xiàn)圖書的渠道。三是眾多研究機(jī)構(gòu)積極開展大數(shù)據(jù)項(xiàng)目的研究與實(shí)踐。如美國(guó)Library Journal舉辦的“Future of the Academic Library Symposium:E-Text Big Data and Access”學(xué)術(shù)研討會(huì)[13];2009年8月,約翰霍普金斯大學(xué)圖書館構(gòu)建一座數(shù)據(jù)研究基礎(chǔ)設(shè)施,用來(lái)管理過去從教學(xué)和科研中產(chǎn)生的海量增長(zhǎng)的數(shù)字資源。部分高校數(shù)字圖書館對(duì)于大數(shù)據(jù)的側(cè)重點(diǎn)在“數(shù)據(jù)監(jiān)護(hù)”上,如2012年初,巴斯大學(xué)成功完成Research360項(xiàng)目的研發(fā),該項(xiàng)目定義了基于終端對(duì)終端的360機(jī)構(gòu)科研生命周期的概念,并列出了圖書館在科學(xué)數(shù)據(jù)管理的不同操作過程中能夠提供什么樣的信息服務(wù)[14],最終實(shí)現(xiàn)了圖書館內(nèi)部對(duì)數(shù)據(jù)的高效管理。
3.1國(guó)內(nèi)大數(shù)據(jù)時(shí)代的數(shù)字圖書館信息服務(wù)研究
在中國(guó)知網(wǎng)中以關(guān)鍵詞“大數(shù)據(jù)”檢索2010年1月至2015年12月期間的文獻(xiàn),共有8520篇,以關(guān)鍵詞“數(shù)字圖書館”檢索,共有10433篇,將“大數(shù)據(jù)”“數(shù)字圖書館”作為關(guān)鍵詞中間用檢索邏輯詞“and”連接進(jìn)行檢索,只有78篇,并且全部為2013年之后發(fā)表。由此可見,目前國(guó)內(nèi)在數(shù)字圖書館或大數(shù)據(jù)領(lǐng)域取得的研究成果很多,而大數(shù)據(jù)環(huán)境下數(shù)字圖書館信息服務(wù)的研究處于萌芽狀態(tài),進(jìn)一步研究的空間巨大。經(jīng)過檢索、分析前人研究成果,發(fā)現(xiàn)在數(shù)字圖書館研究興起的前期國(guó)內(nèi)關(guān)于圖書館信息服務(wù)的文獻(xiàn)內(nèi)容主要集中在圖書館信息服務(wù)能力的評(píng)價(jià)和提升方面,如黃曉菁[15]分析了信息服務(wù)能力評(píng)價(jià)的意義,在建立評(píng)價(jià)信息系統(tǒng)的指標(biāo)體系模型的基礎(chǔ)上提出了一個(gè)評(píng)價(jià)圖書館信息服務(wù)能力的方案。
大數(shù)據(jù)的興起帶給數(shù)字圖書館的機(jī)遇是多方面的,大數(shù)據(jù)技術(shù)的應(yīng)用可以輔助圖書館進(jìn)行信息資源管理、讀者管理、個(gè)性化信息服務(wù)等,同時(shí),大數(shù)據(jù)時(shí)代數(shù)字圖書館信息服務(wù)面臨的挑戰(zhàn)同樣嚴(yán)峻。未來(lái)數(shù)字圖書館的核心資產(chǎn)將是對(duì)大數(shù)據(jù)的綜合掌握,圖書館管理者們應(yīng)充分考慮到用戶利用信息服務(wù)的便利性,實(shí)現(xiàn)數(shù)據(jù)資源、信息技術(shù)、信息內(nèi)容的集成,根據(jù)用戶特定的信息需求打造個(gè)性化特點(diǎn)的全方位信息服務(wù)[16],國(guó)內(nèi)多位學(xué)者為實(shí)現(xiàn)此目標(biāo)進(jìn)行了相關(guān)研究。李蓓蕾[4]指出電子圖書館的信息服務(wù)需要進(jìn)行多方面創(chuàng)新,實(shí)現(xiàn)實(shí)時(shí)信息查詢、個(gè)性化信息定制、實(shí)時(shí)參考咨詢等,陳臣等[17]則設(shè)計(jì)了基于大數(shù)據(jù)的數(shù)字圖書館高效搜索引擎,突出了搜索引擎的用戶個(gè)性化信息服務(wù)功能。大數(shù)據(jù)也從用戶群的整合、數(shù)據(jù)的重構(gòu)以及服務(wù)模式的挖掘等方面深度影響了圖書館傳統(tǒng)的移動(dòng)信息服務(wù),數(shù)字圖書館的信息服務(wù)應(yīng)結(jié)合大數(shù)據(jù)背景進(jìn)行數(shù)據(jù)信息資源整合、個(gè)性化服務(wù)展示、“一站式”全功能檢索等多方面的服務(wù)創(chuàng)新[18]。而楊穎等[19]則一針見血地指出大數(shù)據(jù)對(duì)數(shù)字圖書館信息服務(wù)帶來(lái)巨大沖擊,數(shù)字圖書館必須利用大數(shù)據(jù)原理和技術(shù)來(lái)創(chuàng)新信息服務(wù)方式。通過分析比較數(shù)字圖書館與大數(shù)據(jù)研究范式的結(jié)果,張興旺等[20]認(rèn)為二者的有機(jī)融合需要從方法論創(chuàng)新、信息檢索模式創(chuàng)新、知識(shí)服務(wù)模型創(chuàng)新、系統(tǒng)論視角創(chuàng)新和數(shù)據(jù)分析方法創(chuàng)新5個(gè)方面入手。可以發(fā)現(xiàn)國(guó)內(nèi)學(xué)者均認(rèn)可大數(shù)據(jù)將會(huì)給數(shù)字圖書館信息服務(wù)領(lǐng)域帶來(lái)巨大的變革,但如何抓住機(jī)遇在大數(shù)據(jù)時(shí)代進(jìn)行數(shù)字圖書館信息服務(wù)的創(chuàng)新仍然需要不斷研究與探索。
3.2國(guó)內(nèi)大數(shù)據(jù)時(shí)代的數(shù)字圖書館信息服務(wù)發(fā)展
根據(jù)國(guó)家數(shù)字圖書館統(tǒng)計(jì)2007年國(guó)家數(shù)字圖書館數(shù)字資源發(fā)布總量為14.774TB,2009年為251.33TB,2011年為378.6TB,截至2013年底,國(guó)家數(shù)字圖書館數(shù)字資源總量已達(dá)到874.5TB,其中自建數(shù)字資源量為737.9TB,網(wǎng)絡(luò)信息采集量達(dá)45.7TB,外購(gòu)中外文數(shù)據(jù)庫(kù)共計(jì)273個(gè),文津搜索匯集的元數(shù)據(jù)已達(dá)2.9億條。隨著信息服務(wù)擴(kuò)展至計(jì)算機(jī)、數(shù)字電視、手機(jī)、手持閱讀器、平板電腦、電子觸摸屏等多種服務(wù)終端,服務(wù)量不斷增加,各業(yè)務(wù)系統(tǒng)每天都會(huì)產(chǎn)生大量的日志數(shù)據(jù)。在大數(shù)據(jù)環(huán)境下面對(duì)信息“快速、簡(jiǎn)單、準(zhǔn)確”的要求,國(guó)家圖書館計(jì)算機(jī)與網(wǎng)絡(luò)系統(tǒng)部主任魏大威表示未來(lái)數(shù)字圖書館會(huì)加大資源的揭示力度,全面提升信息服務(wù)能力。國(guó)家數(shù)字圖書館將主要從兩方面發(fā)展,首先是將建立超大型元數(shù)據(jù)倉(cāng)儲(chǔ),結(jié)合大數(shù)據(jù)特點(diǎn)和資源現(xiàn)狀,以用戶需求為導(dǎo)向,突出特色,通過異構(gòu)數(shù)字資源的融合、聚類和重組使資源從數(shù)據(jù)層的揭示與展現(xiàn)轉(zhuǎn)向信息層、知識(shí)層的深度服務(wù);其次是將知識(shí)圖譜可視化展示給讀者,依托融合的物聯(lián)網(wǎng)、移動(dòng)通信網(wǎng)以及互聯(lián)網(wǎng)絡(luò)進(jìn)行傳播,最終實(shí)現(xiàn)為用戶提供電視、電腦、手機(jī)等多種終端的接收,加強(qiáng)用戶數(shù)據(jù)分析,實(shí)現(xiàn)個(gè)性服務(wù),促進(jìn)業(yè)界合作,實(shí)現(xiàn)共知共享。同時(shí)國(guó)內(nèi)很多地方或高校圖書館致力于數(shù)字圖書館個(gè)性化信息服務(wù)方面的發(fā)展。汕頭市圖書館、佛山市圖書館、廈門大學(xué)圖書館、武漢科技學(xué)院圖書館等采用深圳市圖書館開發(fā)的ILAS系統(tǒng)開通“我的圖書館”服務(wù)項(xiàng)目,該系統(tǒng)是文化部于1988年作為國(guó)家重點(diǎn)科技項(xiàng)目下達(dá)、由深圳圖書館承擔(dān)并組織開發(fā)出來(lái)的一套能適應(yīng)國(guó)內(nèi)外不同層次、多種規(guī)模、各種類型圖書館使用的圖書館自動(dòng)化集成系統(tǒng),能夠?qū)崿F(xiàn)信息查詢、聯(lián)合目錄以及感興趣的新書等功能,極大提升了數(shù)字圖書館信息服務(wù)的能力。
大數(shù)據(jù)時(shí)代傳統(tǒng)圖書館紛紛在數(shù)字圖書館信息服務(wù)領(lǐng)域發(fā)力的同時(shí),國(guó)內(nèi)的學(xué)術(shù)資源建設(shè)商發(fā)展同樣迅猛。例如,中國(guó)最大的學(xué)術(shù)資源建設(shè)商中國(guó)知網(wǎng),已由中國(guó)期刊論文資源建設(shè)逐步拓展到國(guó)內(nèi)外期刊論文、會(huì)議論文、學(xué)位論文、報(bào)紙文章、專利等,同時(shí)收錄大量圖書,提供年鑒、工具書的查詢服務(wù)[21],其他資源建設(shè)商,如萬(wàn)方數(shù)據(jù)知識(shí)服務(wù)平臺(tái)、超星數(shù)字圖書館、維普期刊服務(wù)平臺(tái)以及中國(guó)社會(huì)科學(xué)文庫(kù)等也提供了眾多學(xué)術(shù)資源。這些資源建設(shè)商提供的海量學(xué)術(shù)資源對(duì)傳統(tǒng)數(shù)字圖書館形成了很大的沖擊,是我國(guó)普通高校數(shù)字圖書館信息服務(wù)不可或缺的部分。同時(shí)一些網(wǎng)絡(luò)資源服務(wù)商也開始涉足學(xué)術(shù)資源領(lǐng)域。以百度為例,除了百度文庫(kù)、百度百科等學(xué)術(shù)資源,還有百度知道這類基于搜索的互動(dòng)式知識(shí)問答分享信息服務(wù)平臺(tái),此外百度學(xué)術(shù)搜索也于2014年06月初上線,可檢索到收費(fèi)和免費(fèi)的學(xué)術(shù)論文,并通過時(shí)間篩選、標(biāo)題、關(guān)鍵字、摘要、作者、被引用次數(shù)等細(xì)化指標(biāo)提高檢索的精準(zhǔn)性,百度文獻(xiàn)檢索功能的用戶體驗(yàn)越來(lái)越優(yōu)質(zhì)。根據(jù)公開信息,百度每天響應(yīng)來(lái)自138個(gè)國(guó)家和地區(qū)的數(shù)十億次請(qǐng)求,每日新增數(shù)據(jù)10TB,處理超過100PB的數(shù)據(jù),從浩如煙海的信息中精確抓取約10億網(wǎng)頁(yè),同時(shí)索引庫(kù)還擁有千億級(jí)在線索引能力,以幫助用戶完成搜索過程[23]。面對(duì)海量的大數(shù)據(jù),百度自建數(shù)據(jù)中心,開發(fā)自己的大數(shù)據(jù)存儲(chǔ)系統(tǒng),并使用了多項(xiàng)新技術(shù),百度云計(jì)算(陽(yáng)泉)中心數(shù)據(jù)存儲(chǔ)量將超過4000PB,可存儲(chǔ)的信息量相當(dāng)于20多萬(wàn)個(gè)中國(guó)國(guó)家圖書館的藏書總量[22]。
伴隨著云計(jì)算、移動(dòng)互聯(lián)網(wǎng)、物聯(lián)網(wǎng)等信息技術(shù)的成熟,大數(shù)據(jù)技術(shù)將會(huì)給數(shù)字圖書館帶來(lái)深遠(yuǎn)的影響和創(chuàng)造性的變化,將大數(shù)據(jù)技術(shù)應(yīng)用于數(shù)字圖書館信息服務(wù)是圖書情報(bào)領(lǐng)域無(wú)法回避的未來(lái)技術(shù)發(fā)展形態(tài),也是數(shù)字圖書館實(shí)現(xiàn)信息服務(wù)模式轉(zhuǎn)變和創(chuàng)新的必然發(fā)展方向。分析大數(shù)據(jù)時(shí)代的數(shù)字圖書館信息服務(wù)研究和發(fā)展歷程,可以發(fā)現(xiàn)目前國(guó)外相關(guān)研究和發(fā)展已有一定的成果,國(guó)內(nèi)相關(guān)領(lǐng)域也正在迎頭趕上,利用SWOT分析法分析大數(shù)據(jù)時(shí)代與國(guó)外對(duì)比后國(guó)內(nèi)數(shù)字圖書館信息服務(wù)研究和發(fā)展優(yōu)勢(shì)的內(nèi)部?jī)?yōu)勢(shì)、劣勢(shì)以及全球信息化形式下面臨的機(jī)遇和挑戰(zhàn),總結(jié)如圖1所示。
圖1 國(guó)內(nèi)大數(shù)據(jù)時(shí)代數(shù)字圖書館信息服務(wù)研究與發(fā)展的SWOT分析
根據(jù)SWOT分析,未來(lái)我國(guó)數(shù)字圖書館如何更好地將大數(shù)據(jù)技術(shù)應(yīng)用于信息服務(wù)需要從以下幾個(gè)方面著手:
①建立數(shù)字圖書館聯(lián)盟,共享信息資源,通過合作提高整體效益;
②加強(qiáng)技術(shù)創(chuàng)新,解決大數(shù)據(jù)技術(shù)在數(shù)字圖書館應(yīng)用中的網(wǎng)絡(luò)環(huán)境適應(yīng)問題;
③整合系統(tǒng)信息資源,提供集成檢索服務(wù)。將不同來(lái)源、不同格式和類型的信息資源通過聯(lián)盟方式無(wú)縫連接后,提供強(qiáng)大的集成檢索功能,使用戶能夠通過一種檢索策略查詢到不同數(shù)據(jù)源的反饋結(jié)果;
④進(jìn)一步加強(qiáng)數(shù)字圖書館信息服務(wù)的移動(dòng)化和可視化功能。在移動(dòng)互聯(lián)網(wǎng)時(shí)代人們閱讀方式和習(xí)慣均發(fā)生改變,數(shù)字圖書館需要改變自身信息服務(wù)模式迎合用戶習(xí)慣;
⑤提升個(gè)性化信息服務(wù)體驗(yàn)。增強(qiáng)數(shù)據(jù)分析思維,以用戶為導(dǎo)向,根據(jù)數(shù)據(jù)分析用戶的特點(diǎn)和偏好主動(dòng)推薦用戶需要的個(gè)性化信息;
⑥完善信息安全體系。加強(qiáng)網(wǎng)絡(luò)安全防護(hù)措施,增強(qiáng)網(wǎng)絡(luò)安全感知能力,防止信息泄露和信息破壞。
信息技術(shù)發(fā)展所帶來(lái)的機(jī)會(huì)總是稍縱即逝的,如何利用大數(shù)據(jù)技術(shù)更好地推進(jìn)以上問題的解決是未來(lái)數(shù)字圖書館信息服務(wù)研究和發(fā)展的重點(diǎn),在趕超國(guó)外的過程中需要善于抓住信息技術(shù)應(yīng)用領(lǐng)域的前沿技術(shù),學(xué)習(xí)、研究大數(shù)據(jù)思維,在實(shí)際研究和應(yīng)用中加以創(chuàng)新數(shù)字圖書館信息服務(wù),提升圖書館的核心競(jìng)爭(zhēng)力,以期在未來(lái)實(shí)現(xiàn)圖書館服務(wù)的跨越。
參考文獻(xiàn):
[1]陸穎雋.虛擬現(xiàn)實(shí)技術(shù)在數(shù)字圖書館的應(yīng)用研究[D].武漢:武漢大學(xué),2013.
[2]孫坦.開放信息環(huán)境:學(xué)術(shù)圖書館信息資源建設(shè)的重定義與再造[J].中國(guó)圖書館學(xué)報(bào),2013(3):9-17.
[3]李翠萍,常娥.大數(shù)據(jù)時(shí)代數(shù)字圖書館發(fā)展淺析[J].江蘇技術(shù)師范學(xué)院學(xué)報(bào),2013(5):30-132.
[4]李蓓蕾,王映花,劉海.淺析大數(shù)據(jù)時(shí)代高校圖書館的信息服務(wù)[J].科技風(fēng),2014(12):239.
[5]杜暉.基于耦合關(guān)系的學(xué)術(shù)信息資源深度聚合研究[D].武漢:武漢大學(xué),2013.
[6]Huwe TK.Buliding digital libraries:big data and the library:a natural fit[J].Computers in Libraries,2014(2):17-18.
[7]Yamamoto,Kazuo.2004.Report of the International Coalition of Library Consortiain Europe Meeting.Joumal of ColIegeand University Libraries;(71)Mar,pp.56-62.
[8] Holmstroem,J.2002.International Coalition of Library Consortia in Europe Nordinfo Nytt;(2~3),pp.21-27.
[9]Renaud J,Britton S,Wang D,et al.Mining library and university data to understand library use patterns[J].The Electronic Library,2015(3):355-372.
[10]Borgman CL,Wallis JC,Mayernik M S,etal.Drowning in data:digital library architecture to support scientific useof embedded sensor networks[C]//JCDL 07:Proceedings of the7th ACM/IEEE-CSJointConference on Digital Libraries,2007.
[11]W illiams K,Wu J,Choudhury SR,er al.Scholarly big data information extration and integration in the CiteSeerx digital library[C]//Data Engineering Workshops(ICDEW),2014 IEEE 30th InternationalConference,2014:68-73.
[12]楊曉湘,孫坦.中美圖書館MyLibrary個(gè)性化服務(wù)系統(tǒng)的比較研究[J].現(xiàn)代情報(bào),2005(10):220-223.
[13]Watters A.StrataWeek:Harvard Library releasesbig data for itsbool[EB/OL].[2016-01-02]http//strata.oreilly.com/ 2012/04/harvard-book-data-clouder-a-hadoop-splunkipo.html.
[14]Spolanka.Over Drive announces a series of“Big Data”reports[EB/OL][2016-01-06].http://www.libraries.wright. edu/noshelfrequired/2012/04/11/overdrive-an-nounces-a -series-of-big-data-reports.
[15]黃曉菁.基于AHP方法的圖書館信息服務(wù)能力研究[J].情報(bào)雜志,2007(9):149-151.
[16]鄧媛.大數(shù)據(jù)形勢(shì)下圖書館建設(shè)的機(jī)遇與挑戰(zhàn)[J].內(nèi)蒙古科技與經(jīng)濟(jì),2015(7):105-106.
[17]陳臣,陳雙飛.一種基于大數(shù)據(jù)的數(shù)字圖書館高效搜索引擎[J].現(xiàn)代情報(bào),2014(1):49-51.
[18]陳茫,周力青,呂艷娥.大數(shù)據(jù)時(shí)代下的圖書館移動(dòng)服務(wù)創(chuàng)新研究[J].圖書與情報(bào),2014(1):117-121.
[19]楊穎,崔雷,郭繼軍.大數(shù)據(jù)時(shí)代圖書館知識(shí)服務(wù)的創(chuàng)新[J].醫(yī)學(xué)信息學(xué)雜志,2014(4):63-66.
[20]張興旺,李晨暉.數(shù)字圖書館與大數(shù)據(jù):研究范式的分析、比較與融合[J].情報(bào)理論與實(shí)踐,2015(12):37-42.
[21]中國(guó)知網(wǎng)資源總庫(kù)[EB/OL].[2015-07-01].http://epub. cnki.net/kns/subPage/Total.aspx.(China national know ledge infrastructure[EB/OL].[2015-07-01].http://epub. cnki.net/kns/subPage/Total.aspx.)
[22]大數(shù)據(jù)史記:盤點(diǎn)中國(guó)2013行業(yè)數(shù)據(jù)量[EB/OL].[2016-01-01].http://www.aliyun.com/zixun/content/2_11_473021. html.
徐升華男,1952年生。教授,博士生導(dǎo)師。研究方向:知識(shí)管理。
王琪女,1992年生,碩士研究生。研究方向:圖書館管理、知識(shí)管理。
[分類號(hào)]G252
*本文系國(guó)家自然科學(xué)基金項(xiàng)目“企業(yè)協(xié)同創(chuàng)新過程中知識(shí)互動(dòng)機(jī)制研究”(項(xiàng)目編號(hào):71561010);江西省研究生創(chuàng)新專項(xiàng)基金項(xiàng)目“社交媒體環(huán)境下企業(yè)知識(shí)互動(dòng)影響因素研究”(項(xiàng)目編號(hào):YC2015-B052)成果。
收稿日期:(2016-01-22;責(zé)編:王天泥。)