胡麗琴
摘要:本文對大數(shù)據(jù)在圖書采訪工作中的應(yīng)用進行了研究,發(fā)現(xiàn)雖然大數(shù)據(jù)應(yīng)用已是當(dāng)前各行業(yè)的熱門發(fā)展方向,但是在圖書采訪工作中的應(yīng)用情況整體比較落后。有一些實力強的圖書館已有大數(shù)據(jù)應(yīng)用于采訪工作的實踐,采訪人員有更多決策參考依據(jù),提高了采訪質(zhì)量。但大部分圖書館對大數(shù)據(jù)的應(yīng)用還處于比較簡單的階段。本文認(rèn)為采訪人員應(yīng)積極主動推動大數(shù)據(jù)應(yīng)用,從而更好地完成采訪工作。
Abstract: This paper studies on application of big data in the books acquisition work, and found that although the big data is the current hot trend in many industries, but it is relatively backward. In some libraries people make good use of big data in books acquisition, but most libraries in the application of big data is still in relatively simple stage. This paper argues that acquisitioning staff should promote the application of big data to do better books acquisitioning work.
關(guān)鍵詞:圖書館;大數(shù)據(jù);采訪
Key words: library;big data;books acquisition
中圖分類號:G25 文獻(xiàn)標(biāo)識碼:A 文章編號:1006-4311(2018)33-0268-02
0 引言
大數(shù)據(jù)(Big Data)是指“那些大小已經(jīng)超出了傳統(tǒng)意義上的尺度,一般的軟件工具難以捕捉、存儲、管理和分析的數(shù)據(jù)[1]”。上世紀(jì)80年代美國已經(jīng)有人提出大數(shù)據(jù)的概念,而計算機和互聯(lián)網(wǎng)技術(shù)的發(fā)展,使各類記錄的數(shù)據(jù)量激增,近幾年“大數(shù)據(jù)”已成為人們關(guān)注的熱點。2013年11月,我國十多位院士向高層建議我國應(yīng)制定大數(shù)據(jù)國家戰(zhàn)略,并在發(fā)展目標(biāo)、發(fā)展原則、關(guān)鍵技術(shù)等方面做好頂層設(shè)計,提出了包括構(gòu)建大數(shù)據(jù)研究平臺、構(gòu)建大數(shù)據(jù)良性生態(tài)環(huán)境、構(gòu)建大數(shù)據(jù)產(chǎn)業(yè)鏈等,并提出“在安全、醫(yī)療、衛(wèi)生、教育等公共服務(wù)領(lǐng)域開展大數(shù)據(jù)應(yīng)用示范,提高應(yīng)急處置能力和安全防范能力,提升服務(wù)能力和運作效率[2]”。2015年8月,《國務(wù)院關(guān)于印發(fā)促進大數(shù)據(jù)發(fā)展行動綱要的通知》(國發(fā)〔2015〕50號)發(fā)布,明確了發(fā)展大數(shù)據(jù)的指導(dǎo)思想、發(fā)展目標(biāo)和發(fā)展任務(wù),為未來我國大數(shù)據(jù)發(fā)展與應(yīng)用指明了方向。同年10月,《中共中央關(guān)于制定國民經(jīng)濟和社會發(fā)展第十三個五年規(guī)劃的建議》發(fā)布,明確提出了“實施國家大數(shù)據(jù)戰(zhàn)略,推進數(shù)據(jù)資源開放共享”。在國家政策層面的導(dǎo)向和各行業(yè)發(fā)展的需求下,大數(shù)據(jù)在我國的發(fā)展進入了快速發(fā)展的時期。2014年12月,我國第一家大數(shù)據(jù)交易平臺北京中關(guān)村數(shù)海大數(shù)據(jù)大數(shù)據(jù)交易平臺正式發(fā)布上線,2015年4月14日,我國首個大數(shù)據(jù)交易所在貴陽掛牌。其后,武漢、河北、上海、浙江等地相繼創(chuàng)建了大數(shù)據(jù)交易平臺或交易中心。以貴陽大數(shù)據(jù)交易所為例,截至2018年8月,交易金額已經(jīng)累計突破3億元,會員數(shù)量2000多家,可交易的數(shù)據(jù)總量超過150PB[3]。可以說,我們已經(jīng)身處大數(shù)據(jù)的環(huán)境之中。
1 大數(shù)據(jù)應(yīng)用于圖書館采訪工作的背景
圖書館的建設(shè)發(fā)展與國家和社會發(fā)展的節(jié)奏息息相關(guān)。大數(shù)據(jù)環(huán)境下,圖書館的各項工作不僅遭遇到了壓力,同時也迎來了發(fā)展的機遇。圖書館作為文獻(xiàn)信息資源中心,為讀者提供各類紙質(zhì)圖書、期刊雜志報紙以及電子資源的閱讀和利用服務(wù)。利用互聯(lián)網(wǎng)及計算機技術(shù),讀者能夠方便快捷的從圖書館借閱或者獲取自己需要的資源。但在大數(shù)據(jù)環(huán)境下,讀者在其他領(lǐng)域體驗到了企業(yè)基于用戶大數(shù)據(jù)分析的優(yōu)質(zhì)服務(wù),對比圖書館相對落后的服務(wù)模式難免會產(chǎn)生體驗舒適度的落差,讀者可能會因此放棄圖書館而轉(zhuǎn)到其他途徑獲得所需要的服務(wù)。另一方面,圖書館面對壓力如果能順應(yīng)潮流,積極利用大數(shù)據(jù)為讀者提供更優(yōu)質(zhì)的服務(wù),則會開拓圖書館發(fā)展的新領(lǐng)域。本文從圖書館采訪工作的角度,對我國圖書館目前在大數(shù)據(jù)領(lǐng)域開展的服務(wù)進行了研究,試圖總結(jié)和提出圖書館利用大數(shù)據(jù)的實踐方式和途徑,以期在今后的工作中有更大的進步和發(fā)展。
2 基于大數(shù)據(jù)的圖書采訪輔助系統(tǒng)
基于大數(shù)據(jù)的圖書采訪輔助系統(tǒng)主要是指通過收集分析館藏、流通和檢索等環(huán)節(jié)的數(shù)據(jù),實現(xiàn)圖書采訪的輔助決策功能。以復(fù)旦大學(xué)圖書館開發(fā)并使用的圖書采訪輔助決策支持系統(tǒng)為例,通過“從網(wǎng)絡(luò)底層、圖書館集成管理系統(tǒng)、數(shù)據(jù)庫廠商等多途徑獲取圖書館的現(xiàn)有館藏數(shù)據(jù)、流通數(shù)據(jù)和OPAC檢索日志數(shù)據(jù),構(gòu)建基于圖書館流通日志的圖書借閱數(shù)據(jù)倉庫維度模型和基于OPAC日志的點擊流數(shù)據(jù)倉庫,實現(xiàn)對不同類型的數(shù)據(jù)進行多維度統(tǒng)計分析[4]”。通過圖書采訪輔助決策支持系統(tǒng),復(fù)旦大學(xué)圖書館的采訪人員能夠?qū)σ延叙^藏進行各類分析從而結(jié)合本館的資源建設(shè)策略進行調(diào)整和優(yōu)化,還能通過流通和檢索數(shù)據(jù)的分析來獲取館藏的利用情況以及讀者想要閱讀的圖書信息。南昌大學(xué)圖書館的中文圖書采訪輔助系統(tǒng)通過在匯文系統(tǒng)上加掛數(shù)據(jù)采集系統(tǒng)來實現(xiàn),系統(tǒng)提供的數(shù)據(jù)包括“作者簡歷與背景、作者在該領(lǐng)域發(fā)表的論文數(shù)量和論文被引用情況(基于CNKI平臺)以及作者以前的作品被讀者借閱的頻次以及數(shù)量[5]”。采訪人員在對新書書目進行篩選時,通過關(guān)聯(lián)數(shù)據(jù)采集系統(tǒng)的作者信息掌握新書作者在本專業(yè)領(lǐng)域的影響力及在本館的受歡迎程度,由此做出是否購買的決定。經(jīng)統(tǒng)計,南昌大學(xué)圖書館通過輔助系統(tǒng)采選的的圖書,“零借閱率下降了30%[5]”。清華大學(xué)圖書館2013年開始建立了以學(xué)者為中心的知識關(guān)聯(lián)網(wǎng)絡(luò),通過海量文獻(xiàn)數(shù)據(jù)的分析自動甄別出清華大學(xué)目標(biāo)學(xué)者,獲取這些學(xué)者的相關(guān)學(xué)術(shù)信息,因而在參訪工作中能利用這些信息進行決策[6]。
其他基于大數(shù)據(jù)的系統(tǒng)如四川省圖書館陳雪樵等人提出的“基于大數(shù)據(jù)的圖書館應(yīng)用系統(tǒng)”平臺[7]、蘭州商學(xué)院馬曉亭設(shè)計的圖書館大數(shù)據(jù)資源整合平臺[8]等。但這些系統(tǒng)基本停留在設(shè)計階段,尚未得到實際應(yīng)用。
通過大數(shù)據(jù)的挖掘和分析,圖書采訪輔助系統(tǒng)能夠幫助采訪人員更準(zhǔn)確地掌握本館的資源建設(shè)和利用情況,采訪工作更精準(zhǔn)更符合館藏原則和讀者需求。
3 基于圖書館信息管理系統(tǒng)的數(shù)據(jù)應(yīng)用
雖然基于大數(shù)據(jù)的圖書采訪輔助系統(tǒng)對高質(zhì)量的采訪工作來說有很高價值,但系統(tǒng)的建設(shè)依賴于圖書館的綜合實力,只有少數(shù)大館才有人力財力來實現(xiàn)。對大多數(shù)圖書館來說,也可以退而求其次,在采訪工作中直接利用圖書館信息管理系統(tǒng)提供的數(shù)據(jù)分析功能,也能有效地提高采訪質(zhì)量。如江蘇匯文軟件公司的Libsys圖書館管理系統(tǒng),其最新版本LibsysV5.5增加“集成匯文云服務(wù)采訪協(xié)同應(yīng)用,基于匯文云服務(wù)的大數(shù)據(jù)分析,為采訪人員提供必要的決策幫助[9]”。
3.1 信息管理系統(tǒng)統(tǒng)計功能模塊的應(yīng)用 圖書館信息管理軟件都自帶各種功能模塊,其中的統(tǒng)計模塊一般能實現(xiàn)對系統(tǒng)數(shù)據(jù)的各種挖掘和統(tǒng)計分析功能,與采訪相關(guān)的功能如流通綜合統(tǒng)計、利用率分析、館藏文獻(xiàn)統(tǒng)計、讀者成分分析等。如能充分利用統(tǒng)計模塊,對館藏的實際利用情況進行精確的評估,就可作為采訪工作的參考依據(jù)。如遼寧科技大學(xué)圖書館在中文圖書采訪工作中利用匯文系統(tǒng)中的統(tǒng)計功能,對館藏的類目結(jié)構(gòu)、學(xué)科機構(gòu)進行了數(shù)據(jù)分析對比,發(fā)現(xiàn)了重點學(xué)科、新增專業(yè)和停辦專業(yè)相關(guān)館藏建設(shè)中存在的一些問題,并據(jù)此調(diào)整優(yōu)化了原有的采訪原則[10]。
3.2 信息管理系統(tǒng)檢索功能模塊的應(yīng)用 檢索功能記錄了讀者在使用圖書館信息管理軟件的過程中的痕跡,采訪人員可以通過檢索功能提供的數(shù)據(jù)了解讀者關(guān)注度高的圖書信息,從而及時采購圖書。如匯文系統(tǒng)的書目檢索系統(tǒng)有熱門檢索詞、熱門借閱、熱門圖書及被讀者收藏最多的圖書等排行。清華大學(xué)圖書館的水木搜索平臺提供清華人物和熱門標(biāo)簽兩種熱門搜索,還根據(jù)讀者搜索次數(shù)繪制了熱點研究學(xué)科的年度變化曲線。采訪人員可通過統(tǒng)計的熱門檢索詞或讀者收藏的數(shù)據(jù)及時購買讀者關(guān)注的圖書,也可以參考熱門借閱和熱門圖書根據(jù)實際的流通頻率增加熱門圖書的復(fù)本。
隨著大數(shù)據(jù)應(yīng)用的逐步升溫,各種圖書館信息管理系統(tǒng)都在逐步增強大數(shù)據(jù)的挖掘和分析功能,因此圖書館的采訪人員也可直接利用這些功能作為采訪工作的輔助手段,提高圖書采訪質(zhì)量。
4 大數(shù)據(jù)在圖書采訪中的應(yīng)用現(xiàn)狀分析
結(jié)合上述研究,大數(shù)據(jù)在圖書采訪中的應(yīng)用現(xiàn)狀主要包括下面兩個方面。
4.1 大部分圖書館采訪人員的技術(shù)實力不足以實現(xiàn)大數(shù)據(jù)的應(yīng)用 數(shù)據(jù)獲取途徑最佳是能在圖書館已有信息管理系統(tǒng)基礎(chǔ)上開發(fā)出適合本館的采訪工作平臺,能收集匯總來自出版社、書商、讀者等各方面產(chǎn)生的大量數(shù)據(jù),包括書目信息、作者信息、讀者借閱等等。數(shù)據(jù)獲取后的分析也是大數(shù)據(jù)系統(tǒng)必備的功能,目前的數(shù)據(jù)分析能力現(xiàn)狀與數(shù)據(jù)獲取能力都取決于圖書館所用信息管理系統(tǒng)及采訪工作平臺的功能。但是目前只有少數(shù)圖書館能自行開發(fā)并使用基于大數(shù)據(jù)的圖書采訪輔助系統(tǒng),其他大部分圖書館還依賴于軟件公司的信息管理軟件所提供的數(shù)據(jù)。雖然這些數(shù)據(jù)也在一定程度上對采訪工作有幫助,但軟件公司提供的都是同質(zhì)性的數(shù)據(jù)及分析,缺乏個性化的、滿足本館采訪需求的輔助決策功能。數(shù)據(jù)分析人員是大數(shù)據(jù)得以應(yīng)用的人力基礎(chǔ),但是圖書館采訪人員中以圖書情報等相關(guān)專業(yè)人員為主,要完成海量數(shù)據(jù)的分析工作是非常困難的。雖然采訪人員有利用大數(shù)據(jù)的迫切愿望,但實際的數(shù)據(jù)處理能力并不足以完成大數(shù)據(jù)的分析工作。
4.2 大數(shù)據(jù)在各圖書館采訪工作中的應(yīng)用冷熱不均 雖然大數(shù)據(jù)是近幾年各領(lǐng)域的熱門,但在圖書館工作中卻表現(xiàn)出冷熱不均的情況。清華大學(xué)圖書館、復(fù)旦大學(xué)圖書館等大館表現(xiàn)出積極的態(tài)度,自行開發(fā)利用大數(shù)據(jù)技術(shù)平臺挖掘數(shù)據(jù)價值,尤其在采訪工作中提供輔助決策依據(jù)。但其他中小館則局限于技術(shù)和財力,雖有心追隨大數(shù)據(jù)的潮流,卻只能盡量在現(xiàn)有的信息管理軟件基礎(chǔ)上獲得有限的大數(shù)據(jù)和數(shù)據(jù)分析。除圖書館實力的影響外,管理者的發(fā)展思路也影響了大數(shù)據(jù)的應(yīng)用。一些中小館的管理者還處于“守成”的思想階段,即使認(rèn)同大數(shù)據(jù)的發(fā)展趨勢,也沒有將大數(shù)據(jù)與圖書館的發(fā)展聯(lián)系起來。同時,管理思想的局限性也影響了采訪人員的工作主動性。
5 總結(jié)
本文對大數(shù)據(jù)在圖書采訪工作中的應(yīng)用進行了研究,發(fā)現(xiàn)雖然大數(shù)據(jù)應(yīng)用是當(dāng)前各行業(yè)的熱門發(fā)展方向,但是在圖書采訪工作中的應(yīng)用卻比較落后。大部分研究處于理論研究階段,只有少數(shù)圖書館已經(jīng)有大數(shù)據(jù)應(yīng)用的實踐經(jīng)驗,這些實踐經(jīng)驗證明大數(shù)據(jù)應(yīng)用于圖書采訪工作能提高采訪質(zhì)量,使得采訪人員有更多決策參考依據(jù)。因此,采訪人員應(yīng)該積極推動大數(shù)據(jù)在采訪工作中得到利用,爭取館領(lǐng)導(dǎo)的思想和技術(shù)支持,從而盡快利用大數(shù)據(jù)更好地完成采訪工作。
參考文獻(xiàn):
[1]涂子沛.大數(shù)據(jù):正在到來的數(shù)據(jù)革命,以及它如何改變政府、商業(yè)與我們的生活[M].桂林:廣西師范大學(xué)出版社,2013.
[2]中國互聯(lián)網(wǎng)絡(luò)信息中心互聯(lián)網(wǎng)政策研究全球動態(tài)[EB/OL].[2018-06-23].http://www.cnnic.cn/gcjsyj/qyjsyj/hlwzcyj/qqdt/201312/t20131205_43369.htm.
[3]貴陽大數(shù)據(jù)交易所發(fā)展成就[EB/OL].[2018-08-23].http://www.gbdex.com/website/view/aboutGbdex.jsp.
[4]張計龍.大數(shù)據(jù)驅(qū)動圖書館業(yè)務(wù)應(yīng)用與服務(wù)創(chuàng)新[J].上海高校圖書情報工作研究,2013(03):1-6.
[5]袁芳.大數(shù)據(jù)環(huán)境下圖書館文獻(xiàn)資源建設(shè)模式的變革[J].圖書情報工作,2015(18):91-94.
[6]中國新聞出版網(wǎng).大數(shù)據(jù)環(huán)境下清華大學(xué)圖書館的實踐[EB/OL].[2018-06-23].http://www.chinaxwcb.com/2013-08/ 29/content_276028.htm.
[7]陳雪樵,等.基于“大數(shù)據(jù)”的圖書館應(yīng)用系統(tǒng)平臺設(shè)計思路[J].四川圖書館學(xué)報,2016(02):15-18.
[8]馬曉亭.大數(shù)據(jù)時代圖書館數(shù)據(jù)整合系統(tǒng)構(gòu)建研究[J].圖書館建設(shè),2014(06):83-87.
[9]江蘇匯文軟件有限公司Libsys5.5正式推出[EB/OL].[2018-06-23].http://www.libsys.com.cn/product_libsys55.php.
[10]吳玉,張作來,苗永菊.大數(shù)據(jù)時代高校圖書館面向?qū)W科建設(shè)的中文圖書采訪機制[J].中國冶金教育,2015(06):81-85.