●許碧文
(杭州圖書館,杭州310028)
論大數(shù)據(jù)時代圖書館服務的發(fā)展與創(chuàng)新
●許碧文
(杭州圖書館,杭州310028)
大數(shù)據(jù)時代;數(shù)據(jù)挖掘;圖書館服務;知識服務
大數(shù)據(jù)時代,要主動應對大數(shù)據(jù)對傳統(tǒng)圖書館服務的沖擊和挑戰(zhàn),重點建設數(shù)據(jù)資源網(wǎng)絡體系,打造公共數(shù)據(jù)存儲和服務中心,深化知識服務及增強圖書館服務的針對性和有效性,努力探索大數(shù)據(jù)技術和觀念的創(chuàng)新及應用,切實促進圖書館服務的發(fā)展與創(chuàng)新。
大數(shù)據(jù)時代的到來,必將對當前圖書館的發(fā)展理念、工作定位、服務模式等產(chǎn)生巨大沖擊,圖書館事業(yè)亦將面臨一個重大抉擇和發(fā)展起點。圖書館界如何迎接大數(shù)據(jù)帶來的各種挑戰(zhàn),如何利用大數(shù)據(jù)創(chuàng)新發(fā)展圖書館服務,如何提升圖書館在信息技術革命潮流中的競爭力,如何借助大數(shù)據(jù)帶來的機遇突圍圖書館事業(yè)發(fā)展的困境和瓶頸,成為當前圖書館界亟待研究的重要理論和實踐問題。
(1)全面優(yōu)化數(shù)據(jù)資源的收集存儲。過去,無論是傳統(tǒng)圖書館還是數(shù)字圖書館,主要側重數(shù)字資源庫、機構知識庫、語義化信息等結構化數(shù)據(jù)的收集和存儲,而對半結構化、非結構化數(shù)據(jù)關注較少。目前世界上非結構化數(shù)據(jù)占比高達80%以上,如果對這部分數(shù)據(jù)忽視,將意味著對大部分有價值的信息視而不見。大數(shù)據(jù)時代,半結構化、非結構化數(shù)據(jù)的收集、存儲和開發(fā)運用技術得以突破和迅速發(fā)展。為此,圖書館數(shù)據(jù)收集存儲中應延伸到所有承載人類文明記錄的資源,即全媒體資源,要多關注半結構化、非結構化數(shù)據(jù)收集,包括郵件、視頻、微博、頁面點擊等數(shù)據(jù)。圖書館可以在服務中積極運用web2.0技術,開辟交互式共享平臺,開設用戶互助吧、論壇、社區(qū)等欄目,為館員和用戶、用戶與用戶之間開辟實時的交流通道,了解讀者的閱讀愛好和閱讀習慣。積極通過射頻識別(RFⅠD)、門禁通過等技術,收集日常用戶的身份關系、借閱記錄、存儲信息行為、搜索方式、行為痕跡等結構化和非結構化信息。由此,讓圖書館收集存儲的信息“活起來”,成為立體化、動態(tài)性、關聯(lián)性的知識譜系。
(2)聯(lián)通數(shù)據(jù)資源的共享網(wǎng)絡。大數(shù)據(jù)時代下,超體量的數(shù)據(jù)迅速增長,單個圖書館要對如此龐大的數(shù)據(jù)群進行收集、存儲不僅不可能,也毫無必要,必須形成協(xié)調合作網(wǎng)絡體系,才能真正實現(xiàn)數(shù)據(jù)的共有共享,提升信息服務能力。隨著分布式緩存、大規(guī)模并行處理(MPP)數(shù)據(jù)庫、分布式文件系統(tǒng)、云計算平臺、各種NoSQL分布式存儲系統(tǒng)等大數(shù)據(jù)技術的運用,很大程度上加強了數(shù)據(jù)收集、存儲和共享能力,為圖書館在資源共享網(wǎng)絡建設方面提供了巨大的技術支持和發(fā)展前景。具體說,圖書館在推進數(shù)據(jù)資源網(wǎng)絡體系建設中,首先,深化圖書館數(shù)字化,把各類資源轉化為電子數(shù)據(jù),在此基礎上,共同推進全國乃至全世界圖書館資源共享。雖然我國目前沒有任何一所圖書館占有的數(shù)據(jù)資源達到了PB級,但全國圖書館數(shù)據(jù)資源總量卻是一個龐大的數(shù)據(jù)集。其次,推進與檔案館、博物館、藝術館等公共機構的資源共享,各部門應充分利用大數(shù)據(jù)時代提供的技術支撐,積極轉變觀念,理順體制機制,加強圖書、檔案、博物館等之間的“一體化”建設。再者,選擇性地與其他各類信息中心合作,信息時代,各大型信息中心迅速產(chǎn)生,如Google的學術搜索、圖書搜索服務,百度的“百科”、“知道”服務等,甚至包括商業(yè)中心、社會服務中心、娛樂中心和工作空間等在內的信息中心,在數(shù)據(jù)占有、數(shù)據(jù)挖掘和分析中具有重要意義,圖書館應利用大數(shù)據(jù)技術,有選擇性地與其聯(lián)網(wǎng)共享。
(1)搭建政府公共數(shù)據(jù)連接池。大數(shù)據(jù)時代,政府政務的數(shù)字化及政務數(shù)據(jù)的透明化迅速增強,政府作為公共數(shù)據(jù)“托管人”,為公眾提供訪問數(shù)據(jù)窗口成為不可逆轉的潮流。我國正處于城鎮(zhèn)化高速發(fā)展、民主法治迅速推進的轉型期,通過開發(fā)政府公共數(shù)據(jù),對緩解交通擁堵、資源緊缺等問題,消除社會爭端、群體對抗等矛盾,顯得極為迫切。這也是大數(shù)據(jù)最具潛力的應用領域之一。[1]圖書館作為法定的政府信息公開承辦單位,在當前管理體制下,就推動政府數(shù)據(jù)公開方面可作為的還很有限。但公開是一種趨勢,而且也正在不斷推進中,圖書館應該在可為的范圍內,充分利用大數(shù)據(jù)技術,積極搭建政府公共數(shù)據(jù)連接池,不斷推進公共數(shù)據(jù)的開放。
(2)做科研數(shù)據(jù)監(jiān)護的引領者。我國除重大科研項目采取了有規(guī)劃的數(shù)據(jù)管理外,大部分科研數(shù)據(jù)仍處于無序狀態(tài),這對于大數(shù)據(jù)時代下的科研創(chuàng)新將造成無法估量的損失。圖書館在數(shù)據(jù)監(jiān)護工作中所承擔的職責包括分析數(shù)據(jù)集合的存儲、數(shù)據(jù)管理規(guī)劃、最佳實踐經(jīng)驗傳播、收集與傳播數(shù)據(jù)集合以及完成數(shù)據(jù)保存標準的制定等。[1]而大數(shù)據(jù)時代,在超大體量數(shù)據(jù)的收集、存管、共享技術方面有較大發(fā)展,為圖書館履行數(shù)據(jù)監(jiān)護職責,嵌入到科研一線獲取數(shù)據(jù),對數(shù)據(jù)進行持續(xù)系統(tǒng)性維護,根據(jù)科學研究需要推送數(shù)據(jù)服務等方面提供了重要支持。為此,我國圖書館特別是高校圖書館,應抓住這一發(fā)展機遇,創(chuàng)新服務業(yè)務,提升能力水平,通過為科研項目提供數(shù)據(jù)監(jiān)護服務,搶占科研數(shù)據(jù)發(fā)布、存儲、利用和管理的重要陣地,擴大圖書館服務效益。
3.1 借助數(shù)據(jù)挖掘技術深化圖書館的知識服務
大數(shù)據(jù)時代的數(shù)據(jù)挖掘和數(shù)據(jù)分析,不是傳統(tǒng)意義上的一般性統(tǒng)計計算,而是深層次的數(shù)據(jù)整合與挖掘,須廣泛運用分布式系統(tǒng)基礎架構Hadoop、非關系型數(shù)據(jù)庫技術NoSQL等大數(shù)據(jù)技術,從而高速捕捉、發(fā)現(xiàn)和分析大容量、多類型的數(shù)據(jù)并獲得價值。如何充分利用好積累的或者正在產(chǎn)生的巨量數(shù)據(jù)信息,掌握背后的潛在價值,將成為大數(shù)據(jù)時代政府機構、企業(yè)及科研機構等首要關注的問題。在這種強烈的市場需求和發(fā)展趨勢下,圖書館的核心能力不在于所擁有的信息資源,而在于具備利用廣泛信息資源為用戶創(chuàng)造有價值的知識和能力,圖書館服務必須走向知識服務、知識咨詢,并以此作為圖書工作新的生長點。[2]但從目前看,我國圖書館的知識服務還處于初級階段,主要局限在參考咨詢、信息咨詢等知識導航、收集及提供等方面,對于以解決問題為導向,提供技術發(fā)展預測、趨勢分析、宏觀決策咨詢及基于專業(yè)技術層面的知識咨詢等服務模式還有待推進。[3]
大數(shù)據(jù)時代,帶來了更豐富的數(shù)據(jù)資源和更專業(yè)的數(shù)據(jù)分析技術,形成了新的解決問題的思維模式,提供了更廣闊的信息合作視野,[4]為數(shù)據(jù)分析業(yè)務帶來了重大變化和支撐,也為知識服務向專業(yè)化、個性化、決策與創(chuàng)新型發(fā)展,帶來了巨大的發(fā)展機遇。圖書館是人類社會的知識寶庫和智慧發(fā)源地,充分利用大數(shù)據(jù)的各種技術,迅速轉變數(shù)據(jù)處理的范圍、方式、對象、目的等理念和方式,積極推進圖書館信息服務等傳統(tǒng)業(yè)務向數(shù)據(jù)分析、數(shù)據(jù)挖掘方向轉移,開展更有深度、廣度的知識服務,把為政府、企業(yè)等做各類數(shù)據(jù)分析服務、數(shù)據(jù)挖掘服務變?yōu)榇髷?shù)據(jù)時代圖書館的常態(tài)服務內容。這將是大數(shù)據(jù)時代,圖書館服務發(fā)展和創(chuàng)新最具挑戰(zhàn)的領域,也將是催生圖書館服務創(chuàng)新發(fā)展的新的平臺和機遇,更是圖書館現(xiàn)代服務的生成及實現(xiàn)的基本途徑。[5]
3.2 提升圖書館服務的針對性和個性化
(1)增強閱讀推廣服務的效果。目前,圖書館在閱讀推廣方面的工作存在許多不足,特別是可持續(xù)性、實效性方面亟待提升。據(jù)資料顯示,亞馬遜網(wǎng)站充分利用大數(shù)據(jù)相關性分析,通過有效的圖書推薦使其圖書銷售量增加三分之一以上。人們之所以閱讀,也是基于推薦的理由。在大數(shù)據(jù)時代,圖書館也可以通過廣泛的數(shù)據(jù)分析,如通過對讀者借閱情況、書籍出版信息、社交網(wǎng)站評論、經(jīng)濟社會發(fā)展狀況等各類數(shù)據(jù)分析,找出各類相關性,了解特定時期、特定群體的知識需求、閱讀薄弱點以及閱讀興奮點和關注點,主動創(chuàng)新方法有針對性地開展閱讀推廣工作。不僅可開展面上的閱讀推廣,也可開展點對點的閱讀推廣。例如,通過收集和分析讀者借閱情況、生活閱歷、工作崗位等方面的半結構化、非結構化數(shù)據(jù),總體把握讀者的閱讀習慣和知識需求,有針對性地向其開展圖書推薦、知識推送等工作,增強閱讀推廣效果。
(2)提升社區(qū)圖書館、流動圖書館等工作效率。研究表明,當前,我國圖書館利用率低的一個重要原因是圖書館距離用戶太遠,當圖書館與用戶保持合適距離,可有效促進公眾對圖書館的利用。社區(qū)圖書館、流動圖書館等是圖書館深入用戶、親近用戶的有效載體,是圖書館服務的“神經(jīng)末梢”,擴大了圖書館輻射范圍,本可以解決這一難題。但現(xiàn)實效果并不理想,普遍反應是“無法閱讀到合適的、需要的圖書”。造成這種情況的原因主要是社區(qū)圖書館、流動圖書館沒有根據(jù)用戶的需要有針對性地分派圖書,及時更新書籍。大數(shù)據(jù)時代,可以通過數(shù)據(jù)分析,把握特定區(qū)域的人群結構,判斷他們亟需的圖書服務,準確掌握服務的時間、內容、形式和地點等,大大提高圖書的利用率,發(fā)揮圖書館的作用。
(3)打造舒適親和的圖書館物理空間。隨著網(wǎng)絡化信息服務、數(shù)字化圖書館的發(fā)展,實體圖書館作為資料儲存、展示的功能逐漸退化,越來越成為“身體和靈魂的放松、愉悅空間”。將海量信息的科技體驗和美妙空間的藝術體驗融為一體,讓讀者到圖書館,除完成檢索信息的主要目的之外,還可以學習、辦公、開會、交友、參觀、體驗、欣賞,甚至是約會、小憩,將成為實體圖書館發(fā)展的一大目標。在大數(shù)據(jù)時代,提升圖書館資料擺放合理性方面,可以借鑒沃爾瑪“尿布和啤酒”經(jīng)典案例做法,通過對讀者進出圖書館的行走路線、取閱書籍的習慣、書籍資料關聯(lián)性等方面數(shù)據(jù)分析,挖掘出潛在的價值和判斷,優(yōu)化圖書資料分布組合及擺放格局,提高圖書資料的利用率,方便讀者的取閱查找等。在圖書館空間布局方面,收集讀者對舒適度、審美、光線等要求方面的數(shù)據(jù),對家具和設備的組合性、伸縮性、移動性和體驗感進行優(yōu)化,讓讀者在獲取信息中體驗藝術般的享受。
[1]關志剛編譯.大數(shù)據(jù)最具潛力的三大應用領域[EB/OL].[2013-11-18].http://www.ctocio.com/ bigdata/8293.html.
[2]張曉林.走向知識服務:尋找新世紀圖書情報工作的生長點[J].中國圖書館學報,2000(5):30-35.
[3]史海燕.我國數(shù)字圖書館知識服務模式及實踐研究[J].現(xiàn)代情報,2010(9):15-18.
[4]王天泥.知識咨詢:大數(shù)據(jù)時代圖書館的知識服務增長點[J].圖書與情報,2013(2):74-77.
[5]李雪冰,梁杰.圖書館現(xiàn)代服務的生成及實現(xiàn)途徑——基于知識管理角度[J].圖書館理論與實踐,2012(1):10-13.
G254.97
A
1005-8214(2014)12-0019-02
許碧文(1978-),女,碩士,館員,研究方向:圖書館服務、圖書館信息化建設。
2014-05-26[責任編輯]李金甌