王秀云
(濟南大學圖書館,山東 濟南 250022)
隨著信息技術的發(fā)展,用戶通過網絡、手機、客戶端等多種手段無時無刻地在向世界各地接收和發(fā)送數據,帶來了各種數據海量般快速產生,人類已進入了一個大數據的時代,大數據的概念應運而生。2011年5月,全球知名咨詢公司麥肯錫發(fā)布了一份題為《大數據:創(chuàng)新、競爭和生產力的下一個前沿領域》的報告,報告指出“數據已經滲透到每一個行業(yè)和業(yè)務職能領域,逐漸成為重要的生產因素;而人們對于海量數據的運用將預示著新一波生產率增長和消費者盈余浪潮的到來”[1]。目前,大數據已引起各行各業(yè)的高度重視,并作為戰(zhàn)略性技術大力推動其發(fā)展。EMC、IBM、惠普、微軟、Oracle 在內的IT 巨頭紛紛通過收購大數據相關廠商來實現技術整合。作為擁有大量數據的圖書館,不可避免的面臨著大數據信息浪潮的沖擊,如何使用好大數據,更好地服務于圖書館事業(yè)發(fā)展和讀者將成為擺在圖書館面前的重要發(fā)展課題。
大數據(Bia data)是指在一定時間內用常規(guī)軟件工具對其內容進行獲取、儲存、管理和分析的大容量數據[2],大數據的特點可以總結為4V:一是數據量大(Volume)。數據量級已從TB 發(fā)展至PB,甚至開始以EB 和ZB 來計數。IDC 研究報告稱,2011年全球被創(chuàng)建和被復制的數據總量為1.8ZB,預計全球數據量大約每兩年翻一番,到2020年全球將擁有35ZB 的數據量[3]。二是數據類型復雜(Variety)。數據類型涵蓋字符數據、文本數據、圖片、視頻等信息。三是處理速度快(Velocity)。大數據不僅包括結構化、半結構化和非結構化數據,而且這些數據往往是高速實時數據流,大量數據都是隨機動態(tài)產生,數據處理需要在幾秒鐘內形成答案。四是價值高(Value)。大數據蘊含著巨大的財富,通過對這些數據進行處理和分析后,可以獲得許多有價值的知識、模式用于新的知識服務方式。
大數據為政府、企業(yè)以及個人帶來了巨大的價值和影響。第一,大數據的開放將提升社會的公開透明度和政府政策制定的效率。一方面,多種類型數據的公開打開了政府部門間和層級間、政府與民眾間的邊界,政府內部協(xié)同辦公效率和為民眾辦事效率大大提高。另一方面,政府通過為大眾提供的門戶網站、移動政務、政府微博平臺與公眾在線交流互動,充分汲取民眾的信息、知識和智慧,及時調整決策,從而有效提升社會效率和政府效率。第二,隨著物聯(lián)網、移動互聯(lián)網、社交網絡的快速發(fā)展,及視頻監(jiān)控、智能終端等的快速普及,使得對消費者個體和群體的行為、態(tài)度以及對于信息的反應進行實時觀察和了解逐漸成為可能,這為精準定位目標客戶群體數據和了解個體消費習慣、風險收益偏好等提供了重要的工具。大數據已被廣泛應用于諸多領域并產生出驚人的威力和創(chuàng)新能力。第三,大數據意味著大資源,無論是商業(yè)、企業(yè)、經濟或者其他領域,任何決策行為將日益基于數據分析做出,經驗和直覺的判斷將不再流行。新數據的不斷增長和人們數據處理能力的不斷提高,使得利用大數據來進行預測和決策的能力將會隨之無限放大。第四,個人成為大數據鏈條中不可缺少的一環(huán),大量的數據開始應用于人類的生活和工作領域。
一方面,新型媒體的興起給圖書館提供了全新的與讀者接觸的渠道。目前越來越多的圖書館已開通了微博,并將其作為信息發(fā)布、信息收集、參考咨詢、館員讀者互動的交流平臺。通過與微博上讀者的交流,圖書館信息服務時效性、互動性得以大大提升,同時也提高了圖書館的形象和知名度。利用社交媒體的力量,往往能夠取得意想不到的效果。2012年春運期間,新疆維吾爾自治區(qū)圖書館、陜西省圖書館、重慶圖書館和上海市青浦區(qū)圖書館先后在新浪網發(fā)出了內容相似的微博:“春運期間,圖書館將免費為沒有上網條件的外來務工人員提供上網設備,并配有專門的工作人員免費輔導、幫助外來務工人員完成網上訂票”[4]。此事經媒體報道后,一時之間圖書館成為社會的熱點話題,受到了公眾的好評,這對圖書館的形象具有極大的正面宣傳效應。另一方面,通過整合并分析圖書館內部和外部數據可以及時、準確獲取更為完整的讀者信息,從而進行更為精準的信息營銷和服務。圖書館本身擁有讀者的大量數據,如讀者個人身份、借閱記錄、信息行為、搜索方式等等,通過對數據的分析可以了解讀者信息獲取習慣、業(yè)務需求、知識應用能力及希望提供什么樣的服務等,進而有針對性地根據不同讀者特征打造人性化、精確化的信息營銷服務,將優(yōu)質產品及時、準確地送到目標群體手中。
圖書館界利用數據來提升競爭能力具有得天獨厚的條件。首先,圖書館的數據種類繁多,既有所藏文獻資源中的紙質純印本、數字資源、數據庫資源、網絡資源等結構化數據,也有目前圖書館還無法進行或暫時沒有建設的讀者信息、服務信息等半結構化和非結構化數據。其次,在信息時代,圖書館在以讀者滿意度評價模型和服務營銷模型為代表的數據分析上積累了大量的實戰(zhàn)經驗,具備向大數據分析跨越的基礎。第三,通過無線移動網絡、互聯(lián)網、多媒體等科技手段,圖書館完全可以通過虛擬的渠道向讀者提供瀏覽、信息查詢和獲取資源的服務。應該說,圖書館對于傳統(tǒng)的結構化數據的利用是處于領先水平的,但一方面圖書館傳統(tǒng)的數據庫信息量并不豐富和完整,另一方面對于多種異構數據的分析是難以處理的。因此,利用大數據從讀者服務環(huán)節(jié)中發(fā)現新知識,創(chuàng)造新價值將成為圖書館競爭的一大關鍵因素。
圖書館要打破傳統(tǒng)數據源的邊界,應重視新型數據來源,通過各種渠道獲取盡可能多的讀者行為、意愿、專業(yè)需求等數據,并對這些數據進行實時分析,從而挖掘出更大價值。一是注重新媒體讀者服務的發(fā)展,利用QQ/MSN、博客、論壇、微博這些便捷的多向交流工具開展新書通告、參考咨詢、信息推送、活動播報等,吸引讀者的關注,實現多種媒介的聯(lián)動效應,并將其打造成為與到館服務并行的重要服務渠道。二是將圖書館內部數據和外部社交數據互聯(lián),獲得完整的讀者基本信息表,從而進行更加規(guī)范、高效的讀者關系管理。三是創(chuàng)造性利用社交網絡數據和移動數據進行服務創(chuàng)新和精準營銷。如當圖書館通過讀者的移動定位信息知道該讀者所處的地理位置,便自動發(fā)送與其位置相關的各類信息服務;購買新數據庫時在網絡上征求讀者意見,激發(fā)讀者參與的熱情,在了解讀者需求、建議的同時達到良好的宣傳效果。
社交網絡為圖書館提供了一個機會,一個交流平臺,但圖書館服務融入社交網絡獲取更多的讀者信息行為存在著一定的困難,需要一個不斷探索的過程。首先,圖書館難以得知讀者在社交網絡上的用戶名,也就難以進行數據處理、整合分析。圖書館可舉辦各類互動活動來收集讀者的用戶名,或者在讀者協(xié)會申請表上添加社交網絡用戶名的選項,也可以考慮和社交網站進行直接的合作,在實名制的社交網站上,利用已有的讀者身份與讀者對接。其次,目前尚缺乏成熟有效的非結構化數據的處理技術和工具。在初創(chuàng)時期可采取半人工的方式進行處理。第三,目前在國內圖書館龐大的讀者群體中,應用社交網絡所提供的服務只是一部分,是青年讀者喜愛的網絡平臺,他們借助這個平臺獲取信息的需求與他們在成長發(fā)展過程中獲取知識,尋求友誼、舒緩心情等方面的精神追求和心理需求有關。如果只憑借對他們的分析來制定針對所有讀者的策略,統(tǒng)計數據的偏差可能會導致策略的失效,因此暫時只能用于制定一定量的讀者群。第四,數據讓我們面向更開放式共享和分散式合作的同時,也面臨著個人被放在顯微鏡下觀察的困境。知曉讀者的信息而又嚴控其傳播范圍,堅定地維護讀者的個體安全及隱私是大數據時代圖書館員為讀者守秘的義務和責任。
大數據時代,圖書館行業(yè)間的競爭不僅僅依靠豐富的館藏資源、數據共享、創(chuàng)新方式,大數據的擁有量及對各類數據的融合、挖掘與分析能力將成為大數據時代圖書館競爭的關鍵,圖書館建設方案調整將依賴于對大數據的分析與預測。大數據時代的數據分析與傳統(tǒng)的圖書館智能有很大區(qū)別。首先,傳統(tǒng)的圖書館智能所處理的數據大多是讀者身份、借閱記錄等結構化數據,是一種對現有資源的分析與挖掘,而在大數據時代,更多需要處理的是讀者信息行為、搜索方式、服務消費痕跡等半結構化、非結構化數據。其次,大數據時代的數據容量通常以數百TB 或者數百PB 來計量,海量的數據超越了人們數據處理能力的范疇,傳統(tǒng)的數據分析技術難以有效挖掘這些數據潛在的價值。第三,隨著時間的流逝,數據中所蘊含的知識價值往往也在衰減,因此更多的數據分析從離線轉向了在線,開始出現實時或準實時處理。這些本質上的區(qū)別要求圖書館提供高通量計算機、高可靠性、高可擴展性、高可用性的規(guī)模、語義、統(tǒng)計及預測性等數據分析技術、新的數據表示方法[5]。
[1]大數據有大價值[EB/OL].[2012-07-18].http://www.vsharing.com/k/2012-7/662557.html.
[2]大數據時代的企業(yè)數據管理[EB/OL].[2012-12-10].http://www.ebusinessreview.cn/articledetail-195747.html.
[3]IDC 研究報告:2011年全球數據總量1.8ZB[EB/OL].[2011-06-29].http://storage.chinabyte.com/163/12110163.shtml.
[4]新疆維吾爾自治區(qū)圖書館的工作人員正幫助農民工網購火車票[EB/OL].[2012-01-20].http://www.xjlib.org/41ba12df-084c-4d8e-8797-cbe458979590_1.html.
[5]詹劍輝.高通量計算機的性能評價[J].中國計算學會通訊,2011,7(7):40-43.