舒文剛
(重慶南川區(qū)圖書館,重慶 408400)
DIKW體系下數(shù)字圖書館的大數(shù)據(jù)服務模式
舒文剛
(重慶南川區(qū)圖書館,重慶 408400)
大數(shù)據(jù)的意義不在于掌握海量數(shù)據(jù),而在于對這些海量數(shù)據(jù)進行專業(yè)化的整合利用。在DIKW體系下,數(shù)字圖書館關于大數(shù)據(jù)技術的信息資源服務包含:基于數(shù)據(jù)整合的平臺服務、基于數(shù)據(jù)分析的信息服務、基于數(shù)據(jù)應用的知識服務、基于數(shù)據(jù)挖掘的智慧服務4個層次的服務模式。
數(shù)字圖書館 大數(shù)據(jù) 服務模式
隨著云計算時代的到來,大數(shù)據(jù)(Big Data)受到社會各行各業(yè)越來越多的關注。一般而言,大數(shù)據(jù)具有4V特性,包含容量(Volume)、高速(Velocity)、多樣(Variety)、價值(Val?ue)4方面內(nèi)容。大數(shù)據(jù)的意義不在于掌握海量數(shù)據(jù),而在于對這些海量數(shù)據(jù)進行專業(yè)化的整合利用。大數(shù)據(jù)海量數(shù)據(jù)的爆炸式增長,要求數(shù)字圖書館必須及時對數(shù)據(jù)進行收集更新、加工處理及分析應用,以將有效數(shù)據(jù)信息提供給用戶,從而推動數(shù)字圖書館服務模式的變化?,F(xiàn)代的數(shù)字圖書館服務模式正逐漸由以“館藏資源”為中心向以“用戶”為中心轉(zhuǎn)型,而將大數(shù)據(jù)技術應用到數(shù)字圖書館服務中無疑更便于挖掘處理用戶的各項信息需求,更好地為用戶提供更高效的信息需求。
DIKW是關于數(shù)據(jù)、信息、知識發(fā)展演變的理論體系。美國管理學家羅素·艾可夫在《從數(shù)據(jù)到智慧》中,按照數(shù)據(jù)的加工處理程度,將DIKW體系劃分為數(shù)據(jù)、信息、知識、智慧4個層次[1],并對每一個層次賦予各自不同的特質(zhì)。DIKW體系下數(shù)據(jù)、信息、知識與智慧的關系如圖1所示。由此,在DIKW體系下,數(shù)字圖書館關于大數(shù)據(jù)技術的信息資源服務包含:基于數(shù)據(jù)整合的平臺服務、基于數(shù)據(jù)分析的信息服務、基于數(shù)據(jù)應用的知識服務、基于數(shù)據(jù)挖掘的智慧服務4個層次的服務模式。
圖1 DIKW體系下數(shù)據(jù)、信息、知識與智慧的關系
在大數(shù)據(jù)技術環(huán)境下,數(shù)字化信息資源類型多樣、數(shù)量龐大、數(shù)據(jù)結構復雜、數(shù)據(jù)關聯(lián)性強、數(shù)據(jù)波動性高,數(shù)字圖書館要想收集整合全部的信息資源是極其困難的,幾乎難以實現(xiàn)。目前,數(shù)字圖書館信息資源主要包括兩大類:一類是實體館藏資源,主要指圖書館自身整理開發(fā)的數(shù)字化信息資源,如館藏資源檢索數(shù)據(jù)庫、特色館藏數(shù)據(jù)庫、館藏各類專題數(shù)據(jù)庫以及由借助于互聯(lián)網(wǎng)技術采集并下載到本地服務器供用戶使用的信息資源等。二類是虛擬館藏資源,主要指圖書館可利用的網(wǎng)絡在線的數(shù)字化信息資源,包括各種網(wǎng)絡數(shù)據(jù)資源庫、書報在線數(shù)據(jù)庫、網(wǎng)上動態(tài)信息數(shù)據(jù)庫、社交門戶信息資源庫等。在DIKW體系下,數(shù)據(jù)(Data)就是數(shù)據(jù)本身,是為信息服務提供的原始資源。數(shù)字圖書館第一步要做的就是利用大數(shù)據(jù)技術,將這些信息資源進行整合,并根據(jù)數(shù)據(jù)資源的特性,建立一站式數(shù)據(jù)資源整合的平臺服務體系。
其一,數(shù)字圖書館平臺服務體系把云計算與關聯(lián)數(shù)據(jù)相結合,將數(shù)字館藏資源與分散在各種數(shù)據(jù)庫的數(shù)字、文字、圖像、符號等信息資源進行組織和聚合,運用“數(shù)據(jù)——用戶”關系模型,建立統(tǒng)一的數(shù)字圖書館數(shù)字資源門戶,實現(xiàn)數(shù)據(jù)資源的統(tǒng)一聚合和集中揭示,以方便用戶的數(shù)據(jù)資源利用。其二,數(shù)字圖書館平臺服務體系通過大數(shù)據(jù)技術將不同數(shù)據(jù)庫的不同格式、不同類型的數(shù)據(jù)資源進行快速提取集成,完成不同結構數(shù)據(jù)的無縫鏈接,實現(xiàn)一站式統(tǒng)一檢索?!耙徽臼綑z索”適應了當今大數(shù)據(jù)資源的分布性和異構性的特點,可以節(jié)省用戶的資料檢索和數(shù)據(jù)處理時間,提高用戶對數(shù)據(jù)資源利用的效率[2]。其三,數(shù)字圖書館平臺服務體系還應具有多接口、多終端、多系統(tǒng)的支持能力,使用戶能夠借助于有線網(wǎng)絡、無線WiFi、APP應用、PC電腦及手機平板等多種多樣的方式便捷地訪問平臺服務系統(tǒng),使數(shù)字圖書館數(shù)據(jù)整合的平臺服務體系具有通用性、兼容性、易用性和拓展性??傊?,數(shù)字圖書館數(shù)據(jù)整合的平臺服務體系提供的是“一站式數(shù)據(jù)資源服務”,通過對數(shù)字信息資源進行書目級的整合,使用戶能夠通過多種途徑在一個入口、一個界面檢索便可獲得全方位的、立體化信息數(shù)據(jù)資源。
在DIKW體系下,信息(Information)是對數(shù)據(jù)(Data)進行加工處理后產(chǎn)生的數(shù)據(jù)流。信息來源于數(shù)據(jù)但高于數(shù)據(jù),“信息=數(shù)據(jù)+處理”。信息可以為用戶解答一些疑問,如關于誰(Who)、什么(What)、為什么(Why)、怎么做(How)等。因此,數(shù)字圖書館在將信息資源進行整合的基礎上,就要針對不同用戶的信息需求對相應的數(shù)據(jù)進行搜集、存儲、分析,為用戶提供專業(yè)的信息服務。而提高數(shù)字圖書館的信息服務能力的主要方式就是向用戶提供基于大數(shù)據(jù)分析的學科型、個體化的信息服務。
在大數(shù)據(jù)環(huán)境下,隨著信息資源由量到質(zhì)的變化,逐漸形成了分門別類的學科化信息生態(tài)系統(tǒng),使得數(shù)字圖書館的信息服務模式也相應地發(fā)生著變化。數(shù)字圖書館在通過大數(shù)據(jù)技術將這些數(shù)據(jù)信息資源進行采集、分析的基礎上,抽取集合用戶需求的有價值的學科化信息,并為之提供信息服務。一方面,面向社會各個階層人員提供相關學科的信息服務。隨著信息社會的快速發(fā)展,人們更需要的是相關學科領域的專業(yè)信息資源。譬如教師、學生、醫(yī)生、工程師及其他科研人員等對自身學科專業(yè)的信息需求更多,作為為用戶提供信息資源權威平臺的數(shù)字圖書館,則可以通過學科館員及專業(yè)化的信息服務模式為這些用戶提供專業(yè)信息,為社會人才發(fā)展創(chuàng)新提供信息保障服務。另一方面,面向各個社會機構提供相關學科的信息服務。隨著大數(shù)據(jù)技術的廣泛應用,以各種類型公司企業(yè)為代表的社會機構對于信息服務的時效性要求變得更加強烈,關于企業(yè)自身的輿情監(jiān)測、品牌監(jiān)測、信息咨詢、市場分析及競爭情報等信息服務成為包含數(shù)字圖書館在內(nèi)的各種信息服務機構的重要內(nèi)容。為此,數(shù)字圖書館要基于大數(shù)據(jù)技術為企業(yè)用戶提供信息采集、監(jiān)測、分析、推送以及管理的信息服務??傊?,數(shù)字圖書館基于數(shù)據(jù)分析的信息服務是面向用戶的學科化的專業(yè)信息服務。在這種服務模式下,數(shù)字圖書館將用戶的信息需求與信息服務結合起來,按照科學創(chuàng)新研究與對知識信息的需求規(guī)律,對數(shù)據(jù)進行學科化的采集、整合,挖掘出數(shù)據(jù)的專業(yè)價值,動態(tài)有機地滿足用戶的專業(yè)化信息需求[3]。
知識(Knowledge),是在對數(shù)據(jù)信息的理解(Understand?ing)過程中演繹而成的抽象的、邏輯的信息集合。在DIKW體系下,知識體現(xiàn)了信息的本質(zhì)。知識就是知道了什么(Know—what)、知道為什么(Know—why)、知道怎么做(Know—how)及知道誰(Know—who)。知識位于信息之上,具有指導行動的能力,并能夠理解和推理產(chǎn)生新的知識。構建基于數(shù)據(jù)應用的數(shù)字圖書館知識服務模式,是在對數(shù)據(jù)信息加工的基礎上,使提供的信息融合服務體現(xiàn)出知識價值。這不僅可以實現(xiàn)信息知識的有效共享,也有利于推動信息與知識的轉(zhuǎn)化,促進信息知識服務的智能化,繼而引領知識管理的革命。
圖2 數(shù)字圖書館大數(shù)據(jù)知識服務模型
邁爾·舍恩伯格指出:“數(shù)據(jù)就像一個神奇的鉆石礦,它的真實價值就像漂浮在海洋中的冰山,第一眼只能看到冰山一角,而絕大部分都隱藏在表面之下?!盵4]由此,作為信息資源集合平臺的數(shù)字圖書館,其知識服務模式就是要通過大數(shù)據(jù)技術,對海量數(shù)據(jù)進行采集、存儲、組織、分析及決策管理,通過數(shù)據(jù)挖掘和各種分析方法,為用戶構建各種信息資源之間的知識服務網(wǎng)絡,并按用戶需求為其提供信息融合的知識服務。數(shù)字圖書館知識服務模式反映了知識服務完成相應行業(yè)、領域、任務及預期目標的服務水平,包含了大數(shù)據(jù)知識服務過程中所涉及的數(shù)據(jù)、信息、資源、知識及過程等因素,其基本服務模型如圖2所示[5]。此外,基于數(shù)據(jù)應用的數(shù)字圖書館知識服務模式還可以實現(xiàn)信息的可視化服務。國家圖書館副館長魏大威指出:“數(shù)字圖書館可以利用時間軸、地域軸等知識圖譜可視化展示方式將資源呈現(xiàn)給用戶,依托融合的物聯(lián)網(wǎng)、移動通信網(wǎng)以及互聯(lián)網(wǎng)絡進行傳播,最終實現(xiàn)為用戶提供電視、電腦、手機等多種終端的接收?!盵6]通過可視化的技術手段,將海量數(shù)據(jù)信息及其知識語義表示出來,深度發(fā)掘潛在的信息資源,減少異構數(shù)據(jù)問題,降低信息傳遞鴻溝,搭建學科知識地圖,為用戶獲得有效的信息知識提供便利??梢哉f,基于數(shù)據(jù)應用的信息可視化服務也是今后數(shù)字圖書館知識服務的發(fā)展趨勢之一。
智慧(Wisdom)是DIKW體系的最高層次,是人們基于信息知識的理解(Understanding)作出決斷的能力。智慧通過理解過去的信息知識,具有指向未來的特征。隨著人們獲取信息資源的條件日趨成熟,公眾對信息知識的期望也越來越高,社會對于人性化、智能化、智慧型的信息服務需求也越來越強烈。而伴隨著數(shù)字圖書館對信息資源整理開發(fā)能力的提高,智慧服務將逐漸成為數(shù)字圖書館的發(fā)展潮流。
基于數(shù)據(jù)發(fā)掘的數(shù)字圖書館智慧服務具有以下幾方面的特點:其一,能夠為用戶提供人性化、個性化的信息知識服務。數(shù)字圖書館智慧服務更加注重用戶的個體需求,以人為本,為用戶提供的信息服務方式更加靈活多元,使用戶利用信息知識資源更加便捷高效。如可以隨時選擇通過人工、電話、網(wǎng)絡在線、RSS訂閱、郵件定制及24小時自助系統(tǒng)等各種途徑實現(xiàn)信息知識服務。其二,能夠為用戶提供智能化、智慧型的信息知識服務。數(shù)字圖書館智慧服務利用大數(shù)據(jù)技術對用戶的個人信息、獲取信息知識的方式、獲取信息知識的主題、瀏覽下載門戶數(shù)據(jù)庫的日志等數(shù)據(jù)進行分析處理,挖掘用戶的信息需求偏好及潛在的信息需求,構建具有個體特征和需求特征的用戶模型,實現(xiàn)主動地為用戶信息知識需求提供跟蹤與智能化服務。其三,能夠為用戶搭建多維的交互系統(tǒng)。在數(shù)字圖書館智慧服務下,用戶不僅可以檢索利用數(shù)字圖書館服務系統(tǒng)提供的各種信息知識,還可以促進用戶之間、用戶與數(shù)字圖書館服務系統(tǒng)之間、用戶與圖書館及館員之間的交流更加廣泛深入。在數(shù)字圖書館智能感知用戶信息需求和信息知識分布的引導下,推動用戶信息需求與提供的交互,實現(xiàn)各方間互相提供信息知識服務。其四,能夠為用戶構建信息知識的自組織和知識空間。在數(shù)字圖書館智慧服務下,可以通過網(wǎng)絡技術、語義技術對原始數(shù)據(jù)進行語義抽取,構建基于行業(yè)或?qū)W科的宏觀知識空間和基于用戶特定需要的微觀知識空間[7],使用戶自主利用和開發(fā)知識信息??傊?,智慧服務既是數(shù)字圖書館對數(shù)據(jù)挖掘的升華,也是數(shù)字圖書館知識服務的創(chuàng)新;既是數(shù)字圖書館信息服務的核心,也是數(shù)字圖書館服務模式的發(fā)展方向。
[1]羅素·艾可夫.從資料到智慧[J].應用系統(tǒng)分析期刊,1989(16).
[2]陳芬.面向用戶的一站式檢索[J].情報科學,2010(12).
[3]高青.面向用戶的高校圖書館學科化信息服務體系構建[J].現(xiàn)代情報,2009(5).
[4]邁爾·舍恩伯格,庫克耶.大數(shù)據(jù)時代[M].杭州:浙江人民出版社,2013.
[5]秦曉珠,李晨暉.大數(shù)據(jù)知識服務的內(nèi)涵、典型特征及概念模型[J].情報資料工作,2013(2).
[6]李雪.數(shù)字圖書館迎大數(shù)據(jù)時代:將整合資源 提供深度服務[EB/OL].[2014-11-05].http://culture.people.com.cn/n/ 2014/1105/c172318-25981395.html.
[7]烏恩.智慧圖書館及其服務模式的構建[J].情報資料工作,2012(5).
舒文剛男,1965年生。本科學歷,館員。研究方向:圖書館建設。
G250.74
2015-02-25;責編:楊新寬。)