王鷹
(長春師范學院 圖書館,吉林 長春 130022)
基于整合理論數(shù)字圖書館建設問題研究
王鷹
(長春師范學院 圖書館,吉林 長春 130022)
近年來,整合理論正被廣泛的應用于各個領域。在數(shù)字圖書館方面,隨著信息及網(wǎng)絡技術的發(fā)展,存在著大量異構系統(tǒng)及龐雜的資源,因而整合理論的深入應用也成必然。本文先簡單的從概念、發(fā)展、分類、模式及體系結構幾方面介紹整合理論;再結合數(shù)字圖書館建設的實際,分析目前存在的主要問題并提出相應的解決意見。
整合理論;數(shù)字圖書館建設;資源整合;服務整合
整合的英文名稱是“integration”,動詞形式“integrate”來源于拉丁文inter-“made whole”,其字面意思可理解為整理、匯合、聚合、融合的意思。一般理解為所謂整合即是有兩個或兩個以上的事物、現(xiàn)象、過程、屬性、關系、信息、能量等在符合一定條件、要求的前提下,融合、聚合或重組成一個較大的整體的發(fā)展過程及其結果。整合的實質就在于涵蓋了整合后系統(tǒng)內部的功能和各要素之間的關系。[1]當前,就單純的針對“整合”的研究而言,由于國外起步較早,因而無論是在概念、發(fā)展、分類等理論方面,還是在體系結構及實際應用等實踐方面,都已經相對比較成熟。而國內更多的是整合理論與各行各業(yè)結合的實際應用研究,如經濟方面的營銷整合、教育方面的各種課程的整合、醫(yī)學方面的各種整合療法以及旅游、城市規(guī)劃、傳媒等不同的領域。
在數(shù)字圖書館建設方面,整合理論的應用研究還不是很成熟。微觀上來講,多是關于數(shù)字資源整合的,而人力資源整合、服務整合等研究的很少;宏觀上來說,現(xiàn)階段的研究還多停留在館內的整合,關于館際間的整合的研究基本還沒有開始。因而,數(shù)字圖書館整合研究還應給與更多的關注。
1.1 整合的概念及發(fā)展
整合的概念是動態(tài)發(fā)展的,自1862年最早由英國哲學家赫伯特斯賓塞(HerberSencer)從哲學層面提出的以來,隨著整和對象的不斷擴充以及整合方法的不斷豐富,它大體上包括了一下三個階段,面向異構數(shù)據(jù)源的數(shù)據(jù)整合、面向應用的整合、以及面向信息資源的整合。
隨著Web的不斷發(fā)展,Web整合的對象和方法也相應發(fā)生變化。研究人員提出了面向異構數(shù)據(jù)源的數(shù)據(jù)整合。在此階段又可分為數(shù)據(jù)整合(data integation)、智能信息整合(intelligent informatiom integratiom)與內容整合(content integration)。
由于Web資源的范圍不斷擴展,整合的對象也發(fā)展到應用程序、服務等方面。目前研究的主要問題集中于如何集成、重組Web上的服務和應用程序,提高網(wǎng)絡的運行效率,擴展其可重用性,避免重復開發(fā)等方面。
1.2 整合的類型及層次
通過對整合進行分類,有助于明確要解決的整合問題。根據(jù)國內外的研究情況,現(xiàn)有二分法、三分法、四分法等多種分類方式。
(1)二分法[2-3]。F.Leymann和D.Roller把整合分為功能整合(function integration)和數(shù)據(jù)整合(data integration)兩種基本類型。Leymann等認為,目前的絕大多數(shù)研究都屬于數(shù)據(jù)整合范疇,而對于功能整合的研究現(xiàn)在還很少,但它卻是正在增長的研究領域。
Lorcan Demsey將門戶整合的方式分為兩類:一類稱為-ortal(門戶);另一類稱為m-ortal(m門戶)。-or-tal中的意為“表現(xiàn)”(resentation)或“人”(eole)-ortal是在用戶界面層次對內容進行整合。m-ortal中的m意為“機器”(machine)或“代理”(mediation),m-ortal是在編程層次上對內容進行整合。
(2)三分法[4]。三分法是指Thomas Womeldorfft提出的將整合分為數(shù)據(jù)整合、事物整合及操作整合三種類型。
(3)四分法。四分法是由N.Mattos、H.Pirahesh和A.D.Jhingran提出的。他們將整合劃分為應用整合、業(yè)務過程整合、門戶整合和信息整合四種類型。其中應用整合實施從事相似或互不工作的不同應用系統(tǒng)彼此通信;業(yè)務過程整合是對組織內部和跨組織應用的業(yè)務過程進行整合;門戶整合是最表層的整合;信息整合是指信息的物理集成或邏輯集成。
1.3 整合的模式
整合的模式的本身是不涉及具體的整合技術,而是旨在揭示整合的一般性原理和形式。整合模式基本可以概括為以下幾種:以數(shù)據(jù)源模式為中心的整合(local-as-view,簡稱LAV)、以全局模式為中心的整合(global-as-view,簡稱GAV)、雙向整合模式(both-as-view,簡稱BAV)和混合整合模式(global-local-as-view,簡稱GLAV)以及數(shù)據(jù)源間的直接整合(即P2P)。
(1)LAV模式。是以數(shù)據(jù)源模式為中心,全局模式與數(shù)據(jù)源模式之間是對應關系,用戶在全局模式上的操作必須根據(jù)全局模式與數(shù)據(jù)源模式之間的歸隱關系通過一定的轉換,使其符合數(shù)據(jù)源模式的要求,才能對數(shù)據(jù)源進行操作。
(2)GAV模式。與LAV模式正好相反的就是GAV模式。最早提出的整合模式即是GAV模式。GAV模式是以全局模式為中心,采用一種統(tǒng)一的模式對各種數(shù)據(jù)源進行描述。各種數(shù)據(jù)源模式均是這種統(tǒng)一模式下的子模式,即全局模式涵蓋了參與整合的所有數(shù)據(jù)源模式。該方法適用于數(shù)據(jù)源穩(wěn)定的系統(tǒng),操作處理較為簡單。
(3)BAV模式和GLAV模式。近兩年為彌補GAV和LAV的不足提出了BAV模式和GLAV模式。BAV和GLAV在技術實現(xiàn)上較為復雜,因此,目前理論上的研究較多,實際應用并不廣泛。
(4)P2P模式。在這一模式中,系統(tǒng)沒有全局模式,每個對等點(peer)均作為一個自治的信息系統(tǒng),這些系統(tǒng)間的整合是通過建立P2P映射來實現(xiàn)的。
1.4 整合的系統(tǒng)體系結構研究
整合系統(tǒng)通用體系結構是Diego Calvanese等人在研究多種整合機制的基礎上提出的。整合系統(tǒng)體系結構分為物理層、邏輯層、概念層和元層四部分。
直接與要整合的信息或數(shù)據(jù)接觸的物理層由Wraer(封裝器)、Mediation(協(xié)調器)以及具體化視圖存儲庫(materialized view store)三部分組成。對數(shù)據(jù)和查詢描述的邏輯層包括具體化視圖模式(materialized view schema)、數(shù)據(jù)源模式(source schema)和查詢模式(query schema)。概念層描述了整合系統(tǒng)中涉及的概念、概念之間的關系以及信息需求。它是由企業(yè)模型(enterrise model)、數(shù)據(jù)源模型(source model)和查詢模型(query model)構成的。元層是由元模型(meta model)構成的,它包括了所有與各參與整合的系統(tǒng)有關的元信息。
Diego Calvanese等人提出的體系結構是對整合系統(tǒng)體系結構的新穎表達方式,還具有方法論意義。
2.1 思想觀念
圖書館界仍然存在著觀念陳舊落后的問題。其表現(xiàn)為以傳統(tǒng)圖書館的發(fā)展眼光來規(guī)劃數(shù)字圖書館建設,產生了資源重復建設嚴重、資源共享難以實現(xiàn)的局面。
建設數(shù)字圖書館需要一個良性的主觀引導環(huán)境。主管部門和相關業(yè)界應當團結協(xié)作,制定和完善相關政策法規(guī),統(tǒng)籌規(guī)劃,克服困難,妥善解決問題。
2.2 資金
建設數(shù)字圖書館的各個環(huán)節(jié)都需要資金的支持。這些資金僅依賴政府投入是不夠的。為解決此問題,可以在保證國家加大數(shù)字圖書館建設投資力度前提下,公共圖書情報機構建立半企業(yè)化運營機制,以市場為導向爭取更多的收益,力爭改善經費使用的窘境。
2.3 標準化
數(shù)字圖書館的建設是一項跨部門、跨學科、跨行業(yè)并且具有開放性、交互性和擴展性的超大型系統(tǒng)工程,這樣一項工程,要求建設者必須嚴格遵循相關技術標準與規(guī)范。
在建設數(shù)字圖書館應用服務系統(tǒng)的過程中,由于缺乏統(tǒng)一的規(guī)范標準,使大量數(shù)據(jù)庫和電子出版物本身結構也不兼容,直接影響了數(shù)字圖書館的整合應用。如何使用通用標記語言(SGML)、資源描述框架(RDF)模型與句子、擴展標記語言(XML)等國際標準,如何制定中文字符集與漢字平臺標準等問題,都是目前應該探討和研究的[5]。
2.4 人才
在數(shù)字圖書館建設和管理中,需要有多種知識和專業(yè)結構的人才,特別是在計算機自動化和網(wǎng)絡方面具有堅實基礎的專家和在數(shù)字資源開發(fā)、組織和提供利用方面具有豐富經驗的管理人員。特別是在整合的過程中,跨行業(yè)、跨專業(yè)的人才尤其重要。數(shù)字化圖書館時代,圖書館員不僅需要具備圖書情報的專業(yè)知識,還需要有廣博的知識面,以及堅實的計算機、網(wǎng)絡基礎。但就目前的情況來看,我國圖書館界的工作人員離這個要求相差甚遠。由于歷史的原因和現(xiàn)實因素,我國文獻信息工作人員,尤其是各類圖書館工作人員的知識結構、專業(yè)結構、年齡結構都不盡合理,存在著知識面偏窄、專業(yè)技能單一、年齡老化等問題。同時,由于各種各樣不同的原因,使得相當一部分的信息社會通用型人才進不來、留不住,這很大程度上影響了數(shù)字圖書館數(shù)字化信息資源的研制、開發(fā)與利用,造成不少圖書情報機構對數(shù)字圖書館的管理不得不沿用傳統(tǒng)工作模式,另外許多圖書館的數(shù)字圖書館建設仍處于觀望、等待、依賴和滯后的被動局面,可以說,人才問題已經制約我國數(shù)字圖書館建設的發(fā)展。
因此,提高圖書館工作人員隊伍的整體綜合素質,建立健全的人才機制,引進人才、留住人才是當前的重要任務。
2.5 技術
數(shù)字圖書館是一項高技術的產物,必須有堅實可靠的核心技術來保障數(shù)字圖書館工程的實現(xiàn)。在數(shù)字圖書館的整合中,信息整合是基礎,知識整合是數(shù)字資源整合的高級階段,同時這也是數(shù)字圖書館資源整合的終極目標。當前最新的網(wǎng)格技術為有效使用與共享知識資源提供了技術框架。網(wǎng)格把用通信手段連接起來的資源無縫集成為一個有機的整體,以實現(xiàn)互聯(lián)網(wǎng)上資源的全面連通,包括計算資源、存儲資源、通信資源、軟件資源、知識資源、信息資源、設備資源、專家資源等。網(wǎng)格提供的資源預約、分時共享、資源組合、資源授權、數(shù)據(jù)副本等技術,可以有力地支持廣域范圍內的資源共享。
綜上所述,整合理論在數(shù)字圖書館建設方面的應用研究還處于起步階段,還有許多問題有待解決,但整合的趨勢是必然的。
在數(shù)字圖書館整合的研究中,就館內整合而言,由資源整合模式的分析及整合系統(tǒng)的比較可見,資源整合部分的研究及應用已經日趨成熟。而服務整合領域卻還需要更多的關注。在做好館內整合的基礎上,館際間的整合才是最終的目的。只有從整體上做好各館間的整合才更有利于實現(xiàn)資源共享,有效提高數(shù)字圖書館的服務質量,更好的達到為讀者服務的目的。但迄今為止,關于館際間整合的研究還基本處在空白階段。
我們要自覺地在科學方法的指導下,不斷地發(fā)現(xiàn)、運用相關的技術,推動數(shù)字圖書館整合實踐的發(fā)展,完善和拓展整合的基礎方法,構建科學方法論體系,推動我國數(shù)字圖書館整合技術的完善和發(fā)展。當然除了圖書館界的努力之外,還需要政府及相關各部門、行業(yè)的配合,為數(shù)字圖書館的建設完善提供良好的環(huán)境。
今天,隨著相關數(shù)字圖書館館內整合理論研究的成熟,以及應用到其中的新技術的不斷產生與完善,將來的研究目標將更多的集中于館際間的整合,爭取早日實現(xiàn)以用戶為中心的智能化服務。
[1] 馬文峰.數(shù)字資源整合研究[J].中國圖書館學報,2002(4):40-41.
[2] Leymann F,Roller D.Using flows in information integration[J].IBM Systems Journal,2002,41(4):732-742.
[3] Dempsey L.The recombinant library portals and people[J].Journal of Library Administrantion,2003,39(4):103-136.
[4] Womeldorfft T.The pursuit of data integration.Computerworld,1984,18(46):20-21.
[5] 李書賓.關于數(shù)字圖書館建設若干問題的思考[J].情報資料工作,2002,11(2):6-7.
責任編輯:劉 琳
A research on the construction of digital library based on the integration theory
WANG Ying
(Library,Changchun Normal University,Changchun 130022,China)
In recent years,the integration theory is wildly used in different fields.In the field of digital library,with the development of information and network technology,there are a large number of heterogeneous systems.So the further application of the integration theory in this area is definitely imperative.This article introduces the theory from concept,development,classification,pattern and system structure.It analyzes the main problems and gives solutions to them combining with the reality of digital library construction.
integration theory;digital library construction;resource integration;service integration
G250
A
1009-3907(2010)08-0114-04
2010-02-10
王鷹(1972-),女,內蒙古烏蘭浩特人,助理館員,主要從事圖書館學方面研究。