陳 驍 連 鍥 黃 煜 龔德昱
上海財經(jīng)大學圖書館 上海 200433
在開放的信息社會中,圖書館面對的內(nèi)外部環(huán)境越來越復(fù)雜,圖書館管理者需要為決策耗費大量的時間和精力。一方面圖書館需要與更多的組織和機構(gòu)發(fā)生關(guān)系(如數(shù)據(jù)庫廠商、書商、外包業(yè)務(wù)承包商等第三方機構(gòu)),圖書館管理者所面臨的決策的數(shù)量和復(fù)雜性都是前所未有的。另一方面,由于管理信息系統(tǒng)的廣泛應(yīng)用,圖書館每天都會產(chǎn)生大量的數(shù)據(jù),而這些數(shù)據(jù)往往缺少整理和分析,不僅不能給決策提供幫助,反而會給圖書館管理者帶來困擾。因此,有必要設(shè)計一個系統(tǒng),能對相關(guān)數(shù)據(jù)和信息進行加工、處理和分析,能隨時向管理者提供決策所需的有用信息,節(jié)省管理者的時間和精力,提高決策效率。
決策支持系統(tǒng)(Decision Support System,簡稱DSS)是輔助決策者通過數(shù)據(jù)、模型和知識,以人機交互方式進行半結(jié)構(gòu)化或非結(jié)構(gòu)化決策的計算機應(yīng)用系統(tǒng)。它為決策者提供分析問題、建立模型、模擬決策過程和方案的環(huán)境,調(diào)用各種信息資源和分析工具,幫助決策者提高決策水平和質(zhì)量?,F(xiàn)在決策支持系統(tǒng)應(yīng)用比較廣泛,如在組織運營管理、工業(yè)處理、證券投資組合、軍隊管理和醫(yī)療診斷等方面都有大量應(yīng)用[1]。決策支持系統(tǒng)在圖書館中也開始有所應(yīng)用,國外主要集中在文獻采訪[2]、經(jīng)費預(yù)算[3]等方面,我國圖書情報界研究較少,主要集中在圖書館管理[4]、圖書采訪[5]和科技情報[6]等方面。
在日常決策中引入決策支持系統(tǒng),能夠輔助管理者快速、準確地做出決策。基于業(yè)務(wù)數(shù)據(jù)的高校圖書館決策支持系統(tǒng)應(yīng)該包括如下功能:
圖書館決策支持系統(tǒng)需要收集、管理并隨時提供與決策問題有關(guān)的圖書館內(nèi)部信息,以便管理者能夠快速、準確地知道圖書館目前的狀況。圖書館內(nèi)部信息主要包括:館藏信息、資源利用信息、服務(wù)信息和業(yè)務(wù)信息等。
圖書館決策支持系統(tǒng)需要收集、管理并提供與決策問題有關(guān)的外部信息包括:國家、教育部的政策法規(guī),本校相關(guān)規(guī)定,本校重點學科和專業(yè)設(shè)置,出版市場行情,同行動態(tài)等。
圖書館決策支持系統(tǒng)需要收集、管理并提供各項決策方案執(zhí)行情況的反饋信息,為決策的及時調(diào)整或以后的決策提供參考經(jīng)驗,如訂單或合同執(zhí)行進程、學科服務(wù)的反饋情況、圖書館新服務(wù)的反饋情況等。
圖書館決策支持系統(tǒng)應(yīng)能設(shè)置和管理與決策問題有關(guān)的各種模型,使系統(tǒng)中的數(shù)據(jù)、模型與方法能夠很容易地被修改和添加,能靈活運用模型與方法對數(shù)據(jù)進行加工、匯總、分析、預(yù)測,得出所需的綜合信息與預(yù)測信息。
圖書館決策支持系統(tǒng)必須具有良好的人機會話功能,方便用戶輸入數(shù)據(jù)和隨機查詢,同時也需要有強大的圖表輸出功能,方便決策者閱讀和利用。此外,決策支持系統(tǒng)應(yīng)能提供良好的數(shù)據(jù)通信功能,以保證及時收集所需數(shù)據(jù),并將結(jié)果傳送給用戶。
圖書館決策支持系統(tǒng)包含數(shù)據(jù)源、數(shù)據(jù)存儲與管理、聯(lián)機分析處理(OLAP)服務(wù)、決策支持應(yīng)用4個部分。數(shù)據(jù)源是整個業(yè)務(wù)系統(tǒng)的數(shù)據(jù)基礎(chǔ);數(shù)據(jù)存儲與管理是在現(xiàn)有數(shù)據(jù)源的基礎(chǔ)上,對數(shù)據(jù)進行抽取(Extract)、轉(zhuǎn)換和清洗(Transform)、裝載(Load),并有效集成操作(即ETL處理),按照主題進行重新組織,構(gòu)建數(shù)據(jù)倉庫[7];OLAP是按照多維數(shù)據(jù)模型進行再次重組,以支持用戶多角度、多層次的分析;決策支持應(yīng)用是BI系統(tǒng),實現(xiàn)報表、分析、圖表、數(shù)據(jù)集成、數(shù)據(jù)挖掘等。總體結(jié)構(gòu)如圖1所示。
圖1 決策支持系統(tǒng)的體系結(jié)構(gòu)
數(shù)據(jù)集市是按圖書館統(tǒng)計的主題,在數(shù)據(jù)倉庫中對數(shù)據(jù)進行抽取組合,囊括了某個主題所有統(tǒng)計指標涉及元數(shù)據(jù)。數(shù)據(jù)統(tǒng)計的規(guī)則構(gòu)成了OLAP,是對數(shù)據(jù)集市內(nèi)數(shù)據(jù)進行統(tǒng)計分析的方法庫。
2.2.1 數(shù)據(jù)模型構(gòu)建子系統(tǒng)
數(shù)據(jù)模型構(gòu)建子系統(tǒng)包含模型構(gòu)建、語法檢查、模型轉(zhuǎn)換等功能模塊。其中模型構(gòu)建模塊就是根據(jù)客戶的需要構(gòu)建對應(yīng)的多維數(shù)據(jù)概念模型。語法檢查模塊就是根據(jù)所描述的建模規(guī)則對所構(gòu)建的多維數(shù)據(jù)概念進行檢查,若語法不正確,則給出相應(yīng)的提示信息,告知用戶進行調(diào)整。模型轉(zhuǎn)換模塊主要是便于模型的匹配與映射以及元數(shù)據(jù)的生成,將圖形化的多維數(shù)據(jù)概念模型轉(zhuǎn)換為對應(yīng)的XML文檔描述形式[8]。
2.2.2 元數(shù)據(jù)管理子系統(tǒng)
元數(shù)據(jù)管理子系統(tǒng)向下提供對各數(shù)據(jù)源的元數(shù)據(jù)抽取功能,向上為模型匹配與映射、錄入等提供元數(shù)據(jù)訪問接口,對內(nèi)提供元數(shù)據(jù)的標準化、存儲功能。
(1)元數(shù)據(jù)錄入功能
對各數(shù)據(jù)源進行分類,對來源清楚、數(shù)據(jù)格式固定的元數(shù)據(jù)實施定期自動收割入庫。對不能自動收割數(shù)據(jù),系統(tǒng)設(shè)計入口,供各業(yè)務(wù)人員定期將數(shù)據(jù)錄入。錄入功能的運行模式可采用C/S模式,其依據(jù)是業(yè)務(wù)人員工作地點固定,采用C/S模式可降低系統(tǒng)的開發(fā)難度,提高信息安全性。
(2)異構(gòu)元數(shù)據(jù)標準化功能
需要規(guī)定統(tǒng)一的元數(shù)據(jù)格式,對不符合要求的數(shù)據(jù)進行轉(zhuǎn)換,如將圖書館中自動化管理系統(tǒng)與其他信息系統(tǒng)進行整合、分類、標準化。由于元數(shù)據(jù)整合工作十分復(fù)雜,可以分層實現(xiàn),在完成核心公共模塊的前提下,先從核心元數(shù)據(jù)整合開始,然后向元數(shù)據(jù)集擴展。
(3)元數(shù)據(jù)存儲功能
高校圖書館要考慮數(shù)據(jù)的長期保存問題,需要對元數(shù)據(jù)庫進行日常維護和更新,保證數(shù)字資源的完整性、一致性、安全性。
2.2.3 綜合指標管理子系統(tǒng)
將相關(guān)指標組織在一起構(gòu)成指標體系。在這個分類體系中,同位類類目之間為并列關(guān)系,下位類與上位類之間為隸屬關(guān)系,同位類類目不重復(fù)、不交叉。
綜合指標管理包含指標分類的管理和指標的管理兩部分,它具有雙重作用:一是對數(shù)據(jù)倉庫中支持的分析焦點進行統(tǒng)一分類管理,二是對經(jīng)過映射生成的多維數(shù)據(jù)集進行數(shù)據(jù)綜合與錄入時提供指導(dǎo)。指標管理模塊是以圖形化界面為用戶提供交互式指標描述手段,根據(jù)各個高校圖書館統(tǒng)計的主題和口徑,用戶預(yù)先定義一些系統(tǒng)方法庫規(guī)則,完成整個指標體系的定義與管理。用戶通過它可以具體定義綜合指標的層次、類型、展現(xiàn)方式、指標計算公式、計算觸發(fā)機制以及它與數(shù)據(jù)項的關(guān)聯(lián)等信息,并將定義好的指標存放在指標庫中,還能進行指標的日常管理與維護工作。
2.2.4 OLAP分析子系統(tǒng)
OLAP分析子系統(tǒng)的設(shè)計重點在于如何組織數(shù)據(jù)倉庫中的綜合性數(shù)據(jù),如何滿足前端用戶的多維數(shù)據(jù)分析需要?;谏厦鎯牲c考慮,選用基于多維數(shù)據(jù)組織的OLAP 實現(xiàn)。數(shù)據(jù)訪問和生成方式上利用旋轉(zhuǎn)、切片或切塊、向上歸納、向下鉆取等操作剖析數(shù)據(jù)。
2.2.5 資源發(fā)布子系統(tǒng)
根據(jù)系統(tǒng)使用者分散化、動態(tài)化的特點,對經(jīng)OLAP分析好的多維數(shù)據(jù)視圖運用BI工具圖表化展示,并進行B/S式信息的發(fā)布和服務(wù)。
2.3.1 建立圖書館業(yè)務(wù)數(shù)據(jù)倉庫
對圖書館內(nèi)部各信息系統(tǒng)和外部數(shù)據(jù)源抽取所需的數(shù)據(jù),經(jīng)過數(shù)據(jù)清洗,最終按照預(yù)先定義好的數(shù)據(jù)倉庫模型,將數(shù)據(jù)加載到數(shù)據(jù)倉庫中去。本系統(tǒng)選用Microsoft SQL Server作為數(shù)據(jù)倉庫數(shù)據(jù)庫。
2.3.2 按主題分離出數(shù)據(jù)集市
數(shù)據(jù)集建立在具有統(tǒng)一數(shù)據(jù)存儲模型的數(shù)據(jù)倉庫下,各級業(yè)務(wù)人員按照各部門特定的需求把數(shù)據(jù)進行復(fù)制、處理、加工,并最終統(tǒng)一展現(xiàn)為有部門特點的數(shù)據(jù)集合。各高校圖書館可根據(jù)自己統(tǒng)計主題的需要從數(shù)據(jù)倉庫底庫中抽取數(shù)據(jù),建立自己的數(shù)據(jù)集市。
2.3.3 數(shù)據(jù)分析
通過深入分析內(nèi)部的館藏結(jié)構(gòu)數(shù)據(jù)、流通數(shù)據(jù)、電子資源使用數(shù)據(jù)、市面圖書出版數(shù)據(jù),甚至是來自外部的各種參照信息,從而分析得到本館館藏建設(shè)情況,并為圖書館管理人員提供采購決策支持。本系統(tǒng)選用Microsoft 的Analysis service作為OLAP工具。
2.3.4 結(jié)果圖表化
對分析的結(jié)果按不同維度抽取數(shù)據(jù)并圖表化呈現(xiàn)給管理者,使得管理者能對業(yè)務(wù)的發(fā)展狀況有直觀的認識。本系統(tǒng)使用報表工具Pentaho進行圖表化展示。Pentaho允許開發(fā)人員創(chuàng)建報表、儀表盤、分析模型、商業(yè)規(guī)則和 BI 流程,并且能方便地集成至第三方系統(tǒng)中。如將業(yè)務(wù)報表嵌入高校公共數(shù)據(jù)平臺:采用SSO(單點登錄)技術(shù),將報表嵌入學校的公共數(shù)據(jù)平臺,并且設(shè)置權(quán)限審核機制,使得圖書館業(yè)務(wù)數(shù)據(jù)能夠被學校主管領(lǐng)導(dǎo)查看。
我們可以根據(jù)主題來設(shè)計數(shù)據(jù)集市邏輯模型,在此使用星型模型來構(gòu)建圖書館的數(shù)據(jù)集市。為加快分析速度,可以將分析頻繁的層次預(yù)先進行聚集操作,即將信息按照屬性粒度層次來進行聚集,當需要進一步分析時再到原有的基本信息中進行搜索。紙本館藏質(zhì)量分析主題需從下面的紙本館藏結(jié)構(gòu)和圖書借閱情況模型來分析,數(shù)據(jù)模型如圖2和圖3所示。
圖2 紙本館藏結(jié)構(gòu)分析的星形模型
圖3 圖書借閱情況分析的星形模型
館藏結(jié)構(gòu)分析主要包括資金使用情況分析、館藏分布情況分析、圖書使用價值分析和館藏文獻比例分析等。通過剔除舊書、補充新書等方法不斷調(diào)整,提高圖書的使用價值,最終形成適用于本館的最佳藏書結(jié)構(gòu)。考慮到統(tǒng)計大多以年度為單位進行,對模型事實表中的數(shù)據(jù)可按年份進行聚集。如紙本館藏模型中事實表的圖書數(shù)量、圖書金額字段存儲著按中圖法一級分類的年度圖書數(shù)量、圖書金額信息。借閱情況模型事實表中的借閱量也是如此。如需月度或二級分類維度的統(tǒng)計,需對維表基本數(shù)據(jù)進行重新計算匯總。
由紙本館藏模型得出圖書館中各類紙本館藏分布比例情況。借閱情況模型反映讀者需求情況,由模型可以得出讀者對各類紙本館藏的借閱情況。兩者的比值即為圖書的符合程度。符合程度在圖書館分析中主要用于評價館藏是否合理,能否滿足讀者的需求,也可用于采購分析。符合程度的理想值為1,即某類文獻的流通量與其在館藏中所占份額相當。如果這一比例遠大于或遠小于1時,就需要對館藏做一些調(diào)整。
本文對圖書館決策支持系統(tǒng)的目標和實現(xiàn)功能進行了闡述,提出并設(shè)計了基于應(yīng)用數(shù)據(jù)倉庫與OLAP技術(shù)的圖書館業(yè)務(wù)決策支持方案,構(gòu)建了一個數(shù)據(jù)倉庫模型,并規(guī)劃了系統(tǒng)的設(shè)計與分析的路徑。之后,我們將在此基礎(chǔ)上進行實踐,根據(jù)現(xiàn)實操作的具體情況再進行修正和完善。
[1]Marek J Druzdzel,Roger R Flynn.Decision Sopput Systems[EB/OL].[2012-05-12].http://www.pitt.edu/~druzdzel/psfiles/dss.pdf.
[2]F.M.E.Uzoka,O.A.Ijatuyi.Decision support system for library acquisitions:a framework[J].The Electronic Library, 2005,23(4):453-462.
[3]S C Kao, H C Chang, C H Lin.Decision support for the academic library acquisition budget allocation via circulation database mining[J].Information Processing & Management,2003,39(1):133-147.
[4]房宜鋒.基于數(shù)據(jù)挖掘圖書館管理決策研究[D].內(nèi)蒙古:內(nèi)蒙古大學,2010.
[5]夏勍,白似雪.基于Web薦購的圖書采訪決策支持系統(tǒng)設(shè)計[J].圖書館學研究,2012(1):21-25.
[6]張曉,鄧凡.科技情報機構(gòu)輔助政府決策支持系統(tǒng)建設(shè)的思考[J].軟件導(dǎo)刊,2011(1):3-4.
[7]黃志成.基于數(shù)據(jù)挖掘的校園一卡通決策支持系統(tǒng)設(shè)計與開發(fā)[J].現(xiàn)代計算機, 2010(12):175-177.
[8]鄧蘇.決策支持系統(tǒng)[M].北京:電子工業(yè)出版社,2009.