□陳放 王曉平
大連工業(yè)大學(xué),大連,116026
“圖書館統(tǒng)計(jì)云服務(wù)”是一種利用大規(guī)模的低成本計(jì)算單元,通過 IP網(wǎng)絡(luò)相連,為多個(gè)用戶提供的統(tǒng)計(jì)服務(wù)[1]。目前圖書館的“云”概念已經(jīng)騰空而起,“雨”是靠無數(shù)云相互碰撞產(chǎn)生的。“云”和“雨”形成的氣象現(xiàn)象也可以用來解釋圖書館的“云服務(wù)”形成過程。OCLC已經(jīng)將圖書館的“云”形成了“雨”,著陸到我們圖書館世界的地面上,圖書館的上空究竟還有多少“云”能夠形成“雨”?這不能以人們的主觀意愿為轉(zhuǎn)移,這與自然界中“云”的形成過程十分相似,至于“云”是否能夠形成“雨”取決于許多客觀條件。圖書館“云”和“雨”的形成與著陸是有過程的,需要圖書館人在無數(shù)“云”朵中穿行與相互碰撞才能形成。
“全國(guó)高校圖書館事實(shí)數(shù)據(jù)庫”系統(tǒng)(以下簡(jiǎn)稱事實(shí)數(shù)據(jù)庫系統(tǒng)),就是一個(gè)典型的“統(tǒng)計(jì)云服務(wù)”的成功應(yīng)用,只不過我們過去沒有用“云服務(wù)”的理念去定義這種服務(wù)。事實(shí)數(shù)據(jù)庫系統(tǒng)是在教育部高等學(xué)校圖書情報(bào)工作指導(dǎo)委員會(huì)的領(lǐng)導(dǎo)下,2005年以來采用“統(tǒng)計(jì)云服務(wù)方式”在全國(guó)高校范圍內(nèi)實(shí)施。全國(guó)各高校圖書館都能夠通過互聯(lián)網(wǎng),登錄并使用安裝在北京大學(xué)圖書館計(jì)算機(jī)服務(wù)器上的事實(shí)數(shù)據(jù)庫系統(tǒng),只要認(rèn)真及時(shí)填報(bào)相關(guān)數(shù)據(jù),就能檢索并統(tǒng)計(jì)高校圖書館的建設(shè)、管理與服務(wù)情況,為各高校圖書館提供本統(tǒng)計(jì)與評(píng)估服務(wù),從 1999年至今,全國(guó)高校圖書館的統(tǒng)計(jì)數(shù)據(jù)主要來源于該系統(tǒng)。
在“統(tǒng)計(jì)云服務(wù)”的過程中,我們經(jīng)過多年與各種“云”的相互碰撞,受到商業(yè)智能(BI,Business Intelligence)的啟發(fā),使我們想到商業(yè)企業(yè)統(tǒng)計(jì)可以有專門的統(tǒng)計(jì)分析工具,圖書館統(tǒng)計(jì)工作為什么不能有專業(yè)的統(tǒng)計(jì)工具呢?我們從事實(shí)數(shù)據(jù)庫系統(tǒng)的建設(shè)與應(yīng)用中看到了“統(tǒng)計(jì)云服務(wù)”所具有的實(shí)際應(yīng)用價(jià)值和發(fā)展空間。
云計(jì)算給圖書館管理帶來了諸多挑戰(zhàn),如統(tǒng)計(jì)數(shù)據(jù)的保密和隱私;數(shù)據(jù)的有效遷移;統(tǒng)計(jì)結(jié)果的獲取方式及存儲(chǔ)方式;數(shù)據(jù)的知識(shí)產(chǎn)權(quán)等等?!皥D書館應(yīng)用云計(jì)算并沒有現(xiàn)成的道路可走”[2],對(duì)于不同的云服務(wù)會(huì)有不同方法、不同的解決方案。本文通過事實(shí)數(shù)據(jù)庫系統(tǒng)的開發(fā)與應(yīng)用實(shí)例,結(jié)合用戶實(shí)際需求,對(duì)云服務(wù)所面臨的挑戰(zhàn),從技術(shù)、應(yīng)用層面進(jìn)行研究和探討。
“統(tǒng)計(jì)云服務(wù)”的系統(tǒng)構(gòu)架必須建立在開放、穩(wěn)定、整合的平臺(tái)之上。該平臺(tái)應(yīng)該具有提供多層次的用戶管理、安全性控制、連接數(shù)據(jù)源以及訪問、分析和共享信息的功能。系統(tǒng)構(gòu)架猶如建房子的地基,從構(gòu)建系統(tǒng)那一刻起,就要考慮為滿足系統(tǒng)功能與性能指標(biāo),需要構(gòu)建什么樣的地基。在C/S系統(tǒng)構(gòu)架的圖書館管理集成系統(tǒng)中,系統(tǒng)構(gòu)架注重的是模塊的科學(xué)劃分及模塊之間的耦合度,以及對(duì)圖書館工作流描述的細(xì)膩程度。在“云”服務(wù)時(shí)代,我們不是一步就登上“云”端,而是一步一步走上“云”端,“全國(guó)高校圖書館事實(shí)數(shù)據(jù)庫”毋庸質(zhì)疑是一種“統(tǒng)計(jì)云服務(wù)”模式,從 1999年的單機(jī)版系統(tǒng),到 2005年的網(wǎng)絡(luò)版系統(tǒng),從其發(fā)展歷程可以清楚地描繪出其步入“云“端的軌跡。因而那些在C/S系統(tǒng)構(gòu)架設(shè)計(jì)方面積累的經(jīng)驗(yàn)仍然是我們直上“云”端的寶貴財(cái)富。
“統(tǒng)計(jì)云服務(wù)”的開放性是其生存、發(fā)展與應(yīng)用的基本保證。開放性的云服務(wù)系統(tǒng)應(yīng)該采用B/S(Broser/Server)結(jié)構(gòu)進(jìn)行開發(fā)與設(shè)計(jì),同時(shí)應(yīng)解決好系統(tǒng)構(gòu)架設(shè)計(jì)中可能存在的問題。
“一朵云”是由 N個(gè)云片組成的,我們假設(shè)“一朵云”是由N個(gè)圖書館組成的一個(gè)區(qū)域性圖書館;“一層云”是由N朵云組成的,我們假設(shè)“一層云”是由N個(gè)區(qū)域性圖書館組成的;顯然云層越厚,云朵聚集與碰撞的機(jī)會(huì)就越多,形成雨的概率就越大,即圖書館管理層次越多可供聚合的數(shù)據(jù)就越多,信息生產(chǎn)量就越大。因而,可以說“云”是“云服務(wù)”的基本元素。一個(gè)“統(tǒng)計(jì)云服務(wù)”系統(tǒng)至少應(yīng)設(shè)計(jì)為三層用戶管理,即基礎(chǔ)層、區(qū)域?qū)雍椭骺貙??;A(chǔ)層提供每個(gè)圖書館的統(tǒng)計(jì)服務(wù)管理,區(qū)域?qū)硬坏軌蛱峁┗A(chǔ)層服務(wù),還能夠?qū)Ρ緟^(qū)域內(nèi)所有圖書館的統(tǒng)計(jì)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)服務(wù)管理,主控云層不但能夠提供轄區(qū)內(nèi)所有區(qū)域圖書館的統(tǒng)計(jì)服務(wù),還能夠?qū)爡^(qū)內(nèi)所有區(qū)域圖書館的統(tǒng)計(jì)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)服務(wù)管理。即基礎(chǔ)層是區(qū)域?qū)拥淖蛹?區(qū)域?qū)邮侵骺貙拥淖蛹?。從目前的需求來?暫時(shí)各層之間沒有交集,但并不意味今后各層之間沒有交集,OCLC的客戶云組織,由于圖書館屬性的多元化,使各層級(jí)之間具有典型的交集層結(jié)構(gòu)。例如:事實(shí)數(shù)據(jù)庫系統(tǒng)的云層管理分為三層:基礎(chǔ)云層是由經(jīng)教育部注冊(cè)、登記、批準(zhǔn)的普通高校和高職院校圖書館,利用該系統(tǒng)填報(bào)本館統(tǒng)計(jì)數(shù)據(jù)組成的云層;區(qū)域云層是由各省、市高校圖書情報(bào)工作指導(dǎo)委員會(huì),利用基礎(chǔ)云層提供的數(shù)據(jù)組成的云層;主控云層是:教育部高校圖書情報(bào)工作指導(dǎo)委員會(huì),利用區(qū)域云層提供的數(shù)據(jù)組成的云層;我們通過多云層多用戶權(quán)限管理的方法,根據(jù)工作需要授予各云層用戶不同的權(quán)限。主控云層具有編輯系統(tǒng)重要的配置參數(shù)的權(quán)限,如:統(tǒng)計(jì)項(xiàng)目名稱和統(tǒng)計(jì)代碼名稱、編輯數(shù)據(jù)字典、定義統(tǒng)計(jì)公式等權(quán)限,并具有按院校分類或省、市檢索和統(tǒng)計(jì)全國(guó)各高校圖書館不同年度的館舍建設(shè)情況、設(shè)備與設(shè)施情況、館員年齡與學(xué)歷結(jié)構(gòu)情況、讀者年齡與學(xué)歷結(jié)構(gòu)情況、文獻(xiàn)資源分類與數(shù)量、讀者服務(wù)情況等,并可按照院校分類與統(tǒng)計(jì)項(xiàng)目分別列出統(tǒng)計(jì)數(shù)據(jù)排行榜,也可按照省、市與統(tǒng)計(jì)項(xiàng)目分別列出統(tǒng)計(jì)數(shù)據(jù)排行榜等。區(qū)域云層沒有編輯系統(tǒng)重要的配置參數(shù)權(quán)限,但具有主控云層除此之外的其他權(quán)限。基礎(chǔ)云層除具有區(qū)域云層的權(quán)限之外,還具有填報(bào)和編輯本館統(tǒng)計(jì)數(shù)據(jù)的權(quán)限。通過分析我們認(rèn)為多層、多用戶管理的系統(tǒng)構(gòu)架是“統(tǒng)計(jì)云服務(wù)”的基本構(gòu)架。
層級(jí)管理為系統(tǒng)權(quán)限管理的科學(xué)性與安全性奠定了基礎(chǔ)。處于基礎(chǔ)層的圖書館通過系統(tǒng)授權(quán)可以完成對(duì)本館數(shù)據(jù)的遷移或錄入,但是不能對(duì)其他圖書館的數(shù)據(jù)進(jìn)行上述操作,從而解決了圖書館統(tǒng)計(jì)數(shù)據(jù)的保密問題,由于統(tǒng)計(jì)數(shù)據(jù)不涉及到讀者個(gè)人的閱讀隱私,因而無需擔(dān)憂個(gè)人隱私的外泄。
各圖書館把本館的數(shù)據(jù)遷移到“云”中管理,總不像放到“家”中管理那么放心。其實(shí),能夠提供“云”服務(wù)的公共事業(yè)單位或企業(yè),都比每個(gè)圖書館更注重系統(tǒng)的安全性和保密性。他們所構(gòu)造的“云服務(wù)”平臺(tái),無論在系統(tǒng)的硬件設(shè)施方面還是在軟件方面都會(huì)采取一系列安全措施。在中國(guó)提供“云”服務(wù)的企業(yè)與用戶之間要建立一種完全信任機(jī)制還有一段漫長(zhǎng)的路要走,主機(jī)托管的信任機(jī)制在中國(guó)已經(jīng)逐步形成,但是軟件系統(tǒng)的托管機(jī)制即云服務(wù)的信任機(jī)制還需要通過政府或者群團(tuán)組織進(jìn)行推動(dòng)。
對(duì)于本地圖書館管理集成系統(tǒng)安全性和可靠性管理所采取的措施是基于局域網(wǎng)范圍內(nèi)的,對(duì)于廣域網(wǎng)來說,“開放”的服務(wù)模式將使更多的圖書館受益,同時(shí)對(duì)系統(tǒng)的防護(hù)也帶來了更多的挑戰(zhàn)。在系統(tǒng)構(gòu)架設(shè)計(jì)中,值得注意的是要充分利用互聯(lián)網(wǎng)的優(yōu)勢(shì),實(shí)現(xiàn)系統(tǒng)安全可靠運(yùn)行的動(dòng)態(tài)管理。例如:加強(qiáng)系統(tǒng)操作日志的動(dòng)態(tài)管理,提高查詢系統(tǒng)操作記錄的時(shí)效性,跟蹤和防范可能進(jìn)行惡意攻擊的隱患;數(shù)據(jù)的備份機(jī)制要實(shí)現(xiàn)動(dòng)態(tài)管理,對(duì)系統(tǒng)數(shù)據(jù)備份的數(shù)量和主要內(nèi)容進(jìn)行動(dòng)態(tài)通報(bào),尤其是對(duì)系統(tǒng)重要數(shù)據(jù)庫數(shù)據(jù)容量的變更、系統(tǒng)運(yùn)行狀態(tài)異常信息等進(jìn)行實(shí)時(shí)、透明的提醒處理甚至可以提供短信提示等等。
從操作層面上來講,對(duì)“云服務(wù)”系統(tǒng)的易操作性要求很高,不需要人們刻意地進(jìn)行應(yīng)用指導(dǎo)服務(wù),就可以操作自如。從應(yīng)用層面上來講,對(duì)系統(tǒng)的可替代性要求很高,用戶要能夠利用原有系統(tǒng)的數(shù)據(jù)而又?jǐn)[脫原有系統(tǒng)的束縛輕松應(yīng)用云服務(wù)。這就需要系統(tǒng)構(gòu)架設(shè)計(jì)在智能化方面多動(dòng)腦筋,注重系統(tǒng)在應(yīng)用層面參數(shù)配置的靈活性,在提供核心功能服務(wù)的同時(shí),使系統(tǒng)又具有個(gè)性化,為圖書館提供基于本館統(tǒng)計(jì)工作定制的統(tǒng)計(jì)工具,使系統(tǒng)具有更大的靈活性和使用范圍?!霸品?wù)”必然要走向自然應(yīng)用的道路,才有生命力和市場(chǎng)價(jià)值。
B/S系統(tǒng)結(jié)構(gòu)的潛在問題是系統(tǒng)的運(yùn)行效率會(huì)受到網(wǎng)絡(luò)環(huán)境的制約,為此在應(yīng)用技術(shù)領(lǐng)域,網(wǎng)上已經(jīng)公開了許多成熟的技術(shù),不過我們除了在編碼方法上采取措施之外,還要在系統(tǒng)構(gòu)架上對(duì)關(guān)鍵性的功能在數(shù)據(jù)結(jié)構(gòu)、編程方法、輸出方式、數(shù)據(jù)遷移方式等方面的技術(shù)問題進(jìn)行優(yōu)化,以提高系統(tǒng)運(yùn)行效率。
“云服務(wù)”應(yīng)用的特點(diǎn)是圖書館可以跨行業(yè)、跨企業(yè)自主選擇和應(yīng)用用戶所需要的內(nèi)容、工具和作業(yè)平臺(tái),其應(yīng)用價(jià)值在于提供“云服務(wù)”的系統(tǒng)是否能夠?qū)崿F(xiàn)零成本的數(shù)據(jù)遷移。數(shù)據(jù)遷移最大的問題在于數(shù)據(jù)的標(biāo)準(zhǔn)化,商業(yè)利益與零成本數(shù)據(jù)遷移是一對(duì)永恒的矛盾,這是構(gòu)成“云服務(wù)”應(yīng)用價(jià)值的最大障礙。我國(guó)圖書館所使用的自動(dòng)化管理集成系統(tǒng)軟件比較雜,沒有一個(gè)像微軟那樣在市場(chǎng)占有率中有絕對(duì)優(yōu)勢(shì)的軟件供應(yīng)商能夠自然形成數(shù)據(jù)遷移的標(biāo)準(zhǔn),值得慶幸的是,在我國(guó)市場(chǎng)上流通的主流圖書館自動(dòng)化系統(tǒng)所采用的著錄標(biāo)準(zhǔn)是國(guó)標(biāo),書目數(shù)據(jù)通訊格式是 CNMARC、USMARC格式,這些軟件基本上都具有書目數(shù)據(jù)和館藏?cái)?shù)據(jù)輸出接口,比較麻煩的是文獻(xiàn)采訪和文獻(xiàn)流通等數(shù)據(jù)沒有標(biāo)準(zhǔn)的數(shù)據(jù)通訊格式,這對(duì)“統(tǒng)計(jì)云服務(wù)”帶來了困難。在短時(shí)間內(nèi),我們不可能通過圖書館行業(yè)組織或多家企業(yè)聯(lián)合制定圖書館數(shù)據(jù)遷移標(biāo)準(zhǔn),按照《云計(jì)算權(quán)利宣言》對(duì)云計(jì)算標(biāo)準(zhǔn)提出的四點(diǎn)要求,我們應(yīng)盡可能使用現(xiàn)有標(biāo)準(zhǔn),避免使用具有壟斷性質(zhì)的專有標(biāo)準(zhǔn)[3]。今后圖書館應(yīng)該與企業(yè)溝通,作為一種商業(yè)合作條件,讓其對(duì)圖書館系統(tǒng)管理員開放本館系統(tǒng)數(shù)據(jù)庫操作,并提供適當(dāng)?shù)募夹g(shù)培訓(xùn),使用透明的數(shù)據(jù)格式并開放系統(tǒng)數(shù)據(jù)庫設(shè)計(jì)標(biāo)準(zhǔn),讓系統(tǒng)管理員能夠及時(shí)掌握系統(tǒng)核心數(shù)據(jù)庫的數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)庫容量的變化,以便有效管理和利用本館系統(tǒng)所產(chǎn)生的數(shù)據(jù)資源,逐步實(shí)現(xiàn)圖書館自動(dòng)化管理集成系統(tǒng)部分功能的云服務(wù)。
事實(shí)數(shù)據(jù)庫系統(tǒng)統(tǒng)計(jì)數(shù)據(jù)標(biāo)準(zhǔn)化的問題,是通過主控云層的有效管理實(shí)現(xiàn)的,在該云層定義并規(guī)范統(tǒng)計(jì)項(xiàng)目名稱、統(tǒng)計(jì)項(xiàng)目代碼、統(tǒng)計(jì)分類名稱和分類代碼,即基礎(chǔ)云層填報(bào)的相關(guān)數(shù)據(jù)項(xiàng)是由主控云層進(jìn)行管理并控制的,基礎(chǔ)云層只有使用數(shù)據(jù)標(biāo)準(zhǔn)的權(quán)限,沒有定義和規(guī)范相關(guān)數(shù)據(jù)標(biāo)準(zhǔn)的權(quán)限。區(qū)域云層在滿足主控云層要求上報(bào)的統(tǒng)計(jì)項(xiàng)目之外,可以對(duì)本區(qū)域內(nèi)的圖書館增加統(tǒng)計(jì)項(xiàng)目,其相關(guān)統(tǒng)計(jì)名稱規(guī)范標(biāo)準(zhǔn)可由區(qū)域內(nèi)的相關(guān)人員統(tǒng)一制定。
“統(tǒng)計(jì)云服務(wù)”的數(shù)據(jù)遷移問題是數(shù)據(jù)標(biāo)準(zhǔn)化的重要組成部分,圖書館的歷史數(shù)據(jù)需要遷移到“云端”才能利用統(tǒng)計(jì)云服務(wù)的統(tǒng)計(jì)功能,這必然要進(jìn)行數(shù)據(jù)遷移。數(shù)據(jù)遷移分為動(dòng)態(tài)遷移和靜態(tài)遷移。動(dòng)態(tài)數(shù)據(jù)遷移是指“云”與“云”之間能夠相互操作共享數(shù)據(jù)庫資源,或者“云”能夠與地面上的數(shù)據(jù)庫進(jìn)行實(shí)時(shí)的互操作,因而數(shù)據(jù)遷移的數(shù)據(jù)量不受系統(tǒng)客觀條件的限制,即可以說是無條件的數(shù)據(jù)完全遷移;靜態(tài)數(shù)據(jù)遷移是指“云”與“云”之間相互操作共享數(shù)據(jù)庫資源,是受用戶選擇條件限制的固定數(shù)據(jù)字段的內(nèi)容和數(shù)量,即可以說是有條件的數(shù)據(jù)部分遷移或者增量遷移。動(dòng)態(tài)數(shù)據(jù)遷移需要企業(yè)之間完全達(dá)成默契,完全或者部分開放各自系統(tǒng)的數(shù)據(jù)庫操作,這對(duì)異構(gòu)系統(tǒng)來說,可望不可及,只有當(dāng)“云”中所有用戶使用的是同構(gòu)系統(tǒng)的時(shí)候,才能實(shí)現(xiàn)動(dòng)態(tài)數(shù)據(jù)完整的遷移。因此,我們可以借助靜態(tài)數(shù)據(jù)遷移的方法,通過用戶對(duì)統(tǒng)計(jì)數(shù)據(jù)字段的選擇和統(tǒng)計(jì)內(nèi)容時(shí)間段的選擇來確定我們需要遷移到“云”端的數(shù)據(jù),再通過增量數(shù)據(jù)遷移的方式不斷充實(shí)和完善“云”端的數(shù)據(jù),從而,通過云服務(wù)特定統(tǒng)計(jì)數(shù)據(jù)結(jié)構(gòu)的獲取方式及存儲(chǔ)方式獲取圖書館所需要的統(tǒng)計(jì)結(jié)果。
“統(tǒng)計(jì)云服務(wù)”數(shù)據(jù)遷移接口沒有統(tǒng)一的標(biāo)準(zhǔn),但是要滿足三個(gè)基本條件:一是要有可讀取的關(guān)系型數(shù)據(jù)庫,如通過ODBC連接的數(shù)據(jù),接收 TXT文本文件、EXCEL文件、Access格式文件等[4];二是允許系統(tǒng)管理員通過數(shù)據(jù)遷移窗口對(duì)遷移數(shù)據(jù)進(jìn)行條件過濾、控制冗余數(shù)據(jù)進(jìn)入“云”數(shù)據(jù)庫;三是要做好數(shù)據(jù)遷移的斷點(diǎn)保護(hù),防止網(wǎng)絡(luò)中斷給數(shù)據(jù)遷移帶來損失。數(shù)據(jù)遷移的內(nèi)容主要涉及文獻(xiàn)采訪數(shù)據(jù)、文獻(xiàn)編目數(shù)據(jù)、文獻(xiàn)典藏?cái)?shù)據(jù)、文獻(xiàn)流通數(shù)據(jù)、讀者數(shù)據(jù)等。滿足上述條件,則可實(shí)現(xiàn)零成本數(shù)據(jù)遷移。所謂零成本,是指不需要企業(yè)提供數(shù)據(jù)遷移的相關(guān)操作,而是由本館系統(tǒng)管理員通過本地系統(tǒng)的數(shù)據(jù)輸出接口和“云”服務(wù)數(shù)據(jù)接口的相關(guān)操作,完成數(shù)據(jù)遷移工作。
統(tǒng)計(jì)參數(shù)主要包括統(tǒng)計(jì)所需要的統(tǒng)計(jì)輸入項(xiàng)目管理、計(jì)算公式管理、數(shù)據(jù)字典管理、系統(tǒng)配置參數(shù)管理、權(quán)限管理等,由系統(tǒng)主控云層統(tǒng)一管理。
統(tǒng)計(jì)輸入項(xiàng)目是統(tǒng)計(jì)輸出的原始數(shù)據(jù),完整、規(guī)范、靈活的輸入項(xiàng)目界面是統(tǒng)計(jì)輸出內(nèi)容完整、準(zhǔn)確、靈活、多變的基本保證。
事實(shí)數(shù)據(jù)庫系統(tǒng)的統(tǒng)計(jì)輸入項(xiàng)目參照《普通高等學(xué)校本科教學(xué)工作水平評(píng)估指標(biāo)和等級(jí)標(biāo)準(zhǔn)》,主要涉及八個(gè)方面的統(tǒng)計(jì)類別:A圖書館基本情況,B年度經(jīng)費(fèi),C文獻(xiàn)資源積累量,D當(dāng)年新增文獻(xiàn)量,E閱覽室情況,F開館時(shí)間,G電子資源開發(fā)情況,H資源利用情況。每一統(tǒng)計(jì)類別,可以細(xì)分為二級(jí)、三級(jí)類目。通過統(tǒng)計(jì)類別的定義,規(guī)范了統(tǒng)計(jì)項(xiàng)目名稱、統(tǒng)計(jì)項(xiàng)目代碼、統(tǒng)計(jì)分類名稱和分類代碼,具體內(nèi)容請(qǐng)登錄“全國(guó)高校圖書館事實(shí)數(shù)據(jù)庫”[5]。各高校圖書館必須采用教育部高校圖書情報(bào)工作指導(dǎo)委員會(huì)通過主控云層制定的統(tǒng)計(jì)輸入項(xiàng)目填報(bào),在保證必須填報(bào)的數(shù)據(jù)之外,可根據(jù)本館或本區(qū)域的需要,自行增加經(jīng)過定義并規(guī)范的統(tǒng)計(jì)輸入項(xiàng)目,但是不能減少或刪除主控云層已經(jīng)制訂的統(tǒng)計(jì)輸入項(xiàng)目。
計(jì)算公式管理是統(tǒng)計(jì)數(shù)據(jù)運(yùn)算的必要元素,是統(tǒng)計(jì)輸出項(xiàng)目的科學(xué)依據(jù),不同的統(tǒng)計(jì)項(xiàng)目,計(jì)算公式可能是不一樣的,為了保證系統(tǒng)應(yīng)用的實(shí)用性和靈活性,事實(shí)數(shù)據(jù)庫統(tǒng)計(jì)所需要的計(jì)算公式可根據(jù)統(tǒng)計(jì)工作需要自行定義。
數(shù)據(jù)字典是保證系統(tǒng)輸入項(xiàng)目使用規(guī)范詞的有效工具,是防止垃圾數(shù)據(jù)進(jìn)入系統(tǒng)的重要手段,是規(guī)范統(tǒng)計(jì)條件并確定檢索關(guān)鍵詞的必要措施。
系統(tǒng)配置參數(shù)是系統(tǒng)運(yùn)行所必需的參數(shù),不同的用戶系統(tǒng)運(yùn)行參數(shù)可能是不一樣的,為了保證系統(tǒng)應(yīng)用的實(shí)用性和靈活性,系統(tǒng)配置參數(shù)可在系統(tǒng)參數(shù)管理中統(tǒng)一管理。
權(quán)限管理是統(tǒng)計(jì)云服務(wù)安全應(yīng)用的重要保證,統(tǒng)計(jì)云服務(wù)要根據(jù)不同云層的角色進(jìn)行權(quán)限配置,并對(duì)各云層中的各種角色進(jìn)行權(quán)限配置。
統(tǒng)計(jì)參數(shù)的統(tǒng)一、有效的管理,極大地增強(qiáng)了統(tǒng)計(jì)服務(wù)的實(shí)用性和靈活性,使之適應(yīng)各種環(huán)境下的統(tǒng)計(jì)需求。
統(tǒng)計(jì)條件主要包括統(tǒng)計(jì)數(shù)據(jù)輸出的限定條件,如統(tǒng)計(jì)數(shù)據(jù)的時(shí)間、區(qū)域、值域等范圍的選擇,統(tǒng)計(jì)項(xiàng)目、輸出項(xiàng)目的選擇與匹配。
靈活的統(tǒng)計(jì)參數(shù)配置和科學(xué)的統(tǒng)計(jì)限定條件選擇,使用戶能夠比較完整、準(zhǔn)確、清晰地表述自己的選擇,建立統(tǒng)計(jì)條件與統(tǒng)計(jì)需求之間比較完美的內(nèi)在聯(lián)系。在事實(shí)數(shù)據(jù)庫系統(tǒng)中有效注冊(cè)的圖書館,只要填報(bào)了本館的數(shù)據(jù),就可以查詢并統(tǒng)計(jì)其他有效注冊(cè)圖書館的相關(guān)統(tǒng)計(jì)數(shù)據(jù),可以根據(jù)本館統(tǒng)計(jì)需要,選擇某段時(shí)間范圍內(nèi)、再選擇某個(gè)區(qū)域內(nèi)、再選擇某些統(tǒng)計(jì)項(xiàng)目、再選擇統(tǒng)計(jì)輸出方式,系統(tǒng)即可輸出符合檢索條件的填報(bào)數(shù)據(jù)。
圖書館“統(tǒng)計(jì)云服務(wù)”要與時(shí)俱進(jìn),我們不能停留在事實(shí)數(shù)據(jù)庫系統(tǒng)現(xiàn)有的服務(wù)水平上,應(yīng)該在以下六個(gè)方面進(jìn)一步充實(shí)和完善圖書館統(tǒng)計(jì)服務(wù),即圖書館業(yè)務(wù)統(tǒng)計(jì)、圖書館館藏建設(shè)統(tǒng)計(jì)、圖書館讀者服務(wù)統(tǒng)計(jì)、圖書館人事管理統(tǒng)計(jì)、圖書館資產(chǎn)管理統(tǒng)計(jì)、圖書館運(yùn)行管理統(tǒng)計(jì)等。通過事實(shí)數(shù)據(jù)庫的統(tǒng)計(jì)服務(wù)實(shí)踐,我們?cè)诩夹g(shù)上采用科學(xué)的統(tǒng)計(jì)參數(shù)確定方法,靈活的統(tǒng)計(jì)條件選擇界面,簡(jiǎn)易高效的操作方式,豐富多樣的輸出內(nèi)容,使系統(tǒng)的實(shí)用性能得到了基本保障。
統(tǒng)計(jì)結(jié)果是依據(jù)統(tǒng)計(jì)條件的選擇和統(tǒng)計(jì)參數(shù)的設(shè)定所輸出的各種統(tǒng)計(jì)數(shù)據(jù),它獲取方式是通過云的服務(wù)方式展示在網(wǎng)頁上,并可通過用戶所選擇的輸出方式獲取并存儲(chǔ)統(tǒng)計(jì)結(jié)果。統(tǒng)計(jì)云服務(wù)應(yīng)采用先進(jìn)的軟件設(shè)計(jì)技巧并充分利用數(shù)據(jù)字典的優(yōu)勢(shì),使服務(wù)界面設(shè)計(jì)能夠充分考慮用戶的使用習(xí)慣,僅用鼠標(biāo)選擇操作,就可得到滿足個(gè)性化需求的統(tǒng)計(jì)報(bào)表,使統(tǒng)計(jì)結(jié)果的獲取方式及存儲(chǔ)方式,統(tǒng)計(jì)項(xiàng)目的參數(shù)配置,數(shù)據(jù)字典的管理更加靈活便捷。
統(tǒng)計(jì)輸出方式是滿足用戶多種需求關(guān)系的重要手段,統(tǒng)計(jì)云服務(wù)應(yīng)具有寬泛的統(tǒng)計(jì)時(shí)間選擇和統(tǒng)計(jì)輸出方式選擇,通常應(yīng)具有如下統(tǒng)計(jì)輸出方式:
1)統(tǒng)計(jì)輸出的報(bào)表維數(shù)可根據(jù)用戶的選擇自動(dòng)生成二維或三維統(tǒng)計(jì)報(bào)表。
2)統(tǒng)計(jì)輸出的數(shù)據(jù)格式可根據(jù)用戶的選擇自動(dòng)生成 EXCEL/HTML/PDF/等格式。
3)統(tǒng)計(jì)輸出的圖形式樣可根據(jù)用戶的選擇自動(dòng)生成直方圖、餅型圖、折線圖等格式。
4)統(tǒng)計(jì)輸出可生成圖文并茂的報(bào)表式樣,在圖形界面上配有表格輸出,既滿足了圖書館統(tǒng)計(jì)數(shù)據(jù)的微觀需求,又滿足了圖書館統(tǒng)計(jì)數(shù)據(jù)的宏觀需求。
5)統(tǒng)計(jì)輸出的數(shù)據(jù)去向可根據(jù)用戶的選擇發(fā)送到指定部門的指定個(gè)人。
事實(shí)數(shù)據(jù)庫基礎(chǔ)云層的統(tǒng)計(jì)數(shù)據(jù)集中統(tǒng)一存儲(chǔ)在北京大學(xué)圖書館機(jī)房專用服務(wù)器上,統(tǒng)計(jì)結(jié)果的獲取與存儲(chǔ)方式是通過層級(jí)權(quán)限管理來實(shí)現(xiàn)的,統(tǒng)計(jì)結(jié)果可下載到本地電腦中進(jìn)行存儲(chǔ)。
“統(tǒng)計(jì)云服務(wù)”關(guān)鍵在于要尋找一種能夠適應(yīng)“統(tǒng)計(jì)云服務(wù)”技術(shù)、應(yīng)用和管理的解決方案。“統(tǒng)計(jì)云服務(wù)”的價(jià)值,不能用傳統(tǒng)的、平面的、本位的眼光去考量,降低服務(wù)和管理成本這是社會(huì)永恒的主題。“統(tǒng)計(jì)云服務(wù)”不是一個(gè)“無中生有”的創(chuàng)新性服務(wù),而是從孕育滋長(zhǎng)在“地面”幾十年的圖書館統(tǒng)計(jì)工作中提煉、升華出來的一種新型的服務(wù)模式。通過“云”的品質(zhì)和服務(wù)能力的不斷提高,人們對(duì)“云服務(wù)”的方式也會(huì)逐步適應(yīng),進(jìn)而產(chǎn)生新的需求,并將逐步發(fā)展成為圖書館的專業(yè)統(tǒng)計(jì)云。通過事實(shí)數(shù)據(jù)庫系統(tǒng)的開發(fā)與應(yīng)用,我們總結(jié)出“統(tǒng)計(jì)云服務(wù)”之所以在沒有“云”概念誕生的時(shí)候就成功地施展了“云”的魅力,關(guān)鍵不在“技術(shù)”,而在于有效地發(fā)揮了教育部高校圖書情報(bào)工作指導(dǎo)委員會(huì)的組織與管理作用,各省高校圖書情報(bào)工作指導(dǎo)委員會(huì)逐層發(fā)揮作用,各高等院校積極響應(yīng),有效的組織行為是“統(tǒng)計(jì)云服務(wù)”成功的關(guān)鍵。OCLC若沒有在全世界范圍內(nèi)各層級(jí)的圖書館團(tuán)體會(huì)員,沒有這些團(tuán)體會(huì)員所提供、整理并匯集的海量級(jí)的基于WorldCat的書目數(shù)據(jù)與館藏?cái)?shù)據(jù),它推出的WEB級(jí)協(xié)作型圖書館的管理與服務(wù)是不會(huì)引起圖書館界強(qiáng)烈關(guān)注的。雖然本文重點(diǎn)闡述的是“統(tǒng)計(jì)云服務(wù)”的若干技術(shù)問題,我們還是要強(qiáng)調(diào),在中國(guó)現(xiàn)行體制中,“公有云”、“私有云”、“混合云”的成功開發(fā)與應(yīng)用,絕大多數(shù)要優(yōu)先有占有“云”的資源并且具有構(gòu)成“云”的組織結(jié)構(gòu),其后才有“云服務(wù)”。技術(shù)永遠(yuǎn)是為市場(chǎng)服務(wù)的工具,無論IT企業(yè)想出什么樣的高招充實(shí)和完善“云”服務(wù)的技術(shù),都要回到市場(chǎng)這個(gè)主題上來,回歸到研究圖書館相關(guān)組織行為學(xué)的軌道上。“云”組織管理與“云服務(wù)”通常不是一個(gè)機(jī)構(gòu),通常由圖書館的協(xié)作組織或者區(qū)域行政主管部門構(gòu)成,而云服務(wù)機(jī)構(gòu)通常是一個(gè) IT企業(yè),他們之間會(huì)自然形成默契的分工,一個(gè)側(cè)重應(yīng)用的組織與管理,一個(gè)側(cè)重技術(shù)開發(fā)與服務(wù)管理,這是一個(gè)完美的結(jié)合。只有充分發(fā)揮圖書館協(xié)作組織的作用,提高政府或事業(yè)單位的行政效能,有效利用區(qū)域經(jīng)濟(jì)所構(gòu)成的市場(chǎng)氛圍,才能建立比較完整的“云服務(wù)”體系結(jié)構(gòu),才能使圖書館放心地將自己本館所擁有的數(shù)據(jù)聚集到相關(guān)云端,使各館的數(shù)據(jù)資源最大限度地發(fā)揮作用,同時(shí)通過相關(guān)的“云”組織與管理機(jī)構(gòu)限制數(shù)據(jù)資源及其衍生產(chǎn)品的生產(chǎn)與應(yīng)用,這會(huì)有效地規(guī)避由于“云”服務(wù)而引發(fā)的數(shù)據(jù)的知識(shí)產(chǎn)權(quán)問題。
科學(xué)的系統(tǒng)構(gòu)架,零成本的數(shù)據(jù)遷移方式,靈活的參數(shù)配置與條件選擇的方法和豐富的統(tǒng)計(jì)結(jié)果獲取和存儲(chǔ)方式,有效的組織與管理,是圖書館“統(tǒng)計(jì)云服務(wù)”逐步形成、發(fā)展與完善成為圖書館專業(yè)統(tǒng)計(jì)工具和服務(wù)平臺(tái)的必備條件。
1 法新社.美國(guó)政府帶頭推廣云計(jì)算.參考消息,2009-9-19(7)
2 胡小菁,范并思.云計(jì)算給圖書館管理帶來挑戰(zhàn).大學(xué)圖書館學(xué)報(bào),2009,27(4):7-12
3 劉煒.圖書館需要一朵怎樣的“云”?.大學(xué)圖書館學(xué)報(bào),2009,27(4):2-6
4 王曉成.什么是 BI?2008-10-15.[2009-7-5].http://www.cnblog.com/abcdwxc/archive/1312018.html
5 教育部高校圖書情報(bào)工作指導(dǎo)委員會(huì).高校圖書館事實(shí)數(shù)據(jù)庫.2003-10-10.[2009-06-02].http://162.105.140.111/calis/default.asp