付博 武興華
[摘 要]文章將國家開放大學數(shù)字圖書館現(xiàn)有業(yè)務(wù)特點和發(fā)展重點作為研究內(nèi)容,在闡述數(shù)據(jù)治理概念及研究基本情況的基礎(chǔ)上,分析開放大學數(shù)字圖書館發(fā)展情況與存在問題,根據(jù)其自身特點提出有針對性的數(shù)據(jù)治理框架,意在提升開放大學數(shù)字圖書館數(shù)據(jù)資產(chǎn)的服務(wù)水平,提高數(shù)據(jù)的利用率和數(shù)據(jù)價值。
[關(guān)鍵詞]開放大學;數(shù)字圖書館;數(shù)據(jù)治理;數(shù)據(jù)質(zhì)量
[中圖分類號]G258.6 [文獻標識碼]A [文章編號]1008-7656(2019)01-0081-05
在信息化與數(shù)字化的技術(shù)驅(qū)動下,數(shù)據(jù)科學時代拉開序幕,新的研究范式應(yīng)運而生。隨著數(shù)據(jù)科學不斷發(fā)展,管理過程設(shè)定、業(yè)務(wù)流程決策以及數(shù)據(jù)處理方法也在時刻發(fā)生變化。異構(gòu)海量數(shù)據(jù)的產(chǎn)生使傳統(tǒng)的數(shù)據(jù)管理方式“捉襟見肘”,亟需對數(shù)據(jù)進行科學治理以確保數(shù)據(jù)的高效利用與最大增值。
一、數(shù)據(jù)治理的概念及數(shù)據(jù)治理研究的基本情況
(一)數(shù)據(jù)治理的概念
目前,國內(nèi)外的研究機構(gòu)和學者從不同視角對數(shù)據(jù)治理進行定義,但還未形成統(tǒng)一共識。一些國外學者從法案中提出數(shù)據(jù)治理,定義了一系列規(guī)則和政策[1];國際數(shù)據(jù)管理協(xié)會(Data Management Association)認為,在數(shù)據(jù)管理的十大職能中,數(shù)據(jù)治理最為核心,在數(shù)據(jù)的管理和使用層面對數(shù)據(jù)進行規(guī)劃、監(jiān)督及控制,用以支持頂層決策與戰(zhàn)略實施[2];還有一些學者主張數(shù)據(jù)治理應(yīng)從數(shù)據(jù)管控的責任與技術(shù)等角度出發(fā),在人與技術(shù)的集中使用背景下,組織中的數(shù)據(jù)作為一項資產(chǎn)得到合理使用[3-6]。美國全球數(shù)據(jù)管理協(xié)會 (DAMA) 認為,數(shù)據(jù)治理是對數(shù)據(jù)資產(chǎn)管理行使權(quán)利和控制的活動的集合 (DAMA, 2012) [7]。國際數(shù)據(jù)治理研究所 (DGI The Data Governance Institute)認為,數(shù)據(jù)治理是指針對信息相關(guān)過程的決策權(quán)和職責體系,這些過程遵循“在什么時間和情況下、用什么方式、由誰、對哪些數(shù)據(jù)、采取哪些行動”的方法來執(zhí)行[8]。在國內(nèi),數(shù)據(jù)治理的定義還沒有統(tǒng)一,多數(shù)研究與數(shù)據(jù)的生命周期相關(guān),例如數(shù)據(jù)的采集、加工、存儲、利用等,或采用數(shù)據(jù)管護、數(shù)據(jù)管理等名詞[9-14], 還未提到數(shù)據(jù)治理的本質(zhì)。數(shù)據(jù)治理源于IT治理,其將數(shù)據(jù)作為一項有重要價值的資源,不僅僅是對數(shù)據(jù)管理過程的計劃執(zhí)行,更是對管理過程的指導、監(jiān)督和評估。
(二)數(shù)據(jù)治理研究的基本情況
框架方面,除DGI框架和DAMA框架[15]外,國外也有學者提出了決策域模型和驅(qū)動力模型[16][17] 。國內(nèi)包冬梅等總結(jié)了數(shù)據(jù)治理框架中的職能及關(guān)系、工作區(qū)間、任務(wù)、組織結(jié)構(gòu)、責任分工、成效的評估標準等,同時提出了高校圖書館的數(shù)據(jù)治理框架CALib[18]; 許曉東等設(shè)計了高等教育數(shù)據(jù)治理的分析框架[19];李青、韓俊紅設(shè)計了教育數(shù)據(jù)治理框架[20]。
在圖情領(lǐng)域,顧立平從數(shù)據(jù)獲取、數(shù)據(jù)共享、數(shù)據(jù)重用三方面證實了數(shù)據(jù)治理是圖書館事業(yè)發(fā)展重要的機遇[21];劉潔璇闡述了數(shù)據(jù)治理在知識管理中的應(yīng)用與價值,并討論了發(fā)展前景[22];任亞忠分析了大數(shù)據(jù)時代背景下,數(shù)據(jù)治理為圖書館帶來的一系列轉(zhuǎn)變[23]。
二、開放大學數(shù)字圖書館發(fā)展情況
開放大學采用多媒體數(shù)字化資源辦學的特點,決定了信息化與數(shù)字化將是支撐其遠程教育的核心與焦點。數(shù)字圖書館作為開放大學重要的組成部分,在現(xiàn)代信息技術(shù)的支撐下,采用網(wǎng)絡(luò)化、數(shù)字化提供服務(wù)已是常態(tài)。
(一)業(yè)務(wù)特點——海量數(shù)據(jù)與大數(shù)據(jù)利用
開放大學的學生數(shù)量龐大,分布在不同的年齡層次,也遍布不同的城鄉(xiāng)區(qū)域、機構(gòu)崗位與社會階層,知識背景與學習能力也各不相同,同時,學生學習規(guī)律、認知習慣、學習動機、學習環(huán)境方面也差異明顯。因此,每個學生在使用數(shù)字圖書館時,存在不同的學習行為與學習路徑,構(gòu)成了海量讀者行為數(shù)據(jù)的來源。與此同時,在大數(shù)據(jù)飛速發(fā)展的背景下,如何將這些行為數(shù)據(jù)加以價值最大化利用,這成為了目前的研究熱點并值得深入挖掘。
(二)發(fā)展重點——數(shù)字資源深度組織與開放獲取
數(shù)字圖書館是用戶獲取數(shù)字資源及相關(guān)服務(wù)的平臺。依據(jù)傳統(tǒng)的服務(wù)模式,數(shù)字資源通過數(shù)據(jù)庫和網(wǎng)頁形式向用戶呈現(xiàn),根據(jù)數(shù)字資源自身主題或?qū)W科導航進行資源揭示,由用戶主動進行資源獲取,該模式下的需求導向不足。同時,數(shù)字資源整合深度難以滿足用戶的個性化需求,挖掘深度較淺。開放大學強調(diào)優(yōu)質(zhì)資源的共建共享,將免費開放與傳播的公共學習資源納入數(shù)字化服務(wù)中,契合開放大學的辦學理念與服務(wù)宗旨,能夠推動開放大學數(shù)字圖書館資源整合空間的無限延伸,開放獲取將得到拓展和開辟。
三、開放大學數(shù)字圖書館數(shù)據(jù)治理框架
圖1 開放大學數(shù)字圖書館數(shù)據(jù)治理框架圖
開放大學數(shù)字圖書館數(shù)據(jù)治理是在開放大學圖書館發(fā)展戰(zhàn)略和規(guī)劃的指導下實施的,因此,其數(shù)據(jù)治理工作具有鮮明的行業(yè)特征,通用的數(shù)據(jù)治理框架并不完全適用。通過上述對開放大學數(shù)字圖書館的業(yè)務(wù)特點和發(fā)展重點進行分析,提出開放大學數(shù)字圖書館數(shù)據(jù)治理框架(見圖1)。
從內(nèi)容上來看,開放大學數(shù)據(jù)治理包括數(shù)據(jù)治理戰(zhàn)略、數(shù)據(jù)治理活動體系、數(shù)據(jù)治理實施三個層面。在這三個層面中,包括數(shù)字圖書館的文化內(nèi)涵與愿景、規(guī)章制度與組織保障,以及資源服務(wù)、數(shù)據(jù)整合、基礎(chǔ)IT支持等多個方面。
(一)數(shù)據(jù)治理戰(zhàn)略
數(shù)據(jù)治理戰(zhàn)略處于框架的最頂層,對整個數(shù)字圖書館的發(fā)展具有最高指導意義。數(shù)字圖書館秉持“時時、處處、人人”的服務(wù)理念,為學生終身學習打造優(yōu)質(zhì)平臺,并逐步適應(yīng)目前先進的技術(shù)與大數(shù)據(jù)環(huán)境,與時俱進,使各類學習者不受空間時間限制,隨時隨地獲取數(shù)字資源服務(wù)。同時,數(shù)據(jù)治理的戰(zhàn)略意識也應(yīng)當貫穿到數(shù)字圖書館建設(shè)的各個層面,以戰(zhàn)略為指引,形成具體活動與舉措的規(guī)劃。
(二)數(shù)據(jù)治理活動體系
1.規(guī)章制度與組織保障
數(shù)據(jù)治理覆蓋面廣,各項規(guī)劃與舉措,各類業(yè)務(wù)和流程,各種系統(tǒng)與平臺,要求每項工作都必須從制度上加以規(guī)范與保障,將各類章程、辦法、考核等貫穿到各項工作的始終。在規(guī)章制度的指導下,進行人力財力等的有效組織,保證數(shù)據(jù)治理工作的順利進行。根據(jù)學校的愿景和目標,設(shè)定總方向,獲得領(lǐng)導層的支持;進行跨部門的協(xié)調(diào),執(zhí)行數(shù)據(jù)治理具體計劃;業(yè)務(wù)部門劃定具體業(yè)務(wù)的負責工作組或工作人員,履行職責,解決問題。
2.數(shù)據(jù)存儲治理
對于數(shù)字圖書館來說,各類數(shù)據(jù)的存儲安全是最不能忽視的一個問題。數(shù)據(jù)的存儲是其持續(xù)利用的關(guān)鍵點,存儲安全應(yīng)當?shù)玫絻?yōu)先保證,并且需從以下幾點著手并逐步制度化、常態(tài)化。
(1) 安全規(guī)劃。安全規(guī)劃應(yīng)保證存儲在數(shù)據(jù)庫中的所有數(shù)據(jù)安全有效,在經(jīng)過長時間存儲之后仍能被訪問和使用。具體措施如定時評估數(shù)據(jù)、監(jiān)測技術(shù)環(huán)境、測試存儲功能、對所部署的安全措施進行審計、注意數(shù)字資源的權(quán)限管理等,了解可能發(fā)生的安全事件。
(2) 日志分析。日志被認為是一類非常重要的數(shù)據(jù),它顯示出了數(shù)據(jù)的存儲方式、存儲路徑等,基于日志的分析能夠幫助系統(tǒng)管理員更好地了解數(shù)據(jù)訪問使用情況,了解所出現(xiàn)的問題并能及時查看。
(3) 訪問控制。為了防止數(shù)據(jù)被不正當訪問,減少數(shù)據(jù)濫用與數(shù)據(jù)泄露發(fā)生的可能,需要對數(shù)據(jù)的訪問進行權(quán)限設(shè)置,某些權(quán)限只能授予那些需要訪問數(shù)據(jù)的人,以此來降低越權(quán)訪問率與事故后的處理難度。
(4) 容災(zāi)備份。容災(zāi)備份實際上提供了一套復制數(shù)據(jù)的機制,將數(shù)據(jù)保存在另一個物理獨立的存儲容器中。容災(zāi)備份對所有通信和數(shù)據(jù)定期檢查,以確保在數(shù)據(jù)庫運行崩潰時,能夠在最短時間內(nèi)使資源得到安全、高效的恢復。
3.數(shù)據(jù)描述治理
(1) 數(shù)據(jù)編碼標準。建立統(tǒng)一的資源數(shù)據(jù)編碼標準可以保證在全體數(shù)字資源的范圍內(nèi),將數(shù)據(jù)進行一致性管理,為實現(xiàn)數(shù)據(jù)庫的數(shù)據(jù)集成共享,管控協(xié)同,一體化運行做好良好的基礎(chǔ)保障。
(2) 數(shù)據(jù)編碼原則。結(jié)合數(shù)字資源管理需求,制定數(shù)據(jù)編碼規(guī)則如下。
識別唯一性:統(tǒng)一資源數(shù)據(jù)編碼要求具有唯一的識別標志。
特征一致性:保證資源數(shù)據(jù)編碼的關(guān)鍵特征在不同應(yīng)用、不同系統(tǒng)中的高度一致性。
數(shù)據(jù)穩(wěn)定性:資源數(shù)據(jù)編碼本身的屬性不會隨管理過程中的數(shù)據(jù)流轉(zhuǎn)而被修改。
長期有效性:資源數(shù)據(jù)編碼所代表的數(shù)據(jù)對象在存儲中仍然存在,該組員數(shù)據(jù)編碼就應(yīng)該保持有效性。
(3) 元數(shù)據(jù)描述標準。元數(shù)據(jù)是具有對數(shù)據(jù)進行定位、描述、選擇等多種功能的數(shù)據(jù),具有連貫有效地描述、管理、編目網(wǎng)絡(luò)資源的功能。通過對元數(shù)據(jù)的管理,對數(shù)據(jù)進行分類組織,實現(xiàn)無縫信息檢索、內(nèi)容調(diào)用和資源共享,是數(shù)據(jù)治理的重要內(nèi)容。在元數(shù)據(jù)管理中,可以制定三大類元數(shù)據(jù)項:必選項(必須有)、條件項(有則應(yīng)用)和可選項(有用時)。
4.數(shù)據(jù)質(zhì)量治理
數(shù)據(jù)質(zhì)量治理是提高和改善數(shù)字資源數(shù)據(jù)質(zhì)量的一項活動,是對數(shù)據(jù)的每個階段——采集、存儲、管理、共享到應(yīng)用中可能引起的各種數(shù)據(jù)質(zhì)量問題進行管理,從而進行資源監(jiān)測、問題識別與事故預警。質(zhì)量治理是一個循環(huán)管理,其最終要達到的目標是提升數(shù)據(jù)質(zhì)量,通過可靠的數(shù)據(jù)提升其使用價值,并最終獲得管理效益。
數(shù)據(jù)的質(zhì)量治理最主要包括完整性、準確性與有效性等三個方面。
(1) 數(shù)據(jù)的完整性。數(shù)據(jù)的完整性就是數(shù)據(jù)之“全”。即在數(shù)據(jù)生命周期開始時,把所需信息盡可能采集完整,這對于全面把握數(shù)據(jù),對數(shù)據(jù)進行分析并發(fā)現(xiàn)其中規(guī)律及問題具有重要意義。隨著數(shù)據(jù)表格、數(shù)據(jù)庫的深度使用,能夠?qū)?shù)據(jù)完整性進行完善。
(2) 數(shù)據(jù)的準確性。數(shù)據(jù)的準確性是指數(shù)據(jù)是否符合其真實的情況。對于數(shù)字資源來說,其數(shù)據(jù)的準確性尤為重要。因此,我們進行資源數(shù)據(jù)管理時,在整合、傳輸?shù)雀鱾€環(huán)節(jié),都有可能受到各個方面的影響,因此我們要盡可能將誤差控制到最小,以保證數(shù)據(jù)的準確性。
(3 )數(shù)據(jù)的有效性。在保證數(shù)據(jù)的完整性與準確性的同時,還需要考慮數(shù)據(jù)的有效性。也就是說,我們在衡量數(shù)據(jù)時,過期的、不符合要求的數(shù)據(jù)是不產(chǎn)生價值的,是應(yīng)該被剔除的。
5.統(tǒng)計、評估與優(yōu)化
數(shù)字圖書館數(shù)據(jù)采集系統(tǒng)將用戶的行為數(shù)據(jù)記錄下來,并進行統(tǒng)計分析,直接服務(wù)于提升數(shù)字圖書館的建設(shè)水平和服務(wù)質(zhì)量的活動。在加強統(tǒng)計分析與數(shù)據(jù)挖掘的同時,推動學科服務(wù)、知識服務(wù)等的完善。建立可實行的、可測量的統(tǒng)計與評估指標體系,了解數(shù)據(jù)治理的現(xiàn)狀和差距,對數(shù)據(jù)治理框架中的各項內(nèi)容進行不斷優(yōu)化,制定改進路徑,促進數(shù)據(jù)治理向成熟發(fā)展。
(三)數(shù)據(jù)治理的實施
數(shù)據(jù)治理的實施指在戰(zhàn)略規(guī)劃及關(guān)鍵活動指導下,在IT支持層面、數(shù)據(jù)層面和服務(wù)層面所做的具體措施。
IT支持層面包括技術(shù)路線、支撐平臺、遠程服務(wù)等,在支撐整個數(shù)字圖書館系統(tǒng)運行的基礎(chǔ)上,針對開放大學師生遍布全國的特點,提供遠程登陸、聯(lián)合認證等服務(wù);數(shù)據(jù)層面包括數(shù)據(jù)模型、數(shù)據(jù)架構(gòu)、數(shù)據(jù)整合、數(shù)據(jù)發(fā)現(xiàn)四個方面。數(shù)據(jù)架構(gòu)是系統(tǒng)和軟件架構(gòu)層面的描述,主要是從系統(tǒng)設(shè)計和實現(xiàn)的視角來看數(shù)據(jù)流和信息流。數(shù)據(jù)模型包括概念數(shù)據(jù)模型、邏輯數(shù)據(jù)模型和物理數(shù)據(jù)模型等。同時,在標準化、開放性與集成化的標準環(huán)境下,整合數(shù)據(jù)庫的各類資源、整合紙本與數(shù)字資源、整合專業(yè)、小眾的學科資源提供知識路徑等,也正在成為數(shù)字圖書館系統(tǒng)發(fā)展的主流;服務(wù)層面包括構(gòu)建基于開放網(wǎng)絡(luò)的、適合開放大學特點的學術(shù)資源體系,進行資源整合,建立特色資源庫,采用最適合的元數(shù)據(jù)方案,加強數(shù)字資源元數(shù)據(jù)編目,針對成人教育的特點,對資源進行更細粒度、更小單元、更深層面的組織和揭示。與此同時,在開放大學系統(tǒng)中,充分挖掘各分部發(fā)展需求,整合各地優(yōu)勢資源,為整個開放大學體系提供服務(wù)。
四、結(jié)語
開放大學數(shù)字圖書館隨著技術(shù)與數(shù)字資源的不斷前進演變,越來越以數(shù)據(jù)為核心。隨著國家“十三五”規(guī)劃進入關(guān)鍵時期,數(shù)字圖書館的發(fā)展與建設(shè)也應(yīng)該站在“十三五”規(guī)劃的高度,對數(shù)據(jù)治理加以重視。應(yīng)樹立數(shù)據(jù)治理的理念,在新環(huán)境中進行轉(zhuǎn)型,在總體戰(zhàn)略的引領(lǐng)下,明確職責分工,加強組織保障,完善標準體系,提供高質(zhì)量的數(shù)據(jù)服務(wù),將數(shù)據(jù)作為寶貴資產(chǎn)加以利用,為開放大學的師生提供便捷、滿意的服務(wù)。
[參考文獻]
[1]Donaldson A,Walker P.Information governance—A view from the NHS[J].International Journal of Medical Informatics,2004(73).
[2]國際數(shù)據(jù)管理協(xié)會 [EB/OL]. (2015-
05-31)[2018-10-12]. https://dama.org.
[3]Fernandes L,O’Connor M. Data governance
and data stewardship. Critical issues in the move toward EHRs and HIE[J]. Journal of AHIMA/American Health Information Management Association,2009 (80).
[4]Rosenbaum S.Data governance? and? steward
ship: Designing data stewardship entities and advancing data access[J]. Health Services Research,2010 (45).
[5]Haider? A. Asset? lifecycle? data? governance
framework[A]. Proceedings of the 7th World Congress on Engineering Asset Management(WCEAM2012)[C]. Switzerland:Springer International Publishing,2015.
[6]Malik P. Governing big? data: Principles and
practices[J]. IBM Journal of Research and Development,2013 (3).
[7]DAMA International.The DAMA Guide to the
Data Management Body of Knowledge[M]. 1st ed.New York: Technics Publications,2009.
[8]Data? ?Governance? Institute. The? DGI Data
Governance Framework[R/OL].(2015-08-20)[2018- 10-10]. http: // www. datagovernance. com / the-dgi-framework /dgi-framework.pdf.
[9]程蓮娟.美國高校圖書館數(shù)據(jù)監(jiān)護的實踐及其啟示[J].圖書館雜志,2012(1).
[10]錢鵬,鄭建明.高??茖W數(shù)據(jù)組織與服務(wù)初探[J].情報理論與實踐,2011(2).
[11]丁培.數(shù)據(jù)策展與圖書館[J].圖書館學研究,2013(6).
[12]曹霞.國內(nèi)Data Curation研究現(xiàn)狀與熱點分析[J].圖書情報工作,2014(18).
[13]王芳,慎金花.國外數(shù)據(jù)管護(Data Curation)研究與實踐進展[J].中國圖書館學報,2014(12).
[14]張閃閃,顧立平,蓋曉良.國外信息服務(wù)機構(gòu)的數(shù)據(jù)管理政策調(diào)研與分析[J].圖書情報知識,2015(5).
[15]劉桂鋒,錢錦琳,盧章平.國內(nèi)外數(shù)據(jù)治理研究進展:內(nèi)涵、要素、模型與框架[J].圖書情報工作,2017(21).
[16]Khatri V,Brown C V.Designing data governanc[J].Communications of the ACM ,2010 (1).
[17]Martijn N,Hulstijn J,Bruijne M,et al.Determining the effects of data governance on the performance and compliance of enterprises in the logistics and retail sector[C]. International Federation for Information Processing,2015.
[18]包冬梅,范穎捷,李鳴.高校圖書館數(shù)據(jù)治理及其框架[J].圖書情報工作,2015(18).
[19]許曉東,王錦華,卞良,孟倩.高等教育的數(shù)據(jù)治理研究[J].高等工程教育研究,2015(5).
[20]李青,韓俊紅.數(shù)據(jù)治理:提升教育數(shù)據(jù)質(zhì)量的方法和途徑[J].中國遠程教育,2018(8).
[21]顧立平.數(shù)據(jù)治理——圖書館事業(yè)的發(fā)展機遇[J].中國圖書館學報,2016(5).
[22]劉潔璇.高校圖書館知識管理中的數(shù)據(jù)治理[J].情報科學,2018(1).
[23]任亞忠.從數(shù)據(jù)管理走向數(shù)據(jù)治理——大數(shù)據(jù)環(huán)境下圖書館職能的轉(zhuǎn)變[J].四川圖書館學報,2017(4).