王亞寧 魯華杰 李恒 陳黎明
摘 要 元數(shù)據(jù)由于數(shù)據(jù)倉庫技術(shù)的發(fā)展而變得越來越重要,其不僅能夠定義數(shù)據(jù)倉庫的具體作用,還能夠?qū)崿F(xiàn)數(shù)據(jù)倉庫的有效管理。而由于不同的單位大多采用不同的數(shù)據(jù)倉庫管理系統(tǒng),并未采用統(tǒng)一的平臺進(jìn)行管理,使數(shù)據(jù)之間的交流和傳遞變得十分困難,所以應(yīng)該建立統(tǒng)一的標(biāo)準(zhǔn)對原數(shù)據(jù)進(jìn)行管理和描述。CWM是為了將元數(shù)據(jù)管理策略進(jìn)行統(tǒng)一而制定的,其能夠使元數(shù)據(jù)和數(shù)據(jù)倉庫在交換工具以及儲存庫時變得更加方便。本篇文章主要針對元數(shù)據(jù)在數(shù)據(jù)倉庫中的應(yīng)用進(jìn)行了研究。
關(guān)鍵詞 元數(shù)據(jù);數(shù)據(jù)倉庫;研究分析;元數(shù)據(jù)儲存
前言
隨著數(shù)據(jù)倉庫技術(shù)的發(fā)展,元數(shù)據(jù)對于數(shù)據(jù)倉庫技術(shù)的發(fā)展來說十分重要,其已經(jīng)運(yùn)用到了倉庫技術(shù)的整個過程當(dāng)中,成為數(shù)據(jù)倉庫技術(shù)的重要部分。對元數(shù)據(jù)進(jìn)行科學(xué)的管理,能夠提升數(shù)據(jù)管理的安全性。目前市場上儲存元數(shù)據(jù)的格式都存在著明顯的差異,如何通過有效的方式使元數(shù)據(jù)的集成和理解變得更加容易,已經(jīng)成為研究的重要問題。本篇文章將針對元數(shù)據(jù)在數(shù)據(jù)倉庫中的應(yīng)用情況進(jìn)行分析,期望為數(shù)據(jù)倉庫信息管理提供有效的意見建議。
1基本概念
1.1 數(shù)據(jù)倉庫
數(shù)據(jù)倉庫技術(shù)是指在多變化的信息需求之下,構(gòu)建的多維度數(shù)據(jù)儲存管理系統(tǒng),其主要目的是能夠更好地對信息數(shù)據(jù)進(jìn)行管理,使人們能夠?qū)⑿畔?shù)據(jù)的應(yīng)用從較低層次的尾端進(jìn)行查詢,幫助元數(shù)據(jù)管理提供更好的決策支持[1]。
1.2 元數(shù)據(jù)
指對數(shù)據(jù)的信息化描述,例如對信息結(jié)構(gòu)的數(shù)據(jù)描述。利用元數(shù)據(jù)可以找到數(shù)據(jù)倉庫中所要查詢的具體數(shù)據(jù)信息,以便于更好地對數(shù)據(jù)進(jìn)行管理。對元數(shù)據(jù)進(jìn)行有效分類是實現(xiàn)數(shù)據(jù)倉庫科學(xué)管理的前提,但目前并沒有分類的統(tǒng)一標(biāo)準(zhǔn),大多是從數(shù)據(jù)的類型、數(shù)據(jù)抽象程度、系統(tǒng)的用戶、來源、使用目的以及形成時間等幾個方面進(jìn)行分類。目前元數(shù)據(jù)管理越來越得到重視,元數(shù)據(jù)管理不僅能夠廣泛運(yùn)用,使用戶掌握數(shù)據(jù)倉庫中的各類信息,還能夠提高生產(chǎn)率,所以元數(shù)據(jù)的管理十分重要。
2基于CWM的元數(shù)據(jù)管理
元數(shù)據(jù)的管理策略主要有搭建元數(shù)據(jù)交換途徑、元數(shù)據(jù)儲存庫以及元數(shù)據(jù)倉庫三種管理策略,而為了使元數(shù)據(jù)的管理維護(hù)問題得以解決,需要構(gòu)建中央元數(shù)據(jù)儲存庫,對元數(shù)據(jù)的生命周期進(jìn)行統(tǒng)一化的管理[2]。這樣才能夠促進(jìn)數(shù)據(jù)倉庫各種工具之間的交換。CWM是集元數(shù)據(jù)收集、儲存和管理一體化的平臺,其主要由用戶操作層、應(yīng)用層和儲存數(shù)據(jù)層三層架構(gòu)組成。中央元數(shù)據(jù)儲存庫應(yīng)該以CWM為統(tǒng)一的標(biāo)準(zhǔn),再根據(jù)管理平臺實現(xiàn)元數(shù)據(jù)的科學(xué)化管理。
元數(shù)據(jù)儲存的中央元數(shù)據(jù)儲存庫是整個平臺架構(gòu)的核心,所有信息數(shù)據(jù)的流動都需要經(jīng)過儲存庫,其剛開始是CWM各個包的內(nèi)和關(guān)系映射。所有在儲存庫進(jìn)行保存的元數(shù)據(jù)都是通過CWM編碼實現(xiàn)的,能夠使終端用戶對數(shù)據(jù)倉庫的特定主題進(jìn)行查詢,中央元數(shù)據(jù)儲存庫可以實現(xiàn)的功能主要包括瀏覽、查詢、更新、添加以及刪除等基本功能。
3對于元數(shù)據(jù)儲存庫的設(shè)計
3.1 CWM元數(shù)據(jù)的儲存?zhèn)}庫
對于元數(shù)據(jù)管理來說,元數(shù)據(jù)儲存區(qū)是必須具備的,因此建立基于CWM的元數(shù)據(jù)管理平臺有著重要的意義。應(yīng)該將元數(shù)據(jù)儲存結(jié)構(gòu)轉(zhuǎn)變?yōu)榍袑嵖尚械膬Υ娼Y(jié)構(gòu)。數(shù)據(jù)庫作為元數(shù)據(jù)的儲存是一種科學(xué)的處理方法。但是由于對象技術(shù)和關(guān)系數(shù)據(jù)庫所存在的目標(biāo)應(yīng)用不相同,所以兩者之間存在一定的差別,需要使用關(guān)系數(shù)據(jù)庫表結(jié)構(gòu)對對象的CWM原模型進(jìn)行闡述,而CWM原模型關(guān)系模型的映射規(guī)則主要包括數(shù)據(jù)類型映射模式、內(nèi)映射模式以及關(guān)聯(lián)模式映射三種模式。
3.2 元數(shù)據(jù)儲存庫的具體數(shù)據(jù)庫模式
在元數(shù)據(jù)儲存庫當(dāng)中可以構(gòu)建CWM類與關(guān)聯(lián)的映射表,但是應(yīng)該充分考慮到每個工具的特定數(shù)據(jù)需求。其表格類型主要包括數(shù)據(jù)倉庫表、包的信息表、各包中類信息表以及內(nèi)表、關(guān)聯(lián)表、關(guān)聯(lián)信息表、超類表。
4元數(shù)據(jù)管理平臺工具的實現(xiàn)
4.1 管理元數(shù)據(jù)工具的具體功能結(jié)構(gòu)
管理工具能夠?qū)?shù)據(jù)儲存庫里的元數(shù)據(jù)進(jìn)行科學(xué)的管理,其主要的工作原理是登錄元數(shù)據(jù)管理工具,此時設(shè)備會主動連接元數(shù)據(jù)儲存庫里的數(shù)據(jù)庫系統(tǒng),在與元數(shù)據(jù)儲存庫進(jìn)行連接之后,就能夠得到元數(shù)據(jù)管理所需要具備的類表和關(guān)聯(lián)表,元數(shù)據(jù)工具主要有元數(shù)據(jù)查詢、操作、更新幾種功能。
4.2 對于元數(shù)據(jù)的查詢
元數(shù)據(jù)的查詢條件主要包括類查詢和關(guān)聯(lián)查詢兩種方式,兩種查詢方式都需要首先選定數(shù)據(jù)倉庫的主題,最后選定每個包或者關(guān)聯(lián)名進(jìn)行具體信息的查詢。查詢流程:元數(shù)據(jù)的查詢結(jié)果通常以數(shù)據(jù)表格的形式展現(xiàn)出,包括查詢實例的位置屬性以及ID等基礎(chǔ)信息[3]。
4.3 元數(shù)據(jù)的具體操作
元數(shù)據(jù)的具體操作過程包括內(nèi)實例增加、刪除以及關(guān)聯(lián)實力刪除等幾種功能,但是由于元數(shù)據(jù)的實例添加或者刪除與數(shù)據(jù)庫不一樣,所以必須在整個繼承鏈上進(jìn)行操作過程的實現(xiàn)。
4.4 對于元數(shù)據(jù)的更新
因為數(shù)據(jù)的更新主要包括類實例以及關(guān)聯(lián)實例更新兩種功能,但是因為CWM的重用繼承技術(shù),以及繼承鏈在關(guān)系數(shù)據(jù)上實現(xiàn)比較復(fù)雜,所以元數(shù)據(jù)的更新方法與一般的數(shù)據(jù)庫更新不同[4]。類實例更新:主要是對類實例的具體屬性進(jìn)行更新,具體屬性又包括特有屬性和超類繼承屬性,特有屬性更新只需要在類相對應(yīng)的表即可完成整個更新操作,而超類屬性更新則需要更新函數(shù),獲取超類名之后才能夠調(diào)用更新函數(shù)。
5結(jié)束語
綜上所述,對元數(shù)據(jù)進(jìn)行數(shù)據(jù)管理庫的有效管理,需要建立統(tǒng)一的元數(shù)據(jù)管理平臺,而借助CWM元數(shù)據(jù)管理策略能夠?qū)υ獢?shù)據(jù)進(jìn)行有效的管理,構(gòu)建元數(shù)據(jù)倉庫管理平臺的有效框架,并從中央元數(shù)據(jù)儲存庫的開發(fā)管理和元數(shù)據(jù)管理平臺核心組件等兩個方面有效規(guī)劃了管理平臺的組成,搭建數(shù)據(jù)倉庫中的元數(shù)據(jù)進(jìn)行統(tǒng)一儲存建模以及管理的全過程平臺。雖然本篇文章的元數(shù)據(jù)管理平臺能夠?qū)崿F(xiàn)數(shù)據(jù)倉庫的基本功能,但是仍然存在著一些問題,需要進(jìn)行進(jìn)一步的探究和實踐工作。
參考文獻(xiàn)
[1] 羅小洪.數(shù)據(jù)倉庫元數(shù)據(jù)管理系統(tǒng)[J].神州,2019(17):233-234.
[2] 姚鵬飛.數(shù)據(jù)倉庫技術(shù)在裝備試驗信息集成中的應(yīng)用研究[J].信息技術(shù),2019(1):146-150.
[3] 王偉,寧麗.數(shù)據(jù)倉庫技術(shù)與信息加工理論鏡像關(guān)聯(lián)分析[J].中國教育技術(shù)裝備,2018,436(10):38-40.
[4] 程芳,張權(quán),董少林.基于數(shù)據(jù)集成的質(zhì)量元數(shù)據(jù)研究[J].標(biāo)準(zhǔn)科學(xué),2019(5):140-142.