亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        企業(yè)數(shù)據(jù)空間的數(shù)據(jù)組織方法研究

        2020-12-25 06:07:56文必龍焦圣杰
        計算機技術與發(fā)展 2020年12期
        關鍵詞:模型企業(yè)

        文必龍,焦圣杰,郭 嬌

        (東北石油大學 計算機與信息技術學院,黑龍江 大慶 163318)

        0 引 言

        為了更好地應對數(shù)據(jù)的海量、異構、共享性和多樣性給數(shù)據(jù)管理帶來的挑戰(zhàn)[1],F(xiàn)ranklin提出了數(shù)據(jù)空間(Data Space)的概念:一個數(shù)據(jù)空間由一系列相關的異構資源對象集和資源對象間的關聯(lián)關系集組成,包含某個組織或個體相關的一切信息,這些信息可以以任意形式,在任意地方存儲;在將數(shù)據(jù)加入到數(shù)據(jù)空間之前,無需像關系數(shù)據(jù)庫事先為其定義嚴格的關系模式,直接將數(shù)據(jù)源加入數(shù)據(jù)空間,并以pay-as-you-go模式實現(xiàn)數(shù)據(jù)的管理[2]。

        有不少學者對數(shù)據(jù)空間技術開展了研究,其中最具有代表性的是個人數(shù)據(jù)空間技術,如瑞士蘇黎世理工學院開發(fā)的iMeMex系統(tǒng)[3]、美國華盛頓大學開發(fā)的SEMEX系統(tǒng)[4]以及中國人民大學開發(fā)的OrientSpace[5]等個人數(shù)據(jù)空間系統(tǒng)原型。個人數(shù)據(jù)空間的許多技術同樣適合企業(yè)數(shù)據(jù)空間,如個人數(shù)據(jù)空間模型與查詢、數(shù)據(jù)關聯(lián)、數(shù)據(jù)索引等,但與個人數(shù)據(jù)空間相比,企業(yè)數(shù)據(jù)空間管理更加復雜。

        企業(yè)數(shù)據(jù)空間的主體是整個企業(yè),而不是個人或某個部門。需要管理的數(shù)據(jù)來自各個部門、專業(yè)、項目或者業(yè)務,數(shù)據(jù)規(guī)模巨大、種類復雜多樣,組織管理困難。而且,企業(yè)現(xiàn)有數(shù)據(jù)庫具有專門的,甚至標準化的數(shù)據(jù)模式,與個人數(shù)據(jù)空間的數(shù)據(jù)模式的靈活性相反,這些數(shù)據(jù)庫要求的是模式穩(wěn)定,需要將傳統(tǒng)的“先模式后數(shù)據(jù)”和數(shù)據(jù)空間的“先數(shù)據(jù)后模式”的方式協(xié)調起來進行管理。

        針對靈活高效地組織企業(yè)數(shù)據(jù)空間中的數(shù)據(jù)資源的問題,該文結合企業(yè)數(shù)據(jù)管理的特點,提出了企業(yè)數(shù)據(jù)空間的數(shù)據(jù)組織方法:通過構建的分層組織模型實現(xiàn)對數(shù)據(jù)進行多維多角度地組織,利用屬性圖模型統(tǒng)一描述企業(yè)數(shù)據(jù)空間中的各種數(shù)據(jù)資源,實現(xiàn)了對企業(yè)數(shù)據(jù)靈活和高效的組織管理。

        1 相關研究

        目前,數(shù)據(jù)空間中數(shù)據(jù)組織方面的研究主要包括數(shù)據(jù)空間體系架構、數(shù)據(jù)空間數(shù)據(jù)模型表示方法、數(shù)據(jù)索引、數(shù)據(jù)關聯(lián)關系挖掘等。Dong Xin[4]提出的個人信息集成與管理平臺SEMEX系統(tǒng)采用以數(shù)據(jù)為主的體系架構,采用數(shù)據(jù)源、域模型、關聯(lián)與實例、領域模型和關系抽取引擎來組織管理數(shù)據(jù)。J P Dittrich[6]提出了一個基于圖數(shù)據(jù)模型和資源視圖的iDM模型,用一種統(tǒng)一資源視圖的概念和形式化表示方法,實現(xiàn)各種數(shù)據(jù)類型(如文檔、目錄、關系表、XML文檔、數(shù)據(jù)流等)的統(tǒng)一表示,采用數(shù)據(jù)源層、個人數(shù)據(jù)空間管理系統(tǒng)PDSMS(Personal DataSpace Management System)、應用層的分層體系架構來組織管理數(shù)據(jù)。

        中國人民大學的孟小峰教授發(fā)表了關于數(shù)據(jù)空間技術發(fā)展的綜述性文章,并提出了一個典型的數(shù)據(jù)空間集成與管理框架,該框架由數(shù)據(jù)集成引擎、數(shù)據(jù)空間引擎、數(shù)據(jù)演化引擎和數(shù)據(jù)輸出引擎組成[1]。鐘鳴等人基于RDF提出了類似的元組模型,采用逐層分解的方式構建圖,并提供了強大的查詢能力[7]。董彥磊等人提出了一個應用于數(shù)據(jù)空間的3層組織結構,該結構由物理數(shù)據(jù)層、邏輯數(shù)據(jù)層和應用層組成[8]。邏輯數(shù)據(jù)層是整個數(shù)據(jù)空間的關鍵組成部分,基于該層才能對數(shù)據(jù)空間進行統(tǒng)一的管理,同時支持數(shù)據(jù)空間管理系統(tǒng)所提供的各種服務。楊丹等人以實體作為基本的數(shù)據(jù)單位,提出分層的圖模型lgDM[9],用來建模數(shù)據(jù)空間中存在的各種異構數(shù)據(jù),即:實體關聯(lián)數(shù)據(jù)圖和實體關聯(lián)模式圖。王江海等人基于刻面的概念,利用數(shù)據(jù)源、刻面和屬性來描述數(shù)據(jù)源[10]。

        李玉坤等人針對數(shù)據(jù)空間本質特征,提出了基于圖的個人數(shù)據(jù)空間概念模型和基于四元組的數(shù)據(jù)空間邏輯模型,該模型可以刻畫數(shù)據(jù)空間的時序特征[11]。概念上將個人數(shù)據(jù)空間用一個大的有向圖表示,圖中節(jié)點表示數(shù)據(jù)對象,邊表示數(shù)據(jù)對象之間的關聯(lián)關系,數(shù)據(jù)對象和關聯(lián)可以具有若干屬性,屬性取值具有時間屬性。邏輯上用四元組<對象,屬性,取值,時間>描述個人數(shù)據(jù)對象及其動態(tài)變化,即用形如的四元組來刻畫個人數(shù)據(jù)空間,其語義表示為“一個數(shù)據(jù)對象的一個屬性在特定時間的取值”。劉正濤在數(shù)據(jù)空間的基礎上,進一步提出了一種新的Web數(shù)據(jù)管理方法,即Web數(shù)據(jù)空間[12]。通過pay-as-you-go的構建方式,利用語義集成Web上的數(shù)據(jù)訪問,實現(xiàn)一個Web數(shù)據(jù)集成系統(tǒng),此系統(tǒng)的特點是可持續(xù)改進性,系統(tǒng)為組織或個人提供了一種有效利用Web數(shù)據(jù)的途徑。

        企業(yè)數(shù)據(jù)空間的數(shù)據(jù)是復雜多樣的,現(xiàn)有的個人數(shù)據(jù)空間的數(shù)據(jù)組織方法或者傳統(tǒng)的數(shù)據(jù)組織方法都無法將“先模式后數(shù)據(jù)”和“先數(shù)據(jù)后模式”的兩種數(shù)據(jù)管理方式靈活地結合,且企業(yè)中的半結構化數(shù)據(jù)和非結構化數(shù)據(jù)越來越重要,需要統(tǒng)一的方式對企業(yè)中的異構數(shù)據(jù)進行統(tǒng)一表達和描述,且隨著企業(yè)業(yè)務中的快速變化,需要一個靈活的企業(yè)數(shù)據(jù)模式的描述方式,可以隨著企業(yè)的變化,更好地滿足企業(yè)中的數(shù)據(jù)應用需求,需要對企業(yè)數(shù)據(jù)空間的數(shù)據(jù)組織方法進行進一步的研究。

        2 企業(yè)數(shù)據(jù)空間的分層組織模型

        2.1 企業(yè)數(shù)據(jù)空間概念

        個人數(shù)據(jù)空間管理的主要是與個人相關的數(shù)據(jù),僅需滿足個人數(shù)據(jù)需求即可,而企業(yè)數(shù)據(jù)管理的對象是整個企業(yè)中所有相關的數(shù)據(jù),需要滿足各種應用系統(tǒng)的數(shù)據(jù)服務需求。與個人數(shù)據(jù)管理相比,企業(yè)數(shù)據(jù)管理更加復雜,結合數(shù)據(jù)空間的概念,提出企業(yè)數(shù)據(jù)空間的概念:

        定義1:企業(yè)數(shù)據(jù)空間(Enterprise Data Space,EDS)是以整個企業(yè)為主體,以企業(yè)中各個部門的信息系統(tǒng)中的數(shù)據(jù)和數(shù)據(jù)間的關聯(lián)關系為管理對象的數(shù)據(jù)空間,提供按需、即時、靈活的數(shù)據(jù)服務[13]。

        企業(yè)數(shù)據(jù)空間的主要特點有:

        (1)可以對結構化、半結構化和非結構化的數(shù)據(jù)進行統(tǒng)一描述和管理。

        (2)將原有關系數(shù)據(jù)庫的“先模式后數(shù)據(jù)”和數(shù)據(jù)空間的“先數(shù)據(jù)后模式”的方式協(xié)調起來進行管理,靈活管理兩種方式的數(shù)據(jù)。

        (3)具有多維度、多層次、多角度的數(shù)據(jù)組織方式,更能滿足企業(yè)靈活管理和使用數(shù)據(jù)的需求。

        2.2 分層組織模型

        為了更加靈活和高效地組織管理企業(yè)數(shù)據(jù)空間中海量的多源異構數(shù)據(jù)資源,該文提出了一個應用于企業(yè)數(shù)據(jù)空間的分層數(shù)據(jù)組織結構,按照數(shù)據(jù)資源目錄、數(shù)據(jù)模型、數(shù)據(jù)三個層次進行組織與管理,如圖1所示。

        其中數(shù)據(jù)空間(DataSpace,DS)是與主體相關的所有數(shù)據(jù)和數(shù)據(jù)間關系的集合。企業(yè)中不同的部門、項目組或者個人,都可以根據(jù)需要創(chuàng)建數(shù)據(jù)空間,并對其進行維護和使用。不同數(shù)據(jù)空間中的數(shù)據(jù)也可以存在交叉,可以看作企業(yè)數(shù)據(jù)空間的個人視圖。

        圖1 企業(yè)數(shù)據(jù)空間的分層組織架構

        數(shù)據(jù)資源目錄(Data Resource Catalog,DRC),是從多維多角度對數(shù)據(jù)空間中的數(shù)據(jù)進行分類和組織的一種樹形目錄結構,也是企業(yè)中數(shù)據(jù)的分類標準。數(shù)據(jù)源是從數(shù)據(jù)存儲載體形式進行分類的,企業(yè)架構是從使用數(shù)據(jù)的角度對數(shù)據(jù)進行分類,采用應用視圖的方式使用數(shù)據(jù)。這兩種分類方式是數(shù)據(jù)空間提供的默認分類方式,企業(yè)根據(jù)需要可以自行定義相應的分類角度。數(shù)據(jù)資源目錄的每一個葉子節(jié)點都對應有相應的數(shù)據(jù)資源,數(shù)據(jù)資源可以是實際的數(shù)據(jù)源,如具體的數(shù)據(jù)庫系統(tǒng)、文檔文件等,也可以是虛擬的數(shù)據(jù)源,如數(shù)據(jù)視圖。在數(shù)據(jù)空間中,數(shù)據(jù)資源目錄的結構是靈活的、動態(tài)的,一個數(shù)據(jù)資源可以屬于多個目錄節(jié)點。

        數(shù)據(jù)模型(DataModel,DM),代表著不同數(shù)據(jù)資源的數(shù)據(jù)結構,包括多種類型的數(shù)據(jù)源模型,既有物理數(shù)據(jù)源的存儲模型,又有虛擬數(shù)據(jù)源的邏輯模型,還包括數(shù)據(jù)空間的邏輯數(shù)據(jù)模型,即企業(yè)數(shù)據(jù)空間的所有數(shù)據(jù)資源作為企業(yè)頂層組織的一個數(shù)據(jù)視圖。數(shù)據(jù)模型有兩種情況:一種是遺留的關系數(shù)據(jù)庫的數(shù)據(jù)模型,按照“先模式后數(shù)據(jù)”的形式,將關系數(shù)據(jù)庫的數(shù)據(jù)模型直接納入企業(yè)數(shù)據(jù)空間的管理之中;另一種是,預設數(shù)據(jù)模式之外或沒有嚴格數(shù)據(jù)模式的數(shù)據(jù),隨著企業(yè)的需求改變和數(shù)據(jù)模式演化,逐漸演化出來的數(shù)據(jù)模式。數(shù)據(jù)模型由類、類之間的關系、數(shù)據(jù)操作和數(shù)據(jù)約束組成。類(Class),代表著數(shù)據(jù)模型中的類(也就是實體),例如關系數(shù)據(jù)庫的數(shù)據(jù)模型中的一張表,半結構化數(shù)據(jù)中的元素。屬性(Attribute),代表著類中的屬性,如關系表中的字段,半結構化數(shù)據(jù)中的元素。約束(Constrain),代表數(shù)據(jù)模型中類的相關約束。

        數(shù)據(jù)(Data),是指符合數(shù)據(jù)模型定義的類的數(shù)據(jù)實例,即數(shù)據(jù)源。企業(yè)數(shù)據(jù)空間的數(shù)據(jù)源分四類:遺留的關系型數(shù)據(jù)庫、半結構化的數(shù)據(jù)文件、非結構數(shù)據(jù)文件和自動演化的數(shù)據(jù)庫。其中遺留的關系數(shù)據(jù)庫指的是,企業(yè)中已經(jīng)投入使用的各個信息系統(tǒng)或者應用的關系型數(shù)據(jù)庫,其中包含大量數(shù)據(jù)模式穩(wěn)定的結構化數(shù)據(jù);半結構化數(shù)據(jù)文件主要指的是XML文件;非結構化數(shù)據(jù)文件常見的有文檔、視頻、音頻和郵件等;自動演化的數(shù)據(jù)庫主要指的是,事先沒有建立完整的數(shù)據(jù)模式的數(shù)據(jù),而且也沒有相應的物理存儲模式,直接將數(shù)據(jù)存入ESD空間中,通過數(shù)據(jù)模式演化,自動創(chuàng)建相應的邏輯模式和相應的物理存儲模式,提供該數(shù)據(jù)模式下數(shù)據(jù)的存儲和管理。

        數(shù)據(jù)對象(Data Object),是指沒有相應明確數(shù)據(jù)模式和結構的數(shù)據(jù),直接納入企業(yè)數(shù)據(jù)空間的管理,隨著企業(yè)數(shù)據(jù)空間的使用或者有需要的時候,逐步完善數(shù)據(jù)對象的數(shù)據(jù)模式,形成更加嚴格的數(shù)據(jù)模式,利用數(shù)據(jù)模型表示出來,進行組織和管理。

        3 基于屬性圖模型的數(shù)據(jù)模型描述方法

        3.1 屬性圖數(shù)據(jù)模型

        企業(yè)數(shù)據(jù)空間中的數(shù)據(jù)結構復雜,包含不同異構數(shù)據(jù)的數(shù)據(jù)模型,所以需要一個可以描述企業(yè)數(shù)據(jù)空間中所有數(shù)據(jù)的方法。該文利用屬性圖數(shù)據(jù)模型(Property Graph Data Model,PGDM)[14]來描述數(shù)據(jù)空間中存在的各種異構數(shù)據(jù)。企業(yè)數(shù)據(jù)空間利用屬性圖模型將所有數(shù)據(jù)描述并關聯(lián)起來,形成一個與企業(yè)相關的屬性圖。其中使用的基本概念定義如下:

        定義2:節(jié)點(Node)是屬性圖模型中的一個基本元素,用來表示各種類型的數(shù)據(jù),可以是數(shù)據(jù)源、數(shù)據(jù)資源目錄分類節(jié)點,數(shù)據(jù)模型中類、屬性、約束,數(shù)據(jù)層的每一個數(shù)據(jù)單元,數(shù)據(jù)對象等。節(jié)點的標簽(Label)表示數(shù)據(jù)的類型或模式信息,屬性集(Properties)描述節(jié)點的具體信息,節(jié)點可以包含多個屬性(Property)和多個標簽(Label),每個節(jié)點至少擁有一個用于區(qū)分節(jié)點和節(jié)點之間是否相等的唯一標識。

        定義3:關系(Relationship)是任意兩個節(jié)點間可能存在的關聯(lián)關系,同樣是屬性圖模型中的基本元素,將節(jié)點關聯(lián)起來構成圖,也可以稱為圖論中的邊(Edge)。其始端(Start node)和末端(End node)都必須是節(jié)點,關系不能指向空也不能從空發(fā)起,而且關系是有方向的。關系和節(jié)點一樣可以包含多個屬性,但關系只能有一個類型(Type),一個節(jié)點可以被多個關系指向或作為關系的起始節(jié)點。

        定義4:屬性(Property)是節(jié)點或者關系所具有的特性,節(jié)點和關系都可以有多個屬性。屬性是由鍵值對組成的,就像Java的哈希表一樣,屬性名類似變量名,屬性值類似變量值。屬性值可以是基本的數(shù)據(jù)類型,或者由基本數(shù)據(jù)類型組成的數(shù)組。

        定義5:節(jié)點標簽(Node Labels)是一種對節(jié)點進行語義分類的方法[14]。節(jié)點可以分配零個標簽、一個或多個標簽,標簽本質上是圖形結構中面向集合的概念:它們允許輕松高效地創(chuàng)建子圖,這對于許多不同的用途非常有用,例如僅查詢數(shù)據(jù)庫內容的一部分??梢允褂脴撕灡硎灸撤N數(shù)據(jù)類型、結構或模式,或者根據(jù)企業(yè)需要,自定義相應的標簽。雖然不是必需的,但節(jié)點應至少具有一個標簽,為了更加清晰地了解數(shù)據(jù)。

        定義6:關系類型(Relationship Types)實現(xiàn)的內容與處理節(jié)點標簽類似,是為了對關系進行分類。但是關系類型是關系必不可少的,每個關系必須有一種且只有一種類型,兩個節(jié)點可以由多個關系連接,并且在屬性圖中復雜、深層遍歷期間使用。

        定義7:屬性圖模型的數(shù)據(jù)結構,可以形式化定義為一個二元組PGDM=(Nodes,Relationships),其中Nodes表示企業(yè)數(shù)據(jù)空間中所有的節(jié)點集合;Relationships?Node×Node表示節(jié)點之間的關系集合,具體情況如圖2所示。

        圖2 屬性圖數(shù)據(jù)模型的數(shù)據(jù)結構

        利用屬性圖數(shù)據(jù)模型對企業(yè)數(shù)據(jù)空間中的異構數(shù)據(jù)進行統(tǒng)一描述,具有以下優(yōu)點:

        (1)屬性圖模型沒有固定的模式。屬性圖本身并不強制要求數(shù)據(jù)必須具有嚴格的關系模式,符合數(shù)據(jù)空間先模式后數(shù)據(jù)的特點。

        (2)屬性圖的無模式和弱模式特性,更適合處理半結構化數(shù)據(jù)。當半結構化數(shù)據(jù)發(fā)生變化的時候,可以比較方便地處理數(shù)據(jù)模式的變化。

        (3)節(jié)點、屬性及關系,更符合現(xiàn)實世界中事物的特點,更加容易理解。

        (4)關系是明確的,不是由某種約束推斷的,也不是通過連接操作在查詢時建立的,是屬性圖中重要的基本元素,而且可以具有屬性,可以將現(xiàn)實世界中數(shù)據(jù)間復雜的關系給描述和利用起來,具有和節(jié)點相同的表達能力。

        (5)獨立于各種數(shù)據(jù)源,可以描述結構化、半結構、非結構化數(shù)據(jù)結構,可以多維度多層次描述企業(yè)數(shù)據(jù)空間數(shù)據(jù),便于自動模式演化。

        3.2 異構數(shù)據(jù)模型的描述方法

        為了將企業(yè)中大量穩(wěn)定的關系數(shù)據(jù)庫也集成到EDS中進行管理,將“先模式后數(shù)據(jù)”的特點也體現(xiàn)出來,還有后續(xù)弱模式或無模式的數(shù)據(jù)對象隨著使用,逐漸演化出相應的數(shù)據(jù)模型,設計統(tǒng)一的數(shù)據(jù)模式描述方法,無論是結構化數(shù)據(jù)模型、半結構化數(shù)據(jù)模型或者ESD全局邏輯模型,都用同一種描述方法進行描述,在邏輯模式層上進行統(tǒng)一管理。

        數(shù)據(jù)模式由類、類之間關系和類的約束組成。用來統(tǒng)一描述企業(yè)數(shù)據(jù)空間中的各種模型和企業(yè)數(shù)據(jù)空間的概念模型。描述方法的形式化表達為:

        DataModel={Class,Constrain,Relationship}

        其中,DataModel代表不同的數(shù)據(jù)模型,既有物理數(shù)據(jù)源的存儲模型,又有虛擬數(shù)據(jù)源的邏輯模型。在企業(yè)數(shù)據(jù)空間中,有一個全局的邏輯模型。企業(yè)數(shù)據(jù)空間的所有數(shù)據(jù)資源作為企業(yè)頂層組織的一個數(shù)據(jù)視圖,其對應的數(shù)據(jù)模型即全局邏輯模型。

        Class是數(shù)據(jù)模型下包含的各個類(也可叫做實體),例如關系數(shù)據(jù)庫中的一張表或者是視圖,或者一個半結構化的文件的元素節(jié)點。其中Class下包含不同的屬性(Attribute),如關系表中的字段,半結構化數(shù)據(jù)中的屬性節(jié)點。

        Constrain是類的相關約束,是對類的約束限制,如關系表的字段的取值約束。

        Relationship是數(shù)據(jù)模型下各個類之間的關系,如常見的有關系表中的主外鍵關系、類與類之間的引用關系等。

        通過上述的數(shù)據(jù)模型描述方法,無論是各種數(shù)據(jù)源的數(shù)據(jù)模型,還是虛擬的數(shù)據(jù)模型或者數(shù)據(jù)空間本身的全局模型,都可以用統(tǒng)一的方法描述。不同異構數(shù)據(jù)模型,用同一種數(shù)據(jù)模型描述方法,為后續(xù)數(shù)據(jù)模式匹配提供了良好的基礎,可以更好地支持后續(xù)的數(shù)據(jù)模式演化。

        3.2.1 描述結構化數(shù)據(jù)模型

        當結構化數(shù)據(jù)模型在EDS中被進行描述時,需要有一定的描述規(guī)則,才可以直接地對關系數(shù)據(jù)結構進行描述。其中的描述規(guī)則有:

        (1)其中的表(Relation)用Class下的節(jié)點來描述,表的一些本身特征用Class下節(jié)點的屬性集來表示。

        (2)其中表的各個字段(Attribute)用Attribute來表示,屬性的本身特征用Attribute下的屬性集來表示。

        (3)表的一些完整性約束條件和用戶自定義的約束條件,用Constrain來描述。

        (4)表與表之間的關系,用Relationship來描述。

        3.2.2 描述半結構化數(shù)據(jù)模型

        半結構化數(shù)據(jù)的數(shù)據(jù)結構和數(shù)據(jù)內容是混合在一起的,介于結構化和非結構化數(shù)據(jù)之間。現(xiàn)在企業(yè)中用的最廣泛的半結構數(shù)據(jù),就是XML文件。以XML的數(shù)據(jù)模式為例,其數(shù)據(jù)模式描述方法為:

        (1)將XML文件中不含有文本節(jié)點的元素節(jié)點用Class下的節(jié)點來表達,元素節(jié)點的名字當作類的名字,屬性節(jié)點當作節(jié)點的屬性。

        (2)將XML文件中含有文本節(jié)點的元素節(jié)點用Attribute下的節(jié)點來描述,元素節(jié)點的名字當作屬性的名字,屬性節(jié)點當作節(jié)點的屬性。

        3.2.3 描述非結構化數(shù)據(jù)模型

        非結構化數(shù)據(jù)常見的有視頻、音頻、文檔或者一些二進制文件,沒有明顯的數(shù)據(jù)結構。但是在非結構化數(shù)據(jù)文件中,其實是隱含著相應的數(shù)據(jù)結構的。如常見的音頻數(shù)據(jù)、視頻數(shù)據(jù),WORD、PDF文檔,石油企業(yè)中的地震數(shù)據(jù)、測井數(shù)據(jù)等,這些數(shù)據(jù)的格式是標準化的,格式的描述不在數(shù)據(jù)體中。賁福才提出了一種非結構化數(shù)據(jù)模式描述標記語言BULKML,該標記語言采用XML描述的非結構化數(shù)據(jù)的結構,為非結構化數(shù)據(jù)補充模式描述,使非結構化數(shù)據(jù)轉換為半結構化數(shù)據(jù)[15]。BULKML按數(shù)據(jù)文件偏移量(二進制文件)或文件標記(文本文件),對數(shù)據(jù)文件中的數(shù)據(jù)的語義進行標注。BULKML按數(shù)據(jù)文件格式規(guī)范進行定義,每一種格式規(guī)范定義一個BULKML。而且在國家標準非結構化數(shù)據(jù)表示規(guī)范中,利用XML文件格式來表示非結構化數(shù)據(jù)文件的數(shù)據(jù)結構[16]。也就是說非結構化數(shù)據(jù)的數(shù)據(jù)模式用半結構化數(shù)據(jù)文件來表示,從而利用半結構化數(shù)據(jù)的數(shù)據(jù)模式描述方法,實現(xiàn)對非結構化數(shù)據(jù)的數(shù)據(jù)模型進行描述。

        4 結束語

        該文以企業(yè)數(shù)據(jù)的現(xiàn)有數(shù)據(jù)管理特征為出發(fā)點,針對靈活高效地組織企業(yè)數(shù)據(jù)空間中的數(shù)據(jù)資源的問題,對企業(yè)數(shù)據(jù)空間的數(shù)據(jù)組織方法進行研究:提出了企業(yè)數(shù)據(jù)空間分層的組織模型,實現(xiàn)對企業(yè)數(shù)據(jù)空間多角度多維度的組織;建立了基于屬性圖模型的數(shù)據(jù)描述方法,統(tǒng)一描述各種異構數(shù)據(jù)。利用此方法可以高效靈活地組織和管理企業(yè)數(shù)據(jù)空間的數(shù)據(jù),為后續(xù)的數(shù)據(jù)模式演化奠定基礎。

        在以后的工作中,將致力于改進企業(yè)數(shù)據(jù)空間的數(shù)據(jù)的存取優(yōu)化,考慮將企業(yè)中的實時數(shù)據(jù)也納入企業(yè)數(shù)據(jù)空間的管理,解決數(shù)據(jù)模式演化問題等,使企業(yè)數(shù)據(jù)空間功能更加完善。

        猜你喜歡
        模型企業(yè)
        一半模型
        企業(yè)
        企業(yè)
        企業(yè)
        企業(yè)
        企業(yè)
        重要模型『一線三等角』
        敢為人先的企業(yè)——超惠投不動產(chǎn)
        云南畫報(2020年9期)2020-10-27 02:03:26
        重尾非線性自回歸模型自加權M-估計的漸近分布
        3D打印中的模型分割與打包
        人妻少妇人人丰满视频网站| 国产成人精品a视频一区| 成人三级a视频在线观看| 亚洲七七久久综合桃花| 久久国产精品一区二区| 亚洲精品视频1区2区| 毛片无码国产| 精品久久久久久久久午夜福利| 欧美熟妇与小伙性欧美交| 99久久婷婷国产精品综合| 免费av一区二区三区无码| 国产精品福利视频一区| 欧美黑人xxxx性高清版| 免费看片的网站国产亚洲| 国产欧美精品一区二区三区四区| 亚洲精品无码mv在线观看 | 亚洲日韩成人av无码网站| 麻豆国产巨作AV剧情老师| 在线亚洲国产一区二区三区| 久久午夜av一区二区三区| 无码人妻久久一区二区三区不卡| 欧洲亚洲第一区久久久| 偷拍熟女露出喷水在线91| 无码日韩精品一区二区免费暖暖| 亚洲欧洲偷自拍图片区| 欧美精品v欧洲高清| 亚洲精品一区二区成人精品网站| 中国美女a级毛片| 成年女人永久免费看片| 人成视频在线观看免费播放| 日本护士口爆吞精视频| 国产精品第一国产精品| 天天狠天天透天干天天| 日产一区二区三区的精品| 乱码1乱码2美美哒| 亚洲av乱码中文一区二区三区| 加勒比熟女精品一区二区av| 中文字幕一区二区人妻秘书| 国产熟妇高潮呻吟喷水| 欧美破处在线观看| 亚洲免费女女在线视频网站|