亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        一種基于XML的元數(shù)據(jù)模型設(shè)計(jì)方法的研究

        2008-01-01 00:00:00徐小靜
        電腦知識(shí)與技術(shù) 2008年6期

        摘要:元數(shù)據(jù)在網(wǎng)絡(luò)信息資源的管理、存儲(chǔ)和檢索中發(fā)揮著重大的作用。目前業(yè)界對(duì)于元數(shù)據(jù)的定義和管理都還沒(méi)有統(tǒng)一的標(biāo)準(zhǔn)。在現(xiàn)有元數(shù)據(jù)標(biāo)準(zhǔn)的基礎(chǔ)上進(jìn)行擴(kuò)展,并提出一種基于XML的元數(shù)據(jù)模型的設(shè)計(jì)方法,在元數(shù)據(jù)的層次上來(lái)定義和管理資源。

        關(guān)鍵字:元數(shù)據(jù);XML;XML Schema;元數(shù)據(jù)模型

        中圖分類號(hào):TP30文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2008)06-10ppp-0c

        A Research About The Method Of Metadata Model Design Based On XML

        XU Xiao-jing,YANG Qing

        (Computer Science And Technology Academy,Wuhan University Of Technology,Wuhan 430063,China)

        Abstract:Metadata takes an important action on the manage、save and search of network information resources. Today, there has no uniform standard about the definition and management of metadata. Based on the exist standard of metadata and extend it, bring out a design method about the metadata model based on XML, definite and manage resources on the metadata levels.

        Key words:metadata; xml; xml schema; metadata model

        1 引言

        計(jì)算機(jī)網(wǎng)絡(luò)的發(fā)展,使數(shù)據(jù)形式出現(xiàn)了多樣化,除了數(shù)據(jù)庫(kù)以外,還有許許多多的數(shù)據(jù)存放于TXT文件或者其他字處理文件和表格文件或者視頻和圖像文件,這些數(shù)據(jù)本身又呈現(xiàn)出各種不同的形式。這樣,大量分散的形式以及不同格式的數(shù)據(jù)給現(xiàn)代數(shù)據(jù)處理帶來(lái)越來(lái)越大的困難。

        數(shù)據(jù)庫(kù)特別是關(guān)系數(shù)據(jù)庫(kù)具有極強(qiáng)的數(shù)據(jù)管理能力,數(shù)據(jù)的安全程度高,具有穩(wěn)定可靠的并發(fā)訪問(wèn)機(jī)制。但是各數(shù)據(jù)庫(kù)管理系統(tǒng)之間的異構(gòu)性及其所依賴操作系統(tǒng)的異構(gòu)性,嚴(yán)重限制了信息共享和數(shù)據(jù)交換的范圍;此外,數(shù)據(jù)庫(kù)技術(shù)的語(yǔ)義描述能力較差。因此,在數(shù)據(jù)交換和共享方面,傳統(tǒng)的關(guān)系數(shù)據(jù)庫(kù)面臨著嚴(yán)重的挑戰(zhàn)。

        元數(shù)據(jù)是”關(guān)于數(shù)據(jù)的數(shù)據(jù)”,它極大的方便了異構(gòu)系統(tǒng)間數(shù)據(jù)的交換和共享。元數(shù)據(jù)建模是指為更好利用數(shù)據(jù),為所使用數(shù)據(jù)創(chuàng)建更健壯、生命力更強(qiáng)的數(shù)據(jù)模型的行為。 一般來(lái)說(shuō)元數(shù)據(jù)建模包含兩個(gè)方面工作,信息建模和創(chuàng)建模式。信息建模包括靜態(tài)信息建模、動(dòng)態(tài)信息建模、文檔設(shè)計(jì),而創(chuàng)建模式則是利用元語(yǔ)言構(gòu)建數(shù)據(jù)模型。元數(shù)據(jù)模型描述了系統(tǒng)內(nèi)各個(gè)元素、元素之間的關(guān)系及元素的屬性,為在不同模型中交叉使用公共定義數(shù)據(jù)提供了多方面的協(xié)定。

        XML作為更好實(shí)現(xiàn)網(wǎng)絡(luò)互操作和數(shù)據(jù)交換的標(biāo)記語(yǔ)言,已經(jīng)得到極大發(fā)展。XML正在逐漸成為Web上數(shù)據(jù)組織和交換的標(biāo)準(zhǔn),也是實(shí)現(xiàn)語(yǔ)義Web和Web服務(wù)的基礎(chǔ)。XML作為一種語(yǔ)言,可以對(duì)結(jié)構(gòu)化和半結(jié)構(gòu)數(shù)據(jù)進(jìn)行標(biāo)注,作為一種標(biāo)準(zhǔn)可以建立特定領(lǐng)域的數(shù)據(jù)的組織和交換規(guī)范。因此,目前已經(jīng)成為不同行業(yè)和領(lǐng)域中元數(shù)據(jù)建模所采用的標(biāo)記語(yǔ)言。

        異構(gòu)系統(tǒng)間數(shù)據(jù)的交換和共享以及不同形式內(nèi)容的管理,這些都已經(jīng)成為急需解決的問(wèn)題。目前,已經(jīng)有了很多關(guān)于內(nèi)容管理和元數(shù)據(jù)建模方面的研究,但這些研究大多是針對(duì)特定需求的專項(xiàng)研究。為了系統(tǒng)的研究與內(nèi)容管理相關(guān)的處理方案,我們提出一套基于XML的元數(shù)據(jù)模型的設(shè)計(jì)方法。本文建立了一個(gè)元數(shù)據(jù)模型的框架,用以說(shuō)明與元數(shù)據(jù)處理以及異形內(nèi)容管理相關(guān)的途徑。

        2 相關(guān)概念簡(jiǎn)介

        2.1 元數(shù)據(jù)模型

        目前一些專家認(rèn)為元數(shù)據(jù)模型[4]應(yīng)當(dāng)包括兩個(gè)層次:描述數(shù)據(jù)自身的元數(shù)據(jù)和描述數(shù)據(jù)之間關(guān)系的元數(shù)據(jù)。

        描述數(shù)據(jù)自身的元數(shù)據(jù)主要是指那些只與數(shù)據(jù)本身相關(guān)的一些信息,比如數(shù)據(jù)標(biāo)識(shí)信息、數(shù)據(jù)生成時(shí)間、數(shù)據(jù)質(zhì)量信息和數(shù)據(jù)發(fā)布信息等現(xiàn)有的元數(shù)據(jù)標(biāo)準(zhǔn)。而描述數(shù)據(jù)之間關(guān)系的元數(shù)據(jù)則描述了各個(gè)數(shù)據(jù)集是通過(guò)什么樣的關(guān)系構(gòu)成了一個(gè)有機(jī)的整體,比如最基本的組成關(guān)系。

        2.2 其它概念

        元數(shù)據(jù)模型包括描述數(shù)據(jù)自身的元數(shù)據(jù)和描述數(shù)據(jù)之間關(guān)系的元數(shù)據(jù)。而元數(shù)據(jù)是關(guān)于數(shù)據(jù)的結(jié)構(gòu)化數(shù)據(jù)。目前,一般的都使用XML語(yǔ)言來(lái)表示元數(shù)據(jù),而XML文檔的結(jié)構(gòu)或模式需由DTD或XML Schema來(lái)描述。

        根據(jù)上面分析,得出本文涉及的各概念之間的相互關(guān)系,用下例UML圖來(lái)表示:

        圖1

        從圖1中,我們可以發(fā)現(xiàn)元數(shù)據(jù)使用XML文檔來(lái)表示,而XML文檔的結(jié)構(gòu)通過(guò)(依賴)XML Schema來(lái)描述。XML文檔表示的是數(shù)據(jù)(元數(shù)據(jù));而XML Schema表示的是數(shù)據(jù)的結(jié)構(gòu),是內(nèi)容本身。元數(shù)據(jù)模型描述的是內(nèi)容本身而不是數(shù)據(jù),因此,它和XML Schema直接關(guān)聯(lián)。

        3 元數(shù)據(jù)模型的設(shè)計(jì)

        3.1 元數(shù)據(jù)模型框架

        元數(shù)據(jù)模型包括兩個(gè)層次:描述數(shù)據(jù)自身的元數(shù)據(jù)和描述數(shù)據(jù)之間關(guān)系的元數(shù)據(jù)。相應(yīng)的,元模型的框架也應(yīng)該包括兩部分:元數(shù)據(jù)層和元數(shù)據(jù)管理層。

        圖2 元數(shù)據(jù)模型框架

        由圖2可知,此框架主要由三部分組成:元數(shù)據(jù)層、元數(shù)據(jù)管理層以及元數(shù)據(jù)處理模塊。輸入數(shù)據(jù)流為該框架提供數(shù)據(jù)源,元數(shù)據(jù)處理模塊在元數(shù)據(jù)層和元數(shù)據(jù)管理層之間發(fā)揮著“橋梁”的作用,它主要實(shí)現(xiàn)元數(shù)據(jù)的讀取、編輯、寫入和解析等功能,輔助完成元數(shù)據(jù)模型的管理。

        元數(shù)據(jù)主要是從各類數(shù)據(jù)源中提取而來(lái)。不管是TXT文件、字處理文件、表格文件還是各類圖象視頻文件,都可以按照一定的標(biāo)準(zhǔn)來(lái)提取元數(shù)據(jù)。最初提取出來(lái)的元數(shù)據(jù)是一個(gè)個(gè)分散、雜亂無(wú)章的數(shù)據(jù),沒(méi)有系統(tǒng)性。因此,為了便于元數(shù)據(jù)的統(tǒng)一管理和使用,這里我們提出了元數(shù)據(jù)層的概念。元數(shù)據(jù)層是統(tǒng)一存放元數(shù)據(jù)的地方,我們可以把它看作是一個(gè)元數(shù)據(jù)的容器。這個(gè)容器是元模型的核心,它存儲(chǔ)著一系列定義元數(shù)據(jù)的結(jié)構(gòu)良好的XML文檔,它是實(shí)現(xiàn)異構(gòu)系統(tǒng)間數(shù)據(jù)交換和共享的基礎(chǔ)。

        元數(shù)據(jù)管理層主要完成元數(shù)據(jù)模型的創(chuàng)建、存儲(chǔ)、查詢、修改等功能。在本文中,元數(shù)據(jù)模型即一組“XML Schema”和“XML文檔”。由于XML Schema本身也是一個(gè)XML文檔,所以,只要有支持XML數(shù)據(jù)類型的容器就可存儲(chǔ)元數(shù)據(jù)模型。如,Oracle 10g數(shù)據(jù)庫(kù)就支持XML Type的數(shù)據(jù)字段,此外,它還提供XQuery來(lái)支持對(duì)基于XML元素的查詢。這樣,就可滿足元模型的管理和查詢。

        該元數(shù)據(jù)模型框架是以元數(shù)據(jù)的管理為中心而設(shè)計(jì)的。框架的主要應(yīng)用場(chǎng)景是一般的內(nèi)容管理系統(tǒng),其中涉及到不同類型的數(shù)據(jù)源,異構(gòu)系統(tǒng)之間數(shù)據(jù)的交換和共享以及需要實(shí)現(xiàn)基于語(yǔ)義的查詢。

        3.2 元數(shù)據(jù)的定義

        這里,我們定義元數(shù)據(jù)遵從的標(biāo)準(zhǔn)是基于國(guó)際上公認(rèn)的都柏林核心元素集[6](DUBLIC CORE,DC)而擴(kuò)展的。DC元數(shù)據(jù)格式描述的對(duì)象是網(wǎng)絡(luò)資源。簡(jiǎn)單的元素定義和設(shè)置可以很方便的著錄,是DC獲得廣泛應(yīng)用的重要原因,然而它也帶來(lái)另外一個(gè)問(wèn)題,對(duì)著錄對(duì)象的描述深度不夠,不能進(jìn)行專指度較高的檢索。因此,本文將采用DC應(yīng)用模式中的簡(jiǎn)單DC(Simple DC)模式來(lái)定義元數(shù)據(jù)。

        在此,我們定義了描述元數(shù)據(jù)的13種基本元素(括號(hào)內(nèi)為元素的名稱或注釋):Title(資源名稱)、Author(作者)、Keywords(關(guān)鍵字)、Description(資源描述)、Publisher(出版者)、Date(日期)、Resource Type(資源類型)、Format(資源格式)、Resource Identifier(資源的唯一標(biāo)識(shí),如URL、ISBN等)、Source(資源來(lái)源)、Language(語(yǔ)言)、Rights Management(權(quán)限管理)、Email。

        每個(gè)元素根據(jù)ISO/IEC 11179可定義多個(gè)屬性,即:

        名稱(Name):元素名稱

        標(biāo)識(shí)(Identifier):元素唯一標(biāo)識(shí)

        版本(Version):產(chǎn)生該元素的元數(shù)據(jù)版本

        語(yǔ)言(Language):元素說(shuō)明語(yǔ)言

        定義(Definition):對(duì)元素概念與內(nèi)涵的說(shuō)明

        數(shù)據(jù)類型(Datatype):元素值中所表現(xiàn)的數(shù)據(jù)類型

        注釋(Comment):元素應(yīng)用注釋。

        我們使用XML這種自描述的、半結(jié)構(gòu)化和可擴(kuò)展的標(biāo)記語(yǔ)言來(lái)表示元數(shù)據(jù)。表示元數(shù)據(jù)的XML文檔必須是有效的,也就是XML文檔的結(jié)構(gòu)或模式應(yīng)該遵循DTD或XML Schema的描述。

        3.3 元數(shù)據(jù)管理

        元數(shù)據(jù)雖然都存放在了統(tǒng)一的容器(元數(shù)據(jù)層)中,有了一定的系統(tǒng)性,但各個(gè)元數(shù)據(jù)之間缺少關(guān)聯(lián)性,它們都是一個(gè)個(gè)獨(dú)立的元素。因此,需要對(duì)這些元數(shù)據(jù)進(jìn)行統(tǒng)一的管理,使各個(gè)元素之間相互聯(lián)系起來(lái),相互作用。

        元數(shù)據(jù)管理的數(shù)據(jù)來(lái)源是元數(shù)據(jù)層,通過(guò)對(duì)元數(shù)據(jù)的讀取、解析、編輯、寫入以及其他相關(guān)操作來(lái)完成對(duì)元數(shù)據(jù)的管理。

        ① 元數(shù)據(jù)讀?。褐饕獙?shí)現(xiàn)從元數(shù)據(jù)源(如元數(shù)據(jù)庫(kù))中讀取元數(shù)據(jù)。

        ② 元數(shù)據(jù)解析:負(fù)責(zé)對(duì)元數(shù)據(jù)層中的元數(shù)據(jù)進(jìn)行解析,然后將解析后的數(shù)據(jù)傳遞給具體任務(wù)模塊進(jìn)行相應(yīng)的處理。

        ③ 元數(shù)據(jù)編輯:負(fù)責(zé)將元數(shù)據(jù)進(jìn)行封裝,編輯成預(yù)先定義的DTD或XSD(XML Schema Description)樣式。

        ④ 元數(shù)據(jù)寫入:實(shí)現(xiàn)將編輯好的元數(shù)據(jù)寫入元數(shù)據(jù)庫(kù)。

        ⑤ 其它相關(guān)操作主要包括元數(shù)據(jù)庫(kù)的實(shí)現(xiàn);元數(shù)據(jù)的檢測(cè)(判斷元數(shù)據(jù)在元數(shù)據(jù)庫(kù)中是否已經(jīng)存在);元數(shù)據(jù)管理過(guò)程中的任務(wù)調(diào)度以及系統(tǒng)異常的監(jiān)控和處理。

        4 案例分析

        這里,我們將采用本文背景項(xiàng)目(視頻文件管理)中的部分實(shí)例來(lái)分析如何用XSD以及XML文檔來(lái)描述元數(shù)據(jù)模型的兩個(gè)層次。

        4.1 案例數(shù)據(jù)

        本案例引入兩部分相互關(guān)聯(lián)的數(shù)據(jù),分別是視頻文件數(shù)據(jù)以及視頻作者(視頻的創(chuàng)作者而非視頻文件的編輯者)數(shù)據(jù)。

        視頻文件包含如下一些重要信息(我們按照上面3.2中分析的規(guī)范來(lái)描述):Title、Author、Keywords、Description、Publisher、Date、Format和Language。

        視頻作者信息包括:Title(姓名)、Source(國(guó)籍)、Email和Description(個(gè)人簡(jiǎn)介)。

        4.2 xsd文檔

        下面這個(gè)xsd文檔(author.xsd)片段用于描述視頻作者信息的XML實(shí)例文檔的結(jié)構(gòu)。

        <?xml version=“1.0” encoding=“ISO-8859-1” ?>

        <xs:schema xmlns:xs=http://www.w3.org/2001/XMLSchema

        targetNamespace=http://whut.com/app/authorInfo>

        <xs:element name=“firstname” type=“xs:string”/>

        <xs:element name=“l(fā)astname” type=“xs:string”/>

        <xs:element name=“Source” type=“xs:string”/>

        <xs:element name=“Email”>

        <xs:simpleType>

        <xs:restriction base=“xs:string”>

        <xs:pattern value=“[a-zA-Z0-9]+@[a-zA-Z0-9]+.[a-zA-Z]+”/>

        </xs:restriction>

        </xs:simpleType>

        <xs:element name=“Description” type=“xs:string”/>

        <!-- 屬性的定義 -->

        <xs:attribute name=“authorid” type=“xs:string”/>

        <!-- 復(fù)合元素的定義 -->

        … …

        </xs:schema>

        下面是一個(gè)名為videoFile.xsd的文檔片段。該xsd文檔用來(lái)規(guī)范的描述案例中XML實(shí)例文檔的結(jié)構(gòu)。

        <?xml version=“1.0” encoding=“ISO-8859-1” ?>

        <xs:schema xmlns:xs=http://www.w3.org/2001/XMLSchema

        targetNamespace=http://whut.com/app/videoInfo

        xmlns:author= http://whut.com/app/authorInfo>

        <import namespace= http://whut.com/app/authorInfo

        schemaLocation=“http://whut.com/app/ author.xsd”/>

        <xs:element name=“Title” type=“xs:string”/>

        <xs:element name=“Author” type=“author:Title”/>

        … …

        <xs:element name=“Date” type=“xs:date”/>

        <xs:element name=“Format”>

        <xs:simpleType>

        <xs:restriction base=“xs:string”>

        <xs:pattern value=“wmv|avi|rm|asf|rmvb|mpg”/>

        </xs:restriction>

        </xs:simpleType>

        </xs:element>

        <xs:element name=“Language” type=“xs:string”/>

        <!-- 屬性的定義 -->

        <xs:attribute name=“fileid” type=“xs:string”/>

        <!-- 復(fù)合元素的定義 -->

        … …

        </xs:schema>

        從上面的videoFile.xsd中可以看到Author元素的Type(類型)是“外部類型“,它是通過(guò)import機(jī)制導(dǎo)入另一個(gè)xsd文件來(lái)實(shí)現(xiàn)的。

        此外,當(dāng)被導(dǎo)入模式和現(xiàn)有模式擁有相同域名或者被導(dǎo)入模式?jīng)]有域名的情況下,還可以通過(guò)include機(jī)制來(lái)實(shí)現(xiàn)“外部類型“的使用。

        4.3 XML實(shí)例文檔

        下面這個(gè)名為author.xsd的文檔片段用于描述視頻作者信息(author.xml文檔)的結(jié)構(gòu)。

        <author authorid=“112233”

        xmlns:xsi=“http://www.w3.org/2001/XMLSchema-instance”

        xsi:schemaLocation=“http://whut.com/app/authorInfo author.xsd”>

        <Title>

        <firstname>wang</firstname>

        <lastname>wu</lastname>

        </ Title>

        … …

        </ author >

        下面是一個(gè)videoFile.xml(視頻文件)文檔的片段,它是符合上面的xsd文檔(videoFile.xsd)描述規(guī)范的。

        <?xml version=“1.0” encoding=“ISO-8859-1”?>

        <videoFile fileid=“889966” xmlns:xsi=“http://www.w3.org/2001/XMLSchema-instance”

        xsi:schemaLocation=“http://whut.com/app/videoInfo videoFile.xsd”>

        <Title>Long March</ Title >

        <Author>

        <firstname>wang</firstname>

        <lastname>wu</lastname>

        </ Author >

        … …

        <Date>2001-08-08</Date>

        <Format>wmv</Format>

        <Language>Chinese</Language>

        </ videoFile >

        5 結(jié)語(yǔ)

        首先通過(guò)一個(gè)UML類圖來(lái)分析涉及到的各概念之間的關(guān)聯(lián)。然后,在元數(shù)據(jù)層次上提出一個(gè)元數(shù)據(jù)層的概念,同時(shí)提出一個(gè)用XML實(shí)現(xiàn)的元數(shù)據(jù)模型的設(shè)計(jì)方法,制定了元數(shù)據(jù)分類的標(biāo)準(zhǔn),并且分析比較了與元數(shù)據(jù)管理相關(guān)的一些技術(shù)。最后,通過(guò)案例實(shí)現(xiàn)用XSD描述的XML實(shí)例文檔來(lái)表示元數(shù)據(jù)模型的兩個(gè)層次(描述數(shù)據(jù)自身的元數(shù)據(jù)和描述數(shù)據(jù)間關(guān)系的元數(shù)據(jù))。下一步,將采用其中的某些技術(shù)來(lái)進(jìn)一步的完善并實(shí)現(xiàn)元數(shù)據(jù)模型的框架。

        參考文獻(xiàn):

        [1]Tim Bray, Jean Paoli, C. M. Sperberg-McQueen, et al. Extensible Markup Language (XML) 1.0(Third Edition)[EB/OL].http://www.w3.org/TR/REC-xml, W3C Recommendation 04 February 2004.

        [2]劉洪星[著]. XML建模和XML數(shù)據(jù)庫(kù)建模[J]. 計(jì)算機(jī)科學(xué). 2004.

        [3]周駿,徐林,李征[著]. 元模型驅(qū)動(dòng)的企業(yè)建模[J]. 計(jì)算機(jī)工程與應(yīng)用. 2005(27).

        [4]中文元數(shù)據(jù)標(biāo)準(zhǔn)研究項(xiàng)目組. 國(guó)外元數(shù)據(jù)標(biāo)準(zhǔn)比較研究報(bào)告[R]. 2000.12.

        收稿日期:2008-01-12

        作者簡(jiǎn)介:徐小靜(1983-),男,浙江衢州人,學(xué)生,碩士研究生,研究方向:數(shù)據(jù)庫(kù)應(yīng)用技術(shù);楊青(1964-),女,湖北武漢人,副教授,研究方向:數(shù)據(jù)庫(kù)應(yīng)用技術(shù)。

        狠狠综合久久av一区二区三区| 日韩亚洲中字无码一区二区三区| 日本a级大片免费观看| 亚洲av男人免费久久| 青青草国产在线视频自拍| 边喂奶边中出的人妻| 在线播放真实国产乱子伦| 四川少妇大战4黑人| 国产91对白在线观看| 亚洲天堂一区二区三区视频| 在线观看视频免费播放| 欧美丰满熟妇bbbbbb| 曰本无码人妻丰满熟妇5g影院| 美女黄频视频免费国产大全 | 综合无码综合网站| 日韩视频午夜在线观看| 中文字幕34一区二区| 欧美最猛性xxxx| 久久综合九色综合欧美狠狠 | 又白又嫩毛又多15p| 2020国产精品久久久久| 丝袜美腿一区在线观看| 欧美精品国产综合久久| 少妇熟女视频一区二区三区| 国产西西裸体一级黄色大片| 国产自拍视频在线观看免费 | 久久综合精品国产丝袜长腿| 无码人妻专区一区二区三区| av成人一区二区三区| 久久精品国产精品| 国产美女在线一区二区三区| 色婷婷精久久品蜜臀av蜜桃| 久久久久成人精品免费播放动漫| 1000部夫妻午夜免费| 中文亚洲AV片在线观看无码| 少妇呻吟一区二区三区| 亚洲国产精品日本无码网站| 另类老妇奶性生bbwbbw| 日本免费一区二区三区在线看| 极品精品视频在线观看| 午夜男女很黄的视频|