秦 艷
中圖分類(lèi)號(hào):TP3 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1671-7597(2009)0720050-01
一、XML技術(shù)
XML是SGHL(標(biāo)準(zhǔn)通用置標(biāo)語(yǔ)言)的一個(gè)子集,它結(jié)合了SGML和HTML
的優(yōu)點(diǎn)并消除其缺點(diǎn),使其在Web應(yīng)用中既能利用SGML的長(zhǎng)處,又保留了HTML的簡(jiǎn)單性。
XML在誕生后的幾年中,以一種超越HTML的速度發(fā)展,XML的發(fā)展已經(jīng)超出了它的創(chuàng)立者當(dāng)初設(shè)想的程度,已成為網(wǎng)絡(luò)服務(wù)中不可缺少的元素。XML文檔的內(nèi)容與格式分離,易于被機(jī)器讀取和處理,通過(guò)一個(gè)XML文檔就可以把數(shù)據(jù)信息的內(nèi)容、結(jié)構(gòu)和含義完整地表達(dá)出來(lái)。XML并不限于在Web上的應(yīng)用,它已經(jīng)被廣泛地用于置標(biāo)語(yǔ)言設(shè)計(jì)、數(shù)據(jù)交換、智能代理、精確搜索、不同數(shù)據(jù)源集成以及網(wǎng)絡(luò)出版等。
從本質(zhì)上來(lái)說(shuō),XML是描述半結(jié)構(gòu)化數(shù)據(jù)比較適合的數(shù)據(jù)模型,作為數(shù)據(jù)模型它有以下優(yōu)點(diǎn):
1.具有自描述性。XML中的語(yǔ)義標(biāo)識(shí)一方面限定了元素的層次結(jié)構(gòu),另一方面也說(shuō)明了元素的含義。在XML的搜索結(jié)果中,由標(biāo)識(shí)就可以知道內(nèi)容的含義,這使得搜索結(jié)果更有意義。這也是下一代Web的方向語(yǔ)義Web。
2,具有平臺(tái)無(wú)關(guān)性。XML文檔是純文本,獨(dú)立于平臺(tái)和應(yīng)用。所以XML可脫離具體應(yīng)用而自行描述保存在異構(gòu)環(huán)境中的各種數(shù)據(jù),其他系統(tǒng)應(yīng)用能直接對(duì)這些自描述的XML文件中的數(shù)據(jù)進(jìn)行操作。因此,它將成為跨平臺(tái)數(shù)據(jù)交換和操作的標(biāo)準(zhǔn)模式,實(shí)現(xiàn)異構(gòu)數(shù)據(jù)源集成中數(shù)據(jù)的互操作性。
3,能描述不同復(fù)雜程度的數(shù)據(jù)。XML提供了數(shù)據(jù)的結(jié)構(gòu)化表示,并且易于操作。XML可以用一種統(tǒng)一的數(shù)據(jù)模型描述來(lái)自不同數(shù)據(jù)源的數(shù)據(jù),屏蔽數(shù)據(jù)源中應(yīng)用環(huán)境和數(shù)據(jù)結(jié)構(gòu)的異構(gòu)性。
4,具有可擴(kuò)展性。XML可以在不破壞現(xiàn)有結(jié)構(gòu)和系統(tǒng)的情況下增加新的數(shù)據(jù)字段。應(yīng)用服務(wù)器利用XML對(duì)所有數(shù)據(jù)建模,若要改變數(shù)據(jù)模型只需改變數(shù)據(jù)模型定義,如DTD(或XML Schema)等,不需要重新編碼現(xiàn)有對(duì)象。
所以,從數(shù)據(jù)模型的角度來(lái)看,XML很適合用來(lái)描述各種異構(gòu)數(shù)據(jù)源。
二、數(shù)據(jù)交換
數(shù)據(jù)交換是實(shí)現(xiàn)數(shù)據(jù)共享的一種技術(shù),通過(guò)數(shù)據(jù)交換,實(shí)現(xiàn)各系統(tǒng)間的數(shù)據(jù)共享、互聯(lián)互通、業(yè)務(wù)協(xié)同是解決目前“信息孤島”現(xiàn)象的關(guān)鍵途徑。
作為企業(yè)之間數(shù)據(jù)交換系統(tǒng)的中間格式標(biāo)準(zhǔn),最基本的一條就是通用性。國(guó)內(nèi)還沒(méi)有與行業(yè)相關(guān)的成熟的數(shù)據(jù)交換標(biāo)準(zhǔn),因此可以把XML文件作為數(shù)據(jù)交換的標(biāo)準(zhǔn),即把所有的非XML格式的要用于交換的企業(yè)信息轉(zhuǎn)換成XML格式,用它作為中間數(shù)據(jù)格式,需要交換數(shù)據(jù)的企業(yè)可以通過(guò)某種媒介獲取XML格式的信息,然后轉(zhuǎn)化成自己能夠識(shí)別的信息,這樣就完成了一次數(shù)據(jù)交換。
在XML出現(xiàn)之前,由于缺乏合適的數(shù)據(jù)描述方式,因此無(wú)法將各種不同模式的數(shù)據(jù)表示成統(tǒng)一的數(shù)據(jù)模型。這樣,在進(jìn)行數(shù)據(jù)轉(zhuǎn)換時(shí),只能采用圖1所示的網(wǎng)狀結(jié)構(gòu),在參與交換的所有種類(lèi)數(shù)據(jù)之間相互建立映射關(guān)系,對(duì)它們進(jìn)行點(diǎn)對(duì)點(diǎn)的直接轉(zhuǎn)換。假設(shè)有N個(gè)不同的數(shù)據(jù)源參與交換,那么需要建立N*(N-1)/2個(gè)映射關(guān)系。
XML的出現(xiàn)帶來(lái)了第二種選擇。XML的半結(jié)構(gòu)化的特點(diǎn)一方面滿(mǎn)足了表達(dá)關(guān)系數(shù)據(jù)庫(kù)的結(jié)構(gòu)和各種約束的需要,另一方面使之能表達(dá)和描述純文本、二進(jìn)制數(shù)據(jù)等非結(jié)構(gòu)化數(shù)據(jù)。因此,XML完全可以作為異構(gòu)數(shù)據(jù)轉(zhuǎn)換的公共數(shù)據(jù)模型。使用XML文件作為數(shù)據(jù)轉(zhuǎn)換的公共模型和中間文件而建立的如圖2的星型轉(zhuǎn)換結(jié)構(gòu),在N個(gè)不同的數(shù)據(jù)源參與交換的情況下,只需在各數(shù)據(jù)源與XML中間文件之間建立N個(gè)映射關(guān)系。相比網(wǎng)狀模型,數(shù)據(jù)轉(zhuǎn)換的復(fù)雜度被大大降低了。
三、海洋數(shù)據(jù)交換
在海洋數(shù)據(jù)交換領(lǐng)域中,沒(méi)有標(biāo)準(zhǔn)的部落式交換的代價(jià)是高昂的,相同的數(shù)據(jù)分析處理模塊在很多應(yīng)用中被重復(fù)的撰寫(xiě),由于沒(méi)有中間標(biāo)準(zhǔn),各個(gè)系統(tǒng)的代碼重用不能得以有效進(jìn)行,昂貴的數(shù)據(jù)交換代價(jià)是的數(shù)據(jù)源只能散亂孤立的存在,不能真正做到資源的共享。為了提高信息的時(shí)效性和數(shù)據(jù)挖掘系統(tǒng),需要制定一系列標(biāo)準(zhǔn)和技術(shù)規(guī)范來(lái)統(tǒng)一各種技術(shù)流程和系統(tǒng)中以數(shù)字形式存在的各種信息,以達(dá)到信息交互共享、查詢(xún)方便、資料齊全的目的。
自1998年2月,W3C(World Wide Web Consortium)推出可擴(kuò)展標(biāo)記語(yǔ)言XML(eXtensible Markup Language)以來(lái),國(guó)際上一些海洋強(qiáng)國(guó)及研究機(jī)構(gòu)逐漸意識(shí)到XML技術(shù)在處理多種格式的海洋數(shù)據(jù)、簡(jiǎn)化數(shù)據(jù)交換方面存在著巨大潛力。近幾年澳大利亞、加拿大、美國(guó)、俄羅斯等國(guó)家的海洋領(lǐng)域都在把XML運(yùn)用到數(shù)據(jù)交換、資料處理和存儲(chǔ)以及日常管理等方面,國(guó)際海洋資料交換委員會(huì)(IODE)已組成專(zhuān)門(mén)研究小組(SGXML)開(kāi)展海洋XML的技術(shù)交流與協(xié)調(diào)工作。目前,澳大利亞國(guó)家海洋數(shù)據(jù)中心(AODC)根據(jù)XML結(jié)構(gòu)化的樹(shù)型存儲(chǔ)結(jié)構(gòu)以及深層次的嵌套表達(dá)特點(diǎn),將站點(diǎn)觀測(cè)海洋數(shù)據(jù)的站位信息、質(zhì)控細(xì)節(jié)、海洋具體觀測(cè)數(shù)據(jù)記錄等封裝起來(lái)形成一個(gè)XML文檔。
由于XML具有能描述比常用的關(guān)系型數(shù)據(jù)結(jié)構(gòu)更為復(fù)雜、更接近現(xiàn)實(shí)的數(shù)據(jù)的能力,同時(shí)XML可以粒狀地更新,因此XML在海洋觀測(cè)信息采集、預(yù)處理、質(zhì)量控制、海洋元數(shù)據(jù)提取以及數(shù)據(jù)的存儲(chǔ)和維護(hù)等方面改變傳統(tǒng)的數(shù)據(jù)構(gòu)造和處理方式。用XML制定的海洋信息交換標(biāo)準(zhǔn)將給不同海洋信息系統(tǒng)之間數(shù)據(jù)交換帶來(lái)方便,從而推動(dòng)海洋信息化的發(fā)展。
參考文獻(xiàn):
[1]夏登文、石綏詳、姜巖、于戈、王國(guó)仁,XML海洋信息應(yīng)用分析,海洋通報(bào),2005年,第24卷,第1期,84-86頁(yè).
[2]國(guó)家標(biāo)準(zhǔn)委員會(huì),信息技術(shù)-數(shù)據(jù)元的規(guī)范與標(biāo)準(zhǔn)化(GB/T18391-2002),北京:中國(guó)標(biāo)準(zhǔn)出版社,2002.[3]The MarineXML Project.http://ioc.
unesco.org/iode/contents.php?id=33.
作者簡(jiǎn)介:
秦艷(1978-),女,山東日照人,碩士,山東水利職業(yè)學(xué)院助教,主要從事計(jì)算機(jī)教學(xué)和研究方面的工作。