摘 要: 對物流元數(shù)據(jù)的概念進行了定界,針對元數(shù)據(jù)的現(xiàn)狀,提出了物流元數(shù)據(jù)的存儲組織模型,并根據(jù)此模型,設(shè)計了一種基于“元關(guān)系”的元數(shù)據(jù)與物流信息實體之間的同步更新機制,較好地解決了物流元數(shù)據(jù)的集成管理等問題。
關(guān)鍵詞: 物流元數(shù)據(jù); 存儲模型; 同步機制; 元數(shù)據(jù)的存儲; 元關(guān)系
中圖分類號:TP393 文獻標志碼:A 文章編號:1006-8228(2013)10-13-03
0 引言
元數(shù)據(jù)在各領(lǐng)域有不同的定義,在綜合各種定義的基礎(chǔ)上,對物流元數(shù)據(jù)定義如下:物流元數(shù)據(jù)是在物流活動中所產(chǎn)生的數(shù)據(jù)(包含知識和規(guī)則)的描述,包括數(shù)據(jù)的格式、技術(shù)和業(yè)務(wù)過程、數(shù)據(jù)的規(guī)則和約束以及數(shù)據(jù)結(jié)構(gòu)等。
物流元數(shù)據(jù)也是一種數(shù)據(jù),在形式上與其他數(shù)據(jù)沒有區(qū)別,它可以以數(shù)據(jù)存在的任何一種形式存在。但是,物流元數(shù)據(jù)目前缺乏統(tǒng)一的標準,部分企業(yè)所建立的規(guī)范也不能滿足全行業(yè)的需要。本文探討采取另一種方式,即從存儲模型上著手,盡量在不改變現(xiàn)有各系統(tǒng)的基礎(chǔ)上,融合已有的元數(shù)據(jù)規(guī)范,解決這一問題[1-3]。
1 物流元數(shù)據(jù)
1.1 企業(yè)間物流信息交換現(xiàn)狀
目前國內(nèi)很多企業(yè)都無法順利地實現(xiàn)物流信息的交換,大部分企業(yè)的物流信息系統(tǒng)是封閉運作的,企業(yè)在各自的內(nèi)部網(wǎng)絡(luò)采用共同的標準協(xié)議進行數(shù)據(jù)交換,但在企業(yè)間、整個物流行業(yè)間還沒有形成一套統(tǒng)一的、規(guī)范化的物流數(shù)據(jù)交換標準, 企業(yè)物流信息沒有共同的數(shù)據(jù)規(guī)范統(tǒng)一約束,導(dǎo)致了數(shù)據(jù)交換的困難。
1.2 基于元數(shù)據(jù)的物流信息交換技術(shù)
OAI(Open Archive Initiative)技術(shù)的目的是實現(xiàn)異構(gòu)系統(tǒng)間資源的共享和交換。其主要思想是:將服務(wù)提供者和數(shù)據(jù)提供者分離, 服務(wù)提供者只提取元數(shù)據(jù)信息,對元數(shù)據(jù)信息進行重新組織,不需要了解數(shù)據(jù)提供者的內(nèi)部數(shù)據(jù)格式,只需要遵循協(xié)議的格式,將參數(shù)傳給數(shù)據(jù)提供者就可以得到所需的元數(shù)據(jù),進行資源共享和互操作[4]。
在物流聯(lián)盟中制定了統(tǒng)一的元數(shù)據(jù)規(guī)范,各成員只需提取元數(shù)據(jù)信息,無需再對異構(gòu)數(shù)據(jù)進行復(fù)雜的數(shù)據(jù)交換,就可以對資源進行共享和信息的互操作,達到高效、合理、及時完成項目運作的目的。另外,通過元數(shù)據(jù)映射也可達到各類系統(tǒng)間的數(shù)據(jù)交換。為此,基于OAI的思想,從物流信息交換的研究角度出發(fā),提出一個元數(shù)據(jù)框架的設(shè)想和信息交換模型,可以作為一個物流系統(tǒng)間異構(gòu)數(shù)據(jù)交換的可行解決方案。
1.3 物流信息元數(shù)據(jù)框架
這里把目前第三方物流的業(yè)務(wù)概括為兩個中心,即物流中心和配送中心。物流中心承擔(dān)著訂單管理、貨物管理、倉庫管理、財務(wù)管理等,而配送中心主要負責(zé)貨物的配送管理、車輛管理等。
第三方物流業(yè)務(wù)流程產(chǎn)生如下數(shù)據(jù)流:發(fā)貨訂單、驗貨單、貨物通知單、貨物維護單、貨物入庫單、發(fā)貨通知單、配送計劃單、貨物記錄單、貨物運輸單、回單、退貨單;還有基礎(chǔ)資料信息,包括企業(yè)信息、人員信息、車輛信息、儲位信息等。
根據(jù)物流信息資源,劃定了物流信息元數(shù)據(jù)的基本框架。按元數(shù)據(jù)方法劃分成三個類型,即貨物信息元數(shù)據(jù)、單證元數(shù)據(jù)、人員信息元數(shù)據(jù)。依據(jù)各數(shù)據(jù)之間的相互關(guān)系,可以確定一個合作模型中物流信息元數(shù)據(jù)基本框架。這個框架可以支持對物流信息的組織、存儲、檢索和交換,依據(jù)元數(shù)據(jù)性質(zhì)把物流信息元數(shù)據(jù)分為兩類,一類是結(jié)構(gòu)性元數(shù)據(jù),另一類是管理性元數(shù)據(jù)[5]。
2 存儲模型
2.1 存儲策略
元數(shù)據(jù)的存儲包括元數(shù)據(jù)標準的存儲和元數(shù)據(jù)本身的存儲。二者之間的關(guān)系是類和實例之間的關(guān)系,XML文件是表示元數(shù)據(jù)最佳方法。由于元數(shù)據(jù)是樹狀文件,XML本身也是樹型層次結(jié)構(gòu),能夠很好地說明元數(shù)據(jù)的元素類型、元素之間的關(guān)系,并且能夠?qū)υ獢?shù)據(jù)進行嚴格驗證。不過,在將XML文件存入關(guān)系數(shù)據(jù)庫時存在一些問題:XML文件和關(guān)系數(shù)據(jù)庫之間的對象映射關(guān)系比較復(fù)雜。如果將XML文件作為關(guān)系數(shù)據(jù)庫的一個字段進行存儲,則不便于對元數(shù)據(jù)元素進行檢索和展現(xiàn)。
根據(jù)以上分析,我們需要一種存儲策略,把XML Schema的元數(shù)據(jù)標準映射并存儲到關(guān)系型數(shù)據(jù)庫中。為此,建立了圖1所示的基于XML Schema的物流元數(shù)據(jù)存儲體系,將物流元數(shù)據(jù)按照模式和內(nèi)容分別存儲。在由XML Schema模式到關(guān)系型模式的轉(zhuǎn)換過程中,核心工作是制定轉(zhuǎn)換規(guī)則,而建立轉(zhuǎn)換映射規(guī)則的前提是對XML Schema文件建立有效結(jié)構(gòu)。DOM(Document Object Model,文檔對象模型)是一種抽象數(shù)據(jù)結(jié)構(gòu),它將XML文檔表示為由節(jié)點構(gòu)成的樹。在DOM樹中,節(jié)點用來表示元素、屬性和文本。每棵DOM樹都有惟一的根節(jié)點。Element代表元素.是最常用的節(jié)點,它可以組成以它為根的DOM的子樹。元素節(jié)點還可以有元素子節(jié)點、屬性子節(jié)點等。利用DOM樹的思想將XML SChema轉(zhuǎn)換為DOM樹結(jié)構(gòu),分別對根元素和各級子節(jié)點的復(fù)合元素建表。并且,為了保持它們的父子關(guān)系,需要在數(shù)據(jù)表中建立指向其子節(jié)點的復(fù)合元素的外鍵(FK)。其結(jié)構(gòu)解析過程如圖2所示[2,6]。
2.2 存儲組織模型
由于各企業(yè)、各部門依照自身的需要,使用不同的開發(fā)工具建立的物流管理系統(tǒng),大多數(shù)有不同或不能兼容的內(nèi)部元數(shù)據(jù)和特有的元數(shù)據(jù)接口。在沒有統(tǒng)一的物流元數(shù)據(jù)標準之前,數(shù)據(jù)集成存在很多問題,也非常困難。因此,可靠的存儲組織模型,成為高效集成的關(guān)鍵。
本文采用如圖3所示的模型,一個物流共享元數(shù)據(jù)庫由多個元數(shù)據(jù)庫提取得到,一個元數(shù)據(jù)庫包含多個物流元數(shù)據(jù)規(guī)范,每個規(guī)范可包含多個元數(shù)據(jù)對象。其中,每一個規(guī)范代表一個被采用的元數(shù)據(jù)標準?;谏鲜龅膶哟谓M織模型,就可以實現(xiàn)元數(shù)據(jù)按照規(guī)范的分類組織,新的元數(shù)據(jù)標準以新的規(guī)范形式加入到某一元數(shù)據(jù)庫中。該模型具有一定的開放性。
3 同步機制
3.1 元關(guān)系
關(guān)系按照其類型,可分為一般關(guān)系、組合關(guān)系、繼承關(guān)系、屬性型關(guān)系等。其中,屬性型關(guān)系是指兩個對象之間的關(guān)系僅用外鍵字段關(guān)聯(lián)無法實現(xiàn),而需用獨立屬性表來維護關(guān)聯(lián)關(guān)系,如圖4所示。基于屬性表建立物流元數(shù)據(jù)和信息實體之間“元關(guān)系”。維護兩者之間的數(shù)據(jù)一致性,解決同步更新問題。
為了實現(xiàn)一個庫房信息和一條元數(shù)據(jù)的關(guān)聯(lián),首先需要在它們各自所屬的要素類和元數(shù)據(jù)集之間建立一個元關(guān)系。這一步交由數(shù)據(jù)庫中的關(guān)系類表來管理和維護,與此同時,產(chǎn)生一張對應(yīng)該條元關(guān)系的屬性表。它用于維護兩類對象所管理實體之間的關(guān)聯(lián)操作?;谶@種“元關(guān)系”機制,通過定義一個物流信息實體與基于不同規(guī)范的元數(shù)據(jù)集之間的多條元關(guān)系,實現(xiàn)一個信息實體與多條元數(shù)據(jù)的關(guān)聯(lián)。這將有助于借助元數(shù)據(jù)發(fā)布系統(tǒng),在分布、異構(gòu)的信息資源中更快捷、更有效地查詢、訪問、獲取所需要的數(shù)據(jù)[9-10]。
3.2 利用元關(guān)系實現(xiàn)同步機制的過程
首先在物流信息實體和元數(shù)據(jù)集之間建立元關(guān)系,填入關(guān)系類表;在關(guān)系類表中查詢數(shù)據(jù)庫中所有關(guān)系類型為元關(guān)系、原始類ID為ItemsID的關(guān)系類;考慮到一個物流信息實體可能與不同模式下的多個元數(shù)據(jù)集都建有關(guān)系,所以對查詢所得到的每個關(guān)系類。按照下列步驟進行處理。
⑴ 在關(guān)系類對應(yīng)的元關(guān)系屬性表中查找滿足原始鍵值為EntityID、目的鍵值為MetaID的屬性記錄。
⑵ 若沒有找到元關(guān)系屬性記錄表明該物流信息實體沒有元數(shù)據(jù),則根據(jù)元數(shù)據(jù)可同步元素列表的定義,自動從物流信息實體中獲取相關(guān)信息,生成一條新元數(shù)據(jù)。添加到元數(shù)據(jù)集中。
⑶ 若找到相關(guān)屬性記錄集,則對其中每一條屬性記錄,先根據(jù)元數(shù)據(jù)可同步元素列表的定義,自動從物流信息實體中獲取相關(guān)信息,然后再對該條記錄進行更新操作。
參考文獻:
[1] 傅海洋,黃俊,劉曉晨.物流元數(shù)據(jù)及其管理研究[J].物流科技,2008.10.
[2] 吳寶山.基于XML的物流元數(shù)據(jù)的存儲研究[D].安徽大學(xué)碩士學(xué)位論文,2007.
[3] 肖瓏,趙亮.中文元數(shù)據(jù)概論與實例[M].北京圖書館出版社,2007.
[4] 朱毅.元數(shù)據(jù)存儲框架及服務(wù)發(fā)布[J].科技信息,2009.23.
[5] 肖瓏,趙亮.中文元數(shù)據(jù)概論與實例[M].北京圖書館出版社,2011.
[6] 杜楠,彭宏.混合式的元數(shù)據(jù)管理系統(tǒng)研究[J].計算機工程與設(shè)計,2009.15.
[7] 黎建輝,吳威,閻保平.一種基于XML的元數(shù)據(jù)映射與轉(zhuǎn)換算法[J].微電子學(xué)與計算機,2008.1(25).
[8] 鄭琳曦.內(nèi)容管理研究與實現(xiàn)[D].北京工業(yè)大學(xué)工程碩士學(xué)位論文,2007.
[9] XML Linking Language(XLink)Version 1.0.
[10] World Wide Web Consortium.XML Schema.
[11] Open GIS Geography Markup Language (GML)Implementation Specification3.0:OpenGlS Consortium,Inc,2013.
[12] Yan Jie, Zhu Yaolong, Xiong Hui. A Design of Metadata ServerCluster in Large Distributed Object-based Storage. In: 12th NASA Goddard, 21st IEEE Conference on Mass Storage Systems and Technologies,2012.
[13] David Marco.元數(shù)據(jù)倉儲的構(gòu)建與管理[M].機械工業(yè)出版社,2011.