齊繼東 陳 健 荀 燁 馬小平 傅 鈺
摘要:文章以國標(biāo)“物流公共信息平臺應(yīng)用開發(fā)指南-主要單證”為例,通過建立領(lǐng)域本體的概念、概念之間的繼承、約束、實(shí)例關(guān)系表達(dá)了物流公共信息平臺的領(lǐng)域知識,并利用建模工具protégé分析和設(shè)計了物流公共信息平臺主要單證的領(lǐng)域本體庫,即基本本體和過程本體的集合。為物流公共信息平臺主要單證的結(jié)構(gòu)異構(gòu)和語義異構(gòu)的信息交換提供標(biāo)準(zhǔn)。
關(guān)鍵詞:物流公共信息平臺;物流領(lǐng)域本體庫;共享本體與過程本體
中圖分類號:TP391文獻(xiàn)標(biāo)識碼:A
Abstract:Based on applied guide of logistics commonality information flat, the paper has expressed logistics domain information by domain ontology, inherience and constrains and instance which concept andinter-concept have generated. Share ontology and application ontology have structured by protégé. Ontology base is data interchange standard on main docment of logistics commonality information plat.
Key words: logistics commonality information plat; logistics domain ontology base; share ontology and process ontology
0引言
領(lǐng)域本體[2-3]是專業(yè)性的本體提供了某個專業(yè)學(xué)科領(lǐng)域中概念的術(shù)語以及相互關(guān)系的規(guī)范化描述,勾畫出某一領(lǐng)域的基本知識的體系結(jié)構(gòu)和描述語言。一個領(lǐng)域本體包括一套關(guān)于某一領(lǐng)域概念的規(guī)范而清晰的描述稱為類,對概念的各種特征屬性,還包括屬性的限制條件和方面,以及一系列與某個類相關(guān)的實(shí)例,這些實(shí)例組成了一個知識庫。類是本體的核心,它描述了某一領(lǐng)域的概念。屬性描述了類的屬性和實(shí)例。構(gòu)建領(lǐng)域本體可以達(dá)成用戶間或軟件代理間對于信息組織結(jié)構(gòu)的共同理解和認(rèn)識,使專業(yè)領(lǐng)域內(nèi)的假設(shè)變得更加明確,將領(lǐng)域知識從運(yùn)籌學(xué)、知識管理的環(huán)境中剝離出來,并且可以分析專業(yè)領(lǐng)域的知識。
目前,本體模型的研究已經(jīng)進(jìn)入實(shí)際應(yīng)用階段。許多研究領(lǐng)域目前都建立了自己標(biāo)準(zhǔn)的本體,如常識本體、企業(yè)本體(TOVE、ENTERPRISE)、GIS信息資源管理本體等,這使得諸多領(lǐng)域?qū)<夷軌蚴褂盟鼈儊砉蚕砗驮u注領(lǐng)域中的信息。本文以構(gòu)建物流公共信息平臺(Logistics Commonality Information Flat, LCIF)主要單證(Main Documents)本體為例,嘗試分析和設(shè)計物流公共信息平臺領(lǐng)域本體的方法和過程。LCIF本體庫的創(chuàng)建可以為本專業(yè)領(lǐng)域的結(jié)構(gòu)異構(gòu)、語義異構(gòu)的多源信息資源管理提供標(biāo)準(zhǔn)。
1本體的構(gòu)建規(guī)則與方法[8]
1.1領(lǐng)域本體構(gòu)建的規(guī)則[4,9]
由于不同專業(yè)領(lǐng)域和學(xué)科考慮,構(gòu)建領(lǐng)域本體的過程也各不相同,一般認(rèn)為,構(gòu)造領(lǐng)域本體應(yīng)遵循Cruber于1995年提出的5條規(guī)則:①明確性和客觀性。本體應(yīng)該用自然語言對所定義術(shù)語給出明確的、客觀的語義定義。②完全性。所給出的定義是完整的,完全能表達(dá)所描述術(shù)語的含義。③一致性。由術(shù)語得出的推論與術(shù)語本身的含義是相容的,不會產(chǎn)生矛盾。④大單調(diào)可擴(kuò)展性。向本體中添加通用或?qū)S玫男g(shù)語時,不需要修改已有的內(nèi)容。⑤最小承諾。對待建模對象給出盡可能少的約束。
1.2本體的構(gòu)建方法[9]
構(gòu)建領(lǐng)域本體的方法已經(jīng)成為一個新的研究熱點(diǎn),在實(shí)踐中也產(chǎn)生了一些面向不同應(yīng)用需求的本體方法,如IDEF-5法、骨架法、企業(yè)建模法、METHONTOLOGY法、循環(huán)獲取法、七步法等。通過對他們的比較,本文利用骨架法構(gòu)建物流公共信息平臺的領(lǐng)域本體。骨架法是Uschold和King等人基于從開發(fā)企業(yè)建模過程的Enterprise Ontology的經(jīng)驗(yàn)中得出的骨架法(Uschold,1995),該方法使用middle-out開發(fā)方式提供本體開發(fā)的指導(dǎo)方針,還是與商業(yè)和企業(yè)有關(guān)的術(shù)語及其定義的集合。Enterprise Ontology是英國Edinburgh大學(xué)AI應(yīng)用研究所的Enterprise項(xiàng)目組開發(fā),合作伙伴有IBM、Logica UK有限公司和Unilever公司等。骨架法的開發(fā)過程:
(1)確定本體應(yīng)用的目的和范圍。根據(jù)研究的領(lǐng)域或任務(wù),建立相應(yīng)的領(lǐng)域本體或過程本體。研究的領(lǐng)域越大,所建的本體也會越大。
(2)本體分析。定義本體所有術(shù)語的意思及其之間的關(guān)系,該步驟需要領(lǐng)域?qū)<业膮⑴c。對該領(lǐng)域了解越多,所建本體越完善。
(3)本體表示。一般用RDF、OWL語義模型來表示本體。
(4)本體評估。建立本體的評估標(biāo)準(zhǔn)是清晰性、一致性、完善性和可擴(kuò)展性。清晰性就是本體中的術(shù)語應(yīng)無歧義;一致性指的是術(shù)語之間邏輯關(guān)系上應(yīng)一致;完善性是指本體中的概念及其關(guān)系應(yīng)是完整的;可擴(kuò)展性指的是本體應(yīng)能夠可擴(kuò)展以便適應(yīng)將來的發(fā)展需要。符合評估標(biāo)準(zhǔn)則繼續(xù)下一步,否則轉(zhuǎn)到第2步。
(5)本體的建立:以文檔形式保存所建立的本體。
2構(gòu)建物流領(lǐng)域本體
本文以GB/T 18354-2001《中華人民共和國國家標(biāo)準(zhǔn)物流術(shù)語》、GB/T 7635.1-2002《全國主要產(chǎn)品分類與代碼》和GB/T《物流公共信息平臺應(yīng)用開發(fā)指南》等標(biāo)準(zhǔn)規(guī)定的概念和術(shù)語為基礎(chǔ),分析和設(shè)計LCIF的主要單證的領(lǐng)域本體。無論是分析還是通過建模工具設(shè)計本體、類、屬性、約束、還是實(shí)例,均表示為資源描述架構(gòu)(RDF)模式,即是三元組。
2.1物流領(lǐng)域本體分析
本文針對國標(biāo)“物流公共信息平臺應(yīng)用開發(fā)指南-主要單證”中發(fā)貨通知單證(Delivery Notice Document)為例(見表1),分析和設(shè)計物流領(lǐng)域本體,即共享本體(基本本體)和過程本體。
目標(biāo):構(gòu)建LCIF領(lǐng)域本體目標(biāo)是為物流信息的應(yīng)用提供語義層次的應(yīng)用,為供應(yīng)鏈的信息集成提供語義基礎(chǔ),為語義異構(gòu)、結(jié)構(gòu)異構(gòu)的現(xiàn)存多源數(shù)據(jù)集成提供“元數(shù)據(jù)”。
應(yīng)用范圍:LCIF的主要單證主要應(yīng)用在需求方提出物品需求,并上報給供應(yīng)方,供應(yīng)方根據(jù)多點(diǎn)物品的需求與儲備的情況,制定相應(yīng)的物品實(shí)施計劃和配送計劃,即業(yè)務(wù)計劃文檔。本文采用構(gòu)建基本本體[5-6]和過程本體[5-6]的模式(見圖1),分析與設(shè)計發(fā)貨通知單證涉及的領(lǐng)域本體。
依據(jù)《中華人民共和國國家標(biāo)準(zhǔn)物流術(shù)語》,分析發(fā)貨通知單證(Delivery Notice Document)中涉及的概念或術(shù)語,并為其提供精確、公認(rèn)或公理式的描述。
(1)基本本體(base ontology)。LCIF的最高層次的全局共享詞匯集,包括了本領(lǐng)域中的基本術(shù)語或概念,即形成類,以及類屬性要素、類實(shí)例的描述。結(jié)合表1,發(fā)貨通知單證中包含的術(shù)語或概念有:物品(article)、存儲物品的倉庫(warehouse)、生產(chǎn)物品的企業(yè)(enterprise)、裝載或運(yùn)輸物品的設(shè)備或設(shè)施(devices)、企業(yè)或倉庫的坐落位置(area)等。
△物品類(article):發(fā)貨通知中不可避免要包括保障的物品或貨物,此本體包含的屬性應(yīng)是物品本身具備的基本屬性或特殊屬性,并為屬性定義類型和值域等方面。示例:屬性{代碼、名稱、型號、計量單位、單價、單價單位、危險品、運(yùn)輸?shù)燃壍龋瑔蝺r單位值域{元、萬元、美元、歐元、…}。
《全國主要產(chǎn)品分類與代碼》-可運(yùn)輸產(chǎn)品分為5大部類(見表2),每大部類內(nèi)又分為若干部類、大類、中類、小類和細(xì)類。如0大部類又分6部類(分別為01~06),01部類下又分為9大類,01部類谷物、雜糧及其種子部類又分為9大類等,結(jié)合國標(biāo)《全國主要產(chǎn)品分類與代碼》的標(biāo)準(zhǔn),同級本體類不超過2-12個的原則,物品(article)本體的類結(jié)構(gòu)應(yīng)為三層,類級別到物品大類。
結(jié)合《全國主要產(chǎn)品分類與代碼》-可運(yùn)輸產(chǎn)品的規(guī)定,在類〔beginning bits encoded ××〕繼續(xù)增加子類本體。以0大部類為例:01部類種植業(yè)產(chǎn)品(beginning bits encoded zeroone);011大類谷物、雜糧及其種子(beginning bits encoded zerooneone);012大類蔬菜(beginning bits encoded zeroonetwo);013大類水果和堅果(beginning bits encoded zeroonethree);014大類油籽類和含油果類(beginning bits encoded zeroonefour);015大類活的植物、切花和花蕾、花卉種子及其幼苗、插穗和水果種子、蔬菜種子、林木種子和幼苗(beginning bits encoded zeroonefive);016大類飲料和香辛料作物產(chǎn)品(beginning bits encoded zeroonesix);017大類未加工的煙草(beginning bits encoded zerooneseven);018大類制糖用植物(beginning bits encoded zerooneeight);019大類不另分類的植物原料(beginning bits encoded zeroonenine)。
△倉庫類(warehouse):存儲需要保障的物品的庫房信息。屬性示例:代碼、類型、名稱、儲備容量、容量計量單位等。根據(jù)倉庫儲備的物品性質(zhì)及其特點(diǎn),增加倉庫類(warehouse)下子類:通用倉庫類(generalwarehouse)、專用倉庫類(specialitywarehouse)和特殊倉庫類(dangerwarehouse),并進(jìn)一步描述子類的特有屬性及其實(shí)例,如特殊倉庫類中危險等級及其值域。
△包裝類(package):包裝對于物流活動的效率非常重要,因此在貨品包裝本體必須構(gòu)建。示例屬性:名稱、尺寸、材料、凈重、托盤模數(shù)(modulus)等。結(jié)合包裝的方式或運(yùn)輸方式,增加包裝類(package)的子類:集裝化包裝(containerization)、托盤包裝(palietizing)和散裝包裝(inbulk),并結(jié)合各包裝類型標(biāo)準(zhǔn)創(chuàng)建實(shí)例,以及特有屬性及其值域。
△設(shè)備類(devices):實(shí)現(xiàn)物品的發(fā)貨必須具備相應(yīng)的運(yùn)載工具,如運(yùn)輸工具、叉車等。示例屬性:代碼、名稱、額定承載能力等。結(jié)合設(shè)備的功能特點(diǎn),設(shè)備類(devices)下增加子類:運(yùn)載工具(vechile)和裝卸搬運(yùn)機(jī)械類(fork lift truck)并結(jié)合子類特點(diǎn)創(chuàng)建子類屬性及其實(shí)例。
本體或本體之間的約束關(guān)系:企業(yè)類與區(qū)域類之間的駐地關(guān)系、物品類與包裝類之間的包裝關(guān)系、倉庫類與物品類之間存儲關(guān)系,以及類本身屬性值域的約束,如物品類(Article)、設(shè)備類(devices)的“計量單位〔measure、size_measure、modulus_measure〕”屬性的值域來源于計量單位類(measure),企業(yè)類(enterprise)的屬性“駐地”值域來源于區(qū)域類(area)。
(2)過程本體(process ontology)。利用基本本體庫中的一個或多個類及其屬性、約束生成新的本體。如發(fā)貨通知單證本體包含了上述部分類及其部分屬性,個別屬性隸屬發(fā)貨通知單證本身特點(diǎn)。
△單證類(document):描述物流活動過程中涉及的各種單證及其屬性、約束、單證實(shí)例等關(guān)系。依據(jù)國標(biāo)《物流公共信息平臺應(yīng)用開發(fā)指南》的主要單證,單證類(doument)下增加子類:訂單類(order)、發(fā)貨類(delivery)、庫存水平類(inventory)、發(fā)貨狀態(tài)類(delivery status)、發(fā)票(bill)。并在上述類基礎(chǔ)上創(chuàng)建或關(guān)聯(lián)屬性、約束、繼承和實(shí)例等內(nèi)容(由于篇幅所限,LCIF主要單證的其他本體略)。
LCIF主要單證的本體結(jié)構(gòu)見圖2(其中,Thing是領(lǐng)域本體的超類,構(gòu)建的所有類或本體均是其子類)。
2.2利用protégé[1-7]創(chuàng)建LCIF領(lǐng)域本體
目前JOE、KADS22、OILep、OntoEdit、protégé[1]、Ontolingua、WebOnto等本體建模工具不少于50種,通過分析和相關(guān)研究人員使用,本文選擇protégé作為構(gòu)建物流公共信息平臺的基本本體和過程本體的工具,并確定領(lǐng)域本體庫的表達(dá)方式,如RDF、OWL等格式。protégé特點(diǎn)是能免費(fèi)下載,插件可以擴(kuò)展特殊的功能,如程序編程、本體查詢等,具有圖形化的用戶界面,使用簡單,有詳細(xì)友好的幫助文檔,支持多種語言并能支持中文,比較適合本體構(gòu)建的概念化和形式化階段,適用于對構(gòu)建沒有過多經(jīng)驗(yàn)的用戶。本體設(shè)計階段的主要內(nèi)容:確定LCIF領(lǐng)域本體的表達(dá)模式(語言);設(shè)計LCIF共享本體和過程本體。
打開protégé。點(diǎn)擊『create new project』按鈕后,出現(xiàn)選擇project類型的界面。在界面中『select a project type』列出了幾種類型的選擇,選擇『protégé files(.pont and .pins)』,然后點(diǎn)擊『finish』按鈕, 新的項(xiàng)目被成功地建立。在當(dāng)前創(chuàng)建的項(xiàng)目下創(chuàng)建Thing的子類及其子類的子類,并為各子類指定特有的屬性、約束和實(shí)例,由于篇幅關(guān)系,創(chuàng)建過程略。LCIF領(lǐng)域本體結(jié)構(gòu)見圖3。
通過圖3所示本體庫的創(chuàng)建,本體之間關(guān)系、本體屬性、本體約束、屬性約束、本體實(shí)例的設(shè)計,為在信息資源實(shí)踐管理中應(yīng)用,需要利用protégé提供的功能將其生成rdf或owl本體庫。通過本體庫與相關(guān)數(shù)據(jù)庫字典或數(shù)據(jù)管理基礎(chǔ)標(biāo)準(zhǔn)進(jìn)行映射,并利用RDF查詢語言進(jìn)行語義層的數(shù)據(jù)管理。
3結(jié)論
本體作為一種論點(diǎn)是新穎、起點(diǎn)較高的,是連接信息系統(tǒng)與哲學(xué)之間的紐帶,能夠在語義層次上解決信息資源管理中的語義異構(gòu)和結(jié)構(gòu)異構(gòu)的問題。本文以GB/T《物流公共信息平臺應(yīng)用開發(fā)指南-主要單證》為例,通過建立領(lǐng)域本體的概念、概念之間的繼承、約束、實(shí)例關(guān)系表達(dá)了物流公共信息平臺的主要大爆炸各報告的領(lǐng)域知識,并利用建模工具protégé設(shè)計了物流公共信息平臺的主要單證的領(lǐng)域本體集合,即基本本體和過程本體。
參考文獻(xiàn):
[1]Natalya F Noy and Deborah L McGuinness. A Guide to Creating Your First Ontology[EB/OL]. (2001-08-10)[2008-09-25].http://protég.éstanford.edu/publications/ontology-develop-ment/ontology101.
[2]李恒杰. 領(lǐng)域本體建模方法研究[J]. 計算機(jī)工程與設(shè)計, 2008,29(2):381-384.
[3]肖敏,等. 領(lǐng)域本體的構(gòu)建方法研究[J]. 情報方法, 2006(2):70-74.
[4]胡兆芹,等. 領(lǐng)域本體的構(gòu)建實(shí)踐[J]. 醫(yī)學(xué)信息, 2008(1):13-16.
[5]吳玲麗,等. 一種基于Ontology的異構(gòu)數(shù)據(jù)庫語義集成方法[J]. 計算機(jī)系統(tǒng)應(yīng)用, 2008(3):31-37.
[6]袁磊,等. 面向領(lǐng)域知識的本體知識模型XML表示框架[J]. 計算機(jī)工程, 2006,32(1):192-196.
[7]Choset H, Burdick J. Sensor Based Motion Planning: The Hierarchical Generalized Voronoi Graph[Z]. Workshop on Algorithmic Foundation of Robotics, 1996.
[8]Cruber T R. Towards Principles for the Design of Ontologies Used for Knowledge Sharing[J]. International Journal of Human-Computer Studies, 1995(43):907-908.
[9]馮志勇,等. 本體工程及其應(yīng)用[M]. 北京: 清華大學(xué)出版社,2007.