朱強生 朱曉娟 羅雨欣
摘要:該文研究了基于結(jié)構(gòu)化數(shù)據(jù)源的本體建模方法,提出了從關(guān)系數(shù)據(jù)庫數(shù)據(jù)庫出發(fā),對組織業(yè)務(wù)進行本體建模并優(yōu)化方法,以達到組織業(yè)務(wù)的本體建模、業(yè)務(wù)流程簡化優(yōu)化的目的。
關(guān)鍵詞:結(jié)構(gòu)化數(shù)據(jù)源;關(guān)系數(shù)據(jù)庫;本體建模;組織業(yè)務(wù);優(yōu)化
中圖分類號:TP311 文獻標(biāo)識碼:A 文章編號:1009-3044(2014)25-5822-03
Ontology Modeling and Organization of Business Optimization Based on Structured Data Source
ZHU Qiang-sheng1, ZHU Xiao-juan2 , LUO Yu-xin1
(1.College of Information Engineering, Nanjing University of Finance and Economics, Nanjing 210046, China;2.College of Electronic & Photoelectric Technology,Nanjing University of Science and Technology,Nanjing 210094, China)
Abstract:This paper studies the ontology modeling method based on structured data source, puts forward ontology modeling and optimization method from the relation database, to achieve the business purpose of simplified optimization and ontology modeling .
Key words:structured data source; relational database; ontology modeling; organization of business; optimization
1 概述
隨著經(jīng)濟的飛速發(fā)展和企業(yè)不斷壯大,現(xiàn)代企業(yè)的中心已經(jīng)從組織轉(zhuǎn)變到流程,對流程的分析優(yōu)化已經(jīng)成為主要問題。傳統(tǒng)的業(yè)務(wù)優(yōu)化大都采用人工優(yōu)化,需要對企業(yè)現(xiàn)有的業(yè)務(wù)流程、組織結(jié)構(gòu)等信息進行分析,且需要時刻了解當(dāng)前的業(yè)務(wù)流程,適時提出調(diào)整。國外的研究學(xué)者們提出企業(yè)業(yè)務(wù)流程重組(Business Process Reengineering,BPR)[1],主要分為兩類,一類是在現(xiàn)有的業(yè)務(wù)基礎(chǔ)上進行改造;另一類是重新考慮業(yè)務(wù),零起點設(shè)計業(yè)務(wù)。
本體,作為一種“共享概念模型的形式化規(guī)范說明”,能夠很好的描述業(yè)務(wù)特征與業(yè)務(wù)之間的關(guān)系,及業(yè)務(wù)特征與業(yè)務(wù)特征之間的關(guān)系,已經(jīng)廣泛用于現(xiàn)代信息系統(tǒng)。目前,在許多領(lǐng)域中,本體的構(gòu)建大多為手工構(gòu)建。這種方式費時費力,同時還需要領(lǐng)域?qū)<壹皶r參與。該文從企業(yè)數(shù)據(jù)庫出發(fā),通過數(shù)據(jù)庫逆向工程,構(gòu)建企業(yè)組織業(yè)務(wù)的本體模型,通過分析模型其中的活動、目標(biāo)、角色、信息資源等流程的基本要素,在確?;顒佣寄軐崿F(xiàn)的前提下,精簡流程,提高效率。
2 結(jié)構(gòu)化數(shù)據(jù)源的本體建模方法
本體的質(zhì)量決定了基于本體構(gòu)建的應(yīng)用的質(zhì)量,所以選擇合適的數(shù)據(jù)源并從其出發(fā)構(gòu)建高質(zhì)量的本體模型是很重要的[2],當(dāng)前萬維網(wǎng)上大量的數(shù)據(jù)資源主要就是以關(guān)系數(shù)據(jù)庫的方式存儲[3]。在企業(yè)中,企業(yè)的人員、機構(gòu)等信息基本是存入數(shù)據(jù)庫。數(shù)據(jù)源(數(shù)據(jù)庫、XML文檔、Web表格等)的結(jié)構(gòu)化程度有所不同,但是均能夠構(gòu)建高質(zhì)量的本體模型。
通過已有的數(shù)據(jù)庫,我們可以獲取數(shù)據(jù)庫模式信息,根據(jù)設(shè)計好的映射規(guī)則,完成RDM到OWL本體的轉(zhuǎn)換[4],示意圖如圖1。
圖1 RDM到OWL示意圖
2.1 關(guān)系數(shù)據(jù)庫數(shù)據(jù)模型的抽取
目前,網(wǎng)絡(luò)上大量的數(shù)據(jù)仍然主要以關(guān)系數(shù)據(jù)庫的方式存儲,其中,我們通過構(gòu)建關(guān)系數(shù)據(jù)庫模式和本體間映射來解決數(shù)據(jù)庫與本體之間的數(shù)據(jù)互操作性。該文使用Power Designer[5]這個工具,并通過使用其具有的數(shù)據(jù)庫逆向功能,來抽取數(shù)據(jù)庫中的邏輯數(shù)據(jù)模型以及概念數(shù)據(jù)模型。
在軟件工程界,作為一個比較新興的領(lǐng)域,逆向工程已經(jīng)得到廣泛的應(yīng)用。在本文中,我們使用的Power Designer是Sybase公司的CASE工具集,使用它可以方便的對管理信息系統(tǒng)進行分析,它幾乎包括了數(shù)據(jù)模型設(shè)計的全過程??梢詫⒛壳八辛餍械暮蠖藬?shù)據(jù)庫(包括Sybase、DB2、Oracle等)的結(jié)構(gòu)信息通過逆向工程加入到Power Designer的物理數(shù)據(jù)模型和概念數(shù)據(jù)模型中,包括表、索引、觸發(fā)器、視圖等。
2.2 關(guān)系數(shù)據(jù)庫的本體構(gòu)建規(guī)則
利用Power Designer的逆向工程特性,可以直接得到關(guān)系數(shù)據(jù)庫的邏輯數(shù)據(jù)模型和概念數(shù)據(jù)模型,從而可以得到基本的E-R圖。根據(jù)我們定義的規(guī)則[6],將我們通過逆向工程得到的概念數(shù)據(jù)模型中的各種關(guān)系模式可以映射到本體,得到OWL本體概念或關(guān)系。
關(guān)系數(shù)據(jù)模型中的規(guī)范關(guān)系,我們定義的主要映射規(guī)則如下。
R1:如果數(shù)據(jù)庫中有表T1,那么,我們將T1映射到OWL本體模型中,且本體模型中得到的映射類具有相同的名字。T1中的描述轉(zhuǎn)換為同名類的中說明。
R2:如果數(shù)據(jù)庫中有兩個表T1,T2,且兩表之間具有“父子”關(guān)系(T2為T1孩子),那么,我們則將表T1、T2分別映射到OWL本體模型中,分別為作為父類和子類。
R3:如果數(shù)據(jù)庫中表T1存在字段A,且該字段不是外鍵,那么我們將該字段映射到OWL本體模型中,作為同名數(shù)據(jù)類型的屬性。其中,屬性的定義域和值域分別為數(shù)據(jù)庫中表T1對應(yīng)的類、字段A的數(shù)據(jù)類型,同時,字段A的描述對應(yīng)的映射為屬性的說明。
R4:如果數(shù)據(jù)庫表T1存在字段A,且字段A為非空、非外鍵,那么對應(yīng)于該字段所的數(shù)據(jù)類型的屬性,其基數(shù)(cardinality)限制的值是“1”。
如果A的值可以為空,那么對應(yīng)于該字段所的數(shù)據(jù)類型的屬性,其基數(shù)限制(MaxCardinality)的值是“1”。
R5:如果數(shù)據(jù)庫表T1存在字段A不可以為空,且A為外鍵,那么對于該字段所對應(yīng)對象,其屬性的基數(shù)限制(MinCardinality)的值是“1”。
如果字段A的取值可以為空,那么對于該字段所對應(yīng)的對象,其屬性的基數(shù)限制(MinCardinality)的值是“0”。
R6:如果關(guān)系數(shù)據(jù)庫中有表T1,該表的主鍵為Aa 與Ab,且字段Aa與Ab 均為外鍵,Aa 與Ab分別是表Ta與Tb的主鍵,且該表僅包含主鍵字段,那么把字段Aa與Bb映射為同名對象的屬性,同時存在逆向的(inverse-of)關(guān)系。
2.3 關(guān)系數(shù)據(jù)庫的本體構(gòu)建方法
1) 搜集現(xiàn)有的企業(yè)關(guān)系數(shù)據(jù)庫,或根據(jù)企業(yè)的需求關(guān)系創(chuàng)建自己的關(guān)系數(shù)據(jù)庫。由于該數(shù)據(jù)庫已經(jīng)包含了企業(yè)中的各種關(guān)系和行業(yè)的信息,對于缺乏領(lǐng)域?qū)<一蛘邔<覅⑴c不足這樣的問題,可以在一定程度上得到解決。
2) 使用Power Designer的逆向功能。從數(shù)據(jù)庫出發(fā),我們將數(shù)據(jù)庫中的索引、表、視圖等各種關(guān)于數(shù)據(jù)庫結(jié)構(gòu)的信息,通過使用Power Designer的逆向功能,生成物理數(shù)據(jù)模型(PDM)。通過分析物理數(shù)據(jù)模型,我們可以得出各個表的主鍵、外鍵關(guān)系,同時,刪除無用的狀態(tài)屬性、冗余表以及擴展屬性等,然后對實體表進行合并,獲得概念模型,最終獲得E-R模型。
3) 定義概念模型到OWL模型的轉(zhuǎn)換規(guī)則。根據(jù)已定義的轉(zhuǎn)換規(guī)則,我們可以將概念模型中的各個表及其數(shù)據(jù)類型、表-表的關(guān)系、屬性等模式轉(zhuǎn)換為OWL本體中相對應(yīng)的模式。
4) 有效性的檢驗。當(dāng)用OWL語言描述領(lǐng)域本體模型以后,我們需要評估和檢驗來判斷創(chuàng)建的本體模型的有效性。
方法的流程圖如圖2所示。
3 基于本體的組織業(yè)務(wù)優(yōu)化方法
從企業(yè)的關(guān)系數(shù)據(jù)庫出發(fā),由概念模型到本體模型轉(zhuǎn)化,建立領(lǐng)域本體,實現(xiàn)領(lǐng)域內(nèi)知識概念或術(shù)語的一致性描述,得到的領(lǐng)域本體模型,該本體模型其反映了企業(yè)的組織關(guān)系及業(yè)務(wù)流程可視化的本體模型,可以直觀的反映組織業(yè)務(wù)流程,有利于刪除、簡化、重排、合并組織業(yè)務(wù),但對于結(jié)構(gòu)龐大、處理過程復(fù)雜的系統(tǒng),很難全部人工來實現(xiàn)流程的優(yōu)化。我們從本體出發(fā),采用U/C矩陣研究組織業(yè)務(wù)的優(yōu)化[7]。
3.1U/C矩陣
對于過程和數(shù)據(jù)之間的關(guān)系,我們可以用U/C矩陣來表達,其中,矩陣的行表示數(shù)據(jù)類,矩陣的列表示功能。在矩陣中,我們用大寫字母U(User)來表示數(shù)據(jù)的使用,字母C(Cerate)來表示數(shù)據(jù)的產(chǎn)生。U/C矩陣作為一種重要的工具,在管理信息系統(tǒng)(MIS)開發(fā)的系統(tǒng)分析階段得到了重要的應(yīng)用。U/C矩陣的形式是一張表格,我們可以存在數(shù)據(jù)庫中,這樣我們可以通過對數(shù)據(jù)庫的操作,來對其進行操作,分析其正確性。同時,可以利用分析的結(jié)果,對U/C矩陣進行子系統(tǒng)的劃分。
3.2 利用U/C矩陣研究組織業(yè)務(wù)優(yōu)化
1) 根據(jù)企業(yè)信息系統(tǒng)的業(yè)務(wù)流程,繪制業(yè)務(wù)流程圖,明確業(yè)務(wù)數(shù)據(jù)流向。同時,根據(jù)數(shù)據(jù)流向,確定關(guān)系數(shù)據(jù)庫E-R模型中各個實體之間的數(shù)據(jù)流向,明確時序。
2) 由E-R模型到本體模型的轉(zhuǎn)換。
3) 結(jié)合數(shù)據(jù)流程圖和數(shù)據(jù)流圖,建立U/C表,檢驗U/C矩陣的正確性。我們可以從三個方面來檢驗U/C矩陣的正確性:完備性、一致性、無冗余性。通過這三個方面的檢驗,我們可以整理U/C矩陣,對矩陣中行或列的進行移動,使字母“C”盡可能的靠近矩陣對角線,這樣我們得到一個新的矩陣排列。
4) 根據(jù)得到的新U/C矩陣,劃分子系統(tǒng)。
5) 生成通過U/C矩陣優(yōu)化后的模型,生成新的本體。
3.3結(jié)論
1) 對根據(jù)企業(yè)流程所建立的U/C矩陣,可以對矩陣進行正確性檢驗和分析。通過檢驗和分析,其前段調(diào)查工作和分析工作中各種疏漏和冗余,可以及時的被我們發(fā)現(xiàn),進而分析出新的改革方案。
2) 通過對U/C矩陣的求解過程,獲得子系統(tǒng)的劃分。這樣,可以降低業(yè)務(wù)流程的耦合性。
3) 子系統(tǒng)劃分完成后,由于各個子系統(tǒng)之間的數(shù)據(jù)產(chǎn)生和使用相對獨立,我們可以根據(jù)這個劃分結(jié)果,對目前組織機構(gòu)的設(shè)置、業(yè)務(wù)流程的規(guī)劃進行評價。這樣,我們可以改進組織機構(gòu)設(shè)置、完善精簡業(yè)務(wù)流程,進而提高企業(yè)的管理質(zhì)量,降低企業(yè)成本。
4 結(jié)束語
本文分析了結(jié)構(gòu)化數(shù)據(jù)源到本體模型的對應(yīng)關(guān)系,這種形式化對應(yīng)關(guān)系包括數(shù)據(jù)庫的結(jié)構(gòu)模型與本體概念框架模型之間的轉(zhuǎn)換關(guān)系。給出了一個從概念數(shù)據(jù)模型到OWL本體模型的轉(zhuǎn)換規(guī)則,給出了一種基于結(jié)構(gòu)化數(shù)據(jù)源的本體建模方法。最后,利用U/C矩陣的相關(guān)特性,研究了組織業(yè)務(wù)優(yōu)化的方法。
本文僅對基于結(jié)構(gòu)化數(shù)據(jù)源的本體建模問題進行了研究,同時對利用U/C矩陣來進行組織業(yè)務(wù)優(yōu)化的問題進行了探索,設(shè)計完善的轉(zhuǎn)換規(guī)則和更好組織業(yè)務(wù)優(yōu)化方法等工作需要進一步研究。
參考文獻:
[1] Hamer M, Champy J.Reengineering the Corporation: A Manifesto for Business Revolution[M].New York:Nicholas Brealey,1993:113-115.
[2] CHANG K C,HE Bin LI Cheng-kai,et al.Structured databases on the Web:observations and implications [J].ACM SIGMOD Record,2004,33(3):61-70.
[3] 車成逸,馬宗民,焦曉龍.基于結(jié)構(gòu)化信息源的本體構(gòu)建方法綜述[J].計算機應(yīng)用研究,2012(7).
[4] 余霞,劉強,葉丹.基于規(guī)則的關(guān)系數(shù)據(jù)庫到本體的轉(zhuǎn)換方法[J].計算機應(yīng)用研究,2008,25(3):767-770,785.
[5] 顧平.數(shù)據(jù)庫設(shè)計工具Power Designer的研究與實踐[J].計算機應(yīng)用與軟件,2004,11(12).
[6] 杜冬霞,謝紅薇,劉暢.基于關(guān)系數(shù)據(jù)庫的應(yīng)急預(yù)案領(lǐng)域本體構(gòu)建研究[J].微計算機應(yīng)用,2010,31(1).
[7] 張建.U/C矩陣在信息系統(tǒng)功能劃分中的優(yōu)化與研究[J].貴州大學(xué)學(xué)報,2008,25(1).