劉超 耿凡凡
(1.安徽經(jīng)濟管理學(xué)院信息技術(shù)中心,合肥 230059;2.安徽農(nóng)業(yè)大學(xué)信息與計算機學(xué)院,合肥 230036)
農(nóng)產(chǎn)品供應(yīng)鏈?zhǔn)侵敢赞r(nóng)產(chǎn)品為對象,圍繞農(nóng)產(chǎn)品核心企業(yè),通過信息流、物流和資金流實現(xiàn)農(nóng)產(chǎn)品的生產(chǎn)、加工和銷售,從而將農(nóng)戶和農(nóng)業(yè)生產(chǎn)基地、農(nóng)產(chǎn)品收購商、加工商、零售商、消費者連成一體的功能網(wǎng)鏈[1]。我國目前農(nóng)業(yè)信息化水平滯后,整個農(nóng)產(chǎn)品供應(yīng)鏈的信息和知識共享程度不高,供應(yīng)鏈中的部分節(jié)點出現(xiàn)“牛鞭效應(yīng)”現(xiàn)象,對農(nóng)產(chǎn)品的計劃、生產(chǎn)與銷售造成嚴(yán)重影響。對農(nóng)產(chǎn)品供應(yīng)鏈知識進(jìn)行有效地表示并搭建知識共享平臺,可以有效地解決農(nóng)產(chǎn)品供應(yīng)鏈的信息和知識共享問題。
本次研究主要展開基于本體的農(nóng)產(chǎn)品供應(yīng)鏈領(lǐng)域知識表示和建模工作。首先,搜集整理農(nóng)產(chǎn)品供應(yīng)鏈領(lǐng)域相關(guān)知識,確定農(nóng)產(chǎn)品供應(yīng)鏈領(lǐng)域內(nèi)概念及概念間關(guān)系,搭建農(nóng)產(chǎn)品供應(yīng)鏈領(lǐng)域本體框架;其次,通過本體編輯工具Protégé 4.3定義農(nóng)產(chǎn)品供應(yīng)鏈本體的概念、屬性、實例和公理,并基于OWL2語言生成形式化的農(nóng)產(chǎn)品供應(yīng)鏈本體,在語義和知識層面上表示農(nóng)產(chǎn)品供應(yīng)鏈領(lǐng)域知識;最后,通過描述邏輯理論和相似度算法對本體進(jìn)行推理、檢測、評價和優(yōu)化,從而保證所構(gòu)建農(nóng)產(chǎn)品供應(yīng)鏈領(lǐng)域本體的質(zhì)量。農(nóng)產(chǎn)品供應(yīng)鏈本體的構(gòu)建是農(nóng)產(chǎn)品供應(yīng)鏈領(lǐng)域知識的語義表示,其意義是農(nóng)產(chǎn)品供應(yīng)鏈領(lǐng)域知識的共享和復(fù)用。
本體通過對概念、術(shù)語及其相互關(guān)系的規(guī)范化描述,勾畫出某一領(lǐng)域的基本知識體系,用于很好地解決知識表示、知識組織以及知識共享等問題[2]。按照聯(lián)合國糧農(nóng)組織(FAO)的定義,農(nóng)業(yè)本體是一個包含農(nóng)業(yè)術(shù)語及其定義以及術(shù)語間規(guī)范關(guān)系說明的體系[3]。構(gòu)建概念清晰、邏輯結(jié)構(gòu)合理的農(nóng)業(yè)領(lǐng)域本體,有助于語義網(wǎng)站對多種語言的農(nóng)業(yè)資源進(jìn)行描述并把它們聯(lián)系起來,增加其功能性與相關(guān)性。
本次研究首先通過搜集整理農(nóng)產(chǎn)品供應(yīng)鏈領(lǐng)域知識,梳理農(nóng)產(chǎn)品供應(yīng)鏈領(lǐng)域中的概念及概念間的關(guān)系;然后通過本體編輯工具 Protégé 4.3[4],利用本體形式化語言O(shè)WL2構(gòu)建農(nóng)產(chǎn)品供應(yīng)鏈本體,并基于描述邏輯的方法對形式化的農(nóng)產(chǎn)品供應(yīng)鏈本體進(jìn)行推理檢測;最后評價構(gòu)建好的農(nóng)產(chǎn)品供應(yīng)鏈本體,并對其進(jìn)行優(yōu)化。
從文獻(xiàn)、書刊、網(wǎng)絡(luò)媒體等相關(guān)途徑獲取農(nóng)產(chǎn)品供應(yīng)鏈知識,然后梳理農(nóng)產(chǎn)品供應(yīng)鏈領(lǐng)域中所涵蓋的詞匯、術(shù)語等內(nèi)容,從而確定領(lǐng)域內(nèi)共同認(rèn)可的概念,并詳細(xì)整理出概念間分類和非分類關(guān)系以及概念的屬性、相應(yīng)的實例等,最終完成農(nóng)產(chǎn)品供應(yīng)鏈知識整理,搭建農(nóng)產(chǎn)品供應(yīng)鏈本體框架,繼而定義農(nóng)產(chǎn)品供應(yīng)鏈本體的類、屬性、實例、公理等。
我國農(nóng)產(chǎn)品供應(yīng)鏈分類繁多,目前多數(shù)是通過供應(yīng)鏈的復(fù)雜度、供應(yīng)鏈節(jié)點企業(yè)集中程度、供應(yīng)鏈的可靠度和優(yōu)化目標(biāo)等方面對其分類。例如供應(yīng)鏈復(fù)雜度分類中的線性農(nóng)業(yè)供應(yīng)鏈,各節(jié)點間只通過上下游的節(jié)點參與到鏈中,彼此之間除了相鄰節(jié)點外沒有其他聯(lián)系,形式比較單一。這樣分類概念并不明確,不適合本體概念的分類體系。在此以農(nóng)產(chǎn)品流通環(huán)節(jié)為分類標(biāo)準(zhǔn),對農(nóng)產(chǎn)品供應(yīng)鏈概念進(jìn)行分類,將農(nóng)產(chǎn)品供應(yīng)鏈知識分為農(nóng)產(chǎn)品種類、產(chǎn)前供應(yīng)環(huán)節(jié)、消費環(huán)節(jié)、產(chǎn)中生產(chǎn)環(huán)節(jié)、產(chǎn)后加工環(huán)節(jié)和銷售流通環(huán)節(jié)。
本體中類被用來表示一些擁有某一共同特征個體的集合,通過定義父子類、兄弟類、等價類、互斥類等關(guān)系完善概念分類關(guān)系,以保證領(lǐng)域概念知識的完整性和準(zhǔn)確性。
農(nóng)產(chǎn)品供應(yīng)鏈本體將農(nóng)產(chǎn)品產(chǎn)前供應(yīng)環(huán)節(jié)、產(chǎn)中生產(chǎn)環(huán)節(jié)、產(chǎn)后加工環(huán)節(jié)、銷售流通環(huán)節(jié)、消費環(huán)節(jié)等定義為頂層類,再分別設(shè)置子類或?qū)嵗?,如流通渠道與產(chǎn)地批發(fā)市場為父子類,產(chǎn)地批發(fā)市場與銷地批發(fā)市場為兄弟類。圖1所示為農(nóng)產(chǎn)品供應(yīng)鏈本體類示例。
圖1 農(nóng)產(chǎn)品供應(yīng)鏈本體類示例
本體屬性包括對象屬性和數(shù)據(jù)屬性。其中對象屬性是關(guān)聯(lián)2個實例的紐帶,表示概念與概念之間的非分類關(guān)系,具有反逆性、對稱性、傳遞性等約束條件,它的定義域和值域分別來自確定關(guān)聯(lián)的2個類。本課題定義農(nóng)產(chǎn)品供應(yīng)鏈產(chǎn)前供應(yīng)環(huán)節(jié)、產(chǎn)中生產(chǎn)環(huán)節(jié)、產(chǎn)后加工環(huán)節(jié)、銷售流通環(huán)節(jié)、消費環(huán)節(jié)等為關(guān)聯(lián)的類,即對象屬性設(shè)置為“is_part_of”“flow_to”“produce_from”等,其中“product_hierarchy”屬性設(shè)置有子屬性。
數(shù)據(jù)屬性是用于描述實例本身的特性,用基本數(shù)據(jù)類型來表示。它的定義域是用于限定該屬性為某個類特有的數(shù)據(jù)屬性,而值域則包括布爾型、浮點型、字符型等數(shù)據(jù)類型。本次研究中數(shù)據(jù)屬性定義為“funding”“l(fā)evel”“information”等屬性。圖 2 所示為農(nóng)產(chǎn)品供應(yīng)鏈本體對象屬性和數(shù)據(jù)屬性。
圖2 農(nóng)產(chǎn)品供應(yīng)鏈本體對象屬性和數(shù)據(jù)屬性
本體實例是類的組成部分,具有原子性這一特性。創(chuàng)建實例需要充分列舉出各子類所包含的成員,并分別設(shè)置其對象屬性和數(shù)據(jù)屬性,標(biāo)記每個實例的具體特性以及實例與實例之間存在的客觀聯(lián)系。本體定義中需要清楚區(qū)分領(lǐng)域知識的實例(instanceof)關(guān)系和子類(subclassof)關(guān)系。
農(nóng)產(chǎn)品供應(yīng)鏈本體實例主要集中于農(nóng)產(chǎn)品種類、銷售流通環(huán)節(jié)和消費環(huán)節(jié)這幾個概念中。本課題定義肉牛、雞蛋等作為農(nóng)產(chǎn)品種類的實例,以某一農(nóng)產(chǎn)品為實例,描述該農(nóng)產(chǎn)品在整個農(nóng)產(chǎn)品供應(yīng)鏈中經(jīng)歷的所有環(huán)節(jié);在消費環(huán)節(jié)中物流配送服務(wù)商這一概念則將順豐快遞、天天快遞等公司作為實例。
公理規(guī)則闡述了概念和概念間的關(guān)系,使得本體邏輯性更加嚴(yán)謹(jǐn),便于本體邏輯沖突檢測及知識推理。創(chuàng)建公理規(guī)則的目的是加強本體形式化語言的表達(dá)能力,擴展本體知識表示水平,增強概念的“語義”性。本體公理主要包括類的公理、屬性公理、實例公理、約束公理、自定義規(guī)則等。
類的公理中“disjointclasses”“subclassof”“equivalentclasses”分別表示互斥類、父子類、等價類,完善了概念之間的分類關(guān)系。本體在構(gòu)建類的同時定義類的三大公理,如圖3所示,物流配送服務(wù)商的互斥類為消費者服務(wù)部門等,等價類為第三方物流企業(yè)等中間商,父類為消費環(huán)節(jié)等。屬性公理包括屬性定義域值域的限定以及對稱性、傳遞性等約束。如農(nóng)產(chǎn)品供應(yīng)鏈本體屬性“produced_from”定義域為農(nóng)產(chǎn)品,值域為產(chǎn)中生產(chǎn)環(huán)節(jié);屬性“produce”定義域為產(chǎn)中生產(chǎn)環(huán)節(jié),值域為農(nóng)產(chǎn)品,且與“produced_from”互為逆屬性。實例公理則指本體實例的聲明,如相同實例、不同實例等約束限制。
約束公理分為值約束和基數(shù)約束,主要用來表示定義類的充要條件。值約束包括“all values from(?)”“some values from(?)”,用于限制屬性的值域。如果屬性的形容詞限制是“只有”或“只存在”,則添加“all values from”即“only”約束,若屬性的形容詞限制是有些或存在,則添加“some”約束?;鶖?shù)約束包括“max cardinality(≤)”“min cardinality(≥)”“exact cardinality(=)”,用于限制屬性取值的個數(shù)。本體公理既可以通過圖形化添加約束關(guān)系來定義,也可以通過約束規(guī)則的描述來定義。
圖3 農(nóng)產(chǎn)品供應(yīng)鏈本體公理
目前,領(lǐng)域本體以手工構(gòu)建為主,存在工作量大、過程繁復(fù)等問題,為此需要本體推理來檢測邏輯沖突以及推理隱含知識。本體推理是以描述邏輯為基礎(chǔ),運用推理規(guī)則檢測本體的知識框架和形式化表達(dá),確定是否存在不一致性等沖突,并能基于提供的領(lǐng)域知識推理得到其中蘊含的信息。本文選擇FaCT++推理機對農(nóng)產(chǎn)品供應(yīng)鏈本體進(jìn)行邏輯推理檢測[5]。若檢測出存在邏輯或?qū)嵗龥_突,則根據(jù)提示進(jìn)行改正直至不再提示錯誤。
經(jīng)過FaCT++推理機的運行,農(nóng)產(chǎn)品供應(yīng)鏈本體中存在不一致性,推理機對本體中不一致性給出錯誤提示。定義物流配送服務(wù)商為消費環(huán)節(jié)的子類,其等價類是第三方物流等中間商,而第三方物流等中間商卻被錯誤定義為消費渠道的子類,因此,農(nóng)產(chǎn)品供應(yīng)鏈本體發(fā)生了邏輯沖突。通過推理機的運行及修改,將第三方物流等中間商重新定義為流通渠道的子類,繼續(xù)對農(nóng)產(chǎn)品供應(yīng)鏈本體進(jìn)行推理檢測,直至最終結(jié)果顯示出農(nóng)產(chǎn)品供應(yīng)鏈本體沒有邏輯沖突和實例沖突。
本體在特定領(lǐng)域或特定環(huán)境的性能和適用性,是影響本體是否能在語義網(wǎng)中被廣泛應(yīng)用的重要因素,而單純靠人類手工構(gòu)建的本體,無法保證領(lǐng)域本體的嚴(yán)謹(jǐn)性和科學(xué)性。因此,針對領(lǐng)域本體構(gòu)建過程中可能出現(xiàn)的缺乏科學(xué)依據(jù)、構(gòu)建過于簡單、脫離實際等問題,需要對領(lǐng)域本體進(jìn)行評價。領(lǐng)域本體的結(jié)構(gòu)相當(dāng)復(fù)雜,本體評價主要集中在概念評價、概念間關(guān)系評價上。
概念評價主要是針對概念完整性及概念準(zhǔn)確性進(jìn)行評價。通過計算本體概念的準(zhǔn)確率和召回率完成對農(nóng)產(chǎn)品供應(yīng)鏈本體概念的有效性評價,其評價結(jié)果如表1所示。
表1 農(nóng)產(chǎn)品供應(yīng)鏈本體概念評價結(jié)果
概念間關(guān)系評價主要包含關(guān)系準(zhǔn)確性評價、關(guān)系一致性評價和關(guān)系簡潔性評價。本文評價概念間關(guān)系采用的算法是語義相似度算法。該方法首先利用語義相似度計算公式計算概念的相似度:
式中,D(c1,c2)表示兩概念間的公共父節(jié)點深度,L(c1,c2)表示兩概念間的路徑長度。根據(jù)相似度值與所設(shè)閾值ε的結(jié)果進(jìn)行比較:S(c1,c2)≥ε,表示符合相應(yīng)性質(zhì);S(c1,c2)<ε,表示不滿足,并指出錯誤類型。判斷所構(gòu)建本體概念間關(guān)系是否滿足一致性、準(zhǔn)確性、簡潔性,從而完成對農(nóng)產(chǎn)品供應(yīng)鏈本體概念間關(guān)系的評價,并得出評價結(jié)果(表2)。
表2 農(nóng)產(chǎn)品供應(yīng)鏈本體關(guān)系評價一覽表
由表2看出,關(guān)系一致性檢測結(jié)果顯示為0例錯誤,關(guān)系準(zhǔn)確性檢測結(jié)果顯示為2例錯誤,關(guān)系簡潔性檢測結(jié)果顯示為1例錯誤,據(jù)此對提示的錯誤進(jìn)行了修正。
根據(jù)本體概念評價及關(guān)系評價所得結(jié)果進(jìn)行綜合分析,可判定農(nóng)產(chǎn)品供應(yīng)鏈領(lǐng)域本體建模效果良好,領(lǐng)域知識表示達(dá)到原有目標(biāo),可以實現(xiàn)知識的共享和重用。
本體作為知識表示的基本工具,基于其知識共享、復(fù)用、服務(wù)等優(yōu)勢在語義網(wǎng)、知識工程等領(lǐng)域發(fā)揮著重要作用。通過整理農(nóng)產(chǎn)品供應(yīng)鏈領(lǐng)域知識信息,探討農(nóng)產(chǎn)品供應(yīng)鏈本體構(gòu)建過程,完成農(nóng)產(chǎn)品供應(yīng)鏈知識的表示和推理,實現(xiàn)了農(nóng)產(chǎn)品供應(yīng)鏈領(lǐng)域知識的共享和復(fù)用。然而,手工構(gòu)建領(lǐng)域本體費力耗時、易出現(xiàn)傾向性錯誤,因此下一步將嘗試?yán)脵C器學(xué)習(xí)、自然語言處理等技術(shù)自動或半自動構(gòu)建本體,以提高知識的表示和推理準(zhǔn)確性和實效性,更好地開展農(nóng)產(chǎn)品供應(yīng)鏈知識服務(wù)。
[1]薛麗柯,姚雨辰,姜方桃.我國農(nóng)產(chǎn)品供應(yīng)鏈存在的問題及對策[J].當(dāng)代經(jīng)濟,2014(1):76-77.
[2]Gruber T.R.Atranslation Approach to Portable Ontology Specifications[G]//Technical Report,KSL 92-71.Stanford:Knowledge System Laboratory,1993.
[3]錢平,鄭業(yè)魯.農(nóng)業(yè)本體論研究與應(yīng)用[M].北京:中國農(nóng)業(yè)科學(xué)技術(shù)出版社,2006:50-62.
[4]Knublauch H,F(xiàn)ergerson R W,Noy N F,et al.The Protégé OWL Plugin:An Open Development Environment for Semantic Web Applications[G].Lecture Notes in Computer Science,2004:229-243.
[5]Tsarkov D,Horrocks I.FaCT++Description Logic Reasoner:System Description[G].Lecture Notes in Computer Science,2006:292-297.