亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于本體的業(yè)務源模型知識庫構建及應用研究

        2018-04-18 11:07:39徐展琦趙國強
        計算機應用與軟件 2018年2期
        關鍵詞:語義概念模型

        李 智 徐展琦 丁 喆 趙國強

        (西安電子科技大學綜合業(yè)務網(wǎng)理論及關鍵技術國家重點實驗室 陜西 西安 710071)

        0 引 言

        隨著互聯(lián)網(wǎng)科技與大數(shù)據(jù)技術席卷全球,新型網(wǎng)絡應用不斷興起,網(wǎng)絡流量呈爆炸式增長,網(wǎng)絡中的流量行為趨向復雜化、多元化,亟需加深對網(wǎng)絡流量行為模式的認知。業(yè)務源模型通過對真實網(wǎng)絡流量的模擬,刻畫實際流量的突出特性,是一種能夠?qū)嶋H網(wǎng)絡流量進行數(shù)學分析研究而設計出的數(shù)學模型。其對網(wǎng)絡的設計規(guī)劃、網(wǎng)絡性能評價、流量預測及準入控制等都有重要的研究意義和作用。傳統(tǒng)業(yè)務源描述方法通過建立諸如泊松模型、時序模型和小波模型等不同的數(shù)學模型,描述業(yè)務源的流量特征[1]。已有業(yè)務源模型相關研究主要是針對某類具體問題如流量預測問題,建立特定業(yè)務源模型并提出具體算法以解決相應問題[2],缺乏從宏觀角度對業(yè)務源模型進行整體描述的研究,難以形成一個相對完整的知識庫,不利于其知識共享與重用。

        知識表示將知識以計算機可理解的方式存儲并使用,是形成相應知識庫的前提,傳統(tǒng)的知識表示方法主要包括框架表示法、一階謂詞邏輯表示法和產(chǎn)生式表示法等。此類方法很難表示復雜知識,改進的知識表示方法主要有語義網(wǎng)表示法和本體表示法[3]。其中本體表示法可用于描述對象的深層語義,形成的知識具有清晰的概念層次結構和可視化的展示界面,并支持語義層面的邏輯推理,能有效提高知識重用效率。本體表示法已成功被應用于多個領域,國外已實現(xiàn)并投入使用的大型本體有:Cyc[4]、WordNet[5]和UMLS[6]等。Cyc的目標是建立一個完整的人類常識知識庫;WordNet是一種基于認知語言學的英語詞典,能夠按照單詞語義將其組成一個“單詞的網(wǎng)絡”以支持自動的文本分析和其他人工智能應用;UMLS利用本體技術實現(xiàn)對生物醫(yī)學領域詞匯的匯編。鐘秀琴等[7]國內(nèi)研究者研究了基于本體的幾何學知識獲取,為幾何學專家系統(tǒng)、信息檢索等領域提供智能基礎;文獻[8]提出基于領域本體的文獻標注算法,通過融合站點間的數(shù)據(jù),構建游戲領域本體;史云放等[9]利用本體將語義特征引入網(wǎng)絡電子學習資源庫模型構建中,提高資源庫檢索的查全率和查準率。文獻[10]針對當前工業(yè)消防領域存在大量異構信息的問題,采用本體技術建立一種標準化格式的異構信息知識庫。目前,鮮有學者將本體應用于網(wǎng)絡業(yè)務源模型的知識表示與建模。

        本文從知識表示的角度出發(fā),將本體應用于業(yè)務源模型領域知識的形式化描述,構建了業(yè)務源模型本體TSMO(Traffic Source Models Ontology)。首先,本文提取并分析了業(yè)務源模型領域的核心概念及相關屬性,基于OWL構建TSMO;其次,以TSMO為數(shù)據(jù)源,利用本體查詢語言SPARQL(Simple Protocol and RDF Query Language)和本體推理機,并同時結合具體應用場景,對所建本體進行各類知識檢索與推理,驗證所建本體的實用性;最后,在所建本體基礎上設計開發(fā)了業(yè)務員模型智能信息檢索系統(tǒng),在驗證所建本體的合理性和通用性的同時,為研究者和用戶提供了一個業(yè)務源模型領域知識服務語義平臺。

        1 業(yè)務源模型本體構建

        1.1 本體知識概述

        本體是共享概念的明確形式化規(guī)范說明[11],通過規(guī)范化描述概念、屬性及其相互關系,形成某一領域的基本知識體系,建立領域內(nèi)的語義基礎,為某個領域或領域間的實際應用提供便利。從知識工程的角度來說,本文設計的業(yè)務源模型領域本體指的是網(wǎng)絡業(yè)務源模型的本體知識描述,包含業(yè)務源模型領域中的術語、術語之間的關系、屬性及規(guī)則等。

        為了將所建本體以計算機可理解的方式存儲,提升知識庫的可用性,需采用資源描述框架RDF(Resource Description Language)[12]與OWL[13]相結合的方式對其進行形式化描述。RDF是一種聲明語言,在應用中支持基于推理的知識發(fā)現(xiàn)而不是全文匹配檢索。例如,短相關模型具有對象屬性目標節(jié)點且泊松模型是其子類,上述知識可用如下RDF語言形式化描述:

        ShortCorrelationModel

        Destination Node

        Poisson Model

        OWL是W3C推薦的本體描述語言標準,擁有更多機制來描述對象和表達語義,支持RDF語法,添加了更多用于描述屬性和概念的詞匯。如類型之間的不相交性(Disjointwith)和基數(shù)(Cardinality)等,同時使用描述邏輯(Description Logic)增強其推理能力。

        為了深化用戶對領域知識的認知,本文利用RDF三元組將知識以直觀的形式展現(xiàn)給用戶。RDF三元組由資源、屬性及屬性值構成,可用圖形方式展示。圖1為RDF三元組的一個示例,它表示ShortCorrelationModel是TrafficSourceModel的一個子類且與短相關模型等價。

        圖1 RDF三元組示例

        根據(jù)以上定義及分析,本文使用Protégé 4.2[14]作為本體編輯工具,主要作用在于描述目標領域內(nèi)概念、屬性和它們之間的關系。Protégé 4.2不僅支持本體開發(fā),還提供可擴展的應用程序接口API,用于訪問并獲取OWL所描述的本體信息,多用于本體查詢與檢索。Protégé 4.2的文件輸出格式可以定制,可以將構建的本體轉(zhuǎn)換成以RDF和OWL為描述語言的文件表示格式。

        1.2 本體構建方法

        目前,大多數(shù)本體編輯采用手工方式,各個本體開發(fā)組開發(fā)原則、設計標準和定義方法都有區(qū)別。比較常用的本體構建工程思想有骨架法、TOVE企業(yè)建模法、Methontology方法、IDEF-5方法和七步法[15]等。本文通過分析傳統(tǒng)的本體構建七步法形成如圖2所示的改進的七步法構建TSMO。

        圖2 改進的本體開發(fā)七步法

        1.3 本體評估

        本體評估[16]是本體開發(fā)過程的重要環(huán)節(jié),主要是指運用科學的方法,遵循統(tǒng)一的標準和特定的指標體系,對本體的建設理念、應用需求、概念組織、功能設計和實際運行情況等進行綜合測評的過程和方法。為了保證業(yè)務源模型本體的構建質(zhì)量,實現(xiàn)對本體的有效管理和維護,本文主要通過本體構建過程的規(guī)范性,實現(xiàn)所建本體的合理性和通用性,具體如下:

        (1) 在抽取構建本體所需的概念和屬性階段,參考業(yè)務源模型領域的統(tǒng)一標準,通過RDF三元組的形式展示領域內(nèi)的相關概念和概念之間的關系,保證概念的一致性和通用性。

        (2) 在使用Protégé構建本體模型階段,采用FaCT++推理機對本體概念和屬性進行一致性和包含性檢測,對本體中的實例進行沖突檢測,確保所建本體模型的一致性和有效性。

        (3) 在本體的應用階段,基于所建本體設計開發(fā)相關語義系統(tǒng)服務平臺,從而進一步驗證本體的可靠性和實用性。

        1.4 業(yè)務源模型本體

        業(yè)務源模型指以網(wǎng)絡流量的重要特性為出發(fā)點,為了刻畫實際流量的突出特性,同時進行數(shù)學上的理論分析研究而設計出的數(shù)學模型。它提供對網(wǎng)絡業(yè)務源特性簡明抽象化的描述,能明確量化表示網(wǎng)絡流量。按照流量時域相關性特點,業(yè)務源模型可分為兩大類:短相關模型和長相關模型,前者產(chǎn)生的流量通常在時域上僅具有短相關性,隨著時間分辨率的降低,網(wǎng)絡流量將趨于一個恒定值,即流量的突發(fā)性得到緩和;后者則在時域上具有長相關性,即自相似特性[17]。也可根據(jù)模型平穩(wěn)性將其分為寬平穩(wěn)流量模型和嚴平穩(wěn)流量模型。

        根據(jù)改進的本體構建七步法,構建TSMO首先要確定復用現(xiàn)有本體的可能性,目前還沒有現(xiàn)成的業(yè)務源模型領域本體。然后需羅列出業(yè)務源模型中的關鍵概念,這些關鍵概念取自業(yè)務源模型產(chǎn)生、模擬及應用的相關領域。如圖3所示,為利用RDF三元組構建的業(yè)務源模型類結構樹,由于篇幅限制,這里只列出了其中的一部分類,通過樹型結構直觀顯示它們之間的繼承關系。根據(jù)本體的可擴展性,其他的類可以方便地添加到已有的類結構樹和已建本體中。Protégé 4.2中的Classes標簽用于創(chuàng)建類。

        圖3 部分業(yè)務源模型類結構樹

        Protégé 4.2工具中的Object Properties標簽用于創(chuàng)建對象屬性,Data Properties標簽用于創(chuàng)建數(shù)據(jù)屬性。圖4利用RDF三元組顯示了業(yè)務源模型領域的部分屬性結構。

        圖4 部分屬性結構圖

        不同的屬性約束描述屬性的不同方面,如值類型(String、Number、Boolean及Enumerated等)、允許的取值范圍和值基準等。表1列出了TSMO中的部分屬性及相應的屬性約束。

        表1 TSMO部分屬性及屬性約束

        最后使用Protégé 4.2的Individuals標簽即可添加具體的實例并賦予對應的屬性值。通過上述步驟,TSMO初步構建完成,利用Protégé 4.2的OWLViz插件可自動生成如圖5所示的本體結構圖。鑒于篇幅,圖中只顯示了TSMO的上層部分。

        圖5 TSMO本體結構圖

        圖5中Thing是Protégé 4.2內(nèi)置的公共類,是所有類的超類,TSMO的組成如前所述,在此不再贅述。為了將所建本體以計算機可理解的方式存儲,方便后續(xù)的查詢推理,需使用OWL對TSMO進行形式化描述。

        圖5所示本體生成的部分OWL代碼如下:

        ……

        ……

        圖6給出了各種描述語言的語義描述能力和推理能力,其中OWL在上述兩方面能力均表現(xiàn)較好。

        圖6 描述語言能力

        2 TSMO查詢與推理應用實例

        2.1 TSMO查詢

        傳統(tǒng)基于關鍵字的查詢未考慮關鍵詞間的語義關系,無法真正理解用戶的查詢請求。本體查詢關注資源對象的語義信息,在概念意義層次上實現(xiàn)語義查詢,克服基于關鍵字查詢的弊端,有效提高查準率和查全率。

        SPARQL[18]是一種用于搜索RDF數(shù)據(jù)的數(shù)據(jù)協(xié)議和查詢語言,于2008年成為W3C推薦標準。SPARQL有四種查詢方式SELECT、CONSTRUCT、DESCRIBE和ASK,最常用的是SELECT查詢方式。與結構化查詢語言SQL類似,用于查詢滿足條件的數(shù)據(jù)。RDF可由三元組形式化描述,則SPARQL可通過構建相應的查詢?nèi)M來進行語義查詢。

        進行本體查詢前,需給出TSMO的SPARQL查詢前綴,以識別需要查詢的本體。

        PREFIX

        rdf:

        PREFIX

        owl:

        PREFIX

        xsd:

        PREFIX

        rdfs:

        PREFIX

        uni:http://www.semanticweb.org/dace/ontologies

        /2016/8/TrafficSourceModel#

        uni是TSMO中元素的名字空間,rdf、rdfs、xsd、owl為W3C有關定義,下面給出具體本體查詢示例。

        2.1.1查詢概念的類

        如查詢LongCorrelationModel的子類,圖7為對應SPARQL語句及查詢結果,標簽為SPARQL query的輸入框中為查詢語句,具體如下:

        SELECT ?SubClass WHERE

        {?SubClassrdfs:subClassof uni:LongCorrelationModel}

        圖7 查詢LongCorrelationModel子類

        標簽為SubClass的輸出框中為對應的輸出結果,表明長相關模型具有四種子類。

        在圖7的查詢示例中,查詢語句均在標簽名為SPARQL query的標簽框內(nèi),不再贅述。

        2.1.2查詢類的實例

        如查詢Alpha-BetaOnOffModel的實例,其所包含實例如圖8所示,表明現(xiàn)在Alpha-BetaOnOffModel類中存在兩個實例。圖9為對應SPARQL語句及查詢結果,查詢結果輸出其包含的兩個實例。

        圖8 Alpha-BetaOnOffModel實例

        圖9 Alpha-BetaOnOffModel實例查詢

        上述示例表明,本體能夠?qū)崿F(xiàn)語義層面的查詢,能夠檢索概念之間等價、包含等關系,解決傳統(tǒng)基于關鍵字查詢的不足,實現(xiàn)深度查詢。

        2.2 TSMO推理

        推理指由給定知識獲取隱含知識的過程,本體推理的本質(zhì)就是在語義層面將隱含在顯式定義和聲明中的知識提取出來,相對于傳統(tǒng)推理方法可實現(xiàn)語義層次的知識發(fā)現(xiàn)。本文利用Protégé 4.2中自帶本體推理機實現(xiàn)本體推理。

        本文構建的TSMO采用OWL作為本體描述語言,可采用專用本體推理機,F(xiàn)aCT++[19]基于傳統(tǒng)TabLeaux設計實現(xiàn)不僅具有很高的推理效率而且有突出的檢查效率。故本文使用Protégé 4.2集成的FaCT++作為推理機,基于傳統(tǒng)描述邏輯進行推理。下面給出一個簡單示例,首先定義PoissonModel的幾個實例,然后啟動Reseaoner標簽下的FaCT++推理機實現(xiàn)推理,得到如圖10所示的推理結果。

        圖10 推理結果

        為說明基于業(yè)務源模型本體的實際應用,現(xiàn)假設有如圖11所示的網(wǎng)絡應用場景。當前網(wǎng)絡中存在業(yè)務A、業(yè)務B和業(yè)務C三個業(yè)務,若業(yè)務A和業(yè)務B屬于泊松模型的兩個實例,而業(yè)務C屬于長相關模型的實例。若研究者在研究過程中需查詢網(wǎng)絡中存在哪些短相關模型,并同時查詢這些業(yè)務源模型的相關參數(shù),則可以在Protégé中利用FaCT++推理機對所建本體進行推理,推理機由PoissonModel為ShortCorrelationModel子類的給定知識獲取了PoissonModel的實例也屬于ShortCorrelationModel實例的隱含知識。圖10表示推理結果,網(wǎng)絡管理者或研究人員可以根據(jù)此方便管理管理網(wǎng)絡中業(yè)務,同時查詢業(yè)務參數(shù),為后續(xù)研究提供便利。

        圖11 網(wǎng)絡應用場景

        綜上,本體推理在語義層面可有效實現(xiàn)關聯(lián)數(shù)據(jù)的鏈接發(fā)現(xiàn),具有較高的實用價值。

        3 業(yè)務源模型本體語義應用系統(tǒng)

        基于已構建的業(yè)務源模型領域本體,本文設計開發(fā)了業(yè)務源模型智能信息檢索系統(tǒng),為研究者和使用者提供相關業(yè)務源模型語義服務。業(yè)務源模型智能信息檢索系統(tǒng)采用Java語言開發(fā),Web頁面腳本語言選用JSP,后臺服務器選用Tomcat 7.0,OWL本體文件解析推理使用Jena 2.6.3和內(nèi)嵌推理機FaCT++,XML文件的解析使用DOM4J。系統(tǒng)主要設計實現(xiàn)了本體采集、本體擴展與管理、術語檢索和實例查詢等功能。這些功能實現(xiàn)的關鍵技術主要是使用Jena API對OWL本體文件進行語義解析,獲取本體信息并存入相應的數(shù)據(jù)結構,對查詢關鍵詞進行分詞處理,調(diào)用相關SPARQL語句獲取顯性知識,并結合推理機獲取隱性知識。例如,用戶使用查詢關鍵詞“長相關”的查詢結果如圖12所示。查詢結果表明,由于本體在概念之間引入語義特征,從而能夠檢索出相關隱性知識,同時驗證了所建本體的一致性和通用性。

        圖12 業(yè)務源模型智能信息檢索系統(tǒng)

        4 結 語

        本文從知識表示的角度出發(fā),使用本體作為知識表示工具,探討網(wǎng)絡業(yè)務源模型領域的知識獲取與表示,給出所建本體的概念層次關系和屬性描述。結合新增實例構建一個相對完善的業(yè)務源模型領域本體TSMO,形成業(yè)務源模型的知識庫原型,實現(xiàn)對該領域知識的建模。使用RDF和SPARQL完成對TSMO的子類和實例的語義查詢,結合具體應用場景驗證本體推理的應用價值。最后基于所建本體,設計開發(fā)了業(yè)務源模型智能信息檢索系統(tǒng),為研究者和使用者提供了一個業(yè)務源模型領域知識服務平臺。

        [1] Grimm C, Schlüchtermann G. IP traffic theory and performance[M]. Berlin:Springer, 2008:1-319.

        [2] Park D C. Structure optimization of BiLinear Recurrent Neural Networks and its application to Ethernet network traffic prediction[J]. Information Sciences, 2013, 237(13):18-28.

        [3] 劉建煒, 燕路峰. 知識表示方法比較[J]. 計算機系統(tǒng)應用, 2011, 20(3): 242-246.

        [4] Weikum G, Theobald M. From information to knowledge: harvesting entities and relationships from web sources[C]// Twenty-Ninth ACM Sigmod-Sigact-Sigart Symposium on Principles of Database Systems. ACM, 2010:65-76.

        [5] Navigli R,Ponzetteo S P. BabelNet: The automatic construction and application of a wide coverage multilingual semantic network[J]. Artificial Intelligence, 2012, 193(6): 217-250.

        [6] Aronson A R. Effective mapping of biomedical text to the UMLS Metathesaurus: the MetaMap program[C]// Proceedings of the AMIA Symposium. 2001:17-21.

        [7] 鐘秀琴, 符紅光, 佘莉, 等. 基于本體的幾何學知識獲取及知識表示[J]. 計算機學報, 2010,33(1): 167-174.

        [8] 陳小紅, 陳環(huán)環(huán), 方之家, 等. 基于領域本體的游戲攻略文本標注算法研究與實現(xiàn)[J]. 計算機應用與軟件, 2017, 34(2): 80-86.

        [9] 史云放, 武東英, 劉勝利, 等. 基于本體的網(wǎng)絡攻防博弈知識庫構建方法研究[J]. 計算機應用研究, 2014, 31(11): 3460-3464.

        [10] 張波濤, 代晏, 顧進廣. 面向工業(yè)消防決策的本體構建[J]. 計算機應用與軟件, 2014, 31(3): 31-35.

        [11] Hyde D. Vagueness, logic and ontology[M]. Routledge, 2016.

        [12] 杜方, 陳躍國, 杜小勇. RDF 數(shù)據(jù)查詢處理技術綜述[J]. 軟件學報, 2013, 24(6): 1222-1242.

        [13] W3C. OWL Working Group[EB/OL]. https://www.w3.org/OWL/.

        [14] Horridge M, Knublauch H, Rector A, et al. A Practical Guide To Building OWL Ontologies Using The Protégé-OWL Plugin and CO-ODE Tools[M].Berlin: Springer, 2004:3-19.

        [15] 劉宇松. 本體構建方法和開發(fā)工具研究[J]. 現(xiàn)代情報, 2009, 29(9): 17-24.

        [16] 馬文峰, 杜小勇. 領域本體評價研究[J]. 圖書情報工作, 2006, 50(10): 68-71.

        [17] 張賓, 楊家海, 吳建平. Internet流量模型分析與評述[J]. 軟件學報, 2011, 22(1):115-131.

        [18] Quilitz B, Leser U. Querying distributed RDF data sources with SPARQL[C]//European Semantic Web Conference. Springer Berlin Heidelberg, 2008: 524-538.

        [19] Tsarkov D, Horrocks I. FaCT++ description logic reasoner: System description[C]//International Joint Conference on Automated Reasoning. Springer Berlin Heidelberg, 2006: 292-297.

        猜你喜歡
        語義概念模型
        一半模型
        Birdie Cup Coffee豐盛里概念店
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權M-估計的漸近分布
        語言與語義
        幾樣概念店
        學習集合概念『四步走』
        聚焦集合的概念及應用
        3D打印中的模型分割與打包
        “上”與“下”語義的不對稱性及其認知闡釋
        国产精品久久久久久妇女6080| 亚洲一区二区三区高清在线| 国产97在线 | 日韩| 亚洲乱码日产精品bd| 国产欧美曰韩一区二区三区 | 日韩极品免费在线观看| 一道本久久综合久久鬼色| 凹凸在线无码免费视频| 亚洲久无码中文字幕热| 一区二区免费中文字幕| 亚洲成av人片在线观看| 中文字幕在线播放| 91精品国产91| 一区二区三区在线观看视频精品 | 免费中文熟妇在线影片| 日本视频一区二区这里只有精品 | 69sex久久精品国产麻豆| 91免费播放日韩一区二天天综合福利电影 | 久久夜色精品国产噜噜噜亚洲av| 亚洲第一页视频在线观看| 97碰碰碰人妻无码视频| 国产精品一区二区 尿失禁| 久草视频华人在线观看| 国产免费在线观看不卡| 色橹橹欧美在线观看视频高清| 制服丝袜视频国产一区| 亚洲中文字幕国产剧情| 日韩国产人妻一区二区三区| 久久久久亚洲精品天堂| 中文字幕在线观看乱码一区| 日韩在线精品视频一区| 久久久久人妻一区精品色欧美| 欧美亚洲国产人妖系列视| 男人一插就想射的原因| 亚洲国产成人一区二区精品区| 精品久久综合亚洲伊人| 国产成人高清精品亚洲一区| 五月天亚洲av优女天堂| 亚洲一区二区在线观看网址 | 日韩精品一区二区三区四区五区六| 老岳肥屁熟女四五十路|