高慧星,楊 蕊
(燕山大學(xué)里仁學(xué)院,河北 秦皇島 066000)
在信息時(shí)代的快速發(fā)展進(jìn)程中,各類信息采集與存儲(chǔ)技術(shù)也隨之迅速發(fā)展,由此帶來(lái)數(shù)據(jù)量與類別的增長(zhǎng)。在此情形下,語(yǔ)義網(wǎng)應(yīng)運(yùn)而生,可實(shí)現(xiàn)計(jì)算機(jī)針對(duì)網(wǎng)絡(luò)內(nèi)有用信息的自行整合與處理[1-3]。但在語(yǔ)義網(wǎng)的持續(xù)發(fā)展過(guò)程中,其持續(xù)發(fā)展的語(yǔ)義服務(wù)與逐漸豐富的關(guān)聯(lián)數(shù)據(jù)均會(huì)導(dǎo)致語(yǔ)義網(wǎng)內(nèi)過(guò)多不確定性數(shù)據(jù)的產(chǎn)生,增加了語(yǔ)義網(wǎng)應(yīng)用的難度[4-6]。為解決此問(wèn)題,需針對(duì)語(yǔ)義網(wǎng)內(nèi)不確定性數(shù)據(jù)實(shí)施表示與推理。
貝葉斯網(wǎng)絡(luò)在不確定性知識(shí)推理領(lǐng)域被大量應(yīng)用,它融合了圖論和概率論,能夠?qū)?shù)據(jù)變量間的概率分布及條件獨(dú)立性予以呈現(xiàn),通過(guò)模塊化對(duì)不確定性知識(shí)予以描述,實(shí)現(xiàn)概率推理,成為解決不確定性推理問(wèn)題的關(guān)鍵,適用性強(qiáng)且維護(hù)方便[7,8]。模糊貝葉斯網(wǎng)絡(luò)是在貝葉斯網(wǎng)絡(luò)基礎(chǔ)上的擴(kuò)展,它可實(shí)現(xiàn)模糊化與去模糊化處理持續(xù)變量,提升推理精度[9]。
基于以上分析,本文研究一種面向語(yǔ)義網(wǎng)的本體不確定性推理建模方法,通過(guò)本體建模原語(yǔ)與本體語(yǔ)言的確定,構(gòu)建包含語(yǔ)義網(wǎng)知識(shí)及語(yǔ)義的語(yǔ)義網(wǎng)本體模型,在此基礎(chǔ)上,結(jié)合模糊貝葉斯網(wǎng)絡(luò)與聯(lián)結(jié)樹(shù)信念傳播算法構(gòu)建語(yǔ)義網(wǎng)本體不確定性推理模型,實(shí)現(xiàn)對(duì)語(yǔ)義網(wǎng)本體不確定性的推理,并對(duì)推理結(jié)果實(shí)施模糊化與去模糊化處理,獲得最終的高精度推理結(jié)果,為語(yǔ)義網(wǎng)的高效應(yīng)用奠定基礎(chǔ)。
針對(duì)語(yǔ)義網(wǎng)內(nèi)逐步增長(zhǎng)的不確定性數(shù)據(jù),對(duì)其實(shí)施有效的推理尤為關(guān)鍵,通過(guò)運(yùn)用本體創(chuàng)建語(yǔ)義網(wǎng)內(nèi)知識(shí)與語(yǔ)義模型,并結(jié)合模糊貝葉斯網(wǎng)絡(luò)構(gòu)建基于模糊貝葉斯網(wǎng)絡(luò)的本體不確定性推理模型,對(duì)本體實(shí)施擴(kuò)展,實(shí)現(xiàn)對(duì)語(yǔ)義網(wǎng)內(nèi)不確定性數(shù)據(jù)的直接表示與推理。本體不確定性推理建模整體框架如圖1所示。
圖1 本體不確定性推理建模整體框架
本體不確定性推理建模整體框架重點(diǎn)包括本體解析、本體模型構(gòu)建、推理模型三部分。其中,本體解析部分主要通過(guò)Jena API實(shí)現(xiàn),能夠讀取并解析所構(gòu)建的語(yǔ)義網(wǎng)本體,并向數(shù)據(jù)庫(kù)內(nèi)儲(chǔ)存解析之后的本體;本體模型構(gòu)建部分主要包括本體建模原語(yǔ)與本體語(yǔ)言的選取,通過(guò)二者的確定完成包含語(yǔ)義網(wǎng)知識(shí)及語(yǔ)義的本體模型構(gòu)建[10];推理模型部分是整體框架的關(guān)鍵部分,主要包括模糊貝葉斯網(wǎng)絡(luò)模型創(chuàng)建、聯(lián)結(jié)樹(shù)信念傳播算法實(shí)現(xiàn)及推理結(jié)果數(shù)據(jù)處理。
獲取語(yǔ)義網(wǎng)內(nèi)知識(shí)、提供此類知識(shí)的共同理解、將語(yǔ)義網(wǎng)內(nèi)共同認(rèn)可的詞匯確定,同時(shí)通過(guò)各種層次的形式化模式準(zhǔn)確定義此類詞匯間的關(guān)聯(lián),此即為語(yǔ)義網(wǎng)本體構(gòu)建的目標(biāo)。構(gòu)建包含語(yǔ)義網(wǎng)知識(shí)與語(yǔ)義的語(yǔ)義網(wǎng)本體模型的關(guān)鍵在于本體建模原語(yǔ)與本體語(yǔ)言的確定。
2.2.1 本體建模原語(yǔ)確定
構(gòu)建語(yǔ)義網(wǎng)本體時(shí),所運(yùn)用的基礎(chǔ)建模原語(yǔ)包括:①概念或者類:語(yǔ)義方面主要是指對(duì)象的集合,屬于各種事物的策略、功能及推理過(guò)程等抽象;②關(guān)系:主要是指在語(yǔ)義網(wǎng)領(lǐng)域內(nèi)各概念間的相關(guān)關(guān)聯(lián)作用,它與對(duì)象元組集相對(duì)應(yīng),從形式上可將其設(shè)定為笛卡爾積子集,即R:A1×A2×…×Am,比如子類關(guān)系等;③函數(shù):第m個(gè)元素的僅有影響元素為前m-1個(gè)元素的一種特別關(guān)系即為函數(shù),可通過(guò)形式化實(shí)施定義,所定義映射可表示為E=A1×A2×…×Am-1→Am。例如函數(shù)father-of(x,y)所代表的為x屬于y的父節(jié)點(diǎn);④公理:是指諸如概念Y在概念X的區(qū)間內(nèi)的永真斷言;⑤實(shí)例:在語(yǔ)義方面其所指為對(duì)象,即元素。以上五個(gè)基礎(chǔ)建模原語(yǔ),為構(gòu)建語(yǔ)義網(wǎng)本體奠定了基礎(chǔ)。
2.2.2 本體語(yǔ)言確定
本文選取OWL(本體描述語(yǔ)言)作為本體語(yǔ)言對(duì)語(yǔ)義網(wǎng)本體實(shí)施描述,該語(yǔ)言包含DL、Lite及Full三個(gè)子語(yǔ)言,均具備逐漸增強(qiáng)的描述性能,能夠在各種領(lǐng)域內(nèi)應(yīng)用。其中OWL DL子語(yǔ)言具備OWL語(yǔ)言的全部構(gòu)造子,能夠以保障可判別性與運(yùn)算完備性為前提,供應(yīng)描述性能最佳的描述機(jī)制,但該子語(yǔ)言應(yīng)在某些特定約束條件下使用;OWL Lite子語(yǔ)言所供應(yīng)的機(jī)制包括描述簡(jiǎn)單約束特征的機(jī)制與描述分類層次的機(jī)制;OWL Full子語(yǔ)言所供應(yīng)的描述性能最佳,但其缺陷是無(wú)法保障運(yùn)算的完備性。
創(chuàng)建模糊貝葉斯網(wǎng)絡(luò)模型,結(jié)合聯(lián)結(jié)樹(shù)信念傳播算法針對(duì)所構(gòu)建的語(yǔ)義網(wǎng)本體模型內(nèi)不確定性數(shù)據(jù)實(shí)施推理,并對(duì)推理后的數(shù)據(jù)實(shí)施模糊化與去模糊化處理,獲得精確推理結(jié)果。
2.3.1 模糊貝葉斯網(wǎng)絡(luò)
向模糊節(jié)點(diǎn)變量推送貝葉斯網(wǎng)絡(luò)的持續(xù)節(jié)點(diǎn)變量,即為模糊貝葉斯網(wǎng)絡(luò)。設(shè)語(yǔ)義網(wǎng)本體不確定性推理問(wèn)題以某個(gè)有限節(jié)點(diǎn)集表示,即X={x1,x2,…,xm},通過(guò)Xi代表持續(xù)節(jié)點(diǎn)變量xi的全部可能狀態(tài)集。設(shè)某個(gè)模糊隨機(jī)變量以vi表示,將xi∈X模糊成vi,同時(shí)xi的全部狀態(tài)均由vi繼承。那么xi的模糊集合可表示成
(1)
(2)
(3)
式中
(4)
設(shè)V={v1,v2,…,vm},通過(guò)有向弧對(duì)V內(nèi)變量的因果關(guān)聯(lián)予以描述,即
L={(vi,vj)|i≠j;i,j=1,2,…,m?V×V}
(5)
運(yùn)用條件概率描述此種關(guān)聯(lián)的概率
(6)
FBN=(V,L,P)
(7)
2.3.2 模糊概率推理算法
選取聯(lián)結(jié)樹(shù)信念傳播算法作為模糊貝葉斯網(wǎng)絡(luò)的模糊概率推理算法,降低模糊貝葉斯網(wǎng)絡(luò)的計(jì)算煩瑣性,獲得推理結(jié)果。在該算法內(nèi),將各個(gè)聯(lián)結(jié)樹(shù)(團(tuán)樹(shù))S看作一個(gè)節(jié)點(diǎn),通過(guò)此類節(jié)點(diǎn)將消息傳送至周圍節(jié)點(diǎn)。設(shè)團(tuán)樹(shù)S的構(gòu)成為團(tuán)S1,S2,…,Sk,原始勢(shì)能可由各個(gè)團(tuán)因子的乘積獲得。向團(tuán)β(σ)指定各個(gè)σ∈Φ,則Sj的原始勢(shì)能可表示為
?j(Sj)=∏σ:β(σ)=jσ
(8)
式中,局部證據(jù)與各節(jié)點(diǎn)的條件概率相對(duì)應(yīng),也就是
P(xi|π(xi))=σxi(xi,π(xi))
(9)
團(tuán)Sj初始化αi為?i,即
(10)
通過(guò)團(tuán)Sj將其原始團(tuán)勢(shì)能同其周圍全部消息相乘,運(yùn)算Sj和Si割集以外全部變量之和,同時(shí)向Si傳遞所得結(jié)果消息。當(dāng)周圍全部節(jié)點(diǎn)消息均被團(tuán)Si節(jié)點(diǎn)接收之后,由團(tuán)Si節(jié)點(diǎn)向外傳送,此刻通過(guò)運(yùn)算團(tuán)Si周圍全部消息和其原始勢(shì)能的乘積能夠獲得其最后勢(shì)能,即
(11)
(12)
(13)
2.3.3 數(shù)據(jù)模糊處理
通過(guò)聯(lián)結(jié)樹(shù)信念傳播算法實(shí)現(xiàn)模糊貝葉斯網(wǎng)絡(luò)的本體不確定性推理后,針對(duì)所獲得的推理數(shù)據(jù)實(shí)施模糊化與去模糊化處理,提升推理結(jié)果的精確性。
1)節(jié)點(diǎn)變量模糊化處理
(14)
而模糊貝葉斯網(wǎng)絡(luò)的模糊變量vi為此狀態(tài)時(shí)的證據(jù)F(vi)為
(15)
2)節(jié)點(diǎn)變量去模糊化處理
通過(guò)模糊貝葉斯網(wǎng)絡(luò)實(shí)施本體不確定性推理后,可通過(guò)以下向量描述模糊變量vi的信任度B(vi)
(16)
式中,模糊變量集V中的證據(jù)集以F表示。
(17)
(18)
以某地區(qū)汽車防撞警告系統(tǒng)語(yǔ)義網(wǎng)為例,應(yīng)用本文方法對(duì)其實(shí)施不確定性建模與推理。該系統(tǒng)是針對(duì)交通事故實(shí)施預(yù)防的一種安全系統(tǒng),通過(guò)其語(yǔ)義網(wǎng)知識(shí)創(chuàng)建碰撞警告領(lǐng)域本體。實(shí)驗(yàn)中所用數(shù)據(jù)來(lái)自實(shí)驗(yàn)地區(qū)交通運(yùn)輸部門2019年所公布的汽車駕駛數(shù)據(jù)報(bào)告,報(bào)告內(nèi)分析了汽車的駕駛環(huán)境與駕駛者的注意力狀態(tài)等變量,實(shí)現(xiàn)對(duì)此類因素干擾汽車駕駛行為的評(píng)估。由其中選取出三種駕駛情景(A、B、C),三種情景與對(duì)應(yīng)的實(shí)體狀態(tài)如表1所示。
表1 三種駕駛情景與對(duì)應(yīng)實(shí)體狀態(tài)
其中,情景A所表示的是一名駕齡較低的新手司機(jī),其在高速公路上行駛時(shí)車距較近的駕駛情景;情景B所表示的為一名駕駛技術(shù)高但駕駛狀態(tài)不好的高駕齡司機(jī)在高速公路上的駕駛情景;情景C所表示的為一名駕駛技術(shù)好而駕駛狀態(tài)稍差的中等駕齡司機(jī)在普通公路上的駕駛情景,且其駕駛中與前車的車距稍近?,F(xiàn)運(yùn)用本文方法對(duì)三種實(shí)驗(yàn)駕駛情景實(shí)施推理,依據(jù)所得推理結(jié)果檢驗(yàn)本文方法的推理效果。本文方法推理所得三種駕駛情景的詳細(xì)變化情況如圖2所示。
圖2 本文方法推理的三種情景非法駕駛概率變化情況
通過(guò)圖2能夠得出,在本文方法的推理中,增長(zhǎng)的非法駕駛模糊行為狀態(tài)證據(jù)對(duì)非法駕駛行為的影響可在推理結(jié)果中準(zhǔn)確顯示,可見(jiàn),本文方法能夠?qū)崿F(xiàn)對(duì)各種情景模糊概率知識(shí)的準(zhǔn)確推理,具有較高的有效性與可行性。
進(jìn)一步檢驗(yàn)本文方法推理結(jié)果在經(jīng)模糊化與去模糊化處理前后的準(zhǔn)確性,通過(guò)抽樣技術(shù)均勻劃分實(shí)驗(yàn)數(shù)據(jù)為12組,通過(guò)本文方法依次對(duì)12組實(shí)驗(yàn)數(shù)據(jù)實(shí)施推理,獲取到各組實(shí)驗(yàn)數(shù)據(jù)的推理結(jié)果,對(duì)結(jié)果實(shí)施模糊化與去模糊化處理后,統(tǒng)計(jì)并對(duì)比每組數(shù)據(jù)推理結(jié)果處理前后的準(zhǔn)確度,統(tǒng)計(jì)與對(duì)比結(jié)果如圖3所示。
圖3 模糊處理前后推理結(jié)果準(zhǔn)確度對(duì)比
由圖3能夠得出,通過(guò)對(duì)所得推理結(jié)果實(shí)施模糊化與去模糊化處理之后,12組數(shù)據(jù)推理結(jié)果的平均準(zhǔn)確度可達(dá)到94.03%,相比處理前的平均準(zhǔn)確度提高了3.67%,由此可見(jiàn),對(duì)推理結(jié)果實(shí)施模糊化與去模糊化處理,能夠顯著提升每組數(shù)據(jù)最終推理結(jié)果的精度,提高整體推理結(jié)果的可靠性與價(jià)值度。
語(yǔ)義網(wǎng)應(yīng)用中所面臨的關(guān)鍵問(wèn)題即為語(yǔ)義服務(wù)與關(guān)聯(lián)數(shù)據(jù)過(guò)多所導(dǎo)致的語(yǔ)義網(wǎng)內(nèi)出現(xiàn)大量的不確定性數(shù)據(jù),無(wú)形中提升了語(yǔ)義網(wǎng)的實(shí)際應(yīng)用難度,為此,本文針對(duì)一種面向語(yǔ)義網(wǎng)的本體不確定性推理建模仿真方法展開(kāi)研究,通過(guò)結(jié)合基礎(chǔ)建模原語(yǔ)與OWL本體語(yǔ)言,構(gòu)建包含語(yǔ)義網(wǎng)知識(shí)與語(yǔ)義的本體模型,對(duì)所構(gòu)建本體模型實(shí)施讀取與解析后儲(chǔ)存至數(shù)據(jù)庫(kù)內(nèi),構(gòu)建模糊貝葉斯網(wǎng)絡(luò)模型,以聯(lián)結(jié)樹(shù)信念傳播算法作為所構(gòu)建模糊貝葉斯網(wǎng)絡(luò)的模糊概率推理算法,針對(duì)所構(gòu)建的語(yǔ)義網(wǎng)本體模型內(nèi)的不確定性數(shù)據(jù)實(shí)施推理,同時(shí)模糊化與去模糊化處理推理后數(shù)據(jù),獲得最終的精確推理結(jié)果。
將本文方法應(yīng)用于某地區(qū)汽車防撞警告系統(tǒng)語(yǔ)義網(wǎng)內(nèi),實(shí)際應(yīng)用結(jié)果表明,本文方法可將增長(zhǎng)的非法駕駛模糊狀態(tài)證據(jù)對(duì)非法駕駛行為的影響顯示在推理結(jié)果中,并能夠?qū)崿F(xiàn)對(duì)各種情景模糊概率知識(shí)的推理,具有較高的有效性與可行性,另外,本文方法結(jié)合的模糊化與去模糊化處理,可明顯提升最終推理結(jié)果的精度,令整體推理結(jié)果更具可信度與應(yīng)用價(jià)值。