亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于多層領域本體的知識表示通用模型研究

        2020-06-09 07:21:38李金海何有世馬云蕾周愛平
        計算機工程與應用 2020年11期
        關鍵詞:語義概念模型

        李金海,何有世,馬云蕾,周愛平,3

        1.泰州學院,江蘇 泰州225300

        2.江蘇大學 管理學院,江蘇 鎮(zhèn)江212013

        3.東南大學 計算機網(wǎng)絡與信息集成教育部重點實驗室,南京211189

        1 引言

        知識表示是知識管理的基礎,知識表示模型直接決定了知識管理的有效性。目前大多數(shù)信息系統(tǒng)主要是基于關鍵詞對知識進行管理的,在知識的管理過程中,沒有考慮到知識所蘊涵的語義關系,導致了知識檢索結果的查全率及查準率都不能令用戶滿意[1]。而知識表示方法直接影響到知識檢索的準確率以及知識的重用效果[2]。

        關于知識表示的方法主要有面向對象、語義網(wǎng)絡以及基于本體[3-4]等。與其他表示方法相比,基于本體的知識表示方法保證了知識理解的唯一性,同時能夠適應信息系統(tǒng)涉及的知識領域多樣性以及語義關系復雜性的特點,因此,該方法已成為知識表示的主要方法[5-7]。本文將本體知識引入到知識表示模型,通過本體最大程度的挖掘知識的語義。目前,基于本體的知識表示已得到了一定的研究,如,李曙光等針對企業(yè)特定領域內(nèi)的信息資源,基于本體理論研究信息分類編碼方法,并實例化本體生成需要的信息編碼,為信息資源的組織提供了框架[8]。Brandt等通過本體知識表示數(shù)據(jù)倉庫中數(shù)據(jù)的調(diào)用知識以及產(chǎn)品設計過程中的經(jīng)驗知識[9]。朱海華等構建了基于本體的產(chǎn)品服務知識管理系統(tǒng),該系統(tǒng)能實現(xiàn)產(chǎn)品服務活動案例所涉及知識的獲取與重用[10]。王力等提出一種產(chǎn)品設計知識的本體構建方法,基于此構建了基于本體的產(chǎn)品設計知識表示模型,該模型提高了產(chǎn)品設計知識共享與重用效率[11]。

        雖然基于領域本體的知識表示方法具有較強的可理解性與可擴展性,能夠形式化地描述某一領域的知識,在針對單一領域知識的系統(tǒng)中得到了很好的應用,而多領域知識的集成是未來的方向,如涵蓋各類商品的電子商務平臺,各類商品的知識間有著各自的特殊性,基于單一領域本體難以表示出所有商品的信息。但是若通過不同的領域本體來表示各類商品知識,將有礙于系統(tǒng)中本體知識的調(diào)用;另一方面,假如用戶需要的信息涉及多個領域的知識,由于各領域知識組織形式的不同,此時只能對各領域知識分別進行檢索,這會極大地降低信息檢索的效率?;诖?,將研究領域本體的整合,構建通用型的本體模型,使得各領域的知識可以通過通用本體進行表示,有利于復雜信息系統(tǒng)中信息的有效組織以及信息的準確檢索。

        2 知識表示的需求分析

        目前信息系統(tǒng)中信息資源大多通過關系型數(shù)據(jù)庫來表示,關系型數(shù)據(jù)庫有利于結構化信息的表示,但缺乏對非結構化信息的表示;并且沒有完整的語義模型,缺乏對包含復雜語義信息的知識的支持能力[12]。

        2.1 知識表示的特點

        無論是網(wǎng)絡購物信息系統(tǒng)還是管理信息系統(tǒng)都不再是單一領域的集合,而是多領域的重構。并且多領域知識重構的特點不僅在信息系統(tǒng)的構建過程中可以得到體現(xiàn),在信息系統(tǒng)的使用中也能得以體現(xiàn)[13]。

        在宏觀層面上,信息系統(tǒng)的設計涉及多個組織,每個組織包括不同部門、而部門內(nèi)各員工的知識背景存在差異。由于企業(yè)職能的多元化,信息系統(tǒng)在使用過程中,需要面對不同領域,信息系統(tǒng)的使用也涉及多領域知識。

        在微觀層面上,信息系統(tǒng)的設計所需知識來自多學科多領域,且存儲方式異構,為了知識概念與語義的統(tǒng)一,信息系統(tǒng)的設計需要一種能兼容多領域知識的知識表示方式。并且,信息系統(tǒng)在實際使用過程中,由于用戶需求的多樣化,信息系統(tǒng)需要有效理解不同領域知識間的概念與語義關系。

        2.2 多層領域本體

        本文的思路是通過通用的本體構建模型來確保各領域知識在語義層面上的統(tǒng)一[14]。頂層本體作為領域本體的參考依據(jù),它揭示了領域知識在更高語義層次上的關系[15]。但是,在諸多領域本體的構建研究中,忽視了頂層本體提供的上層語義知識[13],為領域本體之間多領域知識的互通帶來難題。

        基于頂層本體的上層語義關聯(lián),構建多層領域本體模型,統(tǒng)一各領域本體的構建,規(guī)范各領域知識的共享與重用。

        多層領域本體從多個層面對不同層次的知識體系進行描述,基于本體各層次概念面向的不同層次的知識體系以及自頂而下的本體構建原則,本文構建了四層領域本體,四層領域本體的各層概念及層次關系如圖1所示。

        上層本體的構建基于頂層本體,繼承了頂層本體中的實體與關系,并按照實體粒度擴展子類體系,描述了具有領域特征的上層類和關系,起到了銜接頂層及應用本體的功能;針對具體領域,依據(jù)明確的領域需求與應用目標,構建能夠較為全面描述該領域知識的應用本體;而實例本體則通過應用本體類的匹配與映射,實現(xiàn)具體領域的實例集成。

        3 多層領域本體的構建

        傳統(tǒng)的領域本體只能表示具體領域中概念及關系,不能表示多個領域中概念集的共有屬性以及概念間的普遍關系,割裂了領域間知識的普遍聯(lián)系,不利于領域知識的復用以及整合。針對基于領域本體的多領域知識表示的不足,本文構建了多層領域本體通用模型,用于多領域知識的表示,圖2為由頂層本體、上層本體、應用本體、實例本體組成的四層本體架構的多層領域本體模型框架。

        圖1 多層領域本體的層次關系圖

        圖2 多層領域本體的模型框架

        3.1 頂層本體的構建

        作為適用于各領域構建領域本體的普適框架,在信息系統(tǒng)的知識表示中,頂層本體能適應不同領域需求的變化,能夠用于各領域知識的共享與重構。頂層框架中的實體不具有領域特征,是對現(xiàn)實世界中的對象從各層面進行的抽象描述?;谝延形墨I[16],分析了基于5W1H的頂層本體構建方法,將頂層本體分為六個通用組成模塊,即What-客體模塊、Where-地點模塊、When-時間模塊、Who-主體模塊、Why-原因模塊、How-方法模塊。

        通過四元組O=(C,A,R,X)表示概念及概念間的關系,其中,C 表示本體中概念的集合,A 表示概念屬性的集合,R 表示概念間關系的集合,X 表示本體的公理與規(guī)則組成的集合。

        概念集合C 由5W1H 的六個模塊的概念集合組成,即C=Cwhat∪Cwhere∪Cwhen∪Cwho∪Cwhy∪Chow,為了保證概念非奇異,設Ci ∩Cj=?{i ≠j ∧i,j ∈(what,where,when,who,why,how)}。

        Cwhat表示有關研究對象的概念集合,其他五個以此類推。

        本體中的概念間的關系R 分為分類關系Rt 與依賴關系Rd,即R=Rt ∪Rd,R ?Ci×Cj(Ci,Cj ∈Cwhat∨Cwhere∨Cwhen∨Cwho∨Cwhy∨Chow)。

        分類關系包括繼承關系kind-of 及整體部分關系part-of,依賴關系表示概念間存在的語義關系。

        通過Protégé定義頂層本體中的概念、屬性、關系及公理。以When-時間模塊的頂層本體為例,如圖3 所示。時間模塊的頂層本體涵蓋了時間所有的通用概念、屬性以及關系。

        圖3 When-時間模塊的頂層本體

        3.2 上層本體的構建

        上層本體涉及多領域知識,本體的粒度過大,不利于知識的復用、整合及維護[17]。為了解決該問題,研究了模塊化的上層本體構建方法,細化本體構建粒度,通過多領域專家協(xié)作、自治構建模塊化本體的基礎上,完成本體的復用、裂變、重組,從而提升通用本體的構建效率及進化能力[18],上層本體的模塊化構建流程[19]如圖4所示。

        其中,核心本體、原子本體都是領域本體,原子本體是模塊化本體構建中的最小單位,是構建的基礎,深度不超過a(a >1);而核心本體是模塊化本體構建的骨架,具有子模塊,深度不超過b(b >1)。模塊化本體構建就是將子模型集成到核心本體模型中。具體步驟如下:

        圖4 上層本體的模塊化構建流程

        步驟1 根據(jù)本體的構建目標確定領域范圍。

        步驟2 依據(jù)領域邊界劃分本體模塊。

        步驟3 確定各模塊的核心本體及原子本體。

        步驟4 將原子本體模塊集成到核心本體模塊,構建本體模塊。

        步驟5 將多個本體模塊集成為一個模塊化本體。

        在模塊化本體構建過程中,通過多領域專家的協(xié)作管理,保證各領域之間語義的一致性,及模塊化本體的構建質(zhì)量。

        每個上層本體模塊由c 個核心本體與d 個原子本體組成,其中,c=1 或0,d ≥0,即每個上層本體模塊最多包含一個核心本體。若c=0,則上層本體模塊為原子本體模塊;若c=1,則上層本體模塊中至少有一個核心本體是其一個子模塊的根,逐層分解,最終的子模塊為原子本體模塊。以電子產(chǎn)品上層本體為例,其模塊化本體的形成如圖5所示。

        圖5 電子產(chǎn)品模塊化本體

        3.3 應用本體的構建

        應用本體是上層本體的細分領域,依據(jù)頂層本體以及上層本體的基礎框架,基于實際的應用場景,分析相關領域的關鍵知識,依次拓展上層本體,構建表示具體應用領域知識的模型。

        基于信息系統(tǒng)所涉及的具體領域知識需求,確定知識表示所需要的領域本體,一方面基于主題詞表,制定詞表向本體轉化的映射規(guī)則;另一方面將領域中已有本體作為補充資源,通過詞表概念的規(guī)范、映射和本體的重用、重構,形成能夠體現(xiàn)領域共有特征的核心概念及關系體系,從而構建用于多領域知識組織和描述的應用本體,形成應用本體的詳細描述文件OWL[20]。

        概念體系的構建是應用本體構建的重點工作,主要包括5個部分:

        (1)確定本體的核心大類;

        (2)確定類的等級關系;

        (3)定義類間的關系;

        (4)定義類的屬性;

        (5)創(chuàng)建類的實例。

        應用本體的構建具體流程如圖6所示。

        圖6 應用本體的構建流程

        以電子產(chǎn)品上層本體中的筆記本應用本體的構建流程為例:

        (1)創(chuàng)建筆記本主題詞表

        基于TF-IWF算法提取筆記本行業(yè)分類標準中的關鍵詞,借助HowNet的標準對關鍵詞進行規(guī)范,構建筆記本主題詞表。

        (2)確定類的等級體系

        基于筆記本應用本體的核心概念,對類的等級體系進行擴展。

        (3)定義類的屬性

        筆記本應用本體的屬性代表概念的數(shù)據(jù)特征。

        如“存儲設備”類包含3 個屬性:內(nèi)存容量、硬盤容量以及光驅類型。

        (4)定義類間的關系

        分析概念與概念之間的關系,定義筆記本領域本體中類間的關系。本體中的關系可劃分為等級關系與非等級關系,主要的類間關系包括:整體-部分關系、同義關系、反義關系、轉指關系、指示關系。

        (5)筆記本應用本體的OWL實現(xiàn)

        通過Protégé構建筆記本應用本體,以OWL語言作為本體的表示語言,構建的本體由24個類,56個數(shù)據(jù)屬性以及13個關系組成。

        圖7 實例本體的概念集C與關系屬性集R

        3.4 實例本體的構建

        采用手工構建本體的方法,以OWL 語言作為本體的表示語言,利用protégé 完成實例本體的設計。實例本體的具體創(chuàng)建流程如下:

        步驟1 解析應用本體模型的OWL,得到概念模型,獲取對應目標的概念集C。

        步驟2 解析應用本體模型的OWL,得到關系模型,獲取與概念集C 相對應的關系屬性集R。

        步驟3 設置概念C 相關聯(lián)的數(shù)據(jù)屬性集A,由本體的公理與規(guī)則X 約束。

        步驟4 將上述的概念集C、關系屬性集R、數(shù)據(jù)屬性集A,填充到實例本體。

        以“筆記本”領域中的聯(lián)想Air 13實例為例,為其創(chuàng)建實例本體,其中,概念集C 與關系屬性集R 如圖7所示,數(shù)據(jù)屬性集A 如表1所示。

        表1 實例本體的數(shù)據(jù)屬性集A

        4 基于多層領域本體的語義檢索仿真實驗

        基于多層領域本體的知識表示通用模型的有效性通過該模型的語義檢索進行驗證。具體驗證步驟如下:

        步驟1 獲取用戶的查詢請求;

        步驟2 將查詢的條件與本體庫中的概念進行語義匹配;

        步驟3 通過搜索引擎查詢語義索引庫;

        步驟4 將檢索結果以一定的相關度進行排序;

        步驟5 排序結果返回給用戶。

        4.1 語義檢索實驗流程

        仿真實驗包括本體管理、語義索引庫、查詢分析及信息檢索四個模塊,如圖8所示。

        圖8 語義檢索實驗流程

        語義檢索的主要功能是從用戶請求中挖掘出檢索關鍵詞,并將它們傳遞到系統(tǒng)的檢索模塊。仿真實驗中的語義擴展包括同義關系、整體-部分關系及實例關系。將預處理后的查詢條件與語義索引庫中的信息進行匹配,計算兩者的相似度,對相似度不小于閾值α 的檢索結果進行排序,并以合適的形式返回給用戶。

        本實驗語義相似度的計算采用基于屬性的Tversky算法,對于檢索關鍵詞M 和待檢索概念N ,Tversky算法如下:

        其中,f(M ?N)表示M 和N 的公有屬性個數(shù),f(MN)表示M 有而N 沒有的屬性個數(shù),f(N-M)表示N有而M 沒有的屬性個數(shù),權重β 與γ ∈[0,1],本實驗中設β=γ=0.5。

        若相似度Sim(M,N)≥α,則概念N 滿足檢索要求。

        4.2 實驗結果分析

        為了客觀地評價基于多層領域本體的知識表示通用模型的有效性,在單個領域以及多個領域知識環(huán)境下,將其與基于傳統(tǒng)領域本體的知識表示模型以及傳統(tǒng)的關鍵詞知識表示模型進行對比分析。

        其中,單個領域選擇應用本體中的筆記本應用本體,多個領域選擇電子產(chǎn)品上層本體中多個應用本體。

        在單個領域知識環(huán)境下,仿真實驗隨機選取10 個筆記本應用本體內(nèi)相關主題進行測試;而在多個領域知識環(huán)境下,仿真實驗在電子產(chǎn)品上層本體中隨機選取10個不同應用本體內(nèi)相關主題進行測試。不同領域環(huán)境下三種模型在不同的相似度閾值下的語義檢索結果如表2所示。其中,召回率R 與精度P 是衡量檢索效果的兩項重要指標,假設,系統(tǒng)檢索到的相關信息為A,系統(tǒng)檢索到的不相關信息為B,相關但是沒被系統(tǒng)檢索到的信息為C ,不相關且沒有被系統(tǒng)檢索到的信息為D,則召回率R=A/(A+C),精度P=A/(A+B)。

        在單個領域環(huán)境下,從整體上看,基于多層領域本體的知識表示模型與基于傳統(tǒng)領域本體的知識表示模型的召回率R 與精度P 差異都有限,基于多層領域本體的知識表示模型略高;但相比于基于關鍵詞的知識表示模型,無論是召回率R 還是精度P,基于本體的知識表示模型優(yōu)勢都較為明顯。這說明在表示單個領域知識時,基于多層領域本體與基于傳統(tǒng)領域本體的知識表示模型,由于不涉及多個領域知識,因此,它們的效果相當;但它們都考慮了概念間的語義關系,因此,較單純的基于關鍵詞的知識表示模型具有明顯優(yōu)勢。從不同相似度閾值的局部上看,隨著相似度閾值的降低,三種模型的召回率R 都是逐步提升;三種模型的精度P 在相似度閾值取中間值時達到頂峰;并且在相似度閾值取中間值時,三種模型無論是召回率R 還是精度P 之間的差異都最小,這是因為多層領域本體主要功效在于提高查詢請求與相關結果間的相似度,降低與不相關結果間的相似度,從而讓更多的相關結果排在比較靠前的位置,因此在相似度閾值較高或較低時,基于多層領域本體的知識表示模型優(yōu)勢明顯,在中間相似度閾值時,優(yōu)勢就不那么顯著了。

        在多個領域環(huán)境下,從整體上看,不同于單個領域環(huán)境,此時,基于多層領域本體的知識表示模型與基于傳統(tǒng)領域本體的知識表示模型的召回率R 與精度P 有著明顯的差異;而基于傳統(tǒng)領域本體的知識表示模型與基于關鍵詞的知識表示模型之間的差異反而降低了。這是由于基于多層領域本體的知識表示模型有利于不同領域知識間的調(diào)用與共享,在多領域環(huán)境下,基于多層領域本體的知識表示模型的性能才能完全體現(xiàn);而基于傳統(tǒng)領域本體的知識表示模型的優(yōu)勢被很大程度上削弱。從不同相似度閾值的局部上看,相比于單個領域,無論是召回率R 還是精度P ,同一相似度閾值下,基于多層領域本體的知識表示模型稍微有所降低,但基于傳統(tǒng)領域本體的知識表示模型與基于關鍵詞的知識表示模型降低得則更為明顯。且隨著相似度閾值的增加,后兩者的召回率R 與精度P 的降低幅度也在增加。說明當系統(tǒng)對相似度要求較高時,基于多層領域本體的知識表示模型較后兩者更適合于涉及多領域知識的系統(tǒng)要求。

        5 結論

        考慮到傳統(tǒng)的基于關鍵詞的知識管理過程中,沒有分析知識所蘊涵的語義關系,導致了知識檢索結果的查全率及查準率都不能令用戶滿意。因此,分析了基于領域本體的知識表示,但也只能適用于單一領域知識體系,在分析復雜信息系統(tǒng)的知識表示需求基礎上,借鑒頂層本體提供的上層語義知識,構建多層領域本體,并詳細分析了各層本體的構建流程。

        最后,通過基于多層領域本體的語義檢索驗證了基于多層領域本體的知識表示通用模型的有效性。仿真實驗結果發(fā)現(xiàn),在單個領域環(huán)境下,無論是多層領域本體的知識表示模型,還是傳統(tǒng)領域本體的知識表示模型,二者效果相當,較基于關鍵詞的知識表示模型具有明顯優(yōu)勢。在多個領域環(huán)境下,基于多層領域本體的知識表示模型的優(yōu)勢得以真正體現(xiàn),無論是召回率R 還是精度P ,不僅較基于關鍵詞的知識表示模型有顯著優(yōu)勢,較傳統(tǒng)領域本體的知識表示模型也有顯著優(yōu)勢。

        表2 不同領域環(huán)境下三種模型語義檢索性能結果對比表 %

        猜你喜歡
        語義概念模型
        一半模型
        Birdie Cup Coffee豐盛里概念店
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權M-估計的漸近分布
        語言與語義
        幾樣概念店
        學習集合概念『四步走』
        聚焦集合的概念及應用
        3D打印中的模型分割與打包
        “上”與“下”語義的不對稱性及其認知闡釋
        亚洲最近中文字幕在线| 久久亚洲日本免费高清一区| 一本大道久久精品一本大道久久 | 国产精品国产自产拍高清| 岛国av无码免费无禁网站 | 国产精品无码片在线观看| 天堂av中文在线官网| 亚洲精品视频在线一区二区| 久久久久久国产精品免费免费男同| 亚洲国产一区二区三区网| 中文字幕a区一区三区| 变态另类人妖一区二区三区 | 国产视频一区二区三区观看| 99久久99久久精品免费看蜜桃| 成人免费网站视频www| 热re99久久精品国产66热6| 国产激情综合五月久久| 久久天堂综合亚洲伊人hd妓女| 天天影视色香欲综合久久| 白白青青视频在线免费观看| 日本一区二区三区光视频| 人妻哺乳奶头奶水| 国产成人久久精品二区三区牛| 亚洲中文字幕不卡一区二区三区| 日本道免费一区二区三区日韩精品 | 高潮迭起av乳颜射后入| 91精品全国免费观看青青| 亚洲av色精品国产一区二区三区| 亚洲av无码一区东京热久久| 色婷婷综合中文久久一本| 欧美在线观看www| 国产综合开心激情五月| 国产精品成人aaaaa网站| 久久综合成人网| 国产女主播在线免费看| 欧洲熟妇色xxxx欧美老妇软件| 国产亚洲av人片在线观看| 日韩国产自拍精品在线| av影院手机在线观看| 少妇高潮尖叫黑人激情在线| 亚洲性69影视|