亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        科技文獻本體模型設計與實現(xiàn)

        2015-07-11 07:43:52尹作重李江華任麗娜
        制造業(yè)自動化 2015年14期
        關(guān)鍵詞:學科分類實例本體

        尹作重,李江華,杜 峻,張 偉,任麗娜

        (1.北京漫游谷信息技術(shù)有限公司,北京 100101;2.中國水利水電科學研究院,北京 100038;3.北京機械工業(yè)自動化研究所,北京 100120)

        0 引言

        在科技文獻中往往存在著大量的專業(yè)知識,而且知識的形式也多種多樣,知識的來源渠道也比較復雜,用來表示知識的概念和術(shù)語也非常多樣化,這導致了科技文獻的信息共享存在著重重困難,在科技文獻共享方面必須采用一種明確的形式化的規(guī)范描述。在知識表示和知識共享方面,本體能從語義和知識兩個層面上對科技文獻的信息進行描述,能夠比較精確而且規(guī)范的描述某個領域知識的概念以及概念間的相互關(guān)系,而且這些概念以及概念的關(guān)系是在領域內(nèi)得到大家認可的概念集,同時本體描述語言是符合W3C標準的建模語言[1],所以由本體構(gòu)建的模型可保證領域知識的共享和可復用性,由于本體具有以上優(yōu)勢,本體技術(shù)在知識表示、知識共享和語義檢索方面的研究成為熱點問題,比如在國內(nèi)外本體技術(shù)在醫(yī)學行業(yè)、農(nóng)業(yè)花卉、化工行業(yè)、生物等領域的研究和應用有了一定的進展,特別是近些年來將本體技術(shù)引入到科技文獻檢索中的研究得到了越來越多的研究和探索,所以對科技文獻本體模型設計和實現(xiàn)的研究對科技文獻共享和檢索方面具有重要的支撐作用。

        1 本體技術(shù)概述

        本體最早是做為一個哲學的概念被提出來的,后來隨著計算機技術(shù)和人工智能技術(shù)的不斷發(fā)展,本體在計算機和人工智能領域被賦予了越來越多的新內(nèi)涵,隨著時間的發(fā)展,本體的內(nèi)涵不斷的完善和豐富,本體的構(gòu)建方法論、描述工具以及構(gòu)建工具都得到了進一步的發(fā)展。本體的應用在不同領域以及不同應用場景中的應用各不相同,所以并沒有形成統(tǒng)一的本體的構(gòu)建方法論、本體模型的描述語言以及構(gòu)建工具。

        1)本體的定義

        各個領域的專家和學者根據(jù)自己的領域知識和理解給出了各自的本體定義,1993年Gruber提出“本體是對概念模型的明確規(guī)范的說明[2]”,1998年Studer提出“本體共享概念模型的明確的形式化規(guī)范說明[3]”,這兩個對本體的定義對本體的發(fā)展比較具有影響力,國際W3C組織采納了Studer對本體所做的定義。

        2)本體構(gòu)建方法

        國內(nèi)外的大學、科研院所以及各個領域的專家和學者對本體的構(gòu)建方法進行了研究,但是在本體的實際構(gòu)建過程中,大多還是采用手工方式,目前在構(gòu)建本體過程中并沒有統(tǒng)一的建模方法,應用比較廣泛的本體構(gòu)建方法主要包括骨架法、METHONTOLOGY法、IDEF5法、TOVE法以及七步法。

        如表1所示,從是否有工程管理、是否需要開發(fā)前期、是否有需求分析、是否有設計、是否有執(zhí)行、是否有開發(fā)后期等維度對常用的本體構(gòu)建方法進行對比分析,每一種本體構(gòu)建方法都有自己的優(yōu)勢和劣勢,都有自己適合的領域,經(jīng)過比較分析,在本文中構(gòu)建科技文獻本體模型的過程中綜合了上述五種方法的優(yōu)勢,并且較多的借鑒了七步法中的設計思路。

        表1 本體構(gòu)建方法分析

        3)本體模型描述語言

        本體是一種知識表示和知識共享的方法,本體的描述語言的特定必須簡單、明確,對知識的表示和描述沒有歧義,由人工智能領域發(fā)展而來的本體描述語言有CycL、Loom、OCML以及Ontolingua語言等,后來隨著計算機技術(shù)的高速發(fā)展,特別是互聯(lián)網(wǎng)技術(shù)的快速發(fā)展,基于語義Web的本體描述語言應運而生,其中RDF、OIL和OWL語言應用比較廣泛,并且被W3C國際組織作為本體描述語言標準向本體研發(fā)人員進行推薦。

        圖1 本體描述語言分析

        如圖1所示,在推理能力與語法表達及互操作兩個維度來說,現(xiàn)有的本體描述語言有各自的優(yōu)缺點,RDF的語法表示存在著弱勢,對WEB本體支持較弱,而DAML+OIL和OWLDL在語法表示方面可以支持比較復雜的本體需求,但OWLDL在推理方面難點和復雜程度比較高,OWLDL在專業(yè)領域的復雜概念和關(guān)系的本體構(gòu)建應用較多。OWL語言被W3C推薦為本體描述語言的標準,比較適合WEB應用,同時使用OWL語言建造和使用本體的難度都比較小,通過以上的比較,在本文中選擇OWL作為水利水電科技文獻本體的描述語言。

        4)本體模型構(gòu)建工具

        在本體的構(gòu)建、編輯、維護過程中,往往采用一些商用的或者免費的軟件工具,這些工具往往是一些大學或者企業(yè)率先研發(fā)出來的,這些工具主要包括以下兩大類 :第一類本體構(gòu)建工具主要包括Ontolingua工具、WebOnto工具以及OntoSaurus工具等;第二類本體構(gòu)建工具包括OilEd工具、Protégé工具和OntoEdit工具等。上述的本體構(gòu)建工具不只支持一種描述語言,往往可以對多種本體描述語言格式進行支持,比如XML,RDF和DAML+OIL等。本體構(gòu)建工具各有優(yōu)缺點,適用于不同領域的本體開發(fā)工作,這些本體構(gòu)建工具還在不斷的發(fā)展和完善之中。

        Protégé軟件是由斯坦福大學醫(yī)學院開發(fā)的構(gòu)建本體模型的一個重要的軟件工具,該軟件是基于Java語言開發(fā)的本體集成開發(fā)環(huán)境,屬于開放源代碼軟件,用戶可以在斯坦福大學Protégé官方社區(qū)下載Protégé工具的最新源代碼以及各個歷史版本,高級用戶甚至可以根據(jù)自己的實際需求來修改Protégé工具的源代碼,并且社區(qū)還為這些用戶提供技術(shù)支持,在本文在構(gòu)建科技文獻本體模型的研究過程中,將采用Protégé4.3作為本體模型的建模工具,設計和構(gòu)建科技文獻的領域本體模型。

        2 科技文獻本體模型設計與實現(xiàn)

        圖2 七步法的主要步驟

        本體模型的設計主要步驟如圖2所示,七步法的主要步驟為“本體專業(yè)領域的確定”→“有無現(xiàn)有本體可以重用”→“凝練領域的重要術(shù)語”→“類以及結(jié)構(gòu)的定義”→“本體中類的屬性定義”→“屬性側(cè)面的定義”→“實例的創(chuàng)建”。在科技文獻本體模型設計過程中,下面按照七步法的指導,對本體模型的設計過程進行詳細描述。

        1)專業(yè)領域的確定

        本體描述的概念以及概念之間的層次關(guān)系都是有一定的領域范圍的,在多個領域通用的本體模型是不存在的,所以應用領域的不同,本體模型也各不相同。構(gòu)建科技文獻領域本體所涉及的范圍就是確定科技文獻的概念、術(shù)語、概念之間的關(guān)系、概念的相關(guān)屬性之間關(guān)系以及屬性以及屬性之間的關(guān)系等內(nèi)容。在構(gòu)建領域內(nèi)本體的過程中,通常采用參考該領域內(nèi)科技文獻分類體系的方式。由于分類方法使用了公認和規(guī)范的術(shù)語,既可以參考領域內(nèi)的分類方法中的術(shù)語和詞匯來形成領域本體的概念和術(shù)語,也可以參考領域內(nèi)分類方法的層次結(jié)構(gòu)來構(gòu)建本體類的關(guān)系,可以縮短構(gòu)建領域內(nèi)本體的工作時間,同時使得本體的可擴展性和可維護性大大提高。

        2)有無現(xiàn)有本體重用的分析

        在構(gòu)建本體模型之前,需要進行大量的調(diào)研工作,確定在該領域內(nèi)是否存在可供復用的領域本體模型,若該領域內(nèi)有可復用的本體,則可以從本體的基礎上,根據(jù)實際需求,在領域內(nèi)專家的指導下,對本體模型進行補充和完善。在本文中則從零開始,在七步法的指導下一步一步的構(gòu)建科技文獻本體模型。

        3)凝練領域的重要術(shù)語

        科技文獻本身包括的信息主要分為內(nèi)容描述、知識產(chǎn)權(quán)相關(guān)、學科分類、外部屬性描述和關(guān)聯(lián)屬性描述等。文件本身信息主要包含了資料名稱信息、學科分類信息、語言類型信息信息、資料類型信息、數(shù)據(jù)類型信息、等信息屬性。文獻的分類信息主要來自于該領域內(nèi)的分類體系。由于文獻間存在著同義詞、相關(guān)性,還有部分和整體的關(guān)系以及參照和被參照的關(guān)系,所以還要需要確定文獻之間的重要關(guān)系。總起來說領域的重要術(shù)語包含了內(nèi)容描述、知識產(chǎn)權(quán)相關(guān)、學科分類、外部屬性描述和關(guān)聯(lián)屬性描述等信息。

        4)類以及結(jié)構(gòu)的設計

        通過前面的步驟得到了最原始的術(shù)語集合,通過分析和細化這些術(shù)語,選擇一部分與本體模型關(guān)系比較密切的術(shù)語作為概念,該概念代表著一類具有共性的實例對象,并且這些概念作為本體模型中層次結(jié)構(gòu)中結(jié)點而存在,在本體理論中,這些概念稱為類,類既是本體模型中最主要的知識單元,同時也是基本組織單元,跟計算機領域內(nèi)的面向?qū)ο缶幊陶Z言中的類有個相似的地方就是本體理論中的類也具有繼承性,越高層的類表示的概念越抽象,子類繼承了父類的屬性,表示的概念比父類具體一些。

        圖3 科技文獻類的設計

        如圖3所示,科技文獻資源的本體描述框架共分為5個大類,共有20多個屬性,這四個大類為:內(nèi)容描述類、知識產(chǎn)權(quán)相關(guān)類、學科分類、外部屬性描述類和關(guān)聯(lián)屬性描述類。

        內(nèi)容描述類主要包括文獻標示、文獻名稱、文獻標題、學科分類、項目來源、文獻語種、關(guān)鍵字、文獻摘要、文獻內(nèi)容等屬性。

        知識產(chǎn)權(quán)相關(guān)類主要包括文獻作者、出版社等屬性。

        學科分類是描述科技文獻模型的重要分類,是科技文獻檢索的基礎。

        外部屬性描述類主要包括文件大小、歸檔日期、文獻類型、文獻頁數(shù)、文件大小、完成日期、資料格式等屬性。

        關(guān)聯(lián)屬性描述類主要包括了是…的一部分、包含…的部分、參照關(guān)系、被參照關(guān)系等屬性,關(guān)聯(lián)屬性描述類主要描述了科技文獻之間的關(guān)聯(lián)關(guān)系,是對象型屬性。

        學科分類是科技文獻資源描述框架的核心類,主要描述了科技文獻的上位類詞、下位類詞和同義類詞的關(guān)系。學科分類通過subClassOf(是子類)和equivalentClass(是同義類)屬性將的學科分類聯(lián)系起來。

        5)本體中類的屬性設計

        通過上述步驟建立了科技文獻領域的整體架構(gòu),該架構(gòu)描述了本體的類以及類的層次關(guān)系,但就有類和類的層次關(guān)系還遠遠不能提供科技文獻本體模型所表達的知識信息,需要在本體模型類和類的層次結(jié)構(gòu)的框架基礎上進一步描述這些類的內(nèi)部結(jié)構(gòu),這些類的結(jié)構(gòu)數(shù)據(jù)就是類的屬性,在本體構(gòu)建過程中,類的屬性通??梢苑譃橐韵聝煞N:數(shù)據(jù)類型屬性和對象屬性。

        如表2所示,科技文獻本體模型的類通過類的屬性建立了類的實例之間的關(guān)聯(lián),使科技文獻本體模型中的“科技文獻”類的實例之間的聯(lián)系構(gòu)成了網(wǎng)狀結(jié)構(gòu),在“科技文獻”類的眾多屬性中,“學科分類”屬性是最重要的一個,該屬性指定科技文獻所屬的學科分類,這個屬性的取值必須是“學科分類”的實例,這樣就建立起來科技文獻信息和學科分類之間的關(guān)系,因此“學科分類”屬性是連接文獻信息和學科分類的重要聯(lián)系方式。

        6)屬性特性的設計

        屬性PROPERTY的特性有翻轉(zhuǎn)性、傳遞性、對稱性、相同性、函數(shù)性等等,可以根據(jù)實際情況進一步設置。屬性的特性名稱、描述和實例如下:

        翻轉(zhuǎn)特性:一個屬性可以被聲明為另一個屬性的翻轉(zhuǎn)屬性,參照屬性是被參照屬性的翻轉(zhuǎn)屬性。例如文獻A的參照屬性是文獻B,則可以推出文獻B的被參照屬性是文獻A。

        傳遞特性:屬性可以被聲明為傳遞的,比如綜合類和綜合A類的名字不同,但擁有相同的實例。

        同義特性:兩個屬性可以被聲明為相同的,比如綜合類和綜合A類的名字不同,但擁有相同的實例。

        文獻信息類的屬性特性根據(jù)技文獻本身的特點,比如在科技文獻本體模型的設計中,文獻信息類的對象屬性有同義詞、相關(guān)文獻、包含…的部分、是…的一部分、被參照、參照等特性。

        7)實例的創(chuàng)建

        通過上述六個步驟創(chuàng)建了科技文獻本體模型的類、類的層次關(guān)系以及類的屬性之后,就可以定義某個類的實例。類的實例之間關(guān)聯(lián)關(guān)系可以通過屬性來進行確定,科技文獻本體模型的設計過程已經(jīng)完成,創(chuàng)建科技文獻本體實例的過程也就是對科技文獻實例進行語義標注的過程,每篇技文獻對應一個實例。

        3 結(jié)論

        本文對本體構(gòu)建方法、描述語言等關(guān)鍵技術(shù)進行研究,按照本體構(gòu)建方法的指導下,結(jié)合領域?qū)<业慕ㄗh,建立出科技文獻領域本體模型,并進一步把科技文獻進行標注,完成科技文獻本體庫的構(gòu)建工作。本體模型的構(gòu)建過程是一個反復迭代、不斷發(fā)展完善的過程,科技文獻本體在實際工作過程中,可以在現(xiàn)有的工作基礎上進一步擴展和完善科技文獻領域本體。

        [1] 趙偉,等.基于本體的語義網(wǎng)檢索模型及關(guān)鍵技術(shù)研究[J].計算機工程與設計.2011,(01):145-148.

        [2] Gruber T R . A Translation Approach to Portable Ontology Specif i cations[J].Knowledge Acquisition. 1993, 5: 199-220.

        [3] Studer R, Benjamins V R and Fensel D.Knowledge Engineering,Principles and Methods[J].Data and Knowledge Engineering. 1998,25(1-2):161-197.

        猜你喜歡
        學科分類實例本體
        基于學科識別功能的中國學位服色彩設計研究
        絲綢(2024年7期)2024-12-31 00:00:00
        Abstracts and Key Words
        哲學分析(2023年4期)2023-12-21 05:30:27
        對姜夔自度曲音樂本體的現(xiàn)代解讀
        中國音樂學(2020年4期)2020-12-25 02:58:06
        審計學成為一級學科可行性研究
        中醫(yī)藥信息學教育發(fā)展歷程回顧與學科發(fā)展現(xiàn)狀分析
        《我應該感到自豪才對》的本體性教學內(nèi)容及啟示
        文學教育(2016年27期)2016-02-28 02:35:15
        基于學科分類下的交互式電子白板設備應用績效評價
        完形填空Ⅱ
        完形填空Ⅰ
        Care about the virtue moral education
        卷宗(2013年6期)2013-10-21 21:07:52
        亚洲国产精品久久久久秋霞小说| 五码人妻少妇久久五码| 日本精品av中文字幕| 亚洲av无码专区国产乱码4se| 性色av闺蜜一区二区三区| 青草热久精品视频在线观看| 国产午夜三级一区二区三| 日韩爱爱视频| 最新亚洲视频一区二区| 亚洲一区二区二区视频| 国产精品免费av片在线观看| 精品久久久久久久中文字幕| 久久99精品久久久久久齐齐百度| 亚洲国产精品成人av| 国产午夜视频在线观看免费| 久久久久成人精品无码中文字幕 | 吃奶呻吟打开双腿做受视频 | 亚洲成人日韩| 国产成人久久精品77777综合| 男女啪啪动态视频在线观看| 欧美激情肉欲高潮视频| 国产熟妇搡bbbb搡bb七区| 东京热无码人妻中文字幕| 人妻少妇中文字幕,久久精品 | 色拍自拍亚洲综合图区| 亚洲伊人久久一次| 国产一级黄片久久免费看| 国产精品亚洲av高清二区| 少妇内射兰兰久久| 国产三级欧美| 日本一区二区高清视频在线| 手机在线看片| 青草国产精品久久久久久| 乱人伦人妻中文字幕不卡| 成人国产精品三上悠亚久久| 69一区二三区好的精华| 国产成人77亚洲精品www| 色综合久久精品中文字幕| 成人免费无码大片a毛片抽搐色欲 日本动漫瀑乳h动漫啪啪免费 | 亚洲啪啪色婷婷一区二区| 美女高潮黄又色高清视频免费|