亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于本體的農(nóng)業(yè)數(shù)據(jù)集成

        2009-04-29 00:00:00黃春毅
        現(xiàn)代情報(bào) 2009年3期

        〔摘 要〕本文介紹了本體在數(shù)據(jù)集成中的作用,借簽Wrapper/Mediator架構(gòu)模式,提出了基于本體的農(nóng)業(yè)數(shù)據(jù)集成模式,并以一個(gè)簡(jiǎn)單的農(nóng)業(yè)古籍?dāng)?shù)據(jù)集成為例,闡述了此模式的具體應(yīng)用。

        〔關(guān)鍵詞〕本體;農(nóng)業(yè)數(shù)據(jù);數(shù)據(jù)集成

        〔中圖分類號(hào)〕TP391 〔文獻(xiàn)標(biāo)識(shí)碼〕B 〔文章編號(hào)〕1008-0821(2009)03-0062-04

        隨著信息處理技術(shù)的發(fā)展,農(nóng)業(yè)信息急劇增長(zhǎng),產(chǎn)生了大量不同類型的數(shù)據(jù),這些數(shù)據(jù)以不同形式存放在各個(gè)部門的不同應(yīng)用系統(tǒng)中,而且往往處于采集時(shí)的原始狀態(tài),具有異構(gòu)性,包括數(shù)據(jù)結(jié)構(gòu)異構(gòu)和語(yǔ)義異構(gòu)。如何將這些異構(gòu)數(shù)據(jù)進(jìn)行合理有效地集成,成為農(nóng)業(yè)信息共享必需解決的問(wèn)題。

        1 基于本體的農(nóng)業(yè)數(shù)據(jù)集成模式

        語(yǔ)義異構(gòu)(即語(yǔ)義沖突)包括概念模糊、命名沖突和域沖突。利用本體為特定領(lǐng)域的實(shí)體給出名字和描述,使用謂詞來(lái)表示這些實(shí)體之間的關(guān)系。通過(guò)對(duì)概念的嚴(yán)格定義和概念之間的關(guān)系來(lái)確定概念的精確含義,表示共同認(rèn)可的、可共享的知識(shí),從而解決語(yǔ)義異構(gòu)的問(wèn)題。

        在農(nóng)業(yè)數(shù)據(jù)集成中使用農(nóng)業(yè)本體有以下優(yōu)勢(shì):本體提供了一個(gè)豐富的、預(yù)定義的詞匯庫(kù),可作為與數(shù)據(jù)源的穩(wěn)定的概念接口,并且獨(dú)立于數(shù)據(jù)模式;本體表示的知識(shí)足夠支持所有相關(guān)信息源的轉(zhuǎn)換;本體支持一致的管理和非一致數(shù)據(jù)的識(shí)別等。

        本文利用本體在解決語(yǔ)義異構(gòu)上的優(yōu)勢(shì),研究解決農(nóng)業(yè)數(shù)據(jù)集成中語(yǔ)義異構(gòu)的問(wèn)題,借鑒Wrapper/Mediator架構(gòu)方式[1],提出適應(yīng)農(nóng)業(yè)數(shù)據(jù)的集成模式,如圖1所示。

        此模式研究包括:農(nóng)業(yè)數(shù)據(jù)全局本體構(gòu)建、農(nóng)業(yè)數(shù)據(jù)局部本體構(gòu)建、全局本體與局部本體映射,以及局部本體與數(shù)據(jù)源的映射。本文以一個(gè)簡(jiǎn)單的農(nóng)業(yè)古籍?dāng)?shù)據(jù)集成為例,闡述這一模式在農(nóng)業(yè)數(shù)據(jù)集成中的具體應(yīng)用。

        2 農(nóng)業(yè)數(shù)據(jù)全局本體構(gòu)建

        農(nóng)業(yè)數(shù)據(jù)全局本體的建立主要包括確定本體應(yīng)用的目的和范圍、查找術(shù)語(yǔ)(原語(yǔ)),定義全局本體,本體編碼,具體步驟如下:

        2.1 確定本體應(yīng)用的目的和范圍

        應(yīng)用目的是幫助集成與農(nóng)業(yè)古籍有關(guān)數(shù)據(jù),方便知識(shí)共享。應(yīng)用范圍包括農(nóng)業(yè)古籍相關(guān)領(lǐng)域的數(shù)據(jù)。

        2.2 查找術(shù)語(yǔ)

        這是提取數(shù)據(jù)集成領(lǐng)域中詞匯(術(shù)語(yǔ))的過(guò)程。這些詞匯用來(lái)構(gòu)建全局本體的概念或者屬性。通過(guò)了解領(lǐng)域知識(shí),找到該領(lǐng)域中的主要的、關(guān)鍵的概念,并將其提取出來(lái)作為全局本體中的詞匯,由這些全局的詞匯構(gòu)成公共語(yǔ)義詞匯庫(kù),作為待集成數(shù)據(jù)源語(yǔ)義上統(tǒng)一的基準(zhǔn)。提取出來(lái)的詞匯必須是概念明確、無(wú)二義性、領(lǐng)域相關(guān)度高的詞匯。例如:農(nóng)業(yè)古籍相關(guān)術(shù)語(yǔ)提取如下:農(nóng)書、出版機(jī)構(gòu)、研究機(jī)構(gòu)、出版活動(dòng)、研究活動(dòng)、農(nóng)史專家、農(nóng)書作者、姓名、主題、版本等。

        2.3 定義全局本體

        這個(gè)步驟包括3個(gè)方面的內(nèi)容:定義類的等級(jí)結(jié)構(gòu)、定義類的屬性、定義類之間的關(guān)系。

        2.3.1 定義類和類等級(jí)結(jié)構(gòu)

        本文在定義類的等級(jí)結(jié)構(gòu)時(shí)采用自頂向下的方法,在全局本體中,從頂層出發(fā),分為農(nóng)書、機(jī)構(gòu)和活動(dòng);其中:活動(dòng)又分為出版活動(dòng),研究活動(dòng)和收藏活動(dòng),機(jī)構(gòu)又分為研究機(jī)構(gòu),出版機(jī)構(gòu)和收藏機(jī)構(gòu)。先創(chuàng)建父概念,再創(chuàng)建其子概念。其類層次結(jié)構(gòu)如如圖2所示:

        2.3.2 定義類的屬性

        定義類的屬性即是描述這些概念的內(nèi)部結(jié)構(gòu)。從已創(chuàng)建的術(shù)語(yǔ)表中篩選出類后,剩下的大多數(shù)術(shù)語(yǔ)(除一些個(gè)體或?qū)嵗?基本上都是這些類的屬性。這些屬性包括主題、版本等。

        2.3.3 定義類之間的關(guān)系

        關(guān)系定義了本體中不同類之間的聯(lián)系,以及類與數(shù)據(jù)類型之間的聯(lián)系。如圖2所示:關(guān)系對(duì)應(yīng)與圖中連接不同的矩形的邊,表示不同類之間的聯(lián)系。

        2.4 本體的編碼

        使得本體能以計(jì)算機(jī)可以理解的方式表示,從而有效利用本體的語(yǔ)義描述能力。本文采用OWL語(yǔ)言描述本體,使用斯坦福大學(xué)的 protégé本體建模工具進(jìn)行建模。以下是部分OWL文件代碼,以及如圖3所示的本體圖。

        agrbook.owl文件部分內(nèi)容:

        <o(jì)wl:Class rdf:ID=″AgrBook″>

        <rdfs:subClassOf

        rdf:resource=″http:∥www.w3.org/2002/07/owl#Thing″/>

        <rdfs:subClassOf>

        <o(jì)wl:Restriction>

        <o(jì)wl:allValuesFrom>

        <o(jì)wl:Class rdf:ID=″Author″/>

        </owl:allValuesFrom>

        <o(jì)wl:onProperty>

        <o(jì)wl:ObjectProperty rdf:ID=″has″/>

        </owl:onProperty>

        </owl:Restriction>

        </rdfs:subClassOf>

        </owl:Class>

        3 農(nóng)業(yè)數(shù)據(jù)局部本體構(gòu)建

        農(nóng)業(yè)數(shù)據(jù)局部本體是對(duì)農(nóng)業(yè)局部數(shù)據(jù)源的語(yǔ)義描述。使用局部本體的優(yōu)勢(shì)主要體現(xiàn)為以下兩點(diǎn):

        每個(gè)局部數(shù)據(jù)源都可能有不同的數(shù)據(jù)模型,即使相同的數(shù)據(jù)模型也可能有不同的語(yǔ)義異構(gòu)問(wèn)題。通過(guò)對(duì)局部數(shù)據(jù)源的分析,將局部數(shù)據(jù)源的語(yǔ)義信息提取出來(lái),并用形式化的本體建模語(yǔ)言進(jìn)行描述,通過(guò)映射能有效解決同名異義或異名同義等問(wèn)題。

        由于全局本體和局部本體的分離,降低了系統(tǒng)耦合性,使得局部數(shù)據(jù)源的數(shù)據(jù)模式的改變不會(huì)影響到全局本體,能較快的適應(yīng)數(shù)據(jù)源模式頻繁改變的情況。

        農(nóng)業(yè)古籍?dāng)?shù)據(jù)集成中,預(yù)設(shè)存在一個(gè)數(shù)據(jù)源S1主要存儲(chǔ)收藏機(jī)構(gòu)與農(nóng)書信息,其對(duì)應(yīng)局部本體如圖4所示。

        Agrbook(Name,Version,Count,Cname);(農(nóng)書的名稱、版本、數(shù)量和收藏機(jī)構(gòu)名稱)

        Collector(Cname,Address,Type);(收藏機(jī)構(gòu)名稱、地址和類型)

        Collect(Cname,Name);(收藏機(jī)構(gòu)名稱和農(nóng)書名稱)

        同時(shí),存在一個(gè)數(shù)據(jù)源S2主要存儲(chǔ)出版機(jī)構(gòu)與農(nóng)書信息,其對(duì)應(yīng)局部本體如圖5所示。

        Monograph(Aname,Version,Count,Name);(農(nóng)書的名稱、版本、數(shù)量和收藏機(jī)構(gòu)名稱)

        Publisher(Name,Address,Type);(出版機(jī)構(gòu)名稱、地址和類型)

        Publish(Name,Aname);(出版機(jī)構(gòu)名稱和農(nóng)書名稱)

        4 全局本體與局部本體映射

        局部本體是全局本體的局部視圖,局部本體中的概念和關(guān)系在全局本體中可以找到一個(gè)對(duì)應(yīng)的語(yǔ)義上相同的概念實(shí)體,通過(guò)這種映射建立語(yǔ)義上的相關(guān)性。

        具體映射建立方法可以分為以下步驟:概念的映射、屬性的映射和角色的映射。

        4.1 概念的映射

        通過(guò)概念映射解決各個(gè)局部數(shù)據(jù)源的異名同義和同名異義問(wèn)題。

        如局部數(shù)據(jù)源S1中的Agrbook和全局本體中的Agrbook是代表相同的語(yǔ)義概念,則建立起從S1.Agrbook到Agrbook的映射關(guān)系。如圖6所示。

        再如數(shù)據(jù)源S1中用Agrbook表示農(nóng)書,而數(shù)據(jù)源S2中用Monograph表示農(nóng)書。這兩個(gè)概念在語(yǔ)義上是相似的,則通過(guò)建立S1.Agrbook到全局本體中的Agrbook的映射和S2.Monograph到全局本體中的Agrbook的映射,使得兩個(gè)不同名字的概念在語(yǔ)義上得到了統(tǒng)一。如圖7所示。圖6 映射解決異名同義問(wèn)題

        4.2 定義局部本體中的屬性到全局本體中的屬性的映射關(guān)系

        映射建立方法和概念的映射類似。

        4.3 定義局部本體中的角色和全局本體角色的映射關(guān)系

        角色是連接概念之間的關(guān)系,通過(guò)定義每個(gè)局部本體中的角色到全局本體中角色的映射關(guān)系,使得局部本體和全局本體之間的映射關(guān)系不再只是概念之間的對(duì)應(yīng)關(guān)系,擴(kuò)展到路徑之間的映射關(guān)系。局部本體之間的角色路徑對(duì)應(yīng)到了全局本體的角色路徑。

        5 局部本體與數(shù)據(jù)源的映射

        具體的建立方法如下:

        5.1 建立本體中的概念(本體圖中的矩形代表的實(shí)體)和關(guān)系表的映射

        即將本體中的概念對(duì)應(yīng)到關(guān)系數(shù)據(jù)庫(kù)中的表名。

        5.2 建立本體中的屬性和關(guān)系表的映射

        即將本體中的屬性對(duì)應(yīng)到關(guān)系數(shù)據(jù)庫(kù)中關(guān)系表的具體的字段名。

        5.3 局部本體中角色和關(guān)系數(shù)據(jù)庫(kù)的映射

        由于關(guān)系數(shù)據(jù)庫(kù)中實(shí)體之間的關(guān)系主要分為一對(duì)一、一對(duì)多、多對(duì)多3種,不同的關(guān)系模式通過(guò)主鍵和外鍵的方式聯(lián)系起來(lái)。對(duì)于多對(duì)多的實(shí)體關(guān)系,需要單獨(dú)構(gòu)造一個(gè)關(guān)系表,關(guān)系表的主鍵包含了2個(gè)外鍵,它們分別是關(guān)系表聯(lián)系的兩個(gè)實(shí)體的主鍵。

        數(shù)據(jù)源S1和數(shù)據(jù)源S2建立局部本體到數(shù)據(jù)源的映射如表1和表2所示。

        6 結(jié)束語(yǔ)

        農(nóng)業(yè)資源合理高效利用是農(nóng)業(yè)可持續(xù)發(fā)展的重要保證,而農(nóng)業(yè)數(shù)據(jù)共享是農(nóng)業(yè)資源合理高效利用的前提。目前,農(nóng)業(yè)數(shù)據(jù)的開發(fā)利用程度還很低,大量數(shù)據(jù)處在分散狀態(tài),數(shù)據(jù)之間缺乏統(tǒng)一的標(biāo)準(zhǔn)。本文根據(jù)本體在數(shù)據(jù)集成中的作用,提出了將一種基于本體的數(shù)據(jù)集成模式應(yīng)用于農(nóng)業(yè)數(shù)據(jù)集成中,對(duì)當(dāng)前農(nóng)業(yè)數(shù)據(jù)集成中遇到的問(wèn)題提出了一套解決方案。本研究的下一步工作是利用集成的農(nóng)業(yè)數(shù)據(jù)建立一個(gè)基于本體的農(nóng)業(yè)數(shù)據(jù)檢索平臺(tái),實(shí)現(xiàn)數(shù)據(jù)共享。

        參考文獻(xiàn)

        [1]李珊,歷浩,張炯,等.基于本體的異構(gòu)數(shù)據(jù)集成的研究[J].計(jì)算機(jī)工程與設(shè)計(jì),2007,28(6):1460-1462.

        [2]曹玲,何琳.農(nóng)業(yè)古籍本體構(gòu)建與應(yīng)用[J].廣西師范大學(xué)學(xué)報(bào):自然科學(xué)版,2007,(2):1-4.

        [3]鄭婭峰.異構(gòu)數(shù)據(jù)集成的研究與實(shí)現(xiàn)[D].西北大學(xué),2005.

        [4]馮志勇,李文杰,李曉紅.本體論工程及其應(yīng)用[M].北京:清華大學(xué)出版社,2007.

        [5]向紅.基于本體的異構(gòu)數(shù)據(jù)集成系統(tǒng)研究與實(shí)現(xiàn).[D]西安電子科技大學(xué),2007.

        [6]謝能付,王文生.農(nóng)業(yè)知識(shí)本體構(gòu)建方法[J].農(nóng)業(yè)網(wǎng)絡(luò)信息,2007,(8):12-16.

        [7]趙菊華.基于本體的水資源數(shù)據(jù)研究[J].計(jì)算機(jī)應(yīng)用,2007,(10):31-33.

        [8]賈暉.基于本體映射的異構(gòu)數(shù)據(jù)集成中間件HDIM研究[J].現(xiàn)代電子技術(shù),2007,(18):143-145.

        [9]常春.聯(lián)合國(guó)農(nóng)業(yè)與糧食組織AOS項(xiàng)目[J].農(nóng)業(yè)圖書情報(bào)學(xué)刊,2003,(2):14-15.

        琪琪av一区二区三区| 激情欧美日韩一区二区| 国产综合自拍| 精品人妻一区二区三区蜜臀在线 | 精品人妻va一区二区三区| 久久久久无码精品国产app| 一本大道香蕉最新在线视频| 扒开非洲女人大荫蒂视频| 亚洲国产精品久久婷婷| 中国丰满人妻videoshd| 国产美女白浆| 手机av在线观看视频| 精品人妖一区二区三区四区| 中文亚洲欧美日韩无线码| 国产成人综合久久久久久| 午夜片无码区在线| 经典女同一区二区三区| 日韩中文字幕一区二区二区| 天天综合网在线观看视频| 国产精品入口牛牛影视| 一区二区三区日本在线| 久久精品99国产精品日本| 99精品国产综合久久久久五月天| 白丝美女被狂躁免费视频网站 | 中文字幕亚洲精品久久| 久久人与动人物a级毛片| 亚洲最大无码AV网站观看| 国产伦理一区二区久久精品| 在办公室被c到呻吟的动态图 | 日本高清一区二区不卡| 国产无夜激无码av毛片| 天天爱天天做天天爽| 日本人妻伦理片在线观看| 97人妻人人揉人人躁九色| 亚洲av综合色区无码一二三区| 国产真实伦视频在线视频| 国产精品成人久久a级片| 精品人妻系列无码人妻漫画| 国产免费无码一区二区三区| 丝袜 亚洲 另类 欧美| 国产毛片av一区二区|