亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        高等學校開放數字資源的本體構建和利用

        2020-07-26 14:19:51軒旭
        科技創(chuàng)新與應用 2020年22期
        關鍵詞:知識共享數字資源

        軒旭

        摘? 要;文章通過對于語義Web技術的理論基礎、結構層次和框架的分析,比較不同技術的特點,并給出了語義Web數字資源整合總體框架和流程。根據數字資源的不同類型,利用本體、語義網服務和搜索引擎,提出分布式的數字資源整合方案,實現了主要數據類型的資源共享。探討了從OWL模型到UML模型之間的轉換,并對如何利用語義Web進行開發(fā),提出應注意的問題和相應的解決措施。

        關鍵詞:語義Web;數字資源;知識共享

        中圖分類號:G25? ? ? ? ? 文獻標志碼:A? ? ? ? ?文章編號:2095-2945(2020)22-0014-04

        Abstract: Through the analysis of the theoretical basis, structure and framework of semantic Web technology, this paper compares the characteristics of different technologies, and gives the overall framework and process of semantic Web digital resource integration. According to the different types of digital resources, a distributed digital resource integration scheme is proposed by using ontology, semantic web service and search engine, and the resource sharing of main data types is realized. This paper discusses the transformation from OWL model to UML model, and puts forward some problems that should be paid attention to and corresponding solutions to how to develop with semantic Web.

        Keywords: semantic Web; digital resources; knowledge sharing

        1 背景和需求

        語義Web 是下一代互聯(lián)網發(fā)展的核心技術之一,數字資源的日趨豐富是推動網絡向智能化和自動化方向發(fā)展的重要動力。語義網賦予知識具體的形式,使它具有計算機可讀性,以及對知識庫進行方便的集成和推理。語義Web本身是一個數據網,通過對數據進行各種方式的描述,以便形成具有遵守特定語法和語義的上下文,即具有相互關聯(lián)的語義。數據資源由于需要特定的存儲方式,呈現出表達形式的多樣性,結構化程度不一。而對大量的資源的查詢,為獲得更為準確和針對性的結果,就需要對各種數據進行整合和組織,使之能體現知識的內在聯(lián)系,讓知識的表達完備和清晰。語義Web具有以數據為中心的組織特征以及對知識庫的推理能力,成為對資源進行組織的一種有效方式。

        Web由國際化聯(lián)盟機構W3C進行管理,根據Tim Berners-lee等人的定義:“語義Web不是另外一個Web,它是現有Web的延伸,其中信息被良好的定語了含義,從而使計算機可以更好地協(xié)同人工作?!闭Z義Web提供了在應用、企業(yè)和社區(qū)之間數據共享的通用框架。語義Web搜索技術和語義服務技術是兩項正在發(fā)展的遠未成熟的技術,都已經有了不同程度的實現。語義Web搜索實現了語義標注的索引以及基于標注本體和知識庫的推理,能夠檢索出內容對象并給出明確的關系。語義Web服務通過富含語義的服務信息可以為服務加入計算機可讀性,便于服務的自動的發(fā)現、組合、協(xié)商和調用,便于數據資源的利用,不僅包括服務而且包括數據。

        2 不同形式數據資源的發(fā)現和利用方式

        當今教育、科研、圖書館數字資源存在大量的重復建設,由于各種標準和應用平臺之間的不兼容,本應相互關聯(lián)結構完備的知識卻是以點的或碎片的形式提供給應用者。原因在于當前的檢索技術僅是以關鍵詞作為檢索詞,無法清晰理解語言的含義,并進行必要的推理。通過語義Web能夠把數據資源公開到網絡上,形成具有語義的知識內容,便于搜索和利用。語義Web上的數字資源的表達的方式多種多樣,通過語義Web對信息進行信息的整合,以一個整體的視角來看,即是通過語義Web的本體技術,利用標注、搜索和語義網絡服務組合,把傳統(tǒng)數據資源轉換為具有一定語義的能夠通過Web訪問的數據資源知識庫。語義Web能夠使用導航、搜索或檢索的方式訪問資源,對知識進行有效的組織,并可以進行進一步的推理和利用。導航簡單明了地利用可視化的方式顯示資源的位置和它們之間的聯(lián)系,搜索可以訪問分布于不同位置的資源存儲,而檢索可以進行完備和準確的查詢。傳統(tǒng)數據包括網頁、數據庫、多媒體等內容。不同的數據都可以利用分布網絡的形式,通過超文本鏈接的方式組織起來。對于Web的內容,通過在網頁中嵌入語義或添加標注充實已有的網站,使網頁的內容之間的關系明確,易于人類或者智能代理的理解和利用。各種數據庫的集成,需要利用語義Web技術提供的多種映射功能集成各種知識,以面向特定應用程序的本體作為知識模型和應用程序之間的接口,完成跨領域的信息交換。對于多媒體內容以及文本中的實體的處理,現在仍以手工分類整理為主,采取文本處理的方法,用關鍵詞、創(chuàng)建時間或者特定的元數據等進行標引,成本較高。檢索大多局限于多媒體的外部特征方面,而發(fā)展方向應是基于內容的檢索?;趦热莸臋z索是對多媒體對象的內容及上下文語義環(huán)境所進行的檢索,既能對以文本為代表的離散媒體進行檢索,也可以對聲音、圖像、視頻等連續(xù)媒體進行檢索。其內容包括物理層、邏輯層、語義層三個不同層次。例如圖像的顏色特征、紋理特征、性狀特征屬于物理層,圖像對象的空間位置和相互關系屬于邏輯層,而語義層是圖像表達的意識。通過引入本體和語義標注,為多媒體的深處理提供了新的方法,尤其在多媒體的語義層面。從原始數據到跨領域的信息共享,需要利用本文提到的不同的方法。

        3 引入數據資源到語義豐富的知識庫

        以下從兩個方面對構建知識庫進行說明:(1)語義Web信息整合的基本內容和框架結構。(2)通過本體技術進行整合的原理、過程和方法。

        3.1 語義Web信息整合的基本內容和框架結構

        語義Web的基礎是數據表示、查詢和應用規(guī)則一組標準。語義Web解決的問題主要在于:將Web數據轉化為計數機可以理解的形式;提供一種構建領域知識的模型;不同領域的信息交換。主要技術包括資源描述框架RDF,用于構造的RDFS,以及用于構建和描述的Web本體語言OWL。RDF定義三元組形式的數據模型,在語義網中,信息被表示成陳述的斷言集合,每一個陳述由三部分組成:主語、謂語和賓語。RDFS是一種面向資源描述框架的詞匯表語言,用語義一致的公共詞匯集合對RDF中使用的資源和屬性,表達RDF信息的含義。OWL是面向Web的本體語言,它擴展了RDFS的詞匯表,引入了更多的約束,可進行推理過程,是更高層級的語言。三者之間體現一種進化的關系。

        Tim Berners-lee 在2000年提出最初的語言Web層次模型,其后隨著語義技術的發(fā)展,該模型不斷完善。通過UNICODE和URI層,支持語義Web上的對象和資源標識;XML及命名空間層,支持創(chuàng)建結構化的XML文檔和在Web上交換文檔;RDF和RDFS 層、本體層兩層給出基本數據模型和各種資源的關系;邏輯層和證明層提供公理和推理規(guī)則,進行演繹和證明;信任層提供信任機制。

        大多數的語義Web的框架結構都是一組工具的集合,通常包括3種基礎組件:存儲、推理和訪問。存儲組件是RDF陳述的知識庫,如Sesame、jena存儲系統(tǒng)。推理組件是推理引擎,如Racer、Pellet等。訪問組件是查詢搜索的應用程序處理器。語言、框架和模型通過抽象規(guī)范化標準找出兼容的解決方案。

        3.2 通過本體技術進行整合的原理,過程和方法

        為了利用傳統(tǒng)數據,首先要做的就是把不同形式的數據轉化為以RDF描述的本體方式;然后對不同領域本體進行轉換,使領域本體對準(Ontology alignment),將數據引入到領域知識模型中,形成知識庫;最后通過Web和各種接口訪問分布的知識庫。轉換這些數據的方法正是本文討論的重點內容。數據資源主要有如下幾種:數據庫、XML描述的文檔、網頁、文本、多媒體,不同的形式決定了轉化為本體的復雜程度,而且結構化程度的不同程度決定了向本體轉換的深度和顆粒度程度。按照數據的結構化程度,可以把數據分為結構化數據,即可以用二維表結構來邏輯表達實現的數據:存儲在數據庫里的數據;半結構化數據:就是介于完全結構化數據和完全無結構的數據之間的數據,它一般是自描述的,數據的結構和內容混在一起,沒有明顯的區(qū)分,能用樹或圖的模型表示。包括HTML文檔、XML文檔和各類報表等;非結構化數據:聲音、圖像、視頻等多媒體文件。轉換這些數據的方法正是整合資源的重點內容。根據結構化程度不同,把數據轉換為RDF格式主要有以下幾種方式:

        3.2.1 對結構化的數據-數據庫數據的轉換

        對于數據庫和其它數據規(guī)范程度較高、數據量大的數據處理,是語義Web的重要任務,RDF和OWL與關系數據庫一樣,都適用于對實體-關系模型中的信息進行建模,可以把數據庫的表和列映射到本體的類和屬性上。目前已有多種工具(如D2RQ、SquirrelRDF)把關系數據庫中數據轉換為虛擬的RDF圖,作為一個SPARQL查詢的端點被訪問,或直接從SQL結果生成RDF,也可以制定一個流式的寫RDF文件接口程序,進行大批量的轉換。

        3.2.2 對于半結構化數據的轉換

        (1)基于XML格式的數據轉換。網絡上有海量的XML數據資源可以使用,XML是樹形結構,每個節(jié)點包含節(jié)點的屬性和子節(jié)點,XMLschema用來表示文檔中節(jié)點的數據類型和預期節(jié)點,而RDF三元組的圖結構是表示使用屬性聯(lián)結資源的陳述。由于將結構和屬性轉換為資源和關系很難找到通用的方法,所以要作具體考慮。從XML轉換到RDF需要較多的方法和步驟。利用可擴展樣式表語言轉換XSTL是一種常用的方式。它首先生成用于影射的模版,然后將源文檔進行解析,按路徑對XML文檔樹的節(jié)點進行匹配,處理節(jié)點的結構和取值,生成對應的RDF文檔。這種方法的好處是可以把轉換的配置保存在程序的外部,當源文檔發(fā)生變化時,并不需要對程序作新的改變。

        (2)對任意的Java對象的轉換和數據公開。Java Reflection API允許對任意對象進行操作,首先推斷該對象是哪一個類的實例,隨后得到這些類的信息,包括屬性名稱、修飾符和合屬性,然后為每一個對象生成類型信息、屬性和值的信息,最后進行序列化成輸出流,存儲為RDF文件。由于很多數據形式能夠通過不同的方式最終轉換成Java數據對象。如以下兩種方式都可以進行XML到Java對象轉換,a.通過JAXB(Java Architecture for XML Binding簡稱JAXB)產生Java類的集合,XML文檔的節(jié)點被表示成protected類型的成員變量,然后把XML中的數值編出(unmarshal)到對象中,產生Java對象(圖1)。b.或者利用文檔對象模型DOM解析XML文檔,然后將其裝載在Java對象中,所以這是一種一般化的方法。

        (3)對于RDFa和各種微格式解析和轉換。RDFa是一個W3C推薦標準,用于在XHTML網頁中插入嵌入式語義。微格式是整合到XHTML網頁中的支持語義表述性表達式的XML標簽,是基于詞匯的集合。要將它們抽取到語義Web應用程序中,需要相應的解析器來處理,通過正確解析后便可以用來構建RDF文檔。對于RDFa而言,它本身已經是RDF格式,所需關注的只是如何從網頁抽取。

        3.2.3 對于非結構化數據的轉換

        多媒體文件對于人類是很容易理解的,而計算機對圖像、圖片、視頻、音頻、文本文檔、地圖等數據類型的理解十分困難。通過Web標簽系統(tǒng),用戶可以對Web中的數據塊、圖像、視頻加標注,增加對Web內容的支持。但是標簽僅僅是一些單詞或短語,除自身的含義外,無法提供給計算機可以識別的語義,畢竟非結構化的文本無法很好的描述非結構化的數據。如果在實現過程中,利用語義標簽標注的方法,就可以把各種非結構化數據轉化為結構化的語義標注描述的數據,產生相應的RDF文件。此方法是通過在一個本體中對標簽進行定義,形成一個標簽本體,對標注詞匯集和本體的標準化,進而產生用戶可以用來標注的語義標簽,為數據提供了無歧義的語言描述。

        猜你喜歡
        知識共享數字資源
        價值網絡關系結構躍遷中知識共享模式演變
        西部獨立學院教師知識共享現狀與對策研究
        基于ISM和AH的虛擬社區(qū)知識共享影響因素研究
        信息自由與版權法的變革
        現代法學(2016年6期)2016-12-08 17:15:04
        美術教科書使用應把握的幾個視角
        圖書館員新角色
        建立中文DOI標識在科技期刊出版中的作用
        高校數字資源云服務平臺的建設研究
        評價高校圖書館數字資源綜合服務能力
        高職校企合作模式下的知識共享激勵機制研究
        成才之路(2016年15期)2016-06-18 17:28:32
        91性视频| 日韩精品成人一区二区三区| 日本艳妓bbw高潮一19| 97久久精品无码一区二区天美| 丰满老熟妇好大bbbbb| 欧美日本亚洲国产一区二区| 毛片av在线播放亚洲av网站| 国产黄色精品高潮播放| 日本一道本加勒比东京热| 中文字字幕在线中文乱码解| 亚洲av乱码一区二区三区林ゆな| 国产女人水真多18毛片18精品 | 国产大学生粉嫩无套流白浆| 国产成人精品精品欧美| 国产精品va在线观看一| 日本高清一区二区三区在线 | 成激情人妻视频| 日本熟女视频一区二区三区| 六月婷婷亚洲性色av蜜桃| 色综合久久蜜芽国产精品| 亚洲中文字幕在线第二页| 久久不见久久见免费视频7| 日韩欧美亚洲中字幕在线播放| 亚洲精品成人久久av| 国产免费二区三区视频| 特级毛片a级毛片100免费播放| 亚洲视频天堂| 少妇激情一区二区三区| 国内永久福利在线视频图片| 少妇私密会所按摩到高潮呻吟| 国产精品久久无码一区二区三区网| 久久99国产亚洲高清| 国产精品人成在线观看不卡| 国产在线无码不卡影视影院| 亚洲巨乳自拍在线视频| 日韩精品成人无码AV片| av免费一区在线播放| 久久精品国产亚洲av影院毛片| 人妻少妇偷人精品无码| 亚洲国产韩国欧美在线| 久久久久久久中文字幕|