亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于Virtuoso 的疾病知識RDF 描述與倉儲研究

        2022-07-21 03:40:18李若宇
        無線互聯(lián)科技 2022年9期
        關(guān)鍵詞:數(shù)據(jù)庫方法

        李若宇,陳 磊

        (淮南師范學院 計算機學院,安徽 淮南 232001)

        0 引言

        隨著2020 年暴發(fā)的新冠肺炎疫情席卷全球,各種疾病知識已經(jīng)成為最有價值的信息之一,建立高質(zhì)量的疾病知識庫,有助于推進醫(yī)學現(xiàn)代化,推進全民醫(yī)學知識科普。 現(xiàn)階段傳統(tǒng)主流數(shù)據(jù)庫以關(guān)系型數(shù)據(jù)庫為主,在存儲結(jié)構(gòu)化數(shù)據(jù)時具有成熟的技術(shù)和良好的性能,但疾病知識擁有著明顯的樹狀結(jié)構(gòu)和拓撲結(jié)構(gòu)特征,傳統(tǒng)關(guān)系型數(shù)據(jù)庫難以做到高效的存儲。

        資源描述框架(Resource Description Framework,RDF)是Web3.0 時代語義網(wǎng)技術(shù)中的一個概念,表達為一種基于圖的數(shù)據(jù)類型,常作為知識圖譜的存儲介質(zhì)。 選用RDF 進行疾病知識描述和倉儲具有查詢效率高、擴展性強、對非結(jié)構(gòu)化非關(guān)系型數(shù)據(jù)兼容性較好等特點。 國內(nèi)外基于RDF 技術(shù)開發(fā)的知識庫有清華大學的Xlore、復旦大學的CN-Dbpedia、谷歌的Freebase 和維基的DBPedia。 Openlink 公司的Virtuoso 數(shù)據(jù)庫能夠?qū)崿F(xiàn)RDF 數(shù)據(jù)的倉儲,并使用SPARQL 語句進行數(shù)據(jù)的檢索和操作[1-2]。

        1 知識描述

        1.1 知識建模

        作為語義網(wǎng)中的核心技術(shù),使用RDF 構(gòu)建知識工程時,知識本體被當作資源表示為URI,不同資源間的聯(lián)系以主謂賓的形式進行描述,形成知識圖譜。 構(gòu)成RDF 的數(shù)據(jù)類型包括:(1)URI。 用于標記資源,以網(wǎng)址的形式。 如在疾病知識中,知識本體“高血壓”被標記為資源:。 (2)字面量。 表示具體值。 如字符串值: "腦動脈粥樣硬化"。上述類型數(shù)據(jù)類型可構(gòu)成主謂賓三元組的RDF 原生數(shù)據(jù)形式[3-4]。 RDF 原生數(shù)據(jù)形式如表1 所示。

        表1 RDF 原生數(shù)據(jù)形式

        疾病知識具有明顯的醫(yī)學知識特征,有較規(guī)則的知識結(jié)構(gòu),例如大多數(shù)疾病都包含中英文名稱、就診科室、多發(fā)群體、病癥分類、常見癥狀、診斷方法、治療方法等共同屬性,因此根據(jù)屬性關(guān)系可以對疾病知識進行有效組織。 對疾病知識進行建模的步驟包括:(1)收集知識文檔。 可以從網(wǎng)絡百科、電子書籍等相對準確的資料上收集資料,注意可以采用爬蟲的方式,但是需要對知識的準確性進行人工驗核。 (2)抽取主要屬性。根據(jù)對大多數(shù)疾病知識的研究,歸納通用疾病屬性,建立數(shù)據(jù)字典。

        在圖1 中,唯一編號的ds125 表示知識本體“冠心病”,ds125 下包含有一級屬性中文名、英文名、多發(fā)人群、就診科室、癥狀、治療方法、檢查方法。 值得注意的是,雖然RDF 數(shù)據(jù)模型中的屬性名類似于關(guān)系模型中的字段名,但這里的屬性名可自由搭配屬性值,如屬性“檢查方法”可以連接一個值,也可以連接若干個值。

        圖1 知識本體“冠心病”的RDF 數(shù)據(jù)模型

        1.2 RDF 數(shù)據(jù)描述

        完成知識內(nèi)容建模以后,需要將知識內(nèi)容轉(zhuǎn)化為RDF 描述,轉(zhuǎn)化工作包括拼接前綴、格式化等工作,產(chǎn)出的結(jié)果應該是規(guī)范的RDF 三元組文檔。

        值得注意的是,賓語除了字面量以外,還可能是資源類型。 如“檢查方法”對應的屬性值這里表示為資源而非字串字面量,一方面,因為具體“檢查方法”更趨向于是一個術(shù)語,符合被定義成為RDF 中的資源;另一方面,一種“檢查方法”可能被多種疾病共享,如“心電圖”可以是多種疾病的“檢查方法”,這時與將“心電圖”作為“檢查方法”的疾病資源便建立了聯(lián)系。 如圖2 所示,讓數(shù)據(jù)實體之間(ds125 和ds126)建立豐富的聯(lián)系,體現(xiàn)關(guān)聯(lián)數(shù)據(jù)語義網(wǎng)的核心理念。

        圖2 通過同一種檢查方法連接起來的兩個疾病實體

        2 Virtuoso 數(shù)據(jù)倉儲

        2.1 Virtuoso 數(shù)據(jù)庫簡介

        RDF 數(shù)據(jù)具有明顯的“圖”結(jié)構(gòu),需要使用圖數(shù)據(jù)庫進行組織和存儲,單純的關(guān)系型數(shù)據(jù)庫并不便于存儲RDF 數(shù)據(jù)。 Openlink Virtuoso 數(shù)據(jù)庫支持以圖的形式存儲RDF 數(shù)據(jù),支持使用SPARQL 語句對RDF 數(shù)據(jù)進行DML 和DQL 操作,兼容主流操作系統(tǒng),支持JDBC,ODBC,HTTP API 等主流數(shù)據(jù)訪問接口和多種編程語言,在海量數(shù)據(jù)存儲和處理方面有著不錯的表現(xiàn),同時還支持將關(guān)系數(shù)據(jù)轉(zhuǎn)換為RDF 數(shù)據(jù)的技術(shù)(RDB2RDF)。 除了Openlink Virtuoso 以外,MarkLogic,Jena,GraphDB 等數(shù)據(jù)庫在RDF 數(shù)據(jù)倉儲方面都有著優(yōu)秀特性[5]。

        2.2 知識倉儲

        知識倉儲在這里主要指將組織好的RDF 數(shù)據(jù)存儲至數(shù)據(jù)庫,在將RDF 數(shù)據(jù)導入Virtuoso 數(shù)據(jù)庫時,常常采用SPARQL-Update 語句的方式進行。

        (1)在Virtuoso 數(shù)據(jù)庫的namespace 定義命名空間和對應的前綴,有助于減小輸入冗余。

        @prefix knt:

        @prefix kna:

        此時知識本體可被表示為knt:ds125,屬性可以被表示為kna:屬性。

        (2)SPARQL 語句支持RDF 縮寫形式,下面是相同主語和相同主謂兩種情況下的縮寫示例。 INSERT 語句同SQL 中,表示將數(shù)據(jù)插入數(shù)據(jù)庫,表示存儲數(shù)據(jù)的圖,這里的圖名可以理解成關(guān)系數(shù)據(jù)庫的庫名。

        如圖3 所示,將寫好的SPARQL 語句插入Database>Interactive SQL 頁面中的輸入框,即可完成SPARQLUpdate 語句執(zhí)行,RDF 數(shù)據(jù)插入成功以后,數(shù)據(jù)庫系統(tǒng)會返回被更改的條目數(shù)量。

        2.3 內(nèi)容檢索

        RDF 數(shù)據(jù)的查詢是通過SPARQL-Query 語句執(zhí)行的,可以對已經(jīng)構(gòu)建好的疾病知識內(nèi)容進行檢索。 進入Virtuoso 數(shù)據(jù)庫,先后進入Linked Data 標簽和SPARQL 標簽,即可執(zhí)行正確的SPARQL 語句。 如圖3所示的SPARQL 語句在單機Execute 按鈕后,可檢索按照上述規(guī)則構(gòu)建的“冠心病”的相關(guān)知識[6]。

        圖3 對“冠心病”的知識進行搜索

        繼續(xù)使用SPARQL 語句:SELECT ? s ? o FROM WHERE{? s? o.},可查詢出庫中所有的疾病名稱,結(jié)果如圖4 所示。

        圖4 對庫中所有疾病名稱進行搜索

        例如通過SPARQL 語句:SELECT COUNT(? s)FROM WHERE{? s ? o.},COUNT 關(guān)鍵詞可統(tǒng)計出收錄的所有的疾病條目數(shù)[7-10]。

        3 結(jié)語

        文中以疾病知識的描述和倉儲為研究對象,介紹了RDF 技術(shù)原理,針對疾病知識特點進行分析和建模形成RDF 圖,隨后進行RDF 描述形成有效的RDF 文檔,在Windows 平臺對Virtuoso 數(shù)據(jù)庫進行部署,使用SPARQL 語言實現(xiàn)RDF 數(shù)據(jù)的導入和檢索,并簡要介紹了一些RDF 數(shù)據(jù)庫管理操作,如圖管理、命名空間管理等。 未來還可以使用Virtuoso 數(shù)據(jù)庫的編程接口,實現(xiàn)疾病知識應用的設計與開發(fā)。

        猜你喜歡
        數(shù)據(jù)庫方法
        學習方法
        數(shù)據(jù)庫
        財經(jīng)(2017年15期)2017-07-03 22:40:49
        數(shù)據(jù)庫
        財經(jīng)(2017年2期)2017-03-10 14:35:35
        可能是方法不對
        數(shù)據(jù)庫
        財經(jīng)(2016年15期)2016-06-03 07:38:02
        用對方法才能瘦
        Coco薇(2016年2期)2016-03-22 02:42:52
        數(shù)據(jù)庫
        財經(jīng)(2016年3期)2016-03-07 07:44:46
        數(shù)據(jù)庫
        財經(jīng)(2016年6期)2016-02-24 07:41:51
        四大方法 教你不再“坐以待病”!
        Coco薇(2015年1期)2015-08-13 02:47:34
        賺錢方法
        久久综合加勒比东京热| 97久久久久人妻精品专区| 人妻久久999精品1024| 久久这里只有精品黄色| 亚洲伊人av天堂有码在线| 久久久久成人精品无码中文字幕| 精品国产三级在线观看| 一区二区三区婷婷在线| 白色白色视频在线观看| 成人欧美一区二区三区黑人| 俄罗斯老熟妇色xxxx| 中字无码av电影在线观看网站 | 欧美性videos高清精品| 国产69精品一区二区三区| 丝袜美腿亚洲综合在线播放| 18岁日韩内射颜射午夜久久成人| 亚洲av男人的天堂在线观看| 人妻中出精品久久久一区二| 国产精品亚洲在线播放| 亚洲av综合一区二区在线观看| 一本大道无码av天堂| 亚色中文字幕| 亚洲av日韩综合一区尤物| 含紧一点h边做边走动免费视频| 老少交欧美另类| 日韩Va亚洲va欧美Ⅴa久久| 人妖国产视频一区二区| 国产av旡码专区亚洲av苍井空| 一区二区国产在线观看| 国产一区二区三区视频了| 丝袜美腿在线观看一区| 免费99精品国产自在在线 | 91极品尤物国产在线播放| 一区二区三区av在线| 毛片无码国产| 日日摸夜夜添夜夜添一区二区| 国产精品美女自在线观看| 综合亚洲伊人午夜网| 欧美孕妇xxxx做受欧美88| 精品一区二区三区在线观看l| 国产91精品在线观看|