亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于眾源數(shù)據(jù)的地理知識存儲方法研究

        2021-07-24 16:03:16楊波趙英俊
        世界核地質(zhì)科學(xué) 2021年2期
        關(guān)鍵詞:三元組謂語主語

        楊波,趙英俊

        (核工業(yè)北京地質(zhì)研究院遙感信息與圖像分析技術(shù)國防科技重點實驗室,北京 100029)

        在眾源數(shù)據(jù)中,數(shù)據(jù)的收集和管理是眾源數(shù)據(jù)應(yīng)用的基礎(chǔ)。隨著日常需求量的變化,以單一文件來收集與管理眾源地理知識已經(jīng)無法滿足地理信息應(yīng)用需求。目前眾源數(shù)據(jù)主要利用數(shù)據(jù)庫技術(shù)進行存儲管理。但是,眾源數(shù)據(jù)的地理知識的數(shù)據(jù)節(jié)點和其屬性關(guān)系的復(fù)雜性,造成經(jīng)典關(guān)系數(shù)據(jù)庫無法滿足對眾源地理知識進行存儲的場景需求。因此,本次研究以核電站場景為例,探究核電站眾源地理知識的存儲方法。為了更好地進行三元組地理數(shù)據(jù)的存儲,筆者查閱了相關(guān)研究文獻,發(fā)現(xiàn),當(dāng)前主流方法是利用圖數(shù)據(jù)庫的方法對地理知識數(shù)據(jù)進行存儲[1-4]。本研究首先分析核電站圖數(shù)據(jù)模型和圖查詢語言等模型設(shè)計原理,詳細分析了如何利用各種主流知識圖譜數(shù)據(jù)庫構(gòu)建地理知識圖譜,包括基于關(guān)系數(shù)據(jù)庫的存儲方案、面向資源描述框架(Resource Description Framework,RDF)的三元組存儲結(jié)構(gòu)和知識圖數(shù)據(jù)庫。其次以圖數(shù)據(jù)庫Neo4j為例設(shè)計核電站圖模型數(shù)據(jù)的底層存儲原理,同時梳理圖數(shù)據(jù)索引和查詢處理等關(guān)鍵技術(shù)[5]。最后,以Neo4j為例,針對知識圖譜數(shù)據(jù)庫開源工具進行眾源地理信息的實踐,數(shù)據(jù)結(jié)果與技術(shù)流程可利用于地理信息領(lǐng)域。

        1 眾源數(shù)據(jù)知識模型

        從數(shù)據(jù)模型角度來看,知識圖譜本質(zhì)上是一種圖數(shù)據(jù)[6-9]。不同領(lǐng)域的知識圖譜均需遵循相應(yīng)的數(shù)據(jù)模型。往往一個數(shù)據(jù)模型的生命力要看其數(shù)學(xué)基礎(chǔ)的強弱,關(guān)系模型長盛不衰的一個重要原因是其數(shù)學(xué)基礎(chǔ)為關(guān)系代數(shù)。知識圖譜的初始發(fā)展來自數(shù)學(xué)經(jīng)典圖論理論,在圖論中,圖是二元組G=( )V,E,其中,V是節(jié)點集合,E是邊集合。圖論認為客觀現(xiàn)實可以用實體及其屬性集合來抽取,而眾源數(shù)據(jù)的知識模型也因此發(fā)展而來。

        1.1 資源描述框架

        RDF是萬維網(wǎng)聯(lián)盟(World Wide Web Consortium,W3C)官方認證的W3C指定的知識描述眾源數(shù)據(jù)知識模型。在RDF三元組集合中,單一的眾源事件信息都配有一個身份信息。事件信息的抽取方法是用三元組的形式進行抽取,三元組模型的抽取結(jié)構(gòu)是(s,p,o)[10-11]。其中,s是主語,p是謂語,o是賓語。(s,p,o)表示知識s與知識o之間具有關(guān)聯(lián)p,或表示知識s具有屬性p且其結(jié)果為o。

        圖1所示是核電站員工的基于眾源數(shù)據(jù)的知識圖譜。其中,有運行二部的張某、李某與運行三部的趙某、王某4名研究人員。張某、李某來自運行二部,屬同事關(guān)系。趙某、王某來自運行三部,也屬同事關(guān)系,且李某與趙某屬多元關(guān)系。他們4人共同參與了運營管理和實驗2個項目,其中,實驗項目[12]是屬于運營管理項目。由于受本文內(nèi)容的限制,只做簡要的方法建設(shè),現(xiàn)實中的人員與項目內(nèi)容節(jié)點與屬性的眾源知識遠比圖中所示的復(fù)雜度高。

        值得注意的是,RDF本身的節(jié)點和屬性并無元數(shù)據(jù)信息。各類節(jié)點及屬性的表示方式如圖1中實線四邊形,即圖中的矩形。邊上的屬性存儲方法表示起來稍顯繁瑣,在眾源數(shù)據(jù)的表示過程中,通過抽象一類總節(jié)點本體[13]來對地理實體進行統(tǒng)稱。如在圖2中,通過設(shè)計超節(jié)點ex:參與實例類(ex:zhang,參與,ex:operation)來實現(xiàn)節(jié)點屬性的表達,該節(jié)點通過RDF內(nèi)置屬性rdf:主語、rdf:謂語和rdf:賓語進行眾源地理知識的內(nèi)部建模,其中實例(ex:參與,權(quán)重,0.4)就實現(xiàn)了為原三元組增加邊屬性的效果。

        圖1 A廠眾源知識Fig.1 Crowdsourcing data of A factory

        圖2 眾源知識中邊屬性的表示Fig.2 Representation of edge attributes in RDF graph

        1.2 屬性知識建模

        屬性知識可以說是目前被圖數(shù)據(jù)庫業(yè)界采納最廣的一種圖數(shù)據(jù)模型。屬性知識由節(jié)點集和邊集組成,且滿足如下性質(zhì):

        (1)每個節(jié)點具有唯一的id;

        (2)每個節(jié)點具有若干條出邊;

        (3)每個節(jié)點具有若干條入邊;

        (4)每個節(jié)點具有一組屬性,每個屬性是一個鍵值對;

        (5)每條邊具有唯一的id;

        (6)每條邊具有一個頭節(jié)點;

        (7)每條邊具有一個尾節(jié)點;

        (8)每條邊具有一個標(biāo)簽,表示聯(lián)系;

        (9)每條邊具有一組屬性,每個屬性是一個鍵值對。

        圖3的每個節(jié)點和每條邊均有id,遵照屬性知識的要素,節(jié)點1的出邊集合為{邊11,邊18},入邊集合為{邊10,邊15},屬性集合為{姓名=趙某,年齡=48,部門=運行三部};邊11的頭節(jié)點是節(jié)點5,尾節(jié)點是節(jié)點1,標(biāo)簽是“參與”,屬性集合為{權(quán)重=0.4}。

        圖3 屬性知識示例Fig.3 Example of property graph

        2 眾源知識存儲方法

        為了對眾源數(shù)據(jù)進行有效存儲和管理,調(diào)研發(fā)現(xiàn),眾源數(shù)據(jù)管理方法有三種類型,關(guān)系型、三元組型及原生圖數(shù)據(jù)庫型,通過文獻調(diào)研和核電站數(shù)據(jù)實驗發(fā)現(xiàn),第三種方法最適合本次研究內(nèi)容。其中,關(guān)系數(shù)據(jù)庫擁有40多年的發(fā)展歷史,從理論到實踐有著一整套的成熟體系[14]。數(shù)據(jù)庫體系從層次數(shù)據(jù)庫到關(guān)系數(shù)據(jù)庫轉(zhuǎn)變,這也帶來了一系列商業(yè)數(shù)據(jù)庫的誕生與發(fā)展[15]。以此類推,知識型數(shù)據(jù)管理方法的誕生也催生了一類知識型商業(yè)數(shù)據(jù)管理與存儲產(chǎn)品。因此,本此研究核心部分將要利用知識型數(shù)據(jù)的管理及存儲方法對眾源數(shù)據(jù)進行有效的收集和管理。為此,構(gòu)建了眾源數(shù)據(jù)的知識管理方法、橫向存儲方法、屬性存儲方法、縱向存儲方法、多重查詢方法以及混合管理方法,為基于眾源數(shù)據(jù)的地理知識存儲提供多元存儲方案。

        圖4所示是以收集并處理核電站的眾源數(shù)據(jù)集的RDF數(shù)據(jù)作為知識圖譜進行實驗和舉例。該知識圖譜構(gòu)建了N公司及其董事長陳某和M公司及其董事長劉某的節(jié)點屬性和弧關(guān)聯(lián)。該實驗數(shù)據(jù)對于其他格式的知識圖譜,這種存儲方案同樣適用。

        圖4 核電站眾源數(shù)據(jù)RDF知識圖譜Fig.4 Crowdsourcing data RDF knowledge graph for nuclear power plant

        2.1 知識管理

        知識管理方法的核心組成如下:知識管理方法(主語,謂語,賓語)

        如表1所示,以M和N公司員工為例,對眾源數(shù)據(jù)中的知識信息進行抽取挖掘得到下表。每一個實體代表一個類似的主語節(jié)點,謂語表示屬性信息,賓語是尾節(jié)點知識。

        表1 三元組存儲案例Table 1 Triple storage case

        知識管理方法的優(yōu)點是結(jié)構(gòu)簡單,眾源數(shù)據(jù)的技術(shù)入門比較低[16]。但缺點是規(guī)則混亂,無標(biāo)準(zhǔn)可參考。圖5所示的SPARSQL查詢時查找某年份出生且是某出生地的某公司的董事長,并且可以將該SPARSQL查詢轉(zhuǎn)換為關(guān)系型數(shù)據(jù)庫查詢。

        圖5 SPARQL查詢與SQL查詢對比Fig.5 Comparison between SPARQL query and SQL query

        2.2 橫向存儲

        橫向存儲法的特點是存儲結(jié)構(gòu)框架模式,該方法與知識管理方法不同,這里的方法是將眾源數(shù)據(jù)按照行優(yōu)先的策略進行存儲。具體內(nèi)容如表2所示,其共有5行、5列,限于篇幅省略了若干列。不難看出,橫向存儲法用列創(chuàng)建眾源數(shù)據(jù)的屬性信息,而行用于創(chuàng)建事件的頭節(jié)點內(nèi)容。

        表2 橫向存儲案例Table 2 Horizontal storage case

        橫向存儲方法,其眾源數(shù)據(jù)的核心查詢語法規(guī)則是:

        SELECT主語

        FROM a

        WHERE出生=‘年份’AND籍貫=‘出生地’董事長LIKE‘_%’

        橫向存儲方法的語法,本文用符號a代替為查詢表,而且,單表查詢即可完成該任務(wù),不用進行連接操作。在基于眾源數(shù)據(jù)的地理信息數(shù)據(jù)集中,該數(shù)據(jù)的存儲方法對于行優(yōu)先存儲來說,會出現(xiàn)大量的存儲空間閑置的情況。如果將該方法應(yīng)用到實際場景中,這種方法會增加數(shù)據(jù)庫管理的復(fù)雜度和運營數(shù)據(jù)的成本。

        2.3 屬性存儲

        屬性存儲方法是把橫向存儲方法進行更加詳細的劃分描述,即把一個橫向存儲方法分為人、專業(yè)化公司和母子公司三個分欄。對于圖5中SPARQL查詢,在屬性存儲方法上等價的SQL查詢?nèi)缦滤荆?/p>

        SELECT主語

        FROM人

        WHERE出生=‘年份’AND籍貫=‘出生地’董事長LIKE‘_%’

        該查詢與橫向存儲方法上查詢的唯一區(qū)別是將欄名由a變成了員工。

        表3 屬性存儲方法Table 3 Store of attribute

        屬性存儲方法是在對知識管理方法和橫向存儲法上的優(yōu)化升級,反過來看,知識管理方法和橫向存儲法又是屬性存儲法的特例。按照屬性存儲方法,雖然它彌補了上面兩個方法的缺點,但是,其本身也出現(xiàn)了數(shù)據(jù)冗余的缺點。而且,屬性存儲方法仍然會進行多個表之間的連接操作,從而影響查詢效率。

        2.4 縱向劃分

        縱向劃分起源于美國高等學(xué)府,該方法以三元組的謂語作為劃分維度,將RDF知識圖譜劃分為若干張只包含(主語,賓語)兩列的表,該表的突出特征是以眾源數(shù)據(jù)的屬性信息為分表。也就是說,圖6中分表分別是出生、董事長、業(yè)務(wù)、子公司等眾源屬性信息。

        圖6 縱向劃分存儲方案Fig.6 Vertical partition storage solution

        對于圖6中的SPARQL查詢,在縱向劃分存儲方案中等價的SQL查詢?nèi)缦拢?/p>

        SELECT出生.主語

        FROM出生,業(yè)務(wù),董事長

        WHERE出生.賓語=‘年份’AND業(yè)務(wù).賓語=‘天然鈾’AND出生.主語=業(yè)務(wù).主語AND出生.主語=董事長.主語

        該查詢涉及3項謂語屬性,出生、業(yè)務(wù)和董事長的連接操作。由于謂語表中的行都是按照主語列進行排序的,可以快速執(zhí)行這種以“主語-主語”作為連接條件的查詢操作,而這種連接操作又是常用的。

        2.5 多重查詢

        多重查詢法是對RDF存儲的一種延伸,該方法利用主、謂、賓語之間的概率分布關(guān)系進行自由組合,其典型的三元組排列組合方式如表4所示。因為該方法將所有RDF進行排列組合,這極大地提升了數(shù)據(jù)庫查詢檢索的效率,但也增加了存儲空間的消耗。

        表4 三元組模式查詢能夠使用的索引Table 4 Usable indexes for triple query

        圖7所示的鏈?zhǔn)絊PARQL查詢“查找生于某年份目前是公司的董事長的人”,可以通過spo和pso表的連接快速執(zhí)行三元組模式“?person董事長?company”與“?company行業(yè)?ind”的連接操作,避免了單表的自連接。

        圖7 一個鏈?zhǔn)絊PARQL查詢Fig.7 A chained SPARQL query

        2.6 混合管理

        例如,在表5中的dph欄中,主語劉某的謂語行業(yè)(pred1列)是多值謂語,則在其賓語列(val1)存儲id值lid:1。例如,主語劉某和陳某的謂語董事長都被分配到pred3列,該列也存儲了主語M公司的謂語專業(yè)化公司和直屬單位。

        表5 混合管理方案Table 5 Hybrid management solution

        SELECT a.主語

        FROM dph AS a

        WHERE a.pred1=‘籍貫’AND a.val1=‘出生地’AND a.pred2=‘出生’AND a.val2=‘年份’AND a.pred3=‘董事長’

        從中可以看出,對于知識圖譜的星型查詢,混合管理存儲方案只需查詢dph欄即可完成,無須進行連接操作。

        現(xiàn)在開始存儲以L公司作為主語的三元組,見表6所示。將(L公司,母公司,M公司)進行數(shù)據(jù)添加時,根據(jù)h1的值將謂語母公司存入列pred1。將(L公司,子公司,C廠)進行數(shù)據(jù)添加時,根據(jù)h1的值將謂語子公司存儲到pred2。在對(L公司,業(yè)務(wù),清潔能源)進行數(shù)據(jù)添加時,將謂語業(yè)務(wù)被h1映射到列pred1,但該列已被占用,因而接著被h2映射到列pred3。將(L公司,子公司,B廠)插入到知識庫時,謂語子公司被h1映射到列predk。在把(M公司,直屬單位,X設(shè)計院)添加到知識庫中時,此時數(shù)據(jù)庫原有位置被占用,會自動添加到額外空間內(nèi)容。

        表6 謂語到列映射的散列函數(shù)Table 6 Hash function of predicate-to-column mapping

        為此,構(gòu)建圖著色算法的沖突圖。圖中節(jié)點為知識圖譜中的所有謂語。每對共現(xiàn)謂語節(jié)點之間由一條邊相連。圖著色問題的要求是為沖突圖中的節(jié)點著上顏色使得每個節(jié)點的顏色不同于其在鄰接節(jié)點的顏色,并使所有顏色數(shù)最少。對應(yīng)到謂語映射問題,即為沖突圖中的謂語節(jié)點分配列,使得每個謂語映射到的列不同于其任一共現(xiàn)謂語映射到的列,并使用所用的列數(shù)目最少。圖8給出了圖4中知識圖譜的沖突圖??梢?,對于13個謂語,僅使用了5種顏色,即只需使用5列。需要指出的是,圖著色是經(jīng)典的NP難題,對于規(guī)模較大的沖突圖可用貪心算法求得近似解。

        圖8 沖突圖Fig.8 Interference graph

        3 眾源知識存儲關(guān)鍵技術(shù)

        為了適應(yīng)大規(guī)模知識圖譜數(shù)據(jù)的存儲管理與查詢處理,知識圖譜數(shù)據(jù)庫內(nèi)部針對圖數(shù)據(jù)模型設(shè)計了專門的存儲方案和查詢后處理機制,以圖數(shù)據(jù)庫Neo4j為例創(chuàng)建其存儲核電站知識場景方案。

        這一部分將深入Neo4j圖數(shù)據(jù)庫底層,探究其原生的圖存儲方案。作為對比,將原有的眾源數(shù)據(jù)知識庫與關(guān)系數(shù)據(jù)庫進行存儲原理進行分析。圖9左邊給出了一個全局索引的示例,典型方法是利用B+樹進行全局檢索,如查找“張某”的同事,需要O( logn)帶代價,其中,n為節(jié)點總數(shù)。如果覺得這樣的查找代價還是可以接受的話,那么換一個問題,誰認識“趙某”的查找代價是多少?顯然,對于這個查詢,需要通過全局索引檢查每個節(jié)點,看其認識的人或共事的人中是否有趙某,總代價為O(nlogn),這樣的復(fù)雜度對于圖數(shù)據(jù)的遍歷操作是不可接受的。也有學(xué)者認為,可為“被認識”關(guān)系再建一個同樣的全局索引,但那樣索引的維護開銷就會翻倍,而且仍然不能做到圖遍歷操作代價與圖規(guī)模無關(guān)。

        圖9 鄰接關(guān)系的全局索引示例Fig.9 Example of global index for adjacency

        在圖數(shù)據(jù)庫中,把屬性信息認為是區(qū)別于關(guān)系數(shù)據(jù)庫的關(guān)鍵點,即數(shù)據(jù)庫中最基本、最核心的概念,如關(guān)系數(shù)據(jù)庫中的“關(guān)系”,才能實現(xiàn)真正的“無索引鄰接”特性。在圖6右邊查找“張某”的同事時,可以通過張某的“同事”出邊進行索引。搜索認識“趙某”的員工,可以通過趙某入邊進行索引。當(dāng)然,目前這種方法的時間復(fù)雜度為O(1)。

        Neo4j與其它眾源數(shù)據(jù)知識庫不同,它是將屬性數(shù)據(jù)集和節(jié)點數(shù)據(jù)集分開管理。該方法的提出,使得Neo4j的運行和管理效率都在同行業(yè)數(shù)據(jù)庫中處于領(lǐng)先地位。首先,在Neo4j中是如何存儲圖節(jié)點和邊。圖10所示,在Neo4j中,存儲單個節(jié)點和屬性分別占用9和33個物理存儲單位。其中,節(jié)點集數(shù)據(jù)存儲在neostore.nodestore.db里,在每一個節(jié)點集中分別存儲著不同的記錄信息。包括,相連節(jié)點、本節(jié)點的身份信息、本節(jié)點的屬性信息以及該節(jié)點屬性信息的身份信息等內(nèi)容。在眾源數(shù)據(jù)屬性信息集中,屬性集存儲在neostore.relationshipstore.db里,在單個屬性數(shù)據(jù)中,會依次存儲該屬性物理位置是否使用、該屬性的頭節(jié)點和尾節(jié)點位置信息、還會包含屬性連接節(jié)點相應(yīng)的身份信息,最后還有頭節(jié)點指向下一個節(jié)點的地址以及尾節(jié)點指向下一個節(jié)點的地址信息。

        圖10 Neo4j中節(jié)點和邊記錄的物理存儲結(jié)構(gòu)Fig.10 Physical storage structure of the node and edge records in Neo4j

        圖11所示是以核電站員工為例,用Neo4j的各種節(jié)點集和屬性集進行舉例,來說明各種眾源數(shù)據(jù)的知識信息是如何相互之間進行信息溝通。以張某和趙某節(jié)點為例,二者在存儲關(guān)系上分別屬于數(shù)據(jù)存儲的初始位置。通過二者都關(guān)聯(lián)的同事信息,可以通過虛線鏈接來確定張某與趙某節(jié)點。對于圖中的核心節(jié)點與項目節(jié)點都使用雙向聯(lián)系,而對于單一位置員工的屬性信息,則使用單一方向聯(lián)系。該方法不僅方便查詢各個員工的關(guān)聯(lián)關(guān)系,同時對于眾源知識圖譜添加與管理也非常便捷。

        圖11 Neo4j中圖的物理存儲Fig.11 Physical storage diagram in Neo4j

        例如,由節(jié)點3導(dǎo)航到節(jié)點1的過程為:

        (1)由節(jié)點3知道其第1條邊為7;

        (2)在邊文件中通過定長記錄計算出邊7的存儲地址;

        (3)由邊7通過雙向鏈表找到邊8;

        (4)由邊8獲得其中的終止節(jié)點id(secondNode),即節(jié)點1;

        (5)在節(jié)點文件中通過定長記錄計算出節(jié)點1的存儲地址。

        4 結(jié)果與分析

        當(dāng)前有多種知識圖譜開源及商業(yè)數(shù)據(jù)庫,本文以Neo4j為例,設(shè)計具體的核電站知識存儲過程,Neo4j的1.0版本發(fā)布于2010年。Neo4j是典型的以知識形式進行數(shù)據(jù)存儲與管理的數(shù)據(jù)庫,它不僅規(guī)定了專屬使用語言,而且還提供了數(shù)據(jù)庫專業(yè)的核心案例以幫助初學(xué)者更好地入門。同時,Neo4j還具備OLTP數(shù)據(jù)庫必須的ACID事務(wù)處理功能。

        Neo4j的不足之處在于其社區(qū)版是單機系統(tǒng),雖然Neo4j企業(yè)版支持高可用性(High Availability)集群,但其與分布式圖存儲系統(tǒng)的最大區(qū)別在于每個節(jié)點上存儲圖數(shù)據(jù)庫的完整副本(類似于關(guān)系數(shù)據(jù)庫鏡像的副本集群),不是將圖數(shù)據(jù)劃分為子圖進行分布式存儲,并非真正意義上的分布式數(shù)據(jù)庫系統(tǒng)。如果圖數(shù)據(jù)超過一定規(guī)模,系統(tǒng)性能就會因為磁盤、內(nèi)存等限制而大幅降低。

        開發(fā)者注冊信息后可以免費下載Neo4j桌面打包安裝版,其中包括Neo4j企業(yè)版的全部功能,即Neo4j服務(wù)器、客服端及全部組件。安裝之后打開軟件為Neo4j Desktop數(shù)據(jù)庫管理界面,然后選擇瀏覽器,打開Neo4j瀏覽器。Neo4j瀏覽器是功能完成的Neo4j可視化交互式客戶端工具,可以用于執(zhí)行Cypher語言。使用Neo4j內(nèi)置的電影圖數(shù)據(jù)庫執(zhí)行Cypher查詢,返回“湯姆·漢克斯”所出演的全部電影,如圖12所示。此外,成功啟動Neo4j服務(wù)器之后,會在7474和7473端口分別開啟HTTP和HTTPS。例 如,使 用 瀏 覽 器 訪 問http://localhost:7474/進 入Web界 面,執(zhí) 行Cypher查詢,其功能與Neo4j瀏覽器一致。

        本文以具體知識存儲過程為例。如圖12所示,對核電站的工作人員信息進行代碼案例測試,六名人員與四個地理位置信息的知識結(jié)果見圖12(a),通過分析可以發(fā)現(xiàn),張某與孫某都是來自同一個城市,并且二人是夫妻關(guān)系;在兩類節(jié)點之間,王某是最受同事喜愛的人。從圖12(b)中可以看出,每個員工節(jié)點有不少于一類屬性關(guān)系,這表明各類知識節(jié)點的屬性關(guān)系,不僅僅只是同事和家屬關(guān)系,而且對比(a)與(b)可以看出,實體類的關(guān)系存儲和表示,并非是單一的行或列存儲。對眾源數(shù)據(jù)的地理知識的存儲,表現(xiàn)的具體實例上可以看出是節(jié)點與屬性知識的融合。

        圖12 Neo4j數(shù)據(jù)庫實例Fig.12 Neo4j database instance

        5 結(jié)論

        針對眾源數(shù)據(jù)這一典型數(shù)據(jù)的存儲問題,利用當(dāng)前流行的知識圖譜技術(shù)對眾源數(shù)據(jù)進行存儲,不僅利用關(guān)系數(shù)據(jù)庫的方法,還利用了圖數(shù)據(jù)庫的方法進行存儲。通過對各種方法的對比分析,發(fā)現(xiàn)傳統(tǒng)的關(guān)系數(shù)據(jù)庫在存儲眾源地理信息時,會造成存儲位置上的數(shù)據(jù)稀疏,并且弱化了眾源數(shù)據(jù)中地理知識的相關(guān)關(guān)系。與之對比,圖數(shù)據(jù)的優(yōu)點明顯,不僅可以解決關(guān)系型數(shù)據(jù)庫在存儲眾源地理知識時數(shù)據(jù)存儲稀疏,造成大量空間浪費的問題,而且還可以刻畫了眾源數(shù)據(jù)的關(guān)系特征。最后通過具體案例分析進一步表明,利用知識圖譜數(shù)據(jù)庫存儲眾源地理信息可以達到復(fù)雜度為O(1)的需求。在后續(xù)研究中,應(yīng)進一步優(yōu)化對眾源數(shù)據(jù)的高效率知識抽取和挖掘,以及對抽取知識的智能化推理等問題。

        猜你喜歡
        三元組謂語主語
        基于語義增強雙編碼器的方面情感三元組提取
        軟件工程(2024年12期)2024-12-28 00:00:00
        基于帶噪聲數(shù)據(jù)集的強魯棒性隱含三元組質(zhì)檢算法*
        談?wù)勔龑?dǎo)主語從句的連接詞的用法
        非謂語動詞
        非謂語動詞
        關(guān)于余撓三元組的periodic-模
        非謂語動詞題不難答 石娟
        非謂語動詞
        盤點高考中的特殊句式(二)
        青蘋果(2014年2期)2014-04-29 20:31:27
        英語中的虛主語“it”和漢語中的虛主語“他”異同之比較
        国产成人久久精品一区二区三区 | 人妻少妇精品中文字幕av蜜桃| 厨房玩丰满人妻hd完整版视频| 国产精品九九九无码喷水| 一区二区三区午夜视频在线观看| 亚洲精品国产成人久久av盗摄| 国产精品对白一区二区三区 | 日本japanese丰满多毛| 亚洲AV无码精品蜜桃| 日本午夜一区二区视频| 插入日本少妇一区二区三区| 日本最大色倩网站www| 国产精品久久久av久久久| 亚洲国产成人aⅴ毛片大全| 日本不卡一区二区三区在线观看| 中文字幕漂亮人妻在线| 亚洲日本va中文字幕| 国产成人一区二区三中文| 一区二区三区在线观看视频免费| 日韩有码在线观看视频| 99爱在线精品免费观看| 色老头一区二区三区| 日本一区二区精品色超碰| 很黄很色的女同视频一区二区| 午夜爽爽爽男女污污污网站| 久久天天躁狠狠躁夜夜爽| 日韩欧美在线观看成人| 亚洲女同一区二区三区| 国产精品538一区二区在线| 特黄a级毛片免费视频| 最新在线观看精品国产福利片| 国产精品一品二区三区| 麻豆91蜜桃传媒在线观看| 成人免费看吃奶视频网站| 456亚洲人成在线播放网站| 少妇激情高潮视频网站| 久久亚洲av无码西西人体| 无码一区二区三区AV免费换脸| 久草国产手机视频在线观看| 国产偷国产偷亚洲高清视频| 国产精品久久久久影院嫩草|