亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        全國礦產資源潛力評價成果數(shù)據(jù)智能檢索方法研究

        2017-09-18 02:44:54趙亞楠朱月琴李朝奎肖克炎范建福李秋平
        中國礦業(yè) 2017年9期
        關鍵詞:評價

        趙亞楠,朱月琴,李朝奎,肖克炎,范建福,李秋平

        (1.湖南科技大學地理空間信息技術國家地方聯(lián)合工程實驗室,湖南 湘潭 411201;2.國土資源部地質信息技術重點實驗室,北京 100037;3.中國地質調查局發(fā)展研究中心,北京 100037;4.中國地質科學院礦產資源研究所,北京 100037;5.西北大學城市與環(huán)境學院,陜西 西安 710127)

        全國礦產資源潛力評價成果數(shù)據(jù)智能檢索方法研究

        趙亞楠1,朱月琴2,3,李朝奎1,肖克炎4,范建福4,李秋平5

        (1.湖南科技大學地理空間信息技術國家地方聯(lián)合工程實驗室,湖南 湘潭 411201;2.國土資源部地質信息技術重點實驗室,北京 100037;3.中國地質調查局發(fā)展研究中心,北京 100037;4.中國地質科學院礦產資源研究所,北京 100037;5.西北大學城市與環(huán)境學院,陜西 西安 710127)

        針對礦產資源潛力評價成果數(shù)據(jù),提出使用Hadoop平臺下的HDFS對海量數(shù)據(jù)進行存儲,構造地質礦產資源數(shù)據(jù)存儲模型。使用支持單條記錄快速查詢的HBase數(shù)據(jù)庫管理其元數(shù)據(jù),并進行礦產資源潛力評價成果數(shù)據(jù)的快速檢索,同時,在HBase上設計多級索引目錄支持非主鍵查詢,解決了HBase只支持簡單的基于主鍵索引的缺點,實現(xiàn)了對礦產資源潛力評價成果數(shù)據(jù)的智能檢索,并通過實驗進一步驗證該方法的正確性和可行性。

        礦產資源;潛力評價;成果數(shù)據(jù);Hadoop平臺;HBase多級索引方法

        1979~1985年和1992~1996年,這兩段時間我國先后開展了成礦遠景區(qū)劃工作和第二輪礦產資源潛力評價工作,對主要的成礦區(qū)帶進行了礦產資源潛力評價?!皵?shù)字地球”、“數(shù)字國土”等項目的開展,也使得地質數(shù)據(jù)也進入了“大數(shù)據(jù)”時代[1]。實現(xiàn)海量地質數(shù)據(jù)管理的同時如何高效、快捷的從全國礦產資源潛力評價成果數(shù)據(jù)中獲取所需數(shù)據(jù)則顯得至關重要。因此,需要一種方法,既能解決結構化與非結構化海量地質數(shù)據(jù)的存儲問題,又要實時、高效的進行數(shù)據(jù)檢索。Hadoop是當前十分流行的基于Share-nothing的分布式處理系統(tǒng),具有高效率的數(shù)據(jù)處理功能、容易拓展等優(yōu)點[2]。HDFS作為底層基礎設施,為云計算提供了高可靠性、高性能的存儲服務,可用于解決地質大數(shù)據(jù)的存儲問題。由于單純的HDFS文件系統(tǒng)不太適合低延遲的訪問應用,因此,用支持高效檢索的分布式數(shù)據(jù)庫HBase來滿足其檢索需求。針對礦產資源潛力評價成果數(shù)據(jù),設計列式存儲表格,將礦產資源潛力評價元數(shù)據(jù)存儲于HBase中,便于高效檢索。同時,設計HBase多級索引目錄,并通過實驗證明,該方法具有可行性。

        1 理論計算檢索技術方法研究現(xiàn)狀

        1.1大數(shù)據(jù)的智能檢索方法研究現(xiàn)狀

        礦產資源潛力評價成果數(shù)據(jù)是通過礦產資源勘查和總結地質調查成果數(shù)據(jù)得到,可用于科學的評價未知礦的潛力,對于指示找礦具有重要的意義。伴隨著大數(shù)據(jù)時代的到來,如何迅速的從冗余的大數(shù)據(jù)中提取所需信息是人們仍需解決的問題。隨著近幾年數(shù)據(jù)處理等技術的快速發(fā)展,NoSQL技術已成為一個熱門的研究領域,各種NoSQL數(shù)據(jù)庫產品也不斷地被開發(fā)出來,例如HBase數(shù)據(jù)庫。不同于傳統(tǒng)數(shù)據(jù)庫,NoSQL數(shù)據(jù)庫放棄了RDBMS所遵循的“12 Codd’s rules”里的很多規(guī)則,同時在存儲和應用等方面也做出了創(chuàng)新,很難對它的檢索方法進行統(tǒng)一定義,因為它們本身就缺乏一個相對統(tǒng)一的技術解決方案[3]。本文歸納了主要的鍵值對型和列式存儲模型的非關系數(shù)據(jù)庫檢索方法。

        1)單級索引方面。即“行健索引”或“主鍵索引”,其實現(xiàn)機制與關系數(shù)據(jù)庫所采用的B+Tree等方案類似。

        2)二級索引方面。NoSQL由于具有弱原子性、一致性、隔離性、持久性等特點和開源分布式的特性,使其在達到數(shù)據(jù)低冗余及高度一致性的條件下實現(xiàn)二級檢索較為困難,目前也僅有Cassandra等幾種方法支持二級檢索。

        3)全文索引方面。NoSQL只能借助Lucene等工具包由開發(fā)者根據(jù)實際需要進行開發(fā)實現(xiàn)。

        Hadoop是一個可部署于多臺廉價機器上的分布式處理體系,被廣泛應用于大數(shù)據(jù)存儲、管理等方面。如何結合Hadoop實現(xiàn)海量數(shù)據(jù)的高效查詢,學者們針對具體的應用情況從不同的角度進行了大量的研究。如,利用HBase建立并存儲索引表及索引數(shù)據(jù),通過分布式倒排索引方法實現(xiàn)了網(wǎng)頁的快速查詢檢索[4];使用應用程序將R-樹寫入到HBase中,實現(xiàn)HBase的多條件查詢[5];通過設計一致性哈希的分布式內存緩存機制,來實現(xiàn)HBase的基于非主鍵檢索和基于范圍的檢索[6];使用HDFS保存索引文件來實現(xiàn)對HDFS的文件進行分布式查詢[7];通過lucene信息檢索庫來實現(xiàn)HBase全文檢索的功能[8]。

        1.2礦產資源潛力評價成果數(shù)據(jù)管理現(xiàn)狀

        1.2.1 礦產資源潛力評價成果數(shù)據(jù)概況

        全國潛力評價成果數(shù)據(jù)包含專題內容多,來源范圍廣,覆蓋大,是全國地質機構的成果匯總,數(shù)據(jù)總量達到了13T,其中包括了二十多個礦種,四十七個項目、九個類型的地質數(shù)據(jù)[9]。主要包含了MapGIS格式的WT點文件、WL線文件、WP圖形文件;JPG、TIF及MSI格式的圖片數(shù)據(jù);XML和TXT的元數(shù)據(jù)文件、DOC的說明文件及XLS的表格數(shù)據(jù)。其中矢量數(shù)據(jù)是全國礦產資源潛力評價數(shù)據(jù)模型規(guī)定的成果數(shù)據(jù),采用全國統(tǒng)一系統(tǒng)庫,利用MapGIS 67繪制而成。

        1.2.2 礦產資源潛力評價數(shù)據(jù)管理模式現(xiàn)狀分析

        20世紀60年代起,美國便加大地質數(shù)據(jù)庫的研究,并投入了大量資本,其他發(fā)達國家緊隨其后,根據(jù)各自國家地質情況,運用網(wǎng)格計算、海量圖庫管理技術、多類型空間數(shù)據(jù)集成等技術,建立起關于各自國家重力、磁力、水文、礦產資源分布等方面的數(shù)據(jù)庫[10]。我國的地質數(shù)據(jù)管理工作也在穩(wěn)步前行,其管理系統(tǒng)是地理信息系統(tǒng)技術、數(shù)據(jù)庫技術以及網(wǎng)絡技術的綜合應用[11]。自2007年國土資源部開展了全國礦產資源潛力評價項目,礦產資源潛力評價信息管理系統(tǒng)的建立已成為國內學者的研究熱點。葉江等[12]結合MapGIS K9和GIS二次開發(fā)方法,實現(xiàn)了西藏地區(qū)礦產資源潛力評價數(shù)據(jù)管理體系;左超群[13]在Oracle 11G及MapGIS地理數(shù)據(jù)庫的基礎上,建立了礦產資源潛力評價數(shù)據(jù)模型;朱靜蘋等[14]通過MapGIS、SOL Server 2008及GeoMAG軟件,完成江蘇礦產資源潛力評價成果數(shù)據(jù)集成。

        2 礦產資源潛力評價成果數(shù)據(jù)智能檢索

        礦產資源潛力評價成果數(shù)據(jù)量大,且數(shù)據(jù)結構復雜,包含了矢量空間數(shù)據(jù)、遙感影像數(shù)據(jù)、文本等,其中非結構化數(shù)據(jù)增長較快。因此,構建一套地質大數(shù)據(jù)的智能檢索系統(tǒng),完成海量地質數(shù)據(jù)穩(wěn)定高效的智能檢索尤為重要。全國礦產資源潛力評價成果數(shù)據(jù)智能檢索模型主要包括三個功能模塊:數(shù)據(jù)存儲模塊、并行計算模塊和智能檢索模塊,結構圖如圖1所示。

        2.1數(shù)據(jù)存儲模塊

        從當前大數(shù)據(jù)存儲技術發(fā)展來看,基于Hadoop的數(shù)據(jù)存儲技術是具有研究意義和實際利用價值的,Hadoop是一個開源分布式的平臺,它通過分布式文件系統(tǒng)HDFS來實現(xiàn)底層存儲模塊。HDFS具有高容錯性的特點,允許用戶在廉價的物理機上部署分布式系統(tǒng),從而為潛力評價成果數(shù)據(jù)提供了數(shù)據(jù)存儲服務[15]。本文基于Hadoop構建了礦產資源潛力評價成果數(shù)據(jù)存儲模型(圖2)。

        圖1 智能檢索架構圖

        圖2 礦產資源潛力評價成果數(shù)據(jù)存儲模型

        圖2通過HDFS及其相關技術把底層的物理存儲接口統(tǒng)一化,并通過虛擬化方法將系統(tǒng)中的存儲設備映射為一個統(tǒng)一的資源進行管理,從而實現(xiàn)多個DataNode協(xié)調工作,將全國礦產資源潛力評價成果數(shù)據(jù)存儲于HDFS上,通過并行計算將索引文件保存在HBase列式存儲表中,完成數(shù)據(jù)的高效存儲。

        2.2并行計算模塊

        MapReduce作為并行編程模型[16]被主要用來進行大數(shù)據(jù)的并行計算,其工作過程主要分為:map階段和reduce階段。本文在MapReduce的基礎上,使用HBase提供的TableOutputFormat方法,實現(xiàn)礦產資源潛力評價成果索引數(shù)據(jù)快速導入HBase。在map階段,MapReduce將HDFS上的全國礦產資源潛力評價成果元數(shù)據(jù)分成固定大小的分片,然后將各個分片分解成鍵值對的形式,這里表示為。Hadoop會為每一個split創(chuàng)建一個map任務用來執(zhí)行用戶自定義的map函數(shù),此時將作為輸入鍵值對從而得到中間值,這里表示為。接著以k2排序并將與k2對應的value組合在一起形成元組。最后根據(jù)key值的范圍將進行分組。reduce階段則將從不同的map中接收的數(shù)據(jù)整合在一起并進行排序,該過程調用用戶編寫的reduce函數(shù),對輸入的元組進行相應的處理,得到并輸出到HBase上。本文將存儲于HDFS的一個5萬數(shù)據(jù)量的文本數(shù)據(jù),經過MapReduce并行算法導入HBase形成索引表的程序執(zhí)行情況。任務執(zhí)行情況如圖3所示。

        2.3智能檢索模塊

        2.3.1 礦產資源潛力評價成果數(shù)據(jù)索引表設計

        HBase將礦產資源潛力評價成果索引表數(shù)據(jù)以列式存儲表的形式存儲,從而形成一個稀疏多維度的排序映射表[17-18]。HBase中,表名(Table Name)用作唯一標識一張表;行關鍵字(RowKey)作為主鍵,用作唯一標識一行數(shù)據(jù),在HBase中對行數(shù)據(jù)進行查詢時,可通過單個行關鍵字、給定行健范圍及全表掃描三種形式進行;列位于列族下,數(shù)量沒有嚴格的規(guī)定,可根據(jù)用戶的需求進行增加,從而確保了HBase存儲的靈活性。

        HBase不同于關系數(shù)據(jù)庫,它沒有嚴格的形態(tài)規(guī)定,既包含了矢量圖形數(shù)據(jù),又包含了文本類型數(shù)據(jù),而存儲表的數(shù)據(jù)記錄也可能包含不同大小的列。因此,本文設計了全國礦產資源潛力評價成果數(shù)據(jù)索引表邏輯模型與物理模型。

        2.3.1.1 邏輯模型(有序映射的映射集合)

        HBase通過坐標系統(tǒng)來查詢單元里的數(shù)據(jù):[行健,列族,列限定符,時間版本],設計礦產資源潛力評價成果數(shù)據(jù)索引表邏輯模型如圖4所示。

        在理解圖4模型概念時,可以將這些坐標從里往外看,認為開始以時間版本為Key、數(shù)據(jù)為Value建立單元映射,接著以列限定符為Key、單元映射為Value建立列族映射,最后以行健為Key、列族為Value建立表映射。

        圖3 MapReduce任務執(zhí)行圖

        圖4 礦產資源潛力評價成果數(shù)據(jù)索引表邏輯模型

        2)物理模型(面向列族)

        HBase中的列族下面包含了列,各列族在磁盤上都會有各自的HFile集合,這樣就形成了物理隔離,從而允許數(shù)據(jù)在HFile層面上分別進行管理,存儲在HFile里的地質礦產資源潛力評價索引數(shù)據(jù)物理模型如圖5所示。

        該礦產資源潛力評價成果數(shù)據(jù)索引表物理模型中的各列下沒有空記錄,如果有空數(shù)據(jù)則HBase在該列將不會存儲數(shù)據(jù),因此HBase列式存儲表是面向列的,一行數(shù)據(jù)中同列族的需要物理的存儲在一處。則以55290602072625為rowkey的數(shù)據(jù)在HFile中的存儲是完整的。如果數(shù)據(jù)有多個列族,同時各列族下有潛力評價成果數(shù)據(jù),那么每個列族使用自己的HFile意味著,當從HBase中讀取數(shù)據(jù)時不需要讀取這一行中的所有數(shù)據(jù),只需讀取用到的部分列族中的數(shù)據(jù),這樣則實現(xiàn)了數(shù)據(jù)的高效存儲與快速讀取。

        2.3.2 HBase多級索引方法

        HBase是基于Hadoop之上的一種非關系型數(shù)據(jù)庫,為海量數(shù)據(jù)的存儲和管理提供了一套具有高可擴展性的技術和方法,同時它提供實時高效的大數(shù)據(jù)查詢分析能力。由于HBase只支持基于主鍵的快速檢索,而不支持基于非主鍵的數(shù)據(jù)查詢,這使得HBase的應用受到了極大地限制。本文根據(jù)礦產資源潛力評價成果數(shù)據(jù),提出了一套基于依據(jù)元數(shù)據(jù)管理表的多級索引方案,其一、二級索引如圖6和圖7所示。

        圖5 礦產資源潛力評價成果數(shù)據(jù)索引表物理模型

        圖6 礦產資源潛力評價成果元數(shù)據(jù)多級索引(第一級)

        在圖6和圖7中,索引表的RowKey設計比較簡短,避免了組合RowKey造成的元數(shù)據(jù)冗余問題,同時也避免了RowKey字段過長導致系統(tǒng)無法緩存更多的其他數(shù)據(jù)而導致內存的有效利用率降低的問題。檢索過程如下。

        首先,當客戶端想檢索符合cf:map=“552906重力資料應用”的cf:address的值,根據(jù)HBase主鍵查詢,需要全表掃描Component才能得到需要的數(shù)據(jù),然而,通過多級索引方法,只需檢索Map表,從Map表中找到一級表的RowKey,然后從對應的列簇中獲取符合條件的數(shù)據(jù)集合,接著檢索程序會在這個小集合中抽取出符合條件的value值,再將檢索到的value值賦給Component表,定位到相應的cf:address,從而進一步調用存儲在HDFS中的礦產資源潛力評價成果數(shù)據(jù)。

        由于地質礦產資源潛力評價成果數(shù)據(jù)具有較復雜的層次關系,多級索引方法同時設計了Mineral表,用來表示各屬性之間的層次關系,同時避免了設計過于繁瑣的主鍵,方便快速檢索。假設檢索符合cf:mineral=”5529毒重石”下包含了哪些圖件,即Component表對應的主鍵是多少。這時,可以檢索Mineral表,通過Rowkey ”5529毒重石”來得到對應的Value值,同時以該Value值作為新的Rowkey去檢索Map表得到它包含的圖件信息,從而實現(xiàn)智能檢索。

        圖7 礦產資源潛力評價成果元數(shù)據(jù)多級索引(第二級)

        3 礦產資源潛力評價成果數(shù)據(jù)智能檢索實驗

        3.1HBase優(yōu)化前后對比試驗

        3.1.1 硬件環(huán)境

        實驗環(huán)境為7臺虛擬機搭建的集群,其中3臺為DataNode,1臺為NameNode,3臺為Zookeeper和HBase,表1給出了硬件環(huán)境。

        表1 集群配置情況

        3.1.2 HBase優(yōu)化前后檢索對比實驗

        為了驗證基于礦產資源潛力評價成果元數(shù)據(jù)多級索引表格在檢索方面的優(yōu)勢,分別選取了5萬條、10萬條、15萬條、20萬條、25萬條、30萬條的數(shù)據(jù),從中檢索符合cf:map= “552901成礦地質背景”的cf:name及對應的礦產資源潛力評價成果數(shù)據(jù),檢索結果如圖8所示。

        圖8 HBase優(yōu)化前后檢索時間對比柱狀圖

        從圖8可以看出,本文設計的多級索引表格在地質礦產資源潛力評價成果數(shù)據(jù)檢索方面與傳統(tǒng)HBase相比有較大優(yōu)勢,這是因為,傳統(tǒng)的HBase在RowKey上建立了類B+樹索引,可以支持高效的基于主鍵的數(shù)據(jù)查詢,由于缺少非主鍵索引的能力,因此在面對非主鍵查詢時只能通過全表掃描Component表的方式找出符合條件的數(shù)據(jù)。而多級索引表格,則可通過檢索前一張表的RowKey,得到的Value值賦給Component表作為二級RowKey,從而避免Component表的全表掃描,節(jié)省大量時間。

        3.2HBase與Oracle對比實驗

        3.2.1 硬件環(huán)境

        表2給出了測試用到的硬件環(huán)境,其中Oracle采用單節(jié)點,HBase則是基于Hadoop集群在7臺電腦上部署的集群,其中,3臺PC作為DataNode,1臺PC作為NameNode,3臺PC配置Zookeeper、HBase。

        3.2.2 數(shù)據(jù)檢索對比試驗

        為了對比HBase多級索引表與傳統(tǒng)關系數(shù)據(jù)庫的數(shù)據(jù)查詢效率,將地質礦產資源潛力評價成果元數(shù)據(jù)分別導入Oracle數(shù)據(jù)庫和HBase數(shù)據(jù)庫,在試驗中用來實驗的數(shù)據(jù)量分別為50萬條、100萬條、150萬條、200萬條、250萬條,每次均抽取50萬條,測試基于Oracle、基于HBase多級索引表的實驗,每組數(shù)據(jù)實驗三次,取平均值作為實驗結果如圖9所示。

        表2 測試數(shù)據(jù)庫硬件環(huán)境

        圖9 數(shù)據(jù)檢索時間對比柱狀圖

        從圖9可以看出,在數(shù)據(jù)量較少時,Oracle在礦產資源潛力評價成果元數(shù)據(jù)表的檢索方面比HBase略占優(yōu)勢。然而,隨著數(shù)據(jù)量的增長,Oracle的檢索時間呈現(xiàn)快速上升的趨勢,尤其當數(shù)據(jù)量達到250萬條時,檢索耗時與200萬條的數(shù)據(jù)量耗時相比上升了約37%。HBase在數(shù)據(jù)量較少時,檢索速率較慢,而隨著數(shù)據(jù)量的增長,檢索優(yōu)勢逐漸突顯了出來。造成上述現(xiàn)象的原因是Hadoop分布式集群的系統(tǒng)開銷時間長于Oracle,當數(shù)據(jù)量小時,Oracle自然占優(yōu)勢。而當數(shù)據(jù)量增大時,HBase是基于列存儲的,進行字段查詢時,可直接定位到該列,避免了全表掃描,同時設計的多級索引表把檢索的負擔主要分配到了RowKey上,節(jié)省檢索時間。而Oracle是基于行存儲的,從一個表中無論檢索幾個字段,都需要將表中相關的數(shù)據(jù)全部掃描一遍,因此隨著數(shù)據(jù)量的增大,查詢速度漸不及HBase。

        4 結 論

        本文結合大數(shù)據(jù)智能檢索研究現(xiàn)狀,將HBase數(shù)據(jù)檢索技術應用于礦產資源潛力評價成果數(shù)據(jù)智能檢索領域,針對地質數(shù)據(jù)情況提出了相關的方法改進,并通過實驗驗證了方法的可行性。

        1)本文設計的多級索引表格在地質礦產資源潛力評價成果數(shù)據(jù)檢索方面較傳統(tǒng)HBase有較大優(yōu)勢。

        2)當數(shù)據(jù)量很少時,傳統(tǒng)關系數(shù)據(jù)庫檢索效率高,而當數(shù)據(jù)量急劇上升時,本文的智能檢索方法則展示出了較大優(yōu)勢。

        [1] 嚴雯英.基于MapGIS與Oracle的地質空間數(shù)據(jù)庫設計與實現(xiàn)[D].湘潭:湖南科技大學,2016.

        [2] Pan J,Biannic Y L,Magoulès F.Parallelizing multiple group-by query in share-nothing environment:a MapReduce study case[J].Acm International Symposium on High Performance Distributed Computing,2010:856-863.

        [3] 劉家志.基于Hadoop架構和多級索引技術的醫(yī)學影像存儲檢索系統(tǒng)研究[D].成都:電子科技大學,2014.

        [4] 萬軼,向廣利.基于hadoop和hbase的分布式索引集群研究[J].信息技術與信息化,2015(1):102-103.

        [5] 陳新鵬.基于HBase的數(shù)據(jù)生成與索引方法的研究[D].北京:北京郵電大學,2013.

        [6] 葛微,羅圣美,周文輝,等.HiBase:一種基于分層式索引的高效HBase查詢技術與系統(tǒng)[J].計算機學報,2016(1):140-153.

        [7] 孫永超.基于Hadoop的信息檢索系統(tǒng)研究[J].情報探索,2016,1(8):125-130.

        [8] 鄒敏昊.基于Lucene的HBase全文檢索功能的設計與實現(xiàn)[D].南京:南京大學,2013.

        [9] 左群超,葉亞琴,文輝,等.中國礦產資源潛力評價集成數(shù)據(jù)庫模型[J].中國地質,2013,40(6):1968-1981.

        [10] 吳湘寧.地質環(huán)境數(shù)據(jù)倉庫聯(lián)機分析處理與數(shù)據(jù)挖掘研究[D].武漢:中國地質大學(武漢),2014.

        [11] 沈泉飛,顧和和,張海榮,等.礦產資源管理信息系統(tǒng)設計與開發(fā)[J].測繪與空間地理信息,2007,30(4):21-24.

        [12] 葉江,張鈴,郭娜,等.基于MapGIS K9數(shù)據(jù)中心的礦產資源潛力評價信息管理系統(tǒng)開發(fā)與實現(xiàn)——以西藏地區(qū)為例[J].國土資源科技管理,2013,30(6):81-86.

        [13] 左群超.礦產資源潛力評價數(shù)據(jù)模型研發(fā)、應用與數(shù)據(jù)集成方法技術體系[J].地質通報,2015,34(12):2334-2351.

        [14] 朱靜蘋,尚培穎,狄群,等.江蘇礦產資源潛力評價成果數(shù)據(jù)集成及應用[J].地質學刊,2015,39(3):400-403.

        [15] 孫永超.基于Hadoop的信息檢索系統(tǒng)研究[J].情報探索,2016,1(8):125-130.

        [16] Nguyen Andrew V,Wynden Rob,Sun,Yao.HBase,MapReduce,and Integrated Data Visualization for Processing Clinical Signal Data[J].AAAI Spring Symposium-Technical Report 2011:40-44.

        [17] Franke Graig,Morin Samuel,et al.Distriuted Semantic Web Data Management in HBase and MySQL Cluster[C].Proceedings of the 2011 IEEE 4th International Conference on Cloud Computing,CLOUD 2011:105-112.

        [18] Yang Jin,Tang Deyu,Zhou Yi.A Distributed Storage Model for EHR Based on HBase[C].Proceedings of the 2011 4th International Conference on Information Management,Innovation Management and Industrial Engineering,ICIII 2011:369-372.

        Researchontheintelligentretrievalmethodofthenationalmineral’spotentialevaluationachievementdata

        ZHAO Yanan1,ZHU Yueqin2,3,LI Chaokui1,XIAO Keyan4,F(xiàn)AN Jianfu4,LI Qiuping5

        (1.National-Local Joint Engineering Laboratory of Geospatial Information Technology,Hunan University of Science and Technology,Xiangtan411201,China;2.Key Laboratory of Geological Information Technology of Ministry of Land and Resources,Beijing100037,China;3.Development and Research Center,China Geological Survey,Beijing100037,China;4.Institute of Mineral Resources,Chinese Academy of Geological Sciences,Beijing100037,China;5.College of Urban and Environmental Science,Northwest University,Xi’an710127,China)

        Based on the national mineral resource’s potential evaluation achievement data,this paper puts forward that the HDFS of Hadoop platform can be used to store and construct the data storage model of geological minerals.We Uses the HBase which supports fast query of individual records to manage its metadata and realize the rapid retrieval of mineral resources potential evaluation achievement data.At the same time,we designs multi-level index catalog in HBase to achieve the non-primary key query.We correct the defect of the HBase which only support primary key index and achieve the goal of the intelligent retrieval base on mineral resources potential evaluation result data.Then we verified the correctness and feasibility of this method by the contrast experiment.

        mineral resource;potential evaluation;results data;Hadoop platform;HBase multilevel index method

        2017-06-27責任編輯:趙奎濤

        國土資源部公益性行業(yè)科研專項項目資助(編號:201511079)

        趙亞楠(1992-),女,山東淄博人,碩士研究生,主要從事地質大數(shù)據(jù)技術研究工作,E-mail:1364176112@qq.com。

        朱月琴(1975-),女,博士,高級工程師,主要從事地質大數(shù)據(jù)、地圖綜合與可視化研究工作,E-mail:yueqinzhu@163.com。

        P208

        :A

        :1004-4051(2017)09-0072-07

        猜你喜歡
        評價
        SBR改性瀝青的穩(wěn)定性評價
        石油瀝青(2021年4期)2021-10-14 08:50:44
        中藥治療室性早搏系統(tǒng)評價再評價
        自制C肽質控品及其性能評價
        寫作交流與評價:詞的欣賞
        中學語文(2015年21期)2015-03-01 03:52:11
        基于Moodle的學習評價
        關于項目后評價中“專項”后評價的探討
        HBV-DNA提取液I的配制和應用評價
        有效評價讓每朵花兒都綻放
        模糊數(shù)學評價法在水質評價中的應用
        治淮(2013年1期)2013-03-11 20:05:18
        保加利亞轉軌20年評價
        国产办公室秘书无码精品99| 国产AV无码无遮挡毛片| 在线播放偷拍一区二区| 日本国产亚洲一区二区| 国产午夜福利片| 久草国产视频| 熟妇人妻丰满少妇一区 | 亚洲旡码a∨一区二区三区 | 久久亚洲精品一区二区| 人妻久久一区二区三区| 一进一出一爽又粗又大| 欧美日韩亚洲成人| 国产亚洲午夜高清国产拍精品不卡| 亚洲乱码中文字幕综合久久| 97在线观看播放| 尤物视频一区二区| av在线男人的免费天堂| 精品国产av一区二区三区四区| 国产真实老熟女无套内射| 日韩国产成人精品视频| 青青草视频网站免费看| 国产精品美女久久久免费 | 欧美黄色免费看| 亚洲成人免费久久av| 日韩人妻不卡一区二区三区| 99久久人人爽亚洲精品美女| 欧美日韩亚洲综合久久久| 国产在线视频网友自拍| 中文字幕一精品亚洲无线一区| 亚洲国产成人久久综合一区77| 女女同性av一区二区三区免费看| 久久国内精品自在自线| 成人欧美一区二区三区的电影| 日韩欧美在线观看成人| 特级黄色大片性久久久| 国产精品成人3p一区二区三区| 91av在线播放| 一区二区免费中文字幕| 精品偷自拍另类在线观看| 99re热这里只有精品最新| 亚洲中文字幕无线乱码va|