亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        大數(shù)據(jù)技術(shù)應(yīng)用于地理國情數(shù)據(jù)分析的探討

        2020-11-27 09:28:51聞紹川
        商品與質(zhì)量 2020年24期
        關(guān)鍵詞:全文檢索國情集群

        聞紹川

        大連智慧星云科技有限公司 遼寧沈陽 110034

        1 綜合分析系統(tǒng)總體架構(gòu)

        分布式搜索引擎ElasticSearch(簡稱ES)是一個(gè)開源的、基于Lucene 的分布式搜索引擎,可以提供穩(wěn)定、實(shí)時(shí)、可靠的檢索服務(wù),具有高可用、易擴(kuò)展、實(shí)時(shí)等特點(diǎn)。ES 使用分布式索引文件存儲(chǔ),可執(zhí)行快速分析搜索,并擴(kuò)展到上百臺(tái)服務(wù)器,能處理PB 級(jí)結(jié)構(gòu)化或非結(jié)構(gòu)化數(shù)據(jù)。本文在分析基于ES 的數(shù)據(jù)組織、分布式集群、分布式索引、地理形狀與地理位置聚合、實(shí)時(shí)空間查詢、統(tǒng)計(jì)分析等關(guān)鍵技術(shù)的基礎(chǔ)上,設(shè)計(jì)開發(fā)了一種面向Web 應(yīng)用的地理國情綜合分析系統(tǒng),采用1000 多萬條地表覆蓋數(shù)據(jù)進(jìn)行模擬試驗(yàn),驗(yàn)證了其分析的高效性和可用性[1]。

        1.1 地理國情時(shí)空大數(shù)據(jù)存儲(chǔ)結(jié)構(gòu)設(shè)計(jì)

        地理國情地表覆蓋成果數(shù)據(jù)包含林地、耕地、草地、建設(shè)用地、水域等多種地物類型,是地理國情普查成果中重要的組成部分,其數(shù)據(jù)量大,復(fù)雜度高,具有較強(qiáng)的代表性。

        1.2 ES 分布式集群

        搭建的ES 集群包含5 臺(tái)虛擬機(jī)服務(wù)器,集群內(nèi)部選出一個(gè)主節(jié)點(diǎn),其他作為數(shù)據(jù)節(jié)點(diǎn),主節(jié)點(diǎn)同時(shí)也作為數(shù)據(jù)節(jié)點(diǎn)使用。使用Head、Kibana 等客戶端管理整個(gè)集群,并調(diào)用集群服務(wù)。集群使用了復(fù)制和分片技術(shù),索引文件分片數(shù)為5,復(fù)制數(shù)為1,分片和復(fù)制特性的同步啟用可起到高性能分布式存儲(chǔ)及容災(zāi)備份的作用。

        1.3 分布式索引構(gòu)建

        采用CSV 文本作為空間數(shù)據(jù)交換格式。CSV 文本中每一行表示一個(gè)空間要素,用逗號(hào)分隔屬性內(nèi)容,空間對(duì)象使用WKT 方式表達(dá)。將ArcGISFileGeodatabase 空間數(shù)據(jù)轉(zhuǎn)換為WKT 字符串,最后在ArcMap 中將屬性表導(dǎo)出為文本格式。

        在執(zhí)行數(shù)據(jù)分析前,首先需要將時(shí)空大數(shù)據(jù)寫入ES 集群中。本文基于ESJavaAPI 開發(fā)了專門的數(shù)據(jù)維護(hù)客戶端,客戶端逐行讀取CSV 文本,按逗號(hào)切割,并指定每個(gè)字段的存儲(chǔ)類型,完成預(yù)處理后再調(diào)用ESJavaAPI,發(fā)送至ES 集群主節(jié)點(diǎn)進(jìn)行索引構(gòu)建。由于時(shí)空大數(shù)據(jù)中存在需要模糊搜索的文本信息,因此引入了IK分詞器(IKAnalyzer)來解決中文分詞問題[2]。

        1.4 地理對(duì)象索引模型

        時(shí)空大數(shù)據(jù)中包含的地理空間對(duì)象體積龐大,必須引入空間索引算法才能對(duì)其進(jìn)行快速空間檢索。ES 中提供了2 種索引算法,地理哈希(Geo-hashPrefixTree)和象限四叉樹(QuadPrefixTree),ES 默認(rèn)使用地理哈希算法。地理哈希是一種將經(jīng)緯度坐標(biāo)編碼成字符串的方式,把整個(gè)地球分為32 個(gè)單元的格子,每個(gè)單元的格子可以再分解成32 個(gè)單元,不斷重復(fù)。象限四叉樹算法和地理哈希算法類似,但每個(gè)層級(jí)都是4 個(gè)單元。地理哈希算法適用于沒有空間關(guān)聯(lián)關(guān)系的點(diǎn)數(shù)據(jù),象限四叉樹算法適用于鄰接邊問題比較普遍的線、面等復(fù)雜數(shù)據(jù)。

        1.5 地理國情綜合統(tǒng)計(jì)分析

        地理國情綜合統(tǒng)計(jì)分析服務(wù)是以地理國情地表覆蓋數(shù)據(jù)為基礎(chǔ)的實(shí)時(shí)地理分析服務(wù),提供對(duì)某一區(qū)域的快速查詢和統(tǒng)計(jì)分析服務(wù)。系統(tǒng)允許用戶在瀏覽器端提交行政區(qū)劃、空間范圍、時(shí)間范圍、統(tǒng)計(jì)字段等參數(shù),分析服務(wù)可快速返回查詢統(tǒng)計(jì)詳情,結(jié)果以可視化圖表的形式展示。地理國情綜合統(tǒng)計(jì)分析服務(wù)的分析功能包括全文檢索、基本統(tǒng)計(jì),空間檢索、綜合統(tǒng)計(jì)分析、格網(wǎng)分析等服務(wù)接口。

        1.5.1 全文檢索

        系統(tǒng)可以對(duì)特定字段執(zhí)行模糊搜索、精確匹配、多字段檢索、范圍搜索、通配符檢索等常規(guī)全文檢索操作,并支持檢索結(jié)果的過濾和排序。具體操作時(shí),使用ESAPI 的match 和query 查詢語句,返回結(jié)果為JSON 數(shù)組,數(shù)組中每個(gè)JSON 對(duì)象包含CC、CCNAME 等所有屬性及空間字段信息,用戶也可以定制請(qǐng)求返回感興趣的字段。返回內(nèi)容包含WKT 空間字段,系統(tǒng)可將詳細(xì)信息展示在Web 前端地圖上。本查詢接口還支持服務(wù)端分頁功能。

        1.5.2 空間檢索

        空間檢索功能可實(shí)現(xiàn)規(guī)則(或不規(guī)則)格網(wǎng)單元查詢、路網(wǎng)密度計(jì)算、高速公路出入口覆蓋居民地?cái)?shù)量分析等大型統(tǒng)計(jì)分析的實(shí)時(shí)計(jì)算和快速響應(yīng)??臻g檢索功能依賴空間索引來實(shí)現(xiàn),因此執(zhí)行檢索前必須完成所有空間幾何對(duì)象的索引構(gòu)建??臻g檢索需要在查詢語句中添加空間范圍過濾參數(shù),空間范圍過濾參數(shù)支持WKT、GeoJSON 等格式,可以是點(diǎn)、線、面任意一種類型。ES 中通常使用組合查詢語句,并將空間對(duì)象字符串放入指定的filter 參數(shù)中,返回結(jié)果與常規(guī)全文檢索功能相同[3]。

        1.5.3 基本統(tǒng)計(jì)分析

        基本統(tǒng)計(jì)分析即計(jì)算滿足在一定約束條件下,某類型的最大值、最小值、平均值、總和、個(gè)數(shù)。該功能使用StatsAggregation 接口,會(huì)一次返回max、min、avg、sum、count5 個(gè)指標(biāo)值。

        1.5.4 綜合統(tǒng)計(jì)分析

        ES 可在全文檢索或空間檢索的結(jié)果集上進(jìn)行統(tǒng)計(jì),即聚合(Aggregations)。聚合功能為ES 注入了統(tǒng)計(jì)分析的高級(jí)功能,用戶使用簡單的R EST 請(qǐng)求語句就可實(shí)現(xiàn)對(duì)大數(shù)據(jù)的統(tǒng)計(jì)指標(biāo)提取,同樣的工作,在Hadoop 中需要編寫調(diào)試大段的Map R educe 腳本,而在ES 中僅調(diào)用一個(gè)API 就能實(shí)現(xiàn)。除提供類似于SQL 語言中的groupby、avg、sum 等常用函數(shù)外,AggregationsAPI 還支持更復(fù)雜的統(tǒng)計(jì)分析接口,例如平方和、方差、標(biāo)準(zhǔn)差、百分位數(shù)統(tǒng)計(jì),其特有的桶聚合(bucketAggregations)可按一定規(guī)則進(jìn)行分組統(tǒng)計(jì),分組方式包括詞項(xiàng)(Terms)方式、過濾器(Filters)方式、數(shù)值范圍方式(R anges)、時(shí)間段(Dates)方式。例如,可針對(duì)地理國情數(shù)據(jù)CCNAME 類別進(jìn)行分組統(tǒng)計(jì),計(jì)算每個(gè)類別所占總面積的百分比。

        2 結(jié)語

        傳統(tǒng)的地理國情數(shù)據(jù)統(tǒng)計(jì)分析采用專門的GIS 統(tǒng)計(jì)軟件,計(jì)算量大、耗時(shí)久,不具備實(shí)時(shí)響應(yīng)的能力。

        猜你喜歡
        全文檢索國情集群
        家國情 詩詞魂
        中華詩詞(2020年10期)2020-07-22 05:37:10
        海上小型無人機(jī)集群的反制裝備需求與應(yīng)對(duì)之策研究
        一種無人機(jī)集群發(fā)射回收裝置的控制系統(tǒng)設(shè)計(jì)
        電子制作(2018年11期)2018-08-04 03:25:40
        推廣生物乙醇汽油:迫切且合乎國情
        能源(2017年11期)2017-12-13 08:12:36
        Python與Spark集群在收費(fèi)數(shù)據(jù)分析中的應(yīng)用
        勤快又呆萌的集群機(jī)器人
        Oracle數(shù)據(jù)庫全文檢索性能研究
        地理國情監(jiān)測(cè)知識(shí)支持庫初步設(shè)計(jì)
        遙感信息(2015年3期)2015-12-13 07:26:50
        特定國情教情中的中小學(xué)校自主權(quán)
        基于KySou的全文檢索系統(tǒng)的分析與優(yōu)化
        亚洲黄色性生活一级片| 亚洲av鲁丝一区二区三区黄| 亚洲日韩精品欧美一区二区 | 亚洲国产成人va在线观看天堂| 人人妻人人澡人人爽人人dvd| 日本老熟妇毛茸茸| 无码之国产精品网址蜜芽| 18禁成人免费av大片一区| 久久天堂精品一区二区三区四区| 成人做受视频试看60秒| 亚洲色在线视频| 成人综合亚洲国产成人| 日本a级特级黄色免费| 色噜噜狠狠狠综合曰曰曰| 特级黄色毛片视频| 在线日韩中文字幕乱码视频| 强d乱码中文字幕熟女免费| 一个人看的视频www免费| 久久久久亚洲精品天堂| 国产精品老女人亚洲av无| 久久国产成人精品av| 精品福利视频一区二区三区| 99国产综合精品-久久久久| 久久国产精品色av免费看| 99热在线观看| 中文字幕av日韩精品一区二区 | 一本一道vs无码中文字幕| 日本三级欧美三级人妇视频| 国产盗摄XXXX视频XXXX| 区一区二区三区四视频在线观看| 亚洲国产精品成人综合色| 亚洲综合伊人制服丝袜美腿| 亚洲女同av一区二区在线观看| 人人人妻人人人妻人人人| 天躁夜夜躁狼狠躁| 欧美日韩一二三区高在线| 24小时在线免费av| 中文乱码字慕人妻熟女人妻| 国产乱人伦偷精品视频免| 日本免费播放一区二区| 18禁黄污吃奶免费看网站|