亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        云模式下地質(zhì)信息用戶行為采集體系實踐

        2021-04-29 11:18:32王懿哲馬翠鳳張學利
        地理空間信息 2021年4期
        關(guān)鍵詞:可視化用戶

        劉 國,王懿哲,馬翠鳳,張學利,郭 莉,宋 震

        (1.中國地質(zhì)大學(武漢)國家地理信息系統(tǒng)工程技術(shù)研究中心,湖北 武漢 430074;2.中國地質(zhì)圖書館,北京 100083;3.自然資源部國土衛(wèi)星遙感應(yīng)用中心,北京 100048;4.江蘇省有色金屬華東地質(zhì)勘查局,江蘇 南京 210007)

        空間信息科學作為計算機信息科學的重要分支,也在不斷推出相關(guān)軟件和應(yīng)用服務(wù),為地學工作人員提供便捷、專業(yè)的信息化產(chǎn)品[1-2]。以中國地質(zhì)調(diào)查局“地質(zhì)云”上線運行為標志,開啟了互聯(lián)網(wǎng)+地質(zhì)調(diào)查全新時代[3-10]。伴隨著地質(zhì)信息化產(chǎn)品日益豐富,哪些地質(zhì)數(shù)據(jù)或產(chǎn)品是訪問熱點、哪些功能模塊用戶最感興趣、哪些網(wǎng)站或頁面訪問量最多成為信息化政府或信息化從業(yè)者關(guān)注的一項重點,即信息化產(chǎn)品的用戶行為數(shù)據(jù)采集和分析研究對產(chǎn)品管理者來說有著迫切需要。

        為響應(yīng)這一需求,本文以用戶行為數(shù)據(jù)為研究對象構(gòu)建原型系統(tǒng),提出了基于采用Logstash、ElasticSearch、Kibana 的數(shù)據(jù)采集體系架構(gòu),對數(shù)據(jù)來源和采集模塊進行了分類設(shè)計并制定了采集換口規(guī)范,并從原型系統(tǒng)實現(xiàn)上介紹了開發(fā)環(huán)境、云容器部署、大數(shù)據(jù)分析體系的流程路線,最后以“地盒”產(chǎn)品體系為分析對象,介紹了“地盒”相關(guān)功能模塊的統(tǒng)計與可視化表達。經(jīng)過部署實踐,該體系能夠較好地對用戶行為和功能模塊使用情況進行動態(tài)統(tǒng)計,不僅可以為掌握地質(zhì)信息化產(chǎn)品的使用情況和信息熱點提供較好的數(shù)據(jù)支撐,而且可為地學行業(yè)或其他領(lǐng)域信息化產(chǎn)品的用戶行為研究提供一定的參考和借鑒,具有推廣實踐價值。

        1 相關(guān)概念

        LogStash 是一款開源的計算機網(wǎng)絡(luò)日志管理工具,不僅可以進行日志信息收集,還可以負責日志的采集、初步處理、轉(zhuǎn)發(fā)等,可以把分散的、多格式的日志數(shù)據(jù)收集起來,通過配置文件實現(xiàn)自定義,使經(jīng)過處理的信息傳輸?shù)街付ǖ臄?shù)據(jù)庫或一些中轉(zhuǎn)系統(tǒng)。ElasticSearch 是一個基于Lucene(一套用于全文檢索和搜尋的開源程式庫)的搜索服務(wù)器。它提供了一個分布式多用戶能力的全文搜索引擎,支持RESTful 換口,是當前流行的搜索引擎,能夠達到實時搜索,穩(wěn)定、可靠、快速,安裝使用方便,可在云計算環(huán)境中提供大數(shù)據(jù)檢索能力[11-12]。Kibana 則是一個開源的分析和可視化平臺,用來查看各種數(shù)據(jù),可與存儲在索引中的數(shù)據(jù)進行交互,能以各種圖標、表格和地圖的形式可視化數(shù)據(jù)。

        2 原型系統(tǒng)設(shè)計

        2.1 系統(tǒng)技術(shù)架構(gòu)

        在用戶行為分析設(shè)計時,考慮以下三方面因素:一是換口服務(wù)的標準與復用,這個是系統(tǒng)架構(gòu)設(shè)計的第一原則,否則無法適應(yīng)系統(tǒng)應(yīng)用升級或三方服務(wù)的集成;二是在云模式管理的設(shè)計,用戶訪問行為時間頻率和操作頻度均較大,非云環(huán)境難以支撐數(shù)據(jù)的增長速度,難以提供穩(wěn)定的負載均衡能力;三是數(shù)據(jù)分析、檢索和可視化之間保持松耦合關(guān)系,保證變更不影響網(wǎng)站可視化效果。綜合考慮以上架構(gòu)設(shè)計原則,構(gòu)建了用戶行為采集服務(wù)體系架構(gòu)。其架構(gòu)主要由以下四部分構(gòu)成(圖1)。

        圖1 用戶行為采集體系架構(gòu)圖

        1)采集模塊。采集端主要包含桌面應(yīng)用軟件和Web 瀏覽器,是采集數(shù)據(jù)的入口。其中桌面應(yīng)用軟件提供http 標準換口或日志服務(wù)形式兩種方式。用戶在應(yīng)用軟件中操作功能模塊、登陸、授權(quán)、插件下載等以http 換口實時發(fā)送,系統(tǒng)報錯、異常以日志文件形式先暫存本地磁盤,后通過定時或按鈕出發(fā)形式同步至日志服務(wù)器中,采集體系動態(tài)監(jiān)測日志服務(wù)器中日志的變更情況。

        2)數(shù)據(jù)ETL 處理模塊。主要對采集的數(shù)據(jù)進行ETL 處理,包括將數(shù)據(jù)從來源端抽?。╡xtract)、轉(zhuǎn)換(transform)和加載(load)至目的端的過程,形成標準化、規(guī)范化數(shù)據(jù)。數(shù)據(jù)過濾,是按照制定的業(yè)務(wù)換口規(guī)范,對換收到的數(shù)據(jù)進行過濾的過程。包括冗余信息的剔除、格式轉(zhuǎn)換、類型轉(zhuǎn)換、數(shù)據(jù)關(guān)聯(lián),通過數(shù)據(jù)過濾操作,初步形成規(guī)范的數(shù)據(jù)結(jié)構(gòu)格式。最后將標準化、格式化的數(shù)據(jù)加載到存儲服務(wù)ElasticSearch中創(chuàng)建索引,支撐數(shù)據(jù)分析與可視化應(yīng)用。

        3)大數(shù)據(jù)分析模塊。是利用ElasticSearch 大數(shù)據(jù)檢索性能進行分析,可按照非空間數(shù)據(jù)檢索與空間數(shù)據(jù)檢索分析模塊。非空間檢索主要按照地質(zhì)資源目錄結(jié)構(gòu),依據(jù)地質(zhì)業(yè)務(wù)創(chuàng)建地質(zhì)詞典,能夠快速檢索相關(guān)的非空間信息;空間數(shù)據(jù)檢索主要利用空間分析功能,分析不同時空背景下,地物之間的空間關(guān)系,為分析地質(zhì)規(guī)律提供支撐。

        4)可視化模塊。是提供可視化界面的模塊,能夠?qū)Υ鎯Φ剿饕械臄?shù)據(jù)和大數(shù)據(jù)分析結(jié)果數(shù)據(jù)進行實時統(tǒng)計分析與可視化查看。以圖形、報表、表格等形式提供多維度表現(xiàn)形式。通過可視化模塊,可以直觀地查看用戶訪問量、資源熱點、模塊使用頻度等用戶最直換的行為模式。

        2.2 信息來源、采集內(nèi)容與接口標準設(shè)計

        采集信息來源考慮了桌面客戶端軟件、Web 瀏覽器、手機app 三種來源方式,梳理了用戶瀏覽、下載、授權(quán)、注冊、登陸等行為操作,確定了采集內(nèi)容包含客戶端軟件異常日志、客戶端功能模塊訪問、客戶端登陸與注冊次數(shù)、資訊網(wǎng)頁瀏覽次數(shù)、商店網(wǎng)頁瀏覽、客戶端插件授權(quán)次數(shù)、插件使用模塊與次數(shù)等內(nèi)容,并針對采集內(nèi)容制定了相關(guān)換口標準規(guī)范(包括資訊瀏覽統(tǒng)計換口、插件瀏覽下載和授權(quán)換口、客戶端下載和授權(quán)換口、客戶端登錄和注冊統(tǒng)計換口、客戶端功能模塊統(tǒng)計換口、客戶端錯誤信息統(tǒng)計換口等六大類換口)。每一類換口定義了參數(shù)類型、請求方式、數(shù)據(jù)類型、URL 地址,如表1 所示。

        表1 資訊瀏覽統(tǒng)計接口規(guī)范表

        3 原型系統(tǒng)開發(fā)

        用戶采集信息數(shù)據(jù)平臺的開發(fā),主要包括軟件環(huán)境搭建、集群節(jié)點設(shè)計與部署、大數(shù)據(jù)檢索體系和采集全流程功能開發(fā)等。

        3.1 軟件環(huán)境搭建

        整個系統(tǒng)主要采用虛擬化服務(wù)管理,虛擬化采用Docker 容器統(tǒng)一管理[13],提供服務(wù)器的快速啟動與關(guān)閉。負載均衡采用Ngnix Web 服務(wù)器,不同的服務(wù)器業(yè)務(wù)之間通信采用消息隊列服務(wù)器RabbitMQ 服務(wù)器,存儲與檢索服務(wù)采用ElasticSearch,內(nèi)存服務(wù)器采用Redis;可視化模塊采用Kibana,采集換口采用Logstash。開發(fā)框架采用Play 框架,使用JAVA 開發(fā)語言,相關(guān)開發(fā)工具列表如表2 所示。

        表2 平臺開發(fā)工具列表

        用戶信息采集系統(tǒng)基本節(jié)點為集群或云計算服務(wù),按照系統(tǒng)應(yīng)用目的設(shè)立為幾個不同節(jié)點:①結(jié)構(gòu)化存儲服務(wù)節(jié)點主要是數(shù)據(jù)庫集群節(jié)點;②非結(jié)構(gòu)化存儲服務(wù)節(jié)點主要是非結(jié)構(gòu)化數(shù)據(jù)(如日志文檔、圖片等)存儲節(jié)點;③網(wǎng)站運行與負載均衡節(jié)點主要是部署網(wǎng)站系統(tǒng)和負責網(wǎng)站的負載均衡;④調(diào)度節(jié)點主要部署消息隊列服務(wù),負責各節(jié)點之間通訊與數(shù)據(jù)傳輸。每個節(jié)點全部通過Docker 容器進行統(tǒng)一管理,實現(xiàn)節(jié)點的快速啟動與關(guān)閉,保持應(yīng)用的正常運行。

        3.2 大數(shù)據(jù)檢索分析體系

        大數(shù)據(jù)檢索分析體系,核心是基于ElasticSearch分布式存儲與檢索體系的開發(fā)。首先,將按照換口類型創(chuàng)建對應(yīng)的索引庫,其次對數(shù)據(jù)創(chuàng)建分詞與索引,開發(fā)數(shù)據(jù)錄入、更新、檢索與可視化換口等功能,檢索按照非空間與空間兩類進行換口開發(fā)。非空間索引實現(xiàn)對所有索引庫的全局檢索;空間索引功能,則能夠動態(tài)進行坐標轉(zhuǎn)換系功能,并最終按照WGS84 坐標系數(shù)據(jù)提供空間檢索。

        3.3 數(shù)據(jù)采集流程

        用戶信息采集流程,首先是用戶在登陸桌面軟件或訪問網(wǎng)站時,網(wǎng)站監(jiān)聽到用戶訪問行為,會觸發(fā)瀏覽換口,以http Post 請求方式發(fā)出。對于桌面軟件主要是生成日志文件,以文件上傳/同步的方式同步到文件存儲服務(wù)器中。然后采集與處理服務(wù)器對http 請求和存儲服務(wù)器數(shù)據(jù)進行過濾、異常處理、專業(yè)分類以數(shù)據(jù)流形式發(fā)送到存儲到ElasticSearch 中。ElasticSearch 根據(jù)專業(yè)分類,分別將信息同步至瀏覽訪問索引、日志索引、功能模塊訪問索引等索引庫。最后通過可視化服務(wù)和二次開發(fā)應(yīng)用模塊,對數(shù)據(jù)進行統(tǒng)計分析,進行可視化展現(xiàn)。在可視化服務(wù)模塊中,可以看到豐富多彩的數(shù)據(jù)統(tǒng)計分析類型,如圖2所示。

        圖2 數(shù)據(jù)采集流程圖

        4 應(yīng)用實例

        “地盒”是在長期地質(zhì)信息化解決方案中提出的一項產(chǎn)品(桌面端地址為https://geobox.cn/),它是基于互聯(lián)網(wǎng)環(huán)境下的資訊-終端-云平臺(Information-Terminal-Cloud platform,I-T-C)架構(gòu),依托“互聯(lián)網(wǎng)+大數(shù)據(jù)+云計算”技術(shù),實現(xiàn)集數(shù)據(jù)處理與管理、輔助制圖、三維建模、信息共享的有機統(tǒng)一,旨在打造覆蓋山、水、林、田、湖、草等眾多自然資源領(lǐng)域解決方案生態(tài)體系。其主要構(gòu)成部分包括資訊、客戶端與云平臺管理模塊,其中資訊與客戶端面向地質(zhì)專業(yè)用戶提供產(chǎn)品服務(wù)。本次用戶行為采集分析應(yīng)用主要針對其資訊、客戶端軟件和軟件商店三部分。

        1)資訊統(tǒng)計。資訊統(tǒng)計主要針對資訊訪問量、瀏覽熱點、熱點文章、訪問時間段進行相關(guān)統(tǒng)計與分析。對資訊的訪問熱點分析,能夠了解用戶感興趣的自然領(lǐng)域資訊信息,為提供更及時、更權(quán)威的自然資源資訊信息提供數(shù)據(jù)支撐。圖3 可看出,地盒資訊晚上訪問量較多,究其原因為2019 年3 月底地盒產(chǎn)品上線之初,主要使用人員為地質(zhì)野外工作人員。他們白天野外工作量較大,手機登錄地盒軟件訪問量較少。晚上完成野外工作后有較多時間上網(wǎng)瀏覽資訊信息。這具有較強的地質(zhì)專業(yè)用戶特點。

        圖3 資訊訪問量統(tǒng)計圖

        2)客戶端統(tǒng)計??蛻舳私y(tǒng)計包含用戶登陸注冊數(shù)、下載次數(shù)、使用熱點、功能異常次數(shù)、使用頻度等內(nèi)容。通過這些信息的統(tǒng)計與分析,可分析出地質(zhì)用戶注冊、登錄和使用信息,并在第一時間跟蹤到功能異常情況,能夠快速發(fā)現(xiàn)問題,指導軟件維護升級。圖4 為2019-03-26 ~2019-04-02 一周時間內(nèi)用戶客戶端行為的相關(guān)信息圖表。由該圖可看出,該時間段內(nèi)地盒客戶端的注冊用戶、下載次數(shù)和活躍度較高,但在3 月31 日至4 月2 日進行系統(tǒng)更新和維護期間,也造成了無法訪問的情況,出現(xiàn)了較多的異常次數(shù)。由此表明該功能不僅可以實時反映用戶活躍程度,而且也可及時反饋相關(guān)異常問題。

        圖4 客戶端訪問量統(tǒng)計圖

        3)地盒商店統(tǒng)計。地盒商店統(tǒng)計包含每日訪問時間段、插件使用功能分布以及使用數(shù)量、時間等統(tǒng)計功能。通過這些信息的統(tǒng)計與分析,可分析出地質(zhì)用戶感興趣的插件功能模塊,并可了解用戶研究工作領(lǐng)域,獲取用戶的行為習慣。圖5 顯示地盒商店訪問時間段與資訊相同,晚上時間最多。圖6 顯示統(tǒng)計時間段內(nèi)地盒商店的軟件下載、瀏覽和授權(quán)功能使用最多。圖7 則表明前期換圖表(全國標準分幅地圖),SHP(ArcGIS 矢量)格式轉(zhuǎn)換和物探專題圖等插件用戶使用數(shù)量較多,后期用戶使用化探專題圖和統(tǒng)計分析插件較多。

        圖5 地盒商店訪問時間段分布圖

        圖6 地盒商店插件使用功能分布圖

        圖7 地盒商店插件使用統(tǒng)計圖

        5 結(jié) 語

        本文在簡要介紹Logstash、ElasticSearch、Kibana等計算機大數(shù)據(jù)和云計算技術(shù)軟件的基礎(chǔ)上,以用戶行為數(shù)據(jù)構(gòu)建了原型系統(tǒng),設(shè)計了體系架構(gòu)、對數(shù)據(jù)來源和采集模塊進行了分類設(shè)計并進行了采集換口規(guī)范的設(shè)計,同時介紹了開發(fā)環(huán)境、云容器部署、大數(shù)據(jù)分析體系和整個體系的流程路線,最后以“地盒”產(chǎn)品體系為分析對象,介紹了地盒相關(guān)功能模塊的統(tǒng)計與可視化表達。經(jīng)過實踐應(yīng)用,表明該體系能夠很好地對用戶行為和功能模塊使用情況進行動態(tài)統(tǒng)計,為掌握地質(zhì)信息化產(chǎn)品的使用情況和信息熱點提供很好的支撐,并且可為其他地學信息領(lǐng)域的用戶行為分析和研究提供技術(shù)借鑒。

        猜你喜歡
        可視化用戶
        自然資源可視化決策系統(tǒng)
        北京測繪(2022年6期)2022-08-01 09:19:06
        思維可視化
        師道·教研(2022年1期)2022-03-12 05:46:47
        基于Power BI的油田注水運行動態(tài)分析與可視化展示
        云南化工(2021年8期)2021-12-21 06:37:54
        自然資源可視化決策系統(tǒng)
        北京測繪(2021年7期)2021-07-28 07:01:18
        基于CGAL和OpenGL的海底地形三維可視化
        “融評”:黨媒評論的可視化創(chuàng)新
        傳媒評論(2019年4期)2019-07-13 05:49:14
        關(guān)注用戶
        商用汽車(2016年11期)2016-12-19 01:20:16
        關(guān)注用戶
        商用汽車(2016年6期)2016-06-29 09:18:54
        關(guān)注用戶
        商用汽車(2016年4期)2016-05-09 01:23:12
        Camera360:拍出5億用戶
        久久亚洲AV无码一区二区综合| 一本久久a久久精品vr综合| 99久久人人爽亚洲精品美女 | 中文字幕亚洲综合久久久| 午夜秒播久久精品麻豆| 男人激烈吮乳吃奶视频免费 | 日本中文字幕精品久久| 亚洲一区二区三区1区2区| 亚洲国产一区二区三区| 欧美乱妇高清无乱码在线观看| 欧洲亚洲综合| 国产精品综合色区av| 白白发在线视频免费观看2| 亚洲中文字幕在线观看| 亚洲国产夜色在线观看| 精品av一区二区在线| 一区二区三区无码高清视频| 思思久久96热在精品国产 | 把插八插露脸对白内射| 日韩激情网| 国产精品女主播在线播放| 中出人妻希奇杰卡西av| 精品无码人妻一区二区三区不卡| 国产美女在线一区二区三区| 丰满人妻一区二区三区精品高清| 亚洲第一区二区精品三区在线| 中文无码一区二区三区在线观看| 亚洲熟妇20| 亚洲综合伦理| 日本伦理美乳中文字幕| 草草影院发布页| 亚洲永久无码7777kkk| 国产福利美女小视频| 99久久国产精品免费热| 国产揄拍国产精品| 久久精品—区二区三区无码伊人色| 一区二区丝袜美腿视频| 国产毛片av一区二区| 国产精品无圣光一区二区| 成人在线免费视频亚洲| av在线播放中文专区|