亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于Flume的分布式日志聚合系統(tǒng)的研究

        2017-08-29 11:28:54陳軍
        科技視界 2017年11期
        關鍵詞:引擎規(guī)則分析

        陳軍

        【摘 要】互聯(lián)網的迅猛發(fā)展以及大數(shù)據(jù)相關技術的興起,使得日志數(shù)據(jù)的規(guī)模日益劇增,給已有的日志采集及分析系統(tǒng)帶來了挑戰(zhàn);本文結合使用Flume、Elasticsearch 以及 Kibana等技術手段提出了一種分布式的日志采集分析系統(tǒng),從系統(tǒng)設計和架構等方面提出了新的解決思路,并針對Flume的訪問日志進行了實時采集和分析及展示。

        【關鍵詞】日志采集;Flume;Elasticsearch;Kibana

        0 引言

        當前隨著“互聯(lián)網+”時代的到來,分布系統(tǒng)需要處理的數(shù)據(jù)量更大、數(shù)據(jù)種類更豐富和數(shù)據(jù)實時性要求更高,面向分布式實時數(shù)據(jù)的分析技術日趨重要。面對高并發(fā)海量數(shù)據(jù)的實時處理,構建滿足負載均衡、高可擴展性、高可用性和持久化多種特性的數(shù)據(jù)分析系統(tǒng)具有較大挑戰(zhàn)。數(shù)據(jù)采集器在應對高并發(fā)的數(shù)據(jù)推送請求時,應該進行負載均衡,最大程度的減少數(shù)據(jù)的緩存時間;數(shù)據(jù)采集系統(tǒng)的高擴展性主要用于實現(xiàn)異構數(shù)據(jù)源的處理,對結構化和非結構化數(shù)據(jù)的兼容處理;面向數(shù)據(jù)流的實時數(shù)據(jù)分析系統(tǒng)需要通過主-備模式的集群保障系統(tǒng)的高可用;同時要對原始數(shù)據(jù)和數(shù)據(jù)分析指標進行持久化,支持高并發(fā)的寫入。本文以開源的Apache Flume為底層數(shù)據(jù)采集技術,從數(shù)據(jù)聚合的視角對分布式日志系統(tǒng)進行研究。

        1 日志分析技術國內外研究現(xiàn)狀

        在大數(shù)據(jù)時代,日志數(shù)據(jù)分析的多樣化需求催生了多種日志分析技術。Apache Flume、ELK(ElasticSearch+Logstash+Kibana)、Scribe和Chukwa是等到廣泛關注和使用的開源日志分析技術。Flume當前是Apache支持的項目,能夠為高效的采集、聚合和傳輸海量日志數(shù)據(jù)提供分布式、可靠的服務。

        Flume采用agent、cllector和storage agent的三層數(shù)據(jù)采集架構,agent支持console、RPC、text、syslog和tail等多種數(shù)據(jù)形式,cllector將多個agent的數(shù)據(jù)匯總后存儲到storage中。Flume利用多Master機制保障了高可用性,通過Zookeeper實現(xiàn)了配置數(shù)據(jù)的一致性。ELK是將ElasticSearch、Logstash和Kibana三種開源技術集成為一體實現(xiàn)數(shù)據(jù)的采集、過濾、分析和可視化的日志分析技術。Scribe 是由Facebook開發(fā)并開源的日志分析采集系統(tǒng),通過共享隊列將多數(shù)據(jù)源的日志暫存并根據(jù)中央存儲系統(tǒng)的健康程度選擇本地持久化還是推送到中存儲系統(tǒng)。Chukwa是一個基于Hadoop的HDFS和mapreduce計算模型的分布式數(shù)據(jù)采集系統(tǒng),包括agents、adaptor、cllectors和map/reduce jobs四大部件。

        開源日志分析技術涵蓋了普適環(huán)境下的數(shù)據(jù)采集模型的多個步驟:數(shù)據(jù)采集、數(shù)據(jù)緩沖、數(shù)據(jù)過濾與轉換、數(shù)據(jù)存儲?;谄者m環(huán)境下的數(shù)據(jù)采集模型提高數(shù)據(jù)采集的高可擴展性、數(shù)據(jù)緩沖的低延遲和數(shù)據(jù)存儲的高可用性將會是數(shù)據(jù)分析系統(tǒng)的研究熱點。

        2 基于規(guī)則引擎的日志聚合方案

        規(guī)則引擎是與應用程序相嵌套的一種組件,實現(xiàn)了業(yè)務規(guī)則和應用程序代碼的有效分離,適用于規(guī)則推理和業(yè)務編排。在日志分析過程中將繁雜的分離規(guī)則使用規(guī)則引擎進行描述,可以實現(xiàn)分析過程中自動高效的數(shù)據(jù)路由與聚合。Drools是基于rete算法將分離的匹配項以不同內容動態(tài)的構建層次化得匹配樹,是當前效率較高、擴展性好的開源規(guī)則引擎。

        在Flume中,除了agent、channel和sink三種最重要的組件,還有攔截器、channel選擇器、sink處理器等增加Flume靈活性的組件。攔截器是位于agent和channel之間的用于攔截來自數(shù)據(jù)源的各種事件,多個攔截器構成的鏈條構成了漏斗型的數(shù)據(jù)過濾工具。Channel選擇器用來決定將接收到的事件寫入到哪個channel,支持必選和可選兩種類型的參數(shù)配置。sink處理器通過事先設定的sink組對組內多個sink如何從各自的channel讀取事件,進而實現(xiàn)層次化Flume中數(shù)據(jù)推送的負載均衡和故障轉移。在Flume中,所有的組件的集成都是通過讀取Context實例化的鍵值類型的配置信息進行的。因此,為了實現(xiàn)Flume更大程度的靈活性,減少繁瑣的配置型信息的管理,有必要探索充分發(fā)揮規(guī)則引擎規(guī)則推理能力的高效方法。

        在深入分析interceptor、channel和sink可定制化的基礎上,作者對規(guī)則引擎如何與Flume多個組件進行結合進行了抽象。這里以channel選擇器的數(shù)據(jù)路由與聚合規(guī)則為例,對使用Drools規(guī)則引擎定義規(guī)則、生成規(guī)則摘要、構造規(guī)則模型以及規(guī)則執(zhí)行器的處理全過程進行了剖析。提出了具有普適意義的日志聚合規(guī)則編程模型。

        3 分布式日志聚合系統(tǒng)框架

        在分析和研究Flume,以及日志聚合規(guī)則的基礎上,結合日志分析系統(tǒng)分布式、高并發(fā)的特性,將日志聚合系統(tǒng)分成數(shù)據(jù)采集、聚合服務和數(shù)據(jù)可視化三個層次。日志采集主要完成對多樣化數(shù)據(jù)源數(shù)據(jù)的采集,能夠對結構化和非結構化數(shù)據(jù)進行初步的匯總;聚合服務包括高并發(fā)請求的轉化和分離、數(shù)據(jù)流服務和日志數(shù)據(jù)的聚合;數(shù)據(jù)可視化支持定制化的數(shù)據(jù)指標顯示,實現(xiàn)對應用程序、服務器負載性能和關鍵業(yè)務多維度數(shù)據(jù)指標的展示。

        日志采集層主要采用RPC的形式收集數(shù)據(jù),并將數(shù)據(jù)推送到influxdb實時數(shù)據(jù)庫中,完成數(shù)據(jù)的初步采集。隨著數(shù)據(jù)源的不斷增加,在日志采集末端需要構建層次化的采集模型有效的均衡influxdb接收數(shù)據(jù)源推送數(shù)據(jù)的壓力。

        聚合服務層一方面要對高并發(fā)的日志數(shù)據(jù)分析請求進行轉化和分離,提供數(shù)據(jù)流服務實現(xiàn)負載均衡;另一方面要對實時數(shù)據(jù)流進行分析,根據(jù)聚合規(guī)則模型實現(xiàn)日志的分類匯總。Influxdb對時序數(shù)據(jù)流根據(jù)關鍵詞進行初步的過濾,獲取目標分析數(shù)據(jù)。結合基于規(guī)則引擎構建的日志聚合方案依據(jù)日志信息的上下文對日志進行分類,當前端請求日志分析指標時根據(jù)不同維度提供數(shù)據(jù)流服務。

        日志分析指標可視化,該層次首先接收數(shù)據(jù)流服務提供的實時數(shù)據(jù),并基于Granfana實現(xiàn)的日志分析指標展示可定制化。日志分析指標持久化可以實現(xiàn)對歷史日志分析指標的存儲,便于觀察關鍵指標的長期趨勢。

        4 總結

        論文基于Flume的分布式日志聚合系統(tǒng)研究主要從日志分析技術對比、基于規(guī)則引擎的日志聚合方案設計以及日志聚合系統(tǒng)的框架設計與實現(xiàn)三個方面進行了研究。在充分分析現(xiàn)有日志分析技術的基礎上,對數(shù)據(jù)聚合規(guī)則如何快速構建的關鍵問題進行研究,本文提出了基于Drools規(guī)則引擎構建聚合規(guī)則的普適性的編程模型。并通過構建層次化得分布式日志聚合系統(tǒng)架構對模型進行驗證,實驗表明規(guī)則引擎的引入,簡化了配置數(shù)據(jù)的管理,對Flume擴展性和靈活性有很大提升。

        【參考文獻】

        [1]宋密,王勁松.基于Flume的網絡安全可視化系統(tǒng)[J].天津理工大學學報,2015,02:38-42.

        [2]馬延超,王超,李尚同.基于大數(shù)據(jù)技術的日志統(tǒng)計與分析系統(tǒng)研究[J].電腦知識與技術,2016,(34):9-11.

        [責任編輯:朱麗娜]

        猜你喜歡
        引擎規(guī)則分析
        撐竿跳規(guī)則的制定
        數(shù)獨的規(guī)則和演變
        隱蔽失效適航要求符合性驗證分析
        電力系統(tǒng)不平衡分析
        電子制作(2018年18期)2018-11-14 01:48:24
        讓規(guī)則不規(guī)則
        Coco薇(2017年11期)2018-01-03 20:59:57
        藍谷: “涉藍”新引擎
        商周刊(2017年22期)2017-11-09 05:08:31
        TPP反腐敗規(guī)則對我國的啟示
        電力系統(tǒng)及其自動化發(fā)展趨勢分析
        無形的引擎
        河南電力(2015年5期)2015-06-08 06:01:46
        基于Cocos2d引擎的PuzzleGame開發(fā)
        日韩精品电影在线观看| 中文字幕免费在线观看动作大片 | 亚洲乱码一区av春药高潮| 国产成人精品成人a在线观看| 一区二区三区福利在线视频| 日本一道本加勒比东京热| 国内永久福利在线视频图片| 色八a级在线观看| 日本在线观看不卡| 午夜视频在线观看国产| 日韩大片高清播放器大全| 精品久久久久久久久久中文字幕| 亚洲小说图区综合在线| 国产高清自产拍av在线| 麻豆精品导航| 成人无码免费一区二区三区| 男人天堂av在线成人av| 亚洲一区二区三区四区精品| 成人免费a级毛片无码片2022| 亚洲av无码专区国产乱码不卡| 亚洲午夜无码视频在线播放| 久久九九精品国产不卡一区| 内射口爆少妇麻豆| 亚洲va欧美va国产综合| 亚洲天堂中文字幕君一二三四| 成人大片免费视频播放一级| 国产精品伦一区二区三级视频| 好爽受不了了要高潮了av| 亚洲av午夜福利一区二区国产 | 青青草手机在线免费视频| 少妇被粗大的猛进出69影院 | 久久最黄性生活又爽又黄特级片| 欧洲美女黑人粗性暴交视频| 国产精品麻豆成人av电影艾秋| 91久久国产情侣真实对白| av网站免费在线浏览| 日韩av东京社区男人的天堂| 国产一区二区牛影视| 快射视频网站在线观看| 少妇扒开毛茸茸的b自慰| 亚洲综合婷婷久久|