亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        檢察機關(guān)全鏈路智能精準監(jiān)控技術(shù)研究

        2024-02-19 00:00:00李志榮王廷帥賈煒周益周
        中國新通信 2024年23期
        關(guān)鍵詞:異常檢測故障診斷

        摘要:針對結(jié)構(gòu)復(fù)雜、規(guī)模龐大的檢察機關(guān)辦案系統(tǒng)服務(wù)請求失敗、響應(yīng)延時等異常問題,如何快速進行故障診斷是保障系統(tǒng)可靠性的關(guān)鍵所在。本文引入動態(tài)插樁方法實現(xiàn)跨組件請求軌跡的監(jiān)測,采用調(diào)用樹對執(zhí)行軌跡進行刻畫和自動構(gòu)建,基于主成分分析方法對應(yīng)用異常進行自動監(jiān)測和細粒度定位。利用基于局部異常因子的無監(jiān)督學習異常檢測算法和異常頻繁項聯(lián)動算法,構(gòu)建針對業(yè)務(wù)異常頻繁項集的異常關(guān)聯(lián)規(guī)則庫,實現(xiàn)覆蓋應(yīng)用關(guān)聯(lián)的全鏈路數(shù)據(jù)實時監(jiān)控和異常提??;建立應(yīng)用異常知識庫,實現(xiàn)檢察機關(guān)辦案系統(tǒng)運行過程中的異常智能告警。

        關(guān)鍵詞:全鏈路;執(zhí)行軌跡;異常檢測;故障診斷

        一、引言

        隨著計算機技術(shù)的發(fā)展,應(yīng)用架構(gòu)從集中式單體架構(gòu)到分布式的面向服務(wù)的架構(gòu)(SOA)[1]。微服務(wù)等分布式框架在解決高并發(fā)和高可用等方面確實表現(xiàn)出了顯著的優(yōu)勢,這使其成為互聯(lián)網(wǎng)應(yīng)用的發(fā)展趨勢[2,3]。

        目前,互聯(lián)網(wǎng)應(yīng)用的復(fù)雜化程度日益提高,且大部分應(yīng)用通過大規(guī)模分布式集群實現(xiàn),跨多個數(shù)據(jù)中心運行。這種分布式架構(gòu)在帶來高性能和可擴展性的同時,也帶來了性能問題探查和故障定位的困難。結(jié)構(gòu)復(fù)雜、規(guī)模龐大以及故障定位困難已成為當前系統(tǒng)運維的主要痛點[4]。王子勇等針對微服務(wù)架構(gòu)面臨的問題,采用覆蓋測試構(gòu)建請求執(zhí)行軌跡的方法,各組件在目標方法調(diào)用處插入監(jiān)測代碼,不用考慮整個系統(tǒng)行為,即能構(gòu)建服務(wù)的執(zhí)行軌跡,但是,該方法無法有效診斷與物理資源相關(guān)的故障[5]。

        針對應(yīng)用復(fù)雜化、性能問題探查困難和故障定位困難等痛點,采用探針(Agent)實時采集應(yīng)用運行時的數(shù)據(jù),提供全局的業(yè)務(wù)流拓撲和業(yè)務(wù)調(diào)用關(guān)系,從而實現(xiàn)對用戶從發(fā)送請求到請求處理完成的全鏈路、完整生命周期的服務(wù)監(jiān)控。告警組件提供故障的實時告警,可通過郵件、短信等方式通知運維管理人員,從而幫助其及時處理問題,提高運維服務(wù)效率。

        二、系統(tǒng)設(shè)計

        (一)業(yè)務(wù)架構(gòu)

        在設(shè)計全鏈路智能精準監(jiān)控平臺的業(yè)務(wù)架構(gòu)過程中,主要從五個方面考慮:1.輕量化采集探針,確保數(shù)據(jù)采集過程業(yè)務(wù)無侵入;2.數(shù)據(jù)采集低消耗,一套探針可應(yīng)對各種分析場景;3.全面兼容國產(chǎn)化環(huán)境,可支持阿里云、華為云等云平臺;4.采集和分析過程分離,避免對業(yè)務(wù)運行造成影響;5.通過融合全方位的采集數(shù)據(jù),采用智能大數(shù)據(jù)分析手段,提供精準全面的全鏈路監(jiān)控分析和系統(tǒng)健康度分析。

        支持多種探針部署,采集應(yīng)用運行狀態(tài)數(shù)據(jù)和網(wǎng)絡(luò)指標;監(jiān)測數(shù)據(jù)統(tǒng)一匯聚到數(shù)據(jù)分析相關(guān)組件,集中完成數(shù)據(jù)收集、聚合壓縮和關(guān)聯(lián)分析,為前端的統(tǒng)一監(jiān)測視圖展示提供服務(wù)。通過統(tǒng)一可視化頁面的方式實現(xiàn)終端監(jiān)控、應(yīng)用監(jiān)控、智能告警、統(tǒng)計分析。

        (二)業(yè)務(wù)流程設(shè)計

        構(gòu)建應(yīng)用運行全方位感知分析體系的關(guān)鍵在于對度量指標數(shù)據(jù)與調(diào)用依賴數(shù)據(jù)的收集,因此,需要強化系統(tǒng)的數(shù)據(jù)采集能力。全鏈路智能精準監(jiān)控平臺采用應(yīng)用探針、網(wǎng)絡(luò)探針和瀏覽器探針獲取指標數(shù)據(jù)和調(diào)用依賴數(shù)據(jù),以此完成對目標系統(tǒng)的全面、持續(xù)監(jiān)控,確保鏈路信息更加完整、準確。

        1.應(yīng)用探針收集到應(yīng)用服務(wù)的狀態(tài)數(shù)據(jù)和運行數(shù)據(jù)后,會以加密方式將數(shù)據(jù)傳輸?shù)饺溌肪珳时O(jiān)控平臺。系統(tǒng)采用平均鏈路聚類法和圖論模型算法,識別應(yīng)用運行方式和鏈路拓撲,構(gòu)建業(yè)務(wù)應(yīng)用拓撲圖,并將資源信息、應(yīng)用實例和應(yīng)用鏈路進行關(guān)聯(lián)識別,完成基于業(yè)務(wù)鏈路維度的關(guān)聯(lián)分析,綜合匯聚數(shù)據(jù)后,完成業(yè)務(wù)畫像建模。

        2.網(wǎng)絡(luò)探針以非侵入式的方式對業(yè)務(wù)資源中的各類事件進行采集、組裝和分析,完成數(shù)據(jù)采集,且整個過程不影響業(yè)務(wù)運行。

        3.瀏覽器探針對狀態(tài)數(shù)據(jù)進行元數(shù)據(jù)拆分,構(gòu)建監(jiān)測用戶排查邏輯,形成用戶端使用信息,實現(xiàn)對業(yè)務(wù)應(yīng)用的全方位、多尺度監(jiān)測。

        (三)組件設(shè)計

        系統(tǒng)部署了探針,用于收集應(yīng)用服務(wù)運行時的數(shù)據(jù)。探針將收集的數(shù)據(jù)發(fā)送到Kafka存儲,數(shù)據(jù)分析組件從Kafka中提取數(shù)據(jù),隨后對數(shù)據(jù)進行預(yù)處理工作。完成預(yù)處理后,這些數(shù)據(jù)會被存儲到數(shù)據(jù)庫中,以確保數(shù)據(jù)的持久性。為了使用戶能夠方便地查詢這些數(shù)據(jù),設(shè)計了數(shù)據(jù)展示組件。用戶可以通過前端頁面與這個組件進行交互,從而查詢并展示所需的數(shù)據(jù)。

        探針:采用非侵入式部署,通過AOP(Aspect-Oriented Programming)與字節(jié)碼增強的方式實現(xiàn)對應(yīng)用運行數(shù)據(jù)的采集。

        數(shù)據(jù)分析:負責預(yù)處理探針采集的數(shù)據(jù),包括錯誤數(shù)據(jù)的丟棄、拓撲圖的解析、同類型數(shù)據(jù)的歸并等。當需要監(jiān)控的應(yīng)用服務(wù)數(shù)量眾多時,為了有效處理龐大的數(shù)據(jù)量,數(shù)據(jù)分析組件會采用集群化的部署方式,以確保能夠高效地完成數(shù)據(jù)處理任務(wù)。數(shù)據(jù)分析組件會將處理好的數(shù)據(jù)持久化到數(shù)據(jù)庫中。

        Kafka:主要負責數(shù)據(jù)的緩沖,通過調(diào)節(jié)數(shù)據(jù)采集與數(shù)據(jù)分析之間速度不匹配的問題,避免出現(xiàn)因為探針發(fā)送數(shù)據(jù)過多而數(shù)據(jù)分析組件無法及時處理而造成的數(shù)據(jù)阻塞或丟失。

        Elasticsearch集群:為了在大數(shù)據(jù)環(huán)境下實現(xiàn)秒級查詢的高效性能,選擇使用Elasticsearch作為數(shù)據(jù)持久化的存儲數(shù)據(jù)庫,存放數(shù)據(jù)分析組件分析后的數(shù)據(jù)。還可以通過內(nèi)部的發(fā)現(xiàn)機制實現(xiàn)橫向節(jié)點的擴充,實現(xiàn)PB級別數(shù)據(jù)查詢的能力[6]。

        數(shù)據(jù)展示:負責處理用戶發(fā)出的請求,通過深入分析用戶的請求路徑,并依據(jù)路徑所關(guān)聯(lián)的代碼邏輯,在Elasticsearch集群中精確篩選所需數(shù)據(jù)。經(jīng)過篩選和處理的數(shù)據(jù)最終會通過前端界面清晰地展示給用戶。

        自監(jiān)控:負責監(jiān)控系統(tǒng)中各組件的運行狀態(tài),可設(shè)置自動清除數(shù)據(jù)規(guī)則,保證系統(tǒng)資源有效性和系統(tǒng)組件的穩(wěn)定運行。

        告警:根據(jù)需要配置告警規(guī)則,通過多種方式,如短信、郵件等發(fā)布告警通知。

        (四)故障診斷

        1.執(zhí)行軌跡構(gòu)建

        基于調(diào)用圖的故障分析方法,在測試和運行階段,對請求調(diào)用的執(zhí)行軌跡進行信息采集,獲取請求調(diào)用的執(zhí)行軌跡,構(gòu)建執(zhí)行軌跡集合,作為檢測目標系統(tǒng)故障的基準。為確保目標系統(tǒng)運行過程中不遺漏任何正確的執(zhí)行路徑,管理員在監(jiān)控到異常執(zhí)行軌跡時,會憑借自身經(jīng)驗進行必要的調(diào)整,隨后驗證并確認調(diào)整后的正確執(zhí)行軌跡,最后將這個新的正確執(zhí)行軌跡加入到執(zhí)行軌跡的集合當中。

        2.故障定位

        若目標系統(tǒng)遭遇故障,其執(zhí)行軌跡會偏離正常路徑,具體表現(xiàn)為軌跡結(jié)構(gòu)的異常變動和執(zhí)行時間的顯著波動。為評估請求處理中的故障情況,本文采用了樹編輯距離[7]作為評估手段,通過細致分析執(zhí)行軌跡之間的差異,能夠精確地定位到故障發(fā)生時所涉及的方法調(diào)用。

        其中,請求i所需的執(zhí)行時長被記錄為xi,而對于某一特定類型的請求,其平均執(zhí)行時長則用μ來表示。CV(變異系數(shù))是一個衡量數(shù)據(jù)離散程度的指標,它等于該類型請求執(zhí)行時間的標準差與平均執(zhí)行時間μ的比值。CV數(shù)值越大,說明性能異常程度越高,則需要對執(zhí)行時間進行異常分析。

        采用主成分分析(Principle Component Analysis,簡稱PCA)[8],將n維數(shù)據(jù)削減為p個主成分(p≤n)以有效地表現(xiàn)原始數(shù)據(jù)信息。其中a為主成分與調(diào)用方法執(zhí)行時間的系數(shù),表示主成分與原始數(shù)據(jù)維度的相關(guān)性,其數(shù)值越大,表明這個維度對應(yīng)的方法引起性能問題的可能性越大,因此,通過判斷a值,能快速定位故障位置。

        (五)規(guī)則和知識庫

        通過對辦案系統(tǒng)應(yīng)用、網(wǎng)絡(luò)、硬件等鏈路監(jiān)控數(shù)據(jù)的全量采集,利用基于局部異常因子的無監(jiān)督學習異常檢測算法和異常頻繁項聯(lián)動算法,將數(shù)據(jù)配置在數(shù)據(jù)庫中。異常規(guī)則表包括異常類型、異常方法、類名稱、探針I(yè)D等關(guān)鍵信息;異常監(jiān)控配置表包括集群標識、服務(wù)IP、收包內(nèi)容等關(guān)鍵信息;網(wǎng)絡(luò)異常規(guī)則過濾表包括應(yīng)用的屬性集群IP、節(jié)點命名空間、虛機節(jié)點和過濾類型等關(guān)鍵信息;網(wǎng)絡(luò)異常規(guī)則過濾詳情表包括事務(wù)過濾URL、關(guān)聯(lián)網(wǎng)絡(luò)異常規(guī)則過濾表的ID等關(guān)鍵信息;重要URL過濾表包括集群標識、重要URL、閾值等信息。構(gòu)建針對業(yè)務(wù)異常頻繁項集的異常關(guān)聯(lián)規(guī)則庫,可實現(xiàn)對覆蓋應(yīng)用關(guān)聯(lián)的全鏈路數(shù)據(jù)的實時監(jiān)控和異常提取。

        設(shè)計不同的索引將各種探針采集到的數(shù)據(jù)存到Elasticsearch數(shù)據(jù)庫中。針對應(yīng)用探針采集的事務(wù)數(shù)據(jù),設(shè)計JavaTraceData索引,包含單次事務(wù)請求的詳細信息、系統(tǒng)出錯信息追蹤、數(shù)據(jù)庫查詢信息、WAR包之間調(diào)用的信息等。針對應(yīng)用探針采集的應(yīng)用訪問數(shù)據(jù)庫的數(shù)據(jù),設(shè)計DBType索引;針對應(yīng)用探針采集到的應(yīng)用之間的訪問信息數(shù)據(jù),設(shè)計Relationship索引,以拓撲形式展示;針對應(yīng)用探針記錄的事務(wù)詳情數(shù)據(jù),設(shè)計Response索引,記錄每一次事務(wù)具體操作各個階段的耗時;針對網(wǎng)絡(luò)探針采集目標系統(tǒng)的網(wǎng)絡(luò)調(diào)用數(shù)據(jù),設(shè)計HttpData索引記錄調(diào)用詳情數(shù)據(jù),設(shè)計SnifferData索引記錄調(diào)用關(guān)系數(shù)據(jù);針對網(wǎng)絡(luò)探針采集到的進程信息數(shù)據(jù),設(shè)計Process索引;針對網(wǎng)絡(luò)探針采集到的主機信息數(shù)據(jù),設(shè)計System索引記錄IP、內(nèi)存信息、CPU使用情況;針對網(wǎng)絡(luò)探針采集到的磁盤信息數(shù)據(jù),設(shè)計Filesystem索引記錄各個分區(qū)的磁盤情況。建立應(yīng)用異常知識庫,為辦案系統(tǒng)運行過程中的異常智能告警提供服務(wù)。

        三、系統(tǒng)部署

        全鏈路智能精準監(jiān)控平臺采用分布式部署,在三臺服務(wù)器上部署不同組件,其中,在數(shù)據(jù)收集服務(wù)器上部署數(shù)據(jù)采集組件、配置組件;在數(shù)據(jù)存儲服務(wù)器上部署自監(jiān)控組件、告警組件、Elasticsearch、Kafka;在數(shù)據(jù)處理服務(wù)器上部署數(shù)據(jù)展示組件、數(shù)據(jù)分析組件、Aerospike。每臺服務(wù)器的資源配置為:CPU為16核、內(nèi)存32G、系統(tǒng)盤為100G、數(shù)據(jù)盤為500G、數(shù)據(jù)庫為Elasticsearch。

        四、系統(tǒng)應(yīng)用

        通過全鏈路智能精準監(jiān)控平臺的部署應(yīng)用,實現(xiàn)對檢察機關(guān)辦案系統(tǒng)的應(yīng)用服務(wù)、硬件資源、瀏覽器頁面等的監(jiān)測,實現(xiàn)對故障的快速分析與定位。

        在應(yīng)用監(jiān)控方面,采用拓撲圖的形式展示某個時間段內(nèi)與應(yīng)用直接關(guān)聯(lián)的服務(wù);展示指定時間段耗時最長Web事務(wù)圖表、響應(yīng)時間和吞吐量,提供慢事務(wù)追蹤的功能,精準定位慢事務(wù);展示應(yīng)用實例存在的異常及對異常的分析詳情;展示應(yīng)用所訪問的數(shù)據(jù)庫詳情,耗時最長的SQL語句、響應(yīng)時間和吞吐率。在硬件監(jiān)控方面,展示監(jiān)控服務(wù)的系統(tǒng)負載、CPU使用率、內(nèi)存使用率、內(nèi)存使用量、磁盤使用率、磁盤使用量、進程CPU使用率、進程內(nèi)存使用率、連接成功率、磁盤I/O讀寫次數(shù)、磁盤I/O吞吐量、磁盤掛載等信息。在瀏覽器監(jiān)控方面,展示所有頁面的用戶感知平均時間,可分解為白屏、可交互、PV時間;展示服務(wù)器端的響應(yīng)時間、HTML加載、頁面渲染性能;展示主機目錄和主機下的頁面及其加載耗時;展示主機AJAX請求的信息。

        五、結(jié)束語

        本研究通過利用應(yīng)用探針、網(wǎng)絡(luò)探針、瀏覽器探針對檢察機關(guān)辦案系統(tǒng)應(yīng)用、網(wǎng)絡(luò)、硬件等鏈路監(jiān)控數(shù)據(jù)的全量采集,構(gòu)建了針對業(yè)務(wù)異常頻繁項集的異常關(guān)聯(lián)規(guī)則庫和應(yīng)用異常知識庫。引入動態(tài)插樁方法實現(xiàn)跨服務(wù)組件的請求軌跡監(jiān)測,采用調(diào)用樹對執(zhí)行軌跡進行刻畫和自動構(gòu)建,基于主成分分析方法對應(yīng)用異常進行自動監(jiān)測和細粒度定位,能夠為檢察機關(guān)辦案系統(tǒng)的穩(wěn)定運行提供有力保障。

        作者單位:李志榮 中華人民共和國最高人民檢察院王廷帥 北京計算機技術(shù)及應(yīng)用研究所

        賈煒 北京計算機技術(shù)及應(yīng)用研究所

        周益周 北京計算機技術(shù)及應(yīng)用研究所

        參考文獻

        [1]FabianAulkemeier,MilanSchramm,Maria-EugeniaIacob,JosvanHillegersberg.AService-OrientedE-CommerceReferenceArchitecture[J].JournalofTheoreticalandAppliedElectronicCommerceResearch,2016,11(1).

        [2]唐志濤,劉星.企業(yè)應(yīng)用系統(tǒng)架構(gòu)演進[J].科技創(chuàng)新與應(yīng)用,2017(35):120-121.

        [3]NadareishviliI,MitraR,McLartyM,eta1.Microservicearchitecture:aligningprinciples,practices,andculture[M].“O’ReillyMedia,Inc.”,2016.

        [4]梁偉,楊明川,馮明,等.應(yīng)用性能管理技術(shù)的研發(fā)與應(yīng)用[J].電信技術(shù),2017(06):42-45.

        [5]王子勇,王燾,張文博,等.一種基于執(zhí)行軌跡監(jiān)測的微服務(wù)故障診斷方法[J].軟件學報,2017,28(06):20.

        [6]ElasticN.V.;ElasticsearchServiceIsNowAvailableonGoogleCloudPlatformGCPinJapan[J].ComputerTechnologyJournal,2019.

        [7]Bille P. A survey on tree edit distance and related problems. Theoretical Computer Science, 2005,337(1):217-239.

        [8]Jolliffe I. Principal Component Analysis. Wiley Online Library, 2002.

        猜你喜歡
        異常檢測故障診斷
        凍干機常見故障診斷與維修
        基于LMD模糊熵的遙測振動信號異常檢測方法
        基于度分布的流量異常在線檢測方法研究
        無線Mesh網(wǎng)絡(luò)安全性研究
        無線Mesh網(wǎng)絡(luò)基礎(chǔ)知識
        基于量子萬有引力搜索的SVM自駕故障診斷
        淺談燃氣輪機排氣溫度異常檢測及診斷
        基于鼠標行為的電子商務(wù)中用戶異常行為檢測
        因果圖定性分析法及其在故障診斷中的應(yīng)用
        基于LCD和排列熵的滾動軸承故障診斷
        亚洲综合在不卡在线国产另类 | 亚洲色大成网站www尤物| 亚洲欧美成人中文在线网站| 久久久精品人妻一区二区三区免费 | 人人妻人人澡人人爽精品欧美| 欧美视频第一页| 亚洲av一区二区网址| 黑人老外3p爽粗大免费看视频| 午夜性无码专区| 91综合在线| 日本久久黄色高清视频| 午夜福利理论片在线观看播放| 日本无码人妻波多野结衣| 久久精品国产91久久性色tv| 日本黄色高清视频久久| 日韩亚洲中文有码视频| 国产激情内射在线影院| 亚洲欧美日韩中文字幕网址| 波多野结衣一区| 亚洲一区二区三区99区| 日本久久精品中文字幕| 亚洲一区 日韩精品 中文字幕| 综合精品欧美日韩国产在线| av天堂一区二区三区| 欧美日韩在线视频| 越南女子杂交内射bbwxz| 国产一起色一起爱| 精品亚洲av乱码一区二区三区| aa片在线观看视频在线播放| 亚洲精品aa片在线观看国产| 亚洲国产欧美另类va在线观看| av在线播放一区二区免费| 色综合久久无码五十路人妻| 久久99精品国产99久久| 亚洲国产一区二区三区,| 日本熟女人妻一区二区| 中文字幕免费不卡二区| 日韩女人毛片在线播放| 国产毛片精品av一区二区| 天堂av在线美女免费| 老熟妇乱子伦av|