亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        長(zhǎng)江干線數(shù)字航道系統(tǒng)守護(hù)進(jìn)程的研發(fā)與應(yīng)用

        2024-02-17 00:35:30徐為李睿管宇航王胤澤張翔
        中國(guó)水運(yùn) 2024年1期
        關(guān)鍵詞:進(jìn)程故障系統(tǒng)

        徐為,李睿,2,管宇航,王胤澤 ,張翔

        (1.長(zhǎng)江武漢航道局,湖北 武漢 430040;2.中國(guó)地質(zhì)大學(xué)(武漢)國(guó)家地理信息系統(tǒng)工程技術(shù)研究中心 地理與信息工程學(xué)院,湖北 武漢 430074;3.嵩山實(shí)驗(yàn)室,河南 鄭州 450046)

        近些年,隨著數(shù)字航道的建設(shè)及深入應(yīng)用,我國(guó)內(nèi)河航道業(yè)務(wù)實(shí)現(xiàn)了主要助航設(shè)施的動(dòng)態(tài)監(jiān)測(cè)和及時(shí)維護(hù)、航道維護(hù)資源的科學(xué)配置和聯(lián)網(wǎng)調(diào)度、航道主要現(xiàn)勢(shì)信息的可靠發(fā)布和共享服務(wù),極大地提升長(zhǎng)江武漢航道局航道安全暢通效能及信息服務(wù)水平。保障數(shù)字航道系統(tǒng)平臺(tái)長(zhǎng)期穩(wěn)定運(yùn)行是數(shù)字航道持續(xù)發(fā)揮通航效益的基本及核心工作。但是,數(shù)字航道的各個(gè)關(guān)鍵應(yīng)用偶爾會(huì)出現(xiàn)系統(tǒng)進(jìn)程卡死的狀況,無(wú)法及時(shí)恢復(fù)系統(tǒng)正常運(yùn)行,這樣會(huì)嚴(yán)重影響數(shù)字航道系統(tǒng)的穩(wěn)定運(yùn)行,造成不可預(yù)知的重大影響。因此,為了保證數(shù)字航道系統(tǒng)高可用性,當(dāng)前迫切需要研制一套進(jìn)程守護(hù)程序,實(shí)現(xiàn)數(shù)字航道系統(tǒng)平臺(tái)各個(gè)關(guān)鍵應(yīng)用的實(shí)時(shí)監(jiān)聽、故障報(bào)警和自動(dòng)重啟功能。

        針對(duì)數(shù)字航道系統(tǒng),采用進(jìn)程級(jí)別監(jiān)控和守護(hù),可以及時(shí)發(fā)現(xiàn)并且干預(yù)數(shù)字航道系統(tǒng)進(jìn)程運(yùn)行方面的隱患及問題,并將根據(jù)故障問題嚴(yán)重等級(jí)進(jìn)行針對(duì)性處理,對(duì)數(shù)字航道的高系統(tǒng)可用性需求做出探索性嘗試,同時(shí)也是為長(zhǎng)江航道維護(hù)服務(wù)的智能化、自動(dòng)化和標(biāo)準(zhǔn)化奠定基礎(chǔ)。因此,開展本項(xiàng)目的研究非常有必要。

        在監(jiān)控系統(tǒng)方面,考慮到商業(yè)監(jiān)控高昂的使用成本和學(xué)習(xí)成本,本研究采用開源監(jiān)控解決方案。Zabbix是一個(gè)目前比較成熟的開源監(jiān)控解決方案,支持多種操作系統(tǒng),可實(shí)現(xiàn)跨平臺(tái)分布式部署。Zabbix 擁有靈活多變的報(bào)警策略,可以及時(shí)發(fā)現(xiàn)系統(tǒng)產(chǎn)生的異常,同時(shí)Zabbix 集成了多種數(shù)據(jù)采集方式,可應(yīng)對(duì)多種情況下的跨平臺(tái)監(jiān)控,十分契合本研究的需求。

        綜上所述,本研究要解決的問題有兩個(gè),第一個(gè)問題是針對(duì)分布式系統(tǒng)進(jìn)行進(jìn)程級(jí)別的細(xì)致且實(shí)時(shí)監(jiān)控;第二個(gè)問題是通過系統(tǒng)日志、系統(tǒng)運(yùn)行狀態(tài)和服務(wù)器接口等多渠道定位系統(tǒng)異常所在。因此,本研究將采用Zabbix 企業(yè)級(jí)開源監(jiān)控解決方案對(duì)長(zhǎng)江數(shù)字航道系統(tǒng)所在的服務(wù)器集群分別進(jìn)行系統(tǒng)核心進(jìn)程監(jiān)控。同時(shí)開發(fā)守護(hù)進(jìn)程系統(tǒng),該系統(tǒng)將會(huì)分析通過Zabbix 收集到的數(shù)字航道系統(tǒng)實(shí)時(shí)運(yùn)行數(shù)據(jù),系統(tǒng)日志以及服務(wù)器狀態(tài),判斷當(dāng)前系統(tǒng)是否發(fā)生異常,以及是否進(jìn)行報(bào)警和故障處理。

        1 系統(tǒng)模塊分析

        1.1 跨平臺(tái)服務(wù)器集群監(jiān)控模塊

        針對(duì)進(jìn)程級(jí)別的故障監(jiān)控需要將監(jiān)控?cái)?shù)據(jù)從整個(gè)服務(wù)器的監(jiān)控?cái)?shù)據(jù)細(xì)分到每一個(gè)相關(guān)進(jìn)程的監(jiān)控?cái)?shù)據(jù),包括進(jìn)程占用的CPU、內(nèi)存、硬盤等硬件參數(shù)以及系統(tǒng)頁(yè)面響應(yīng)時(shí)間參數(shù)等,是整個(gè)守護(hù)進(jìn)程系統(tǒng)得以運(yùn)行的基礎(chǔ)。

        1.2 進(jìn)程健康綜合判定模塊

        數(shù)字航道系統(tǒng)守護(hù)進(jìn)程制定并采用健康指數(shù)的目的主要有以下三點(diǎn):①判斷進(jìn)程運(yùn)行狀態(tài),是否發(fā)生故障;②尋找硬件系統(tǒng)可能存在的性能瓶頸,定位性能瓶頸并提供對(duì)應(yīng)的硬件升級(jí)方案;③記錄系統(tǒng)負(fù)載歷史,幫助分析用戶行為對(duì)系統(tǒng)帶來(lái)的沖擊和影響。

        1.3 監(jiān)控平臺(tái)可視化模塊

        系統(tǒng)監(jiān)控?cái)?shù)據(jù)的展示采用大屏圖表的形式進(jìn)行可視化,通過Grafana 監(jiān)控展示技術(shù)使監(jiān)控主頁(yè)實(shí)時(shí)展示監(jiān)控進(jìn)程的各項(xiàng)具體信息,并且通過管理員編輯模塊自定義監(jiān)控展示內(nèi)容。系統(tǒng)能清晰展現(xiàn)被守護(hù)進(jìn)程當(dāng)前的運(yùn)行狀態(tài),方便運(yùn)維人員快速了解當(dāng)前系統(tǒng)運(yùn)行的各項(xiàng)指標(biāo)。

        1.4 自動(dòng)報(bào)警與自動(dòng)重啟功能模塊

        當(dāng)進(jìn)程出現(xiàn)卡死或者系統(tǒng)宕機(jī)的情況下,本系統(tǒng)可以對(duì)系統(tǒng)管理員發(fā)出報(bào)警通知,與此同時(shí)針對(duì)系統(tǒng)宕機(jī)的情況進(jìn)行自動(dòng)重啟操作,最大程度地減少系統(tǒng)不可用時(shí)間。

        1.5 監(jiān)控歷史數(shù)據(jù)分析模塊

        對(duì)于不斷產(chǎn)生的監(jiān)控?cái)?shù)據(jù),系統(tǒng)實(shí)現(xiàn)了歷史數(shù)據(jù)分析功能,能將當(dāng)前系統(tǒng)監(jiān)控?cái)?shù)據(jù)與歷史異常運(yùn)行時(shí)段的數(shù)據(jù)進(jìn)行對(duì)比,判斷系統(tǒng)未來(lái)一段時(shí)間內(nèi)的風(fēng)險(xiǎn)情況。此外在系統(tǒng)發(fā)生重大故障時(shí)還可根據(jù)日志、報(bào)錯(cuò)信息以及監(jiān)控?cái)?shù)據(jù)分析此次問題的具體原因,為未來(lái)各個(gè)系統(tǒng)的代碼邏輯優(yōu)化提供具體建議,預(yù)防系統(tǒng)再次卡死或宕機(jī)。

        2 系統(tǒng)設(shè)計(jì)

        2.1 系統(tǒng)總體設(shè)計(jì)

        系統(tǒng)整體采用Vue、SpringBoot、MySQL、Zabbix 等技術(shù)進(jìn)行高效快捷的開發(fā)。如圖1 所示,該系統(tǒng)主要分為四個(gè)部分。系統(tǒng)的架構(gòu)設(shè)計(jì)圖如圖2 所示。

        圖1 系統(tǒng)設(shè)計(jì)模型

        圖2 系統(tǒng)架構(gòu)設(shè)計(jì)圖

        圖3 進(jìn)程守護(hù)系統(tǒng)界面

        系統(tǒng)管理員可以通過界面添加新的監(jiān)控進(jìn)程以及修改相關(guān)指標(biāo)報(bào)警閾值。同時(shí)在系統(tǒng)后臺(tái)有詳細(xì)的日志功能,將系統(tǒng)運(yùn)行過程中的關(guān)鍵信息和動(dòng)作進(jìn)行匯總統(tǒng)計(jì),便于管理員進(jìn)行回溯分析。

        2.2 系統(tǒng)穩(wěn)定保障設(shè)計(jì)

        Zabbix 客戶端有兩種工作方式,分別是主動(dòng)式監(jiān)控與被動(dòng)式監(jiān)控,其中,被動(dòng)式監(jiān)控比較適合內(nèi)網(wǎng)環(huán)境下的監(jiān)控需求,同時(shí)減輕Zabbix Agentd 在被監(jiān)控服務(wù)器上的運(yùn)行負(fù)擔(dān)。

        作為守護(hù)進(jìn)程系統(tǒng),首先要保障系統(tǒng)自身持續(xù)且穩(wěn)定的運(yùn)行,這樣才能去守護(hù)其他的系統(tǒng)。當(dāng)Zabbix 監(jiān)測(cè)到進(jìn)程守護(hù)系統(tǒng)沒有響應(yīng)后,會(huì)自動(dòng)調(diào)用進(jìn)程守護(hù)系統(tǒng)的重啟腳本,保障系統(tǒng)持續(xù)可用。

        對(duì)于被守護(hù)的數(shù)字航道系統(tǒng),則不能輕易的采取自動(dòng)重啟的方式,否則會(huì)因網(wǎng)絡(luò)故障或某些輕微干擾導(dǎo)致系統(tǒng)頻繁重啟,嚴(yán)重影響用戶體驗(yàn)。對(duì)于用戶使用較少的深夜時(shí)段,可以采用自動(dòng)重啟功能,減少重啟的可感知程度。

        2.3 系統(tǒng)安全設(shè)計(jì)

        該項(xiàng)目研制過程中,嚴(yán)格遵循網(wǎng)絡(luò)安全相關(guān)要求。服務(wù)器機(jī)房安裝在長(zhǎng)江武漢航道局內(nèi),進(jìn)出需要進(jìn)行身份驗(yàn)證。登錄服務(wù)器前需要進(jìn)行強(qiáng)密鑰安全驗(yàn)證。進(jìn)程守護(hù)系統(tǒng)實(shí)現(xiàn)了用戶身份管理。與此同時(shí),還將通過如下的手段保障安全。

        (1)該技術(shù)將部署于長(zhǎng)江武漢航道局超融合平臺(tái)上,在長(zhǎng)江武漢航道局內(nèi)網(wǎng)環(huán)境下使用。

        (2)該技術(shù)部署服務(wù)器安裝專業(yè)的EDR 病毒防護(hù)系統(tǒng),并接入長(zhǎng)江武漢航道局安全感知平臺(tái)、入侵檢測(cè)(IDS)和入侵防御(IPS)系統(tǒng)。

        (3)該技術(shù)部署后,將進(jìn)一步經(jīng)過漏洞掃描系統(tǒng)后,通過升級(jí)安全漏洞補(bǔ)丁等手段封堵住操作系統(tǒng)和應(yīng)用軟件本身所帶來(lái)的安全漏洞。

        進(jìn)一步檢查是否配置虛擬防火墻、路由器過濾策略和系統(tǒng)本身的各項(xiàng)安全措施(如針對(duì)各類攻擊所進(jìn)行的通信協(xié)議安全配置)。

        3 系統(tǒng)關(guān)鍵技術(shù)

        3.1 基于Zabbix 的服務(wù)器集群多進(jìn)程實(shí)時(shí)監(jiān)控關(guān)鍵技術(shù)

        本研究對(duì)Zabbix 提供的開源監(jiān)控解決方案進(jìn)行了簡(jiǎn)化,使其在保證輕量化的前提下適配數(shù)字航道系統(tǒng)監(jiān)控需求。本研究實(shí)現(xiàn)了面向服務(wù)器集群多進(jìn)程的輕量化自動(dòng)監(jiān)控技術(shù),該技術(shù)包含數(shù)據(jù)可視化、分布式系統(tǒng)監(jiān)控以及網(wǎng)絡(luò)流量監(jiān)控功能,能完整反應(yīng)進(jìn)程當(dāng)前運(yùn)行狀態(tài)。

        3.2 多維度的健康判定模型與分級(jí)關(guān)鍵技術(shù)

        為構(gòu)建多維度的健康判定模型,結(jié)合計(jì)算機(jī)操作系統(tǒng)相關(guān)技術(shù)以及在測(cè)試環(huán)境服務(wù)器中一個(gè)月的系統(tǒng)指標(biāo)監(jiān)測(cè)。本研究提出了一種由CPU 利用率、硬盤讀速率、磁盤寫速率、內(nèi)存占用率、數(shù)字航道網(wǎng)頁(yè)響應(yīng)時(shí)間以及進(jìn)程心跳指數(shù)六種參數(shù)組成的健康判定模型。并根據(jù)實(shí)際情況搭配了一個(gè)合理的權(quán)重分配公式,進(jìn)程守護(hù)系統(tǒng)能依據(jù)這些指數(shù)準(zhǔn)確判斷當(dāng)前系統(tǒng)所處狀態(tài)。

        3.3 基于事件驅(qū)動(dòng)機(jī)制的進(jìn)程守護(hù)消息推送報(bào)警關(guān)鍵技術(shù)

        本研究在進(jìn)程守護(hù)系統(tǒng)中使用了基于事件驅(qū)動(dòng)機(jī)制的報(bào)警信息推送技術(shù)。用戶可以在系統(tǒng)界面中自行設(shè)置相關(guān)的報(bào)警閾值、報(bào)警媒介、恢復(fù)閾值以及報(bào)警接收者。當(dāng)監(jiān)控項(xiàng)的監(jiān)控?cái)?shù)據(jù)超過閾值一段時(shí)間后,進(jìn)程守護(hù)系統(tǒng)將會(huì)觸發(fā)消息推送機(jī)制,使用郵件或接口調(diào)用等形式完成報(bào)警信息的推送,達(dá)到及時(shí)預(yù)警的效果。

        3.4 多情景下的進(jìn)程多策略重啟關(guān)鍵技術(shù)

        當(dāng)進(jìn)程卡死或者健康指數(shù)過低時(shí)系統(tǒng)會(huì)進(jìn)行自動(dòng)重啟。重啟的策略包括手動(dòng)重啟、自動(dòng)重啟、低健康指數(shù)重啟和定時(shí)重啟。這一關(guān)鍵技術(shù)使其能夠智能化地輔助進(jìn)程管理。

        4 系統(tǒng)應(yīng)用效益和創(chuàng)新性分析

        4.1 系統(tǒng)應(yīng)用效益分析

        進(jìn)程守護(hù)系統(tǒng)預(yù)警反應(yīng)快捷,告警信息發(fā)布及時(shí),進(jìn)程自動(dòng)重啟及時(shí)準(zhǔn)確,實(shí)現(xiàn)了數(shù)字航道系統(tǒng)的高可用性,達(dá)到了項(xiàng)目的預(yù)期效果。運(yùn)維人員可在故障發(fā)生的第一時(shí)間得到故障信息,發(fā)現(xiàn)問題,解決問題。目前系統(tǒng)納入監(jiān)控范圍的進(jìn)程為數(shù)字航道核心進(jìn)程與數(shù)字航道核心數(shù)據(jù)庫(kù),在系統(tǒng)試運(yùn)行過程中,共發(fā)生進(jìn)程低健康指數(shù)報(bào)警1 次,進(jìn)程未響應(yīng)3 次。在測(cè)試人員和管理員核對(duì)后發(fā)現(xiàn)該系統(tǒng)自動(dòng)報(bào)警和自動(dòng)重啟功能的反應(yīng)均比較及時(shí),進(jìn)程提供的故障信息和實(shí)際狀況相符,可以較好地完成數(shù)字航道核心進(jìn)程監(jiān)控的任務(wù)。

        在生產(chǎn)環(huán)境的數(shù)字航道系統(tǒng)中,未采用本系統(tǒng)時(shí)的系統(tǒng)故障平均響應(yīng)時(shí)間一般在15 分鐘左右,在核心進(jìn)程卡死故障發(fā)生期間系統(tǒng)無(wú)法進(jìn)行任何數(shù)據(jù)交互,將造成大量的數(shù)據(jù)丟失,甚至是無(wú)法挽回的經(jīng)濟(jì)損失。如果能在生產(chǎn)環(huán)境中使用本系統(tǒng)進(jìn)行數(shù)字航道系統(tǒng)的進(jìn)程守護(hù)工作,則可以將系統(tǒng)故障平均響應(yīng)時(shí)間大大縮短至10 秒以內(nèi),預(yù)計(jì)將減少88%的經(jīng)濟(jì)損失。

        4.2 進(jìn)程健康判定指數(shù)方面的標(biāo)準(zhǔn)創(chuàng)新

        為構(gòu)建多維度的健康判定模型,除了基本的硬件性能參數(shù)以外,該系統(tǒng)提出的進(jìn)程健康指數(shù)判斷模型還針對(duì)數(shù)據(jù)量大用戶多的問題,在模型中加入了數(shù)字航道網(wǎng)頁(yè)響應(yīng)時(shí)間參數(shù),該參數(shù)是系統(tǒng)體驗(yàn)好壞的關(guān)鍵參數(shù)。同時(shí)該判定標(biāo)準(zhǔn)還采用了動(dòng)態(tài)權(quán)重的進(jìn)程健康指數(shù)計(jì)算方法。當(dāng)某一指標(biāo)大大超過判定的區(qū)域時(shí),會(huì)被標(biāo)記為異常狀態(tài),該項(xiàng)判定指標(biāo)的權(quán)重將會(huì)動(dòng)態(tài)提升,以降低進(jìn)程健康指數(shù)的最終得分,讓管理員發(fā)現(xiàn)該項(xiàng)指標(biāo)發(fā)生了異常。

        4.3 智能管理方面的模式創(chuàng)新

        由于數(shù)字航道系統(tǒng)所處硬件環(huán)境的特殊性,所有服務(wù)器均運(yùn)行在內(nèi)網(wǎng)環(huán)境。為解決這一問題開發(fā)者通過使用進(jìn)程重啟腳本的方式來(lái)實(shí)現(xiàn)數(shù)字航道系統(tǒng)核心進(jìn)程自動(dòng)重啟功能。同時(shí)提供四種不同的重啟策略來(lái)應(yīng)對(duì)不同的情境和需求。例如設(shè)定在深夜時(shí)段的定時(shí)重啟可以保障系統(tǒng)及時(shí)清理運(yùn)行時(shí)產(chǎn)生的冗余緩存數(shù)據(jù),解決部分報(bào)錯(cuò)問題,同時(shí)保持最小程度的重啟可感知性,保證系統(tǒng)持續(xù)高可用性。

        5 結(jié)語(yǔ)

        數(shù)字航道系統(tǒng)高效運(yùn)行的核心前提是數(shù)字航道系統(tǒng)平臺(tái)的穩(wěn)定運(yùn)行,實(shí)時(shí)提供數(shù)字航道各項(xiàng)關(guān)鍵業(yè)務(wù)數(shù)據(jù)。為更好地保障數(shù)字航道系統(tǒng)平臺(tái)的穩(wěn)定運(yùn)行,提高系統(tǒng)運(yùn)維效率,本研究提出了一套進(jìn)程守護(hù)系統(tǒng)來(lái)實(shí)時(shí)監(jiān)測(cè)數(shù)字航道系統(tǒng)核心進(jìn)程狀態(tài),并在核心進(jìn)程出現(xiàn)異常情況時(shí),及時(shí)進(jìn)行報(bào)警或自動(dòng)重啟,減少?gòu)某霈F(xiàn)問題到發(fā)現(xiàn)問題所需的時(shí)間,大大提高數(shù)字航道系統(tǒng)的穩(wěn)定性。本研究取得的成果如下:

        (1)本研究通過對(duì)長(zhǎng)江數(shù)字航道系統(tǒng)整體框架與技術(shù)構(gòu)成的深入研究,提出了一套基于Zabbix 的針對(duì)分布式系統(tǒng)的守護(hù)進(jìn)程原型系統(tǒng)。

        (2)該系統(tǒng)通過一系列關(guān)鍵技術(shù)實(shí)現(xiàn)了對(duì)數(shù)字航道系統(tǒng)所在服務(wù)器集群的實(shí)時(shí)進(jìn)程級(jí)監(jiān)控,分析以及故障報(bào)警等功能。同時(shí)制定了多種進(jìn)程重啟策略以滿足不同情形下的重啟需求。

        (3)開展了守護(hù)進(jìn)程原型系統(tǒng)在數(shù)字航道系統(tǒng)測(cè)試環(huán)境中的部署以及相關(guān)測(cè)試工作,該系統(tǒng)可展示實(shí)時(shí)監(jiān)控?cái)?shù)據(jù),對(duì)于系統(tǒng)故障能在秒級(jí)時(shí)間內(nèi)發(fā)出警報(bào),大大減少系統(tǒng)故障平均響應(yīng)時(shí)間與故障發(fā)生后帶來(lái)的經(jīng)濟(jì)效益損失。

        猜你喜歡
        進(jìn)程故障系統(tǒng)
        Smartflower POP 一體式光伏系統(tǒng)
        WJ-700無(wú)人機(jī)系統(tǒng)
        ZC系列無(wú)人機(jī)遙感系統(tǒng)
        故障一點(diǎn)通
        債券市場(chǎng)對(duì)外開放的進(jìn)程與展望
        連通與提升系統(tǒng)的最后一塊拼圖 Audiolab 傲立 M-DAC mini
        奔馳R320車ABS、ESP故障燈異常點(diǎn)亮
        故障一點(diǎn)通
        江淮車故障3例
        社會(huì)進(jìn)程中的新聞學(xué)探尋
        国产av天堂成人网| 久久久精品中文字幕麻豆发布| 中文字幕日韩精品一区二区三区| 日日鲁鲁鲁夜夜爽爽狠狠视频97| 成年女人在线观看毛片| 国产一区二区三区不卡在线观看 | 国产av一区二区精品久久凹凸| 国产男女乱婬真视频免费| 精品一区二区三区国产av| 日本精品一区二区三区在线观看| 国产片精品av在线观看夜色| 亚洲暴爽av人人爽日日碰| 久久99亚洲网美利坚合众国| 中文字幕一区二三区麻豆| 久久成人国产精品免费软件| 伊人久久大香线蕉综合网站| 欧美激情αv一区二区三区| 精品蜜桃一区二区三区| 日韩精品视频免费网站| 无码任你躁久久久久久久| 综合精品欧美日韩国产在线| 久久综合这里只有精品| 91久久精品一区二区三区大全| 国产成人无码a区在线观看导航| 性动态图av无码专区| 日韩国产有码在线观看视频| 男女激情视频网站免费在线| 特黄做受又硬又粗又大视频小说| 97在线观看| 亚洲色偷拍一区二区三区| 日本在线一区二区免费| 久久96国产精品久久久| 香港日本三级亚洲三级| 免费精品美女久久久久久久久久| 亚洲精品一区二在线观看| 777精品出轨人妻国产| 18禁美女裸体网站无遮挡| 色欧美与xxxxx| 麻豆视频av在线观看| 宅男666在线永久免费观看| 日韩在线免费|