肖飛 龍清
摘 要:目前檢察機(jī)關(guān)的信息化建設(shè)進(jìn)入快車(chē)道,各級(jí)檢察機(jī)關(guān)基本上都已經(jīng)完成了基礎(chǔ)網(wǎng)絡(luò)的建設(shè),并在其之上建立了大量的應(yīng)用系統(tǒng)。隨著檢察機(jī)關(guān)統(tǒng)一業(yè)務(wù)運(yùn)營(yíng)系統(tǒng)的上線(xiàn),所有的辦案流程都在網(wǎng)上流轉(zhuǎn),應(yīng)用系統(tǒng)的穩(wěn)定性越來(lái)越重要,對(duì)檢察機(jī)關(guān)的網(wǎng)絡(luò)與應(yīng)用的實(shí)時(shí)監(jiān)控和故障排查成為研究的重點(diǎn)。本文提出檢察機(jī)關(guān)建立省級(jí)集中信息網(wǎng)絡(luò)及應(yīng)用智能動(dòng)態(tài)監(jiān)測(cè)平臺(tái)的總體思路,并詳述其中的技術(shù)難點(diǎn)關(guān)聯(lián)分析算法如何實(shí)現(xiàn)。
關(guān)鍵詞:智能監(jiān)測(cè);數(shù)據(jù)建模;關(guān)聯(lián)分析;預(yù)警式服務(wù)
中圖分類(lèi)號(hào):TP312 文獻(xiàn)標(biāo)識(shí)碼:A
1 引 言
21世紀(jì)以來(lái),信息化技術(shù)的飛速革新為科技發(fā)展提供了巨大的助推力,尤其是在最近一個(gè)十年,web2.0和互聯(lián)網(wǎng)思維深入人心,計(jì)算機(jī)和網(wǎng)絡(luò)不但成為了人們不可缺少的手段,更加深刻的改變了人類(lèi)生產(chǎn)生活的方式[1]。如何在劇烈的社會(huì)變革中保持先進(jìn)的生產(chǎn)力,利用信息化的手段提升戰(zhàn)斗力,是檢察機(jī)關(guān)面臨的巨大挑戰(zhàn)。最近五年來(lái),檢察機(jī)關(guān)的信息化建設(shè)進(jìn)入快車(chē)道,網(wǎng)絡(luò)建設(shè)和系統(tǒng)建設(shè)相較于上一個(gè)十年取得了巨大的成就,尤其是檢察機(jī)關(guān)的統(tǒng)一業(yè)務(wù)應(yīng)用系統(tǒng)在全國(guó)檢察機(jī)關(guān)全面鋪開(kāi)上線(xiàn)后[2],該系統(tǒng)成為檢察機(jī)關(guān)最核心的業(yè)務(wù)應(yīng)用系統(tǒng),承載了檢察機(jī)關(guān)所有的辦案業(yè)務(wù)。該系統(tǒng)上線(xiàn)之后,實(shí)現(xiàn)了信息跨區(qū)域共享,提高了辦案效率、規(guī)范了執(zhí)法行為、強(qiáng)化了內(nèi)部監(jiān)督制約,為檢察權(quán)的依法正確行使提供了有效的信息化支撐和機(jī)制保障。但是由于全國(guó)檢察機(jī)關(guān)信息化建設(shè)工作建設(shè)晚、底子薄、資金有限,對(duì)應(yīng)用系統(tǒng)的監(jiān)控、保障、維護(hù)具有相當(dāng)大的難度。本文提出了檢察機(jī)關(guān)建立省級(jí)集中信息網(wǎng)絡(luò)及應(yīng)用智能動(dòng)態(tài)監(jiān)測(cè)平臺(tái)的總體思路,并詳述了其中的技術(shù)難點(diǎn)——關(guān)聯(lián)分析算法如何實(shí)現(xiàn)。
1.1 基本情況
目前,各級(jí)檢察機(jī)關(guān)已建成覆蓋從最高檢到全部基層檢察院的檢察系統(tǒng)專(zhuān)線(xiàn)網(wǎng)絡(luò),各級(jí)檢察院都將本院的局域網(wǎng)接入專(zhuān)線(xiàn)網(wǎng)上,并建立了大量多種多樣的應(yīng)用系統(tǒng),如電子郵件、內(nèi)網(wǎng)網(wǎng)站、網(wǎng)上辦公、網(wǎng)上辦案等。由于檢察院信息化平臺(tái)架構(gòu)比較早,業(yè)務(wù)系統(tǒng)比較分散、數(shù)據(jù)和管理應(yīng)用較復(fù)雜,對(duì)檢察業(yè)務(wù)的連續(xù)性存在潛在威脅、管理復(fù)雜、相應(yīng)速度滯后等問(wèn)題。2014年,檢察系統(tǒng)統(tǒng)一業(yè)務(wù)軟件正式運(yùn)行后,大部分的檢察業(yè)務(wù)均需網(wǎng)上辦理,這就對(duì)網(wǎng)絡(luò)的穩(wěn)定性提出了很高的要求。因此,對(duì)網(wǎng)絡(luò)實(shí)施不間斷的智能監(jiān)控,實(shí)時(shí)監(jiān)測(cè)網(wǎng)絡(luò)上各類(lèi)設(shè)備的運(yùn)行狀態(tài),對(duì)可能影響網(wǎng)絡(luò)穩(wěn)定的隱患提早發(fā)現(xiàn)、提早解決變得尤為重要。
隨著檢察機(jī)關(guān)各類(lèi)應(yīng)用軟件不斷增加,也迫切的需要對(duì)正在運(yùn)行的業(yè)務(wù)系統(tǒng)進(jìn)行實(shí)時(shí)監(jiān)管,一旦發(fā)現(xiàn)問(wèn)題,主動(dòng)報(bào)警,方便管理人員在第一時(shí)間發(fā)現(xiàn)問(wèn)題和解決問(wèn)題。
1.2 相關(guān)系統(tǒng)研究現(xiàn)狀
信息網(wǎng)絡(luò)智能監(jiān)測(cè)系統(tǒng)是進(jìn)行網(wǎng)絡(luò)監(jiān)測(cè)和管理最有效的手段,該類(lèi)系統(tǒng)主要有兩大類(lèi)別,一是設(shè)備廠商針對(duì)各自設(shè)備開(kāi)發(fā)的智能監(jiān)測(cè)管理系統(tǒng),如Cisco、3Com、華為、銳捷等;二是第三方開(kāi)發(fā)的IT運(yùn)維智能管理系統(tǒng),如HP、ENOC、東華網(wǎng)智、ServiceWise IT服務(wù)管理軟件等。這兩類(lèi)系統(tǒng)在一定程度上解決了網(wǎng)絡(luò)上各類(lèi)設(shè)備監(jiān)測(cè)和管理問(wèn)題,但不足之處也很明顯的,設(shè)備廠商的智能監(jiān)測(cè)管理系統(tǒng)只支持單一公司產(chǎn)品,不支持其他公司的產(chǎn)品,擴(kuò)展性不夠,功能性也比較單一。第三方運(yùn)維的檢測(cè)系統(tǒng)雖然對(duì)第三方產(chǎn)品進(jìn)行支持,但一般是著重于解決某一方面的問(wèn)題,如有的注重于對(duì)客戶(hù)端軟件的管理,有的注重于對(duì)各類(lèi)服務(wù)器性能的監(jiān)測(cè),有的則著重對(duì)網(wǎng)絡(luò)帶寬及網(wǎng)絡(luò)設(shè)備的監(jiān)測(cè)。以上這些系統(tǒng)在運(yùn)營(yíng)商或企業(yè)平臺(tái)中有一定程度的應(yīng)用,但由于檢察專(zhuān)網(wǎng)屬于保密網(wǎng)絡(luò),同時(shí)還應(yīng)符合國(guó)家保密局對(duì)于保密網(wǎng)絡(luò)的網(wǎng)絡(luò)智能監(jiān)測(cè)系統(tǒng)的要求。因此這些系統(tǒng)不能滿(mǎn)足檢察機(jī)關(guān)全方位監(jiān)控解決方案的需要。
要實(shí)現(xiàn)對(duì)檢察機(jī)關(guān)的信息網(wǎng)絡(luò)進(jìn)行全方位的智能監(jiān)控、做到統(tǒng)一管理、調(diào)度,就必須對(duì)檢察專(zhuān)線(xiàn)網(wǎng)的現(xiàn)狀進(jìn)行全面分析,嘗試將各類(lèi)產(chǎn)品進(jìn)行整合,互相開(kāi)放接口程序,使之形成統(tǒng)一、有效的監(jiān)管平臺(tái)。
1.3 檢察機(jī)關(guān)運(yùn)維存在的弊端
從自身角度來(lái)說(shuō),檢察機(jī)關(guān)的網(wǎng)絡(luò)運(yùn)維存在以下弊端:
1.運(yùn)維力量偏弱,尤其是在基層院,往往一人身兼數(shù)職;
2.應(yīng)用系統(tǒng)多且雜,沒(méi)有有效的監(jiān)控手段;
3.運(yùn)維人員比較雜,響應(yīng)慢,運(yùn)維機(jī)制不完善;
4.人員、設(shè)備調(diào)度不及時(shí),工作保障不及時(shí)。
為解決以上問(wèn)題,有必要以省級(jí)為單位調(diào)研檢察機(jī)關(guān)專(zhuān)線(xiàn)網(wǎng)的現(xiàn)狀,全面、系統(tǒng)地對(duì)檢察機(jī)關(guān)專(zhuān)線(xiàn)網(wǎng)管理與維護(hù)遇到的難題提出解決方案。
1.4 研究目標(biāo)
本論文研究的總體目標(biāo)是建立檢察機(jī)關(guān)的信息網(wǎng)絡(luò)智能監(jiān)測(cè)系統(tǒng),可在大屏幕界面和終端上實(shí)時(shí)觀測(cè)服務(wù)器運(yùn)行狀態(tài)、應(yīng)用程序運(yùn)行狀態(tài)和數(shù)據(jù)保障情況,實(shí)現(xiàn)網(wǎng)絡(luò)上的各類(lèi)設(shè)備及其應(yīng)用集中監(jiān)測(cè)、報(bào)警、應(yīng)急處置和遠(yuǎn)程處理,保障人員統(tǒng)一調(diào)度,提高網(wǎng)絡(luò)、應(yīng)用和數(shù)據(jù)運(yùn)行的穩(wěn)定性,變被動(dòng)響應(yīng)式的管理為主動(dòng)預(yù)警式的管理。
依托該系統(tǒng),集中監(jiān)控和發(fā)現(xiàn)故障,同時(shí)整合該省各級(jí)檢察院的IT運(yùn)維人員,對(duì)所有的運(yùn)維人員進(jìn)行統(tǒng)一管理、統(tǒng)一調(diào)度,建立健全統(tǒng)一的運(yùn)維、應(yīng)急處理機(jī)制,為下級(jí)院的IT運(yùn)維人員提供堅(jiān)實(shí)的技術(shù)支撐,解決目前各級(jí)院運(yùn)維力量薄弱、相應(yīng)速度慢、排除故障不及時(shí)的頑癥。
2 總體架構(gòu)
2.1 總體模塊架構(gòu)
我們?cè)O(shè)計(jì)的檢察機(jī)關(guān)智能動(dòng)態(tài)監(jiān)測(cè)系統(tǒng)總體架構(gòu)圖如圖1所示。圖中,信息系統(tǒng)智能動(dòng)態(tài)監(jiān)測(cè)平臺(tái)分為監(jiān)控中心、運(yùn)維中心、應(yīng)急中心、和指揮調(diào)度中心四個(gè)大的功能模塊。各類(lèi)服務(wù)器、網(wǎng)絡(luò)設(shè)備、應(yīng)用系統(tǒng)、視頻設(shè)備通過(guò)南向接口總線(xiàn)監(jiān)控中心接入告警數(shù)據(jù)和性能數(shù)據(jù),在監(jiān)控中心進(jìn)行匯總,根據(jù)預(yù)先設(shè)置的IT資源信息進(jìn)行關(guān)聯(lián)分析。分析后產(chǎn)生的故障數(shù)據(jù)通過(guò)運(yùn)維中心觸發(fā)綜合作業(yè)計(jì)劃或單項(xiàng)作業(yè)計(jì)劃,產(chǎn)生作業(yè)計(jì)劃調(diào)度數(shù)據(jù)。在應(yīng)急中心中依據(jù)業(yè)務(wù)影響的級(jí)別程度觸發(fā)各類(lèi)應(yīng)急響應(yīng)預(yù)案,產(chǎn)生應(yīng)急調(diào)度數(shù)據(jù)。各類(lèi)調(diào)度數(shù)據(jù)通過(guò)指揮調(diào)度中心生成任務(wù)工單,下發(fā)給IT運(yùn)維人員進(jìn)行調(diào)度操作,并進(jìn)行自動(dòng)短信通知或郵件通知。當(dāng)調(diào)度需要其他業(yè)務(wù)系統(tǒng)流程配合時(shí),通過(guò)北向接口總線(xiàn)上傳到其他業(yè)務(wù)系統(tǒng)接口中,在相關(guān)業(yè)務(wù)系統(tǒng)中完成調(diào)度并回饋閉環(huán)數(shù)據(jù)給指揮調(diào)度中心。該平臺(tái)應(yīng)當(dāng)有完善的檢察機(jī)關(guān)IT運(yùn)維人員管理機(jī)制和運(yùn)維保障機(jī)制作為支撐,并建立系統(tǒng)自身的安全策略,將相關(guān)的故障處理流程存入知識(shí)庫(kù)中,提供給IT運(yùn)維人員查閱使用。endprint
2.2 數(shù)據(jù)流圖架構(gòu)
從監(jiān)控系統(tǒng)的數(shù)據(jù)流的角度來(lái)看,如圖2所示,該系統(tǒng)通過(guò)標(biāo)準(zhǔn)接口方式綜合采集設(shè)備層的各類(lèi)告警、性能和網(wǎng)絡(luò)參數(shù)數(shù)據(jù),通過(guò)統(tǒng)一的接口層進(jìn)行數(shù)據(jù)清洗和數(shù)據(jù)轉(zhuǎn)換,在數(shù)據(jù)模型層轉(zhuǎn)化為標(biāo)準(zhǔn)的資源模型數(shù)據(jù)和動(dòng)態(tài)告警、性能數(shù)據(jù),并在關(guān)聯(lián)分析層自動(dòng)進(jìn)行數(shù)據(jù)挖掘和數(shù)據(jù)關(guān)聯(lián),講動(dòng)態(tài)數(shù)據(jù)與資源數(shù)據(jù)進(jìn)行關(guān)聯(lián),確定告警、性能數(shù)據(jù)可能影響到的業(yè)務(wù)資源,最后將分析結(jié)果提交給調(diào)度處理層進(jìn)行業(yè)務(wù)影響判斷、故障處理和工單調(diào)度處理。
3 關(guān)鍵技術(shù)點(diǎn)
3.1 多種數(shù)據(jù)采集
目前,架設(shè)在檢察專(zhuān)線(xiàn)網(wǎng)上的設(shè)備有網(wǎng)絡(luò)設(shè)備、安全設(shè)備、服務(wù)器、存儲(chǔ)設(shè)備、視頻設(shè)備等,設(shè)備類(lèi)型多種多樣、設(shè)備品牌型號(hào)均不一致。智能動(dòng)態(tài)監(jiān)測(cè)系統(tǒng)應(yīng)該能監(jiān)測(cè)到各類(lèi)設(shè)備的以下信息,以保證基本全面地獲取系統(tǒng)管理所需的數(shù)據(jù)。
1.網(wǎng)絡(luò)設(shè)備:設(shè)備告警信息、性能狀態(tài)信息(如CPU狀態(tài)信息、內(nèi)存狀態(tài)信息)、網(wǎng)絡(luò)拓?fù)湫畔ⅰ⒃O(shè)備運(yùn)行日志信息、設(shè)備所有者信息、路由信息、配置文件信息、鏈路管理信息、IP地址、接口狀態(tài)等;
2.服務(wù)器、存儲(chǔ)設(shè)備:設(shè)備告警信息、性能狀態(tài)信息(如CPU狀態(tài)信息、內(nèi)存狀態(tài)信息)、網(wǎng)絡(luò)拓?fù)湫畔?、硬盤(pán)Smart信息、設(shè)備運(yùn)行日志信息、IP地址、設(shè)備所有者信息等;
3.安全設(shè)備:設(shè)備告警信息、性能狀態(tài)信息(如CPU狀態(tài)信息、內(nèi)存狀態(tài)信息)、網(wǎng)絡(luò)拓?fù)湫畔?、設(shè)備運(yùn)行日志信息、設(shè)備所有者信息、配置文件信息、安全防護(hù)日志信息、IP地址、接口狀態(tài)等;
4.視頻設(shè)備:設(shè)備告警信息、性能狀態(tài)信息(如CPU狀態(tài)信息、內(nèi)存狀態(tài)信息)、網(wǎng)絡(luò)拓?fù)湫畔?、設(shè)備運(yùn)行日志信息、IP地址、設(shè)備所有者信息、接口狀態(tài)等。
5.系統(tǒng)應(yīng)用:系統(tǒng)相關(guān)進(jìn)程的正常運(yùn)行情況、與外部接口的聯(lián)通情況、關(guān)鍵數(shù)據(jù)的存儲(chǔ)情況等。
3.2 多接口接入
智能動(dòng)態(tài)監(jiān)測(cè)系統(tǒng)需要支持對(duì)以下各類(lèi)接口方式接入方式。3.3 運(yùn)維智能知識(shí)庫(kù)建立
知識(shí)庫(kù)就是對(duì)信息網(wǎng)絡(luò)及應(yīng)用智能監(jiān)測(cè)系統(tǒng)中涉及到的軟硬件信息和知識(shí)進(jìn)行收集和整理,按照一定的方法進(jìn)行分類(lèi)保存,并提供相應(yīng)的檢索手段,同時(shí)通過(guò)建立的知識(shí)庫(kù),將知識(shí)庫(kù)與事件監(jiān)控中心進(jìn)行關(guān)聯(lián),在發(fā)生事件時(shí),可以為事件處理人員提供大量的相關(guān)信息,例如事件相關(guān)的配置信息、關(guān)聯(lián)業(yè)務(wù),該事件的最佳處理方式等。這樣為事件處理人員提供決策支持信息,同時(shí)提供相應(yīng)事件進(jìn)行處理的標(biāo)準(zhǔn)流程,大大減少對(duì)事件進(jìn)行處理所需要的事件。減少事件處理的出錯(cuò)概率。通過(guò)對(duì)普遍性事件的標(biāo)準(zhǔn)流程處理過(guò)程可以采用事件預(yù)案處理方式實(shí)現(xiàn)信息網(wǎng)絡(luò)及應(yīng)用智能監(jiān)測(cè)系統(tǒng)自動(dòng)處理,提高事件處理的效率,減少事件處理人員的工作量和出錯(cuò)概率。
3.4 運(yùn)維流程調(diào)度
調(diào)度中心根據(jù)監(jiān)測(cè)中心的數(shù)據(jù),對(duì)系統(tǒng)的運(yùn)行情況進(jìn)行全面分析,在發(fā)生故障的情況下,根據(jù)故障的嚴(yán)重程度、緊急性要求向運(yùn)維中心或應(yīng)急中心發(fā)送指令,啟動(dòng)運(yùn)維流程或應(yīng)急流程。
運(yùn)維中心既可以接收調(diào)度中心的工作任務(wù),也可以接收系統(tǒng)維護(hù)人員自發(fā)提起的工作任務(wù)。如果是其他機(jī)關(guān)部門(mén)個(gè)人進(jìn)行故障報(bào)修,還需要先經(jīng)過(guò)故障等級(jí)評(píng)定才發(fā)起工作任務(wù)。對(duì)于提起的工單,如果是緊急或嚴(yán)重的故障處理,系統(tǒng)會(huì)提交給應(yīng)急中心。應(yīng)急中心有一套完整的應(yīng)急預(yù)案,包括:故障通報(bào)機(jī)制,運(yùn)維處理權(quán)限提升機(jī)制,從而有效的整合各種人員、設(shè)備、資金、資源,實(shí)現(xiàn)故障迅速排除。
對(duì)于普通的故障處理,運(yùn)維中心要綜合調(diào)度運(yùn)維人員、備用設(shè)備和管理軟件,對(duì)故障進(jìn)行處理。故障處理完畢后,判斷處理結(jié)果是否需要升級(jí)上報(bào),升級(jí)上報(bào)的任務(wù)如果不能徹底解決,將向調(diào)度中心報(bào)告。如果不需升級(jí)上報(bào)的任務(wù)或徹底處理完成的任務(wù),將生成處理方案進(jìn)行審批,并關(guān)閉事件工單。并將處理的信息同步到知識(shí)庫(kù)。
4 核心算法分析
從監(jiān)測(cè)的數(shù)據(jù)來(lái)看,各類(lèi)網(wǎng)絡(luò)設(shè)備、操作系統(tǒng)、應(yīng)用系統(tǒng)產(chǎn)生的告警數(shù)據(jù)、性能數(shù)據(jù)應(yīng)當(dāng)是相互關(guān)聯(lián)的。某個(gè)網(wǎng)絡(luò)節(jié)點(diǎn)、某臺(tái)服務(wù)器性能或某個(gè)應(yīng)用系統(tǒng)故障有可能影響到的是同一個(gè)檢察業(yè)務(wù)。智能動(dòng)態(tài)監(jiān)測(cè)平臺(tái)應(yīng)當(dāng)能夠根據(jù)預(yù)先建立的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)和各個(gè)層級(jí)之間的依賴(lài)關(guān)系建立起關(guān)聯(lián)分析和故障根源性分析的手段,從某個(gè)告警或性能數(shù)據(jù)出發(fā),層層溯源,尋找其影響的檢察業(yè)務(wù),發(fā)出通知信息,提供給IT管理人員主動(dòng)發(fā)現(xiàn)故障和解決故障,將業(yè)務(wù)中斷的影響時(shí)間縮短到最短,影響降低到最低。
以下給出了對(duì)資源關(guān)系進(jìn)行抽象數(shù)據(jù)建模和進(jìn)行關(guān)聯(lián)分析的基本算法思路。
4.1 支持關(guān)聯(lián)分析的全網(wǎng)資源數(shù)據(jù)建模
檢察機(jī)關(guān)網(wǎng)絡(luò)錯(cuò)綜復(fù)雜,多個(gè)專(zhuān)業(yè)之間存在著承載和轉(zhuǎn)接的關(guān)系,各網(wǎng)絡(luò)設(shè)備、硬件設(shè)備和應(yīng)用系統(tǒng)之間類(lèi)型復(fù)雜,告警也相互影響。為支持告警關(guān)聯(lián)分析,必須針對(duì)全網(wǎng)進(jìn)行跨資源數(shù)據(jù)建模,以模型進(jìn)行關(guān)聯(lián)分析的支撐[3]。
圖3為全網(wǎng)資源數(shù)據(jù)模型,該模型力求屏蔽資源支撐網(wǎng)絡(luò)錯(cuò)綜復(fù)雜的專(zhuān)業(yè)性差異,將各專(zhuān)業(yè)資源數(shù)據(jù)以及數(shù)據(jù)之間的物理、邏緝關(guān)聯(lián)用簡(jiǎn)潔明了的數(shù)據(jù)結(jié)構(gòu)進(jìn)行存儲(chǔ),以之支撐告警和性能數(shù)據(jù)的關(guān)聯(lián)分析[4]。
從邏緝視角可將上述模型分為4個(gè)層次:應(yīng)用、業(yè)務(wù)、鏈路、節(jié)點(diǎn),其中的鏈路是廣義上的和跨軟硬件的,泛指所有的能夠承載業(yè)務(wù)的物理或者邏緝連接,節(jié)點(diǎn)同樣是廣義上和跨專(zhuān)業(yè)的,泛指所有能夠發(fā)生告警的端點(diǎn)[5]。
結(jié)合以上釋義來(lái)看圖4中關(guān)系,T_Customer為第一層的應(yīng)用數(shù)據(jù),記錄了所有應(yīng)用數(shù)據(jù);T_Service為第二層的業(yè)務(wù)數(shù)據(jù),記錄了承載在檢察專(zhuān)線(xiàn)網(wǎng)上的所有業(yè)務(wù);T_Path和T_Link為第三層,是支持關(guān)聯(lián)分析核心數(shù)據(jù),記錄了廣義的鏈路信息,其中T_Path表專(zhuān)用于記錄所有的物理連接,例如從交換機(jī)到路由器之間的物理連接,網(wǎng)絡(luò)線(xiàn)路對(duì)服務(wù)器、存儲(chǔ)的承接關(guān)系等;T_Link記錄了所有的邏緝連接,如某幾臺(tái)存儲(chǔ)和服務(wù)器支撐起了統(tǒng)一業(yè)務(wù)軟件系統(tǒng),系統(tǒng)中包涵了檢察機(jī)關(guān)偵查、公訴等相關(guān)的業(yè)務(wù);T_TermPoints為第四層邏緝數(shù)據(jù),記錄所有的節(jié)點(diǎn)信息,無(wú)論該節(jié)點(diǎn)是物理鏈路的端口還是邏輯鏈路的端口,都記錄其中,與之相關(guān)的是T_Equipment,用來(lái)記錄節(jié)點(diǎn)所屬的網(wǎng)元信息,以及T_TermSubTerm,用于記錄各節(jié)點(diǎn)之間的父子關(guān)系。endprint
建立以上跨專(zhuān)業(yè)的模型之后,就可以將復(fù)雜的資源數(shù)據(jù)采用倒入或錄入的方式存入該統(tǒng)一模型之中,提供給關(guān)聯(lián)分析作為數(shù)據(jù)支撐。
4.2 基于資源模型的關(guān)聯(lián)分析算法
基于資源模型進(jìn)行關(guān)聯(lián)分析算法的過(guò)程,目的是發(fā)現(xiàn)根源故障,排除衍生故障。該算法運(yùn)行的過(guò)程就是通過(guò)資源模型將告警進(jìn)行分組,并在組內(nèi)通過(guò)時(shí)間以及告警位置發(fā)現(xiàn)告警之間的關(guān)系[6]。
以下將各資源之間的物理關(guān)系稱(chēng)為Path關(guān)系,各資源之間的邏緝關(guān)系稱(chēng)為L(zhǎng)ink關(guān)系,所有發(fā)生告警的節(jié)點(diǎn)稱(chēng)為T(mén)P,一組相關(guān)的節(jié)點(diǎn)稱(chēng)為T(mén)Ps,各節(jié)點(diǎn)之間的父子關(guān)系稱(chēng)為SubTerm關(guān)系。具體的關(guān)聯(lián)分析算法運(yùn)行步驟如下:
1.析告警信息,合理抽取關(guān)聯(lián)算法涉及的關(guān)鍵告警信息;
2.從該條告警數(shù)據(jù)的TP出發(fā),參照SubTerm關(guān)系中記錄的節(jié)點(diǎn)父子關(guān)系,拓展出所有的父TP;
3.參照Link關(guān)系,拓展出一個(gè)Link中所有對(duì)應(yīng)的A端TP和Z端TP;
4.參照Path關(guān)系,拓展出指定深度或者指定最大個(gè)數(shù)的TP。應(yīng)該確保一個(gè)網(wǎng)元內(nèi)的與當(dāng)前TP有Path關(guān)系的高層TP都能被拓展到。建議拓展深度為3;
5.以上三步拓展獲取的TP集合組成一個(gè)相關(guān)的TPs;
6.獲取該TPs在一個(gè)特定時(shí)間窗口上發(fā)生的所有告警Alarms,對(duì)TPs組進(jìn)行裁減;
7.將TPs中每個(gè)TP與Service關(guān)系進(jìn)行關(guān)聯(lián),查看每個(gè)TP的告警影響到多少個(gè)Service,記為associateNum;
8.統(tǒng)計(jì)TPs組內(nèi)所有的TP的associateNum,選取其中最大的作為該組的根源告警。
以上步驟中,1.為預(yù)處理,2~5為抽取組合TPs,6~8為進(jìn)行根源判斷。
算法中,基于資源模型對(duì)告警進(jìn)行了分組,分組中加入了時(shí)間窗口的考慮,并對(duì)各告警的跨專(zhuān)業(yè)關(guān)聯(lián)進(jìn)行了分析,分組完成后,基于告警影響的程度大小,判定了根源告警,抑制了衍生告警[7]。
4.3 告警處理流程描述
按照以上算法,告警在本系統(tǒng)中的處理基本流程如圖5所示。在預(yù)處理、數(shù)據(jù)清洗之后,進(jìn)行告警分類(lèi)組合、根源判斷、影響性判斷,最終形成結(jié)論推送給運(yùn)維人員,幫助定位故障和處理故障[8]。
5 小 結(jié)
對(duì)于省級(jí)集中管理的單位來(lái)說(shuō),如何在網(wǎng)絡(luò)和應(yīng)用系統(tǒng)飛速發(fā)展、不斷膨脹的信息化時(shí)代,對(duì)全網(wǎng)進(jìn)行管理,是當(dāng)前IT管理的重點(diǎn)和難點(diǎn)。本文提出了檢察機(jī)關(guān)建立省級(jí)集中信息網(wǎng)絡(luò)及應(yīng)用智能動(dòng)態(tài)監(jiān)測(cè)平臺(tái)的總體思路,并詳述了其中的技術(shù)難點(diǎn)——關(guān)聯(lián)分析算法如何實(shí)現(xiàn)。從經(jīng)濟(jì)效益來(lái)說(shuō),檢察機(jī)關(guān)省級(jí)集中的智能動(dòng)態(tài)監(jiān)測(cè)系統(tǒng)實(shí)現(xiàn)以后,能夠有效的解決檢察機(jī)關(guān)運(yùn)維力量不足、故障處理響應(yīng)慢的弊端,集中調(diào)度全省IT運(yùn)維人員,有利于節(jié)約運(yùn)維方面的人力。而且,在預(yù)警式的故障監(jiān)管得以實(shí)現(xiàn)后,有利于檢察機(jī)關(guān)及時(shí)了解網(wǎng)絡(luò)設(shè)備和硬件設(shè)備的運(yùn)行情況,發(fā)現(xiàn)性能瓶頸,有針對(duì)性的采購(gòu)相關(guān)軟硬件,做到有的放矢,有利于節(jié)約IT運(yùn)維成本。另外,該系統(tǒng)經(jīng)論證和實(shí)現(xiàn)后,具有在全國(guó)檢察機(jī)關(guān)及其它有類(lèi)似的涉密網(wǎng)、非涉密網(wǎng)復(fù)雜網(wǎng)絡(luò)環(huán)境的省級(jí)單位進(jìn)行推廣的價(jià)值。
黨的十八屆四中全會(huì)為我國(guó)司法改革制定了宏偉藍(lán)圖,檢察機(jī)關(guān)在司法改革的大潮中擔(dān)負(fù)著無(wú)比重要的攻堅(jiān)戰(zhàn)任務(wù),信息化的手段無(wú)疑將會(huì)是未來(lái)改革中強(qiáng)有力的助推器,如何利用信息化的手段支持檢察業(yè)務(wù)、保障司法改革,成為檢察機(jī)關(guān)信息化人員面臨的重要課題。本文提出的思路,能夠?yàn)闄z察機(jī)關(guān)信息化提供進(jìn)一步的保障和促進(jìn),具有積極意義。當(dāng)然,對(duì)該思路還必要進(jìn)行深入思考和反復(fù)論證,更有待于實(shí)務(wù)的檢驗(yàn)和各級(jí)檢察機(jī)關(guān)不斷努力嘗試。
參考文獻(xiàn)
[1] 國(guó)家電子政務(wù)十二五規(guī)劃[R].
[2] 最高人民檢察院.《“十二五”時(shí)期科技強(qiáng)檢規(guī)劃綱要》[R].
[3] 王洋,李國(guó)才,徐亞昆. 信息通信網(wǎng)絡(luò)告警分類(lèi)、關(guān)聯(lián)性與管理方法研究[J].電信科學(xué),2013,(8):132-135.
[4] 陸振鋒.基于Web服務(wù)的集中告警系統(tǒng)建設(shè)探討[J]. 江西通信科技,2008(03): 42-45.
[5] 丁志平,楊季文,呂強(qiáng). 網(wǎng)絡(luò)管理系統(tǒng)中資源模型的設(shè)計(jì)與應(yīng)用[J]. 計(jì)算機(jī)工程,2007,(6):173-175.
[6] 閆生超,唐云善,張春平,等.基于網(wǎng)絡(luò)和時(shí)間關(guān)聯(lián)關(guān)系的告警相關(guān)性分析[J]. 電力系統(tǒng)自動(dòng)化,2011,(9):78-81.
[7] 劉冬生,曾小薈,唐衛(wèi)東,等. 一種新的告警關(guān)聯(lián)聚類(lèi)算法.計(jì)算機(jī)應(yīng)用研究,2013,(12):3786-3789.
[8] 李煥洲,張健,陳麟. 涉密網(wǎng)資源監(jiān)控體系的研究與實(shí)現(xiàn)[J].計(jì)算機(jī)應(yīng)用, 2006,5(5):1090-1092.endprint