孫永梅 王紅民
摘 要:信息系統(tǒng)是信息化的基礎和重要內容,在信息化快速發(fā)展的今天,各類信息系統(tǒng)(本文重點描述非涉密信息系統(tǒng))應運而生。為了使系統(tǒng)處于良好運行狀態(tài),充分發(fā)揮其工作效能,就必須要加強系統(tǒng)的運行維護管理(以下簡稱運維),在實際運維過程中要借助大數(shù)據(jù)的工具和思路,制定科學合理的運維計劃和應急預案,提高信息系統(tǒng)的運維效率和質量。
關鍵詞:信息 系統(tǒng)大數(shù)據(jù) 系統(tǒng)維護
中圖分類號:TN913 文獻標識碼:A 文章編號:1674-098X(2017)06(a)-0164-02
1 運維對象
提到運維,必須首先明確運維對象,一是基礎設施,包括機房(含有配電、UPS、溫濕度控制、門禁等);二是服務器、小型機、磁盤陣列等承載信息系統(tǒng)運行的硬件設備;三是防火墻、防毒墻、WAF(應用防火墻)、網(wǎng)閘、負載均衡、IPS、抗DDOS攻擊、APM(應用性能管理系統(tǒng))、日志服務器、網(wǎng)管軟件、備份系統(tǒng)等安全設備;四是操作系統(tǒng)、虛擬化軟件、數(shù)據(jù)庫軟件、網(wǎng)絡版防病毒軟件等基礎環(huán)境軟件;五是互聯(lián)網(wǎng)或與互聯(lián)網(wǎng)邏輯隔離的專線網(wǎng)絡(如國家電子政務外網(wǎng)或行業(yè)轉線網(wǎng));六是信息系統(tǒng)軟件及軟件在運行中產(chǎn)生的數(shù)據(jù);七是信息系統(tǒng)的主管者、系統(tǒng)管理員、系統(tǒng)維護人員及系統(tǒng)用戶,及其終端設備;八是系統(tǒng)的應急預案、巡檢及故障處理優(yōu)化記錄等知識庫資料文檔。
2 運維數(shù)據(jù)
根據(jù)運維對象的分類歸納,運維數(shù)據(jù)包括七大類。
2.1 基礎設施數(shù)據(jù)
機房的承重參數(shù)、環(huán)境溫濕度、機房空調和UPS的功率及UPS延時時間和斷電后溫度上升速度和上限、進出機房的門禁記錄和攝像記錄等。
2.2 硬件設備數(shù)據(jù)
設備的配置參數(shù)(含CPU、內存、硬盤、電源及功率等)、設備上線日期、資產(chǎn)記錄、保修期和維修記錄、位于機柜內的具體位置、承載的實際系統(tǒng)清單以及設備巡檢記錄及外觀報警記錄等。
2.3 安全設備數(shù)據(jù)
安全設備的部署方式、啟用功能、安全策略、安全設備的各項日志、數(shù)據(jù)流量、黑白名單等。
2.4 基礎軟件數(shù)據(jù)
各類基礎軟件的版本、補丁及升級記錄、虛擬化軟件和防病毒軟件有效期限、系統(tǒng)的登陸日志、安全事件日志等。
2.5 網(wǎng)絡數(shù)據(jù)
互聯(lián)網(wǎng)或專線網(wǎng)絡專線號、域名解析、系統(tǒng)備案信息、帶寬、上聯(lián)下聯(lián)設備、系統(tǒng)整體網(wǎng)絡拓撲結構圖等。
2.6 信息系統(tǒng)軟件及數(shù)據(jù)
信息系統(tǒng)的軟件版本、歷史版本和升級記錄、系統(tǒng)數(shù)據(jù)及各個時點的系統(tǒng)備份數(shù)據(jù)。系統(tǒng)設計的用戶數(shù)、在線規(guī)模人數(shù)、并發(fā)訪問量以及系統(tǒng)數(shù)據(jù)的日均增量等。
2.7 信息系統(tǒng)的主管者、系統(tǒng)管理員、系統(tǒng)維護人員及系統(tǒng)用戶等數(shù)據(jù)
信息系統(tǒng)的主管者、系統(tǒng)管理員、系統(tǒng)維護人員及用戶清單(含姓名職務聯(lián)系方式等),系統(tǒng)上線時間和升級記錄、系統(tǒng)各相關干系人調閱數(shù)據(jù)、維護系統(tǒng)的申請和審批處理記錄等。系統(tǒng)性能的峰值指標、峰值時段、閑值指標、閑值時段等。
2.8 系統(tǒng)知識庫數(shù)據(jù)
各項運維管理制度、系統(tǒng)的應急預案和應急演練記錄、巡檢及故障處理優(yōu)化記錄等知識庫資料文檔數(shù)據(jù)。
綜上所述,運維數(shù)據(jù)包羅萬象,既有關系型的數(shù)據(jù)庫數(shù)據(jù),又有非關系型的文件、圖片、影像等數(shù)據(jù)。運維數(shù)據(jù)量可謂海量。另外,各類運維數(shù)據(jù)之間又相互關聯(lián)、相互影響、相互制約,摸清各類運維數(shù)據(jù)之間的關系對于提高運維效率和質量至關重要。比如:硬件設備的配置參數(shù)(如服務器的CPU、內存)、基礎軟件(如數(shù)據(jù)庫的索引建立和優(yōu)化)的優(yōu)化參數(shù)、網(wǎng)絡的帶寬及網(wǎng)管軟件的帶寬分配和安全設備的安全策略以及信息系統(tǒng)軟件自身效率處理等4大因素決定了信息系統(tǒng)的性能指標(系統(tǒng)設計的用戶數(shù)、在線規(guī)模人數(shù)、并發(fā)訪問量)。再比如:服務器硬盤故障燈告警,做了raid5的磁盤仍然可以保持正常運維,軟件方面不會有任何故障提示,但是如果不及時更換故障硬盤,將為系統(tǒng)數(shù)據(jù)丟失埋下巨大的安全隱患。
3 大數(shù)據(jù)運維
3.1 統(tǒng)一安全管控平臺
從客戶實際環(huán)境出發(fā),對全網(wǎng)的安全設備、網(wǎng)絡設備、主機設備、數(shù)據(jù)庫及應用系統(tǒng)的日志、事件信息進行集中收集和管理,結合客戶最關注的信息安全痛點問題,通過強大的關聯(lián)分析引擎制定關聯(lián)規(guī)則,實時對客戶現(xiàn)網(wǎng)環(huán)境進行監(jiān)控和分析,對網(wǎng)絡異常情況、系統(tǒng)脆弱性、黑客入侵、違規(guī)操作等安全事件實時報警,并通過友好的展示界面進行展示,使得不同層次的管理人員都能從平臺中查看到自己最關注的安全信息。平臺由據(jù)采集層、分析處理層、安全展現(xiàn)層及及其對外接口組成。
數(shù)據(jù)采集層:主要對各類安全資源、對象的安全事件、安全配置、安全漏洞、資產(chǎn)信息等數(shù)據(jù)進行采集,此類信息一般通過Syslog、SNMP Trap、File(FTP或SFTP)、ODBC、XML等標準協(xié)議。
分析處理層:主要是對系統(tǒng)采集到的各種設備的信息進行存儲和分析處理。包括信息的過濾、歸并、關聯(lián)分析,從海量日志中分析潛在的安全問題,產(chǎn)生安全告警,結合資產(chǎn)價值和脆弱性進行綜合風險分析。
安全呈現(xiàn)層:對采集分析數(shù)據(jù)進行統(tǒng)一呈現(xiàn),提供相應的Portal登陸查看、操作界面,實現(xiàn)資產(chǎn)管理、報表管理、系統(tǒng)管理、安全告警管理、脆弱性管理、風險管理、知識庫管理、運維管理等。并對不同的管理人員提供不同的展示界面,系統(tǒng)管理人員最多點擊三次操作就可以定位到安全事件的根源。
外部接口層:提供與支撐系統(tǒng)、專業(yè)安全系統(tǒng)的外部接口。
3.2 綜合網(wǎng)管軟件
網(wǎng)管軟件不能僅停留在設備管理層面,它應該能進一步深入的對服務器和應用系統(tǒng)進行監(jiān)測和管理。采用友好的使用界面,這樣就可以遠程協(xié)同維護和管理,實現(xiàn)分布式大規(guī)模網(wǎng)絡的集中層級管理?,F(xiàn)在流行的一類網(wǎng)管軟件,采用非代理模式,這樣就避免了傳統(tǒng)的“Agent”模式的繁瑣和重復性勞動,而且便于實施和后期維護,極大地節(jié)省了工作時間和工作繁雜度。網(wǎng)管軟件必須做到對網(wǎng)絡中每個關鍵應用的監(jiān)測和管理。這樣,管理人員可以迅速對其應用系統(tǒng)、服務器或設備進行定位,檢測各關鍵應用信息系統(tǒng)運行是否正常。
先進的網(wǎng)管軟件還能提供美觀的網(wǎng)絡應用拓撲圖,對應用系統(tǒng)的流程進行逐步監(jiān)測,當系統(tǒng)異常時,通過顏色變化及時定位和提示應用系統(tǒng)故障。另外,主動式的網(wǎng)管系統(tǒng)是發(fā)展方向。網(wǎng)管系統(tǒng)本身具有強大的預故障處理功能,并且能夠自動進行故障恢復,盡一切的可能把故障發(fā)生的可能性降至了最低。好的網(wǎng)管系統(tǒng)應該讓網(wǎng)管員忘記了這套系統(tǒng)在網(wǎng)絡中的管理。
針對海量的運維數(shù)據(jù),既要利用現(xiàn)代化、可視化的大數(shù)據(jù)工具,又要充分發(fā)揮系統(tǒng)開發(fā)者、維護者的經(jīng)驗智慧,從海量、繁雜的數(shù)據(jù)中挖掘出相互關聯(lián)的規(guī)律和影響制約關系。對于制定科學的運維計劃、設備及軟件更新計劃、應急預案等極有針對性和科學性,是縮短系統(tǒng)故障時間、提高運維效率和質量的必要保證。
參考文獻
[1] 李大偉,劉飛飛,李薇薇.信息系統(tǒng)運行維護的八大意識[J].中國信息界,2011(3):51-52.
[2] 李培林.對信息系統(tǒng)運行維護管理的探討[J].機械工業(yè)信息與網(wǎng)絡,2013(10):54.
[3] 田雨.信息系統(tǒng)運行維護管理模式探討[J].中小企業(yè)管理與科技旬刊,2015(9):227.