【摘 要】本文主要介紹了近幾年在煉化企業(yè)信息化快速發(fā)展的情況下,大量的信息系統(tǒng)上線運行,大大小小近一百個。關于如何做好應用系統(tǒng)運行維護進行了探討,主要從運維制度化、加強變更管理、監(jiān)控管理、問題管理、培訓管理等方面著手,保證系統(tǒng)平穩(wěn)運行。
【關鍵詞】應用系統(tǒng);運行維護
0.概述
2000年以來,在中國石化信息化建設的總體部署下,企業(yè)的信息化建設得到了跨越式的發(fā)展,初步建成以ERP 為核心的經營管理信息體系、以MES為核心的生產管理信息體系、以實時數據庫為核心的生產控制信息體系,搭建起了企業(yè)信息化建設的總體框架。目前我公司已建成的應用系統(tǒng)有近百個,如下圖所示:
圖1-1 已建成的主要信息系統(tǒng)
根據總部信息化“六統(tǒng)一”原則和“建用結合、以用為主”方針指引,隨著這些核心業(yè)務系統(tǒng)的逐步上線運行,企業(yè)的生產經營已經離不開信息系統(tǒng),如何保證這些信息系統(tǒng)能夠安全平穩(wěn)運行;如何利用系統(tǒng)切實解決企業(yè)生產經營難點、提升精細化管理、提高經濟效益;成為擺在運維支持人員面前的一個重要課題,下面主要從以下幾個方面進行討論。
1.系統(tǒng)維護和管理的重要性
隨著近幾年我公司信息系統(tǒng)的逐漸上線運行,形成了“生產經營分析—TBM—ERP—MES—計量—LIMS—實時數據庫”等核心系統(tǒng)為主線的從“經營—生產—操作控制”一系列的信息系統(tǒng)。任何一個系統(tǒng)故障造成的損失,影響面是比較大,甚至影響整個企業(yè)的業(yè)務,如:服務器故障、ERP系統(tǒng)、計量系統(tǒng)的進出廠業(yè)務等。
其次,從各信息系統(tǒng)的生命周期看,大致可分為規(guī)劃和設計、開發(fā)和測試、實施、運營和終止等五個階段。前面三階段從時間的角度看,只占生命周期的20%,其余80%的時間基本上是運維服務,如果系統(tǒng)運維做得不好,那么這些花費大筆投資建立起來的系統(tǒng),無法帶來預期的效益,或者導致用戶無法正常使用,因此信息系統(tǒng)也是“三分靠建設,七分靠管理”。只有進行良好的維護和管理,信息系統(tǒng)才能正常運轉并發(fā)揮作用。信息系統(tǒng)的運維管理要從系統(tǒng)技術管理和業(yè)務應用管理兩個方面著手,一方面保證系統(tǒng)長滿優(yōu)平穩(wěn)運行,另一方面保證系統(tǒng)的應用效果。
2.規(guī)范運維管理,建立運維支持體系
從組織機構上建立支持中心,參照中石化總部信息系統(tǒng)運維二層三級的支持體系,成立企業(yè)支持中心,全面負責公司信息系統(tǒng)的運行管理工作。
首先,選擇合適的業(yè)務人員和IT人員負責系統(tǒng)管理及各類業(yè)務的運維支持工作,要 “選用合適的人,合理地做事 ”。各支持人員一定要精通本專業(yè)的業(yè)務處理,培養(yǎng)既懂業(yè)務又懂IT的復合型人才。同時,引入“AB角制度”,明確分工職責,落實責任到人。每模塊均設置主員和備員,主員承擔模塊支持工作,備員作為后備力量,在主員崗位變化時,備員承擔主員職責。
其次,系統(tǒng)運維工作細致繁瑣,如何保證將其做到“無微不至”呢?方法是把運維工作和制度化緊緊地捆綁到一起?!皼]有規(guī)矩,不成方圓”,科學、完善的制度是運行管理的核心之一。必須完善和嚴格落實運維管控制度,用制度管人,用流程管事,使得運維工作做到有章可循、有據可依。
3.做好系統(tǒng)變更管理,降低系統(tǒng)風險
在系統(tǒng)運維過程中,由于系統(tǒng)升級、程序優(yōu)化、業(yè)務調整、用戶調整等需求,都需要進行系統(tǒng)的變更。為了做好系統(tǒng)變更管理,主要需做好如下幾個方面:一是制定變更策略,變更的對象分類、變更需求分析、變更方案確定、變更測試、變更影響度、變更緊急度等,嚴格按照策略執(zhí)行;二是確定變更的角色,變更的申請人、審批人、變更的實施者、變更管理的負責人等;三是要確定變更管理的流程:第一步由關鍵用戶創(chuàng)建用戶/權限變更的變更請求;第二步單位負責人對該變更請求進行初步審批,若拒絕,則該變更請求被關閉;若批準,則交由支持中心負責人;第三部支持中心負責人進一步審批的變更請求,若拒絕,則該變更請求被關閉;若批準,則交由應用管理員人;第四步應用管理員人對該變更請求在系統(tǒng)進行實施,實施后交關鍵用戶;第五步關鍵用戶在系統(tǒng)進行變更測試,測試不通過,繼續(xù)交應用管理員修改,測試通過,關閉該變更請求。
4.加強問題跟蹤,實現閉環(huán)管理
為保證各應用系統(tǒng)遇到問題后及時解決,將影響最小化,制定了規(guī)范的問題提報流程,(如下圖)。企業(yè)支持人員登錄到統(tǒng)一的平臺上(SLM)來解決用戶提報的問題,形成痕跡管理,實現問題上報、解決、確認關閉的閉環(huán)管理,規(guī)范日常運維流程,提高工作效率。能夠實現對所有的問題進行分析和匯總,便于查詢。同時結合現代通信手段(Email或者手機短信)確保問題響應處理效率的提高。為了保證問題解決的及時性,系統(tǒng)將問題分為非常高(VeryHigh)、高(High)、中(Medium)、低(Low)4個等級。
5.借助運維工具,提高監(jiān)控水平,變被動為主動
“居安思危,未雨綢繆”。實施主動的問題管理,化被動為主動,在信息系統(tǒng)故障發(fā)生之前發(fā)現和解決有關問題和知名故障,是運維工作的重點之一。
SAP Solution Manager運維管理平臺的使用:2007年10月在總部的統(tǒng)一安排下,企業(yè)SAP Solution Manager運維管理平臺成功上線運行,將ERP系統(tǒng)所有的運維工作納入電子化、規(guī)范化、流程化的管理。該運維管理平臺主要的功能應用場景如下:在總部對SLM的實施中,主要實現了解決方案監(jiān)控、運維支持服務臺、變更請求管理三個模塊功能。解決方案監(jiān)控管理,對ERP系統(tǒng)ABAP DUMP、OS狀態(tài)、后臺作業(yè)、備份記錄等16項指標運行情況進行實時監(jiān)控,并形成早期預警報告,及早發(fā)現問題、處理問題,消除系統(tǒng)瓶頸,變被動的緊急救火為主動預防。SAP Solution Manager運維管理平臺同企業(yè)SAP R/3系統(tǒng)進行集成,實現無縫連接,在系統(tǒng)監(jiān)控和問題服務管理上方便快捷。
6.加強培訓,提高運維能力
企業(yè)信息化程度不斷加強,支持中心要維護的應用系統(tǒng)數量多、涉及業(yè)務范圍廣,這就要求IT運維人員必須是多技能的“復合型人才”。業(yè)務與技術的結合,是相輔相成的。首先從業(yè)務著手,然后落實于技術,最后再回饋到業(yè)務。在企業(yè)實踐中,業(yè)務運行質量的好壞始終是上至管理者、下至普通員工關心的第一位的問題,而技術和系統(tǒng)只是實現業(yè)務績效的有力工具。目前運維人員的專業(yè)IT技能和業(yè)務技能大多是不夠的。這就需要不斷加強培訓和學習。
首先在項目建設期間學習:讓運維人員參與到信息項目建設中去,參加項目規(guī)劃階段的運維設計和項目上線前的功能、性能和業(yè)務測試等,使他們的知識和技術水平在項目建設過程中得到更新和提升。其次制定培訓計劃:結合總部開展的“比學趕幫超”活動和總部支持中心組織的培訓,全面深入開展以ERP為首的應用系統(tǒng)的學習和應用,在“支持、服務、管理”的基礎上,做好培訓管理,切實做到讓關鍵用戶深入掌握各應用系統(tǒng)的內部原理,提升支持人員的操作技能、業(yè)務處理和問題解決能力,推動企業(yè)信息系統(tǒng)的深化應用、發(fā)揮其潛在功能。最后建立運維知識庫管理:在日常工作中,不斷積累經驗,建立運維知識庫管理,完善技術溝通渠道,實現知識共享,提高運維人員的整體工作效率。
7.結束語
總之,信息系統(tǒng)上線運行是業(yè)務應用的開始,為保證系統(tǒng)正常運行,為企業(yè)生產經營提供精細的業(yè)務數據,切實為領導的決策提供數據支撐,企業(yè)運維技術人員要一絲不茍、持之以恒、老老實實按規(guī)范做事,把細微的事情做好,使信息系統(tǒng)最大限度的發(fā)揮效益。