鄧 湘 勤
(國電大渡河流域水電開發(fā)有限公司,四川 成都 610041)
水電企業(yè)IT運維管理“雙提升”的探索與思考
鄧 湘 勤
(國電大渡河流域水電開發(fā)有限公司,四川 成都610041)
摘要:目前,國內(nèi)多數(shù)水電企業(yè)設立有集控中心,統(tǒng)一管理企業(yè)的IT基礎設施建設和運維服務。通過集中控制和統(tǒng)一調(diào)度,有效管理企業(yè)IT運維,提升企業(yè)管理水平和效益。為構建智能水電,促進企業(yè)管理和效益的雙提升提供完善的科技保障和技術支持。
關鍵詞:IT運維;監(jiān)控;管理;效益
1前言
網(wǎng)絡規(guī)模的發(fā)展和擴大,使得應用產(chǎn)品技術日漸多樣和復雜,越來越多的企業(yè)實現(xiàn)了生產(chǎn)業(yè)務和日常工作信息化,并通過提高信息化水平而提高經(jīng)營水平和管理能力,隨著網(wǎng)絡運用的普及和深入,企業(yè)業(yè)務的展開也越來越依賴IT(軟件)系統(tǒng)的正常運轉(zhuǎn),IT部門正由“成本中心”轉(zhuǎn)變?yōu)椤胺罩行摹?、“效益中心”。IT運維作為IT管理的核心和重點部分,其作用發(fā)揮,直接決定著企業(yè)管理、效益雙提升成果。
IT運維管理部門作為企業(yè)的基礎職能部門,為企業(yè)信息系統(tǒng)安全穩(wěn)定運行提供了重要的科技保障和技術支撐。在網(wǎng)絡的基礎設施建設完成之后,整個網(wǎng)絡處于運行狀態(tài),IT運維部門采用相關的管理方法,對運行環(huán)境(包括物理網(wǎng)絡、軟硬件環(huán)境等)、業(yè)務系統(tǒng)等進行維護管理。目前,國內(nèi)IT運維管理方式、管理手段趨同,理念相近,如何全面提升企業(yè)競爭力與可持續(xù)發(fā)展能力,完善企業(yè)運維體系,發(fā)揮IT運維在水電企業(yè)的作用,突出水電特色,促進管理和效益的雙提升,是水電企業(yè)IT運維人員的一個重要工作課題。
近年來,水電企業(yè)均開展了信息化建設工作,部分水電企業(yè)信息化基礎設施建設已初具規(guī)模,建立了相對完善的IT系統(tǒng)綜合管理平臺,能夠?qū)W(wǎng)絡、服務器、存儲、數(shù)據(jù)庫、應用系統(tǒng)、機房等進行統(tǒng)一的監(jiān)控管理;并對用戶現(xiàn)有的路由器、防火墻、上網(wǎng)行為管理、備份系統(tǒng)、DNS等系統(tǒng)進行升級和擴容,業(yè)務系統(tǒng)、信息系統(tǒng)運轉(zhuǎn)良好,取得很好的成效。正因為如此,許多企業(yè)越來越重視IT運維管理,通過引入ITIL思想,不斷完善運維制度,梳理IT運維流程,努力提升IT運維能力,從而更好的保障了企業(yè)業(yè)務系統(tǒng)的正常運行。
同時,在運維實踐中,也暴露出不少急需解決的問題。一是理念跟不上企業(yè)發(fā)展的步伐。從長遠看,IT系統(tǒng)以業(yè)務為中心的動態(tài)架構終將向以戰(zhàn)略為中心的知識架構發(fā)展,計算機網(wǎng)絡大發(fā)展必須適應企業(yè)業(yè)務的應用,企業(yè)對IT系統(tǒng)的要求必然越來越高,IT系統(tǒng)面臨IT資源整合、IT管理、IT業(yè)務個性化的挑戰(zhàn)。二是設備跟不上。不少企業(yè)的網(wǎng)絡分析技術,路由器、交換機的應用與安全技術,網(wǎng)絡安全事件回放以及黑客攻擊的手段、方法及防范技術,網(wǎng)絡安全架構設計和網(wǎng)絡安全設備的部署,主機操作系統(tǒng)和應用服務器系統(tǒng)安全加固等還不適應企業(yè)未來發(fā)展的需要,在實踐操作中,流程不規(guī)范、運維水平參差不齊也導致經(jīng)濟效益、管理效益不突出,甚至造成操作過于繁瑣,影響效率。三是人員總體水平跟不上。
2“在哪兒”的問題
“在哪兒”就是要明確企業(yè)IT運維的現(xiàn)狀,通過對IT的實踐運作進行審視,運用對標的手段、統(tǒng)籌的方法、綜合分析公司IT運維的環(huán)境,所處的階段,找準自身的方位。
近年來,筆者所在的公司信息化工作按照“實用優(yōu)先、試點先行”的思路穩(wěn)步推進,先后建成了視頻會議系統(tǒng)、OA、網(wǎng)站、財務管理、人資管理、生產(chǎn)管理、工程管理等業(yè)務系統(tǒng);信息網(wǎng)絡基礎架構不斷夯實,依托流域光纖通信環(huán)網(wǎng)和電信租用通道,公司廣域網(wǎng)帶寬已達到8M+水平。IT基礎設置包括硬件和軟件2大部分,硬件包括:服務器、網(wǎng)絡通訊設備、視頻會議設備、存儲設備等,軟件包括:操作系統(tǒng)、數(shù)據(jù)庫、中間件、基礎應用軟件等。
隨著各業(yè)務系統(tǒng)的建設,IT系統(tǒng)的運維工作日趨繁雜,也日益重要??陀^地說,目前公司信息化建設重點已從大規(guī)模的“基礎設施建設”階段轉(zhuǎn)向以管理創(chuàng)新、提升應用效益為主要特征的“雙提升”階段。公司IT運維迫切需要通過統(tǒng)一管理,來優(yōu)化IT運維管理流程,降低故障發(fā)生概率,快速定位故障,縮短故障處理時間,提高問題處理效率。
3“去哪兒”的問題
“去哪兒”就是要明確公司IT運維的發(fā)展方向,明確目標。要把握全局,統(tǒng)籌規(guī)劃。IT運維服務的目標是要把80%以上的問題和隱患通過日常的巡檢、維護都能解決掉。
上世紀90年代,國內(nèi)用戶開始引入IT,在完成了IT基礎架構的建設后,進入了維護和運維階段,發(fā)展到現(xiàn)在,IT系統(tǒng)的多平臺、多層次、異構性越來越為大家所認同、接受,同時,其復雜程度也對IT服務提出了更高的要求,越來越多的跡象表明:“大運維”正在成為IT基礎架構服務的未來發(fā)展方向,這也是筆者所在公司所關注的。
一般來講,IT運維的主要目的有三個:
(1)提供一個安全穩(wěn)定的基礎設施平臺,為各業(yè)務系統(tǒng)運行提供可靠保障和運維支撐。主要通過提供硬件維保(服務器、存儲、網(wǎng)絡)及軟件維保(系統(tǒng)、數(shù)據(jù)庫、中間件等產(chǎn)品),為公司提供方便、快捷、安全的服務。
(2)為各個業(yè)務部門提供IT運維服務,快速處理日常問題。這就需要IT運維人員不僅要熟知不同廠商的各種軟硬件產(chǎn)品,而且需要對IT基礎架構理論、企業(yè)IT法規(guī)和最佳實踐有深入的理解和積累。
(3)通過自動化監(jiān)控手段提高工作效率,減輕IT運維人員工作強度。以建設企業(yè)綠色數(shù)據(jù)中心為目標,使IT行業(yè)的理論標準水電行業(yè)的規(guī)范制度要求有機結合,為公司日常管理提供咨詢、集成、維護等一系列IT服務。
基于以上目的,公司在IT運維管理上不斷引入新思維、新方法,在管理上不斷創(chuàng)新。
說到底,IT運維管理是為公司業(yè)務服務,減少IT系統(tǒng)故障率,提升公司運營效益,IT運維體系建設的總目標是從業(yè)務的角度實現(xiàn)全公司IT資源的整體監(jiān)控,并通過制定相應的流程規(guī)范來合理、高效的調(diào)配資源,使IT管理架構與全公司業(yè)務系統(tǒng)的管理架構相統(tǒng)一,使IT運維服務工作能在一個統(tǒng)一的管理平臺下進行。
4“怎么去”的問題
圖1 IT運維管理平臺模型
“怎么去”就是要規(guī)劃好實踐路徑。要堅持理論指導,堅持結合實際的創(chuàng)新,破除IT運維和其他業(yè)務部門間的障礙,不斷提升IT運維水平,保障企業(yè)業(yè)務系統(tǒng)高效運行。4.1建立IT運維管理平臺,實現(xiàn)IT設備運行可監(jiān)控
首先,建立IT運維統(tǒng)一管理平臺,對全網(wǎng)設備進行全面監(jiān)控。將網(wǎng)絡設備、服務器、數(shù)據(jù)庫、中間件、應用、IP地址、虛擬機、存儲、機房環(huán)境等統(tǒng)一納入監(jiān)控范圍。實現(xiàn)故障告警、根源分析,當設備異常時,第一時間通過短信的方式通知運維人員,并迅速響應。第二,將業(yè)務相關軟硬件關聯(lián)起來,實現(xiàn)整體業(yè)務監(jiān)控,保障關鍵業(yè)務系統(tǒng)的正常運行。通過建立業(yè)務故障發(fā)現(xiàn)、分析機制,提升業(yè)務系統(tǒng)運維能力。及時發(fā)現(xiàn)業(yè)務運行隱患。第三,可視化呈現(xiàn),將我們所關心的網(wǎng)絡拓撲、業(yè)務拓撲、機房拓撲等已圖形化的方式展現(xiàn),在同一界面展現(xiàn)各個設備的運行狀況和健康度,并實時展現(xiàn)相互關系,幫助準確、及時掌控整體系統(tǒng)運行情況,發(fā)揮整合的效力。
圖2 機房監(jiān)控
4.2建立IT運維管理平臺,實現(xiàn)IT故障可避免
圖3 運維管理統(tǒng)計圖
建立統(tǒng)一的IT運維管理平臺,找到設備運行的薄弱環(huán)節(jié),在薄弱環(huán)節(jié)有的放矢的投入人力和物力、避免潛在故障的發(fā)生。通過建立IT運維管理平臺,提早發(fā)現(xiàn)和準確定位問題,找出全網(wǎng)系統(tǒng)運行的薄弱環(huán)節(jié)。發(fā)現(xiàn)設備利用率超閾值的情況,第一時間短信通知相應運維人員,避免宕機故障的發(fā)生。經(jīng)過一段時間的監(jiān)控,發(fā)現(xiàn)部分設備資源使用率較高,一直高負荷運轉(zhuǎn),設備運行不平衡,存在潛在的宕機風險。經(jīng)及時采取相應措施,避免了重大故障的發(fā)生。
4.3建立IT運維管理平臺,優(yōu)化IT運維流程
在系統(tǒng)中對現(xiàn)行IT運維管理流程進行了梳理、整合和優(yōu)化,結合ITIL標準,制定統(tǒng)一的運行維護服務制度和操作規(guī)程,為運維人員間的協(xié)同操作提供規(guī)范和約束,包括網(wǎng)上保修、問題處理、機房出入登記機制等。
4.4建立IT運維管理平臺,實現(xiàn)IT運維效益提升
建立IT運維管理平臺,實現(xiàn)IT設備監(jiān)控自動化,打造全天候7x24小時無人自動巡檢,故障自動告警的運維保障平臺,擺脫日常繁瑣的手動巡檢帶來的運維人力高支出,平衡由于運維工程師水平不同所帶來的波動性風險。故障處理后,將處理的結果編輯成知識文檔,納入知識庫,固化處理經(jīng)驗,積累解決方案,便于重復問題的快速響應。從而不斷提升運維團隊的整體水平,提升企業(yè)運維效益。
5結語
本文從IT運維管理平臺建設的工作實踐出發(fā),探討了水電企業(yè)運維服務管理和效益提升的工作方法。以ITIL思想做指導,建立與水電企業(yè)IT運維環(huán)境相適應的一體化運維管理平臺。幫助IT運維部門由被動的“救火”,轉(zhuǎn)變成科學有效的流程化IT運維管理,從根本上解決故障發(fā)現(xiàn)
和解決滯后、IT資產(chǎn)臺帳管理不規(guī)范、運維流程不清晰等問題。實現(xiàn)了全方位的IT系統(tǒng)管理。對網(wǎng)絡設備、服務器、安全設備、存儲、機房基礎環(huán)境進行整合管理,實現(xiàn)了對IT系統(tǒng)的集中、統(tǒng)一監(jiān)控與管理。全面提升運維人員運維能力,持續(xù)推進企業(yè)的信息化建設。為構建智能水電,促進企業(yè)管理和效益的雙提升提供完善的科技保障和技術支持。
鄧湘勤(1975-),女,四川遂寧人,工程師,國電大渡河公司集控中心網(wǎng)絡主管,主要從事企業(yè)信息化網(wǎng)絡管理及運維工作.
(責任編輯:卓政昌)
工作研究
收稿日期:2015-05-20
文章編號:1001-2184(2015)03-0115-02
文獻標識碼:B
中圖分類號:TV74;S219.07;C93
作者簡介: