石菲
俗話說,三分建設,七分運維。近年來云計算、大數(shù)據、BYOD風光無限,但若缺失了行之有效的運維保障,這些新技術在企業(yè)組織中的應用推進步伐就會乏力。例如:機房中核心設備因新應用出現(xiàn)哪怕微小故障,通過“多米諾效應”的傳遞力,最終都可能導致業(yè)務的中斷。隨著IT與業(yè)務融合進程的逐步深入,IT運維管理在現(xiàn)代企業(yè)發(fā)展過程中擔負起的責任越來越重要。
規(guī)模大、應用多
覆蓋80個中央政務部門和相關單位,管理31個省、自治區(qū)、直轄市和新疆生產建設兵團,并能夠讓20多個中央政務部門的全國業(yè)務系統(tǒng)在這張“大網”上穩(wěn)定運行。這樣一張規(guī)模大、覆蓋面廣的復雜網絡,其運維管理人員還不到20人,究竟是如何做到的呢?
“國家電子政務網”是在工業(yè)和信息化部電子科學技術委員會及工業(yè)和信息化部基礎產品發(fā)展研究中心指導下,建立的全國最早的、系統(tǒng)全面的介紹電子政務建設、信息化建設的專業(yè)網站。由基于國家電子政務傳輸網的政務內網和政務外網組成。其中,國家電子政務網絡政務內網由黨委、人大、政府、政協(xié)、法院、檢察院的業(yè)務網絡互聯(lián)互通形成,主要滿足各級政務部門內部辦公、管理、協(xié)調、監(jiān)督和決策的需要,同時滿足副省級以上政務部門的特殊辦公需要;政務外網主要滿足各級政務部門社會管理、公共服務等面向社會服務的需要。
政務外網由國家信息中心負責承建,該網目前已連接中央政務部門80個,連接31個省、自治區(qū)、直轄市和新疆生產建設兵團,成為我國覆蓋面最廣,連接部門最多,規(guī)模最大的政務公用網絡。
目前,電子政務外網已經承載了中紀委監(jiān)察部、國務院應急辦、國務院扶貧辦、國家審計署、國家安監(jiān)總局等20多個中央政務部門的全國性業(yè)務應用。國家發(fā)展改革委、人力資源和社會保障部、中編辦等十多個中央政務部門使用政務外網互聯(lián)網出口,實現(xiàn)了政務公開和公共服務業(yè)務。環(huán)保部、衛(wèi)生部業(yè)務應用的部署也正在逐步展開,人社部金保二期工程、公安部人口庫等項目也已有意向依托政務外網運行。另據不完全統(tǒng)計,各地基于政務外網部署的行政審批、電子監(jiān)察、應急平臺、社會保障、文化共享等業(yè)務應用系統(tǒng)總計已達1200多項。為各地提高為民服務水平,提升行政效率,節(jié)約財政經費起到了積極作用。
隨著電子政務外網規(guī)模逐漸增大、接入的政務部門逐漸增多,電子政務外網業(yè)務所面臨的運維管理問題日益凸顯。
對接整合是難點
國家電子政務外網管理中心外網辦運行管理處副處長吳阿明介紹說,電子政務外網是一個比較復雜的網絡,它不像部委網絡采取的多級架構,而是由省級和中央級網絡兩大管理核心組成。其中省網是早已建好的獨立網絡,所以兩大管理核心的對接整合成為難點。
從結構上來講,各大部委都有自己的結構路由器,各省有落地路由器。這些設備、線路、鏈接都由管理中心進行管理。以管理中心的運維平臺為總平臺,將省級和其他網管系統(tǒng)納入體系,實現(xiàn)相互之間的協(xié)同和數(shù)據共享,以保證端到端的業(yè)務交互。
從應用上來說,吳阿明認為電子政務外網主要有四大需求,定位需求、管理人需求、決策人需求以及用戶需求。“你可以理解為類似運營商的網絡,既面向工信部用戶,也要面向省里和其他用戶,因此要求運維體系要能夠監(jiān)控所有網絡,出現(xiàn)問題及時解決。除此之外還有流程、資源管理、服務管理等需求,并在此基礎上進行整合?!彼f?!坝捎诓粌H涉及到同種系統(tǒng)對接,還涉及到異構系統(tǒng)對接,這是一個不小的挑戰(zhàn)。”
因此,在整合方面有很多技術問題是管理中心難以獨立解決的,他們希望找到一個戰(zhàn)略合作伙伴來一起進行。除了技術上的支持外,管理中心更需要方法上的建議以及戰(zhàn)略合作伙伴按照他們的需求進行持續(xù)改進的能力。2012年5月,管理中心選擇了銳捷網絡RIIL IT綜合業(yè)務管理平臺作為總控制臺來管理政務外網。迄今為止,他們已經基于該平臺完成了不少改進,與異構網絡的對接管理工作也不再成為問題。
滿足可視化需求
網絡運維管理,監(jiān)控很重要。“首先要快速發(fā)現(xiàn)并定位故障;其次要掌握整個網絡運行情況并進行分析;最后要將運行情況呈現(xiàn)給上級管理部門,并將業(yè)務運行情況反饋給用戶。此外,管理中心和省網之間要進行協(xié)同,保障部委多級縱向業(yè)務在網絡上的運行,還要注意在運維中加強和省網之間的協(xié)調?!眳前⒚髡f。
除此之外,對于復雜的網絡管理還有一個重要要素是可視化。
傳統(tǒng)的機房監(jiān)控只能看到溫濕度、是否漏水、煙感UPS等內容,而要實現(xiàn)故障快速準確定位,要求信息量更精確,內容能夠可視化,通過拓撲圖中的信息很難直接表達呈現(xiàn)。在RILL運維平臺上雙擊數(shù)據區(qū)之后,可以看到數(shù)據區(qū)的機房結構,還可以用3D方式通過各個視角來察看資源情況??梢跃唧w查看機柜中的各種設備,包括顯示、運行狀態(tài)以及其他基礎信息。這些都可以根據運維屬性以及配制屬性進行定制。發(fā)生故障時,值班人員可以看到具體是哪一個機柜的哪些設備出了問題。
故障定位后,系統(tǒng)會自動發(fā)送告警信息。告警方式有短信、郵件等類型,但由于電子政務外網是涉密網站,目前告警方式主要通過郵件來進行。而告警條件的設置,則要根據業(yè)務情況進行選擇。可以設定規(guī)則形成模板,之后應用到各個資源之上。在項目實施的初級階段,系統(tǒng)會根據用戶的使用需要和實際的運行情況來靈活進行調整。在運行一段時間后,系統(tǒng)還會提供策略模板,根據項目階段和最終用戶的實際情況產生推薦值,此外用戶也可以自己隨時調整。管理中心希望將來可以加入時間列表等手段將故障事件或等級類別納入其中,將告警級別高的故障預警自動顯示出來。下一步會重點研究省級告警信息和骨干業(yè)務層面節(jié)點設備的告警信息。
在平臺部署時也是如此,電子政務外網如此大規(guī)模的管理部署只進行了一個月左右,系統(tǒng)調試就已經基本完成。在模版設置好后,系統(tǒng)的自動發(fā)現(xiàn)功能可以自動發(fā)現(xiàn)新增設備,將其納入拓撲圖中,有些省份三天就可以全部完成。
吳阿明透露說,目前已經有12個省級單位使用該平臺,下一步會進行預備管理平臺的搭建,包括和其他子系統(tǒng)進行對接,和下級系統(tǒng)進行對接等。管理中心還會制定相關管理規(guī)范,統(tǒng)一規(guī)范管理接口,保證和其他運維異構平臺的順利整合。