董明/中國人民銀行哈爾濱中心支行清算中心
論新形勢下支付系統(tǒng)運行維護方式的創(chuàng)新
董明/中國人民銀行哈爾濱中心支行清算中心
支付系統(tǒng)為各商業(yè)銀行業(yè)金融機構(gòu)及金融市場提供了安全高效的支付清算服務,其運行質(zhì)量對整個金融體系的安全和效率具有舉足輕重的影響。隨著支付系統(tǒng)建設推廣,支付系統(tǒng)運維工作將越來越重要,越來越復雜,沒有良好的運維管理體系,運維的質(zhì)量和效率就無法保證。創(chuàng)新支付系統(tǒng)運行維護方式,科學運用先進的運維手段,建立合理,高效的運維管理體系變得尤為重要。
隨著計算機技術(shù)及其管理理念的不斷發(fā)展,支付系統(tǒng)的運行維護體系也逐步發(fā)展起來。目前,支付系統(tǒng)的運維管理已形成了以清算總中心運維為主,各城市處理中心運維為輔的兩級運維管理體系,初步實現(xiàn)了支付系統(tǒng)運維的集中管理。
(一)基本實現(xiàn)運維管理工作的統(tǒng)籌化
通過借鑒科學、規(guī)范的運維體系建設方法論,結(jié)合自身實際情況和建設目標,制定合理有效的運維管理制度和工作流程,支付系統(tǒng)實現(xiàn)了運維資源共享、運維工作標準化,確立了支付系統(tǒng)運維統(tǒng)一管理,統(tǒng)一調(diào)度,統(tǒng)一運維平臺。在運維體系建設的全過程當中,從運維規(guī)劃、實施、監(jiān)控各層面進行統(tǒng)一規(guī)范和管理,全國范圍內(nèi)形成統(tǒng)一和規(guī)范的目標、思路、制度、流程。
(二)初步實現(xiàn)了運維手段的自動化
為確保系統(tǒng)的安全、穩(wěn)定、高效運行,支付系統(tǒng)運行監(jiān)控系統(tǒng)開始投入建設,2006年7月和2010年5月,清算總中心分別完成了支付系統(tǒng)運行監(jiān)控系統(tǒng)項目和運行監(jiān)控系統(tǒng)擴充項目,采用的均是CA公司的監(jiān)控產(chǎn)品,建成后初步實現(xiàn)了對對整個支付系統(tǒng)的運行監(jiān)控,支付系統(tǒng)在可用性,可靠性等方面獲得了提升,系統(tǒng)維護和保障工作也在電子化、流程化和規(guī)范化方面獲得了提高。
(三)初步建立了運維知識共享機制
清算總中心為提高各清算中心運行維護水平,每年舉辦各類技術(shù)培訓班,使得支付系統(tǒng)各級操作人員和技術(shù)人員可以自由溝通、交流,分享工作經(jīng)驗,交流工作體會,探討實際工作中遇到的問題,共享運維經(jīng)驗,對提高各清算中心運維能力發(fā)揮了很大的作用。
目前,支付系統(tǒng)運維管理方式雖然基本滿足系統(tǒng)的安全穩(wěn)定運行的需求,但也存在一些不足之處。一是支付系統(tǒng)維護管理觀念相對狹隘,運維人員偏少。由于運維工作量大,使得支付系統(tǒng)的技術(shù)人員疲于應付,這樣的方式提高了運維成本,降低了運維工作的效率。二是支付系統(tǒng)運行監(jiān)控系統(tǒng)存在的功能不完備、使用不方便、信息展示手段落后等現(xiàn)存問題,無法滿足城市處理中心運行維護需要。三是由于崗位變動、時間推移等特點,培訓到的運維知識往往難以傳承,而且目前各清處或心接收問題后進行解答時,通常以解決問題為原則,不及時反饋問題產(chǎn)生的原因,也沒有對避免同樣問題的出現(xiàn)提出建議。四是目前大多數(shù)系統(tǒng)運維工作由信息技術(shù)人員完成,缺乏業(yè)務人員的參與監(jiān)督。
隨著支付系統(tǒng)建設進程的推進,系統(tǒng)運維要求越來越高,任務越來越重,需要我們對支付系統(tǒng)運維各個環(huán)節(jié)進行研究,借鑒和運用先進的運維理念、方法、工具,提升對支付系統(tǒng)運維的認識,保障支付系統(tǒng)安全穩(wěn)定運行。
(一)從運維觀念入手,由“被動”向“主動”轉(zhuǎn)變
我們需要轉(zhuǎn)變支付系統(tǒng)運維的傳統(tǒng)觀念,由“救火員”式的“傳統(tǒng)被動式運維”轉(zhuǎn)變?yōu)椤爸鲃舆\維”,技術(shù)維護人員由“急診大夫”晉升為“保健醫(yī)生”。主動運維主要體現(xiàn)在兩個方面:第一,提前預知故障產(chǎn)生的原因,并把故障消除在發(fā)生之前,第二,運維人員的工作積極性提高,能夠主動消除故障。如今,在信息系統(tǒng)運維領(lǐng)域中,從被動到主動運維的升華是針對信息系統(tǒng)如何提高系統(tǒng)可用性、降低運維成本,實現(xiàn)運維科學化的過程。通過主動運維,爭取在最終用戶發(fā)現(xiàn)和報告故障之前主動發(fā)現(xiàn)并解決應用系統(tǒng)的各種隱患。在轉(zhuǎn)變運維觀念的同時,我們還需要重新修訂完善我們的運維管理制度,通過完善運維管理制度來強化我們對支付系統(tǒng)運行情況的掌控,通過加強巡檢以及多渠道采集支付系統(tǒng)運行狀態(tài)等措施,從制度上做到實時監(jiān)控,保障支付系統(tǒng)運行問題能及時定位,適時啟動相關(guān)流程解決問題,改善運行環(huán)境。
(二)從運維方法入手,借鑒先進的運維工具和手段
信息系統(tǒng)運維的自動化分為三個階段:第一個階段是單個任務的自動化,比
如服務器的自動巡檢;第二個階段是運維流程的自動化,例如變更、配置的自動化;第三個階段是面向業(yè)務流程和服務的自動化。目前支付系統(tǒng)已經(jīng)基本實現(xiàn)了服務器、網(wǎng)絡、數(shù)據(jù)庫等基礎(chǔ)設施運維的自動化,而面向業(yè)務流程和服務的自動化是大勢所趨,這方面目前頏上有許多先進的運維標準,像ITIL(信息技術(shù)服務管理)和BSM(業(yè)務服務管理)等可供我們借鑒和學習。關(guān)于ITIL、ITSM、BSM的概念相關(guān)文獻已有詳細著述,本文不再討論,但ITIL、ITSM、BSM僅僅只是解決問題的思路,至于如何落實到實處,首先要明確IT服務管理的實施步驟,在落實基礎(chǔ)管理上做流程化,然后才能逐步做面向業(yè)務流程和服務的管理。
(三)挖掘支付系統(tǒng)的潛在利用價值
由于支付系統(tǒng)各信息系統(tǒng)的信心程序由總中心組織開發(fā)和完成,系統(tǒng)管理和維護人員只能從有限的技術(shù)培訓中,得到系統(tǒng)安裝的基本信息,未能形成系統(tǒng)的整體設計、架構(gòu)和維護理念。造成清算中心技術(shù)人員對系統(tǒng)內(nèi)部數(shù)據(jù)結(jié)構(gòu)的掌握程序有限,也從根本上限制了技術(shù)人員研究和解決深層次問題和可能性,加強對支付系統(tǒng)架構(gòu)的研究和培訓,有利于運維技術(shù)人員業(yè)務能力的提高。另一方面支付系統(tǒng)數(shù)據(jù)與經(jīng)濟有很大關(guān)聯(lián)度,支付系統(tǒng)的數(shù)據(jù)庫中沉淀了大量的交易數(shù)據(jù),加深對支付系統(tǒng)內(nèi)部數(shù)據(jù)結(jié)構(gòu)的分析,運用數(shù)據(jù)挖掘方法比如關(guān)聯(lián)規(guī)則、聚類分析等可以提高支付系統(tǒng)的潛在利用價值。
(一)健全運維機制
制定和完善切初可行的運行維護管理制度,將各種運維行為按照流程的方式加以組織,使各崗位人員在制度的規(guī)范下協(xié)同操作,有效解決各類運維問題,實現(xiàn)各項工作的規(guī)范化管理。準確規(guī)范規(guī)章條款,是科學制定運維管理制度的必要條件。運行維護管理制度可分為:網(wǎng)絡管理制度、系統(tǒng)和應用管理制度、人員管理制度和質(zhì)量考核制度等。同時,為保證運行維護體系的高效、協(xié)調(diào)運行,應依據(jù)管理環(huán)境、管理內(nèi)容、管理要求制定統(tǒng)一的運行維護工作流程,實現(xiàn)運行維護工作的標準化、規(guī)范化。運行維護流程包含的環(huán)節(jié)有:事件管理、問題管理、變更管理、配置管理。全面規(guī)范的運維管理制度體系完整覆蓋支付系統(tǒng)運維管理的各環(huán)節(jié),是科學制定運維管理制度的必要條件。
(二)建立綜合運維管理平臺
支付系統(tǒng)綜合運維管理平臺應當包括運維服務管理系統(tǒng)、監(jiān)控管理系統(tǒng)兩個方面的內(nèi)容。運維服務管理系統(tǒng)包含服務臺、事件管理、變更管理、問題管理、發(fā)放管理、配置管理,并且以配置管理數(shù)據(jù)庫及知識數(shù)據(jù)庫為信息支撐。監(jiān)控管理系統(tǒng)將根據(jù)支付管理指標,實現(xiàn)對各級信息系統(tǒng)的全面監(jiān)控管理,并根據(jù)不同的監(jiān)控結(jié)果進行相應的處理,必要時將通過報警功能及時通知相關(guān)技術(shù)人員,確保系統(tǒng)處于最優(yōu)的運行狀態(tài)。監(jiān)控平臺應主要包括硬件平臺監(jiān)控管理模塊、軟件平臺監(jiān)控管理模塊、應用系統(tǒng)監(jiān)控管理模塊和機房環(huán)境監(jiān)控管理模塊,系統(tǒng)管理員可以通過這四個模塊對支付系統(tǒng)的網(wǎng)絡設備、主機、存儲、數(shù)據(jù)庫、中間件、業(yè)務系統(tǒng)和機房環(huán)境進行全面的管理。建立和實施支付系統(tǒng)綜合運維管理平臺注定是一個循序漸進的過程,不可能一蹴而就,實際上,只有在管理好計算機基礎(chǔ)設施的基礎(chǔ)之上,才能進一步實施信息管理綜合管平臺,然后逐步去管理好核心信息系統(tǒng),逐步發(fā)展到管理多個信息系統(tǒng),最終實現(xiàn)對所有業(yè)務系統(tǒng)高效管理的業(yè)務服務管理目標。
(三)建立全國統(tǒng)一的運維知識庫
建設支付系統(tǒng)運維人員溝通交流平臺,進一步完善業(yè)務技術(shù)溝通渠道,讓支付清算系統(tǒng)技術(shù)人員有一個全方位的交流平臺,促使各級操作規(guī)程人員和技術(shù)人員可以自由溝通、交流、分離工作經(jīng)驗,交流工作體會,探討實際工作中遇到的問題,共享運維經(jīng)驗。同時,通過創(chuàng)建清算運維知識庫,定期收集和統(tǒng)計各種運維方面的問題,加以分析后將解決及防范的方法和策略分類匯總并補充到運維知識庫中,使參與運維的技術(shù)人員能及時掌握和了解該類運維信息,進一步實現(xiàn)支付系統(tǒng)運維知識和運維經(jīng)驗的工享,提高運維效率。
(四)加強技術(shù)培訓,提高一級技術(shù)人員的運維能力
支付系統(tǒng)和其他信息系統(tǒng)運行維護業(yè)務一樣是圍繞技術(shù)、人、和業(yè)務流程三個基本要素展開,毫無疑問人是最重要的決定因素??萍歼M步日新月益,要時刻能保持與最新科技水平的一致是不現(xiàn)實,也是不可能的,根據(jù)技術(shù)人員的水平和特點,一方面應有計劃、有步驟地對技術(shù)人員進行針對性的支付系統(tǒng)技能培訓,以提高運維人員的技術(shù)支持水平,逐步實現(xiàn)支付系統(tǒng)運維操作的標準化。另一方面也要根據(jù)技術(shù)人員的特長分類別,分層次的對技術(shù)人員進行相關(guān)的高級培訓,適度安排支付系統(tǒng)整體設計、架構(gòu)方面的培訓,加強支付系統(tǒng)運維技術(shù)力量,提高解決復雜問題、困難問題的能力。