唐雨 孟壇魁 梁藝軍
(中國人民大學(xué)網(wǎng)絡(luò)與教育技術(shù)中心)
IT服務(wù)流程設(shè)計和執(zhí)行
唐雨 孟壇魁 梁藝軍
(中國人民大學(xué)網(wǎng)絡(luò)與教育技術(shù)中心)
中國人民大學(xué)網(wǎng)絡(luò)與教育技術(shù)中心作為學(xué)校的信息化建設(shè)職能部門,其角色正在由IT技術(shù)提供者向IT服務(wù)提供者轉(zhuǎn)變,本文總結(jié)以ISO20000標(biāo)準(zhǔn)化體系為指導(dǎo)的IT服務(wù)管理體系在中國人民大學(xué)的具體實踐并著重介紹IT服務(wù)管理體系落地過程中的流程設(shè)計和執(zhí)行要點。
ISO/IEC 20000是由國際標(biāo)準(zhǔn)化組織ISO發(fā)布的信息業(yè)服務(wù)標(biāo)準(zhǔn),由BS15000轉(zhuǎn)變而來,而BS15000則是由英國標(biāo)準(zhǔn)協(xié)會(BSI)以ITIL為核心發(fā)布的。ISO/IEC 20000是一個針對管理流程系統(tǒng)的標(biāo)準(zhǔn),適合IT服務(wù)的提供者,既適用于企事業(yè)單位內(nèi)部的IT部門,也適用于外部的服務(wù)提供商。通過ISO/IEC 20000的認(rèn)證,意味著提供服務(wù)的IT組織,對ISO/IEC 20000中定義的管理流程,具有足夠好的管理控制力,圖1為ISO20000 標(biāo)準(zhǔn)化體系的框架結(jié)構(gòu)圖。
由圖1可見,ISO20000的體系框架包含了5大流程,即服務(wù)交付流程、控制流程、發(fā)布流程、解決流程和關(guān)系流程,其中又細(xì)分為13個具體的管理流程,分別是服務(wù)報告、能力管理、服務(wù)持續(xù)性與可用性管理、信息安全管理 、IT 服務(wù)預(yù)算編制與會計核算、配置管理、變更管理、發(fā)布管理、事件管理、問題管理、業(yè)務(wù)關(guān)系管理和供應(yīng)商管理。
我們在學(xué)校內(nèi)部建設(shè)IT服務(wù)管理體系的宗旨是:通過使工作可記錄、可管理、可控制的規(guī)范化流程,對技術(shù)手段進(jìn)行整合、轉(zhuǎn)換和提升,最終向用戶提供優(yōu)質(zhì)服務(wù)。
流程執(zhí)行的過程,有工作階段的轉(zhuǎn)移,有工作、審批主體的轉(zhuǎn)移,有對其它流程的啟動,還有流程間的信息共享。比如,事件管理中,有一線人員向二線人員遞交;需審批時可向相關(guān)領(lǐng)導(dǎo)遞交,批復(fù)后遞交回來;還可在事件管理流程中啟動問題管理流程;問題管理流程又啟動變更、發(fā)布管理流程;變更管理流程中啟動配置管理流程。
圖 ISO20000 IT服務(wù)管理體系框架
事件管理、問題管理、配置管理、變更管理和發(fā)布管理是ISO 20000服務(wù)管理體系中的5個核心管理流程,也是我們在日常的運維和服務(wù)中使用頻率最高的流程。
事件管理
事件管理以解決用戶的具體服務(wù)請求為目的,當(dāng)發(fā)現(xiàn)故障或收到用戶的服務(wù)請求時,就進(jìn)入事件管理流程。我們在實踐中堅持使用IT服務(wù)管理平臺,進(jìn)行事件處理,以便達(dá)到可記錄、可回溯、可控制的要求。
事件管理流程依據(jù)部門的崗位劃分,是一個逐步升級的過程,直至最終解決用戶的服務(wù)請求。大多數(shù)事件通過服務(wù)臺的電話指導(dǎo)就可以解決,服務(wù)臺不能立即解決的問題逐步交由現(xiàn)場一線工程師、二線工程師進(jìn)行解決。對于影響較大,需要部門或?qū)W校領(lǐng)導(dǎo)進(jìn)行決策才能解決的事件,稱為重大事件,對此我們制訂了詳細(xì)的“重大事件列表”。
關(guān)鍵績效指標(biāo)KPI:單位時段事件數(shù)量、事件關(guān)閉率、滿意率。
問題管理
當(dāng)事件沒有得到根本解決,或同類事件較多時,進(jìn)入問題管理流程。問題指事件背后未知的原因。
問題一般由二線工程師發(fā)起,從事件處理流程發(fā)起,或根據(jù)監(jiān)控數(shù)據(jù)的分析獨立發(fā)起。
在實踐中,我們以業(yè)務(wù)科室作為問題管理的第一責(zé)任人,業(yè)務(wù)科室認(rèn)為需要跨部門處理的問題,再上升至中心層面處理。
問題處理的結(jié)果是找到問題所在。通過系統(tǒng),可記錄問題分析和解決方案,包括觸發(fā)的變更、發(fā)布過程。同時,可把整個處理中獲得的經(jīng)驗,記錄為知識庫中知識條目。
關(guān)鍵績效指標(biāo)KPI:單位時段問題數(shù)量、解決率、問題解決后的事件下降率、知識條目數(shù)量、知識庫有效使用率。
配置管理
對運維管理的對象,在管理系統(tǒng)中有信息記錄,記錄其支持運維工作所需信息,稱為配置項。配置項集合即設(shè)備、系統(tǒng)的臺帳。
在事件管理、問題管理、變更管理、發(fā)布管理流程中,將使用這些信息。
在事件、問題處理中,需要對設(shè)備、系統(tǒng)的配置進(jìn)行更改,進(jìn)入變更流程。完成變更后,應(yīng)進(jìn)入配置管理流程,修改配置項內(nèi)容,以與實際情況保持一致。
凡是需要對其變更進(jìn)行記錄的設(shè)備或系統(tǒng),應(yīng)建立相應(yīng)配置項,以便做好運維工作,如空調(diào)、電源,網(wǎng)絡(luò)交換機、配線架、重要系統(tǒng)所在的服務(wù)器、應(yīng)用系統(tǒng)等。
對變更沒有風(fēng)險,不需通過流程控制的常規(guī)性設(shè)備、系統(tǒng)變更,可不進(jìn)入變更流程,而只做配置管理。
關(guān)鍵績效指標(biāo)KPI:配置項數(shù)量、配置項符合率。
變更管理
變更管理,是在事件、問題處理中,或用戶對軟件系統(tǒng)的需求變動、增加時,對系統(tǒng)、設(shè)備的軟硬配置或程序進(jìn)行改變。
變更管理流程的目的是記錄和控制變更的過程,避免風(fēng)險,并提供從不成功變更狀態(tài)恢復(fù)所需信息。
當(dāng)變更的影響廣泛,風(fēng)險高時,需要進(jìn)行重大變更流程控制,需要審批變更方案,提交危機處理預(yù)案,事前要進(jìn)行備份處理等,為此我們制訂了詳細(xì)的“重大變更列表”。
在時間緊急情況下,可簡化流程,進(jìn)行緊急變更流程控制。關(guān)鍵績效指標(biāo)KPI:變更數(shù)量、成功率。
發(fā)布管理
變更管理中,涉及把信息部署在多個實際運行環(huán)境的系統(tǒng)組件中,或用戶需要知道情況,需要改變使用方式,需要得到資源和指導(dǎo)培訓(xùn)時,進(jìn)入發(fā)布管理。
由于影響面廣,所以在變更管理基礎(chǔ)上,要進(jìn)行進(jìn)一步的控制,如事前評審,以控制風(fēng)險。要記錄發(fā)布信息,以便回溯。發(fā)布之后,要驗證,并為用戶提供需要的信息、資源和培訓(xùn)。
關(guān)鍵績效指標(biāo)KPI:發(fā)布數(shù)量、成功率。
上述5大核心管理流程之外的流程稱為其他流程。這些流程比前面流程要宏觀,不是日常的,但應(yīng)定期執(zhí)行,以提高IT服務(wù)管理水平。這類工作有時容易被忽略。
業(yè)務(wù)關(guān)系管理、服務(wù)級別管理和服務(wù)報告
A.業(yè)務(wù)關(guān)系管理
業(yè)務(wù)關(guān)系管理的對象是用戶,目的是保持與用戶的良好關(guān)系,這些用戶包括學(xué)校各部門和個人用戶兩種類型,主要手段是溝通。
針對部門用戶,我們在各單位均已設(shè)置專兼職信息員,負(fù)責(zé)與中心聯(lián)系;定期召開全校信息員會議,報告服務(wù)、建設(shè)情況,收集意見和建議,進(jìn)行培訓(xùn);通過信息員會議,了解用戶的業(yè)務(wù)和需求。
針對個人用戶,中心提供了滿意度回訪和用戶投訴渠道,以進(jìn)行良好的溝通。
B.服務(wù)級別管理
公布服務(wù)目錄提供服務(wù)范圍,服務(wù)等級協(xié)議(SLAs)來定義服務(wù)要求。服務(wù)等級協(xié)議的起點是中心根據(jù)各系統(tǒng)資源、運行狀況做出的服務(wù)承諾,之后可通過全校信息員會議,協(xié)商修訂。
C.服務(wù)報告
服務(wù)報告主要報告履行服務(wù)承諾的情況,報告可對改進(jìn)IT服務(wù)工作提供指標(biāo)性信息,可包括事件處理統(tǒng)計數(shù)據(jù),可用性、可持續(xù)性統(tǒng)計數(shù)據(jù),還有運維中的帶寬、速率等檢測數(shù)據(jù),每學(xué)期向信息員會議報告。中心每年度向?qū)W校信息化領(lǐng)導(dǎo)小組提交報告。
容量、持續(xù)性、可用性管理
A.容量管理流程關(guān)心系統(tǒng)的容量是否夠用。
如各關(guān)鍵系統(tǒng)的CPU利用率,內(nèi)存使用率,存儲空間,授權(quán)用戶數(shù);主要網(wǎng)絡(luò)節(jié)點的上聯(lián)鏈路帶寬及高峰使用率,數(shù)據(jù)交換能力等。
我們對核心機房空調(diào)、電源、網(wǎng)絡(luò)主干、重要應(yīng)用系統(tǒng)進(jìn)行不間斷自動監(jiān)測;在重點時段對電子校務(wù)系統(tǒng)、校園卡卡系統(tǒng)等進(jìn)行特別檢測。每年提交一次容量分析報告和改進(jìn)容量狀況的管理報告。
關(guān)鍵績效指標(biāo)KPI:資源使用率。
B.持續(xù)性管理,強調(diào)從中斷中恢復(fù)的能力。
把重要的系統(tǒng)納入持續(xù)性管理。服務(wù)恢復(fù)、系統(tǒng)修復(fù)工作在事件管理流程中,有時涉及問題管理流程。體系規(guī)定,對納入持續(xù)性管理的系統(tǒng),要有數(shù)據(jù)故障恢復(fù)計劃。
每遇到中斷事故要進(jìn)行持續(xù)性記錄,并在匯總表中記錄。每年度,可結(jié)合項目申報和規(guī)劃做一次分析和改進(jìn)持續(xù)性狀況的規(guī)劃報告。
特別是,對重要系統(tǒng),要提供冗余備份設(shè)備、配件,對數(shù)據(jù)進(jìn)行備份。體系規(guī)定,對納入持續(xù)性管理的系統(tǒng),要有數(shù)據(jù)備份計劃。通過流程執(zhí)行,可保證數(shù)據(jù)備份的按計劃進(jìn)行。
關(guān)鍵績效指標(biāo)KPI:年度服務(wù)中斷次數(shù),年度累計中斷時間,本年度最長持續(xù)服務(wù)時間。
C.可用性管理,主要關(guān)心可用率,比如網(wǎng)絡(luò)主干的可用率。利用事件記錄信息,對關(guān)鍵系統(tǒng)、設(shè)備進(jìn)行定期考察,每年制定一次分析和改進(jìn)可用性狀況的《可用性管理報告》。
關(guān)鍵績效指標(biāo)KPI:可用率、5年以上和高故障設(shè)備數(shù)量、比例。
信息安全管理
日常工作中,中心對一般信息安全事件進(jìn)行記錄和處理;對安全系統(tǒng)進(jìn)行運維;提供安全服務(wù)和資源;進(jìn)行安全培訓(xùn)。
安全方針和組織機構(gòu)建設(shè)。中心制訂和監(jiān)督執(zhí)行安全制度、策略,其中包括網(wǎng)絡(luò)與信息安全等級劃分和保護(hù)。中心會同相關(guān)部門制訂、修訂安全緊急處理預(yù)案。重大安全事件來臨時,需要協(xié)調(diào)網(wǎng)絡(luò)、系統(tǒng)和應(yīng)用等部門及相關(guān)用戶進(jìn)行處理。
定期通過安全事件分析安全趨勢,對信息資產(chǎn)進(jìn)行風(fēng)險評估,采取改善措施,消除各系統(tǒng)的安全隱患。
在其它系統(tǒng)的流程執(zhí)行過程中,考慮安全因素,比如,安全部門可通過變更流程記錄、檢查督促重要系統(tǒng)的密碼變更。
關(guān)鍵績效指標(biāo)KPI:安全事件發(fā)生數(shù)量、安全事件解決率、安全隱患排除數(shù)量。
財務(wù)管理
財務(wù)管理的目的是提高中心員工的成本意識,平衡成本、用戶需求和質(zhì)量的關(guān)系。
流程規(guī)定除執(zhí)行國家、學(xué)校的規(guī)章制度,執(zhí)行已審批國家、學(xué)校項目外,對中心支配資金執(zhí)行審批制度和按月做財務(wù)報告制度。
新項目應(yīng)為用戶增加有價值的服務(wù),或?qū)ο到y(tǒng)的容量、可用性、可持續(xù)性提升起重要作用。學(xué)校應(yīng)依據(jù)各流程提供的報告,進(jìn)行資金使用方向的決策。
定期統(tǒng)計全中心的項目和內(nèi)部財務(wù)支出的總體數(shù)額和結(jié)構(gòu),結(jié)合項目完成后的驗收、總結(jié),記錄、評估各項目的成本和完成目標(biāo)的效果。
供應(yīng)商管理
記錄供應(yīng)商的聯(lián)系方式,了解其產(chǎn)品、服務(wù)內(nèi)容。
對招標(biāo)過程和合同簽訂過程進(jìn)行記錄,進(jìn)行情況通報,由申報者、技術(shù)委員會和行政領(lǐng)導(dǎo)參與審議和審批等流程控制。
保管合同等資料。
組織相關(guān)科室進(jìn)行工程驗收。沒有驗收的系統(tǒng)和樓宇布線系統(tǒng),如果納入正常運維工作,將由中心負(fù)擔(dān)施工方應(yīng)負(fù)擔(dān)的質(zhì)量成本。
根據(jù)配置管理中包含的購置時間、合同號等資產(chǎn)信息,申請維修、培訓(xùn)、升級等服務(wù),必要時根據(jù)合同與供應(yīng)商進(jìn)行商務(wù)、法律交涉。
通過對以往工作的總結(jié),評價、記錄服務(wù)商實際提供服務(wù)、產(chǎn)品的質(zhì)量。
[1] 《ITIL白皮書》 左天祖 主編
[2] 《ISO20000-2實施指南 中文版》 劉青 譯
[3]《實施IT治理:方法論、模型、全球最佳實踐》,Gad J Selig著,中治研國際信息技術(shù)研究院譯 中國經(jīng)濟出版社