張虹娟
(天津海河傳媒中心網(wǎng)絡(luò)信息部 天津300222)
經(jīng)過(guò)十余年的建設(shè),廣電企業(yè)信息化建設(shè)蓬勃發(fā)展,電視節(jié)目的“采、編、播、存、管、控”等關(guān)鍵業(yè)務(wù)已全面數(shù)字化、網(wǎng)絡(luò)化。在三網(wǎng)融合的大背景下,云平臺(tái)、虛擬化等IT 行業(yè)的主流技術(shù)已在部分廣電企業(yè)試水成功,得到廣泛應(yīng)用。
隨著廣電信息化的不斷深入,傳統(tǒng)媒體系統(tǒng)的特點(diǎn)逐漸模糊,IT 化特征越來(lái)越明顯,廣電制播系統(tǒng)、業(yè)務(wù)網(wǎng)逐步進(jìn)化為廣電網(wǎng)絡(luò)信息系統(tǒng)。愈加復(fù)雜化、專(zhuān)業(yè)化的廣電網(wǎng)絡(luò)信息系統(tǒng)對(duì)運(yùn)維服務(wù)提出了更高要求,傳統(tǒng)被動(dòng)式運(yùn)維服務(wù)的不足日趨凸顯。無(wú)論是傳統(tǒng)的視音頻設(shè)備還是新型的網(wǎng)絡(luò)信息系統(tǒng)設(shè)備,安全播出是廣電人亙古不變的生存底線,規(guī)范有效的運(yùn)維服務(wù)則是守住這條底線的有效措施。如何順應(yīng)技術(shù)和市場(chǎng)的需求,保障廣電網(wǎng)絡(luò)信息系統(tǒng)的健康性和高可用性,提供高效專(zhuān)業(yè)的運(yùn)維服務(wù)成為廣電技術(shù)人員面臨的一個(gè)重要問(wèn)題。
天津海河傳媒中心網(wǎng)絡(luò)信息部依據(jù)《電視臺(tái)信息系統(tǒng)運(yùn)行維護(hù)服務(wù)通用要求》、ITSS 等國(guó)家和行業(yè)標(biāo)準(zhǔn),結(jié)合自身特點(diǎn)和存在問(wèn)題進(jìn)行研究分析,為建設(shè)標(biāo)準(zhǔn)化、體系化、主動(dòng)化的高質(zhì)量網(wǎng)絡(luò)信息系統(tǒng)運(yùn)維服務(wù)體系,從人員、流程、技術(shù)、資源4 個(gè)方面進(jìn)行了改進(jìn)。
ITSS 是我國(guó)信息技術(shù)服務(wù)行業(yè)最佳實(shí)踐的總結(jié)和提升,借鑒了質(zhì)量管理原理和過(guò)程改進(jìn)方法的精髓,規(guī)定了IT 服務(wù)的組成要素和生命周期,并對(duì)其進(jìn)行標(biāo)準(zhǔn)化,全面規(guī)范了IT 服務(wù)產(chǎn)品及其組成要素,用于指導(dǎo)實(shí)施標(biāo)準(zhǔn)化的IT 服務(wù)。如圖1 所示,ITSS 能力模型由人員(正確選人)、流程(規(guī)范做事)、技術(shù)(高效做事)和資源(保障做事)組成。IT 服務(wù)生命周期由規(guī)劃設(shè)計(jì)、部署實(shí)施、服務(wù)運(yùn)營(yíng)、持續(xù)改進(jìn)和監(jiān)督管理5 個(gè)階段組成。
圖1 ITSS運(yùn)維能力模型示意圖Fig.1 Schematic diagram of ITSS operational capability model
2018 年發(fā)布的《電視臺(tái)信息系統(tǒng)運(yùn)行維護(hù)通用要求》GY/T 317—2018,是由廣電總局參考《廣播電視安全播出管理規(guī)定》、ITSS 標(biāo)準(zhǔn)、ITIL、ITSM等國(guó)內(nèi)、國(guó)際IT 界成熟的一系列標(biāo)準(zhǔn)并針對(duì)國(guó)內(nèi)廣電行業(yè)特色制定的、適用于電視臺(tái)信息系統(tǒng)運(yùn)行維護(hù)服務(wù)能力建設(shè)、管理和評(píng)估的通用要求。如圖2 所示,該標(biāo)準(zhǔn)提出了廣電信息系統(tǒng)運(yùn)行維護(hù)能力體系框架,對(duì)運(yùn)維對(duì)象、組織環(huán)境及管理職責(zé)進(jìn)行了闡述,是適用于廣電信息系統(tǒng)運(yùn)行維護(hù)服務(wù)能力的建設(shè)、管理和評(píng)估的通用要求,是國(guó)內(nèi)外成熟IT 管理機(jī)制和廣電行業(yè)特點(diǎn)的完美結(jié)合。
圖2 電視臺(tái)信息系統(tǒng)運(yùn)維服務(wù)能力體系框架Fig.2 Framework of operation and maintenance service capability system for TV Station information system
天津數(shù)字電視大廈投入使用后,網(wǎng)絡(luò)信息部與廠商工程師合作,完成了媒資網(wǎng)、數(shù)字播出系統(tǒng)、主干網(wǎng)、各頻道非編制作網(wǎng)等諸多項(xiàng)目的搭建,第三方運(yùn)維團(tuán)隊(duì)進(jìn)駐數(shù)字電視大廈,運(yùn)維服務(wù)實(shí)現(xiàn)全覆蓋。在此階段,網(wǎng)絡(luò)管理部技術(shù)人員負(fù)責(zé)項(xiàng)目搭建、核心存儲(chǔ)、服務(wù)器維護(hù)等工作,第三方運(yùn)維團(tuán)隊(duì)提供保姆式的桌面服務(wù),雙方合作為全臺(tái)網(wǎng)絡(luò)信息系統(tǒng)提供有效的運(yùn)維服務(wù),運(yùn)維標(biāo)準(zhǔn)、操作守則、人員培訓(xùn)等規(guī)范化標(biāo)準(zhǔn)初步形成。
隨著云技術(shù)在天津海河傳媒中心廣泛應(yīng)用帶來(lái)的技術(shù)變革,運(yùn)維服務(wù)中長(zhǎng)期積累的一些問(wèn)題逐漸顯現(xiàn),例如:第三方運(yùn)維人員技術(shù)水平參差不齊,人員流動(dòng)性大,難以提供穩(wěn)定、標(biāo)準(zhǔn)、規(guī)范的運(yùn)維服務(wù);長(zhǎng)期分工造成臺(tái)方技術(shù)人員和第三方運(yùn)維人員互有短板,人才浪費(fèi);工作流程標(biāo)準(zhǔn)化、體系化程度不夠,多憑經(jīng)驗(yàn)做事,容易出現(xiàn)人為失誤;未形成系統(tǒng)、規(guī)范的知識(shí)培訓(xùn)平臺(tái),技術(shù)成果固化度低。
為了解決上述問(wèn)題,提供更好的運(yùn)維服務(wù),網(wǎng)絡(luò)信息部的技術(shù)人員認(rèn)真研讀《廣播電視安全播出管理規(guī)定》、ITSS 標(biāo)準(zhǔn)、ITIL、ITSM 等國(guó)內(nèi)、國(guó)際IT界的一系列標(biāo)準(zhǔn),結(jié)合自身業(yè)務(wù)特點(diǎn),開(kāi)啟了建設(shè)高質(zhì)量、標(biāo)準(zhǔn)化、體系化、主動(dòng)化運(yùn)維服務(wù)的實(shí)踐之路。
3.1.1 調(diào)整人員、整合崗位結(jié)構(gòu)
吸納運(yùn)維團(tuán)隊(duì)中的精英人員,根據(jù)天津海河傳媒中心廣電信息系統(tǒng)用戶(hù)特點(diǎn)和需求,重新梳理并調(diào)整劃分崗位。
新聞崗:維護(hù)新聞云的軟硬件設(shè)備,為新聞中心4 個(gè)樓層提供保姆式運(yùn)維服務(wù),保障全天各檔直播新聞的安全制作和播出。
媒資中心崗:維護(hù)主干、媒資、綜合云的軟硬件設(shè)備,對(duì)主干、媒資、綜合云、新聞云的核心服務(wù)進(jìn)行監(jiān)控。同時(shí)作為信息中心,負(fù)責(zé)接聽(tīng)全臺(tái)報(bào)修電話,對(duì)問(wèn)題進(jìn)行預(yù)處理和任務(wù)分發(fā),起到了信息接收、管理、分發(fā)的樞紐作用。
子網(wǎng)崗:負(fù)責(zé)對(duì)主樓Avid 網(wǎng)、后期Avid 網(wǎng)、衛(wèi)視縮編網(wǎng)、科教少兒網(wǎng)、廣告網(wǎng)、綜合云后期大制作的軟硬件設(shè)備進(jìn)行日常維護(hù),處理突發(fā)問(wèn)題。
帶班崗:負(fù)責(zé)解決一線值班員無(wú)法解決或無(wú)法單獨(dú)解決的問(wèn)題。
通過(guò)調(diào)整人員、整合崗位結(jié)構(gòu),改進(jìn)了人員冗余、人才浪費(fèi)等問(wèn)題,上述崗位按個(gè)人意愿及部門(mén)考核競(jìng)聘上崗,做到了正確用人。
3.1.2 建立系統(tǒng)、完善的業(yè)務(wù)培訓(xùn)和考核機(jī)制
網(wǎng)絡(luò)信息部經(jīng)常組織技術(shù)培訓(xùn)、交流活動(dòng),但未形成系統(tǒng)的長(zhǎng)效機(jī)制。為了彌補(bǔ)長(zhǎng)期分工形式帶來(lái)的技術(shù)短板,提升每名員工的技術(shù)能力,在保持原有學(xué)習(xí)模式的同時(shí),部門(mén)每月安排一名技術(shù)骨干給大家進(jìn)行業(yè)務(wù)培訓(xùn),定時(shí)進(jìn)行業(yè)務(wù)考核。
通過(guò)建立系統(tǒng)、完善的業(yè)務(wù)培訓(xùn)和考核機(jī)制,技術(shù)人員的業(yè)務(wù)水平得到了普遍的提升,彌補(bǔ)了個(gè)人的技術(shù)短板。
3.2.1 堅(jiān)持規(guī)范的變更管理
網(wǎng)絡(luò)信息部歷來(lái)重視過(guò)程的管理,在配置、變更、發(fā)布、信息安全等管理方面有著嚴(yán)格的操作票制度。大到設(shè)備的調(diào)試安裝,小到補(bǔ)丁程序,都要遵循如圖3 所示的變更操作流程。通過(guò)規(guī)范化的變更控制和管理,將變更給生產(chǎn)環(huán)境造成的影響和風(fēng)險(xiǎn)降低到最低,在安全周密的回滾方案的基礎(chǔ)上使得每一次成功或者不成功的變更操作對(duì)用戶(hù)造成的影響降低到最小甚至忽略不計(jì),從而保證了天津海河傳媒中心廣電信息系統(tǒng)整體環(huán)境的高穩(wěn)定性。
圖3 變更操作流程Fig.3 Change of operation flow
3.2.2 建立標(biāo)準(zhǔn)化、科學(xué)化、主動(dòng)化運(yùn)維服務(wù)過(guò)程管理體系
由第三方運(yùn)維團(tuán)隊(duì)提供的保姆式服務(wù),對(duì)事件報(bào)修、問(wèn)題總結(jié)等服務(wù)過(guò)程的管理并不到位,多憑技術(shù)人員的經(jīng)驗(yàn)操作,很容易造成事前考慮不全面、事中操作不規(guī)范、事后匯報(bào)不及時(shí)、問(wèn)題解決不到位、技術(shù)經(jīng)驗(yàn)固化不及時(shí)等問(wèn)題。
為了讓每一位技術(shù)人員能夠規(guī)范做事,變被動(dòng)運(yùn)維為主動(dòng)運(yùn)維,把可能出現(xiàn)的問(wèn)題消滅在萌芽,參考先進(jìn)經(jīng)驗(yàn)并結(jié)合自身特點(diǎn),進(jìn)一步規(guī)范運(yùn)維服務(wù)的全流程,如圖4 所示。人員、設(shè)備得到了合理的分配和使用,以操作標(biāo)準(zhǔn)、各類(lèi)指南為依據(jù),在配置管理、備件庫(kù)、知識(shí)庫(kù)的基礎(chǔ)上,形成了貫穿事件全生命周期、監(jiān)督檢查全覆蓋、技術(shù)成果及時(shí)固化的標(biāo)準(zhǔn)化、科學(xué)化、主動(dòng)化運(yùn)維服務(wù)過(guò)程管理體系。
圖4 規(guī)范化、標(biāo)準(zhǔn)化、科學(xué)化、主動(dòng)化運(yùn)維服務(wù)過(guò)程管理體系Fig.4 Normalized,standardized,scientific,active operation and maintenance service process management system
3.3.1 研發(fā)創(chuàng)新
網(wǎng)絡(luò)信息部一直以扎實(shí)的技術(shù)功底和豐富的運(yùn)維經(jīng)驗(yàn)為基礎(chǔ),秉承著大膽創(chuàng)新的技術(shù)理念。在創(chuàng)建標(biāo)準(zhǔn)化、體系化、主動(dòng)化運(yùn)維服務(wù)體系建設(shè)的過(guò)程中收獲諸多技術(shù)創(chuàng)新成果。以主樓Avid 網(wǎng)為例,零成本實(shí)現(xiàn)主樓Avid 網(wǎng)多樓層演播室制播網(wǎng)絡(luò)化;自主研發(fā)以通用硬盤(pán)替代Avid 專(zhuān)用播出服務(wù)器硬盤(pán);自主修復(fù)Avid Unity ISIS 盤(pán)陣ISB 硬盤(pán);自主研發(fā)成功實(shí)現(xiàn)以通用機(jī)型替代Avid 公司指定專(zhuān)用機(jī)型,迅速解決Interplay 非線性工作流引擎單點(diǎn)故障,首次實(shí)現(xiàn)由臺(tái)方技術(shù)人員獨(dú)立完成Avid 網(wǎng)核心服務(wù)器的搭建工作。
上述技術(shù)創(chuàng)新成果在迅速解決問(wèn)題為臺(tái)里節(jié)省大量經(jīng)費(fèi)的同時(shí),更標(biāo)志著網(wǎng)絡(luò)信息部運(yùn)維工作的內(nèi)容已由日常網(wǎng)絡(luò)運(yùn)維拓展到更高一級(jí)的自主研發(fā)、獨(dú)立系統(tǒng)搭建,是網(wǎng)絡(luò)信息部在創(chuàng)建標(biāo)準(zhǔn)化、體系化、主動(dòng)化運(yùn)維服務(wù)體系建設(shè)過(guò)程中的華麗轉(zhuǎn)型。
3.3.2 維護(hù)、監(jiān)督與改進(jìn)
按各網(wǎng)絡(luò)設(shè)備的不同屬性和用戶(hù)使用特點(diǎn),制定規(guī)范完備的系統(tǒng)維檢計(jì)劃、應(yīng)急預(yù)案,定時(shí)開(kāi)展應(yīng)急演練,讓每名技術(shù)人員都能根據(jù)應(yīng)急預(yù)案進(jìn)行實(shí)操練習(xí),實(shí)行專(zhuān)人負(fù)責(zé)的定期和不定期的設(shè)備檢查。
完善例會(huì)制度,從實(shí)際出發(fā)制定工作計(jì)劃,考核執(zhí)行情況,檢查執(zhí)行結(jié)果,取長(zhǎng)補(bǔ)短探討業(yè)務(wù)。堅(jiān)持進(jìn)行PDCA 中計(jì)劃、執(zhí)行、檢查、改進(jìn)的持續(xù)改進(jìn)機(jī)制,針對(duì)工作的各個(gè)層面進(jìn)行查漏補(bǔ)缺,對(duì)運(yùn)維服務(wù)的生命周期進(jìn)行持續(xù)有效的維護(hù)、監(jiān)督與改進(jìn)。
3.4.1 主干中心平臺(tái)
天津海河傳媒中心廣電信息系統(tǒng)以主干中心平臺(tái)來(lái)實(shí)現(xiàn)服務(wù)臺(tái)功能,媒資中心崗的值班人員借助各類(lèi)監(jiān)控工具,對(duì)主干、媒資、綜合云、新聞云等重點(diǎn)網(wǎng)絡(luò)的核心服務(wù)進(jìn)行監(jiān)控。同時(shí)作為信息中心,負(fù)責(zé)接聽(tīng)全臺(tái)各頻道報(bào)修電話,借助知識(shí)庫(kù)對(duì)問(wèn)題進(jìn)行分析和預(yù)處理,部分問(wèn)題能夠通過(guò)電話遠(yuǎn)程指導(dǎo)的方式得以解決,預(yù)處理無(wú)法解決的問(wèn)題也能及時(shí)安排相應(yīng)崗位的人員解決,報(bào)修信息能夠在第一時(shí)間得到接收、處理和分發(fā)。
3.4.2 運(yùn)維監(jiān)控工具
新聞云、綜合云陸續(xù)上線投入使用后,更多的監(jiān)控工具被引入主干中心平臺(tái),如圖5、6 所示,對(duì)主干平臺(tái)、綜合云、新聞云等重點(diǎn)網(wǎng)絡(luò)的核心服務(wù)進(jìn)行監(jiān)控,節(jié)省了大量巡檢時(shí)間。服務(wù)的運(yùn)行狀態(tài)時(shí)時(shí)展現(xiàn)在值班人員眼前,可以在第一時(shí)間發(fā)現(xiàn)異常跡象并進(jìn)行處理,變被動(dòng)運(yùn)維為主動(dòng)運(yùn)維,使得故障對(duì)用戶(hù)的影響降低到最小。
圖5 主干平臺(tái)業(yè)務(wù)監(jiān)控界面Fig.5 Backbone platform business monitoring interface
圖6 綜合云媒資監(jiān)控界面Fig.6 Integrated cloud media monitoring interface
3.4.3 綠色備件庫(kù)
完善的備件庫(kù)是硬件設(shè)備故障快速恢復(fù)、業(yè)務(wù)實(shí)現(xiàn)連續(xù)性的物質(zhì)基礎(chǔ)和保障。網(wǎng)絡(luò)信息部多年來(lái)注重備件庫(kù)的建設(shè),指定專(zhuān)人對(duì)備件庫(kù)進(jìn)行管理,及時(shí)采購(gòu)不足的備品備件。在集中采購(gòu)的同時(shí),備件庫(kù)的另一大來(lái)源就是下線設(shè)備的回收再利用,也是綠色備件庫(kù)的由來(lái)。下線的設(shè)備小到內(nèi)存大到服務(wù)器都會(huì)按照統(tǒng)一標(biāo)準(zhǔn)進(jìn)行檢查,質(zhì)量合格的登記進(jìn)入備件庫(kù),在適當(dāng)?shù)臅r(shí)候再次上線使用。通過(guò)綠色的回收再利用,一方面縮短了備件的采購(gòu)周期,另一方面為臺(tái)里節(jié)省了大量的備件采購(gòu)經(jīng)費(fèi)。
3.4.4 動(dòng)態(tài)知識(shí)庫(kù)
知識(shí)庫(kù)是運(yùn)維服務(wù)中的重要工具,更是運(yùn)維服務(wù)能力建設(shè)的基礎(chǔ)。在人員崗位結(jié)構(gòu)調(diào)整后,網(wǎng)絡(luò)信息部對(duì)現(xiàn)有相關(guān)文檔進(jìn)行了整合和補(bǔ)充,技術(shù)骨干對(duì)自己熟悉的網(wǎng)絡(luò)編寫(xiě)操作手冊(cè)、常見(jiàn)問(wèn)題的處理方法。指定專(zhuān)人在上述文檔的基礎(chǔ)上按統(tǒng)一格式編寫(xiě)知識(shí)庫(kù),以子網(wǎng)知識(shí)庫(kù)為例,包含了子網(wǎng)所轄各系統(tǒng)的系統(tǒng)詳細(xì)資料、值班常規(guī)內(nèi)容、系統(tǒng)維檢記錄、系統(tǒng)常見(jiàn)問(wèn)題處理方法、系統(tǒng)大事記、應(yīng)急預(yù)案、相關(guān)培訓(xùn)考核等資料,覆蓋了日常工作的方方面面,從日常操作到突發(fā)事件的處理均有章可循。
知識(shí)庫(kù)并不是一成不變的,專(zhuān)人按月對(duì)工作日志進(jìn)行提煉,將日志中記錄的問(wèn)題解決方法、系統(tǒng)大事記、設(shè)備維檢等事件進(jìn)行規(guī)范化的總結(jié)積累,相關(guān)人員審核無(wú)誤后補(bǔ)充到知識(shí)庫(kù)中。動(dòng)態(tài)知識(shí)庫(kù)的建立實(shí)現(xiàn)了知識(shí)積累、技術(shù)成果及時(shí)固化、經(jīng)驗(yàn)的傳承與共享等目的,為提升整個(gè)運(yùn)維體系的效率提供了保證,是運(yùn)維人員尤其是一線值班員提供標(biāo)準(zhǔn)化服務(wù)、迅速解決問(wèn)題的堅(jiān)實(shí)基礎(chǔ)。
2020 年初全國(guó)爆發(fā)新冠肺炎疫情,網(wǎng)絡(luò)信息部將近三分之一的成員因春節(jié)返鄉(xiāng)需要自行居家隔離不能到臺(tái)值班。為了及時(shí)向全市人民播報(bào)我市疫情防控進(jìn)展,新聞中心每天新增數(shù)檔直播節(jié)目,十幾個(gè)小時(shí)滾動(dòng)直播疫情新聞,其他頻道的正常維護(hù)也不能中斷,這個(gè)時(shí)候更加需要網(wǎng)絡(luò)信息部為全臺(tái)提供高效、安全的運(yùn)維服務(wù)。
為了解決人員不足、工作量激增的問(wèn)題,領(lǐng)導(dǎo)研究決定將子網(wǎng)崗和媒資中心崗合并,由子網(wǎng)組全權(quán)負(fù)責(zé),擠出的人員全線支援新聞崗。子網(wǎng)組同事憑借之前在培訓(xùn)中學(xué)到的主干平臺(tái)、綜合云的相關(guān)知識(shí),參考知識(shí)庫(kù)中相關(guān)文檔,在最短時(shí)間內(nèi)熟悉并掌握了中心崗全部業(yè)務(wù),保障子網(wǎng)各網(wǎng)絡(luò)、主干平臺(tái)及綜合云的正常運(yùn)行,安全無(wú)事故。
這次新冠肺炎疫情期間網(wǎng)絡(luò)信息部成功應(yīng)對(duì)突發(fā)減員、業(yè)務(wù)量激增等危機(jī),證明標(biāo)準(zhǔn)化操作守則的制定、全面的業(yè)務(wù)培訓(xùn)、完備的知識(shí)庫(kù)建設(shè)是十分有效的,全體人員的職業(yè)技能和專(zhuān)業(yè)化程度得到了大幅提升,是天津海河傳媒中心廣電信息系統(tǒng)高質(zhì)量標(biāo)準(zhǔn)化、體系化、主動(dòng)化運(yùn)維服務(wù)建設(shè)的寶貴成果。
經(jīng)過(guò)一年多的探索與實(shí)踐,天津海河傳媒中心廣電信息系統(tǒng)標(biāo)準(zhǔn)化、體系化、主動(dòng)化運(yùn)維服務(wù)體系建設(shè)的探索和實(shí)踐初獲成果。展望未來(lái),網(wǎng)絡(luò)信息部將進(jìn)一步深挖問(wèn)題,繼續(xù)完善運(yùn)維體系,彌補(bǔ)各項(xiàng)業(yè)務(wù)中的不足,引入更多IT 界、管理界的成功經(jīng)驗(yàn)和先進(jìn)工具,構(gòu)建更加完善的高質(zhì)量廣電網(wǎng)絡(luò)信息系統(tǒng)運(yùn)維服務(wù)體系。