張永梅++賈輝++唐軼軒++姚振++王麗
摘 要:隨著國(guó)網(wǎng)安徽省電力公司設(shè)備(資產(chǎn))運(yùn)維精益管理系統(tǒng)的上線,實(shí)現(xiàn)了橫向、縱向多系統(tǒng)數(shù)據(jù)共享和業(yè)務(wù)融合,推動(dòng)了生產(chǎn)管理信息化水平再上新臺(tái)階。文章針對(duì)系統(tǒng)建設(shè)過(guò)程中出現(xiàn)的數(shù)據(jù)訪問(wèn)反應(yīng)慢、圖形卡頓和接口穩(wěn)定性差等問(wèn)題做的系統(tǒng)調(diào)優(yōu)進(jìn)行了介紹,并闡述了PMS2.0系統(tǒng)深化應(yīng)用的管理方法和相應(yīng)措施。
關(guān)鍵詞:系統(tǒng)架構(gòu);性能調(diào)優(yōu);“126”管控;深化應(yīng)用
國(guó)網(wǎng)安徽省電力公司(以下簡(jiǎn)稱“安徽公司”)為適應(yīng)“三集五大”體系建設(shè)要求,支撐運(yùn)維檢修全過(guò)程精益化管理和電網(wǎng)資產(chǎn)的全壽命周期管理,更大范圍地實(shí)現(xiàn)數(shù)據(jù)共享和業(yè)務(wù)融合,推動(dòng)公司生產(chǎn)管理信息化水平再上新臺(tái)階,啟動(dòng)了設(shè)備(資產(chǎn))運(yùn)維精益管理系統(tǒng)(以下簡(jiǎn)稱“PMS2.0”)建設(shè)工作。
PMS2.0圍繞生產(chǎn)管理的全過(guò)程,以設(shè)備管理為中心,計(jì)劃任務(wù)為主線進(jìn)行設(shè)計(jì),是生產(chǎn)精益化管理的重要支撐平臺(tái)。系統(tǒng)包含標(biāo)準(zhǔn)中心、電網(wǎng)資源中心、計(jì)劃中心、運(yùn)維檢修中心、監(jiān)督評(píng)價(jià)中心和決策支持中心六大中心,系統(tǒng)用戶覆蓋了省電力公司本部、電科院、省檢修公司、送變電公司、16家地市公司及其所轄72家縣公司。
隨著系統(tǒng)的建成及推廣應(yīng)用,逐漸暴露出系統(tǒng)架構(gòu)不夠優(yōu)化、圖形客戶端運(yùn)行緩慢、配搶工單頻繁超時(shí)等問(wèn)題。
1 系統(tǒng)架構(gòu)介紹
安徽公司遵照國(guó)網(wǎng)統(tǒng)一發(fā)放的《SG-PMS2.0省公司系統(tǒng)安裝配置手冊(cè)》開展系統(tǒng)部署工作,系統(tǒng)總體架構(gòu)如圖1所示。
其中,省公司側(cè)部署3臺(tái)數(shù)據(jù)庫(kù)服務(wù)器采用ORACLE11gRAC的集群方式對(duì)外提供服務(wù),34臺(tái)應(yīng)用服務(wù)器分布在不同資源池、不同區(qū)域,分別按不同的程序功能部署了PMS2.0系統(tǒng)的各類應(yīng)用程序,所有應(yīng)用服務(wù)器均接入radware做負(fù)載均衡對(duì)外提供服務(wù)。
應(yīng)用服務(wù)器按其部署服務(wù)劃分為拓?fù)鋿鸥穹?wù)14臺(tái),PMS主服務(wù)9臺(tái),接口服務(wù)6臺(tái),GIS服務(wù)4臺(tái),配網(wǎng)管控計(jì)算服務(wù)1臺(tái)。部署拓?fù)鋿鸥穹謪^(qū)服務(wù)的14臺(tái)服務(wù)器呈兩兩互備方式,避免單點(diǎn)故障;復(fù)用其中4臺(tái)配置高的服務(wù)器并部署了數(shù)據(jù)代理和柵格前置服務(wù),呈兩兩互備方式,避免單點(diǎn)故障。部署PMS主服務(wù)的9臺(tái)服務(wù)器,復(fù)用其中4臺(tái)機(jī)器額外部署了SGUAP服務(wù)、空間信息服務(wù)和配搶消息服務(wù),呈相同服務(wù)多節(jié)點(diǎn)方式,避免單點(diǎn)故障。6臺(tái)接口服務(wù)器中兩臺(tái)單獨(dú)部署為配搶專用接口服務(wù),呈兩兩互備方式,避免單點(diǎn)故障。另外4臺(tái)部署對(duì)外接口、任務(wù)調(diào)度服務(wù),同時(shí)還部署了PMS主服務(wù)以作備用。
2 性能優(yōu)化
針對(duì)系統(tǒng)存在的性能問(wèn)題,國(guó)網(wǎng)安徽省信通公司(以下簡(jiǎn)稱“信通公司”)開展了數(shù)據(jù)庫(kù)、圖形和接口的相關(guān)優(yōu)化工作,提升了PMS2.0運(yùn)行穩(wěn)定性及用戶體驗(yàn)。
2.1 數(shù)據(jù)庫(kù)優(yōu)化
為解決系統(tǒng)運(yùn)行緩慢、數(shù)據(jù)庫(kù)服務(wù)器宕機(jī)問(wèn)題,信通公司在國(guó)網(wǎng)典設(shè)的三節(jié)點(diǎn)ORACLE11g的RAC基礎(chǔ)上,又額外異地部署了一套三節(jié)點(diǎn)的ADG備庫(kù),實(shí)現(xiàn)數(shù)據(jù)庫(kù)快速切換、災(zāi)難性恢復(fù)及數(shù)據(jù)保護(hù),當(dāng)主庫(kù)出現(xiàn)故障時(shí),備庫(kù)可以自動(dòng)切換為主庫(kù),并對(duì)外提供服務(wù)。同時(shí),將應(yīng)用程序的JDBC連接串由常規(guī)的IP∶PORT改為URL∶PORT方式,通過(guò)域名系統(tǒng)(Domain Name System,DNS)進(jìn)行域名解析,當(dāng)數(shù)據(jù)庫(kù)出現(xiàn)故障時(shí)主備庫(kù)切換后,應(yīng)用在不需要任何干預(yù)的情況下實(shí)現(xiàn)自動(dòng)重連當(dāng)前可用數(shù)據(jù)庫(kù);對(duì)最能體現(xiàn)數(shù)據(jù)庫(kù)運(yùn)行安全及運(yùn)行質(zhì)量的DBtime,事務(wù)響應(yīng)時(shí)間,數(shù)據(jù)庫(kù)等待事件數(shù)、活動(dòng)會(huì)話走勢(shì)、物理讀寫、CPU負(fù)載率、文件系統(tǒng)及表空間使用率等關(guān)鍵指標(biāo)部署了監(jiān)控措施,設(shè)置指標(biāo)告警閾值;同時(shí)按日將執(zhí)行時(shí)間較長(zhǎng)的結(jié)構(gòu)化查詢語(yǔ)言(Structured Query Language,SQL)語(yǔ)句提取出來(lái),數(shù)據(jù)庫(kù)與應(yīng)用系統(tǒng)專業(yè)人員聯(lián)合分析,提出優(yōu)化建議,部分SQL語(yǔ)句也同步報(bào)送國(guó)網(wǎng)總部開發(fā)分析,預(yù)先進(jìn)行系統(tǒng)性能薄弱點(diǎn)的控制,避免因性能問(wèn)題影響系統(tǒng)安全穩(wěn)定運(yùn)行。
2.2 圖形架構(gòu)優(yōu)化
針對(duì)PMS2.0出現(xiàn)的圖形編輯卡頓現(xiàn)象,信通公司通過(guò)對(duì)I6000監(jiān)控系統(tǒng)主機(jī)運(yùn)行關(guān)鍵數(shù)據(jù)的分析,發(fā)現(xiàn)該問(wèn)題的主要影響因素為主機(jī)資源不足。系統(tǒng)使用24核CPU的虛擬機(jī)加載全省數(shù)據(jù)時(shí),虛擬機(jī)CPU使用率指標(biāo)長(zhǎng)期居高不下,系統(tǒng)存在嚴(yán)重超負(fù)荷運(yùn)轉(zhuǎn)現(xiàn)象,導(dǎo)致用戶前端操作卡頓現(xiàn)象頻現(xiàn)。對(duì)此,信通公司協(xié)調(diào)硬件資源進(jìn)行優(yōu)化,及時(shí)擴(kuò)容低配置虛擬機(jī)CPU至48核,并新增4臺(tái)物理機(jī)(配置為80C/128G)同步投入運(yùn)行。
在提升硬件資源、降低SQL響應(yīng)時(shí)長(zhǎng)后,PMS2.0系統(tǒng)響應(yīng)速度有所提升,但圖形編輯卡頓現(xiàn)象仍然存在,重要功能模塊運(yùn)行性能指標(biāo)仍不理想。信通公司從監(jiān)控指標(biāo)的運(yùn)行表象,分析發(fā)現(xiàn)在系統(tǒng)架構(gòu)及程序設(shè)計(jì)上系統(tǒng)也需要進(jìn)行進(jìn)一步的優(yōu)化處理,經(jīng)過(guò)充分調(diào)研、比對(duì)、分析并測(cè)試后,決定從系統(tǒng)架構(gòu)及數(shù)據(jù)分區(qū)方面開展優(yōu)化調(diào)整,采用更改柵格拓?fù)浞?wù)數(shù)據(jù)加載機(jī)制,由加載全省數(shù)據(jù)改為加載地市數(shù)據(jù),即“圖形分區(qū)方案”。將各地市按照電網(wǎng)數(shù)據(jù)量大小、地市行政區(qū)域界限劃分為6個(gè)區(qū)域,每個(gè)區(qū)域使用兩臺(tái)機(jī)器進(jìn)行集群部署柵格拓?fù)浞?wù),避免單點(diǎn)故障并負(fù)載均衡,從源頭解決圖形編輯卡頓問(wèn)題,為開展各項(xiàng)業(yè)務(wù)應(yīng)用提供了最大保障。
2.3 接口優(yōu)化
針對(duì)PMS2.0與CMS營(yíng)銷業(yè)務(wù)應(yīng)用系統(tǒng)接口穩(wěn)定性較差,導(dǎo)致配搶工單超時(shí)率高達(dá)9.35‰的問(wèn)題,信通公司創(chuàng)新提出營(yíng)銷側(cè)接口獨(dú)立部署的方案,將營(yíng)銷接口服務(wù)剝離出來(lái),單獨(dú)部署在4臺(tái)新的服務(wù)器上,并作F5負(fù)載均衡,大幅提升了接口性能;同時(shí)在所有接口都增加了監(jiān)控“握手”記錄的機(jī)制,每次接口調(diào)用時(shí),都會(huì)產(chǎn)生一條日志記錄“握手”結(jié)果,極大地方便了問(wèn)題定位與分析。
3 深化應(yīng)用
3.1 管理方法
3.1.1 管理目標(biāo)
安徽公司在項(xiàng)目建設(shè)中建立里程碑節(jié)點(diǎn)清晰的項(xiàng)目工作計(jì)劃,在總體進(jìn)度嚴(yán)格要求下依據(jù)任務(wù)緊迫性、實(shí)際開發(fā)及實(shí)施進(jìn)度合理調(diào)整計(jì)劃細(xì)節(jié),以確保達(dá)到“細(xì)節(jié)可操作、節(jié)點(diǎn)可控制、整體可完成”的目標(biāo)。endprint
3.1.2 管理細(xì)則
為確保工程的順利實(shí)施,安徽公司嚴(yán)格按照國(guó)家對(duì)系統(tǒng)集成項(xiàng)目管理的有關(guān)規(guī)定和系統(tǒng)實(shí)施方案,對(duì)項(xiàng)目實(shí)施過(guò)程中的進(jìn)度、質(zhì)量和資源的使用進(jìn)行全過(guò)程的管理。按照“統(tǒng)一規(guī)劃、統(tǒng)一標(biāo)準(zhǔn)、統(tǒng)一平臺(tái)、統(tǒng)一建設(shè)”的原則,PMS2.0系統(tǒng)實(shí)施工作成立項(xiàng)目領(lǐng)導(dǎo)小組、項(xiàng)目管控組、項(xiàng)目工作組、實(shí)施組、技術(shù)支持組,為項(xiàng)目推進(jìn)提供組織保障。
同時(shí),安徽公司積極推行“126”管控模式,即圍繞“一個(gè)計(jì)劃”—里程碑計(jì)劃,執(zhí)行“兩個(gè)方案”—工作方案、單軌上線方案,推行“六項(xiàng)機(jī)制”—分級(jí)負(fù)責(zé)制、周月例會(huì)機(jī)制、關(guān)鍵指標(biāo)通報(bào)考核機(jī)制、進(jìn)度節(jié)點(diǎn)管控機(jī)制、問(wèn)題管控機(jī)制、部門間橫向協(xié)同機(jī)制,細(xì)致分解工作任務(wù)項(xiàng),落實(shí)各項(xiàng)工作責(zé)任方及時(shí)間節(jié)點(diǎn)。同時(shí),要求各單位在嚴(yán)格執(zhí)行省公司“126”管控模式及機(jī)制的基礎(chǔ)上,要比照建立自己的管控機(jī)制,為項(xiàng)目進(jìn)度及質(zhì)量提供了保障。
3.2 用戶培訓(xùn)
為保障系統(tǒng)應(yīng)用效果,省公司組織16家地市公司的輸變配專家關(guān)鍵用戶進(jìn)行集中培訓(xùn),從中選拔出優(yōu)秀學(xué)員作為培訓(xùn)老師,與項(xiàng)目組專家一起組成培訓(xùn)團(tuán)隊(duì),赴地市公司開展駐地培訓(xùn)。同時(shí),根據(jù)培訓(xùn)效果,組織人員對(duì)教材進(jìn)行優(yōu)化,以實(shí)用為主,突出差異,重點(diǎn)培訓(xùn)PMS2.0和PMS1.0在業(yè)務(wù)和流程上的差異,縮短培訓(xùn)時(shí)間,使基層人員能夠盡快掌握。系統(tǒng)建設(shè)期間,累計(jì)培訓(xùn)12 854人次,培訓(xùn)范圍覆蓋管理人員及各個(gè)班組成員,培訓(xùn)覆蓋率100%,為各單位業(yè)務(wù)正常開展打下堅(jiān)實(shí)基礎(chǔ)。
3.3 工具研發(fā)
隨著PMS2.0系統(tǒng)上線運(yùn)行,系統(tǒng)“應(yīng)用情況指標(biāo)”查詢模塊存在考核細(xì)度低于現(xiàn)場(chǎng)要求,功能完善進(jìn)度慢等問(wèn)題,影響了實(shí)際指標(biāo)管控、分析工作。為此,安徽公司結(jié)合PMS2.0系統(tǒng)指標(biāo)體系與本地基層實(shí)際業(yè)務(wù)應(yīng)用情況,研發(fā)了“PMS智能管控分析平臺(tái)”,以精益化管理為主線,以推進(jìn)PMS2.0系統(tǒng)實(shí)用化應(yīng)用為重點(diǎn),統(tǒng)計(jì)查詢各業(yè)務(wù)指標(biāo),提升各地市公司專業(yè)人員業(yè)務(wù)應(yīng)用系統(tǒng)能力,建立統(tǒng)一、高效、集約的運(yùn)維檢修管理信息化平臺(tái),滿足執(zhí)行層、管理層和決策層需要,提升電網(wǎng)運(yùn)檢管理精益化水平。
“PMS智能管控分析平臺(tái)”針對(duì)基礎(chǔ)設(shè)備臺(tái)賬、生產(chǎn)業(yè)務(wù)數(shù)據(jù)、系統(tǒng)運(yùn)行數(shù)據(jù)的各類指標(biāo)進(jìn)行分析、預(yù)警,秉承“以指標(biāo)促應(yīng)用,以應(yīng)用促管理”理念,從月度、季度、年度3個(gè)維度對(duì)指標(biāo)進(jìn)行科學(xué)組合,強(qiáng)化指標(biāo)評(píng)價(jià)對(duì)生產(chǎn)信息化專業(yè)管理的支撐作用,合理設(shè)置發(fā)布周期,科學(xué)指導(dǎo)各單位系統(tǒng)實(shí)用化推進(jìn),加大各單位管理改進(jìn)和自我提升的關(guān)注度。
4 結(jié)語(yǔ)
PMS2.0是“三集五大”體系建設(shè)中的“大檢修”體系內(nèi)容,支撐了運(yùn)維檢修全過(guò)程精益化管理和電網(wǎng)資產(chǎn)的全壽命周期管理,安徽公司通過(guò)以上技術(shù)上、管理上的一系列措施,有效地提升了系統(tǒng)性能,提高了用戶體驗(yàn)。目前,該系統(tǒng)已在安徽公司全面應(yīng)用推廣,系統(tǒng)運(yùn)行穩(wěn)定,功能應(yīng)用可靠,有效支撐了安徽公司現(xiàn)有設(shè)備資產(chǎn)的運(yùn)維檢修、全壽命周期管理。
Optimization and application of equipment (asset)
operation and maintenance lean management system
Zhang Yongmei, Jia Hui, Tang Yixuan, Yao Zhen, Wang Li
(State Grid AnHui Information &Telecommunication Company, Hefei 230061, China)
Abstract: With the equipment (asset) operation and maintenance lean management system of State Grid Anhui Electric Power Company on the line, achieved a horizontal, vertical multi-system data sharing and business integration, and promoted the level of production management information to a new level. This paper introduces the system tuning in the process of system construction, such as slow data access, graphics caton and poor interface stability, and elaborated the deepen application management methods and the corresponding measures of the PMS2.0 system.
Key words: system structure; performance tuning; “126” management and control; deepen applicationendprint