李文學(xué)
(黃河鑫業(yè)有限公司,青海 西寧 810000)
分布式控制系統(tǒng)主要是基于現(xiàn)代計(jì)算機(jī)技術(shù)的應(yīng)用對(duì)生產(chǎn)過程進(jìn)行集中監(jiān)視、管理、操作和分散控制[1]。該系統(tǒng)從構(gòu)成上來看,作為縱向分層和橫向分散的控制系統(tǒng),以多層信息網(wǎng)絡(luò)作為基礎(chǔ),將分布于全廠內(nèi)的控制設(shè)備信息數(shù)據(jù)處理連接起來,實(shí)現(xiàn)不同信息共建共享,并完成管控與決策。該系統(tǒng)運(yùn)行過程中難免受到一些不良因素的影響,因此加強(qiáng)系統(tǒng)運(yùn)行維護(hù)管理至關(guān)重要。
運(yùn)維管理初期,應(yīng)當(dāng)全面熟悉DCS系統(tǒng)的構(gòu)成架構(gòu)。比如,XDPS系統(tǒng)由DPU、高速實(shí)時(shí)信息數(shù)據(jù)網(wǎng)和MMI組成,需熟記系統(tǒng)構(gòu)成和相關(guān)設(shè)備,提高維護(hù)管理效率。要清楚各模塊功能,全面了解外部接線圖,清晰認(rèn)知DCS內(nèi)部數(shù)據(jù)流向和處理流程。實(shí)踐中,還應(yīng)當(dāng)熟悉DCS各模塊及地儀表的運(yùn)行和故障狀態(tài)指示燈代表的意思,準(zhǔn)確掌握各儀器設(shè)備的性能,便于及時(shí)發(fā)現(xiàn)和處理故障問題[2]。DCS軟、硬件備份也非常重要,硬件備份應(yīng)當(dāng)以易損部位為重點(diǎn),如BCNET卡和DPU模塊等。軟件備份過程中,應(yīng)當(dāng)針對(duì)操作系統(tǒng)、DPU組態(tài)和歷史數(shù)據(jù)庫等定期備份,確保備份的多樣性。此外,要注意收集整理資料,包括硬件、軟件和廠家聯(lián)系方式等相關(guān)信息資料,便于系統(tǒng)維護(hù)過程中節(jié)約時(shí)間,使維護(hù)工作更具針對(duì)性。
實(shí)際中,既要做好各項(xiàng)準(zhǔn)備工作,又要加強(qiáng)系統(tǒng)運(yùn)行和停運(yùn)兩個(gè)環(huán)節(jié)的維護(hù)與管理工作。
在DCS系統(tǒng)運(yùn)行過程中,因機(jī)柜下層為電纜夾層,情況復(fù)雜且容易出現(xiàn)鼠害問題,所以應(yīng)將機(jī)柜下的電纜入口封死,并且在機(jī)柜中放置一些粘鼠板或放置毒鼠藥物。系統(tǒng)運(yùn)行時(shí),應(yīng)當(dāng)注意故障卡件的更換。新卡件應(yīng)當(dāng)用防靜電袋進(jìn)行包裹,防止人直接用手接觸相關(guān)元器件造成不利后果。在卡件更換過程中,應(yīng)當(dāng)做好防靜電處理,必要時(shí)應(yīng)帶上防靜電手環(huán),注意在卡件更換前對(duì)跳線地址進(jìn)行確認(rèn)[3]。實(shí)際運(yùn)行過程中經(jīng)常會(huì)出現(xiàn)測(cè)點(diǎn)跳變問題,多數(shù)情況下是因?yàn)榫偷亟泳€端子松動(dòng)或DCS機(jī)柜端子板通道受到損壞,也可能是因?yàn)閺?qiáng)電磁干擾。因此,需嚴(yán)格檢查信號(hào)線屏蔽和接地狀況,確保信號(hào)線與干擾源保持一定的距離。實(shí)際運(yùn)行過程中,應(yīng)當(dāng)注意對(duì)組態(tài)的優(yōu)化處理,提前備份好組態(tài)并做好記錄。運(yùn)行過程中,DCS系統(tǒng)應(yīng)當(dāng)對(duì)電腦磁盤進(jìn)行檢查,尤其要檢查空余容量,優(yōu)化整理磁盤,及時(shí)清除沒有價(jià)值的數(shù)據(jù)信息,同時(shí)定期將歷史數(shù)據(jù)導(dǎo)入移動(dòng)硬盤予以保存。在系統(tǒng)運(yùn)行過程中,還要定期檢查操作人員的權(quán)限,特別是網(wǎng)絡(luò)端口位置的配置情況,嚴(yán)格管理工程師授權(quán),嚴(yán)禁非熱控人員擅自登錄并修改組態(tài)。
在DCS系統(tǒng)停運(yùn)后,按照規(guī)程和要求清理DCS機(jī)柜和卡件中的清灰,并及時(shí)更換運(yùn)行過程中不能更換的元件。要對(duì)操作員站、工程站內(nèi)的電腦清灰,并且給CPU涂抹散熱硅脂,確保計(jì)算機(jī)正常運(yùn)行。停機(jī)后,檢查各機(jī)柜、UPS和電源模塊供電,處理好低電壓電源模塊,必要時(shí)對(duì)其進(jìn)行更換處理。對(duì)機(jī)柜內(nèi)部的DPU、卡件和網(wǎng)絡(luò)進(jìn)行冗余測(cè)試,詳細(xì)記錄冗余測(cè)試結(jié)果[4]。檢查DCS系統(tǒng)接線及插頭的牢靠性,防止出現(xiàn)虛接問題,緊固處理易松動(dòng)之處。檢查機(jī)柜散熱風(fēng)扇的實(shí)際運(yùn)行情況,更換存在故障及老化而影響散熱效果的風(fēng)扇。測(cè)量接地電阻,確保機(jī)柜接地銅排到大地的接地電阻不超過2.5 Ω。
系統(tǒng)停運(yùn)后的維護(hù)管理過程中,需特別注意以下幾方面問題。在對(duì)DCS系統(tǒng)進(jìn)行停電檢修前,確認(rèn)生產(chǎn)設(shè)備停運(yùn)且整個(gè)組態(tài)信息已保存完好,待停電手續(xù)完全辦理后再嚴(yán)格按照順序進(jìn)行操作。先依次使單個(gè)電源停止工作,然后總電源停止工作。切忌隨意??傠娫?。清灰處理是應(yīng)用干燥的壓縮空氣確保無水和無油污,壓力保持在0.05 MPa。清灰時(shí)所用的吸塵器應(yīng)具有較大吸力,能及時(shí)吸走揚(yáng)塵。在DCS機(jī)柜檢修過程中,防靜電處理也非常重要,而帶好防靜電設(shè)備及人體事先進(jìn)行放電非常重要。同時(shí),盡可能避免碰觸卡件上的電路部件,拆卸的卡件應(yīng)當(dāng)置于防靜電墊子上。DCS機(jī)柜中的電源模塊很容易發(fā)熱和老化,且容易產(chǎn)生電壓不足等問題,因此在對(duì)其進(jìn)行清洗時(shí),應(yīng)先去掉觸頭上的銹蝕,然后清洗電源背板和接線處。實(shí)踐中若無法有效解決上述問題,則建議更換電源模塊。清理完畢卡件上的灰塵回裝至機(jī)柜槽位內(nèi)時(shí),一定要確保編號(hào)無誤,同時(shí)檢查卡件連接電纜插接是否到位,確保其牢固不松動(dòng)[5]。機(jī)柜散熱扇清理過程中,應(yīng)當(dāng)更換轉(zhuǎn)動(dòng)不靈活的散熱風(fēng)扇。檢修工作完成后,嚴(yán)格按照規(guī)定進(jìn)行通電測(cè)試,檢測(cè)各等級(jí)輸出電壓是否正常,尤其是DPU及卡件的狀態(tài)是否正常,并檢查切換功能是否正常。
2.3.1 系統(tǒng)現(xiàn)狀概述
某廠在運(yùn)機(jī)組全部采用DCS控制系統(tǒng),其中一些DCS系統(tǒng)已經(jīng)實(shí)現(xiàn)了機(jī)組運(yùn)行參數(shù)顯示、故障保護(hù)停車和聲光報(bào)警功能,同時(shí)實(shí)現(xiàn)了數(shù)據(jù)庫、自控控制邏輯組態(tài)、歷史信息查詢、數(shù)據(jù)顯示畫面和故障順序記錄等功能。2018年度1月份對(duì)上述各機(jī)組運(yùn)行故障進(jìn)行統(tǒng)計(jì)記錄,數(shù)據(jù)顯示DCS控制系統(tǒng)故障率最高可達(dá)0.56%,平均故障率0.4%。隨著系統(tǒng)規(guī)模的擴(kuò)大及用時(shí)延長,控制系統(tǒng)中的問題逐漸暴露,如通信故障、組態(tài)文件信息丟失和無故監(jiān)控畫面退出等。為此,需對(duì)DCS系統(tǒng)運(yùn)行過程中的各種故障問題進(jìn)行分析與處理,使故障發(fā)生率從0.4%下降至0.1%。
2.3.2 維護(hù)管理方案
第一,無故監(jiān)控畫面退出。出現(xiàn)這樣的問題,主要是因?yàn)檐浻布嫒菪圆?,系統(tǒng)物理內(nèi)存與虛擬內(nèi)存經(jīng)長期運(yùn)行,導(dǎo)致內(nèi)存空間占用增大,使內(nèi)存空間變小或者不足導(dǎo)致系統(tǒng)退出。也可能因?yàn)橄到y(tǒng)盤空間相對(duì)較小,在長期運(yùn)行過程中導(dǎo)致磁盤碎片數(shù)量增大,導(dǎo)致文件讀取所需的時(shí)間增加,監(jiān)控系統(tǒng)因此而退出。此外,如果操作人員進(jìn)行非法操作,也會(huì)導(dǎo)致監(jiān)控系統(tǒng)自動(dòng)退出;周圍環(huán)境溫度過高或濕度太大,也會(huì)導(dǎo)致監(jiān)控畫面無故退出。對(duì)于這一故障,應(yīng)當(dāng)從以下幾個(gè)方面著手。首先,每隔2~3個(gè)月對(duì)操作站進(jìn)行一次除塵處理,優(yōu)化設(shè)計(jì)除塵檢修方案,確保操作站硬件的清潔性,降低故障發(fā)生率;其次,清掃操作站時(shí)應(yīng)當(dāng)利用系統(tǒng)磁盤碎片整理程序整理磁盤,以此消除碎片;最后,對(duì)操作人員加強(qiáng)教育培訓(xùn),使他們能夠全面了解操作知識(shí)和技能。同時(shí),要定期改變組態(tài)文件的存放分區(qū),以免硬盤因系統(tǒng)長期讀寫和分區(qū)而損壞硬盤。
第二,組態(tài)文件丟失。究其原因,主要是系統(tǒng)控制站運(yùn)行時(shí)間較長,后備鋰電池基本失效,當(dāng)電源箱供電出現(xiàn)故障問題時(shí),可能會(huì)導(dǎo)致組態(tài)數(shù)據(jù)丟失。對(duì)于這一問題,應(yīng)當(dāng)定期檢查與更換后備鋰電池,并利用系統(tǒng)大修契機(jī)制定有效的技術(shù)措施,全面監(jiān)測(cè)與檢修供電系統(tǒng)。
第三,通信故障。系統(tǒng)采用的是共享式以太網(wǎng),主要問題是用戶共建共享帶寬,各用戶的實(shí)際可用帶寬隨網(wǎng)絡(luò)用戶的增加而遞減。當(dāng)網(wǎng)絡(luò)負(fù)荷相對(duì)較大時(shí),會(huì)導(dǎo)致數(shù)據(jù)信息沖突而導(dǎo)致數(shù)據(jù)阻塞,嚴(yán)重威脅控制系統(tǒng)的安全運(yùn)行。針對(duì)這一問題,應(yīng)當(dāng)升級(jí)DPU硬件通信卡,優(yōu)化升級(jí)DCS通信網(wǎng)絡(luò)交換機(jī)和DCS軟件通信協(xié)議等。
經(jīng)過對(duì)DCS控制系統(tǒng)的全面管理,從機(jī)組DCS系統(tǒng)運(yùn)行狀態(tài)檢驗(yàn)效果來看,未發(fā)生無故監(jiān)控畫面退出問題、數(shù)據(jù)無法刷新以及通信故障。
DCS系統(tǒng)運(yùn)行維護(hù)與管理關(guān)系著電廠的整體穩(wěn)定性,維護(hù)工作應(yīng)當(dāng)落實(shí)到過程中,做到防患于未然。