梅昌利
摘 要:計(jì)算機(jī)作為控制系統(tǒng)輸入及輸出設(shè)備,運(yùn)行維護(hù)及故障處理關(guān)系著控制系統(tǒng)及生產(chǎn)裝置的安全平穩(wěn)運(yùn)行。從設(shè)備選型、日常維護(hù)、故障快速處理等方面著手提高控制系統(tǒng)計(jì)算機(jī)的可靠性。
關(guān)鍵詞:控制系統(tǒng);計(jì)算機(jī);故障;恢復(fù)
中圖分類號(hào): TP309.1 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 1673-1069(2016)22-106-2
0 引言
滄州煉化焦化裝置控制系統(tǒng)主要有DCS系統(tǒng)ECS-700一套,帶3臺(tái)工程師站,5臺(tái)操作站;SIS系統(tǒng)TRICON一套,帶1臺(tái)工程師站、2臺(tái)操作站;順控系統(tǒng)AB SLC5000系統(tǒng)1套,帶1臺(tái)工程師站、1臺(tái)操作站;除焦系統(tǒng)AB SLC5000系統(tǒng)1套,帶1臺(tái)工程師站、1臺(tái)操作站。共17臺(tái)計(jì)算機(jī),型號(hào)皆為DELL T5500系列工作站。
自2009年大修改擴(kuò)建以來(lái)已7年,各控制系統(tǒng)操作站/工程師站已出現(xiàn)多臺(tái)計(jì)算機(jī)軟/硬件故障。計(jì)算機(jī)硬件故障部位主要有:主板/硬盤(pán)/電源/顯示器/網(wǎng)卡等。軟件故障主要有:系統(tǒng)文件丟失、系統(tǒng)不能正常運(yùn)行等。處理故障時(shí)一般要至少半天時(shí)間,若計(jì)算機(jī)主板故障則時(shí)間更長(zhǎng)。計(jì)算機(jī)硬盤(pán)故障后要重裝系統(tǒng)及軟件,對(duì)于比較復(fù)雜的軟件安裝及配置則要依托廠家到廠解決。對(duì)于組態(tài)數(shù)據(jù)、歷史趨勢(shì)、操作記錄等數(shù)據(jù)丟失,沒(méi)有很好的解決辦法。
這些問(wèn)題一直對(duì)裝置平穩(wěn)操作、安全生產(chǎn)造成了很大威脅。特別是有一些單操作站/單工程師站配置的控制系統(tǒng)影響最大。
1 影響控制系統(tǒng)計(jì)算機(jī)平穩(wěn)運(yùn)行的因素
①焦化裝置因生產(chǎn)焦炭的原因,環(huán)境比較差,焦碳粉容易進(jìn)入計(jì)算機(jī)內(nèi)部,對(duì)計(jì)算機(jī)的平穩(wěn)運(yùn)行造成很大影響。
②這些計(jì)算機(jī)已經(jīng)至少工作6年以上,已出了質(zhì)保期,硬件故障后不能快速、便捷、低成本的維修。配置為:DELL T5500/5600系列,CPU 至強(qiáng)Xeon E5506,主板 Intel 5520,內(nèi)存 2G,硬盤(pán)容量 320G,顯卡芯片 英偉達(dá)nVIDIA Quadro NVS295,網(wǎng)卡 Broadcom 5754,支持操作系統(tǒng) Windows Vista/7/Red Hat Enterprise Linux WS v.5.3.0,購(gòu)置時(shí)間 2009年,質(zhì)保3年。
③這批計(jì)算機(jī)官方不對(duì)Windows XP系統(tǒng)進(jìn)行支持(現(xiàn)有控制系統(tǒng)計(jì)算機(jī)因控制組態(tài)軟件兼容問(wèn)題,全部裝Windows XP),無(wú)官方硬件驅(qū)動(dòng),只能找兼容驅(qū)動(dòng),容易造成工作不穩(wěn)定。
④這批計(jì)算機(jī)因成本問(wèn)題,只配了單硬盤(pán),未配置成RAID1(獨(dú)立磁盤(pán)冗余陣列,數(shù)據(jù)安全性高),數(shù)據(jù)損壞后不可恢復(fù)。
⑤一些控制系統(tǒng)安裝、組態(tài)復(fù)雜,且操作不夠人性化;同時(shí)還存在軟件、組態(tài)有缺陷等問(wèn)題。
除了國(guó)產(chǎn)的ECS-700和研華Advantech外,其他系統(tǒng)都是英文界面,組態(tài)都是廠家直接完成的,且廠家對(duì)維護(hù)人員的培訓(xùn)不到位??刂葡到y(tǒng)軟件要求長(zhǎng)期穩(wěn)定運(yùn)行,基本整個(gè)壽命周期都不需要更新,造成維護(hù)人員缺少練習(xí)機(jī)會(huì),組態(tài)培訓(xùn)后,維護(hù)能力逐漸下降。
2 針對(duì)以上問(wèn)題制定的措施
2.1 加強(qiáng)控制系統(tǒng)計(jì)算機(jī)日常管理
控制系統(tǒng)計(jì)算機(jī)一般不停機(jī)運(yùn)行一個(gè)大修周期,所以日常巡檢、維護(hù)很關(guān)鍵。焦化裝置計(jì)算機(jī)故障頻發(fā)后,加強(qiáng)了對(duì)計(jì)算機(jī)的日常巡檢。重點(diǎn)工作主要包含:
①檢查計(jì)算機(jī)硬件情況。計(jì)算機(jī)CPU、顯卡溫度, CPU使用率、內(nèi)存占用率、各硬件運(yùn)行情況。
②控制柜用過(guò)濾網(wǎng)封堵,減少粉塵進(jìn)入。若設(shè)備積灰嚴(yán)重,則要交替停機(jī)清灰。
③嚴(yán)格控制操作室及工程師站溫度、濕度及靜電。溫度18℃~24℃,相對(duì)濕度45%~70%,操作室門(mén)口豎立防靜電柱消除靜電。
2.2 建立每臺(tái)控制系統(tǒng)計(jì)算機(jī)檔案信息
控制系統(tǒng)計(jì)算機(jī)很多關(guān)鍵信息需要記錄并及時(shí)更新。主要記錄了控制系統(tǒng)計(jì)算機(jī)各類信息:裝置、控制系統(tǒng)型號(hào)、計(jì)算機(jī)配置、軟件配置、用戶密碼、備份方式、保存方式、備份日志等。這些信息基本包含了控制系統(tǒng)計(jì)算機(jī)的大部分信息,為維護(hù)工作打下了堅(jiān)實(shí)基礎(chǔ)。
2.3 準(zhǔn)備備用計(jì)算機(jī)及配件
為了能及時(shí)、快速地恢復(fù)損壞計(jì)算機(jī)運(yùn)行,那么準(zhǔn)備備用計(jì)算機(jī)和易損件的備件是必要的。按近期實(shí)際運(yùn)行統(tǒng)計(jì),計(jì)算機(jī)易損件一般有:電源、硬盤(pán)、主板、顯示器、網(wǎng)卡等。其中硬盤(pán)、網(wǎng)卡因通用性強(qiáng),全廠各機(jī)型基本都能替換,可提前儲(chǔ)備。
因計(jì)算機(jī)硬件更新很快,電源、主板一般為系列專用產(chǎn)品,這個(gè)不用儲(chǔ)備,到時(shí)直接返廠維修。更節(jié)省的方案是選用工況好的淘汰的計(jì)算機(jī)作為備用機(jī),可作為應(yīng)急使用。同時(shí)應(yīng)準(zhǔn)備一些可讀寫(xiě)光盤(pán),作為系統(tǒng)和軟件工具載體。一些移動(dòng)硬盤(pán)或3.5寸硬盤(pán)盒,保存?zhèn)浞菸募?/p>
注意:備用計(jì)算機(jī)和配件一定要確認(rèn)在原操作系統(tǒng)下具有完整驅(qū)動(dòng)程序,否則不能使用。
2.4 嘗試快速備份、還原數(shù)據(jù)
根據(jù)控制系統(tǒng)計(jì)算機(jī)的長(zhǎng)期基本不用變更軟件配置的特點(diǎn),嘗試將整個(gè)計(jì)算機(jī)硬盤(pán)全部鏡像復(fù)制,并保存在同型號(hào)硬盤(pán)上。硬盤(pán)最好準(zhǔn)備一個(gè)3.5寸硬盤(pán)盒,便于隨時(shí)外接到USB口備份。當(dāng)然,這個(gè)工作需要在每次修改了組態(tài)后,再執(zhí)行。當(dāng)出現(xiàn)硬盤(pán)故障后,可馬上更換上新硬盤(pán),即可馬上恢復(fù)計(jì)算機(jī)正常運(yùn)行。當(dāng)然可能損失各類歷史數(shù)據(jù)。
當(dāng)出現(xiàn)主板、電源等故障后,可將原硬盤(pán)換到備用機(jī)上,即可馬上恢復(fù)計(jì)算機(jī)正常運(yùn)行。
當(dāng)備用機(jī)與原計(jì)算機(jī)配置不同時(shí)(即使一個(gè)大型號(hào)的設(shè)備不同批次也可能不同配置),可用帶異機(jī)還原這種功能的軟件,比如ATIH。ATIH是一個(gè)強(qiáng)大的備份還原工具,主要有以下特點(diǎn):
①唯一支持開(kāi)機(jī)熱備份(包含操作系統(tǒng)盤(pán))。這樣就可不停機(jī)隨時(shí)備份,對(duì)控制系統(tǒng)穩(wěn)定運(yùn)行有利。
②支持不間斷備份??杀Wo(hù)關(guān)鍵數(shù)據(jù),當(dāng)數(shù)據(jù)損壞或進(jìn)行了錯(cuò)誤操作可及時(shí)恢復(fù)。
③支持異機(jī)還原。這樣即使硬件完全不同也能實(shí)現(xiàn)完整備份與還原。
④支持windows系統(tǒng)備份文件轉(zhuǎn)換,適應(yīng)性更強(qiáng)。
⑤支持多核多線程備份還原等功能,備份還原操作更快,對(duì)系統(tǒng)影響更小。
備份完成后,對(duì)每個(gè)硬盤(pán)進(jìn)行標(biāo)記并登記,這樣原計(jì)算機(jī)不管軟件還是硬件故障都能簡(jiǎn)單、快速恢復(fù),確保數(shù)據(jù)萬(wàn)無(wú)一失。
按照以上幾點(diǎn)執(zhí)行后,控制計(jì)算機(jī)故障率逐步下降。控制系統(tǒng)廠家需要來(lái)廠服務(wù)的次數(shù)大大減少了。維護(hù)工程師基本能處理控制計(jì)算機(jī)各類故障,節(jié)省了不少維護(hù)費(fèi)用。最關(guān)鍵的是即使發(fā)生硬件和軟件故障后,都能及時(shí)、簡(jiǎn)單的恢復(fù)系統(tǒng)運(yùn)行。一般此項(xiàng)步驟現(xiàn)在只需要花1到2小時(shí)即可完成。減少了停機(jī)時(shí)間,確保裝置穩(wěn)定。