李茜
山西陽(yáng)泉升華通信技術(shù)有限公司, 山西 陽(yáng)泉 045000
我在單位主要負(fù)責(zé)EWSD交換機(jī)的運(yùn)行維護(hù),故障處理。工作近二十年來(lái),從1994年8月開通的全國(guó)首家專網(wǎng)六千門EWSD程控交換機(jī)到現(xiàn)在發(fā)展成五萬(wàn)余門的規(guī)模,設(shè)備第一次出現(xiàn)雙側(cè)硬盤均UNA的嚴(yán)重情況,相對(duì)來(lái)說(shuō)比較重視。特認(rèn)真分析,仔細(xì)研究,寫成論文,以便今后更好地管理維護(hù),保證交換機(jī)安全、可靠、穩(wěn)定運(yùn)行。
2006年7月22日,我局所屬703分局突然出現(xiàn)AIC-0告警,即風(fēng)扇告警。由于當(dāng)時(shí)我離告警現(xiàn)場(chǎng)較遠(yuǎn),只好電話通知就近的非維護(hù)人員看了一下程控機(jī)房的空調(diào)及CP113C機(jī)柜的風(fēng)扇。但未看出什么問題,空調(diào)未停,機(jī)柜風(fēng)扇也轉(zhuǎn)。我有些奇怪,以前遇見的風(fēng)扇告警都是停電告警,通電告警自動(dòng)消除。這次是?急急忙忙往告警地點(diǎn)趕。沒想到人未到,故障繼續(xù)升級(jí)惡化,具體告警內(nèi)容顯示如下:
表明1側(cè)硬盤已退出服務(wù),于是采取相應(yīng)動(dòng)作,試圖激活該側(cè)硬盤,但不成功。此時(shí),0側(cè)硬盤也出現(xiàn)告警,雙硬盤故障產(chǎn)生!告警消息如下:
通過以上報(bào)告,可以得出結(jié)論:1側(cè)硬盤及其上級(jí)單元IOC-1均UNA,因此決定先激活0側(cè)硬盤,并嚴(yán)格按照雙硬盤故障處理流程操作,命令如下:
交換機(jī)隨后提示如下消息:
根據(jù)操作流程,決定執(zhí)行第三條命令CONTMDDACT;
意思是在雙側(cè)硬盤均UNA的情況下,`用文件控制處理機(jī)去重新激活。命令執(zhí)行.
接著UPDGEN; 命令接受。52秒后命令執(zhí)行。
該命令為的是在硬盤上恢復(fù)一個(gè)可執(zhí)行的GEN,繼續(xù)系統(tǒng)的操作。這條命令可被用來(lái)在硬盤故障調(diào)試程序期間保存非永久性數(shù)據(jù)。
此時(shí)全部電話正常,都能打出去了。系統(tǒng)已從雙硬盤故障中恢復(fù),接下來(lái)要檢查相應(yīng)數(shù)據(jù)。
2.1 此次故障原因是703局停電,交換機(jī)靠蓄電池供電,幾乎快放空所致。在這個(gè)過程中,風(fēng)扇是一個(gè)一個(gè)往下掉電,而且是首先告警,然后是MDD1側(cè)和0側(cè)。我讓非維護(hù)人員看空調(diào)和風(fēng)扇,那時(shí)設(shè)備已來(lái)電,但硬盤均UNA。不到現(xiàn)場(chǎng)輸命令,設(shè)備不能自動(dòng)恢復(fù)。還算發(fā)現(xiàn)的及時(shí),否則,后果不堪設(shè)想。再拖延一段時(shí)間,那就會(huì)造成話費(fèi)丟失的重大故障。這就要求我們維護(hù)人員一定要及時(shí)迅速處理故障,勿因小失大。
2.2 事后,我仔細(xì)看了OMT上的自動(dòng)輸出報(bào)告發(fā)現(xiàn):其實(shí)在13:59時(shí)已有POWER FAILURE的告警自動(dòng)提示。說(shuō)明EWSD交換機(jī)軟件系統(tǒng)對(duì)此早有考慮。告警很準(zhǔn)確,很到位。是很成熟的產(chǎn)品。機(jī)房的技術(shù)資料中也有這類描述。平日多翻翻,積少成多,天長(zhǎng)日久,維護(hù)水平才會(huì)不斷提高。
2.3 程控交換機(jī)告警的同時(shí),703局ADSL設(shè)備也同樣有故障,上不了網(wǎng)。一般來(lái)說(shuō),它們之間互不影響。有經(jīng)驗(yàn)的技術(shù)人員應(yīng)馬上懷疑到它們的共性:電源問題!