李 佳
(新疆廣電傳輸網(wǎng)絡(luò)有限責任公司,烏魯木齊 830000)
隨著通信技術(shù)的迅猛發(fā)展,各運營企業(yè)要想在激烈的市場競爭中立足,除了有高水準的營銷策略和高質(zhì)量的窗口服務(wù),穩(wěn)定可靠的網(wǎng)絡(luò)運維體系更是有力的后方保障。通信設(shè)備傳輸速率從幾年前的155M、2.5G 發(fā)展到了10G 至100G,隨著承載業(yè)務(wù)的不斷增多,設(shè)備的穩(wěn)定工作顯得尤為重要。當設(shè)備溫度過高,內(nèi)部部分元器件的性能急劇劣化,可能導(dǎo)致業(yè)務(wù)板出現(xiàn)誤碼,甚至會使業(yè)務(wù)中斷。因此,設(shè)備散熱是我們在日常維護工作中不容忽視的部分。
華為傳輸設(shè)備均配備專用風機盒,風機盒內(nèi)風扇的作用是為子架散熱,使其可以在適宜溫度下正常高效的工作。風機盒的工作原理是:子架下方的風機盒采用吹風的方式,將外部的冷空氣吹入子架內(nèi)部。子架上方的風機盒采用吸風的方式,將子架內(nèi)部的熱空氣吸出子架。形成從下到上的風道。子架中的各類單板采用豎插的方式,與風道平行,這種設(shè)計保證了機架的進風和熱空氣的流通,起到很好的散熱作用。同時,OSN8800設(shè)備還為每個分區(qū)的風扇根據(jù)所在分區(qū)單板的溫度實現(xiàn)獨立智能調(diào)速。低于25℃以低速率運轉(zhuǎn);高于45℃以高速率運轉(zhuǎn);25℃~45℃之間智能調(diào)速,風機盒的防塵網(wǎng)可以直接拉出,方便清洗和維護。
設(shè)備的子架上下托盤、左右側(cè)板、前后蓋板全部采用導(dǎo)熱系數(shù)較高的鋁合金,在托盤表面對稱位置沖出相同的圓孔,保證氣流的暢通。機柜進、出風口在設(shè)計上保證機柜的進風和經(jīng)過單板后熱空氣的流通,機柜門板設(shè)計有小圓孔方便散熱。
在單板槽位分布中,發(fā)熱器件盡可能分散放置。發(fā)熱量較大的交叉板,設(shè)計槽位均在通風最好的9、10槽位。當業(yè)務(wù)較多、子架安裝板件比較密集時需要特別注意設(shè)備運行的溫度。
華為早期Metro 系列設(shè)備配有專用的PMU(電源和環(huán)境監(jiān)控板),能夠查詢當前設(shè)備的環(huán)境溫度數(shù)據(jù)。目前主用的華為3500、7500及8800設(shè)備上,已不配有專門的環(huán)境監(jiān)控板,但在重要單板中增加了溫度檢測的功能,可方便的查詢單板當前溫度。
當兩個風機盒的6個風扇有一個風扇壞掉時,設(shè)備可短期工作,但需盡快更換。當同一風機盒中兩個或以上風扇壞掉或兩個風機盒同時有一個或以上風扇壞掉時,必須立即更換風機盒。
外部環(huán)境變化對設(shè)備的穩(wěn)定運行也會影響很大。在0℃-40℃之間正常穩(wěn)定工作,但夏季氣溫常超過37℃,加上設(shè)備本身發(fā)熱,機房溫度會在40℃以上,因此機房必須配備制冷空調(diào)。冬季可根據(jù)機房溫度做適當?shù)恼{(diào)整。
除外部環(huán)境溫度外,在通風口處堆放跳纖、光衰、工具等雜物;防塵網(wǎng)清掃不及時、風扇故障、風道被堵等問題都可能造成設(shè)備運行溫度過高,引起板件出現(xiàn)溫度告警甚至出現(xiàn)傳輸誤碼和板件的損壞。
案例一:機房環(huán)境差、防塵網(wǎng)堵塞導(dǎo)致設(shè)備單板出現(xiàn)溫度超限告警。
故障現(xiàn)象:2019年7月,省干351-庫車站上報TEMP_OVER告警。
定位及處理:
步驟1:網(wǎng)管查詢告警的18-EFI 板性能值,查詢當前溫度49℃。步驟2:查詢子架其他單板工作溫度。8-ST2和6-OBU 當前溫度均為40℃左右,偏高??沙醪脚袛嗍菣C房溫度高或防塵網(wǎng)堵塞造成單板散熱不好出現(xiàn)告警。步驟3:機房查看發(fā)現(xiàn)內(nèi)部灰塵較大,散熱差導(dǎo)致單板工作溫度逐步升高,上報告警。對機房及設(shè)備除塵后,EFI 板告警結(jié)束,ST2板和OBU 板溫度降至27℃。
案列二:空調(diào)故障導(dǎo)致機房溫度高,業(yè)務(wù)板件誤碼增多。
故障現(xiàn)象:省干87-石河子站10-S16 板出現(xiàn)R_OOF 告警。同時,5-EGT2板出現(xiàn)B3_SD_VC3告警。
定位及處理:
步驟1:S16出現(xiàn)R_OOF 告警,EGT2出現(xiàn)誤碼告警,因沒有更高級別的R_LOS 告警且放大板光功率正常,排除線路故障原因。步驟2:查詢石河子站近期發(fā)生的告警及各單板性能值。經(jīng)查4月14日出現(xiàn)TEMP_ALARM 告警,查看發(fā)現(xiàn)機房空調(diào)出現(xiàn)故障,向廠家報修但備件未到貨時將機房窗戶打開,用臺式風扇臨時對設(shè)備降溫。4月16日再次出現(xiàn)TEMP_ALARM 告警,PMU 板溫度持續(xù)上升,EGT2板伴隨產(chǎn)生大量誤碼,因此判斷故障是由設(shè)備單板長時間運行在高溫下誤碼增多導(dǎo)致出現(xiàn)幀失步。步驟3:因連續(xù)2天開窗,機房灰塵較大,對設(shè)備防塵網(wǎng)、風扇以及子架內(nèi)部進行徹底的灰塵清理工作,并聯(lián)系廠家當日對空調(diào)進行維修后,所有告警結(jié)束。
(1)密切關(guān)注機房環(huán)境溫度變化。
(2)定期查看設(shè)備溫度情況。
(3)定期清理防塵網(wǎng),確保風扇工作正常。
日常維護中要努力保持機房的溫度、濕度和配備防塵、防靜電、防水設(shè)施。在問題出現(xiàn)時迅速地定位,解決,及時將故障處理在萌芽狀態(tài),降低業(yè)務(wù)中斷造成的經(jīng)濟損失和板件更換等維護費用。
注釋
①SDH:同步數(shù)字體系;DWDM:密集波分復(fù)用;OTN:光傳送網(wǎng)。
②FAN-FAIL:風扇失效或風扇電源未開。
③TEMP_OVER:溫度超限。
④B3_SD_VC3:VC3的B3誤碼超劣化門限。