[林勝龍]
動環(huán)監(jiān)控系統(tǒng)是電信通信系統(tǒng)及近年大量建設(shè)的互聯(lián)網(wǎng)數(shù)據(jù)中心極其重要的支撐系統(tǒng)。經(jīng)過30多年的發(fā)展,大大減輕動力維護(hù)人員的工作強(qiáng)度,提升業(yè)務(wù)效率。但經(jīng)過多年的建設(shè)和使用發(fā)現(xiàn)仍存在忽略的隱患及改善的問題。對這些問題的重視才能避免偶然性致命的故障。
電信機(jī)房除接入網(wǎng)設(shè)備間、無線基站外,監(jiān)控系統(tǒng)數(shù)據(jù)傳輸網(wǎng)絡(luò)已全面使用城域網(wǎng)傳輸。但在某些局站特別是偏遠(yuǎn)中小型局站,動環(huán)監(jiān)控傳輸網(wǎng)絡(luò)與營業(yè)廳或辦公網(wǎng)絡(luò)共用匯聚交換機(jī)。而部分匯聚交換機(jī)使用無保障的交流供電。在設(shè)計時未能考慮到一旦出現(xiàn)市電停電,發(fā)電機(jī)又無法及時自啟動時,通過此類型交換機(jī)接入的監(jiān)控系統(tǒng)將全面癱瘓。維護(hù)人員不能及時判斷監(jiān)控系統(tǒng)的通信故障是網(wǎng)絡(luò)故障引起的還是由于電力系統(tǒng)故障引起的。
在監(jiān)控系統(tǒng)規(guī)劃設(shè)計時,應(yīng)考慮監(jiān)控系統(tǒng)上聯(lián)接口應(yīng)接入到有電源保障、可靠性高的核心網(wǎng)絡(luò)設(shè)備中,且監(jiān)控系統(tǒng)其他網(wǎng)絡(luò)接入設(shè)備均應(yīng)使用UPS(Uninterruptible Power System,不間斷電源)保障或電池保障的直流設(shè)備供電。保證即使出現(xiàn)市電故障或電源設(shè)備故障,在故障初期能及時反映出現(xiàn)場的實(shí)際問題。改造方案如圖1所示,原有動環(huán)監(jiān)控交換機(jī)至接入交換機(jī)的虛線連接拆除,改為動環(huán)監(jiān)控系統(tǒng)交換機(jī)到匯聚交換機(jī)的實(shí)現(xiàn)。
圖1 動環(huán)監(jiān)控系統(tǒng)網(wǎng)絡(luò)改造圖
在建設(shè)動環(huán)監(jiān)控系統(tǒng)時,監(jiān)控系統(tǒng)自身的電源均來自UPS或高頻開關(guān)電源。在大型的通信局站或IDC(Internet Data Center,互聯(lián)網(wǎng)數(shù)據(jù)中心),由于規(guī)模較大建設(shè)周期長,設(shè)備分批投入使用。監(jiān)控系統(tǒng)亦隨著被監(jiān)控設(shè)備的增加而不斷擴(kuò)大,監(jiān)控采集設(shè)備也增多。因?yàn)榻ㄔO(shè)時間的差異及工程項目大小不同。在設(shè)計上容易忽略或缺失監(jiān)控電源容量的考慮。監(jiān)控施工單位往往就近接入原有的監(jiān)控設(shè)備電源,從而形成整個監(jiān)控系統(tǒng)通過單一的總電源獲取電能。隨著監(jiān)控設(shè)備增多,設(shè)備老化,容易出現(xiàn)單點(diǎn)故障,最終整個監(jiān)控系統(tǒng)因?yàn)槟硞€設(shè)備故障而崩潰。改造前監(jiān)控系統(tǒng)供電方案如圖2所示。
圖2 單一供電的動環(huán)監(jiān)控系統(tǒng)
針對這個問題,在規(guī)劃監(jiān)控系統(tǒng)時應(yīng)作出安排。現(xiàn)在通信電源系統(tǒng)已采用分散供電為主。一個局站已具有多套電源系統(tǒng)。在進(jìn)行配套電源系統(tǒng)監(jiān)控接入時,亦應(yīng)當(dāng)增加監(jiān)控系統(tǒng)的電源分布,使監(jiān)控系統(tǒng)形成多個供電點(diǎn),減少各個監(jiān)控子系統(tǒng)的范圍,從而減少監(jiān)控系統(tǒng)掉電的風(fēng)險范圍。改造后供電方案如圖3所示。
此外動環(huán)監(jiān)控系統(tǒng)十分重要的監(jiān)測設(shè)備是低壓設(shè)備,特別是市電進(jìn)線系統(tǒng)。近年來低壓配電設(shè)備均配備智能電量儀表(簡稱智能電表)提供給監(jiān)控系統(tǒng)獲取市電數(shù)據(jù)。而設(shè)計監(jiān)控系統(tǒng)時,忽略了一個因素。大部分智能電表取電來自監(jiān)測的市電。當(dāng)市電掉電時,智能電表也因此失電而無法工作。對監(jiān)控系統(tǒng)而言只能監(jiān)測到智能電表通信故障,而不是直接的市電的電量信息。同樣柴油發(fā)電機(jī)的低壓配電柜也存在類似問題。
圖3 分散供電的動環(huán)監(jiān)控系統(tǒng)
對于智能電表的上述問題,應(yīng)從智能電表電源入手。對于重要或全部的智能電表供電應(yīng)來自有保障的監(jiān)控系統(tǒng)電源。即使在設(shè)備電源關(guān)閉或不工作時,監(jiān)控系統(tǒng)仍能監(jiān)測當(dāng)時的電量數(shù)據(jù)。
設(shè)備的數(shù)量亦隨之大幅增加,監(jiān)控系統(tǒng)的測點(diǎn)數(shù)量也大幅增加。監(jiān)控系統(tǒng)并發(fā)處理告警的能力是否足夠,對監(jiān)控系統(tǒng)在關(guān)鍵時刻運(yùn)行有很大影響。如遇到極端氣候?qū)е麓竺娣e停電,單一局站或區(qū)域并發(fā)數(shù)千條告警時,系統(tǒng)告警判別能力,上報時間是否及時,是否出現(xiàn)遺留和延誤都需要在設(shè)計時考慮及投入使用前測試確認(rèn)。
在建設(shè)監(jiān)控系統(tǒng)選擇監(jiān)控系統(tǒng)供應(yīng)商時,應(yīng)考慮根據(jù)其網(wǎng)絡(luò)及軟件架構(gòu),內(nèi)部數(shù)據(jù)處理方式,判斷其提供的監(jiān)控軟件和架構(gòu)是否具有大規(guī)模并發(fā)告警的處理能力,并在驗(yàn)收時通過模擬進(jìn)行測試確認(rèn)。大規(guī)模并發(fā)告警不常見,但一旦出現(xiàn)如系統(tǒng)能力不足將直接導(dǎo)致系統(tǒng)癱瘓。
隨著企業(yè)的減員增效,人員壓縮、運(yùn)維制度的改變導(dǎo)致同一機(jī)房存在不同管理人員的情況。目前監(jiān)控系統(tǒng)難于分離出不同維護(hù)單位的數(shù)據(jù)。同時,維護(hù)和管理體系中的人員也有各自的數(shù)據(jù)需求。維護(hù)人員更關(guān)心設(shè)備運(yùn)行的實(shí)時數(shù)據(jù)、狀態(tài)和告警等信息。管理人員更著重設(shè)備的容量、負(fù)荷、資源和系統(tǒng)的趨勢信息。
如果監(jiān)控軟件平臺使用監(jiān)控數(shù)據(jù)與用戶前端界面無需緊密關(guān)聯(lián)的方式。用戶前端界面可以根據(jù)業(yè)務(wù)需求和人員需求進(jìn)行設(shè)備的選擇配置。靈活地配置出不同人員終端監(jiān)控不同的設(shè)備數(shù)據(jù)。
一般監(jiān)控系統(tǒng)以動環(huán)設(shè)備方式顯示運(yùn)行數(shù)據(jù),未能顯示出設(shè)備間的關(guān)系及層次影響關(guān)系。需要使用人員對現(xiàn)場設(shè)備和環(huán)境比較熟悉。但作為軟件系統(tǒng)如果能減少使用人員分析的時間,從而縮短故障處理的時間,可以提高系統(tǒng)的利用價值。
監(jiān)控系統(tǒng)應(yīng)可以根據(jù)需求切換不同的應(yīng)用界面,如告警出來時可提供供電拓?fù)鋱D有助維護(hù)人員評估當(dāng)前設(shè)備故障影響的范圍并選擇適當(dāng)?shù)膫溆梅桨附鉀Q問題。后續(xù)透過切換設(shè)備詳細(xì)測點(diǎn)分析及定位問題設(shè)備的故障原因。
無論IDC機(jī)房或傳統(tǒng)機(jī)房都會經(jīng)常性的對設(shè)備進(jìn)行保養(yǎng)、維護(hù)、維修、工程改造等各種固定的或臨時性的設(shè)備關(guān)停。如中央空調(diào)系統(tǒng)、柴油發(fā)電機(jī)組機(jī)油更換、電池更換、UPS或直流電源電池充放電測試、高低壓設(shè)備維護(hù)等。在進(jìn)行這方面操作時,難免會觸發(fā)監(jiān)控系統(tǒng)的告警。為避免因?yàn)榫S護(hù)或工程原因帶來的告警影響正常設(shè)備的監(jiān)控,監(jiān)控軟件應(yīng)實(shí)現(xiàn)在維護(hù)或工程狀態(tài)的設(shè)備快速屏蔽。并且對已屏蔽設(shè)備,有故障設(shè)備,正常通信的設(shè)備應(yīng)能有所區(qū)別顯示。此外已屏蔽告警的設(shè)備應(yīng)有時間段設(shè)置,避免脫離維護(hù)或工程狀態(tài)的設(shè)備長期處于屏蔽狀態(tài)而脫離監(jiān)控保護(hù)。
隨著電信企業(yè)對通信機(jī)房及設(shè)備節(jié)能越來越重視,早期建設(shè)的監(jiān)控系統(tǒng)更著重采集被監(jiān)測設(shè)備的運(yùn)行狀態(tài)和數(shù)據(jù)的采集,而忽視設(shè)備能耗的數(shù)據(jù)采集。到現(xiàn)在增加節(jié)能系統(tǒng)需采集電能數(shù)據(jù)時,由于動環(huán)系統(tǒng)或設(shè)備未在新建時加裝智能電表,設(shè)備投入使用后加裝智能電表往往需要停電才能實(shí)現(xiàn),給在用設(shè)備帶來風(fēng)險。特別時IDC機(jī)房,由于用戶不同或重要程度不用,服務(wù)器設(shè)備不是所有設(shè)備都是雙電源保障。即使配備裝電源設(shè)備,客戶亦不輕易容許任何一路電源斷電。為改造帶來困難。
在新建機(jī)房時,考慮節(jié)能系統(tǒng)需要,中央空調(diào)主機(jī)、各類水泵、水塔、風(fēng)機(jī)、精密空調(diào)、機(jī)房IT用電的配電柜配備電能計量功能的智能電表。同時為方便維護(hù)及維修。對智能電表的操作或更換應(yīng)無需斷開配電開關(guān)即可操作。另一方面目前IDC建設(shè)亦重視PUE值的計算,各系統(tǒng)的智能電表測量令系統(tǒng)PUE值的計算更準(zhǔn)確。
節(jié)能系統(tǒng)對中央空調(diào)運(yùn)行數(shù)據(jù)采樣其中一項是要采集中央空調(diào)中的水流量數(shù)據(jù)。該數(shù)據(jù)在原有動環(huán)監(jiān)控系統(tǒng)中極少進(jìn)行采樣,即使是中央空調(diào)主機(jī)設(shè)備廠家也很少能提供。因?yàn)樵黾铀髁繖z測數(shù)據(jù)往往需要對水管進(jìn)行破壞性加裝傳感器,即使使用超聲波的水流量傳感器也因?yàn)閮r格高昂,而且不破壞水管也要破壞水管的保溫層而難于實(shí)施。所以在新建中央空調(diào)系統(tǒng)時需將水量流量檢測納入監(jiān)控系統(tǒng)采樣清單中。
對節(jié)能系統(tǒng)來說,高耗電的設(shè)備主要是空調(diào)設(shè)備,要實(shí)現(xiàn)節(jié)能又要保障機(jī)房溫度在合適范圍內(nèi),這就要求業(yè)務(wù)機(jī)房安裝溫濕度監(jiān)控設(shè)備應(yīng)在兼顧性能和造價基礎(chǔ)上確定安裝位置和數(shù)量。為提高機(jī)房送冷的效率,目前業(yè)務(wù)機(jī)房已大量使用冷熱通道封閉系統(tǒng)。溫濕度監(jiān)測設(shè)備應(yīng)均勻分布,高效地實(shí)現(xiàn)接近實(shí)際的空間溫度采樣。
動環(huán)監(jiān)控系統(tǒng)從最初的實(shí)現(xiàn)動力設(shè)備運(yùn)行監(jiān)控、環(huán)境監(jiān)控功能,逐步趨向附加更多的增值功能。利用過動環(huán)監(jiān)控網(wǎng)絡(luò)及數(shù)據(jù)采樣,實(shí)現(xiàn)節(jié)能、設(shè)備的資源管理、監(jiān)控數(shù)據(jù)分發(fā)。從單一的設(shè)備監(jiān)控,向智能設(shè)備巡檢,立體化展示、監(jiān)控數(shù)據(jù)的大數(shù)據(jù)分析、專家系統(tǒng)故障分析方向發(fā)展。所有這些增值功能都需要建立在前端數(shù)據(jù)采集完備,準(zhǔn)確的基礎(chǔ)上。在動環(huán)監(jiān)控系統(tǒng)規(guī)劃建設(shè)時,應(yīng)根據(jù)未來的這些功能需求特點(diǎn),做好設(shè)計規(guī)劃。在當(dāng)前資金受限時,需要考慮未來增加功能時預(yù)留接口,能快速簡便的實(shí)現(xiàn)。
特別是監(jiān)控軟件方面,現(xiàn)場維護(hù)人員與管理人員的需求同時兼顧好?,F(xiàn)場維護(hù)人員更希望直觀快捷的定位問題所在,最好能提供問題的原因和解決方法。管理人員則希望了解設(shè)備總體運(yùn)行情況,掌握設(shè)備的利用率,設(shè)備資源情況,維護(hù)人員處理故障的效率考核等。另一方面如IDC使用服務(wù)的用戶也會有獲取租用機(jī)房或機(jī)柜的設(shè)備環(huán)境運(yùn)行情況的需求。監(jiān)控軟件系統(tǒng)設(shè)計時應(yīng)考慮提供靈活的軟件接口實(shí)現(xiàn)數(shù)據(jù)的分發(fā),又要保證系統(tǒng)的效率和安全。
電信企業(yè)除了功能需求外,系統(tǒng)投資方面也提出了越來越高的要求。如何經(jīng)濟(jì)地投入實(shí)現(xiàn)最多的功能,避免重復(fù)的設(shè)備投入也是在規(guī)劃時統(tǒng)籌考慮的。各動力系統(tǒng)設(shè)計時都獨(dú)立的進(jìn)行,而動環(huán)監(jiān)控時貫穿在各個系統(tǒng)之間的,在設(shè)計時考慮監(jiān)控接入問題對節(jié)約投資是大又可為的。如配電柜哪些必須采用智能電表,哪些可以采集機(jī)械電表等最大節(jié)約投資及減少后期改造式的投入。