數(shù)據(jù)中心在中國的發(fā)展尤為迅速,數(shù)據(jù)中心有著數(shù)據(jù)集中、綠色節(jié)能、安全可信、虛擬化和云計算等特點。然而數(shù)據(jù)中心的建設對動力電源等的設備要求較高,維護不易。一旦數(shù)據(jù)機房運行中斷,容易導致數(shù)據(jù)丟失、客戶不滿意和其他社會影響。圖1為福祿克朱華敏在論壇現(xiàn)場演講。
圖1 福祿克 朱華敏
數(shù)據(jù)中心等級的劃分都是和電源的冗余相關,因此等級越高的數(shù)據(jù)機房要求的不間斷工作的時間越長。對于A級和AA級的機房,容錯時間基本都是0ms。因此,對于數(shù)據(jù)機房的動力維護,我們需要從把設備用到壞才進行維修的被動式,升級到無論設備的實際狀況如何,都定期對機器進行維修或維護的預防性維護。相對于被動式維護,預防性維護雖然投入的人力更多,但是可避免50%的電氣故障。在預防性維護的基礎上,可以借助軟件進行數(shù)據(jù)分析,做到預測性維護,防范故障于未然。
整個機房動力設備主要有服務器和交換器等關鍵設備、監(jiān)控、變壓器、備用柴油發(fā)電機、UPS及其蓄電池、接地系統(tǒng)等等。我們需要預測性維護的關鍵設備是除了監(jiān)控和服務器等關鍵負載所有的電氣設備。如圖2為數(shù)據(jù)中心動力和環(huán)境設備。
圖2 數(shù)據(jù)中心動力和環(huán)境設備
所有電氣設備在發(fā)生隱患的初期,最容易表現(xiàn)的形式是發(fā)熱。我們可以從溫度和溫度差異來進行故障的識別。利用紅外熱成像儀快速定位故障,將熱信息瞬間可視化,并且在專業(yè)的分析軟件的幫助下,可進行深入分析,提高預測性維護效率 。
UPS是數(shù)據(jù)機房電源動力的核心。它的工作原理是把供電的交流電通過整流器轉(zhuǎn)化成直流,再由逆變器將直流轉(zhuǎn)化成交流。如果市電的供電有中斷,UPS就會從后備蓄電池汲取直流電,通過逆變器的轉(zhuǎn)化對關鍵負載進行供電。因此后備電池的維護也非常重要。如圖3為數(shù)據(jù)中心動力電源要求。
圖3 數(shù)據(jù)中心動力電源要求