伍盛達(dá), 田宇
(工業(yè)和信息化部電子第五研究所, 廣東 廣州 511370)
預(yù)測性維護(hù)是指通過各種技術(shù)手段進(jìn)行數(shù)據(jù)和信號的采集、 分析, 同時(shí)結(jié)合設(shè)備運(yùn)行的壽命期統(tǒng)計(jì)規(guī)律或歷史數(shù)據(jù), 預(yù)測可能的后果, 提前采取有針對性的維護(hù)活動(dòng)[1]。 得益于無損檢測、 智能監(jiān)控和工業(yè)物聯(lián)網(wǎng)等技術(shù)的發(fā)展, 數(shù)據(jù)中心積累了大量的設(shè)備運(yùn)行參數(shù)、 環(huán)境參數(shù)等監(jiān)測指標(biāo), 為預(yù)測性維護(hù)提供了良好的基礎(chǔ)。
設(shè)備溫度是預(yù)測性維護(hù)中重點(diǎn)關(guān)注的指標(biāo)之一。 溫度異常經(jīng)常是通信機(jī)房設(shè)備存在隱患的前兆[2]。 紅外熱成像技術(shù)作為一種非接觸、 無損的溫度檢測手段, 如何應(yīng)用到數(shù)據(jù)中心預(yù)測性維護(hù)中, 值得我們探討。
應(yīng)用紅外熱成像技術(shù)的預(yù)測性維護(hù)流程圖如圖1 所示。 根據(jù)設(shè)備的使用壽命規(guī)律和歷史數(shù)據(jù)來制定預(yù)測性維護(hù)策略, 通過數(shù)據(jù)采集篩選, 最終形成歷史數(shù)據(jù)庫。 根據(jù)決策判斷方法及模型標(biāo)準(zhǔn), 結(jié)合歷史數(shù)據(jù)對采集結(jié)果進(jìn)行對比分析, 若出現(xiàn)異常值, 則進(jìn)行原因查找并修復(fù), 修復(fù)后進(jìn)行數(shù)據(jù)復(fù)測并重新錄入歷史數(shù)據(jù)庫進(jìn)行對比; 若無異常值, 當(dāng)次檢測完成, 根據(jù)檢測數(shù)據(jù)重新制定預(yù)測性維護(hù)策略。
圖1 應(yīng)用紅外熱成像技術(shù)的預(yù)測性維護(hù)流程圖
預(yù)測性維護(hù)策略包括維護(hù)范圍、 維護(hù)頻次和更新策略等。
根據(jù)紅外熱成像技術(shù)的特點(diǎn), 將維護(hù)范圍規(guī)定為電纜、 母排、 接線端子和斷路器等電氣元件。
在設(shè)備投入使用的早期, 其失效率較高, 隨著時(shí)間的延續(xù)呈逐步下降趨勢[3]。 這一時(shí)期被稱為早期失效期。 因此, 在設(shè)備施工調(diào)試后正式投入使用前需進(jìn)行預(yù)測性維護(hù), 并且在額定滿負(fù)荷狀態(tài)下測量電氣元件的溫度并采集相關(guān)數(shù)據(jù)。 在設(shè)備投入使用的首年, 預(yù)測性維護(hù)頻率為每季度一次。 若一年內(nèi), 檢測數(shù)據(jù)符合要求且無明顯的變化, 則可判斷設(shè)備進(jìn)入恒定失效率期。 在此期間, 應(yīng)以半年一次的頻率檢測電氣元件的溫度。 當(dāng)設(shè)備運(yùn)行時(shí)間接近壽命限期或從數(shù)據(jù)分析中發(fā)現(xiàn)劣化趨勢, 可判斷它已進(jìn)入耗損失效期, 預(yù)測性維護(hù)頻率應(yīng)加大到每季度一次。
對于超期使用的設(shè)備, 預(yù)測性維護(hù)頻率應(yīng)加大到每月一次, 若溫度指標(biāo)無異常, 經(jīng)維護(hù)審批部門對其維護(hù)成本、 更換成本和使用價(jià)值評估后可決定是否繼續(xù)使用。 對于溫度指標(biāo)異常的設(shè)備應(yīng)進(jìn)行修復(fù)或更換。
數(shù)據(jù)采集可通過在線監(jiān)測及離線檢測兩種手段完成。 檢測過程中, 要注意排除人體熱輻射、 陽光、 運(yùn)行指示燈或熒光燈等干擾。 當(dāng)發(fā)現(xiàn)異常熱點(diǎn)時(shí), 應(yīng)確定紅外發(fā)射率已根據(jù)熱點(diǎn)位置的材料進(jìn)行合理設(shè)置, 并以不同的角度反復(fù)掃描, 排除外部熱反射引入的干擾。
數(shù)據(jù)采集完成后, 存入歷史數(shù)據(jù)庫進(jìn)行歸檔, 用于后續(xù)的判斷分析中。 歸檔數(shù)據(jù)應(yīng)包含采集日期、 被測元件位置、 電流、 環(huán)境溫度和熱像圖等信息。 必要時(shí)還可以添加更詳細(xì)的描述, 如設(shè)備(元件) 的額定電流、電流諧波、 紅外發(fā)射率和外部影響因素等內(nèi)容, 使分析的原材料更豐富和詳實(shí), 提高決策判斷的可信度。
決策判斷方法主要有3 種, 分別是表面溫度判斷法、 同類比較法和歷史比較法。 判斷輸出結(jié)果有4 種情況, 分別為正常、 一般缺陷、 嚴(yán)重缺陷和緊急缺陷。 為了方便判斷分析, 下文提供了各種方法的數(shù)學(xué)模型, 并規(guī)定正常、 一般缺陷、 嚴(yán)重缺陷和緊急缺陷4 種情況分別對應(yīng)數(shù)字0、 1、 2 和3。
a) 表面溫度判斷法
將紅外熱成像儀測得的電氣元件表面溫度與溫度限值進(jìn)行比較判斷。 對于實(shí)際的運(yùn)行負(fù)荷電流為額定電流或接近額定電流時(shí), 判斷結(jié)果的可信度較高。 因此, 在早期失效期內(nèi)進(jìn)行滿載壓力檢測時(shí),優(yōu)先采用此方法進(jìn)行判斷。 表面溫度判斷法的模型如下:
式(1) 中: t——電氣元件最熱點(diǎn)的溫度;
T1, T2——溫度限值。
T1, T2的具體取值如表1 所示。
表1 T1、 T2 具體的取值表 [4]
b) 同類比較法
在同一電氣回路中, 當(dāng)三相電流對稱和三相(或兩相) 設(shè)備相同時(shí), 比較三相(或兩相) 電流致熱型設(shè)備對應(yīng)部位的溫升值, 判斷設(shè)備是否正常。 若三相設(shè)備同時(shí)出現(xiàn)異常, 可與同回路的同類設(shè)備比較[5]。 此外, 還應(yīng)引入溫升限值作為判斷依據(jù)。 同類比較法的模型如下:
式(2) 中: t——電氣元件最熱點(diǎn)的溫度;
δ——被測點(diǎn)與同類點(diǎn)的相對溫差;
T1——溫度限值。
T1的具體取值如表2 所示。
表2 T1 的具體取值表
c) 歷史數(shù)據(jù)比較法
將紅外熱成像儀測得的電氣元件表面溫度與歷史數(shù)據(jù)進(jìn)行比較。 綜合分析負(fù)荷電流、 環(huán)境溫度、圖像特征和變化趨勢等因素, 得出判斷結(jié)果。 在歷史數(shù)據(jù)存量較少無法擬合趨勢線的情況下, 可僅與前次的數(shù)據(jù)進(jìn)行比較; 在兩次的負(fù)載電流及環(huán)境溫度相近時(shí), 其模型如下:
式(3) 中: δ——本次檢測值與上次檢測值的相對溫差。
數(shù)據(jù)中心中電氣元件的異常熱點(diǎn)以電流致熱型為主。 溫度異常原因有接觸不良, 電纜松股、 斷股、 老化和設(shè)計(jì)容量不足等, 可根據(jù)各種缺陷的典型熱像圖進(jìn)行分析。
根據(jù)缺陷的嚴(yán)重程度制定相應(yīng)的修復(fù)策略。 對于一般缺陷, 可利用停電維護(hù)的機(jī)會, 有計(jì)劃地安排修復(fù)工作, 消除缺陷; 對于嚴(yán)重缺陷, 宜在一周內(nèi)進(jìn)行修復(fù); 對于緊急缺陷, 應(yīng)立即進(jìn)行修復(fù)。
以華南某大型數(shù)據(jù)中心為例做分析。
首先, 制定初次預(yù)測性維護(hù)策略。 規(guī)定本次預(yù)測性維護(hù)的范圍為變壓器出線柜、 ATS 柜、 饋線柜、 UPS 輸入柜、 輸出柜和動(dòng)力配電柜內(nèi)的電氣元件。 經(jīng)統(tǒng)計(jì), 設(shè)備已運(yùn)行8 年, 而交直流配電設(shè)備的平均壽命約15 年。 根據(jù)全生命周期失效率變化規(guī)律, 可知設(shè)備處于恒定失效率期。 預(yù)測性維護(hù)頻率為半年一次。
采集配電房溫度及流過各個(gè)電氣元件的電流參數(shù)及紅外熱成像儀的檢測結(jié)果存入歷史數(shù)據(jù)庫。 例如: 3-2UP6 B 相銅排存入以下要素, 如圖2 所示。
圖2 歷史數(shù)據(jù)要素
由于此次是初次預(yù)測性維護(hù), 缺乏歷史數(shù)據(jù),因此, 只采用表面溫度判斷法和同類比較法進(jìn)行分析, 過程中發(fā)現(xiàn)兩處缺陷。
如圖3 所示, 3 # 電抗器的最熱電溫度為134.1 ℃, 可直接采用表面溫度判斷法進(jìn)行判斷。根據(jù)式(1) 及表1 判斷該處存在緊急缺陷。 如圖4所示, A 相最熱電為34.8 ℃, 雖然熱點(diǎn)溫度未超過限值, 但溫度高于其余兩相。 因此, 選擇同類比較法進(jìn)行分析。 通過DCIM 平臺參數(shù)采集可知, 環(huán)境溫度為22.6 ℃, A 相電流為122.6 A, B 相電流為120.1 A, C 相電流為118.2 A, 三相電流接近。通過紅外熱成像儀檢測得出B、 C 相的最熱電溫度分別為25.6、 25.2 ℃。 計(jì)算得到A 相熱點(diǎn)相對B相熱點(diǎn)的相對溫差δ 為307%。 根據(jù)式(2) 及表2判斷該處存在嚴(yán)重的缺陷。
圖3 -1F P12 配電柜3 #電抗器熱像圖
圖4 3-1UP1 A 相銅排熱像圖
如圖3 所示, 電抗器與外部電氣接線的連接處為最熱點(diǎn), 溫度以接頭為中心向四周快速地遞減,因此推斷缺陷原因可能為接頭老化或接觸不良。 立即啟動(dòng)緊急缺陷響應(yīng)措施, 更換電抗器接頭, 復(fù)測后溫度恢復(fù)正常。 如圖4 所示, 熱像以銅排連接處螺栓為中心緩慢地向四周擴(kuò)散, 因此可推斷缺陷原因可能為連接螺栓松動(dòng)。 并在兩周后完成了螺栓緊固工作, 溫度恢復(fù)正常。
實(shí)踐表明, 通過紅外熱成像數(shù)據(jù)采集, 合理地選取決策判斷模型進(jìn)行分析, 能有效地發(fā)現(xiàn)缺陷,消除隱患, 對數(shù)據(jù)中心的安全可靠運(yùn)行起到積極的效果。
紅外熱成像技術(shù)在數(shù)據(jù)中心預(yù)測性維護(hù)應(yīng)用中的難點(diǎn)在于決策分析, 因?yàn)檫@不僅涉及大量的數(shù)據(jù)統(tǒng)計(jì)比對, 還涉及圖像特征的判斷。 當(dāng)前, 對紅外熱像的特征判斷還停留在人工階段。 如何利用圖像識別技術(shù)進(jìn)行圖像特征智能識別, 提高判斷效率及準(zhǔn)確性。 這一課題值得我們研究探討。