李美威1 謝小鵬1 馮 偉 賀石中
(1.華南理工大學機械與汽車工程學院 廣東廣州 510640; 2.廣州機械科學研究院有限公司設備狀態(tài)檢測研究所 廣東廣州 510700)
在線油液監(jiān)測是指在設備不停機的情況下,通過各種在線傳感器對油液理化指標和鐵磁磨粒等進行實時監(jiān)測,根據監(jiān)測參數來判定設備的運行情況,并進行相應的故障診斷[1]。早期的異常檢測能夠避免更多的嚴重后果,保證系統(tǒng)性能和效率并減少維修費用。在整個在線監(jiān)測過程中,當系統(tǒng)嚴重偏離其正常情形時就會導致異常發(fā)生[2],異常檢測就是識別出監(jiān)測數據偏離正常情況的程度。對在線油液監(jiān)測數據進行趨勢分析和預測,以提前發(fā)現異常并報警,可有效避免故障發(fā)生。目前,常用的趨勢分析方法有回歸擬合、統(tǒng)計分析、支持向量機、時間序列分析、灰色理論和人工神經網絡等。趨勢預測的方法有很多,但是適用于油液監(jiān)測系統(tǒng)的較少[3]。
針對油液檢測特征的趨勢分析,國內外學者都展開了大量研究。林麗等人[4]基于油液在線監(jiān)測的磨粒信息對齒輪箱磨損狀態(tài)進行了診斷和預測。張紅和龔玉[5]以光譜分析為例,運用灰色理論對磨損趨勢進行了預測。高經緯等[6]對內燃機潤滑油中的各元素運用時序模型進行了趨勢分析,以判斷內燃機的磨損狀態(tài)。TOBON-MEJIA等[7]使用小波分解技術和基于高斯混合隱馬爾科夫來估計軸承的壽命。SOUALHI等[8]運用基于向量回歸機的方法對軸承進行了監(jiān)測分析。上述研究主要是通過離線油液分析或是對一個周期內某個特征進行實驗擬合分析再運用于在線,這往往需要大量的時間去收集足夠全面的數據,而且用某個周期內的特征變化代表所有情況是不準確的。
在線監(jiān)測數據往往是不平衡的,能監(jiān)測到的故障數據比正常數據通常要少得多,這使得許多傳統(tǒng)的診斷方法并不適用于這種問題[9]。而各種設備故障的發(fā)生往往會有一個潛在過程。針對在線數據的這些特點,本文作者對設備運行平穩(wěn)期的監(jiān)測數據構建ARMA模型,然后對整個時期的模型殘差進行分析,將監(jiān)測數據特征量在故障發(fā)生之前的一段時間內的殘差劃分為平穩(wěn)期和故障潛伏期,設定故障潛伏期殘差界限值,一旦殘差越界即可提前報警。
自回歸滑動平均(Auto Regression Moving Average,ARMA)模型是研究平穩(wěn)隨機過程的典型方法。ARMA模型認為一個時間序列的相互依存關系表現在原始數據的延續(xù)性上,在某時刻的值受到歷史值和噪聲的影響[10-11]。對于一個離散的時間序列{x1,x2,......,xn,......},ARMA數學模型表示為
xt=μ+φ1xt-1+φ2xt-2+......+φpxt-p+εt-
θ1εt-1-......-θqεt-q
(1)
式中:xt是當前值;μ是常數項;p和q是模型階數;φi和θi是模型參數;{εt}是白噪聲序列。
當q=0時,ARMA(p,q)模型就退化成自回歸AR(p)模型,即
xt=μ+φ1xt-1+φ2xt-2+......+φpxt-p+εt
(2)
當p=0時,ARMA(p,q)模型就退化成移動平均MA(q)模型,即
xt=μ+εt-θ1εt-1-......-θqεt-q
(3)
在使用ARMA(p,q)模型對時間序列進行擬合時,首先需要對時間序列進行平穩(wěn)非白噪聲檢驗。可使用單位根檢驗和Ljung-Box檢驗進行序列的平穩(wěn)非白噪聲檢驗。ADF檢驗通過檢驗序列中是否存在單位根來判斷序列的平穩(wěn)性[12],如果序列存在單位根則為非平穩(wěn)序列,否則就是平穩(wěn)序列。Ljung-Box是對時間序列是否存在滯后相關的一種檢驗方法[13],如果序列存在滯后相關則為非白噪聲序列,否則為白噪聲序列。
檢驗完序列為平穩(wěn)非白噪聲后,就可使用ARMA(p,q)模型進行分析。首先需要確定模型中的p和q值。ARMA(p,q)模型的階數主要是根據序列的自相關系數和偏自相關系數的拖尾性和截尾性來判斷。其對應的模型如表1所示。
表1 ARMA模型定階基本原則
確定模型階數后,估計模型中的參數。使用最小二乘估計法對模型參數進行估計[14],最小二乘法能充實使用序列值,精度較高。此時,記
a=(μ,φ1,φ2,......,φp,θ1,θ2,......,θq)T
(4)
Ft(a)=μ+φ1xt-1+φ2xt-2+......+φpxt-p-
θ1εt-1-......-θqεt-q
(5)
計算殘差:
εt=xt-Ft(a)
(6)
計算殘差平方和:
φpxt-p+θ1εt-1+......+θqεt-q)2
(7)
使式(7)達到最小的參數值a即為參數的估計值。由于白噪聲序列的值無法確定,所以需要運用迭代的方法進行計算。
在模型構建完成以后,就可以得到擬合殘差序列。如果殘差序列為白噪聲,則認為擬合模型充分提取了原始序列中的所有信息,這樣模型才顯著有效。所以需要使用Ljung-Box方法對殘差序列進行白噪聲檢驗以判斷模型的有效性。
在進行模型定階時只是主觀判斷相關系數的拖尾性和截尾性來確定p和q的值,但該模型不一定是最優(yōu)模型。選用最小信息量準則(Akaike Information Criterion,AIC)來進行模型優(yōu)化,AIC準則通過模型的似然函數值和參數個數來衡量模型的擬合效果[15],即
(8)
通過比較多個模型的AIC值,即可選取AIC最小的模型作為最優(yōu)模型。
K均值是一種聚類方法。對于一維K均值,其算法如下:
(1)隨機選取序列中的2個數作為初始中心點k1、k2;
(2)分別計算所有點到k1和k2的距離d1和d2,若d1≤d2,則記為1類,否則為2類;
(3)更新中心點,將所有1類點的均值賦給k1,所有2類點的均值賦給k2;
(4)重復步驟(2)、(3),直至k1和k2不再變化。
由于數據是一維時間序列,即可使用兩中心點的均值作為界限值,即
thresholdε=(k1+k2)/2
(9)
以某水電站水輪機組為研究對象,用實時獲取的推力油槽油液含水量進行模型驗證和分析。該機組安裝了廣研檢測的在線油液監(jiān)測儀,可實時采集機組油液的各項特征,采樣周期為1 h。該設備在運行過程中遭受了水污染,油液含水量大幅上升。水分會使油液乳化,降低油液黏度和油膜厚度,還會促使油品氧化,加速腐蝕,惡化油質,所以應保證油液中的含水量盡可能地低。文中選取一次含水量超標的數據作為樣本數據進行分析,總共454條數據,根據油液標準設定的含水量界限值為1×10-4(質量分數,下同),含水量實時趨勢如圖1所示。
圖1 原始數據時序Fig 1 Original time series
使用ADF檢驗序列平穩(wěn)性,其檢驗結果如表2所示。
表2 序列檢驗結果
表3 序列檢驗結果
2.2.2 模型定階與參數估計
圖2 序列自相關函數Fig 2 Time autocorrelation function (ACF)
圖3 序列偏相關函數Fig 3 Time partial autocorrelation function (ACF)
從圖2和圖3中可看出,其自相關表現出明顯的拖尾性,偏相關在9階之后取值均在置信區(qū)間內,可認為偏相關9階截尾,根據表1可判定為AR(9)模型。再分別對AR(7)、AR(8)、AR(9)、AR(10)、AR(11)進行分析,比較它們的AIC,選取最優(yōu)模型。5種模型的AIC值如表4所示。
表4 各模型的AIC值對比
從表4可知,AR(9)模型的AIC值最小,則選取AR(9)模型進行序列擬合,并運用最小二乘法對AR(9)模型進行參數估計,其參數估計結果如表5所示
表5 參數估計結果
則模型的表達式為
xt=26.288 9+0.639 8(xt-1-26.288 9)+
0.123 6(xt-2-26.288 9)-0.004 1(xt-3-26.288 9)-
0.020 6(xt-4-26.288 9)+0.003 8(xt-5-26.288 9)+
0.027 3(xt-6-26.288 9)+0.378 8(xt-7-26.288 9)-
0.243 5(xt-8-26.288 9)-0.160 6(xt-9-26.288 9)+
εt=6.716 8+0.639 8xt-1+0.123 6xt-2-0.004 1xt-3-
0.020 6xt-4+0.003 8xt-5+0.027 3xt-6+0.378 8xt-7-
0.243 5xt-8-0.160 6xt-9+εt
圖4 AR(9)模型擬合結果和原始數據比較Fig 4 Comparison of fitting results of AR(9) model and original data
2.2.3 模型檢驗
驗證擬合模型的殘差序列是否為白噪聲序列。同理,使用Ljung-Box檢驗方法對殘差序列的3、6、9期和12期滯后進行自相關分析,其結果如表6所示。
表6 殘差Ljung-Box檢驗結果
從表6中可知殘差序列的3、6、9和12期滯后的檢驗概率遠大于0.05,并且均接近于1,則可認為殘差序列為白噪聲序列,模型有效。
圖5 原始時間序列及其擬合結果Fig 5 Original time series and its fitting results
圖6 不同時期殘差統(tǒng)計直方圖Fig 6 Residual statistical histogram of different period
從圖6中可以看出,平穩(wěn)期殘差是一個白噪聲序列,大致符合正態(tài)分布。而故障潛伏期的殘差分布發(fā)生了較大變化,對故障潛伏期的殘差序列進一步分析劃分界限值。
圖7 原始序列報警示意圖Fig 7 Alarming schematic diagram of original time sequence
從圖7中可以看出,油液含水量的界限值為1×10-4, 2019年2月14日4∶22時的實測值為9.685×10-5,尚未達到報警界限值,而且此時下一步的預測值為7.83×10-5,也未達到報警界限值,即不會提前報警。只有在2019年2月14日5∶22時的實測值為1.157 2×10-4,超過報警界限值,系統(tǒng)及時報警。即在這種情況下,系統(tǒng)在測量值超過報警界限值時會及時報警,但無法提前報警。
圖8 殘差報警示意圖Fig 8 Alarming schematic diagram of residual
從圖8中可以看出,根據3sigma原則確定殘差界限值2.643×10-5,在2019年2月14日4∶22時的殘差值為2.987×10-5,超過殘差界限值,系統(tǒng)發(fā)出警報,即系統(tǒng)提前1 h發(fā)出警報。而根據K均值得到的界限值1.271×10-5,在2019年2月14日2∶22時的殘差值為1.877×10-5,超過殘差界限值,系統(tǒng)發(fā)出警報。相對于3sigma原則,使用K均值可在相同的采樣周期下大大增加提前報警的時間,而且報警時的含水量相對更小,可有效地防止設備故障發(fā)生和進一步惡化。
(1)利用ARMA模型對設備平穩(wěn)運行時期的在線油液監(jiān)測數據進行建模,利用該模型可及時掌握監(jiān)測特征量的變化趨勢,運用殘差來表示設備偏離平穩(wěn)狀態(tài)的程度。
(2)針對ARMA模型對非平穩(wěn)期的預測精度較低且只能進行一步預測的特點,利用模型擬合殘差判定設備處于正常期還是故障潛伏期,并通過K均值聚類將設備發(fā)生故障前的殘差進行二分類,將兩類中心點的均值作為正常期與故障潛伏期間的界限值。
(3)通過實際的監(jiān)測數據進行模型驗證和分析,結果表明,通過此方法可提前系統(tǒng)警報時間,有效控制油液監(jiān)測特征量的值并且防止設備故障發(fā)生。