李玉吉,曹旭輝,王江宏,趙 欣
(陜西國防工業(yè)職業(yè)技術學院,陜西 西安 710300)
煤炭是我國當前較為重要的資源之一[1],能夠順利進行煤礦生產(chǎn),是現(xiàn)階段社會中所要研究的關鍵方向[2]。順利運行的煤礦汽車機械設備能夠使為煤炭生產(chǎn)提供重要保障,并且是煤炭企業(yè)的核心技術[3]。在煤炭生產(chǎn)環(huán)節(jié),生產(chǎn)環(huán)境較為惡劣[4],煤礦汽車機械設備的安全性能也時常無法保障,因此,通過有效方式保障煤礦汽車機械設備的順利運行[5-6],能夠順利提升煤炭生產(chǎn)的質(zhì)量。許多學者對檢測故障問題進行研究,如徐青青等[7]研究診斷煤礦機械軸承故障方法,劉永亮[8]研究診斷煤礦機械齒輪箱故障方法,但當故障發(fā)生率較高時,依然存在泛化錯誤等問題,并且隨著故障的增加還會發(fā)生檢測精度降低等事件。低秩鑒別投影算法能夠有效判別結(jié)構,還能有效進行泛化,采用低秩鑒別投影算法,能夠有效提取故障特征[9]。神經(jīng)網(wǎng)絡方法能夠基于人腦的思維想法,診斷噪聲較強等存在問題的信息[10-11]。因此本文設計基于機器學習算法的煤礦汽車機械設備故障診斷模型,通過低秩鑒別投影算法提取故障特征,再根據(jù)特征,采用ART神經(jīng)網(wǎng)絡學習算法進行故障診斷。
采用基于低秩鑒別投影算法,提取煤礦汽車機械設備故障特征,該算法判別結(jié)構描述功能較強,并且還擁有全局資源描述功能,可以改善新樣本的提取速度[12],獲取明顯的投影矩陣。
1.1.1 低秩鑒別投影算法
該算法的主要過程是:首先獲取低秩表示模型的系數(shù)矩陣L,并將其劃分為噪聲、類內(nèi)、類間,并使類間與類內(nèi)散度分別保持夠大以及夠小,之后賦予經(jīng)線性投影資源恒定的低秩結(jié)構,并維持較強的數(shù)據(jù)低維空間聚類能力[13]。通過L表示系數(shù)矩陣,由式(1)描述低秩表示模型:
(1)
式中,λ>0;E為噪聲;E2,1為l2,1范數(shù),其定義了噪聲的規(guī)范。
(2)
若低秩矩陣經(jīng)式(3)變化后未發(fā)生改變:
y=PT
(3)
式中,P為投影矩陣。
yi,j的計算公式為:
(4)
(5)
同時,依據(jù)式(6)表示類間散度:
(6)
為達到資源劃分合理,同時投影后噪聲保持最低,所以需要最小化PTei,j的范數(shù),計算公式為:
(7)
通過式(8)判斷最優(yōu)投影的過程:
(8)
式中,類內(nèi)與噪聲散度被r所維持。
1.1.2 低秩鑒別投影算法步驟
(1)以數(shù)據(jù)集X為基礎,定義其為c類,求出最優(yōu)相似矩陣L,對L的獲取采用非精確增廣拉格朗日乘子法。
ART神經(jīng)網(wǎng)絡是由兩層神經(jīng)元構成,分別是比較層與識別層,其通過識別層中的一個單一神經(jīng)元進行類別判決。并且能夠在線學習,自適應性較好。通過什么方式解決逐步削弱神經(jīng)網(wǎng)絡的學習率和鄰域,對于學習的聚類精度和收斂速度非常重要,因此通過墨西哥草帽函數(shù)改進ART神經(jīng)網(wǎng)絡學習算法。通過逐漸削弱冪函數(shù),可以提升收斂效果,提供較好的聚類條件,因此,通過式(9)削弱學習速率η:
(9)
式中,a1通常值為0.05。
鄰域函數(shù)通過墨西哥草帽函數(shù)描述,在鄰域中,獲勝神經(jīng)元和內(nèi)神經(jīng)元i的間距與側(cè)反饋的強度存在關系,具體為:
(10)
式中,rij為競爭層神經(jīng)元的間距;δ(t)為鄰域的可用水平方向的長度。rij的計算公式為:
rij=‖wi-wj‖
(11)
式中,wi和wj為關聯(lián)競爭性神經(jīng)元的權值,并通過冪函數(shù)逐步削弱,具體為:
(12)
式中,a2通常取0.5。因此得出調(diào)整權值方式為:
(13)
經(jīng)迭代后,計算過程趨弱了鄰域區(qū)域外劃分故障的作用,提升了鄰域內(nèi)劃分類的作用,并通過非線性函數(shù),提升收斂效果。由式(14)、式(15)計算神經(jīng)網(wǎng)絡識別層的發(fā)送:
(14)
(15)
式中,ξ為神經(jīng)網(wǎng)絡的門限值,在開始過程中通常取值0.6,ξ∈[0,1],而操作過程中與操作完成時期取值0.8,通過在0~1區(qū)域內(nèi)逐次0.05添加ξ的值,以改善診斷效果,研究分類程度,使ξ每個周期的值都能被監(jiān)測到,最終獲取矢量輸出。
(1)學習階段1。①獲取輸入最優(yōu)投影矩陣的列向量;②開始運行ART網(wǎng)絡權值,向其中導入最優(yōu)投影矩陣的列向量;③與競爭層相關聯(lián)的神經(jīng)元,在獲取某一類樣本時被啟動,之后樣本輸出值高于其他所有值,各類競爭神經(jīng)元與神經(jīng)元的間隔由歐氏距離描述;④估量鄰域函數(shù)值和調(diào)整權系數(shù);⑤逐步削弱學習率和鄰域水平方向的長度;⑥循環(huán)操作步驟③,一直到總體樣本都經(jīng)過操作;⑦迭代次數(shù)增加,當?shù)螖?shù)大于最大迭代次數(shù)情況下完成。
(2)學習階段2。循環(huán)操作步驟②—⑥,T2=200,η0=0.04,δ0=1,ξ=0.8,逐步削弱學習率和鄰域水平方向的長度,向所選樣本添加網(wǎng)絡,選取另一組最優(yōu)投影矩陣的列向量提供網(wǎng)絡輸入,并折返,在樣本平穩(wěn)地與興奮神經(jīng)元鏈接時結(jié)束。T=t+1,在t>T2情況下完成操作。將神經(jīng)元的相關權系數(shù)發(fā)送并保存,即完成ART神經(jīng)網(wǎng)絡的操作過程,最終實現(xiàn)煤礦汽車機械設備故障診斷。
將本文模型應用于某煤礦企業(yè)中,分析該企業(yè)煤礦汽車設備的故障發(fā)生情況。并選取文獻[7]一種煤礦汽車機械軸承故障診斷模型、文獻[8] 煤礦汽車機械齒輪箱故障診斷模型作為本文模型的對比模型,通過以下實驗驗證故障診斷效果。隨機選取25個故障進行分析,分析不同診斷模型的故障識別能力,分析結(jié)果如圖1所示。根據(jù)圖1可知,隨著故障樣本數(shù)量的提升,3種模型的故障識別能力逐漸下降,文獻[7]模型的故障識別能力始終保持最低,并且隨著故障數(shù)量增加識別率迅速下降,而文獻[8]模型的故障識別率要高于文獻[7]模型,但依然低于本文模型,本文模型在故障數(shù)量增加時,故障識別率保持緩慢下降的形式,從最高96%逐漸降低至87%,并且一直高于其他2種模型,本文模型的故障識別效果較好。
圖1 故障識別能力Fig.1 Fault recognition capability
對故障診斷模型進行分析,選取所存在的10個故障,分析3種模型故障診斷的泛化性能,分析結(jié)果如圖2所示。根據(jù)圖2可知,隨著故障的提升,不同模型設備故障診斷的泛化錯誤逐漸較高,文獻[7]模型的泛化錯誤最高要達到4.88%,而文獻[6]模型的泛化錯誤最高也要達到4.71%,并且2種模型的泛化錯誤都要同時高于本文模型,因此,本文模型在設備故障診斷過程中,存在較少的泛化錯誤。
圖2 不同模型的泛化錯誤Fig.2 Generalization error of different models
測試數(shù)據(jù)選取4 000個正常設備數(shù)據(jù),5 000個異常樣本,分析訓練后不同模型的ROC曲線對比,分析結(jié)果如圖3所示。根據(jù)圖3可知,在誤檢率為0.03時,3種模型的診斷進度較為接近,但誤檢率達到0.15時,3種模型出現(xiàn)較大差距,并且本文模型的診斷精度始終高于另外2種模型,因此,本文模型具有較好的泛化能力。
圖3 不同模型的ROC曲線Fig.3 ROC curves of different models
對比3種模型,分析在信噪比不同的情況下故障診斷的程度,分析結(jié)果如圖4所示。根據(jù)圖4可知,由于信噪比逐漸下降,不同模型的故障診斷準確率也隨之降低,文獻[8]模型的診斷準確率在信噪比為5、0、-5、-10 dB時,要高于文獻[7]模型,但信噪比為20、15、10 dB的情況下,文獻[8]模型診斷準確率低于文獻[7]模型,并且文獻[8]模型的最高故障診斷準確率為80%,文獻[7]模型最高只達到82%,而本文模型的最高診斷準確率為92%,且在信噪比不同的情況下,本文模型的診斷準確率始終高于另外2種算法。因此,本文模型的診斷準確率較高,并且擁有較好的抗噪聲能力。
圖4 不同模型故障診斷結(jié)果Fig.4 Fault diagnosis results of different models
設定最高診斷煤礦汽車機械設備故障次數(shù)為50次,分析3種模型在不同診斷次數(shù)下的均方根誤差,分析結(jié)果如圖5所示。根據(jù)圖5可知,隨著診斷次數(shù)的上升,不同模型的均方根誤差均有所下降,文獻[7]模型與文獻[8]模型在診斷次數(shù)為50次時均方根誤差分別為0.032與0.037,而本文模型在診斷次數(shù)為20次時,診斷均方根誤差下降至0.02,說明此時本文模型可以完成煤礦機械設備全部故障診斷,故障診斷效率高,優(yōu)勢顯著。
圖5 不同模型的均方根誤差Fig.5 Root mean square error of different models
本文有效結(jié)合低秩鑒別投影算法和改進ART神經(jīng)網(wǎng)絡學習算法,構建基于機器學習算法的煤礦汽車機械設備故障診斷模型,根據(jù)低秩鑒別投影算法,提取故障特征,之后采用改進ART神經(jīng)網(wǎng)絡學習算法,通過兩階段的學習,實現(xiàn)煤礦汽車機械設備故障診斷。在未來階段,可在此基礎上加深研究,細化設備故障的類型,提升故障診斷的效率。