謝博才,宮殿君
(1. 中國(guó)國(guó)家鐵路集團(tuán)有限公司,北京 100844;2. 北京全路通信信號(hào)研究設(shè)計(jì)院集團(tuán)有限公司,北京 100070;3.北京市高速鐵路運(yùn)行控制系統(tǒng)工程技術(shù)研究中心,北京 100070)
道岔轉(zhuǎn)換系統(tǒng)是鐵路變換股道的重要轉(zhuǎn)轍設(shè)備,直接影響了列車的行車安全。隨著國(guó)內(nèi)軌道交通的蓬勃發(fā)展,行車速度和客運(yùn)量的不斷提升,道岔設(shè)備故障率的增加會(huì)影響運(yùn)營(yíng)效率,甚至造成人民生命財(cái)產(chǎn)的損失,因此對(duì)道岔設(shè)備進(jìn)行狀態(tài)監(jiān)控以及故障的診斷和預(yù)測(cè)是迫切且必要的。
故障檢測(cè)與診斷技術(shù)、故障預(yù)測(cè)與健康管理技術(shù)是可靠性分析中的兩大重要技術(shù)。故障診斷包括故障檢測(cè)和故障隔離兩個(gè)過(guò)程,其中故障檢測(cè)是利用各種檢測(cè)算法發(fā)現(xiàn)設(shè)備運(yùn)行過(guò)程中的異常信號(hào),判斷是否發(fā)生了故障并實(shí)現(xiàn)準(zhǔn)確定位;而故障隔離要求對(duì)故障類型、故障部位及故障成因作出診斷,以便采取相應(yīng)的維修措施,使得由于故障導(dǎo)致停滯的設(shè)備恢復(fù)運(yùn)行[1-2]。目前,故障診斷方法普遍分為3類:基于模型的故障診斷方法、基于信號(hào)處理的故障診斷方法和基于人工智能的故障診斷方法。基于模型的故障診斷方法需要針對(duì)監(jiān)測(cè)對(duì)象建立精確的數(shù)學(xué)模型,例如微分方程,通過(guò)模型輸入和輸出之間的殘差來(lái)進(jìn)行故障診斷。這種方法的缺點(diǎn)是建立模型需要足夠的用于模型開(kāi)發(fā)的先驗(yàn)知識(shí)且模型的建立是非常復(fù)雜與費(fèi)時(shí)的,同時(shí)所建立的模型精確與否會(huì)直接影響故障檢測(cè)與診斷的性能?;谛盘?hào)處理的故障診斷方法是先采集設(shè)備運(yùn)行中的傳感器信號(hào),通過(guò)觀察、分析序列中隱藏的信息進(jìn)行特征提取,并依據(jù)特征值確定是否發(fā)生故障。該方法只能對(duì)信號(hào)本身的特點(diǎn)進(jìn)行分析,無(wú)法挖掘出更深層的信息,而且若是不具備一定的專家知識(shí),很難選擇處理信號(hào)的方法從而提取到真正有用的特征。而基于人工智能的故障診斷方法利用機(jī)器學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)等智能算法挖掘大量歷史數(shù)據(jù)中隱藏的信息建立模型,從而實(shí)現(xiàn)故障診斷。目前,絕大多數(shù)關(guān)于道岔系統(tǒng)故障診斷的相關(guān)研究都普遍采用了后兩種診斷方法以及他們的結(jié)合應(yīng)用,研究結(jié)果也表明基于人工智能的診斷方法具有較好的研究前景。
故障預(yù)測(cè)與健康管理技術(shù)是設(shè)備運(yùn)維的重要手段,也是一種綜合的技術(shù)解決方案,包括實(shí)時(shí)監(jiān)測(cè)設(shè)備運(yùn)行狀態(tài)、健康評(píng)估、故障診斷和緩變故障預(yù)測(cè)、壽命預(yù)測(cè)等[3]。預(yù)測(cè)與健康管理(PHM)利用采集到的數(shù)據(jù)信息,通過(guò)各種人工智能算法建立模型對(duì)系統(tǒng)的健康狀態(tài)進(jìn)行評(píng)估,能夠計(jì)算出系統(tǒng)某些參數(shù)的趨勢(shì)變化,以及對(duì)一些特定故障模式進(jìn)行有效地預(yù)測(cè),為待監(jiān)測(cè)對(duì)象提供一系列可靠、高效的運(yùn)維方案。對(duì)于鐵路道岔這類大型、復(fù)雜的機(jī)械設(shè)備,PHM技術(shù)可以為轉(zhuǎn)轍設(shè)備提供狀態(tài)監(jiān)測(cè)與設(shè)備健康管理,進(jìn)一步提高質(zhì)量管理水平,建立信息化和智能化的維修管理機(jī)制,提高列車運(yùn)行的安全性和可靠性。
由于人工智能算法的獨(dú)特優(yōu)點(diǎn)和基于大數(shù)據(jù)的需求,目前在道岔故障診斷與運(yùn)維領(lǐng)域幾乎都是利用機(jī)器學(xué)習(xí)相關(guān)算法來(lái)實(shí)現(xiàn)。但是機(jī)器學(xué)習(xí)算法的種類較多,實(shí)際應(yīng)用中還會(huì)使用兩種甚至多種算法結(jié)合,很容易對(duì)初次接觸的人造成理解上的混亂。本文重點(diǎn)對(duì)基于信號(hào)處理和人工智能即基于信號(hào)數(shù)據(jù)的道岔故障診斷算法進(jìn)行歸納、整理和總結(jié),并根據(jù)PHM技術(shù)在道岔故障診斷上的現(xiàn)有研究,展望未來(lái)的發(fā)展趨勢(shì)。
在道岔故障診斷領(lǐng)域中,大部分的診斷算法流程如圖1所示。首先,通過(guò)故障模式的成因、轉(zhuǎn)轍機(jī)原理以及傳感器采集數(shù)據(jù)的難易程度確定最優(yōu)的監(jiān)測(cè)信號(hào)數(shù)據(jù);其次,要對(duì)原始數(shù)據(jù)進(jìn)行去噪、歸一化等方法整理數(shù)據(jù)樣本,并建立正常樣本集和故障樣本集;之后,應(yīng)用各種數(shù)據(jù)挖掘、信號(hào)處理算法提取對(duì)樣本集區(qū)分度最高的特征向量;最后,建立機(jī)器學(xué)習(xí)模型實(shí)現(xiàn)故障的分類與診斷,給出相應(yīng)的運(yùn)維措施與建議,提高經(jīng)濟(jì)效益。
在機(jī)器學(xué)習(xí)、模式識(shí)別和圖像處理中,特征提取指的是以初始的信號(hào)數(shù)據(jù)為基礎(chǔ),通過(guò)各種方法對(duì)數(shù)據(jù)進(jìn)行變換,從而將原始數(shù)據(jù)轉(zhuǎn)換為一組具有明顯物理意義或者統(tǒng)計(jì)意義的特征的一種方法。特征提取可以促進(jìn)后續(xù)的學(xué)習(xí)和泛化步驟,特征好壞對(duì)泛化能力有至關(guān)重要的影響。
在信號(hào)的特征提取算法中,最常見(jiàn)的方法是時(shí)域分析、頻域分析和時(shí)頻域分析。在實(shí)際特征提取過(guò)程中,通常會(huì)基于電流曲線和功率曲線對(duì)道岔轉(zhuǎn)換狀態(tài)進(jìn)行分段,之后再統(tǒng)計(jì)各段的時(shí)域統(tǒng)計(jì)量、頻域統(tǒng)計(jì)量或使用Mallat小波等進(jìn)行時(shí)頻域分析,從而提取到大量的特征統(tǒng)計(jì)量。其中楊靜[4]基于DWT變換,選擇Haar小波基對(duì)電流信號(hào)進(jìn)行9層分解,得到了不同尺度下信號(hào)的高頻細(xì)節(jié)部分和低頻部分,原始信號(hào)經(jīng)過(guò)DWT變換后可以提取到基本趨勢(shì)和重要整體特征,信號(hào)的維度也大幅下降。時(shí)頻域分析中除離散小波變換外,經(jīng)驗(yàn)?zāi)B(tài)分解也常用作提取信號(hào)的細(xì)節(jié)特征。該算法依據(jù)信號(hào)本身,將信號(hào)分解為若干個(gè)固有模態(tài)函數(shù)(IMF),計(jì)算每個(gè)IMF的樣本熵和模糊熵作為原始信號(hào)的多尺度特征,使得統(tǒng)計(jì)量具有更好的穩(wěn)定性。
由于正常曲線和故障曲線之間一定會(huì)存在差異性,因此一些研究者提出了基于曲線相似度的特征提取算法。該方法通常將正常曲線和幾種故障模式曲線作為模板,通過(guò)計(jì)算待測(cè)曲線與模板之間的相似或距離函數(shù)作為后續(xù)診斷的特征,距離函數(shù)包括弗雷歇(Fretchet)距離、快速動(dòng)態(tài)時(shí)間規(guī)整(FastDTW)算法等,最后根據(jù)相似度特征判斷待測(cè)曲線是否發(fā)生了故障。實(shí)驗(yàn)證明基于曲線相似度的算法無(wú)需大量的訓(xùn)練樣本,準(zhǔn)確率很高且FastDTW算法效果普遍優(yōu)于Fretchet距離。
上述方法普遍從定量的角度對(duì)數(shù)據(jù)進(jìn)行分析,但是由于鐵路通常環(huán)境復(fù)雜以及惡劣天氣的影響,容易出現(xiàn)隨機(jī)的波動(dòng)和無(wú)關(guān)趨勢(shì),因此還有一類算法是通過(guò)基于定性的角度對(duì)曲線形狀進(jìn)行特征提取。該類算法利用時(shí)間窗將信號(hào)進(jìn)行分割,并對(duì)窗口內(nèi)的數(shù)據(jù)進(jìn)行線性擬合,通過(guò)符號(hào)語(yǔ)言描述每種趨勢(shì)片段,最終將信號(hào)形狀簡(jiǎn)化為一串趨勢(shì)序列特征。根據(jù)事先建立的故障診斷規(guī)則知識(shí)庫(kù)進(jìn)行序列匹配,從而有效區(qū)別不同的故障狀態(tài)。其中孫孟雷[5]依據(jù)功率曲線的形狀提取信號(hào)的持久化四邊形區(qū)域映射功率持久化特征,提取信號(hào)峰值三角區(qū)域映射功率峰值的特征,從而對(duì)轉(zhuǎn)轍機(jī)動(dòng)作過(guò)程進(jìn)行特征化表述,通過(guò)特征向量灰度化結(jié)果證明了該方法的可行性和實(shí)用性。
特征選擇也稱為特征子集選擇,是特征提取的后續(xù)步驟。它是從提取到的特征集合中挑選出一些最有代表性或最有區(qū)分度的特征,以達(dá)到降低數(shù)據(jù)維度的目的,也是提高學(xué)習(xí)算法性能的重要手段。在道岔故障診斷中最常用的是基于Fisher準(zhǔn)則的特征選擇方式,通過(guò)計(jì)算類間方差與類內(nèi)方差之比,找到最有效的特征。但該方法只能篩選出一部分有用特征,當(dāng)特征維數(shù)仍然過(guò)大時(shí),需要降維算法來(lái)進(jìn)一步進(jìn)行特征選擇,常見(jiàn)方法有主成分分析法(PCA)、線性判別分析(LDA)、局部線性嵌入(LLE)、t-SNE等。降維方法各有優(yōu)劣,需要根據(jù)實(shí)際數(shù)據(jù)進(jìn)行選擇。將數(shù)據(jù)維度降至低維,在保留絕大多數(shù)原始數(shù)據(jù)信息的同時(shí),又能夠提高故障診斷的效率和精度。
機(jī)器學(xué)習(xí)的目的是通過(guò)某種算法,如神經(jīng)網(wǎng)絡(luò)等學(xué)習(xí)輸入與輸出的關(guān)系,并可以利用學(xué)習(xí)到的關(guān)系通過(guò)未知輸入盡可能準(zhǔn)確地得到未知輸出,一般步驟是在進(jìn)行特征提取步驟之后,將特征向量輸入機(jī)器學(xué)習(xí)算法進(jìn)行學(xué)習(xí),得到最終的診斷結(jié)果。在道岔故障診斷領(lǐng)域中,機(jī)器學(xué)習(xí)擁有廣泛的應(yīng)用空間,涉及的算法包括無(wú)監(jiān)督學(xué)習(xí)中的聚類分析、監(jiān)督學(xué)習(xí)中的支持向量機(jī)、神經(jīng)網(wǎng)絡(luò)、集成學(xué)習(xí)、深度學(xué)習(xí)等。
2.2.1 聚類分析模型
聚類分析是一種無(wú)監(jiān)督的機(jī)器學(xué)習(xí)算法。在處理分類問(wèn)題的時(shí)候,一般數(shù)據(jù)標(biāo)簽是已知的,通過(guò)提前對(duì)數(shù)據(jù)進(jìn)行訓(xùn)練,從而得知數(shù)據(jù)屬性進(jìn)而對(duì)它們進(jìn)行劃分。而聚類分析與普通分類的區(qū)別在于,聚類分析處理的數(shù)據(jù)是沒(méi)有標(biāo)簽的,需要在沒(méi)有訓(xùn)練樣本的前提下進(jìn)行劃分,通過(guò)衡量不同數(shù)據(jù)間的相似性,將它們分類到不同的類簇中。
在實(shí)際使用中,通常將聚類分析視為一種數(shù)據(jù)挖掘手段,能夠發(fā)掘數(shù)據(jù)的內(nèi)部結(jié)構(gòu)特征。針對(duì)特征提取中的一些缺點(diǎn),如時(shí)頻域分析對(duì)數(shù)據(jù)的利用度不高、降維方法會(huì)丟失有用數(shù)據(jù)等,聚類算法在對(duì)數(shù)據(jù)進(jìn)行分類時(shí),會(huì)選擇信息表征更全面的訓(xùn)練集和測(cè)試集,從而避免隨機(jī)性造成的信息不全面問(wèn)題。利用聚類算法的分類特性,將隨機(jī)的數(shù)據(jù)進(jìn)行整理和聚類,可以看出輸入向量的特征值是否能夠全面地反映它所代表的樣本的特征,為后續(xù)診斷算法提供正確的信息來(lái)源。楊菊花等[6]針對(duì)初始特征維度過(guò)高的問(wèn)題,選擇DBSCAN聚類算法篩選故障診斷敏感特征,構(gòu)建診斷敏感特征集,起到了降維的作用。李孟瀾[7]對(duì)多種聚類算法,包括K-means算法、FCM算法、凝聚式層次聚類算法、DBSCAN算法和DPCA算法進(jìn)行對(duì)比分析,通過(guò)不同的特征集與聚類算法搭配得到聚類準(zhǔn)確率,從而獲取最優(yōu)數(shù)據(jù)處理方法。在此基礎(chǔ)上構(gòu)建了聚類集成算法,驗(yàn)證聚類集成算法在轉(zhuǎn)轍機(jī)故障數(shù)據(jù)挖掘上的優(yōu)勢(shì)。
2.2.2 灰色關(guān)聯(lián)分析模型
灰色關(guān)聯(lián)分析可以依據(jù)各因素之間的相似性來(lái)衡量關(guān)聯(lián)程度,進(jìn)而達(dá)到判斷系統(tǒng)當(dāng)前狀態(tài)以及預(yù)測(cè)發(fā)展趨勢(shì)的目的。經(jīng)過(guò)不斷地探索與發(fā)展,形成了鄧氏關(guān)聯(lián)度、灰色絕對(duì)關(guān)聯(lián)度、灰色相對(duì)關(guān)聯(lián)度等不同的關(guān)聯(lián)度模型。
根據(jù)灰色關(guān)聯(lián)分析中曲線幾何形狀越相似關(guān)聯(lián)度越高的特點(diǎn),提出了一些基于灰色關(guān)聯(lián)分析的道岔故障診斷模型。朱緒昌[8]使用了基于鄧氏關(guān)聯(lián)度的模型,通過(guò)比較故障模式之間的關(guān)聯(lián)度,選擇關(guān)聯(lián)度最小的變換算子確立故障特征序列,并確定變換算子用于數(shù)據(jù)變換,最終選擇最優(yōu)的故障診斷關(guān)聯(lián)度模型。
2.2.3 支持向量機(jī)模型
支持向量機(jī)(SVM)是一種二分類模型,它的基本思想是在特征空間中找到一個(gè)能夠正確劃分訓(xùn)練數(shù)據(jù)集并且?guī)缀伍g隔最大的分離超平面。如圖2所示, 即為分離超平面,對(duì)于線性可分的數(shù)據(jù)集來(lái)說(shuō),這樣的超平面有無(wú)數(shù)個(gè),但幾何間隔最大的分離超平面是惟一的。SVM通過(guò)引入核函數(shù),可以解決在高維空間中的內(nèi)積運(yùn)算,從而實(shí)現(xiàn)非線性分類問(wèn)題。SVM一般作為二分類器使用,但由于實(shí)際應(yīng)用中也需要解決多分類任務(wù),可以通過(guò)多個(gè)SVM分類器結(jié)合的方法實(shí)現(xiàn),如一對(duì)一法、一對(duì)多法和SVM決策樹(shù)法。
圖2 SVM模型最優(yōu)超平面示意Fig.2 The optimal hyperplane schematic diagram of the SVM model
SVM因其小樣本量、高維模式識(shí)別和易實(shí)現(xiàn)等優(yōu)點(diǎn)在道岔故障診斷上被廣泛應(yīng)用,也出現(xiàn)了許多基于SVM故障診斷模型的研究和討論,包括解決了數(shù)據(jù)樣本不平衡問(wèn)題與SVM核函數(shù)參數(shù)σ和懲罰因子C的選擇問(wèn)題。同時(shí),一些研究者為了彌補(bǔ)SVM算法在故障診斷上的不足,將SVM與其他算法進(jìn)行結(jié)合優(yōu)化,提高了識(shí)別的準(zhǔn)確率和效率。王登飛等[9]采用SVM-AdaBoost算法疊加了多個(gè)基本SVM分類器,提高算法的抗干擾能力。對(duì)于SVM算法核函數(shù)調(diào)參困難的問(wèn)題,孔令剛等[10]將SVM與改進(jìn)型灰狼優(yōu)化算法結(jié)合,實(shí)現(xiàn)了參數(shù)的自動(dòng)優(yōu)化,達(dá)到100%的分類準(zhǔn)確率。
2.2.4 神經(jīng)網(wǎng)絡(luò)模型
目前,在道岔故障診斷領(lǐng)域中,應(yīng)用最多的機(jī)器學(xué)習(xí)算法是各種神經(jīng)網(wǎng)絡(luò)模型,并在這些算法的基礎(chǔ)上優(yōu)化改進(jìn),提高識(shí)別精度。
人工神經(jīng)網(wǎng)絡(luò)是機(jī)器學(xué)習(xí)中最常用的模型,它從信息處理的角度對(duì)人腦神經(jīng)元進(jìn)行抽象,按照輸入層、隱藏層和輸出層的基本結(jié)構(gòu)進(jìn)行拓展,依據(jù)不同的連接方式組成不同的網(wǎng)絡(luò)模型。神經(jīng)網(wǎng)絡(luò)由大量的節(jié)點(diǎn)也稱為神經(jīng)元互相聯(lián)結(jié)構(gòu)成,每一個(gè)節(jié)點(diǎn)都代表一種激勵(lì)函數(shù),每?jī)蓚€(gè)節(jié)點(diǎn)之間的連接代表一個(gè)通過(guò)該連接的加權(quán)值,稱之為權(quán)重。神經(jīng)網(wǎng)絡(luò)具有自主學(xué)習(xí)能力、非線性映射能力、對(duì)任意函數(shù)逼近能力和容錯(cuò)能力,因此誕生了許多神經(jīng)網(wǎng)絡(luò)模型。在道岔故障診斷中,常用的模型有BP神經(jīng)網(wǎng)絡(luò)、PNN神經(jīng)網(wǎng)絡(luò),也有少量采用其他的模型如深度學(xué)習(xí)、集成學(xué)習(xí)等。
在工程應(yīng)用與研究中,多數(shù)診斷算法都采用BP神經(jīng)網(wǎng)絡(luò)或PNN神經(jīng)網(wǎng)絡(luò)建立道岔故障診斷模型,這些模型都取得了較好的故障診斷結(jié)果,其中習(xí)家寧[11]在PNN模型的基礎(chǔ)上提出了基于PNN決策級(jí)融合的故障診斷模型,使得某一模型在出現(xiàn)失效的情況下具有容錯(cuò)能力。但是,BP和PNN神經(jīng)網(wǎng)絡(luò)在使用上都存在一些問(wèn)題:BP神經(jīng)網(wǎng)絡(luò)的初始權(quán)重和閾值是隨機(jī)獲取的,容易使訓(xùn)練階段陷入局部最優(yōu);而PNN神經(jīng)網(wǎng)絡(luò)在故障模式樣本有限的情況下,難以找到體現(xiàn)整個(gè)故障空間的平滑因子。因此,通常需要一些參數(shù)尋優(yōu)算法與神經(jīng)網(wǎng)絡(luò)進(jìn)行結(jié)合以提高診斷算法性能。其中比較常見(jiàn)的參數(shù)尋優(yōu)算法是粒子群優(yōu)化算法和灰狼優(yōu)化算法,與單獨(dú)使用神經(jīng)網(wǎng)絡(luò)對(duì)比,收斂性和穩(wěn)定性均有一定程度的提高。
另外還有一些基于深度學(xué)習(xí)與集成學(xué)習(xí)的研究。卷積神經(jīng)網(wǎng)絡(luò)(CNN)及優(yōu)化算法作為最常用的深度學(xué)習(xí)算法被廣泛應(yīng)用。陳亭[12]使用深度卷積神經(jīng)網(wǎng)絡(luò)中的深度殘差網(wǎng)絡(luò)對(duì)道岔故障模式進(jìn)行識(shí)別,證明深度殘差網(wǎng)絡(luò)相對(duì)于淺層殘差網(wǎng)絡(luò)和全連接神經(jīng)網(wǎng)絡(luò)故障診斷的效果更出色。李林霄[13]在原始CNN的前向傳導(dǎo)與反向傳播過(guò)程之中加入自適應(yīng)模塊,對(duì)初始分類結(jié)果進(jìn)行特征提取和分析,自適應(yīng)地調(diào)整特征誤差,實(shí)現(xiàn)特征殘差的自適應(yīng)增強(qiáng),達(dá)到提高收斂效果,提高識(shí)別精度的目的。楊菊花等[14]在卷積層特征提取后將結(jié)果作為門控循環(huán)單元(GRU)的輸入,再輸出分類概率。經(jīng)實(shí)驗(yàn)驗(yàn)證,該優(yōu)化方法的準(zhǔn)確率優(yōu)于PCA-HMM,訓(xùn)練時(shí)間優(yōu)于PCA-GA-SVM。集成學(xué)習(xí)通過(guò)組合多個(gè)弱分類器構(gòu)建出一個(gè)強(qiáng)分類器,集成算法包括Bagging算法、Boosting算法和Stacking算法等。通過(guò)組合深度學(xué)習(xí)與集成學(xué)習(xí),可以構(gòu)建出基于集成學(xué)習(xí)的深度置信網(wǎng)絡(luò)故障診斷模型和基于集成學(xué)習(xí)的卷積神經(jīng)網(wǎng)絡(luò)故障診斷模型,進(jìn)一步提升道岔故障診斷性能。
在故障診斷中還應(yīng)用了一些其他的機(jī)器學(xué)習(xí)算法?;趯傩约訖?quán)的樸素貝葉斯網(wǎng)絡(luò)分類器,可以提高分類結(jié)果的準(zhǔn)確性。左元[15]對(duì)KNN算法提出改進(jìn),提出基于類別特征加權(quán)的K最鄰近算法(FSWKNN),相比較KNN與WKNN在診斷精度上都有明顯的提升。針對(duì)道岔故障診斷中的文本數(shù)據(jù)建立故障樹(shù)編碼,進(jìn)而轉(zhuǎn)化為貝葉斯網(wǎng)絡(luò)進(jìn)行故障診斷,提供了一種文本挖掘的思路和方法。
道岔故障可能發(fā)生在運(yùn)行的各個(gè)階段,F(xiàn)DD技術(shù)可以保證在故障發(fā)生后及時(shí)預(yù)警和實(shí)現(xiàn)快速檢修,但若能對(duì)設(shè)備進(jìn)行全生命周期監(jiān)測(cè)以及數(shù)據(jù)挖掘,就能在故障二次發(fā)生前及時(shí)預(yù)警,提前作出檢修措施,避免經(jīng)濟(jì)和人員損失。目前,PHM技術(shù)在道岔故障預(yù)測(cè)領(lǐng)域還不夠成熟,關(guān)于道岔健康狀態(tài)評(píng)估與故障預(yù)測(cè)方面的文獻(xiàn)很少,本文基于現(xiàn)有的研究資料對(duì)涉及機(jī)器學(xué)習(xí)的算法進(jìn)行總結(jié)。
由于道岔設(shè)備處于室外且環(huán)境復(fù)雜,導(dǎo)致突發(fā)故障(如尖軌卡入異物)的概率大大提升,而這類故障很難通過(guò)算法進(jìn)行預(yù)測(cè)。但是在道岔動(dòng)作過(guò)程中,因?yàn)殚L(zhǎng)時(shí)間的動(dòng)作而引發(fā)的疲勞性故障(如動(dòng)作桿運(yùn)動(dòng)的摩擦力增加),即緩變性故障,可以通過(guò)訓(xùn)練故障發(fā)生前后的曲線數(shù)據(jù)預(yù)測(cè)發(fā)生故障的動(dòng)作次數(shù)。侯大山[16]針對(duì)“道岔轉(zhuǎn)換過(guò)程中功率曲線大幅波動(dòng)”這一故障類型,提取故障發(fā)生前500次動(dòng)作曲線的特征,采用KPCA算法構(gòu)建退化性能指標(biāo)及失效閾值,建立PSO-ELM模型預(yù)測(cè)退化性能指標(biāo)變化趨勢(shì),證明隱層神經(jīng)元數(shù)目為30時(shí),達(dá)到最優(yōu)預(yù)測(cè)性能。正負(fù)樣本不平衡問(wèn)題一直是道岔故障診斷和預(yù)測(cè)的難點(diǎn)。鐘志旺[17]針對(duì)“尖軌摩擦力過(guò)大”的故障模式,提出SVDD算法,僅利用道岔正常運(yùn)行數(shù)據(jù)實(shí)現(xiàn)對(duì)目標(biāo)樣本和非目標(biāo)樣本的劃分,避免因缺少故障數(shù)據(jù)造成的樣本不平衡問(wèn)題。由SVDD算法得到的健康指標(biāo),對(duì)于異常檢測(cè)和故障檢修具有指導(dǎo)意義。
在健康狀態(tài)等級(jí)分級(jí)上,一些研究者根據(jù)曲線之間的關(guān)系構(gòu)建指標(biāo),劃分健康狀態(tài)等級(jí)或檢修等級(jí),并應(yīng)用機(jī)器學(xué)習(xí)算法對(duì)指標(biāo)進(jìn)行預(yù)測(cè)。皮爾遜相關(guān)系數(shù)、歐氏距離、弗雷歇距離和云相似度等方法經(jīng)常被選擇作為衡量道岔健康狀態(tài)等級(jí)的指標(biāo)。道岔的健康狀態(tài)通常分為健康、亞健康和故障3級(jí),道岔處于健康狀態(tài)是不需要維護(hù)的,處于故障狀態(tài)的設(shè)備需要立即維修,而亞健康狀態(tài)較為復(fù)雜,需要對(duì)其展開(kāi)研究,預(yù)測(cè)故障發(fā)生的可能性及故障可能出現(xiàn)的時(shí)間。多項(xiàng)式回歸模型、AR模型、長(zhǎng)短時(shí)記憶神經(jīng)網(wǎng)絡(luò)模型(LSTM)、CNN-GRU模型等方法能夠?qū)ξ磥?lái)一段時(shí)間內(nèi)的評(píng)價(jià)指標(biāo)進(jìn)行預(yù)測(cè),根據(jù)評(píng)價(jià)指標(biāo)的趨勢(shì)獲得道岔的狀態(tài)。通過(guò)真實(shí)數(shù)據(jù)驗(yàn)證,預(yù)測(cè)結(jié)果較為準(zhǔn)確。
聚焦于道岔設(shè)備退化狀態(tài)的挖掘也是研究的熱點(diǎn),通過(guò)一些機(jī)器學(xué)習(xí)算法學(xué)習(xí)道岔設(shè)備從正常運(yùn)行狀態(tài)到故障狀態(tài)之間的大量數(shù)據(jù),建立設(shè)備退化狀態(tài)樣本庫(kù)和模型,然后對(duì)道岔狀態(tài)進(jìn)行評(píng)估,從而識(shí)別設(shè)備處于何種狀態(tài)。文獻(xiàn)[18-20]都使用了不同的聚類算法建立退化狀態(tài)與故障模式之間的關(guān)系,實(shí)現(xiàn)對(duì)道岔設(shè)備退化狀態(tài)的識(shí)別。其中許慶陽(yáng)[18]提出了一種基于Kohonen神經(jīng)網(wǎng)絡(luò)和隱馬爾科夫模型結(jié)合的算法,用于進(jìn)行退化狀態(tài)與故障狀態(tài)的識(shí)別與評(píng)估,實(shí)現(xiàn)故障預(yù)測(cè)。高利民[19]等使用SOM-BP混合神經(jīng)網(wǎng)絡(luò)算法,得到6種退化狀態(tài)樣本。李園祥[20]提出基于堆疊降噪自動(dòng)編碼機(jī)結(jié)合自組織映射神經(jīng)網(wǎng)絡(luò)的方法,構(gòu)建道岔轉(zhuǎn)轍機(jī)的退化模型,并在此基礎(chǔ)上利用LSTM對(duì)設(shè)備剩余壽命進(jìn)行預(yù)測(cè)。
道岔設(shè)備穩(wěn)定運(yùn)行是保障鐵路安全的一個(gè)重要因素。人工智能的發(fā)展,給故障檢測(cè)與診斷技術(shù)提供了一種有效的手段。機(jī)器學(xué)習(xí)技術(shù)可以挖掘一些人工看不到的隱患,針對(duì)設(shè)備的日常維護(hù)和故障檢修也越來(lái)越智能化、自動(dòng)化。本文梳理了近年來(lái)針對(duì)FDD和PHM的文獻(xiàn)資料與應(yīng)用研究,可以發(fā)現(xiàn)絕大多數(shù)研究還是聚焦在故障模式的分類與診斷上,且使用的信號(hào)數(shù)據(jù)種類單一,挖掘的信息非常有限。而且,機(jī)器學(xué)習(xí)在PHM領(lǐng)域中是一個(gè)比較困難和新興的課題,還需要進(jìn)一步的展開(kāi)研究。因此,在道岔故障診斷領(lǐng)域,機(jī)器學(xué)習(xí)的研究仍有3個(gè)可以進(jìn)步的方向。
在故障檢測(cè)與診斷領(lǐng)域,正常樣本與故障樣本不平衡問(wèn)題仍是一個(gè)難點(diǎn),很多時(shí)候需要將故障樣本積累到一定的數(shù)據(jù)量才可以進(jìn)行分析。預(yù)測(cè)與健康管理相比故障診斷更具有現(xiàn)實(shí)研究意義,故障預(yù)測(cè)和壽命預(yù)測(cè)是今后的研究熱點(diǎn)和重要趨勢(shì)。
目前道岔的故障診斷與預(yù)測(cè)研究中,絕大多數(shù)研究都在從電流、功率等信號(hào)中提取特征展開(kāi)研究,數(shù)據(jù)類型不夠全面。因此能否增加一些傳感器數(shù)據(jù),例如溫度、濕度、轉(zhuǎn)換力、表示桿位移、文本數(shù)據(jù)等,多方面地建立更準(zhǔn)確的模型。
機(jī)器學(xué)習(xí)模型種類很多,且每種模型都有明顯優(yōu)缺點(diǎn)及適用范圍。如何針對(duì)道岔故障類型選擇合適的模型,以及如何對(duì)模型進(jìn)行結(jié)合也是未來(lái)的一個(gè)研究方向。