劉 晶,唐 震,王曉茜,竇潤亮,季海鵬
(1.河北工業(yè)大學(xué) 人工智能與數(shù)據(jù)科學(xué)學(xué)院,天津 300400;2.河北省數(shù)據(jù)驅(qū)動工業(yè)智能工程研究中心,天津 300400;3.天津開發(fā)區(qū)精諾瀚海數(shù)據(jù)科技有限公司,天津 300400;4.天津大學(xué) 管理與經(jīng)濟(jì)學(xué)部,天津 300072;5.河北工業(yè)大學(xué) 材料科學(xué)與工程學(xué)院,天津 300400)
工業(yè)4.0背景下,設(shè)備運行過程越來越復(fù)雜,某些關(guān)鍵部件的故障可能導(dǎo)致整個生產(chǎn)系統(tǒng)停機,因此設(shè)備故障的早期診斷和預(yù)測成為研究熱點[1]。近年來,數(shù)據(jù)驅(qū)動的故障診斷方法[2]解決了因機理復(fù)雜難以建立精確數(shù)學(xué)模型的問題,在理論上大幅提高了故障診斷的準(zhǔn)確率,受到廣泛關(guān)注。在實際應(yīng)用中,由于生產(chǎn)現(xiàn)場的不穩(wěn)定導(dǎo)致設(shè)備運行數(shù)據(jù)具有強噪聲和復(fù)雜性,運用數(shù)據(jù)驅(qū)動的故障診斷方法的實際故障診斷正確率遠(yuǎn)低于實驗室結(jié)果,為了進(jìn)一步提高生產(chǎn)現(xiàn)場的準(zhǔn)確率,需要人機交互的智能輔助決策方法。
2012年谷歌公司提出知識圖譜技術(shù)[3],通過構(gòu)建結(jié)構(gòu)化的知識庫,推理算法求解故障成因,實現(xiàn)由知識圖譜引導(dǎo)的設(shè)備故障診斷?;谥R圖譜的知識推理算法主要包括基于距離向量的TransE模型[4]及其衍生的模型,以及基于語義匹配的RESCAL模型[5]、ComplEx模型[6]、DistMult模型[7]等,目前已有學(xué)者將知識推理算法應(yīng)用于設(shè)備故障診斷。喬驥等[8]將電網(wǎng)調(diào)度中大量文本規(guī)程記錄組織為知識圖網(wǎng)絡(luò),構(gòu)建了面向電網(wǎng)故障處理輔助決策的知識圖譜應(yīng)用框架,實現(xiàn)了電網(wǎng)故障處置的解析判別、輔助決策和多維人機交互。為進(jìn)一步實現(xiàn)故障數(shù)據(jù)和知識輔助之間的聯(lián)動,周彬等[9]提出一種面向設(shè)備點檢故障根因分析的因果知識建模方法,該方法通過提取設(shè)備故障運維因果知識圖,結(jié)合故障知識中混雜影響因素,實現(xiàn)設(shè)備故障語義關(guān)系發(fā)掘,并實現(xiàn)圖譜節(jié)點間隱含的因果性語義鏈路補全。為了實現(xiàn)知識庫的擴(kuò)展,劉華一等[10]提出一種基于語義網(wǎng)的機床故障診斷知識擴(kuò)展方法和一種應(yīng)用該方法的知識擴(kuò)展平臺體系結(jié)構(gòu),該方法利用語義網(wǎng)技術(shù)實現(xiàn)了對機床故障知識收集效率的提升,驗證了故障診斷知識庫在實例擴(kuò)展方面的有效性。上述方法從故障文本中提取結(jié)構(gòu)化數(shù)據(jù),構(gòu)建設(shè)備故障知識圖譜,均取得了較好的效果。但上述方法需要依賴于大量的故障樣本作為訓(xùn)練數(shù)據(jù),由于設(shè)備的高可靠性,故障數(shù)據(jù)較難獲得,如何在小樣本情況下由知識圖譜實現(xiàn)設(shè)備故障的推理非常重要。
為實現(xiàn)小樣本情況下知識圖譜的故障推理,需要知識圖譜推理算法擁有元學(xué)習(xí)的能力。元學(xué)習(xí)[11]的目標(biāo)是使算法適應(yīng)當(dāng)前任務(wù),且能夠在新任務(wù)上利用較少的訓(xùn)練樣本取得更好的泛化表現(xiàn)?;谧罹叽硇缘脑獙W(xué)習(xí)MAML(model-agnostic meta-learning)算法[12]模型無關(guān)的思想,目前已有可在小樣本情況下實現(xiàn)知識推理的模型,包括MetaKGR(meta-based multi-hop reasoning method)[13]模型、FSRL(few-shot relation learning model)[14]模型、GANA(gated and attentive neighbor aggregator)[15]模型等,而對于非高頻三元組如何實現(xiàn)有效預(yù)測,CHEN等[16]通過模型無關(guān)元學(xué)習(xí)對實體嵌入過程中的參數(shù)進(jìn)行訓(xùn)練,可以在小樣本情況下取得有價值的實體信息,實現(xiàn)了在稀疏數(shù)據(jù)集中的鏈接預(yù)測。
由上述研究可知,目前由知識圖譜引導(dǎo)的設(shè)備故障診斷算法缺乏元學(xué)習(xí)的能力,難以在在小樣本情況下推理故障成因,且在進(jìn)行知識實體的推理時,未考慮知識圖譜推理算法的負(fù)樣本生成策略,導(dǎo)致隨機生成的負(fù)樣本帶來了不必要的模型訓(xùn)練開銷。通識領(lǐng)域常采用隨機替換頭尾節(jié)點的方法生成負(fù)樣本,但隨機替換產(chǎn)生的負(fù)樣本對于設(shè)備故障診斷并無實際意義,反而會導(dǎo)致可能相關(guān)聯(lián)的故障間因為對負(fù)例的學(xué)習(xí)而失去聯(lián)系,或是故障診斷模型在負(fù)例中學(xué)習(xí)不到任何有價值的信息。針對上述問題,本文提出一種基于元學(xué)習(xí)的設(shè)備故障知識圖譜構(gòu)建及推理方法,該方法通過提取設(shè)備時序信號和文本規(guī)則等多源信息構(gòu)建知識圖譜,實現(xiàn)了同一故障簇可視化及相似故障查詢,提供對故障診斷決策的輔助。并通過基于元學(xué)習(xí)的故障鏈接預(yù)測算法(Meta-Fault link prediction algorithm,MetaF),實現(xiàn)在小樣本情況下故障類型的鏈接預(yù)測和設(shè)備故障診斷的推理,為實現(xiàn)更精確的模型訓(xùn)練,采用在同一故障簇鄰域的負(fù)樣本生成策略,避免了隨機替換頭尾實體導(dǎo)致預(yù)測算法無法在負(fù)例中學(xué)習(xí)到有用的知識。最后在公開數(shù)據(jù)集上驗證了模型故障診斷能力,證明了本文故障診斷提供輔助決策的有效性。
基于元學(xué)習(xí)的設(shè)備故障知識圖譜構(gòu)建及推理方法框架如圖1所示。該方法包括基于設(shè)備故障信息知識圖譜構(gòu)建和基于元學(xué)習(xí)的故障鏈接預(yù)測算法MetaF兩個模塊。其中,基于設(shè)備故障信息知識圖譜構(gòu)建實現(xiàn)對設(shè)備文本數(shù)據(jù)的分類提取和設(shè)備時序數(shù)據(jù)的特征提取,得到設(shè)備故障規(guī)則鏈的描述和故障特征信息,結(jié)合故障規(guī)則和信號特征后實現(xiàn)知識圖譜的構(gòu)建?;谠獙W(xué)習(xí)的故障鏈接預(yù)測算法MetaF分別接收支持集和查詢集的任務(wù)實現(xiàn)小樣本情況下的故障診斷,支持集訓(xùn)練數(shù)據(jù)通過元學(xué)習(xí)N-way、K-shot的方式劃分得到多組任務(wù),輸入MetaF訓(xùn)練算法,查詢集則驗證模型在新鏈接預(yù)測任務(wù)上的泛化效果。在MetaF中采用同一故障簇鄰域的負(fù)樣本生成策略進(jìn)行負(fù)樣本的生成,通過TransE算法進(jìn)行故障實體的鏈接預(yù)測,最終輸出對故障類型的診斷推理結(jié)果,并提供相似故障列表查詢,為故障診斷提供輔助決策。
針對傳統(tǒng)故障診斷方法缺乏故障信息結(jié)構(gòu)化管理能力的問題,提出一種構(gòu)建基于設(shè)備故障信息知識圖譜方法,并將其數(shù)據(jù)進(jìn)行劃分以適應(yīng)于元學(xué)習(xí)訓(xùn)練。構(gòu)建知識圖譜的方法如圖2所示,對于設(shè)備運行生成的故障信息,首先從設(shè)備數(shù)據(jù)的文本描述中提取知識圖譜的故障規(guī)則鏈,其次從設(shè)備運行數(shù)據(jù)中提取信號特征信息,最后將信號特征和故障規(guī)則鏈結(jié)合,生成統(tǒng)一描述形式的節(jié)點信息,完成知識圖譜的構(gòu)建。
對于設(shè)備故障信息知識圖譜的定義如式(1)所示:
(1)
式中:E={e1,e2,…,en}(n<|E|)為n個實體集合,R={r1,r2,…,rm}(m<|R|)為實體間關(guān)系集合。構(gòu)建知識圖譜,需要從設(shè)備故障數(shù)據(jù)的文本數(shù)據(jù)中抽取故障規(guī)則,為不同故障類型定義分類標(biāo)準(zhǔn)。設(shè)備文本數(shù)據(jù)可以總結(jié)出多種工況特征,而設(shè)備運行數(shù)據(jù)是在多種工況特征疊加下產(chǎn)生的結(jié)果,因此定義圖譜中的兩類節(jié)點,分別為故障類型節(jié)點和故障時序片段節(jié)點。故障類型節(jié)點為某一工況下的實體表示,故障時序片段節(jié)點為多種工況疊加下,設(shè)備運行時序信號采樣片段的實體表示。以某一工況下設(shè)備運行記錄文件為例,將文本抽取為故障規(guī)則的方法如圖3所示。假設(shè)取得一個由“外圈故障”“014深度損傷”“風(fēng)扇端”這3種類型工況疊加得到的混合工況記錄文件,則分別定義“故障點位置”“損傷深度”“檢測位置”3種故障類型節(jié)點與3種工況類型對應(yīng),并定義一個故障時序片段節(jié)點與該混合工況記錄對應(yīng),且存在<故障時序片段節(jié)點,belong_to,故障類型節(jié)點>的三元組關(guān)系。
由此得到知識圖譜中三元組的定義,如式(2)所示。對于圖譜中的所有故障規(guī)則鏈s=(h,r,t),均有s?S,r為實體節(jié)點間關(guān)系描述。
S={(h,r,t)|h,t∈E,r∈R}。
(2)
進(jìn)一步的,為獲得圖譜節(jié)點的嵌入向量形式描述,需要對設(shè)備時序數(shù)據(jù)進(jìn)行信號分解并提取特征值,將其存儲為知識圖譜的形式化表達(dá)結(jié)構(gòu),便于知識圖譜鏈接預(yù)測算法直接處理。對選定的時序片段序列,對其進(jìn)行變分模態(tài)分解(Variational Mode Decomposition,VMD),VMD分解通過求變分模型最優(yōu)解確定信號的各本征模態(tài)函數(shù)(Intrinsic Mode Functions,IMFs)分量,最終實現(xiàn)信號頻譜劃分和各本征模態(tài)函數(shù)分量的分離。求解模態(tài)分量方法如式(3)~式(5)所示。求解約束變分問題如公式(3)所示:
s.t.
(3)
式中:{uk}為分解得到的IMFs分量,{ωk}為IMFs分量的中心頻率,K為分解的IMFs數(shù)量。采用二次懲罰因子β和拉格朗日乘數(shù)λ將約束問題轉(zhuǎn)化為非約束問題,如式(4)所示:
L({uk},{ωk},λ)=
(4)
最后將上述問題通過交替方向乘子法求解,uk和ωk的最小值求解方法如式(5)所示:
(5)
其中:n為迭代次數(shù),當(dāng)?shù)綕M足收斂條件(6)時停止;ε為給定的判定精度,
(6)
根據(jù)VMD分解得到K個模態(tài)分量IMFs={IMFs1,IMFs2,…,IMFsK}后,為使知識圖譜鏈接預(yù)測算法獲取時序信號特征數(shù)據(jù),需要對IMFs分量求解其波形因子得其一維信號特征。波形因子是訊號的均方根值和整流平均值的比值,常用于時序信號的故障診斷任務(wù),其計算如式(7)所示:
(7)
由IMFs提取的{form1,form2,…,formk}波形因子矩陣為故障特征向量矩陣,矩陣每列為L維的向量,例如formk={line1,line2,…,lineL},對應(yīng)在第k維模態(tài)分解的向量上L個知識圖譜節(jié)點數(shù)據(jù)。
綜上,完成設(shè)備故障信息知識圖譜的構(gòu)建,故障規(guī)則鏈和故障特征值分別存儲于故障圖譜規(guī)則層和故障圖譜數(shù)據(jù)層。在圖譜的兩個層級間定義模式映射<故障時序片段節(jié)點,故障特征節(jié)點>,映射表示同一故障時序片段在兩個不同層級之間的不同存儲方式。
根據(jù)設(shè)備故障信息知識圖譜的數(shù)據(jù)形式,需要將其三元組劃分為元學(xué)習(xí)任務(wù)的形式。因為設(shè)備故障信息構(gòu)建的圖譜中,實體數(shù)量遠(yuǎn)遠(yuǎn)多于實體間關(guān)系的數(shù)量,由此設(shè)置關(guān)系為任務(wù)的劃分依據(jù)。此外,故障實體間的語義信息是由關(guān)系進(jìn)行連接的,由此通過關(guān)系進(jìn)行元學(xué)習(xí)任務(wù)參數(shù)訓(xùn)練是合理的。根據(jù)N-way,K-shot的原則,對元學(xué)習(xí)訓(xùn)練任務(wù)的三元組劃分方法如圖4所示。對于三元組數(shù)據(jù)集D,劃分為支持集訓(xùn)練數(shù)據(jù)Dtrain和查詢集驗證數(shù)據(jù)Dtest,并對Dtrain進(jìn)一步分為n個任務(wù)組:Task1、Task2、…、Taskn。對于每一個任務(wù)組,其內(nèi)部均選取同一種關(guān)系的三元組,分別作為該組任務(wù)的訓(xùn)練支持集Strain和訓(xùn)練查詢集Qtrain。
如圖4中的任務(wù)劃分方式,即使某一類的故障樣本數(shù)量較稀少,也可通過在任務(wù)中重復(fù)使用該樣本以實現(xiàn)數(shù)據(jù)增強,解決了樣本數(shù)量少和稀缺故障難提取的問題。
針對實際工況下故障數(shù)據(jù)稀缺的問題提出MetaF算法,該算法基于元學(xué)習(xí)的鏈接預(yù)測算法融入了同一故障簇鄰域的負(fù)樣本生成策略。對于知識圖譜算法而言,生成負(fù)樣本的目標(biāo)是提供高質(zhì)量的負(fù)三元組樣本,隨機生成的負(fù)樣本對于故障診斷鏈接預(yù)測算法的訓(xùn)練并無實際意義,會對最終訓(xùn)練結(jié)果產(chǎn)生影響。受知識圖譜推理算法RippleNet[17]啟發(fā),同一故障簇鄰域的負(fù)樣本生成策略模擬了水波紋的傳播方式,在知識圖譜中以需要替換的頭實體或尾實體為種子,在限定范圍的區(qū)域內(nèi)以種子為中心向外逐層查詢其他節(jié)點與待替換節(jié)點的相似度,其擴(kuò)散查詢方式如圖5所示。
(8)
(9)
(10)
(11)
(12)
當(dāng)替換頭實體時,生成的負(fù)樣本三元組S如式(13)所示,當(dāng)替換尾實體時,生成的負(fù)樣本三元組S如式(14)所示。因為替換的節(jié)點是與起始節(jié)點相似度最小的,所以對應(yīng)的三元組應(yīng)被作為故障推理模型訓(xùn)練時的負(fù)例學(xué)習(xí),以獲得較高質(zhì)量的故障關(guān)聯(lián)信息學(xué)習(xí)。
(13)
(14)
MetaF算法結(jié)構(gòu)如圖6所示。設(shè)置MetaF為兩層結(jié)構(gòu),通過鄰域負(fù)樣本生成策略構(gòu)建三元組負(fù)例,分別實現(xiàn)在支持集中關(guān)系元信息的學(xué)習(xí),以及查詢集中新實例的任務(wù)學(xué)習(xí)。MetaF在每一輪任務(wù)學(xué)習(xí)中進(jìn)行關(guān)系元的更新和故障類型的鏈接預(yù)測,即通過訓(xùn)練數(shù)據(jù)更新關(guān)系元和梯度元,預(yù)測與給定缺失三元組具有關(guān)系的故障實體節(jié)點,預(yù)測結(jié)果為故障診斷的結(jié)果。
MetaF在小樣本情況下的故障診斷主要步驟如下:
在支持集中,對輸入的三元組(hi,ti,ri),通過關(guān)系元學(xué)習(xí)器計算其關(guān)系元信息RTr,在關(guān)系元學(xué)習(xí)器中L層的神經(jīng)網(wǎng)絡(luò)計算對應(yīng)輸入三元組的關(guān)系元信息R(hi,ti),如式(15)~式(17)所示,其中L為神經(jīng)網(wǎng)絡(luò)層數(shù)且l∈(1,2,…,L-1),Wl為第l層權(quán)重,bl為第l層偏置項。
(15)
(16)
(17)
對于提取到的多個關(guān)系元信息,使用求平均的方法計算該趟任務(wù)的關(guān)系元信息RTr,如式(18)所示,其中K表示該趟任務(wù)參與訓(xùn)練的關(guān)系元數(shù)量。
(18)
依據(jù)知識圖譜鏈接預(yù)測算法TransE,計算當(dāng)前關(guān)系元RTr對于三元組的尾節(jié)點S(hi,ti),此處使用的評分函數(shù)如式(19)所示,其中‖x‖表示計算向量x的L-2范數(shù),且S(hi,ti)取值越低表示三元組計算結(jié)果越準(zhǔn)確,反之則表示該三元組為負(fù)樣本。
(19)
(20)
依據(jù)損失函數(shù)L(Sr)的計算,可以計算該關(guān)系元的梯度以指導(dǎo)參數(shù)變化。梯度元GTr的計算如式(21)所示:
(21)
(22)
實現(xiàn)關(guān)系元的更新后,即可在查詢集中鏈接預(yù)測未知三元組(hj,tj,rj)′的對應(yīng)故障尾節(jié)點S(hj,tj),且在查詢集中的得分函數(shù)和損傷分別如式(23)和式(24)所示:
(23)
(24)
為驗證MetaF在知識圖譜網(wǎng)絡(luò)中的鏈接預(yù)測能力,以及小樣本情況下算法的有效性,選擇公開數(shù)據(jù)集NELL-One作為實驗的基準(zhǔn)數(shù)據(jù)集。NELL數(shù)據(jù)集是在互聯(lián)網(wǎng)信息中自動抽取新知識的知識庫,NELL-One是NELL知識圖譜數(shù)據(jù)集的子集,其根據(jù)關(guān)系出現(xiàn)的次數(shù),選擇小于500次且大于50次的三元組,提取并重新組合為數(shù)據(jù)集,常用于驗證算法在小樣本情況下知識圖譜的鏈接預(yù)測能力。
為評估模型效果,根據(jù)關(guān)系出現(xiàn)的頻率確定三元組出現(xiàn)的頻率,定義出現(xiàn)頻率較低的關(guān)系為目標(biāo)關(guān)系,用于評估小樣本情況下的效果,非低頻關(guān)系為背景關(guān)系。采用Pre-Train和In-Train兩種模型訓(xùn)練方法分別評估其效果,Pre-Train在模型訓(xùn)練前結(jié)合背景關(guān)系進(jìn)行模型預(yù)訓(xùn)練,In-Train為直接使用背景關(guān)系和目標(biāo)關(guān)系直接訓(xùn)練模型。選擇MRR、Hits@10、Hits@5、Hits@1作為實驗評估指標(biāo),MRR為測試集數(shù)據(jù)上的平均排名,Hits@10、Hits@5、Hits@1分別為正確結(jié)果在預(yù)測結(jié)果中排名前10、前5、前1的比例。對比試驗選擇的模型為FSRL[14]、GANA[15]、MetaR[16]算法,分別在1-shot和5-shot兩種情況下進(jìn)行實驗,實驗結(jié)果如表1和表2所示。
表1 1-shot實驗結(jié)果 %
表2 5-shot實驗結(jié)果 %
根據(jù)實驗結(jié)果可看出,由MetaR優(yōu)化得到的MetaF在1-shot和5-shot兩種情況下,于In-Train的模型訓(xùn)練中均取得了優(yōu)于原始模型的效果。對于FSRL模型,MetaF在MRR上獲得了3.7%(1-shot)和2.5%(5-shot)的提升,在Hits@10上獲得了2.1%(1-shot)和3.2%(5-shot)的提升;而對于GANA模型,MetaF在MRR上獲得了2.5%(1-shot)和0.8%(5-shot)的提升,在Hits@10上獲得了1.9%(1-shot)和0.9%(5-shot)的提升,說明MetaF在鏈接預(yù)測的性能上與當(dāng)前主流方法基本一致。在Pre-Train訓(xùn)練中,MetaF與MetaR相比并未取得明顯的進(jìn)步,由于Pre-Trian過程會對實體嵌入進(jìn)行預(yù)訓(xùn)練,且根據(jù)負(fù)樣本生成策略增加了數(shù)據(jù)集中僅出現(xiàn)一次的三元組數(shù)量,因此影響了MetaF在知識圖譜中鏈接預(yù)測的表現(xiàn)。對于In-Train訓(xùn)練,MetaF較MetaR在MRR上取得了5.2%(1-shot)和2.2%(5-shot)的進(jìn)步,而對于發(fā)現(xiàn)相似故障列表最有評估價值的Hits@10,MetaF較MetaR取得了7.7%(1-shot)和2.9%(5-shot)的進(jìn)步。說明MetaF可有效在包含背景知識的訓(xùn)練過程In-Trian中進(jìn)行鏈接預(yù)測任務(wù)。
故障診斷實驗分為設(shè)備故障信息知識圖譜的構(gòu)建和MetaF故障推理兩個部分,首先抽取故障數(shù)據(jù)集特征信息并構(gòu)建知識圖譜,將圖譜以三元組的形式存儲于txt文本文檔和csv文件中,并將圖譜導(dǎo)入Neo4j數(shù)據(jù)庫,MetaF模型使用PyTorch包構(gòu)建模型進(jìn)行訓(xùn)練。
2.2.1 數(shù)據(jù)集介紹
實驗選取設(shè)備故障診斷領(lǐng)域常用的美國凱斯西儲大學(xué)(Case Western Reserve University,CWRU)滾動軸承故障數(shù)據(jù)集,已有多篇文獻(xiàn)使用該數(shù)據(jù)集驗證算法[18-19]。CWRU數(shù)據(jù)集包含由加速度傳感器采集的軸承振動信號數(shù)據(jù)和對應(yīng)的機理說明文檔。CWRU數(shù)據(jù)包括在軸承試驗臺驅(qū)動端(Drive)、風(fēng)扇端(Fan)和基座端(Base)采集的振動信號。采用電火花加工單點損傷,損傷直徑有0.007英寸、0.014英寸、0.021英寸3種,損傷部位有內(nèi)圈、外圈和滾動體3種,其中外圈損傷點分別在3點鐘、6點鐘、12點鐘的方位設(shè)置。
2.2.2 設(shè)備故障信息知識圖譜的構(gòu)建
實驗選取了CWRU數(shù)據(jù)集中所有12 kHz數(shù)據(jù),根據(jù)數(shù)據(jù)集的文本規(guī)則描述,對數(shù)據(jù)進(jìn)行分類提取,總結(jié)出5種分類可以為數(shù)據(jù)進(jìn)行劃分,具體為:端點、故障點位置、損傷深度、載荷和檢測位置,如表3所示。
表3 CWRU數(shù)據(jù)集分類規(guī)則
根據(jù)以上分類規(guī)則,可得圖譜中節(jié)點間的對應(yīng)關(guān)系,如表4所示。根據(jù)每一個故障采樣片段在5個維度上的屬性值,得到故障時序片段節(jié)點和故障類型節(jié)點間的連接關(guān)系。
表4 節(jié)點間對應(yīng)關(guān)系
根據(jù)設(shè)備故障信息知識圖譜的節(jié)點定義和數(shù)據(jù)關(guān)系,對軸承故障信號劃分片段并進(jìn)行變分模態(tài)分解,生成的特征向量與節(jié)點結(jié)合構(gòu)建知識圖譜,提取到1 196個實體和6種關(guān)系,構(gòu)建得到的知識圖譜局部結(jié)構(gòu)如圖7所示,其描述了CWRU軸承故障數(shù)據(jù)在端點、故障點位置、損傷深度、載荷和檢測位置這5種維度下的關(guān)聯(lián)方式,并實現(xiàn)了不同類型故障下的故障片段間的知識鏈接。知識圖譜中任意兩個故障時序片段節(jié)點間的距離均為兩跳,中間由與其相關(guān)聯(lián)的故障類型節(jié)點連接,這樣的結(jié)構(gòu)便于在某一區(qū)域內(nèi)鏈接預(yù)測故障片段真正的故障類型。
2.2.3 故障推理實驗和分析
為驗證在小樣本條件下,MetaF可以較好地完成故障推理任務(wù),選取4種不同工況下的設(shè)備正常運行數(shù)據(jù)為基準(zhǔn),并以9:1的比例將正常數(shù)據(jù)與故障數(shù)據(jù)混合,構(gòu)建小樣本故障數(shù)據(jù)集,數(shù)據(jù)集的劃分如表5所示。
表5 小樣本故障數(shù)據(jù)集劃分方法
分別測試4組小樣本數(shù)據(jù)集在MetaF數(shù)據(jù)集上的表現(xiàn)效果,以平均排名MRR和精確率Precision為評價指標(biāo),驗證算法推理故障實體的能力。MetaF由鄰域負(fù)樣本生成模塊和故障鏈接預(yù)測模塊組成,因此設(shè)置移除鄰域負(fù)樣本生成模塊作為消融實驗對照組,記為模型M_min,該組實驗僅使用隨機生成的負(fù)樣本,以驗證負(fù)樣本生成策略的有效性,故障診斷實驗和消融實驗如表6所示。
表6 故障診斷實驗和消融實驗 %
由表6的故障診斷實驗結(jié)果可以看出,MetaF在4組故障樣本稀疏的數(shù)據(jù)集上均表現(xiàn)出較為均衡的效果,并未因為故障類型的不同導(dǎo)致模型性能的變化。對于表6中作為對照的消融實驗結(jié)果,MetaF比作為對照的M_min,在MRR和Precision上均有提升,對于4個數(shù)據(jù)集,MetaF在MRR上的提升分別為6.8%、6.4%、7.3%和7.2%,并且MetaF在Precision上的提升分別為14.1%、14.0%、13.6%和13.2%,說明鄰域負(fù)樣本生成模塊的加入有效提高了MetaF推理故障實體的能力,同時表明MetaF在小樣本數(shù)據(jù)的故障診斷中表現(xiàn)良好。
由于傳統(tǒng)基于數(shù)據(jù)驅(qū)動的故障診斷方法無法結(jié)構(gòu)化管理故障特征信息,在故障數(shù)據(jù)內(nèi)容發(fā)生變化時,需要重新訓(xùn)練模型。而基于知識圖譜的方法因為已有對故障信息的描述,在理論上具有一定程度的優(yōu)勢,選取DS_01小樣本數(shù)據(jù)集為實驗數(shù)據(jù),驗證知識圖譜方法對比數(shù)據(jù)驅(qū)動方法,在模型收斂速度和運行時間上的優(yōu)勢。選取故障診斷領(lǐng)域常用的LSTM算法[20]與MetaF算法對比,模型的損失值曲線對比如圖8所示,平均運行時間對比如圖9所示。
根據(jù)實驗結(jié)果顯示,MetaF獲得了比數(shù)據(jù)驅(qū)動的LSTM算法更快的模型收斂速度和更短的平均運行時間,說明基于知識圖譜的方法在模型的運行速度和運行時間上優(yōu)于基于數(shù)據(jù)的方法,MetaF依賴結(jié)構(gòu)化的故障信息存儲,有效利用了已知信息加快故障樣本向量計算的速度,實現(xiàn)故障診斷的效率提升。
2.2.4 相似故障查詢結(jié)果和分析
MetaF實現(xiàn)相似故障查詢的流程如圖10所示,在輸入故障采樣片段后,MetaF通過知識圖譜中已有故障信息確定樣本故障類型并更新模型,得到故障類型后更新知識圖譜,最后在更新的節(jié)點鄰域內(nèi)進(jìn)行可視化的相似故障查詢。
實驗隨機選取CWRU數(shù)據(jù)驗證集中的一段采樣片段作為輸入,采樣長度為1 600,將該采樣片段進(jìn)行模態(tài)分解后輸入MetaF模型進(jìn)行故障類型的診斷,并根據(jù)診斷結(jié)果進(jìn)行相似故障查詢,查詢結(jié)果如圖11所示。根據(jù)輸入的故障片段,可查詢出一組目標(biāo)相似故障簇,以及3組其他相似故障簇。
對于查詢得到的相似故障列表,根據(jù)故障向量間的歐式距離進(jìn)行故障相似度的評分,對于任一組故障向量P={p1,p2,…,pk}和Q={q1,q2,…,qk},其故障相似度Fault_Similarity計算方法如式(25)所示,式中k表示向量的維數(shù)。
(25)
根據(jù)輸入的故障片段,分別與求得的相似故障列表中每一項計算其故障相似度,得到評分結(jié)果統(tǒng)計如圖12所示。
根據(jù)評分結(jié)果,可得片段141130020、片段141230070、片段141230040、片段141230010這4組數(shù)據(jù)與輸入故障最相似,進(jìn)一步查表可得這4組數(shù)據(jù)與輸入故障均為故障類型faultType = {point:Drive,located:B,deepth:007,load:1}。在推理的14個相似故障中發(fā)現(xiàn)4個故障樣本與輸入故障相似,則稱目標(biāo)相似故障簇的樣本檢出率為28.6%。通過該組相似故障查詢實驗,可說明本文提出的方法在故障診斷應(yīng)用上的有效性。為進(jìn)一步說明MetaF的故障推理能力較于MetaR有提升,分別對比兩種模型在相似故障查詢中目標(biāo)相似故障簇的樣本檢出率。設(shè)置實驗分別在相似故障列表長度為10、15、20的情況下進(jìn)行,每組實驗進(jìn)行10次取其結(jié)果的平均值,實驗結(jié)果如表7所示。
表7 目標(biāo)相似故障簇的樣本檢出率 %
由表7的實驗結(jié)果可看出,MetaF在相似故障列表長度分別為10、15、20時,MetaF相較于MetaR提升了11.1%、6.4%、8.5%,說明同一故障簇鄰域負(fù)樣本生成策略的加入提升了模型故障診斷的能力,并通過相似故障查詢有效輔助了故障決策。
2.2.5 實際工程應(yīng)用案例分析
以電力變壓器故障數(shù)據(jù)診斷為例,驗證MetaF發(fā)現(xiàn)設(shè)備故障和相似故障查詢的有效性。電力變壓器運行數(shù)據(jù)包括正常運行以及低能放電、低溫過熱、高能放電、高溫過熱、中低溫過熱和中溫過熱這6種故障。依據(jù)5種變壓器綜合故障特征,定義變壓器數(shù)據(jù)標(biāo)簽為fault_tag={feature01,feature02,feature03,feature04,feature05},5種特征分別對應(yīng)變壓器五種油中溶解氣體含量計算得到的特征值,將已有數(shù)據(jù)劃分為DGA_01={正常運行,低能放電,低溫過熱},DGA_02={正常運行,高能放電,高溫過熱},DGA_03={正常運行,中低溫過熱、中溫過熱}3組實驗數(shù)據(jù),將正常數(shù)據(jù)和故障數(shù)據(jù)以9:1的比例混合,分別在3個數(shù)據(jù)集上進(jìn)行知識圖譜構(gòu)建,并在圖譜基礎(chǔ)上完成故障診斷任務(wù)。變壓器故障圖譜的構(gòu)建及其故障診斷結(jié)果分別如圖13和圖14所示。
圖14分別是MetaF在3組變壓器故障數(shù)據(jù)的精確率和相似故障的樣本檢出率,可看出相較于CWRU數(shù)據(jù)集,變壓器數(shù)據(jù)獲得了更高的相似故障樣本檢出率,這是由于變壓器數(shù)據(jù)構(gòu)建的知識圖譜結(jié)構(gòu)相對簡單,因此獲得了更高的相似故障命中。根據(jù)實驗驗證了MetaF在完成較高準(zhǔn)確度的故障診斷時,還可提供較好的相似故障查詢,有效輔助了設(shè)備故障診斷決策。
針對小樣本情況下難以構(gòu)建故障數(shù)據(jù)知識圖譜,從而導(dǎo)致推理算法無法準(zhǔn)確實現(xiàn)故障診斷的問題,本文提出一種基于元學(xué)習(xí)的設(shè)備故障知識圖譜構(gòu)建及推理方法。該方法包括兩部分:第一部分為根據(jù)故障數(shù)據(jù)文本描述提取數(shù)據(jù)的分類規(guī)則,構(gòu)建本體模型的故障規(guī)則鏈,并提取故障數(shù)據(jù)中的特征信息作為故障規(guī)則鏈的數(shù)據(jù)信息,實現(xiàn)設(shè)備故障信息知識圖譜的構(gòu)建;第二部分利用同一故障簇鄰域范圍內(nèi)的負(fù)樣本生成策略,通過MetaF模型進(jìn)行小樣本情況下的故障診斷和相似故障列表查詢,實現(xiàn)對設(shè)備運行數(shù)據(jù)的故障診斷決策輔助。實驗結(jié)果表明,MetaF有效提高了在知識圖譜上推理的準(zhǔn)確率,并能有效利用設(shè)備運行數(shù)據(jù)構(gòu)建故障診斷領(lǐng)域知識圖譜,提供相似故障列表和可視化的相似故障簇,為故障診斷提供了有效的知識支撐。