高明哲 許愛強(qiáng) 唐小峰 張偉
當(dāng)前,模擬電路廣泛應(yīng)用于通信、控制、導(dǎo)航等電子系統(tǒng)中,隨著對(duì)電子系統(tǒng)可靠性需求的不斷提高,模擬電路的故障診斷技術(shù)也已成為當(dāng)前電路測(cè)試領(lǐng)域的研究熱點(diǎn)[1].統(tǒng)計(jì)數(shù)據(jù)表明,在數(shù)模混合的復(fù)雜電子系統(tǒng)當(dāng)中,超過80%的元件故障發(fā)生在模擬電路部分[2],然而模擬電路的故障診斷技術(shù)卻發(fā)展緩慢,難以達(dá)到實(shí)際應(yīng)用的需求.導(dǎo)致這種現(xiàn)象的原因主要有:1)模擬電路的故障現(xiàn)象十分復(fù)雜,任何一個(gè)元件的參數(shù)超出容差就屬故障,各類軟、硬故障及多重并發(fā)故障導(dǎo)致了模擬電路的故障狀態(tài)是無限的,故障特征可以是連續(xù)的[3?4];2)模擬電路的輸入–輸出關(guān)系十分復(fù)雜,電路響應(yīng)與元件參數(shù)往往呈非線性映射關(guān)系,且電路中還存在非線性元件,使得實(shí)際應(yīng)用中很難建立電路響應(yīng)的精確數(shù)學(xué)模型[1,4?5];3)由于各類因素的影響,模擬電路非故障元件的實(shí)際參數(shù)值會(huì)在標(biāo)稱值上下隨機(jī)波動(dòng),加之元件的非線性表征誤差、測(cè)試誤差等,使得診斷過程困難重重[1,4?6].
為解決上述關(guān)鍵問題,近年來國(guó)內(nèi)外許多學(xué)者對(duì)模擬電路的故障診斷方法開展了研究,研究成果主要集中于模擬電路的故障特征提取和故障模式分類這兩個(gè)關(guān)鍵環(huán)節(jié)上.在現(xiàn)階段故障特征提取的研究中,模擬電路常用的故障特征主要有:1)在被測(cè)電路(Circuit under test,CUT)的內(nèi)部測(cè)試節(jié)點(diǎn)直接測(cè)量節(jié)點(diǎn)電壓作為故障特征[2,6?8];2)通過直流和交流分析從CUT的時(shí)頻響應(yīng)中提取的故障特征,包括峰值增益及對(duì)應(yīng)的頻率和相位[9]、直流輸出電壓和3dB截止頻率等[10];3)通過信號(hào)處理得到的小波特征[1,11?12]、信號(hào)包絡(luò)特征[5]及其他高階統(tǒng)計(jì)量特征(如峰度、偏度、熵值等)[1,13?14].在故障模式分類的研究中,基于機(jī)器學(xué)習(xí)的故障分類方法是當(dāng)前研究最多的方向,所用到的算法主要有:反向傳播神經(jīng)網(wǎng)絡(luò)(Backward propagation neural network,BPNN)[4,9,14]、徑向基網(wǎng)絡(luò)(Radial basis function network,RBFN)[15]、支持向量機(jī)(Support vector machine,SVM)[4,16?17]、超限學(xué)習(xí)機(jī) (Extreme learning machine,ELM)[18]等.此外還有基于故障編碼[5]、類間距離[19]、貝葉斯法[16]等的故障分類器.然而,上述故障診斷方法存在三點(diǎn)不足:1)SVM、神經(jīng)網(wǎng)絡(luò)等分類算法的輸出僅僅是故障樣本對(duì)應(yīng)的故障類別標(biāo)簽,無法輸出其他診斷信息,如故障樣本屬于各故障類別的概率;2)在高維特征樣本的分類器設(shè)計(jì)中,故障特征的維數(shù)約簡(jiǎn)與分類器建模是分離進(jìn)行的,這樣就存在約簡(jiǎn)后輸入到分類器的特征與該分類器可能不是最佳匹配的問題[20];3)診斷實(shí)驗(yàn)中采用的故障多樣性較少,難以代表實(shí)際應(yīng)用中模擬電路的故障狀況[4].
2001年Tipping[21]提出的相關(guān)向量機(jī)(Relevance vector machine,RVM)是一種基于貝葉斯框架的機(jī)器學(xué)習(xí)算法,相比SVM 具有參數(shù)設(shè)置簡(jiǎn)單、稀疏度更高、概率式輸出、基函數(shù)不受Mercer條件限制等優(yōu)點(diǎn).但最初的RVM和SVM一樣是為二分類問題設(shè)計(jì)的,在多分類問題中需要建立多個(gè)RVM分類器.2010年牛津大學(xué)的Psorakis等[22]在傳統(tǒng)RVM的基礎(chǔ)上提出了直接多分類相關(guān)向量機(jī)(Multiclass relevance vector machine,mRVM),通過采用Multinomial probit函數(shù)代替?zhèn)鹘y(tǒng)RVM 中的Logistic sigmoid函數(shù)從而將單個(gè)模型的二分類推廣到多分類,并且能夠給出分類結(jié)果的后驗(yàn)概率.此外,鑒于RVM 具有良好的稀疏性,文獻(xiàn)[20,23?24]提出利用RVM進(jìn)行特征約簡(jiǎn),通過將線性核建立在原始特征空間并對(duì)特征維進(jìn)行冪變換擴(kuò)展,使之能對(duì)特征空間進(jìn)行稀疏,從而得到最適合該RVM分類器的特征向量.然而冪變換擴(kuò)展雖然保證了分類性能,但增加了模型訓(xùn)練的復(fù)雜度.
本文針對(duì)模擬電路故障診斷中的關(guān)鍵問題,提出了一種基于多核多分類相關(guān)向量機(jī)(Multi-kernel learning multiclass relevance vector machine,MKL-mRVM)的模擬電路故障診斷方法.所提方法沿用了文獻(xiàn)[4]中的故障診斷實(shí)施框架,首先,通過故障注入技術(shù)來生成實(shí)際應(yīng)用中可能出現(xiàn)的各類電路故障;然后,從頻率響應(yīng)中提取出用于診斷的最小模糊度特征(Minimum ambiguity features,MAF);最后,采用MKL-mRVM算法進(jìn)行故障模式分類,MKL-mRVM能夠?qū)λ崛〉腗AF的每一維建立非線性核,在保持原有分類能力的同時(shí),通過約束核系數(shù)實(shí)現(xiàn)原始特征空間的稀疏化,得到一組更適合該分類器的稀疏特征向量,同時(shí)基于貝葉斯框架的MKL-mRVM還能夠給出診斷結(jié)果的后驗(yàn)概率.Sallen-Key帶通濾波電路和Biquad低通濾波電路是國(guó)際上最常用的兩個(gè)驗(yàn)證診斷方法性能的基準(zhǔn)電路,本文以這兩個(gè)電路作為對(duì)象,驗(yàn)證所提方法的實(shí)用性.
本文的主要安排如下:第1節(jié)介紹了MKL-mRVM算法原理及訓(xùn)練流程,并分析了算法的計(jì)算復(fù)雜度;第2節(jié)介紹了模擬電路大規(guī)模故障診斷的實(shí)施框架,包括故障電路仿真、特征提取和故障分類的實(shí)現(xiàn);第3節(jié)將所提方法應(yīng)用到兩個(gè)CUT的故障診斷實(shí)驗(yàn)中,并與其他方法進(jìn)行了對(duì)比;第4節(jié)對(duì)文章進(jìn)行了總結(jié).
其中,kd為建立在每一維特征上的基本核函數(shù),βd為基本核函數(shù)對(duì)應(yīng)的加權(quán)系數(shù),βd的大小反映了該特征對(duì)分類結(jié)果的貢獻(xiàn)度.βd的值在模型訓(xùn)練中求出,若βd很小(如βd<10?10),則可認(rèn)為該特征對(duì)于分類結(jié)果沒有貢獻(xiàn),將其從特征空間中移除.
圖1 多核組合原理圖Fig.1Combination of multi-kernels
隨后建立核矩陣K∈RN×N,K的每一列kn=[k(x1,xn),k(x2,xn),···,k(xn,xn)]T反映了在核函數(shù)映射下觀測(cè)值xn與其他樣本的關(guān)聯(lián)性[22].mRVM引入了輔助變量Y∈RC×N來實(shí)現(xiàn)直接多分類,Y的概率分布與傳統(tǒng)RVM的回歸模型相同,即ycn~N(wckn,1)[21],其中W∈RC×N為MKL-mRVM模型的權(quán)重.Y的大小可以看作樣本所屬類別的排位:對(duì)于觀測(cè)值xn,ycn最大值所對(duì)應(yīng)的類別c即為xn所屬的類別,利用Multinomial probit函數(shù)[25]表示即為
根據(jù)貝葉斯框架,為保持模型稀疏,為權(quán)重W設(shè)置先驗(yàn)分布,并令先驗(yàn)分布中的超參數(shù)αcn服從超參數(shù)為γ、ν的伽馬分布.通過設(shè)置γ、ν取較小的值,訓(xùn)練后的權(quán)重W被約束在零點(diǎn)附近,使得模型為由極少數(shù)W為非零的相關(guān)向量(Relevance vectors,RV)組成的稀疏模型.記超參數(shù)αcn屬于矩陣A∈RC×N,則采用了多層貝葉斯結(jié)構(gòu)MKL-mRVM 模型結(jié)構(gòu)由圖2所示,其中,β和W是訓(xùn)練模型所要求解的變量,A、Y是求解過程的中間變量.由于引入了隱含變量Y,故參數(shù)求解采用了期望最大化(Expectation maximization,EM)算法.
圖2 MKL-mRVM模型結(jié)構(gòu)示意圖Fig.2Schematic diagram of MKL-mRVM
MKL-mRVM的訓(xùn)練是一個(gè)二型最大似然過程,訓(xùn)練過程迭代更新每個(gè)待求參數(shù)的值.在每一步迭代得到A的更新值后,采用EM 算法估計(jì)參數(shù)W、β、Y的更新值,其中M步估計(jì)W、β,E步估計(jì)Y.
首先求令邊際似然函數(shù)p(Y|A)最大化的超參數(shù)A的估計(jì)值.假定樣本n在各類別中共用一個(gè)超參數(shù)值αn,則超參數(shù)A的對(duì)數(shù)邊際似然函數(shù)lnp(Y|A)可寫為:
其中,C=I+KTA?1K,C∈RN×N.文獻(xiàn)[26]分析了RVM訓(xùn)練單步迭代的計(jì)算復(fù)雜度,指出訓(xùn)練時(shí)若將包含了所有樣本信息的整個(gè)核函數(shù)矩陣K代入模型會(huì)使算法的計(jì)算復(fù)雜度很高,因此采用了向模型中逐個(gè)添加樣本的增量訓(xùn)練方式來訓(xùn)練模型.將C進(jìn)行分解,得到:
其中,C?i為隔離樣本i之后的C,αi為樣本i對(duì)應(yīng)的超參數(shù),ki為樣本i所在的核函數(shù)序列.由此從L(A)中分解出樣本i對(duì)L(A)的單獨(dú)貢獻(xiàn)值:
由此求得當(dāng)前超參數(shù)矩陣A的更新值A(chǔ)?,符號(hào)?代表增量學(xué)習(xí)過程中模型當(dāng)前包含樣本數(shù)為M時(shí)的參數(shù)(M?N),因此A?∈RM×M,之后采用EM算法計(jì)算權(quán)重W的最大后驗(yàn)估計(jì)值:
其中,K?∈RM×N,為E步中隱變量Y期望的估計(jì)值.β的初始值為1/D,更新值通過求解式(9)的二次規(guī)劃來得到.
最后根據(jù)M步W和β的估計(jì)值,給出E步中隱變量Y的期望的更新值.隱變量Y為C×N維錐形截?cái)喔咚狗植?對(duì)于類別標(biāo)簽為i的樣本,yin期望的估計(jì)值由式(10)更新;對(duì)于其他類別為c的樣本(),ycn期望的估計(jì)值由式(11)更新[22].
其中,μ服從標(biāo)準(zhǔn)高斯分布,μ~N(0,1),Eμ[·]代表μ服從標(biāo)準(zhǔn)高斯分布時(shí)的期望,Φ代表高斯累積分布,定義為[22].
記X?為包含在模型中的樣本集合,訓(xùn)練開始令所有α=∞,此時(shí)X?為空集,隨后隨機(jī)選擇一個(gè)樣本作為初始樣本,為其超參數(shù)αi設(shè)置初始值
在隨后的迭代中,根據(jù)選擇的樣本計(jì)算
θi大小反映了該樣本對(duì)模型分類提供的額外信息量[19].θi>0說明該樣本對(duì)模型分類有益,需要將其加入X?并更新αi的值;θi<0說明該樣本為冗余樣本,需要將其超參數(shù)設(shè)置為αi=∞使其從X?中剔除.
當(dāng)所有θi>0的樣本均包含在X?中且相鄰兩步迭代中超參數(shù)的改變值|lnAk?lnAk?1|<ε(ε通常取 10?12),則判定模型收斂.
綜上所述,MKL-mRVM的迭代流程如下:
步驟1.初始化各模型參數(shù):根據(jù)目標(biāo)值t初始化Y,隨機(jī)選擇一個(gè)樣本i并根據(jù)式(12)為其超參數(shù)αi賦值,令其他α=∞;
步驟2.更新超參數(shù)A?:
a)根據(jù)式(13)計(jì)算樣本的θi,
b)若θi>0,則根據(jù)式(6)更新αi,
c)若θi<0且αi<∞,則令αi=∞;
步驟3.M步:根據(jù)式(8)更新?;
步驟4.求解式(9)的二次規(guī)劃更新;
步驟5.E步:根據(jù)式(10)、(11)更新;
步驟6.再次隨機(jī)選擇一個(gè)樣本,重復(fù)步驟2~步驟5,直至滿足收斂條件,訓(xùn)練結(jié)束.
模型訓(xùn)練完成后,模型參數(shù)W和β中的大部分值為零,因此模型在樣本空間和特征空間上均是稀疏的.對(duì)于新的輸入樣本xnew,MKL-mRVM的輸出為一系列后驗(yàn)概率
式(14)即新樣本屬于類別c的概率,而最大概率對(duì)應(yīng)的類別即為新樣本所屬的類別
MKL-mRVM每步迭代的計(jì)算復(fù)雜度取決于三點(diǎn):式(8)計(jì)算時(shí)的求逆運(yùn)算、式(9)特征權(quán)值的優(yōu)化以及式(10)、式(11)中更新值的估算.其中求逆運(yùn)算的復(fù)雜度為O(M3),特征權(quán)值優(yōu)化過程的計(jì)算復(fù)雜度取決于原始特征維數(shù)D,隱含變量更新值的計(jì)算復(fù)雜度主要取決于樣本類別數(shù)C.此外,模型訓(xùn)練的迭代步數(shù)很大程度上由訓(xùn)練樣本的數(shù)量決定,因此模型的總體訓(xùn)練時(shí)間取決于樣本類別數(shù)、訓(xùn)練樣本個(gè)數(shù)以及輸入的原始特征維數(shù).
本文所采用的模擬電路大規(guī)模故障診斷的實(shí)施框架源自文獻(xiàn)[4],如圖3所示.該框架分為故障電路生成、故障數(shù)據(jù)仿真、故障特征提取和故障模式分類4個(gè)階段.
模擬電路的故障通??煞譃橛补收虾蛙浌收?硬故障(如開路或短路)會(huì)造成電路拓?fù)浣Y(jié)構(gòu)的改變,使電路功能發(fā)生很大變化;軟故障指元件參數(shù)的實(shí)際值超出了容差范圍,從而導(dǎo)致電路工作性能下降.
在故障電路生成階段中,我們通過變異操作將多種故障注入到CUT中,得到一系列不同故障模式下的CUT變異體,故障生成所采用的變異操作見表1.其中,PCH為軟故障變異操作,我們?cè)O(shè)置故障的最小可檢測(cè)尺度(Minimum detectable fault size,MDFS)為2t(t為元件的容差值),采用均勻分布U(0.1Xn,Xn?2t)和U(Xn+2t,2Xn)(Xn為元件標(biāo)稱值)來分別表示元件的參數(shù)負(fù)向偏差(PCH↓)和參數(shù)正向偏差(PCH↑);ROP、LRB、GRB和NSP為硬故障變異操作,采用均勻分布U(100k?,1M?)和U(10?,1k?)來分別表示開路狀態(tài)和橋接狀態(tài)所用的阻值.
圖3 診斷實(shí)施框架示意圖Fig.3 Implementation framework of the diagnosis
將上一階段生成的故障CUT變異體和初始的無故障CUT輸入到基于Pspice內(nèi)核的仿真器中,以掃頻信號(hào)作為激勵(lì),得到各CUT的頻率響應(yīng)曲線的仿真數(shù)據(jù).鑒于元件參數(shù)存在一定的容差,我們假設(shè)各元件參數(shù)服從均值為標(biāo)稱值Xn,標(biāo)準(zhǔn)差為σ=tXn/3的高斯分布,隨后進(jìn)行n次Monte Carlo仿真得到各類CUT的仿真數(shù)據(jù)n組.
故障的特征值要滿足:1)在同一故障中相近;2)在不同故障間不同[1].本文從CUT的頻率響應(yīng)曲線中提取了最小模糊度特征(Minimum ambiguity features,MAF)作為故障特征.
2.3.1 模糊度模型
設(shè)s為一故障特征值,由于s的大小會(huì)隨著元件存在的容差而在一定范圍內(nèi)變動(dòng),故采用φ(s)來表示某一狀態(tài)下s的概率分布.CUT所處的狀態(tài)不同,對(duì)應(yīng)的分布φ(s)也不同.對(duì)于指定的兩類CUT故障fi和fj,定義二者在該特征下的模糊度為:
在實(shí)際計(jì)算中,我們采用核密度估計(jì)(Kernel density estimation,KDE)方法來求得故障特征值的概率分布函數(shù).假設(shè)一組觀測(cè)到的特征值,則采用KDE得到的概率分布函數(shù)為
其中,K為核函數(shù),h為平滑參數(shù).
圖4 模糊度示意圖Fig.4 Schematic diagram of ambiguity
2.3.2 最小模糊度特征
從CUT的工作頻率中采樣得到m個(gè)離散的頻率點(diǎn)作為特征集S={s1,s2,···,sm}, 每類故障都可得到一個(gè)基于該特征集的m×n維數(shù)據(jù)集Gm×n={G(s1),G(s2),···,G(sm)},n為故障數(shù)據(jù)仿真時(shí)的Monte Carlo仿真次數(shù).
對(duì)于兩類故障fi、fj及其對(duì)應(yīng)的故障數(shù)據(jù)集Gi、Gj,首先計(jì)算二者的各特征下的模糊度,然后二者的最小模糊度特征可由式(18)得到[4]:
Mi,j∈ S,其對(duì)應(yīng)的最小模糊度記作.通過各種故障兩兩之間的組合,可得到診斷任務(wù)所需的最小模糊度故障特征集S?.
根據(jù)最小模糊度特征集S?生成訓(xùn)練數(shù)據(jù)集來訓(xùn)練MKL-mRVM 分類器,對(duì)于新的樣本,MKL-mRVM 分類器能夠輸出該樣本的故障類別、診斷置信度以及最優(yōu)特征.診斷性能采用了文獻(xiàn)[1]提出的以下5個(gè)指標(biāo)來從多方面進(jìn)行評(píng)價(jià):
表1 變異操作Table 1 Mutation operators
本文的診斷實(shí)驗(yàn)包含兩個(gè)案例:案例1為Sallen-Key帶通濾波電路的診斷,注入故障數(shù)較少,主要用于詳細(xì)分析MKL-mRVM算法的診斷性能;案例2為Biquad低通濾波電路的診斷,注入故障數(shù)較多,主要用于驗(yàn)證MKL-mRVM算法對(duì)大規(guī)模故障診斷的可行性.
為比較診斷結(jié)果,將同樣采用核函數(shù)建模的SVM和核超限學(xué)習(xí)機(jī)(Kernel extreme learning machine,kELM)應(yīng)用于故障模式分類中,三種方法均使用高斯核函數(shù),并采用5折交叉驗(yàn)證法來選取平均驗(yàn)證誤差最小的模型參數(shù).其中,SVM采用一對(duì)一(One-against-one,OAO)法進(jìn)行多分類,一共需要構(gòu)建c(c?1)/2個(gè)SVM分類器.
仿真實(shí)驗(yàn)以Matlab 2015a作為實(shí)驗(yàn)平臺(tái),所有實(shí)驗(yàn)均在CPU為3.3GHz、內(nèi)存為16GB的PC上運(yùn)行.
3.1.1 實(shí)驗(yàn)設(shè)計(jì)
Sallen-Key帶通濾波電路的電路結(jié)構(gòu)如圖5所示,其中心頻率為25kHz.仿真實(shí)驗(yàn)注入14個(gè)軟故障,故障描述見表2,其中,無故障狀態(tài)下各元件參數(shù)的變動(dòng)范圍控制在容差的10%之內(nèi).
圖5 Sallen-Key帶通濾波電路結(jié)構(gòu)圖Fig.5 Sallen-Key band-pass filter circuit diagram
將從[0Hz,100kHz]頻率區(qū)間中等間隔離散化得到的1001個(gè)激勵(lì)信號(hào)輸入到仿真器中,設(shè)置Monte Carlo仿真次數(shù)n=200,得到每類200個(gè)故障樣本(共3000個(gè)).將故障樣本按類別平均分為2組,第一組作為訓(xùn)練樣本集,第二組作為測(cè)試樣本集.
表2 Sallen-Key帶通濾波電路故障描述Table 2 Faults in Sallen-Key band-pass filter
3.1.2 頻率響應(yīng)分析
圖6給出了f1、f4、f5、f7 4類故障模式與無故障狀態(tài)f0的頻率響應(yīng)曲線對(duì)比,可以看出在這4類軟故障中,f5與f0的頻率響應(yīng)特性最為接近,二者在大部分頻率點(diǎn)上存在重合,使得f5的診斷相對(duì)較難,余下三類故障模式與f0均在不同的頻率區(qū)間上可分.
通過各類樣本的模糊度分析,提取出該CUT故障的最小模糊度特征為S?=0,3.9,9.0,10.6,11.2,12.5,16.0,16.8,17.0,19.5,20.8,23.9,25.7,26.1,33.4,34.8,48.5,78.2,91.7,97.6,100.0(kHz),共21個(gè)頻率點(diǎn).
3.1.3 診斷性能比較
表3給出了按照所選特征頻率點(diǎn)三種方法的診斷性能及時(shí)間的比較,表中的粗體字代表了該項(xiàng)性能指標(biāo)中的最好結(jié)果,其中測(cè)試時(shí)間為1500個(gè)測(cè)試樣本的平均測(cè)試時(shí)間.通過表3可以看出:1)在診斷精度上,MKL-mRVM方法的精度最高,分類準(zhǔn)確度能夠達(dá)到96.40%,SVM 次之,略高于kELM;2)在訓(xùn)練時(shí)間上,kELM擁有最快的訓(xùn)練速度,SVM次之,而MKL-mRVM 的訓(xùn)練時(shí)間高達(dá)381.4s,這是由于MKL-mRVM較多的迭代步數(shù)極大地增加了總體訓(xùn)練時(shí)間,圖6顯示了MKL-mRVM的訓(xùn)練過程,算法在迭代1502步后收斂,迭代步數(shù)幾乎等于訓(xùn)練樣本數(shù);3)在平均測(cè)試時(shí)間上,kELM依然擁有最快的速度,SVM次之,MKL-mRVM略慢于SVM,這是由于MKL-mRVM 在測(cè)試中需要計(jì)算樣本屬于各類別的概率,而概率信息對(duì)于診斷結(jié)果的評(píng)價(jià)具有重要作用.
表3 三種方法的診斷性能對(duì)比Table 3 Diagnostic performance comparison of 3 methods
圖6 幾類故障的頻率響應(yīng)曲線Fig.6 Frequency response curves of faults
在MKL-mRVM的診斷結(jié)果中,所有故障模式里診斷正確率最低的是f5,對(duì)應(yīng)的正確率為89%,診斷正確率最高的是f4,對(duì)應(yīng)的正確率為98%,從診斷結(jié)果來看,MKL-mRVM對(duì)本案例中的各類故障模式均有較好的區(qū)分能力,并且診斷正確率和該故障模式與其他故障模式頻率響應(yīng)的相似度相關(guān),頻率響應(yīng)曲線越相似,診斷的正確率越低.
雖然MKL-mRVM 的訓(xùn)練時(shí)間較長(zhǎng),但其構(gòu)建分類模型實(shí)際用到的樣本很少.由圖7可以看出,由于采用了增量訓(xùn)練方法,MKL-mRVM在每一步迭代中僅對(duì)1500個(gè)訓(xùn)練樣本中的1個(gè)進(jìn)行學(xué)習(xí)來更新超參數(shù)矩陣A?,并根據(jù)更新后的α值來判斷該樣本是否保留在模型中.當(dāng)算法收斂時(shí),原有1500個(gè)訓(xùn)練樣本中的絕大多數(shù)樣本的超參數(shù)α=∞,僅保留了其中15個(gè)α<∞的樣本作為相關(guān)向量來構(gòu)建分類模型,因此在實(shí)際使用中可通過減少訓(xùn)練樣本的數(shù)量來減少模型的訓(xùn)練時(shí)間.文獻(xiàn)[27]提出了一種用于傳統(tǒng)RVM的訓(xùn)練樣本集精簡(jiǎn)方法,其基本思想利用Gram-Schmidt算法檢測(cè)樣本之間的線性相關(guān)性,從而剔除樣本集中的冗余樣本點(diǎn),理論上可以應(yīng)用到MKL-mRVM中.此外,對(duì)于已經(jīng)訓(xùn)練好的MKL-mRVM 分類模型,若有新的故障樣本出現(xiàn),MKL-mRVM能夠在原有分類模型的基礎(chǔ)上通過增量訓(xùn)練對(duì)新樣本進(jìn)行單獨(dú)學(xué)習(xí),通過算法流程的步驟2~5來快速更新模型參數(shù),無需納入之前的所有樣本重訓(xùn)模型,使得MKL-mRVM可以應(yīng)用到樣本序貫輸入的在線診斷中.
圖7 MKL-mRVM的迭代過程Fig.7 Diagnostic performance comparison of 3 methods
3.1.4 特征選擇及分類置信度分析
MKL-mRVM算法在輸入的21個(gè)原始故障特征上建立了基本核函數(shù),基本核函數(shù)的加權(quán)系數(shù)β可以表示故障特征對(duì)分類的重要程度.圖8顯示了模型訓(xùn)練后加權(quán)系數(shù)β的大小,可以看出,大多數(shù)的加權(quán)系數(shù)都在10?10以下,對(duì)應(yīng)的特征為無關(guān)特征,將其從模型中剔除,剩下系數(shù)較大的7個(gè)特征被認(rèn)為是重要特征,即MKL-mRVM所選擇的最能代表故障特點(diǎn)并將各類故障進(jìn)行區(qū)分的頻率點(diǎn)最小集合.根據(jù)訓(xùn)練結(jié)果,本案例的最優(yōu)特征集為Sopt=0,10.6,11.2,12.5,20.8,23.9,100.0(kHz).
MKL-mRVM分類器能夠輸出測(cè)試樣本屬于各類別的后驗(yàn)概率,因此可將分類結(jié)果對(duì)應(yīng)的概率大小作為診斷結(jié)果的置信度.為分析診斷結(jié)果與置信度的關(guān)系,我們從正確診斷的樣本和錯(cuò)誤診斷的樣本中各隨機(jī)挑選20個(gè)樣本,所選樣本的診斷結(jié)果與診斷置信度的關(guān)系如圖9所示.可以看出,診斷正確樣本的診斷置信度明顯高于診斷錯(cuò)誤樣本的診斷置信度.在本案例的所有測(cè)試樣本中,診斷正確的樣本平均診斷置信度達(dá)到0.8505,而診斷錯(cuò)誤的樣本平均診斷置信度僅為0.4103.因此,MKL-mRVM所輸出的概率信息能夠?qū)υ\斷結(jié)果的質(zhì)量進(jìn)行評(píng)價(jià),具有一定的實(shí)用價(jià)值.
圖8 故障特征對(duì)應(yīng)的加權(quán)系數(shù)值Fig.8 The weighting factors of fault features
圖9 診斷結(jié)果的置信度Fig.9 Confidence of diagnostic results
3.2.1 實(shí)驗(yàn)設(shè)計(jì)
Biquad低通濾波電路的電路結(jié)構(gòu)如圖10所示.該電路包含較多的元件數(shù)量,仿真實(shí)驗(yàn)共注入各類故障92個(gè),詳見表4,其中,軟故障PCH↓和PCH↑對(duì)應(yīng)的元件參數(shù)服從均勻分布U(0.1Xn,Xn?2t)和U(Xn+2t,2Xn),硬故障中,ROP、NSP接入的阻值服從均勻分布U(100k?,1M?),LRB、GRB接入的阻值服從均勻分布U(10?,1k?).
圖10 Biquad低通濾波電路結(jié)構(gòu)圖Fig.10 Biquad low-pass filter circuit diagram
圖11 幾類故障的頻率響應(yīng)曲線Fig.11 Frequency response curves of faults
將從[1Hz,200kHz]中等間隔離散化得到的1000個(gè)激勵(lì)信號(hào)輸入到仿真器中,設(shè)置Monte Carlo仿真次數(shù)n=100,得到每類100個(gè)故障樣本(共9300個(gè)).同樣按類別將其平均分為2組,分別作為訓(xùn)練樣本集和測(cè)試樣本集.
3.2.2 頻率響應(yīng)分析
圖11給出了9類故障模式與無故障狀態(tài)f0的頻率響應(yīng)曲線對(duì)比,可以直觀的看出f5、f19、f43、f48、f87 5類故障在所選頻率區(qū)間內(nèi)與f0有很好的可分性,f1與f0在部分區(qū)間內(nèi)可分,而f28、f64、f77與f0的頻率響應(yīng)極為相似,四者在絕大部分頻率點(diǎn)上重合.根據(jù)模糊度分析本案例共提取出NS?=350個(gè)最小模糊度特征.
3.2.3 診斷性能比較
由于許多故障模式的頻率響應(yīng)曲線和無故障狀態(tài)的頻率響應(yīng)曲線過于相似,使得分類器根據(jù)所選的特征頻率點(diǎn)依然難以精確地診斷出每類故障.因此,對(duì)于表4中的各類故障我們?cè)O(shè)置不同模糊組門限λ來給出故障所屬的模糊組.圖12給出了無故障狀態(tài)f0所對(duì)應(yīng)的模糊組,圖中λ所在圓的內(nèi)部所有的故障兩兩互為模糊組,當(dāng)λ=1時(shí)不存在模糊組,隨著λ減小,越來越多故障表現(xiàn)相似的故障類型落入到同一模糊組中,可以看出圖11中f28、f64、f77三類難以區(qū)分的故障均在f0的模糊組中.表5給出了不同模糊組門限λ下三種方法的診斷性能,在存在模糊組的前提下,只要診斷結(jié)果為實(shí)際故障所在模糊組中的任意一種故障我們就假定診斷正確.
通過表5可以看出:1)當(dāng)λ=1,即不考慮模糊組的情況下,三種方法的分類準(zhǔn)確率都比較低,同時(shí)故障誤判率也非常高,這是由于多種故障的頻率響應(yīng)曲線和f0非常接近,分類器難以將正常狀態(tài)從多類故障狀態(tài)中區(qū)分出來,隨著λ降低,征兆相似的故障故障不斷落入同一個(gè)模糊組中,在考慮模糊組的情況下,三種方法的分類準(zhǔn)確率也隨之上升,當(dāng)λ<0.5時(shí),MKL-mRVM的分類準(zhǔn)確率能夠達(dá)到85%以上;2)在不同模糊組的診斷中,MKL-mRVM均擁有最高的分類準(zhǔn)確率,SVM次之,kELM最低,MKL-mRVM在λ=0.3時(shí)的分類準(zhǔn)確率就已經(jīng)高于λ=0.1時(shí)SVM和kELM的分類準(zhǔn)確率;3)kELM 依然擁有最快的訓(xùn)練速度和測(cè)試速度,而MKL-mRVM的訓(xùn)練和測(cè)試速度最慢,模型的訓(xùn)練花費(fèi)了近6個(gè)小時(shí),較多的故障類別和特征維數(shù)大大增加了MKL-mRVM的訓(xùn)練時(shí)間.
圖12 不同門限下f0所在的模糊組Fig.12 Ambiguity groups of f0 under different thresholds
3.2.4 采用其他特征的診斷性能
雖然較多的訓(xùn)練樣本數(shù)以及特征數(shù)極大地增加了MKL-mRVM的訓(xùn)練時(shí)間,但MKL-mRVM從350個(gè)特征中提取了47個(gè)作為診斷的最優(yōu)特征,由于冗余信息被剔除,MKL-mRVM的分類準(zhǔn)確率明顯高于SVM和kELM.為比較故障特征以及最優(yōu)化約簡(jiǎn)對(duì)診斷性能的MKL-mRVM影響,表6給出了不考慮模糊組(λ=1)的情況下分別采用高階統(tǒng)計(jì)量(峰度結(jié)合偏度)[13]、電路規(guī)格參數(shù)(峰值增益和3dB截止頻率)[14]以及未經(jīng)約簡(jiǎn)的MAF作為特征時(shí)mRVM的診斷性能(由于不需要特征約簡(jiǎn)故采用mRVM),可以看出,相比本文提出的診斷方法,高階統(tǒng)計(jì)量和電路規(guī)格兩種特征雖然計(jì)算復(fù)雜度小,但診斷精度卻遠(yuǎn)遠(yuǎn)低于本文方法,難以應(yīng)對(duì)大規(guī)模故障診斷的需求,而未經(jīng)約簡(jiǎn)的MAF雖然使得訓(xùn)練時(shí)間得以縮短,但診斷精度不及本文所提方法.此外,盡管本文所提方法提高了故障診斷的準(zhǔn)確率,然而當(dāng)充分考慮現(xiàn)實(shí)中可能存在的各類故障時(shí),上述方法都難以取得比較理想的診斷精度,在大規(guī)模故障診斷中依然存在著許多模糊組.
表5 三種方法的診斷性能對(duì)比Table 5 Diagnostic performance comparison of 3 methods
表6 其他特征的診斷性能Table 6 Diagnostic performance of other features
本文提出了一種基于MKL-mRVM的模擬電路故障診斷方法,相比已有方法,本文方法的主要貢獻(xiàn)有:1)通過故障注入生成了參數(shù)連續(xù)的軟故障和各類硬故障,并考慮了非故障原件的參數(shù)容差,使故障樣本更貼合實(shí)際情況;2)MKL-mRVM能夠約簡(jiǎn)原始故障特征,減少冗余信息,使得故障診斷結(jié)果的準(zhǔn)確度更高;3)基于貝葉斯框架的MKL-mRVM分類算法能夠給出診斷結(jié)果的置信度.然而模擬電路的故障診斷是一個(gè)復(fù)雜的問題,本文所提方法在應(yīng)對(duì)大規(guī)模故障診斷時(shí)依然達(dá)不到理想的診斷精度,診斷結(jié)果依然存在著較多的模糊組,并且MKL-mRVM用于診斷時(shí)的訓(xùn)練時(shí)間較長(zhǎng),下一步的研究工作可集中于提高M(jìn)KL-mRVM的訓(xùn)練效率.