者 娜,劉才學(xué),楊泰波,何 攀,簡(jiǎn) 捷,王廣金
(中國(guó)核動(dòng)力研究設(shè)計(jì)院,成都 610200)
隨著核電站反應(yīng)堆運(yùn)行時(shí)間的推移,反應(yīng)堆某些零部件可能會(huì)因沖擊、振動(dòng)等因素而發(fā)生脫落。同時(shí),在核電站反應(yīng)堆安裝或檢修時(shí),存在著將金屬件遺留在反應(yīng)堆系統(tǒng)內(nèi)的風(fēng)險(xiǎn)。這些金屬部件會(huì)在冷卻劑的帶動(dòng)下不斷游動(dòng)而與壓力邊界產(chǎn)生碰撞,若不能及時(shí)將其發(fā)現(xiàn),將使壓力邊界遭到嚴(yán)重破壞而危及反應(yīng)堆安全。為了保證核電站反應(yīng)堆系統(tǒng)的安全性,通常核電現(xiàn)場(chǎng)會(huì)采用松脫部件監(jiān)測(cè)系統(tǒng)來(lái)對(duì)撞擊信號(hào)進(jìn)行監(jiān)測(cè),以識(shí)別是否存在松脫部件[1]。但在實(shí)際情況中,監(jiān)測(cè)系統(tǒng)可能會(huì)因?yàn)楝F(xiàn)場(chǎng)復(fù)雜的工況條件、環(huán)境因素等而記錄大量非撞擊信號(hào)的信號(hào),即脈沖尖峰信號(hào)、噪聲信號(hào)、自檢信號(hào)、噪聲波動(dòng)信號(hào)、通道閃斷信號(hào)。因此有必要從監(jiān)測(cè)系統(tǒng)采集到的信號(hào)中將真實(shí)撞擊信號(hào)識(shí)別出來(lái),以便于后期進(jìn)一步的松脫部件確認(rèn)。在國(guó)外,金屬撞擊信號(hào)識(shí)別過(guò)程主要依靠專(zhuān)家利用自身身經(jīng)驗(yàn)對(duì)監(jiān)測(cè)系統(tǒng)所采集的數(shù)據(jù)進(jìn)行分析以得出結(jié)論,可靠性依賴于專(zhuān)家的分析水平,并且無(wú)法避免數(shù)據(jù)量大耗時(shí)過(guò)長(zhǎng)的缺點(diǎn),一旦反應(yīng)堆存在金屬松脫部件,可能由于無(wú)法實(shí)時(shí)給出診斷結(jié)論而導(dǎo)致嚴(yán)重的后果,對(duì)核電運(yùn)行安全產(chǎn)生威脅。在國(guó)內(nèi),研究人員在采集端系統(tǒng)抗信號(hào)誤報(bào)警方法研究方面做了大量工作,取得了一些進(jìn)展,但目前核電站監(jiān)測(cè)系統(tǒng)由于外界干擾或其他因素導(dǎo)致的系統(tǒng)誤報(bào)警、誤觸發(fā)問(wèn)題仍然未得到有效解決,大量干擾信號(hào)導(dǎo)致的“誤觸發(fā)”給診斷人員及時(shí)給出診斷結(jié)論帶來(lái)了極大困難,因此,有必要利用智能識(shí)別手段來(lái)快速識(shí)別監(jiān)測(cè)系統(tǒng)已采集到的單個(gè)通道信號(hào)是否為金屬撞擊信號(hào)。反應(yīng)堆松脫部件的診斷主要包括金屬撞擊信號(hào)識(shí)別和綜合診斷兩個(gè)過(guò)程,診斷結(jié)果的準(zhǔn)確程度與能否準(zhǔn)確識(shí)別金屬撞擊信號(hào)直接相關(guān)。六類(lèi)信號(hào)中,撞擊信號(hào)來(lái)自外界真實(shí)撞擊,而其余信號(hào)并非由撞擊產(chǎn)生,如由于采集板卡的自激勵(lì)脈沖而產(chǎn)生的脈沖尖峰信號(hào),監(jiān)測(cè)系統(tǒng)為定期進(jìn)行自身性能檢驗(yàn)而通過(guò)力錘器產(chǎn)生的自檢信號(hào),由于監(jiān)測(cè)通道受外界運(yùn)行環(huán)境影響而產(chǎn)生的噪聲波動(dòng)信號(hào),由于電荷轉(zhuǎn)換器過(guò)載保護(hù)導(dǎo)致的通道閃斷。與干擾信號(hào)頻率分布雜亂無(wú)規(guī)律相比,實(shí)際的金屬撞擊信號(hào)中包含了多種頻率成分,且存在于某一較寬頻帶范圍內(nèi),若采用全頻帶范圍內(nèi)的單一特征作為信號(hào)特征,將很難全面描述撞擊信號(hào)與監(jiān)測(cè)系統(tǒng)所采集的其他信號(hào)之間的差異,這給金屬撞擊信號(hào)的識(shí)別工作帶來(lái)一定的困難,進(jìn)而影響后續(xù)松脫部件的精確診斷。
變分模態(tài)分解[2]是近些年國(guó)內(nèi)外學(xué)者廣泛關(guān)注的一種信號(hào)分解方法,它能將信號(hào)按照其頻率自低到高的順序,自適應(yīng)地分解為一定數(shù)目的固有模態(tài)分量(IMF),且分解過(guò)程中各分量頻帶無(wú)需人為干預(yù),非常適用于處理非線性、非平穩(wěn)信號(hào)。本文擬采用VMD方法將信號(hào)分解為若干個(gè)頻帶的分量并提取信號(hào)特征,以實(shí)現(xiàn)對(duì)信號(hào)的全面描述。但經(jīng)VMD處理后得到的信號(hào)特征維數(shù)過(guò)高,支持向量機(jī)等智能分類(lèi)方法分類(lèi)準(zhǔn)確率會(huì)隨著特征維數(shù)的上升而下降,且支持向量機(jī)這類(lèi)智能算法的分類(lèi)準(zhǔn)確率很大程度上取決于模型參數(shù)的的選擇[3-5]。因此,需要尋找一種新的算法來(lái)進(jìn)行信號(hào)的智能分類(lèi)。
隨機(jī)森林[6]是在20世紀(jì)80年代提出的分類(lèi)樹(shù)算法基礎(chǔ)上發(fā)展起來(lái)的一種無(wú)需調(diào)參的智能分類(lèi)算法,它通過(guò)多棵分類(lèi)樹(shù)的組合來(lái)實(shí)現(xiàn)分類(lèi),在處理高維數(shù)據(jù)方面具有明顯的優(yōu)勢(shì)。
針對(duì)上述問(wèn)題,筆者提出了一套新的反應(yīng)堆撞擊信號(hào)識(shí)別方法,采用VMD方法對(duì)信號(hào)進(jìn)行分解得到各IMF分量信號(hào),分別提取各分量信號(hào)的時(shí)域、頻域特征構(gòu)成原始信號(hào)特征向量,將原始信號(hào)特征向量作為輸入,信號(hào)類(lèi)型作為輸出,建立隨即森林分類(lèi)模型來(lái)實(shí)現(xiàn)反應(yīng)堆金屬撞擊信號(hào)的識(shí)別。
Dragomiretskiy等[7]于2014年提出了一種新的信號(hào)處理方法—變分模態(tài)分解,作為一種新的信號(hào)處理方法,變分模態(tài)分解具有自適應(yīng)、非遞歸特點(diǎn),該方法在變分框架內(nèi)來(lái)實(shí)現(xiàn)多成分信號(hào)的分解,通過(guò)迭代搜索變分模型的最優(yōu)解,確定各個(gè)模態(tài)分量的帶寬及其頻率中心,從而自適應(yīng)地實(shí)現(xiàn)包含多成分的信號(hào)中各個(gè)分量的有效分離,為從不同頻帶細(xì)致描述非線性且包含多種頻率成分的金屬撞擊信號(hào)提供了條件。
假定各個(gè)模態(tài)分量μk是頻率中心為wk的有限帶寬,則約束變分模型可表示為[8]
(1)
式中,k為最終分解得到的分量個(gè)數(shù)。
為獲得上述約束變分問(wèn)題的最優(yōu)解,引入二次懲罰參數(shù)α和拉格朗日乘子λ(t),將上述問(wèn)題轉(zhuǎn)換為非約束變分問(wèn)題來(lái)求解。其中,二次懲罰參數(shù)可很大程度上減少高斯噪聲帶來(lái)的影響,而拉格朗日乘子是常用的一種保持約束嚴(yán)格執(zhí)行的方式[9]。增廣的拉格朗日函數(shù)可表示為
(2)
至此,初始的變分問(wèn)題可通過(guò)拉格朗日法的交替方向乘子來(lái)實(shí)現(xiàn)求解,具體步驟如下:
步驟1 初始化μk、ωk、λ和n為0;
步驟2n=n+1,執(zhí)行整個(gè)算法循環(huán);
步驟4k=k+1,返回步驟3,重復(fù)至k=K時(shí)首個(gè)內(nèi)層循環(huán)結(jié)束;
步驟6k=k+1,返回步驟5,直至k=K時(shí)內(nèi)層第二個(gè)循環(huán)結(jié)束;
隨機(jī)森林算法是以CART決策樹(shù)作為弱分類(lèi)器的一種組合分類(lèi)算法,其本質(zhì)是一種由隨機(jī)生成的若干個(gè)決策樹(shù)組成的強(qiáng)分類(lèi)器[10]。它在實(shí)現(xiàn)分類(lèi)時(shí)要經(jīng)歷兩個(gè)過(guò)程,分別為生成決策樹(shù)過(guò)程和投票過(guò)程,其原理是針對(duì)原始樣本集,每次選擇樣本構(gòu)成一個(gè)容量小于原始訓(xùn)練樣本集的訓(xùn)練子集并對(duì)應(yīng)生成一棵決策樹(shù),再由N個(gè)決策樹(shù)構(gòu)成隨機(jī)森林完成對(duì)原始訓(xùn)練樣本的分類(lèi)訓(xùn)練。其中,選擇子集的和生成決策樹(shù)的過(guò)程均是隨機(jī)的。
隨機(jī)森林是一種典型的Bagging方法,它應(yīng)用自助法(bootstrap)重采樣技術(shù)生成多個(gè)決策樹(shù)分類(lèi)器。決策樹(shù)的生長(zhǎng)步驟如下:
步驟1 從由M個(gè)樣本數(shù)據(jù)構(gòu)成的初始訓(xùn)練集數(shù)據(jù)中有放回地隨機(jī)選擇樣本數(shù)據(jù)構(gòu)成一個(gè)樣本數(shù)量為N(N 步驟2 針對(duì)具有K個(gè)特征屬性的樣本子集,在單棵決策樹(shù)的各個(gè)節(jié)點(diǎn)處,隨機(jī)地從K個(gè)特征屬性中選擇m個(gè)特征屬性,并且以節(jié)點(diǎn)不純度最小為標(biāo)準(zhǔn)從上述特征屬性中選擇某個(gè)特征屬性進(jìn)行分裂生長(zhǎng),重復(fù)上述過(guò)程直至該決策樹(shù)遍歷所有的特征屬性。在整個(gè)森林的生長(zhǎng)過(guò)程中m將保持恒定。 隨機(jī)森林中的單棵決策樹(shù)從根節(jié)點(diǎn)開(kāi)始對(duì)訓(xùn)練樣本子集進(jìn)行劃分,它是一種自上而下遞歸分裂產(chǎn)生的二叉樹(shù)。決策樹(shù)分裂過(guò)程,是以分裂節(jié)點(diǎn)不純度最小為原則分裂為兩個(gè)節(jié)點(diǎn),規(guī)則不變依次分裂直至滿足分支終止規(guī)則時(shí)分裂終止。 隨機(jī)森林采用的CART決策樹(shù)在節(jié)點(diǎn)處隨機(jī)選擇特征屬性的過(guò)程中,其選擇標(biāo)準(zhǔn)為各個(gè)節(jié)點(diǎn)Gini不純度最低。Gini不純度可表示為 (3) 式中:G(i)為節(jié)點(diǎn)i的不純度,設(shè)Pw是節(jié)點(diǎn)i上樣本屬于w類(lèi)(假設(shè)樣本的特征屬性數(shù)量為W)的頻率。 圖1為單棵決策樹(shù)的結(jié)構(gòu)示意圖,t0為根節(jié)點(diǎn),ti(i≥1)表示分裂節(jié)點(diǎn),Nt表示終端節(jié)點(diǎn)。 圖1 決策樹(shù)結(jié)構(gòu)示意Fig.1 Decision tree structure 生成若干個(gè)決策樹(shù)后,由全部決策樹(shù)構(gòu)成隨機(jī)森林分類(lèi)器。采用隨機(jī)森林分類(lèi)器對(duì)樣本數(shù)據(jù)進(jìn)行分類(lèi)時(shí),最終的分類(lèi)結(jié)果是通過(guò)對(duì)各決策樹(shù)的分類(lèi)結(jié)果進(jìn)行投票來(lái)確定的,投票過(guò)程可表示如下 (4) 式中:nt為構(gòu)成隨機(jī)森林的決策樹(shù)個(gè)數(shù);I(*)為性函數(shù);nhi,C為決策樹(shù)hi對(duì)預(yù)測(cè)類(lèi)樣本C的分類(lèi)結(jié)果;nhi是決策樹(shù)hi的葉子結(jié)點(diǎn)數(shù)。 經(jīng)投票后,生成混淆表CM,它是一個(gè)nc×nc表。表中的元素cm(ω≠∈)表示類(lèi)型ω被分類(lèi)為類(lèi)型∈的次數(shù),僅當(dāng)(ω=∈)時(shí),cm(ω,ω)表示類(lèi)型ω被分類(lèi)正確的個(gè)數(shù)。隨機(jī)森林分類(lèi)正確率CRT為 (5) 隨機(jī)森林的分類(lèi)原理決定了它在處理數(shù)據(jù)時(shí),能夠避免由于模型輸入數(shù)據(jù)維數(shù)上升而使得分類(lèi)精度下降的情況,保證了在原始信號(hào)特征維數(shù)較大的情況下,仍能獲得良好的分類(lèi)效果。 本研究采用VMD和隨機(jī)森林相結(jié)合的方法進(jìn)行反應(yīng)堆金屬撞擊信號(hào)的識(shí)別,具體流程如下: 步驟1 對(duì)原始信號(hào)進(jìn)行VMD分解,得到分解后的N個(gè)固有模態(tài)分量信號(hào); 步驟2 針對(duì)每一個(gè)IMF分量信號(hào),提取16個(gè)時(shí)域特征量[11],如峭度、方根幅值、偏斜度指標(biāo)等,時(shí)域特征參數(shù)反映了信號(hào)時(shí)域振動(dòng)幅值、能量以及時(shí)間序列分布情況,同時(shí)根據(jù)式(6)、式(7)和式(8),提取3個(gè)時(shí)域特征量,式(6)為標(biāo)準(zhǔn)差計(jì)算公式,式(7)為衡量數(shù)據(jù)穩(wěn)態(tài)變化的指標(biāo),式(8)為衡量信號(hào)突變的程度。針對(duì)各IMF分量信號(hào)頻譜,提取13個(gè)頻域特征量[12],如重心頻率、均方頻率、頻率方差等,它們反映了振動(dòng)信號(hào)頻譜集中程度、主頻帶位置的變化等頻域情況,將上述32個(gè)指標(biāo)作為此IMF的特征; (6) (7) F3=max{|xi|}/F2 (8) 步驟3N個(gè)固有模態(tài)分量信號(hào)的特征構(gòu)成一個(gè)包含N×32個(gè)元素的特征向量,作為原始信號(hào)的特征向量; 步驟4 將上述過(guò)程提取的原始信號(hào)特征向量作為輸入,信號(hào)類(lèi)別作為輸出,建立隨機(jī)森林模型,利用測(cè)試樣本驗(yàn)證模型分類(lèi)的準(zhǔn)確程度。 圖2為反應(yīng)堆金屬撞擊信號(hào)識(shí)別流程圖。 圖2 反應(yīng)堆金屬撞擊信號(hào)識(shí)別流程Fig.2 Recognition process of reactor metal impact signal 數(shù)據(jù)來(lái)源為國(guó)內(nèi)某核電站現(xiàn)場(chǎng)LPMS監(jiān)測(cè)系統(tǒng)記錄的數(shù)據(jù),LPMS系統(tǒng)主要由加速度傳感器、信號(hào)調(diào)理、數(shù)據(jù)采集卡(A/D轉(zhuǎn)換)、數(shù)字信號(hào)處理芯片、計(jì)算機(jī)構(gòu)成。加速度傳感器布置在反應(yīng)堆壓力容器頂部和底部,監(jiān)測(cè)系統(tǒng)的采樣頻率為50 kHz,采樣時(shí)間為1 s。本研究中獲得的樣本包含六種信號(hào)類(lèi)型數(shù)據(jù),信號(hào)類(lèi)型分別為撞擊信號(hào)、自檢信號(hào)、噪聲信號(hào)、脈沖尖峰信號(hào)、通道閃斷信號(hào)、噪聲波動(dòng)信號(hào),六類(lèi)信號(hào)時(shí)域波形如圖3所示。將樣本分為訓(xùn)練集和測(cè)試集,其中訓(xùn)練集樣本容量和測(cè)試集樣本容量分別為800和240,樣本數(shù)量如表1所示。 表1 各類(lèi)信號(hào)樣本數(shù)量 筆者以金屬撞擊信號(hào)為例,說(shuō)明VMD分解和特征提取過(guò)程。首先對(duì)原始信號(hào)進(jìn)行VMD分解,研究表明[13],模態(tài)分量的分解層數(shù)影響著VMD分解結(jié)果的合理性,理論上經(jīng)VMD分解后得到的各個(gè)模態(tài)分量信號(hào)的頻率分布情況為由低到高,當(dāng)最后一個(gè)分量信號(hào)的中心頻率第一次達(dá)到最大值時(shí)的分解層數(shù)即為最佳分解層數(shù),本研究中通過(guò)觀察最后一個(gè)分量信號(hào)的中心頻率確定出VMD最佳分解層數(shù)為4,信號(hào)分解后得到由低頻到高頻分布的4個(gè)IMF分量,如圖4所示。然后求取各個(gè)IMF分量信號(hào)的頻譜,結(jié)果如圖5所示。 其次,根據(jù)特征計(jì)算公式提取撞擊信號(hào)IMF1分量信號(hào)的19個(gè)時(shí)域特征量,以及13個(gè)頻域特征量,依次提取IMF2、IMF3及IMF4的相同特征。將從4個(gè)IMF分量信號(hào)及其頻譜中提取出的128個(gè)特征量作為原始信號(hào)的一組特征向量。同理,對(duì)脈沖尖峰信號(hào)、噪聲信號(hào)、自檢信號(hào)、噪聲波動(dòng)信號(hào)以及通道閃斷信號(hào)提取特征向量。六類(lèi)信號(hào)各自的128個(gè)特征的特征值如圖6所示。 (a) 撞擊信號(hào) (b) 脈沖尖峰信號(hào) (c) 噪聲信號(hào) (d) 自檢信號(hào) (e) 噪聲波動(dòng)信號(hào) (f) 通道閃斷信號(hào)圖3 原始信號(hào)時(shí)域波形Fig.3 Tine-domain waveform of original signals (a) IMF1 (b) IMF2 (c) IMF3 (d) IMF4圖4 撞擊信號(hào)各IMF分量信號(hào)Fig.4 IMF components of impact signal (a) IMF1 (b) IMF2 (c) IMF3 (d) IMF4圖5 撞擊信號(hào)各IMF分量信號(hào)頻譜Fig.5 Frequency spectrum of IMF components of impact signal 由圖6可以看出,不同類(lèi)型信號(hào)經(jīng)VMD分解后提取的特征在數(shù)值上和變化情況上存在明顯的差異,說(shuō)明本研究所采用的特征提取方法提取出的特征的在全面表征原始信號(hào)所含的信息方面是有效的。 將上述過(guò)程提取出的訓(xùn)練集特征作為輸入,訓(xùn)練集樣本信號(hào)對(duì)應(yīng)的類(lèi)別標(biāo)簽作為輸出,建立隨機(jī)森林模型,其中隨機(jī)森林模型的決策樹(shù)個(gè)數(shù)為500(默認(rèn)參數(shù))。將測(cè)試集特征作為隨機(jī)森林模型輸入,進(jìn)行預(yù)測(cè)分類(lèi)。為對(duì)比和評(píng)估模型分類(lèi)效果,采用將訓(xùn)練集特征作為輸入向量建立的支持向量機(jī)模型和從未經(jīng)VMD分解的原始信號(hào)中提取的相同特征作為輸入建立的隨機(jī)森林模型來(lái)對(duì)測(cè)試集進(jìn)行分類(lèi),其中,SVM的核函數(shù)為徑向基核函數(shù),采用網(wǎng)格法進(jìn)行參數(shù)尋優(yōu),懲罰參數(shù)c為84,核函數(shù)參數(shù)g為0.1,分類(lèi)結(jié)果如圖7所示。 (a) 撞擊信號(hào)(b) 脈沖尖峰信號(hào)(c) 噪聲信號(hào) (d) 自檢信號(hào)(e) 噪聲波動(dòng)信號(hào)(f) 通道閃斷信號(hào)圖6 六類(lèi)信號(hào)特征值Fig.6 Eigenvalues of six kinds of signals (a) VMD_SVM模型(b) RF模型(c) VMD_RF模型圖7 三類(lèi)模型分類(lèi)結(jié)果Fig.7 Classification results of three models 從圖7可以看出,三類(lèi)模型均能實(shí)現(xiàn)六種信號(hào)的分類(lèi),但明顯可以看出,三類(lèi)模型中,本研究提出的方法建立的VMD_RF模型在實(shí)現(xiàn)上述信號(hào)分類(lèi)時(shí)錯(cuò)分樣本最少。計(jì)算三種模型分類(lèi)結(jié)果的分類(lèi)誤差,誤差計(jì)算結(jié)果如表2所示。 表2 三類(lèi)模型分類(lèi)誤差 從表2可以發(fā)現(xiàn),三類(lèi)模型中支持向量機(jī)分類(lèi)模型的分類(lèi)誤差最大,為17.01%,RF模型的分類(lèi)誤差為7.47%,而VMD_RF分類(lèi)模型的誤差僅為2.90%,進(jìn)一步說(shuō)明了VMD分解后提取的信號(hào)特征更全面地表征了原始信號(hào)的信息,同時(shí)說(shuō)明在實(shí)現(xiàn)反應(yīng)堆金屬撞擊信號(hào)識(shí)別方面,VMD_RF模型的識(shí)別效果要優(yōu)于單一的隨機(jī)森林模型和支持向量機(jī)模型。 通過(guò)實(shí)際工程實(shí)例驗(yàn)證表明,采用基于變分模態(tài)分解和隨機(jī)森林的方法進(jìn)行反應(yīng)堆金屬撞擊信號(hào)識(shí)別是有效的。本研究主要結(jié)論如下: (1) 利用變分模態(tài)分解將原始信號(hào)分解為多個(gè)分量信號(hào),能夠?qū)崿F(xiàn)從多頻帶角度描述包含多個(gè)頻率成分的原始信號(hào)。 (2) 提出的基于變分模態(tài)分解的反應(yīng)堆金屬撞擊信號(hào)特征提取新方法提取的特征可以更全面地表征原始信號(hào)所含的特征信息,解決了由于特征信息不足而導(dǎo)致的識(shí)別精度低的問(wèn)題。 (3) 構(gòu)造的VMD_RF分類(lèi)模型,可實(shí)現(xiàn)反應(yīng)堆金屬撞擊信號(hào)的識(shí)別,并獲得良好的識(shí)別效果,避免了由于特征維數(shù)上升后模型構(gòu)建不合理而產(chǎn)生的識(shí)別精度下降的缺陷,為后續(xù)松脫部件的進(jìn)一步確定奠定了良好基礎(chǔ)。2.2 投票過(guò)程
2.3 基于VMD_RF的反應(yīng)堆金屬撞擊信號(hào)識(shí)別方法
3 反應(yīng)堆金屬撞擊信號(hào)識(shí)別分析
3.1 數(shù)據(jù)獲取
3.2 識(shí)別結(jié)果及分析
4 結(jié) 論