郭家興,錢君霞,柳 瑞,馬鴻娟
(1. 中國能源建設(shè)集團(tuán)江蘇省電力設(shè)計(jì)院有限公司,江蘇 南京 210000;2. 華北電力大學(xué)(保定),河北 保定 071003)
為了適應(yīng)中國近海島礁發(fā)展以及近海風(fēng)電、跨海通信等重大工程項(xiàng)目的施工需求,光纖復(fù)合海底電纜(簡稱“海纜”)的使用愈加頻繁。在跨海輸電和通信傳輸中,海纜發(fā)揮著重要作用[1-2]。復(fù)雜的海洋地質(zhì)構(gòu)造和施工作業(yè)環(huán)境,都是引起海纜不同程度機(jī)械或電學(xué)故障的因素[3]。因此,對海纜各類工況進(jìn)行信號識別,有助于海纜故障的早期預(yù)警。
支持向量機(jī) (support vector machine,SVM)算法被廣泛地用作振動(dòng)信號的識別。SVM具有樣本需求量小、泛化能力強(qiáng)和判別精確度高的優(yōu)勢[4]。在實(shí)際應(yīng)用中,其核函數(shù)的選取以及參數(shù)的設(shè)定直接影響分析效率。目前徑向基函數(shù)(radial basis function,RBF)的核函數(shù)已被證實(shí)對非線性問題的解決效果良好[5-7]。因此,如何更好選擇懲罰因子C和核函數(shù)參數(shù)g很重要。常用的參數(shù)優(yōu)化方法包括網(wǎng)格搜索(grid search, GS)、遺傳算法(genetic algorithm,GA)和粒子群優(yōu)化(particle swarm optimization, PSO)等。文獻(xiàn)[8]采用GS 算法對SVM 的懲罰因子C和核函數(shù)參數(shù)g進(jìn)行尋優(yōu),以此建立分類器用于識別故障類型,并達(dá)到了不錯(cuò)的效果。文獻(xiàn)[9]針對SVM 參數(shù)選擇困難問題,采用GA-SVM 算法,確定參數(shù)最優(yōu)值識別3種故障類型,模型故障診斷平均準(zhǔn)確率比SVM 有了較大的提升。文獻(xiàn)[10]采用GA-SVM 算法,有效地提高了SVM 的分類性能,但是由于GA的操作較為復(fù)雜,從而導(dǎo)致尋優(yōu)速度較慢。文獻(xiàn)[11]提出用PSO-SVM 算法,雖收斂速度得到提升,但卻很容易陷入局部最優(yōu)解。文獻(xiàn)[12]將構(gòu)建的多維特征向量送入PSO-SVM 模式自動(dòng)識別分類模型,與SVM 相比,該方法具有更好的識別準(zhǔn)確率。文獻(xiàn)[13]用人工蜂群( artificial bee colony,ABC) 算法來優(yōu)化SVM,這種方法可以很好地克服局部最優(yōu)解,但無法利用全局最優(yōu)信息迭代更新。文獻(xiàn)[14]利用麻雀搜索算法(sparrow search algorithm, SSA)優(yōu)化SVM 對刀具磨損狀態(tài)進(jìn)行識別,其識別準(zhǔn)確率達(dá)到了98.246%。文獻(xiàn)[15]利用SSA-SVM 對滾動(dòng)軸承進(jìn)行識別,診斷模型的測試正確率為96.67% ,比傳統(tǒng)的GA-SVM 和PSO-SVM診斷模型分別提高了3.34和1.67個(gè)百分點(diǎn),且收斂速度更快,可有效應(yīng)用于故障診斷。文獻(xiàn)[16]利用 SSA 對SVM 參數(shù)進(jìn)行調(diào)節(jié),以實(shí)現(xiàn)對瓶蓋裝配的檢測,優(yōu)化后的SVM模型測試準(zhǔn)確率達(dá)到98.33%,基于SSA-SVM 的瓶蓋裝配檢測模型識別精度高、調(diào)參速度快、泛化能力強(qiáng)。
目前,典型的振動(dòng)分析算法——集合經(jīng)驗(yàn)?zāi)B(tài)分解(ensemble empirical mode decomposition, EEMD)算法被廣泛用于故障診斷[17],其可對信號進(jìn)行分解以提取特征。SSA是一種新穎的群體優(yōu)化算法,現(xiàn)有研究通過19個(gè)標(biāo)準(zhǔn)測試函數(shù)進(jìn)行驗(yàn)證,結(jié)果顯示SSA 在搜索精度、收斂速度、穩(wěn)定性和避免局部最優(yōu)值方面均表現(xiàn)優(yōu)異[18]。因此,本文提出了一種基于SSA-SVM優(yōu)化的EEMD-SSA-SVM 混合海纜振動(dòng)信號識別模型。其首先采用EEMD 對3 種海纜振動(dòng)信號進(jìn)行分解,并求解其模態(tài)分類的峭度和能量熵,以構(gòu)成特征向量用于后續(xù)識別;為提高分類準(zhǔn)確率,采用SSA 優(yōu)化SVM 的懲罰因子和核函數(shù)參數(shù),形成SSA-SVM 識別模型;并將本文方法與PSO-SVM、SVM算法進(jìn)行了對比分析。
SSA-SVM算法的主角為麻雀,每只麻雀個(gè)體只有一項(xiàng)屬性,即位置,其可表示麻雀所尋覓到的食物所在方位。對于每只麻雀個(gè)體,其可能有3 種狀態(tài)的改變:1) 充當(dāng)發(fā)現(xiàn)者,帶領(lǐng)種群尋覓食物;2) 作為追隨者,追隨發(fā)現(xiàn)者覓食;3) 具備警戒機(jī)制,發(fā)現(xiàn)危險(xiǎn)則放棄覓食。麻雀算法的優(yōu)化參數(shù)為SVM中懲罰因子C和核函數(shù)參數(shù)g,適應(yīng)度函數(shù)為SVM對測試集的預(yù)測正確率。
SSA 是薛建凱在2020 年提出的一種新的群體智能優(yōu)化算法,其靈感來自麻雀的覓食和反捕食行為。SSA 不受目標(biāo)函數(shù)可微性、可推導(dǎo)性和連續(xù)性的限制,具有全局搜索能力強(qiáng)、穩(wěn)定性好、收斂速度快等優(yōu)點(diǎn)。SSA是一種新穎、組織良好的元啟發(fā)式算法,可用于解決各個(gè)領(lǐng)域的優(yōu)化問題[19]。
假設(shè)在D維搜索空間中有M只麻雀,由M只麻雀組成的種群具體如下:
式中:xid——維度D中的第i只麻雀。
這里,采用海纜故障的準(zhǔn)確率作為適應(yīng)度函數(shù),以不斷更新最優(yōu)值來達(dá)到最佳的識別率。所有麻雀的適應(yīng)度值FX可表示為
在SSA中,適應(yīng)度值FX表示能量儲(chǔ)備,f表示適應(yīng)度函數(shù)。在搜尋過程中,能源儲(chǔ)備量較高的生產(chǎn)者將優(yōu)先獲得食物。一般而言,占種群10%~20%的生產(chǎn)者負(fù)責(zé)尋找食物,其覓食搜索范圍比掠食者的大;同時(shí),生產(chǎn)者應(yīng)通過式(3)更新:
式中:t——當(dāng)前迭代次數(shù);Xid,t—— 第i只麻雀在d維中經(jīng)t次迭代后所在的位置;T—— 最大迭代次數(shù);α ——均勻隨機(jī)數(shù),α∈ (0,1];Q—— 服從正態(tài)分布的隨機(jī)數(shù);L——大小為1×d的矩陣,其所有元素均為1;R2——警告值,R2∈ [0,1];ST——安全值,ST∈ [0.5, 1]。
當(dāng)R2<ST時(shí),覓食區(qū)周圍沒有捕食者,生產(chǎn)者可以執(zhí)行廣泛的搜索操作。當(dāng)R2≥ST時(shí),群中的偵察麻雀已經(jīng)識別出一個(gè)捕食者,并立即向其他麻雀發(fā)出警報(bào),然后,群中的麻雀開始進(jìn)行反捕食者行為,調(diào)整搜索策略并迅速向安全區(qū)域移動(dòng)。
在覓食過程中,除了生產(chǎn)者之外,所有麻雀都充當(dāng)尋找最佳覓食區(qū)域的搜尋者。搜尋者根據(jù)式(4)更新其位置。當(dāng)時(shí),第i個(gè)搜尋者得不到任何食物,處于饑餓狀態(tài),適應(yīng)性較低,這種麻雀很有可能飛到另一個(gè)地方覓食并獲得更高的能量。當(dāng)i≤時(shí),第i個(gè)搜尋者在當(dāng)前最佳位置xb附近找到一個(gè)隨機(jī)位置進(jìn)行覓食。
式中:xwd,t——在第t次迭代中麻雀在第d維的最差位置;xbd,t+1——在第(t+1)次迭代中麻雀在第d維的最佳位置;A——大小為1×d的矩陣,其每個(gè)元素被隨機(jī)分配到1或-1,使得A+=AT。
當(dāng)檢測到危險(xiǎn)時(shí),種群邊緣的麻雀將迅速移動(dòng)到一個(gè)安全的區(qū)域以獲得更好的位置,而種群中間的麻雀會(huì)隨機(jī)走動(dòng)以接近其他麻雀。移動(dòng)的數(shù)學(xué)表達(dá)式如下:
式中:xbd,t——第t次迭代時(shí)預(yù)警麻雀的最佳全局位置;β——步長控制參數(shù),為正態(tài)分布隨機(jī)數(shù),均值為0,方差為1;K——表示麻雀移動(dòng)方向的隨機(jī)數(shù),也是步長控制參數(shù),且K∈[-1,1];ε是一個(gè)小常數(shù),以避免分母為0 的情況;fi——第i只麻雀的適應(yīng)度值;fb——當(dāng)前麻雀群的最佳適應(yīng)度值;fw——當(dāng)前麻雀群的最差適應(yīng)度值。
當(dāng)fi≠fb時(shí),麻雀處于種群的邊緣,容易受到捕食者的攻擊;當(dāng)fi=fb時(shí),麻雀就在種群中間。一旦麻雀意識到來自捕食者的威脅,它就會(huì)靠近其他麻雀并調(diào)整搜索策略以避免受到攻擊。
SVM懲罰因子C和核函數(shù)參數(shù)g的選擇對分類結(jié)果有很大影響。同時(shí),SSA算法具有較強(qiáng)的全局搜索能力,適合用于優(yōu)化SVM的C和g,以獲得更好的參數(shù)組合。通過使用一定數(shù)量的麻雀進(jìn)行全局優(yōu)化,可以得到最優(yōu)的參數(shù)組合。然后,利用SSA優(yōu)化算法得到的最優(yōu)C和g來建立SVM 識別模型,并得到診斷結(jié)果。使用SSA算法優(yōu)化SVM的過程如圖1所示,具體步驟如下:
圖1 SSA-SVM 算法流程圖Fig.1 Flow chart of SSA-SVM algorithm
1) 首先確定故障診斷模型的輸入、輸出。提取故障特征作為診斷模型輸入,確定目標(biāo)輸出值。建立訓(xùn)練、測試樣本集。
2) 初始化麻雀搜索算法相關(guān)參數(shù),包括種群數(shù)量M、最大迭代次數(shù)T、C和g。
3) 通過交叉驗(yàn)證,對訓(xùn)練樣本進(jìn)行分類,以交叉驗(yàn)證的準(zhǔn)確率作為麻雀個(gè)體的適應(yīng)度。保留最優(yōu)的適應(yīng)度值及位置信息。
4) 根據(jù)式(3)~式(5)更新位置。
5) 計(jì)算麻雀個(gè)體新位置的適應(yīng)度值,將更新后的適應(yīng)度值與原來的最優(yōu)值進(jìn)行比較,并更新全局最優(yōu)信息。
6)判斷迭代次數(shù)是否滿足終止條件,如不滿足,則重復(fù)步驟3);反之則停止,輸出最優(yōu)參數(shù),將測試集樣本輸入到最優(yōu)的 SVM 模型,輸出診斷結(jié)果。
華北電力大學(xué)尚秋峰團(tuán)隊(duì)通過有限元仿真得到了海纜的錨砸、摩擦及沖刷振動(dòng)信號。設(shè)定船錨重151 kg,其下落的速率為6.95 m/s,錨砸持續(xù)時(shí)間定為0.05 s,海纜長度500 cm,重力加速度g=9.8 m/s2,通過ANSYS 軟件仿真,提取光單元的振動(dòng)數(shù)據(jù),進(jìn)而得到對應(yīng)的錨砸故障信號[20]。通過有限元分析法中的瞬態(tài)動(dòng)力學(xué)分析方法仿真構(gòu)建了巖石與海纜發(fā)生摩擦?xí)r的二維模型,設(shè)摩擦的時(shí)間為0.5 s,起始速度是0.25 m/s,滑動(dòng)方向沿x軸的正方向,同時(shí)在y方向施加了約束,使海纜摩擦運(yùn)動(dòng)方向只能沿x軸正向,提取光單元的振動(dòng)數(shù)據(jù),得到對應(yīng)的摩擦故障信號[21]。在波浪高度為100 cm、速度為2 m/s、周期為1 s的勻速海浪條件下,構(gòu)建了在波浪沖刷條件下裸露的懸跨海纜的有限元模型,模型中規(guī)定水流沿y軸方向流動(dòng),通過有限元仿真得到了海纜沖刷故障信號[22]。
圖2 所示的實(shí)驗(yàn)系統(tǒng)為布里淵光時(shí)域分析(Brillouin optical time-domain analysis,BOTDA)和偏振態(tài)檢測相結(jié)合的溫度/應(yīng)變/振動(dòng)多參量傳感系統(tǒng)[23-25],其可以實(shí)現(xiàn)對溫度、應(yīng)變和偏振態(tài)的同時(shí)檢測。BOTDA系統(tǒng)中,窄線寬激光器輸出的光信號經(jīng)耦合器分為兩路,并由摻鉺光纖放大器(erbium doped fiber amplifier, EDFA)放大。其中一路光信號由聲光調(diào)制器(acousto-optic modulator,AOM)調(diào)制成脈沖光,經(jīng)EDFA2 放大并由光柵濾除EDFA2 所產(chǎn)生的自發(fā)輻射噪聲,最后進(jìn)入傳感光纖。耦合器的另一路光信號由電光調(diào)制器(electro-optic modulator,EOM)調(diào)制產(chǎn)生約11 GHz 頻移的光信號。本系統(tǒng)采用損耗型BOTDA 技術(shù),連續(xù)光頻率高于脈沖光頻率。利用光濾波器選取EOM 輸出的已調(diào)制信號的上邊帶,此信號作為探測光進(jìn)入傳感光纖。當(dāng)光纖中相向傳輸?shù)膬陕饭獾念l率差與光纖的布里淵頻移一致時(shí),受激布里淵散射(stimulated Brillouin scattering,SBS)作用最強(qiáng)。攜帶SBS 信息的探測光通過環(huán)形器、保偏耦合器和光電探測器,分別由高速數(shù)據(jù)采集設(shè)備(A/D 轉(zhuǎn)換器)和偏振分析儀(POD)進(jìn)行數(shù)據(jù)采集,采用Matlab 進(jìn)行數(shù)據(jù)處理和分析。
圖2 BOTDA 實(shí)驗(yàn)框圖Fig.2 Block diagram of the BOTDA experiment
從POD獲取振動(dòng)信號并完成本文算法分析的模擬實(shí)驗(yàn)過程為:分別將仿真獲得的摩擦、沖刷和錨砸3種故障振動(dòng)信號輸入到任意波形信號發(fā)生器中,開啟功率放大驅(qū)動(dòng)振動(dòng)臺,使振動(dòng)段光纖產(chǎn)生摩擦、沖刷和錨砸3種故障形態(tài)對應(yīng)的偏振態(tài)變化。本實(shí)驗(yàn)中,振動(dòng)信號特征的提取和識別采用的數(shù)據(jù)源為POD輸出的斯托克斯矢量S1信號,其對應(yīng)海纜內(nèi)置的單模光纖中連續(xù)探測光偏振態(tài)的變化,為輸入到POD的光功率(P)經(jīng)過水平/垂直線偏振器后所輸出光功率之差。摩擦、沖刷和錨砸這3種故障形態(tài)對應(yīng)的S1信號如圖3 所示,采用本文提出的EEMD-SSA-SVM算法對S1進(jìn)行處理,即可識別海纜故障。振動(dòng)信號探測的性能將受到POD采集速率的影響。依據(jù)所分析振動(dòng)信號的頻域分布不同,采用的POD采集速率分別如下:沖刷信號0.25 kHz、摩擦信號50 kHz和錨砸信號200 kHz。
圖3 海纜振動(dòng)信號光功率Fig.3 Optical power of vibration signal of submarine cable
EEMD 方法,也就是在原始信號中加入白噪聲,改變故障信號的極值點(diǎn),以保證信號在不同尺度上的連續(xù)性,可有效抑制由于異常擾動(dòng)引起的模態(tài)混疊和端點(diǎn)效應(yīng)[26-28]。EEMD分解過程如下:
1) 在原始海纜故障信號中多次加入等長度的高斯白噪聲ni(t),得到新的信號為
式中:xi(t)——在原信號x(t)中第i次加入噪聲后的信號。
所加入的白噪聲應(yīng)符合的規(guī)律為
式中:ε——輸入信號的標(biāo)準(zhǔn)差;k——加入噪聲的強(qiáng)度;N——加入噪聲的次數(shù)。
2) 通過擬合信號的上下包絡(luò)線求解均值m(t)。
3) 在加入噪聲的信號中去除均值序列m(t),得到檢測信號,并判斷檢測信號是否滿足固有模態(tài)分量(intrinsic mode functions,IMF)的條件。如不滿足,繼續(xù)重復(fù)步驟2),直到檢測信號滿足IMF條件為止。
4) 利用xi(t)和固有模態(tài)函數(shù)計(jì)算剩余信號,即
式中:Ai(t)——剩余信號;IMFi(t)——第i次加入高斯白噪聲的固有模態(tài)分量總和。
5) 對剩余信號重復(fù)步驟2)和步驟3),依次獲得IMF分量。
6) 重新在原始信號中加入白噪聲,并重復(fù)以上步驟。
7) 為了避免所加入的白噪聲對特征提取的影響,對分解得到的同階IMF 分量進(jìn)行集總平均,則EEMD的分解結(jié)果為
式中:IMFi j(t)——第i次加入高斯白噪聲的第j個(gè)固有模態(tài)函數(shù)。
對經(jīng)過POD 后的含噪聲振動(dòng)信號進(jìn)行EEMD 分解。其中,原始信號中添加的白噪聲均值為0、標(biāo)準(zhǔn)差為0.2,EEMD分解層數(shù)設(shè)置為6。經(jīng)過EEMD分解后的各振動(dòng)信號模態(tài)分量波形如圖4所示。
圖4 3 類海纜振動(dòng)信號EEMD 分解Fig.4 EEMD decomposition of the three-class signals
每類信號各有500 組,依次求解每組分解后各個(gè)模態(tài)分量的峭度值及能量熵,每一組特征向量中包含有6個(gè)模態(tài)分量,對應(yīng)的特征值共計(jì)12個(gè)。對沖刷、摩擦及錨砸信號對應(yīng)的特征向量分別給定標(biāo)簽1、2和3。其中,根據(jù)3 類振動(dòng)信號的第一組數(shù)據(jù)提取的特征值如表1所示,共計(jì)提取1 500組特征向量。
表1 3 類海纜振動(dòng)信號特征值Tab.1 Characteristic values of three-types of signals
以每類信號各個(gè)模態(tài)分量的峭度及能量熵組合作為輸入特征向量進(jìn)行分類訓(xùn)練。沖刷振動(dòng)信號,指定輸出標(biāo)簽為1;摩擦振動(dòng)信號,指定輸出標(biāo)簽為2;錨砸振動(dòng)信號,指定輸出標(biāo)簽為3。每類信號各500組數(shù)據(jù),即共計(jì)提取了1 500組特征向量作為數(shù)據(jù)集用于訓(xùn)練。其中,又將數(shù)據(jù)集的80%作為訓(xùn)練集、20%作為測試集,由此得到1 200個(gè)樣本的訓(xùn)練集和300個(gè)樣本的測試集。
為了更好地觀察在測試集上每類算法對3類故障的識別情況,EEMD-PSO-SVM、SVM算法及本文提出的算法的混淆矩陣如圖5所示。圖中,混淆矩陣的橫坐標(biāo)軸代表海纜故障預(yù)測的狀態(tài)類別標(biāo)簽,縱坐標(biāo)軸代表海纜故障實(shí)際類別標(biāo)簽。每類故障有100個(gè)測試樣本,即測試集中共有300個(gè)測試樣本?;煜仃囎髮蔷€上的值表示模型為每種類型的海纜故障狀態(tài)正確預(yù)測的樣本數(shù),該值越大,算法對海纜故障分類越有效??梢钥闯?,本文所提算法不僅對海纜振動(dòng)信號的識別效果優(yōu)于EEMDPSO-SVM、SVM算法的,而且對各類故障識別精度高。
圖5 3 類算法分類結(jié)果Fig.5 Classification results of three algorithms
為了進(jìn)一步說明模型的性能,以識別準(zhǔn)確率作為適應(yīng)度函數(shù),將EEMD-SSA-SVM與EEMD-PSO-SVM模型進(jìn)行了最佳適應(yīng)度值的比較,如圖6所示,EEMDSSA-SVM 模型經(jīng)過約5 次迭代后可以快速識別出最優(yōu)值。EEMD-PSO-SVM 模型在經(jīng)過大約15 次迭代時(shí)達(dá)到最優(yōu)值,SSA 算法在優(yōu)化SV M 參數(shù)后優(yōu)化速度快、適應(yīng)度好、識別率高。
圖6 各類算法的最佳適應(yīng)度曲線Fig.6 Optimum fitness curves of the algorithms
經(jīng)過150 次迭代,EEMD-SSA-SVM、EEMD-PSOSVM 及SVM 的識別率及運(yùn)行時(shí)間及F1分?jǐn)?shù)如表2 所示。由表2可知,本文提出的模型在準(zhǔn)確率、時(shí)間、F1分?jǐn)?shù)這3 個(gè)評價(jià)指標(biāo)上表現(xiàn)良好,說明本文提出的模型具有較強(qiáng)的故障診斷能力和良好的綜合性能,其能夠更好地診斷海纜故障類型,實(shí)現(xiàn)對海纜的故障預(yù)警與保護(hù)。
表2 3 種算法性能對比Tab.2 Performance comparison among the three algorithms
為了進(jìn)一步驗(yàn)證算法的診斷性能,改變數(shù)據(jù)中訓(xùn)練樣本和測試樣本所占的比例,將訓(xùn)練樣本的比例分別設(shè)置為70%、50%和30%,結(jié)果如表3 所示。可以看出,在不同訓(xùn)練樣本下,EEMD-SSA-SVM 算法在準(zhǔn)確率上均優(yōu)于其他算法,在測試時(shí)間上僅次于SVM 算法,但是SVM 算法識別效果不佳,綜合而言,EEMDSSA-SVM具有良好的綜合診斷性能。
表3 不同訓(xùn)練集比例下3 種算法性能對比Tab.3 Performance comparison among the three algorithms under the different proportions of training sets
通過對海纜各類工況信號進(jìn)行識別,可以實(shí)現(xiàn)海纜故障的早期預(yù)警。為更快、更精確地實(shí)現(xiàn)海纜故障早期預(yù)警,本文提出一種基于SSA-SVM 算法的海纜振動(dòng)信號識別方法。其首先采用EEMD來分解海纜振動(dòng)信號,并提取模態(tài)分量的特征進(jìn)行分類;為了提高算法識別準(zhǔn)確性,采用SSA算法來優(yōu)化懲罰因子C和核函數(shù)參數(shù)g,并構(gòu)建EEMD-SSA-SVM 海纜振動(dòng)信號識別模型。在測試中,運(yùn)用EEMD 算法分解提取各分量峭度值作為特征向量進(jìn)行識別。對EEMD-SSA-SVM、EEMD-PSO-SVM 和SVM 算法進(jìn)行仿真比較,結(jié)果顯示,EEMD-SSA-SVM 算法在測試集上的分類識別率最高,達(dá)到了95%;EEMD-SSA-SVM 運(yùn)行時(shí)間雖次于SVM的,但SVM算法識別率最低。
本文所提出的EEMD-SSA-SVM 模型準(zhǔn)確率高、優(yōu)化能力強(qiáng),能對海纜振動(dòng)信號進(jìn)行較為準(zhǔn)確的區(qū)分,但其未考慮信號中噪聲的影響。后續(xù)將對信號降噪進(jìn)行研究,以提升算法性能,進(jìn)一步提高信號識別精度。