路 建,李 勇,王宗收,郝崇清
(1.河北張河灣蓄能發(fā)電有限責(zé)任公司,河北石家莊 050300;2.河北科技大學(xué)電氣工程學(xué)院,河北石家莊 050018)
主站發(fā)電機(jī)是抽水蓄能發(fā)電站核心運(yùn)行單元,然而發(fā)電機(jī)組設(shè)備在長期運(yùn)行時存在下導(dǎo)瓦間隙偏小、冷卻器容量不足、透平油老化、雜質(zhì)混入等風(fēng)險隱患[1]。對一些長期緩慢變化的趨勢信息,如發(fā)電機(jī)瓦溫等,采用機(jī)器學(xué)習(xí)算法和大數(shù)據(jù)處理方法對生成的報表數(shù)據(jù)進(jìn)行分析,進(jìn)而實現(xiàn)故障監(jiān)測和潛在風(fēng)險預(yù)警,對提高整個系統(tǒng)的穩(wěn)定性和可靠性,以及給監(jiān)控系統(tǒng)國產(chǎn)化改造提供了很好的范本,具有很好的推廣意義。
基于機(jī)器學(xué)習(xí)的故障監(jiān)測方法,目的在于通過不同故障模態(tài)下信號傳感器采集的數(shù)據(jù)信息,訓(xùn)練學(xué)習(xí)得到一個數(shù)據(jù)與故障之間的數(shù)學(xué)模型,并通過該模型對后測數(shù)據(jù)進(jìn)行實時監(jiān)測,以確定故障類型和時間,其中隨機(jī)森林、決策樹、神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)等方法已越來越多地應(yīng)用到各類故障檢測和診斷領(lǐng)域[2-5]。李兵等[6]利用一種改進(jìn)的隨機(jī)森林算法,在考慮漏報率的基礎(chǔ)上提出了電機(jī)軸承故障診斷決策方法;鄭日暉等[7]提出了優(yōu)化決策樹的智能診斷方法,在簡化模型的基礎(chǔ)上使得故障分類的準(zhǔn)確率大大提升;賈京龍等[8]基于油中溶解氣體濃度信息,利用卷積神經(jīng)網(wǎng)絡(luò)的方法實現(xiàn)了電力變壓器故障診斷。陳如清等[9]基于振動傳感器的頻譜信息,提出了一種基于遞歸神經(jīng)網(wǎng)絡(luò)的方法,成功用于旋轉(zhuǎn)機(jī)械裝置的故障診斷。支持向量機(jī)作為一種有監(jiān)督的機(jī)器學(xué)習(xí)方法,其在樣本數(shù)量、待識別的模式數(shù)量以及非線性問題分類等方面均能達(dá)到良好效果。樊浩等[10]提出了主元分析結(jié)合支持向量機(jī)的斷路器故障診斷方法,在噪聲背景下實現(xiàn)了斷路器7種故障的準(zhǔn)確分類。然而,支持向量機(jī)的懲罰因子以及核函數(shù)參數(shù)組合較大程度地影響了故障識別準(zhǔn)確率,有學(xué)者利用各類尋優(yōu)算法對支持向量機(jī)的參數(shù)組合進(jìn)行優(yōu)化配置以期望獲得更高的故障識別準(zhǔn)確率[11-13]。近年來,麻雀搜索算法受到了學(xué)者們的廣泛關(guān)注,其可以有效避免陷入局部尋優(yōu)的問題,現(xiàn)已被成功應(yīng)用于三維無人機(jī)航跡規(guī)劃[14]。
基于以上分析,提出一種通過主站發(fā)電機(jī)瓦溫信息構(gòu)建發(fā)電機(jī)故障診斷模型的方法,利用麻雀算法全局尋優(yōu)和局部尋優(yōu)自由切換的優(yōu)勢,對支持向量機(jī)的懲罰因子以及核函數(shù)參數(shù)組合進(jìn)行優(yōu)化,以提高發(fā)電機(jī)故障模式識別準(zhǔn)確率。
支持向量機(jī)(SVM)是一種具有較強(qiáng)泛化能力、適用小樣本學(xué)習(xí)的模型,被廣泛應(yīng)用于分類和回歸等問題。對于線性可分問題,SVM通過建立一個最優(yōu)決策超平面,滿足平面兩側(cè)待分類的樣本之間距離最大化,從而獲得良好的泛化能力和分類效果。對于非線性可分問題,是將低維不易區(qū)分的特征點(diǎn)通過核函數(shù)實現(xiàn)到高維特征空間的非線性映射,然后在特征空間中建立最優(yōu)超平面進(jìn)行分類。
1)設(shè)最優(yōu)決策超平面:
ωφ(x)+b=0,
(1)
式中:ω為權(quán)重;b為偏置量。
2)通過ωφ(x)+b>0或ωφ(x)+b<0對x進(jìn)行分類,決策函數(shù)如下:
f(x)=sgn(ωφ(x)+b)。
(2)
3)為了解決非線性可分問題,通過將懲罰因子C和松弛系數(shù)ζi引入到目標(biāo)函數(shù)中,以此來間接增大目標(biāo)函數(shù)值。目標(biāo)函數(shù)和約束條件構(gòu)造如下:
(3)
式中:C為懲罰因子,用于調(diào)整樣本間的權(quán)重;ζi為松弛系數(shù),對應(yīng)于非線性樣本。
4)利用拉格朗日函數(shù)及拉格朗日乘子αi解出不等式約束條件下的最大值。
(4)
可得最優(yōu)分類函數(shù)為
(5)
式中:K(x,xi)為支持向量機(jī)的核函數(shù);m為向量樣本個數(shù)。
SVM的核函數(shù)種類包括高斯徑向基核函數(shù)、線性核函數(shù)和多項式核函數(shù)等。其中,相較于其他核函數(shù),高斯徑向基核函數(shù)有更好的分類效果,因此采用RBF核函數(shù)求解,表達(dá)式[15]如式(6)所示:
(6)
使用虛擬麻雀進(jìn)行食物的尋找,由n只麻雀組成的種群可如式(7)表示:
(7)
式中:d為待優(yōu)化問題變量的維數(shù);n為麻雀的數(shù)量。則所有麻雀的適應(yīng)度值可以表示為
(8)
式中f表示適應(yīng)度值。
在第t次迭代中,擁有較好適應(yīng)度的第i個麻雀在第j維更新位置為
(9)
式中:itermax為最大迭代次數(shù);α為介于0~1的隨機(jī)值;Q為服從正態(tài)分布的隨機(jī)值。R2(R2∈[0,1]) 和 ST(ST∈[0.5,1])分別表示預(yù)警值和安全值。L表示一個1×d大小的元素為1的矩陣。
在覓食過程中,新入麻雀的位置更新表示為
(10)
式中:Xp是目前發(fā)現(xiàn)者所占據(jù)的最優(yōu)位置;Xworst則表示當(dāng)前全局最差的位置;A表示每個元素隨機(jī)為±1的1×d向量。
“意識到危險”位置的麻雀位置更新為
(11)
式中:Xbest是當(dāng)前的全局最優(yōu)位置;β作為步長控制參數(shù);K∈[-1,1]是一個隨機(jī)數(shù),表示麻雀移動的方向;fi是當(dāng)前麻雀個體的適應(yīng)度值。
由式(3)和式(6)可知,SVM的懲罰因子C和核函數(shù)半徑g是影響其分類能力的主要因素,其中懲罰因子C可以影響SVM對樣本學(xué)習(xí)的準(zhǔn)確性,參數(shù)g影響樣本的空間投射[16]。通過麻雀搜索算法尋找到最佳的2個參數(shù)C和g,進(jìn)而提高SVM在故障模式識別中的正確率。利用麻雀搜索算法來進(jìn)行SVM參數(shù)優(yōu)化的步驟如下:
Step1 確定訓(xùn)練樣本和測試樣本;
Step2 設(shè)置麻雀種群規(guī)模pop,搜索空間維度dim,最大迭代次數(shù)Max_iteration。生成麻雀初始位置,取[-1,1]之間的隨機(jī)數(shù)作為麻雀的初始位置,設(shè)置“意識到危險”的麻雀及“發(fā)現(xiàn)者”麻雀占比,并確定預(yù)警值ST;
Step3 計算出麻雀種群適應(yīng)度值,得到最優(yōu)位置Xp和最劣位置Xworst;
Step4 根據(jù)式(9)—式(11)更新“發(fā)現(xiàn)者”“加入者”“意識到危險”的麻雀位置;
Step5 計算麻雀更新位置后的適應(yīng)度值,并與前一次迭代中的適應(yīng)度值做對比。假如高于原有適應(yīng)度值,則把新位置值作為最優(yōu)的適應(yīng)度值Xbest;否則保持原適應(yīng)度值不變;
Step6 判斷是否已經(jīng)達(dá)到了最大迭代次數(shù),若未達(dá)到,則轉(zhuǎn)到Step3,若已經(jīng)達(dá)到,則停止迭代過程;
Step7 結(jié)束尋優(yōu)過程,輸出最優(yōu)(C,g)組合,以最優(yōu)參數(shù)構(gòu)造SVM分類器。
利用張河灣抽水蓄能電站監(jiān)控系統(tǒng)采集的水泵發(fā)電機(jī)實測溫度數(shù)據(jù)進(jìn)行方法的驗證和分析。數(shù)據(jù)覆蓋正常、下導(dǎo)瓦間隙偏小、冷卻器容量不足、透平油老化、雜質(zhì)混入故障5種狀態(tài)模式。每個狀態(tài)中選取了200組故障樣本數(shù)據(jù)作為研究數(shù)據(jù),其中訓(xùn)練樣本集160組(占80%)和測試樣本40組(占20%),對故障狀態(tài)進(jìn)行診斷測試。限于篇幅,各故障狀態(tài)下部分溫度數(shù)據(jù)(截取了下導(dǎo)軸承20個溫度數(shù)據(jù)點(diǎn))變化情況如圖1所示,其中相鄰數(shù)據(jù)點(diǎn)之間的采樣時間間隔為10 min。
圖1 原始溫度數(shù)據(jù)在4種故障模式下的變化情況Fig.1 Distribution of original temperature data in four fault modes
采用本文所提方法對SVM模型進(jìn)行優(yōu)化,并完成故障模式識別,其相關(guān)參數(shù)設(shè)置如下:種群規(guī)模為50,最大迭代次數(shù)為100,搜索空間維度為2,“意識到危險”的麻雀占比為25%,“發(fā)現(xiàn)者”麻雀占比為75%,預(yù)警值為0.6;SVM模型中懲罰因子C∈[0.01,1],核函數(shù)半徑g∈[2×10-5,2×105]。
以識別錯誤率作為適應(yīng)度,利用麻雀尋優(yōu)算法對懲罰因子C和核函數(shù)半徑g的參數(shù)組合尋優(yōu),其適應(yīng)度及參數(shù)變化過程分別如圖2和圖3所示。
圖2 麻雀尋優(yōu)算法的適應(yīng)度變化曲線Fig.2 Fitness curve of sparrow optimization
圖3 懲罰因子和核函數(shù)半徑的尋優(yōu)過程Fig.3 Optimization process of penalty factor and kernel radius
由圖2可知,麻雀尋優(yōu)算法在第6次迭代完成了參數(shù)尋優(yōu),因此,本文所提的麻雀尋優(yōu)-支持向量機(jī)故障識別模型具備較快的收斂速度。參數(shù)尋優(yōu)結(jié)果為C=448.5,g=0.036 72,并以此模型對200組測試樣本(正常、下導(dǎo)瓦間隙偏小、冷卻器容量不足、透平油老化、雜質(zhì)混入各40組)故障識別測試。其中組數(shù)1~40為正常測試樣本,組數(shù)41~80為下導(dǎo)瓦間隙偏小故障測試樣本,組數(shù)81~120為冷卻器容量不足故障測試樣本,組數(shù)121~160為透平油老化故障測試樣本,組數(shù)161~200為雜質(zhì)混入故障測試樣本。模型對測試樣本的識別結(jié)果及識別正確率統(tǒng)計分別如圖4和表1所示。為了驗證本文所提方法在提升識別正確率方面的有效性,傳統(tǒng)SVM模型識別的統(tǒng)計結(jié)果如表2所示。
由表1的統(tǒng)計分析可知,正常和冷卻器容量不足故障測試樣本的正確率最高,均可達(dá)到95%,下導(dǎo)瓦間隙偏小故障測試樣本的正確率較低為87.5%。在200個測試樣本中,識別錯誤的樣本數(shù)為16,其總體識別正確率達(dá)到92%。由表1和表2的數(shù)據(jù)對比,可見本文所提方法將200組測試樣本的識別正確率提高了7%。然而,下導(dǎo)瓦間隙偏小故障的識別錯誤樣本數(shù)仍然偏高。
圖4 測試樣本識別結(jié)果Fig.4 Identification results of the test samples
此外,為驗證所使用的麻雀尋優(yōu)-支持向量機(jī)(Sparrow-SVM)方法較現(xiàn)行主流故障模式識別方法的優(yōu)勢,分別利用粒子群-支持向量機(jī)(PSO-SVM)、遺傳算法-支持向量機(jī)(GA-SVM)和麻雀尋
表1 基于麻雀尋優(yōu)-支持向量機(jī)方法的測試樣本識別正確率統(tǒng)計Tab.1 Statistical results for the identification accuracy of the test samples based on Sparrow-SVM
表2 基于傳統(tǒng)SVM的測試樣本識別正確率統(tǒng)計Tab.2 Statistical results for the identification accuracy of the test samples based on traditional SVM
優(yōu)-極限學(xué)習(xí)機(jī)(Sparrow-ELM)以相同數(shù)據(jù)樣本進(jìn)行訓(xùn)練并測試識別,相應(yīng)的統(tǒng)計結(jié)果如表3所示。由數(shù)據(jù)分析可知,Sparrow-SVM方法識別正確率均高于被對比的其他3種主流方法。一方面驗證了麻雀尋優(yōu)方法較傳統(tǒng)粒子群尋優(yōu)、遺傳算法尋優(yōu)的優(yōu)勢;另一方面說明在抽水蓄能電站主機(jī)故障訓(xùn)練樣本有限的情況下,SVM方法較ELM方法故障模式分類效果更佳。
表3 與現(xiàn)行同類方法識別結(jié)果對比Tab.3 Performance comparison with other current fault pattern recognition methods 單位:%
提出了一種基于溫度信號分析的麻雀尋優(yōu)-支持向量機(jī)發(fā)電機(jī)故障模式識別方法,經(jīng)數(shù)據(jù)分析得到相關(guān)結(jié)論如下。
1)抽水蓄能電站下導(dǎo)瓦間隙偏小、冷卻器容量不足、透平油老化、雜質(zhì)混入故障可導(dǎo)致發(fā)電機(jī)瓦溫等信息的變化。
2)通過瓦溫構(gòu)建的故障樣本可用于訓(xùn)練SVM模型并可實現(xiàn)實測數(shù)據(jù)的故障類型識別,同時,麻雀尋優(yōu)算法可快速有效地對SVM的懲罰因子C和核函數(shù)半徑g進(jìn)行尋優(yōu)。與傳統(tǒng)SVM識別方法相比,麻雀尋優(yōu)-支持向量機(jī)可將樣本識別正確率從85%提升至92%,在200組測試樣本中,識別錯誤樣本數(shù)由30組降至16組。
3)張河灣抽水蓄能電站故障下實測溫度數(shù)據(jù)表明,本文所提出的麻雀尋優(yōu)-支持向量機(jī)方法可進(jìn)行故障模式識別,為機(jī)組運(yùn)行狀態(tài)的智能化監(jiān)測提供了有效支撐,為抽水蓄能發(fā)電站主站電機(jī)的安全可靠運(yùn)行提供了技術(shù)保障。
采樣過程中溫度波動對溫度變化率的影響容易導(dǎo)致下導(dǎo)瓦間隙偏小故障發(fā)生誤判?;谝陨戏治?,各類故障下溫度數(shù)據(jù)的預(yù)處理將作為今后研究的重點(diǎn)。