趙 亮,趙 輝,李 杰,楊柏依,周衛(wèi)慶
(1.華能萊蕪發(fā)電有限公司,山東 濟(jì)南 271102;2.南京工程學(xué)院 能源與動(dòng)力工程學(xué)院,江蘇 南京 211167)
配備中速磨煤機(jī)的制粉系統(tǒng)是火電機(jī)組的重要組成部分,其運(yùn)行的好壞直接影響到鍋爐燃燒穩(wěn)定及機(jī)組負(fù)荷的安全性。由于磨煤機(jī)的工作環(huán)境較為惡劣,雜質(zhì)磨損、潮濕堵煤等情況均可能引起磨煤機(jī)的故障。故障特征主要體現(xiàn)在溫度、風(fēng)壓、通風(fēng)量等監(jiān)測參數(shù)上。例如,磨煤機(jī)堵煤會(huì)導(dǎo)致通風(fēng)量驟減,原煤水分與出口溫度有著直接的關(guān)系。因此,基于信號(hào)的設(shè)備監(jiān)測評(píng)估技術(shù)對(duì)于機(jī)組的安全生產(chǎn)具有重大的現(xiàn)實(shí)意義。
目前已有各類先進(jìn)數(shù)據(jù)建模方法應(yīng)用于磨煤機(jī)故障預(yù)警及診斷中。文獻(xiàn)[1]應(yīng)用證據(jù)理論對(duì)磨煤機(jī)的故障進(jìn)行診斷。文獻(xiàn)[2]選取特征參數(shù),采用模糊C均值方法實(shí)現(xiàn)了斷煤故障的快速診斷。文獻(xiàn)[3]基于磨煤機(jī)的振動(dòng)信號(hào),提出了一種K值優(yōu)化結(jié)合最小二乘支持向量機(jī)的磨煤機(jī)振動(dòng)故障識(shí)別方法。文獻(xiàn)[4]分別應(yīng)用CNN(Convolutional neural networks)和BiLSTM(Bi-directional long short term memory)學(xué)習(xí)數(shù)據(jù)的空間特征、時(shí)間特征,提出了基于注意力機(jī)制的卷積神經(jīng)網(wǎng)絡(luò)–雙向記憶長短神經(jīng)網(wǎng)絡(luò)的磨煤機(jī)故障預(yù)警方法。類似基于數(shù)據(jù)建模方法的機(jī)組磨煤機(jī)故障診斷方法還有相似性建模方法[5,6]、信號(hào)多元處理法[7,8]、進(jìn)化優(yōu)化智能算法等[9-13]。
盡管數(shù)據(jù)建模方法在磨煤機(jī)故障預(yù)警診斷領(lǐng)域得到了一定程度的應(yīng)用,但是也存在著模型過于復(fù)雜、工程適用性不強(qiáng)等問題。為此,本文引入可擴(kuò)展的機(jī)器學(xué)習(xí)方法XGBoost,以提高建模時(shí)對(duì)海量數(shù)據(jù)的利用效率和模型精度;同時(shí),提出一種具有自適應(yīng)能力的可靠性監(jiān)測指標(biāo)及可靠性評(píng)價(jià)方法,以此實(shí)現(xiàn)磨煤機(jī)實(shí)時(shí)預(yù)警及評(píng)價(jià)。
XGBoost本質(zhì)上是一種機(jī)器學(xué)習(xí)的算法[14],由多個(gè)分類回歸算法組合而成,并且這種組合可以不斷擴(kuò)展。
對(duì)于一個(gè)訓(xùn)練用的數(shù)據(jù)集樣本,設(shè)其所包含的數(shù)據(jù)組數(shù)為n,數(shù)據(jù)集的特征參數(shù)個(gè)數(shù)為m,記為{x1,x2,…,xn,xi∈Rm,yi∈R}。其中,xi是第i個(gè)樣本的特征參數(shù)向量,yi是特征向量對(duì)應(yīng)的真實(shí)值。XGBoost的集成數(shù)學(xué)模型為:
式中:F為CART的函數(shù)集合;fk為第k棵樹的結(jié)構(gòu),包含獨(dú)立的樹結(jié)構(gòu)、樹葉的結(jié)點(diǎn)數(shù)T和權(quán)重向量ω。
對(duì)于一個(gè)觀測樣本,XGBoost模型在每棵樹上將其映射到每片葉子結(jié)點(diǎn)上,然后將所有葉結(jié)點(diǎn)的權(quán)重求和,即得到最終的預(yù)測值。
損失函數(shù)是用于衡量實(shí)際值和預(yù)測值的誤差。損失函數(shù)值越小則說明偏差越小。
損失函數(shù)為:
式中:l為訓(xùn)練損失函數(shù);
正則項(xiàng)Ω為處理目標(biāo)函數(shù)復(fù)雜度的約束函數(shù),其作用為平衡模型的準(zhǔn)確度和復(fù)雜度、避免過度擬合、取得最佳的模型準(zhǔn)確度和泛化能力。
XGBoost算法通過迭代增加樹模型的方式完成訓(xùn)練。過程中,在每次增加決策樹函數(shù)后,損失函數(shù)的值則會(huì)相應(yīng)減小。
對(duì)于第t次迭代過程中的第i個(gè)樣本,其損失函數(shù)的變化為:
可以看出,預(yù)測的輸出變?yōu)?fi(xi)。
為使損失函數(shù)取得最小值,進(jìn)行泰勒級(jí)數(shù)展開:
式中:hi為損失函數(shù)l在展開點(diǎn)處的二階導(dǎo)數(shù);gi為損失函數(shù)在展開點(diǎn)處的一階導(dǎo)數(shù)。
除去常數(shù)項(xiàng),由此得到簡化目標(biāo)函數(shù)為:
通過對(duì)ωi求導(dǎo),得到對(duì)應(yīng)樹結(jié)構(gòu)下的最優(yōu)葉節(jié)點(diǎn)權(quán)重,其公式為:
得到的最優(yōu)損失函數(shù)為:
采用公式(7)可以對(duì)算法中的樹結(jié)構(gòu)進(jìn)行綜合評(píng)價(jià)。若取得最小值,則表明此時(shí)的樹結(jié)構(gòu)達(dá)到最優(yōu)。
目前關(guān)于樹結(jié)構(gòu)搜索采用較多的算法為貪心算法,其基本原理為從單片葉結(jié)點(diǎn)開始,通過不斷迭代增加樹的分枝,確定最終的模型參數(shù)。
在實(shí)際應(yīng)用中,可利用模型的預(yù)測值和實(shí)測值構(gòu)造一種衡量偏差程度的指標(biāo)。一般采用某種距離測度來直觀地表示這種偏差。
選用最為常見的相似度指標(biāo)為:
式中:x、y分別代表2個(gè)不同的向量;deuc(x,y)代表x、y兩者之間的距離測度,如歐氏距離、馬氏距離等。
顯然,相似度指標(biāo)處于0~1之間。2個(gè)向量之間的差距越小,其相似度越接近于1。
監(jiān)測指標(biāo)超限則應(yīng)給出對(duì)應(yīng)的預(yù)警判定。傳統(tǒng)的閾值確定方法一般為歷史值統(tǒng)計(jì)方法。然而,考慮到目前各機(jī)組因普遍參與調(diào)峰而經(jīng)常出現(xiàn)各種新的運(yùn)行工況,再考慮到生產(chǎn)現(xiàn)場環(huán)境復(fù)雜、電磁干擾較大等因素,傳統(tǒng)意義上固定不變的閾值確定方式已經(jīng)不能適應(yīng)生產(chǎn)實(shí)際需求。
引入一種能夠適應(yīng)工況變化的自適應(yīng)閾值確定方法[14],其中心思想是采用迭代的思想代替不斷累積的時(shí)間窗,計(jì)算公式為:
式中:為前n時(shí)刻的相似度均值;simn為第n時(shí)刻的相似度值;為前n時(shí)刻的方差均值,thr為自適應(yīng)閾值。
由以上公式可見,通過時(shí)間上的滾動(dòng)迭代,可以實(shí)現(xiàn)統(tǒng)計(jì)量和閾值的更新。
在實(shí)際工程應(yīng)用中,為防止出現(xiàn)誤報(bào)的情況,當(dāng)連續(xù)3個(gè)采樣點(diǎn)出現(xiàn)超限時(shí),給出對(duì)應(yīng)的報(bào)警信號(hào)。
通常,設(shè)備的故障存在著一個(gè)逐漸劣化的過程。雖然設(shè)備狀態(tài)的變化可以通過其相關(guān)的特征參數(shù)被直接反映出來,但是應(yīng)用中存在參數(shù)數(shù)量多、變化原因多的問題。由此,為判定各參數(shù)的總體劣化情況,定義多參數(shù)的劣化度綜合指標(biāo)[15],計(jì)算式為:
式中:m為設(shè)備故障個(gè)數(shù);n為參數(shù)個(gè)數(shù);xij為設(shè)備第i個(gè)故障第j個(gè)參數(shù)的測量值;wi為第i個(gè)故障發(fā)生時(shí)對(duì)設(shè)備出力的影響權(quán)重;wj為第j個(gè)參數(shù)對(duì)設(shè)備出力的影響權(quán)重;為設(shè)備第i個(gè)故障時(shí)第j個(gè)參數(shù)的正常狀態(tài)閾值,為設(shè)備第i個(gè)故障時(shí)第j個(gè)參數(shù)的停運(yùn)閾值。
如式(12)所示,當(dāng)xij<時(shí)參數(shù)處于正常狀態(tài);當(dāng)
根據(jù)公式的定義,多特征參數(shù)的綜合劣化度計(jì)算過程為:首先將各特征參數(shù)與機(jī)組負(fù)荷組合為狀態(tài)向量,采集歷史數(shù)據(jù)進(jìn)行聚類,劃分為典型的設(shè)備工況運(yùn)行區(qū)間。根據(jù)特征參數(shù)的觀測值,判定其所在的工況區(qū)間,并計(jì)算各特征參數(shù)的劣化度,最終通過加權(quán)計(jì)算出所有特征參數(shù)的綜合劣化度。
在得到特征參數(shù)的劣化度后,構(gòu)造一種具備短期實(shí)時(shí)評(píng)價(jià)功能的可靠性評(píng)價(jià)模型,這樣有助于在設(shè)備故障發(fā)生的早期進(jìn)行判斷并采取對(duì)應(yīng)的有效措施。
將設(shè)備特征參數(shù)的狀態(tài)與可靠性融合考慮,定義設(shè)備的可靠性評(píng)價(jià)模型為[15]:
定義第j個(gè)參數(shù)對(duì)設(shè)備性能的影響權(quán)重為:
式中:qj為通過專家經(jīng)驗(yàn)及層次分析法得到的第j個(gè)特征參數(shù)異常對(duì)設(shè)備整體性能的影響權(quán)重;wj為只考慮參數(shù)異常影響時(shí),其對(duì)設(shè)備整體性能的影響權(quán)重。
目前大型火電機(jī)組一般配備的是中速磨煤機(jī)。在磨煤的過程中,常見的故障包括堵煤、斷煤、著火。
以國內(nèi)某600 MW機(jī)組為驗(yàn)證對(duì)象,其所配磨煤機(jī)型號(hào)為HP1003。在設(shè)計(jì)煤種下,磨煤機(jī)的額定出力為55.5 t/h,對(duì)應(yīng)的通風(fēng)量為97.98 t/h。
根據(jù)運(yùn)行機(jī)理[16],堵煤時(shí),磨煤機(jī)的主要參數(shù)變化為磨出口溫度降低、磨電流增大、磨差壓增大等;斷煤時(shí)的主要參數(shù)變化為磨出口溫度升高、磨電流大幅度減少、磨差壓減小等;著火故障會(huì)影響出口溫度、冷風(fēng)門開度等。
根據(jù)故障機(jī)理分析,在選取參數(shù)時(shí)應(yīng)考慮到數(shù)據(jù)易于直接獲取,并且對(duì)于特定故障的敏感性較大。該磨煤機(jī)現(xiàn)場測點(diǎn)共30多個(gè),經(jīng)過綜合比較和典型故障分析[17],確定10個(gè)特征參數(shù),如表1所示。
表1 磨煤機(jī)特征參數(shù)Tab.1 Characteristic parameters of coal mill
設(shè)置采樣周期為10 s。采集表1所列參數(shù)的歷史運(yùn)行數(shù)據(jù)800組。采用高低限和波動(dòng)率檢測2種方法,將超過正常區(qū)間、恒定不動(dòng)和突變的異常值剔除,得到正常工況數(shù)據(jù),并將其用于訓(xùn)練模型,最終得到XGBoost預(yù)測模型。
以同樣的采樣周期采集到得磨煤機(jī)另一連續(xù)時(shí)段的共500組運(yùn)行數(shù)據(jù),并將其用于所建立的模型進(jìn)行電流參數(shù)和熱風(fēng)調(diào)節(jié)門開度參數(shù)測試,結(jié)果如圖1和圖2所示。
圖1 磨煤機(jī)電流參數(shù)估計(jì)Fig.1 Estimation of coal mill current parameters
圖2 熱風(fēng)調(diào)節(jié)門開度參數(shù)估計(jì)Fig.2 Estimation of hot air regulating valve opening parameters
圖1和圖2顯示了磨煤機(jī)電流和熱風(fēng)調(diào)門開度的參數(shù)預(yù)測效果。從圖中可以看出,在磨煤機(jī)運(yùn)行狀態(tài)正常的情況下,模型的預(yù)測值和實(shí)測值之間的吻合度較高。該結(jié)果說明模型具有較好的預(yù)測能力,即:在正常運(yùn)行狀態(tài)下,參數(shù)的實(shí)測值和預(yù)測值偏差很小,相似度指標(biāo)維持在一個(gè)較高的水平。反之,若兩者之間出現(xiàn)偏差甚至隨著時(shí)間發(fā)展其呈現(xiàn)出不斷增大的趨勢(shì),則說明設(shè)備的運(yùn)行已經(jīng)偏離了正常狀態(tài),此時(shí)應(yīng)給出對(duì)應(yīng)的預(yù)警信息,提醒現(xiàn)場人員及時(shí)介入處理。
以同樣的采樣周期,采樣得到一段磨煤機(jī)發(fā)生故障前后的數(shù)據(jù)220組,計(jì)算其相似度指標(biāo)如圖3所示。
圖3 相似度指標(biāo)監(jiān)測Fig.3 Similarity index monitoring
圖3中黑色的實(shí)線為相似度指標(biāo)的計(jì)算值,點(diǎn)劃線為采用傳統(tǒng)的統(tǒng)計(jì)方法得到的固定閾值線,紅色虛線為動(dòng)態(tài)閾值線。從圖中可以看出:1)如果使用固定閾值的方式,在56、116、202等幾個(gè)正常工況點(diǎn)處會(huì)出現(xiàn)誤報(bào)警的情況,而動(dòng)態(tài)閾值會(huì)隨著工況的變化實(shí)時(shí)調(diào)整,在設(shè)備運(yùn)行正常的情況下,均未發(fā)生誤報(bào)警的情況。2)當(dāng)設(shè)備發(fā)生故障后,相似度指標(biāo)線首先越過動(dòng)態(tài)閾值線,說明動(dòng)態(tài)閾值能夠適應(yīng)工況的變化,比固定閾值提前給出預(yù)警信號(hào)。
利用模型訓(xùn)練數(shù)據(jù),對(duì)正常工況下的設(shè)備可靠度進(jìn)行統(tǒng)計(jì)分布分析,計(jì)算結(jié)果如圖4所示。圖中各柱的高度值表示設(shè)備的平均可靠度。低負(fù)荷區(qū)間設(shè)備運(yùn)行可靠度偏低;在高負(fù)荷區(qū)間,設(shè)備的可靠度較高,與實(shí)際運(yùn)行的情況相符。
圖4 磨煤機(jī)可靠度分布統(tǒng)計(jì)Fig.4 Reliability distribution statistics of coal mills
利用故障數(shù)據(jù)進(jìn)行可靠度計(jì)算,結(jié)果如圖5所示。
圖5 磨煤機(jī)整體可靠度趨勢(shì)Fig.5 Overall reliability trend of coal mills
從圖5可以看出:在故障發(fā)生前,磨煤機(jī)的整體可靠度維持在0.7附近;當(dāng)發(fā)生故障后,其可靠度值也出現(xiàn)了明顯的下降趨勢(shì)。
圖中紅色圈出的地方表示通過相似度指標(biāo)進(jìn)行監(jiān)測預(yù)警的區(qū)域。顯然,可靠度的大幅下降與相似度指標(biāo)的越限能夠相互驗(yàn)證,并且兩者得到的結(jié)論與實(shí)際情況一致。
本文建立了磨煤機(jī)特征參數(shù)的XGBoost預(yù)測模型。利用某600 MW機(jī)組中速磨實(shí)際運(yùn)行數(shù)據(jù)進(jìn)行驗(yàn)證,結(jié)果表明,模型的預(yù)測值與實(shí)際值吻合度較高,有效地實(shí)現(xiàn)了特征參數(shù)的實(shí)時(shí)監(jiān)測。
引入自適應(yīng)的動(dòng)態(tài)閾值確定方法。該方法能夠根據(jù)運(yùn)行工況的變化實(shí)時(shí)更新調(diào)整,比傳統(tǒng)的固定閾值具有更高的可靠性和靈敏度,能夠有效地降低誤報(bào)率。
基于特征參數(shù)的劣化度計(jì)算磨煤機(jī)整體的運(yùn)行可靠度,利用可靠度趨勢(shì)監(jiān)測其整體的運(yùn)行狀態(tài),進(jìn)一步提高了預(yù)警的準(zhǔn)確性。