夏祥禮 陳國彬 劉 超
1(重慶工商大學(xué)融智學(xué)院 重慶 401320)2(貴州航天電器股份有限公司 貴州 貴陽 550009)
近年來,越來越多的研究人員開始關(guān)注數(shù)據(jù)驅(qū)動(dòng)方法。許多過程數(shù)據(jù)可以通過使用測量技術(shù)來收集、存儲和分析。數(shù)據(jù)驅(qū)動(dòng)的軟傳感器模型有望解決現(xiàn)場實(shí)際問題中難以采用機(jī)理建模的通用技術(shù)[1,2]。建立準(zhǔn)確的數(shù)學(xué)模型是軟測量技術(shù)研究的主要內(nèi)容之一,常見的非線性預(yù)測模型包括人工神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)[3-5]等。
最小二乘支持向量機(jī)LSSVM是支持向量機(jī)的一種變體,良好的非線性處理能力使得LSSVM得到廣泛應(yīng)用。然而,LSSVM正則化參數(shù)和核參數(shù)嚴(yán)重影響模型的預(yù)測精度和泛化能力,其模型參數(shù)的選擇問題也是LSSVM模型重要研究內(nèi)容之一。文獻(xiàn)[6]采用差分進(jìn)化算法優(yōu)化最小二乘支持向量機(jī)模型,將其用于開關(guān)磁阻電機(jī)模型建立,仿真實(shí)驗(yàn)驗(yàn)證了DE-LSSVM模型的有效性。為改善LSSVM模型對非高斯脈動(dòng)風(fēng)速預(yù)測性能,李春祥等[7]采用蟻群算法和遺傳算法分別與粒子群算法相融合的混合算法優(yōu)化模型參數(shù),結(jié)果驗(yàn)證了優(yōu)化后的模型精度更高。文獻(xiàn)[8]采用三維果蠅優(yōu)化算法選擇LSSVM模型參數(shù)并建立庫存調(diào)節(jié)誤差預(yù)測模型,仿真結(jié)果驗(yàn)證了優(yōu)化算法對模型泛化能力提升的有效性。
飛蛾火焰優(yōu)化算法MFO是Mirjalili等模仿飛蛾捕焰機(jī)制提出的群智能優(yōu)化技術(shù)[9-10]。為增強(qiáng)MFO算法的性能,提出一種反學(xué)習(xí)MFO算法OMFO。進(jìn)一步,采用OMFO算法優(yōu)化選擇LSSVM模型參數(shù),并構(gòu)建OMFO-LSSVM軟測量模型,仿真實(shí)驗(yàn)驗(yàn)證了OMFO-LSSVM模型的實(shí)用性。
基于結(jié)構(gòu)風(fēng)險(xiǎn)最小化準(zhǔn)則的LSSVM因具有良好的非線性回歸特性,常用作軟測量建模的主要工具之一。LSSVM的目標(biāo)函數(shù)定義如下:
(1)
Subject toyi=<ω,xi>+b+eii=1,2,…,n
(2)
式中:(xi,yi),i=1,2…,l,xi∈Rn,yi∈R,為訓(xùn)練樣本集;φ(·)為非線性映射;γ為正則化參數(shù);ei為第i個(gè)樣本的擬合誤差。利用拉格朗日法構(gòu)造目標(biāo)函數(shù):
(3)
式中:αi是拉格朗日乘子。
根據(jù)式(3),通過L對ω、b、ei和αi的偏導(dǎo)數(shù)等于零對式(3)進(jìn)行優(yōu)化,可得到LSSVM的數(shù)學(xué)模型:
(4)
待求參數(shù)α=[a1,a2,…,ai,…,an],b可由下式求得:
(5)
式中:e=[1 1 … 1]T;y=[y1y2…yn]T;支持向量值α和偏執(zhí)量b是LSSVR的模型參數(shù);Ω是一個(gè)n×n的對稱矩陣。
Ωij=φ(xi)Tφ(xj)=K(xi,xj)i,j=1,2,…,n
(6)
式中:K(xi,xj)為核函數(shù)。常用核函數(shù)多項(xiàng)式核函數(shù)、Sigmoid核函數(shù)、徑向基等核(RBF)函數(shù)。RBF函數(shù)比其余兩種核函數(shù)待優(yōu)化參數(shù)少、且性能優(yōu)良,因此選擇RBF函數(shù)為LSSVM模型的核函數(shù):
(7)
Mirjalili等在2015年提出飛蛾火焰優(yōu)化算法MFO,旨在通過模仿飛蛾夜間使用的導(dǎo)航方法來解決優(yōu)化問題。在MFO算法中,飛蛾個(gè)體為優(yōu)化問題的候選解。n個(gè)飛蛾在d維空間中構(gòu)成的種群由矩陣M描述:
(8)
飛蛾個(gè)體適應(yīng)度值存儲在OM矩陣中:
(9)
火焰為當(dāng)前迭代所獲得的最佳位置,種群F和適應(yīng)度矩陣OF描述如下:
(10)
(11)
MFO算法包括捕焰行為和棄焰操作。飛蛾以對數(shù)螺旋運(yùn)動(dòng)軌跡移動(dòng)到火焰位置,并實(shí)現(xiàn)全局最優(yōu),其捕焰行為描述如下:
S(Mi,Fj)=Di·ebt·cos(2πt)+Fj
(12)
式中:Mi,Fj分別為第i個(gè)飛蛾和第j個(gè)火焰;S(Mi,Fj)為飛蛾更新位置;b為螺旋常量;t為[-1,1]之間的隨機(jī)數(shù);Di=Fj-Mi。
在MFO算法中,定義最大迭代次數(shù)和當(dāng)前迭代次數(shù)分別為T和t。MFO算法通過式(13)棄焰操作將火焰數(shù)量由N逐漸減少,并最終將保持一個(gè)最優(yōu)火焰:
(13)
MFO算法是一種自然啟發(fā)的搜索算法,在解決各種優(yōu)化問題時(shí)具有良好的性能和效率。橫向定向過程中的“火焰”變量是MFO用來更新種群新位置的一個(gè)重要參數(shù)。然而,火焰的減少會(huì)導(dǎo)致收斂速度變慢,從而影響最終解決方案的質(zhì)量。為了克服這個(gè)缺點(diǎn),提出新的反學(xué)習(xí)OBL(opposition-based learning)飛蛾火焰算法;此外,針對越界飛蛾,采用一種鏡像越界策略保證飛蛾均在維度范圍內(nèi),改善種群多樣性。
2.2.1反學(xué)習(xí)算法
(14)
在MFO基礎(chǔ)上增加基于反學(xué)習(xí)策略的補(bǔ)充函數(shù)H以加快MFO收斂速度,并獲得了高精度的解。H函數(shù)描述如下:
H=(A+B)-C×rand()
(15)
Mi=H
(16)
(17)
(18)
式中:s=當(dāng)前迭代次數(shù)/最大迭代次數(shù);Γ和Θ分別為飛蛾的最大和最小位置;U和L為搜索空間的上、下限;C為任意迭代過程中最佳火焰位置;rand()為(0,1)之間的隨機(jī)數(shù)。式(15)是反學(xué)習(xí)的一種新形式,H函數(shù)根據(jù)飛蛾的反向位置生成新的反向解。
2.2.2飛蛾越界鏡像策略
MFO優(yōu)化過程中,飛蛾按式(12)更新位置,其位置坐標(biāo)會(huì)發(fā)生越界情況而不斷被置于邊界上,不僅降低飛蛾種群的多樣性,還容易使算法陷入局部最優(yōu),進(jìn)而影響算法的優(yōu)化性能。針對這種情況,利用下式更新越界飛蛾:
(19)
式中:mi,j為第i個(gè)飛蛾中第j維越界位置;Lj、Uj為第j維的取值范圍。多次重復(fù)操作式(19)可以將mi,j映射到維度的范圍之內(nèi),保證了種群多樣性,有效提升MFO算法優(yōu)化性能。
OMFO算法步驟描述如下:
參數(shù)初始化:種群規(guī)模(sizepop)、維數(shù)(d)、最大迭代次數(shù)(Max_iterrations)、當(dāng)前迭代次數(shù)(Iteration)等 初始化飛蛾和火焰While(Iteration<=Max_iterrations)OM=FitnessFunction(M);按式(13)更新MFOs算法火焰數(shù)量;if Iteration==1 F=sort(M); OF=sort(OM);else F=sort(Mt-1, Mt);//t是當(dāng)前迭代次數(shù) OF=sort(OMt-1, OMt);endfor i=1: sizepop for j=1:d 計(jì)算Di=Fj-Mi; 按式(12)更新M(i, j); endend按式(17)-式(18)計(jì)算A、B;按式(15)計(jì)算H函數(shù);更新Mi=H;按式(19)處理越界飛蛾;End終止并輸出全局最優(yōu)解飛蛾。
LSSVM軟測量模型關(guān)心系統(tǒng)的輸入與輸出而不必掌握對象的具體內(nèi)部物理結(jié)構(gòu)。LSSVM模型參數(shù)包括正則化參數(shù)γ和核寬度δ,通過優(yōu)化技術(shù)解決模型參數(shù)確定的問題能夠有效提升模型預(yù)測精度和泛化能力。MFO算法全局優(yōu)化性能優(yōu)異,基于反學(xué)習(xí)與飛蛾越界鏡像策略改進(jìn)的OMFO算法在高維、多模函數(shù)優(yōu)化中性能更優(yōu),因此采用OMFO解決LSSVM模型的數(shù)對(γ,δ2)的優(yōu)化選擇問題。以每個(gè)飛蛾對應(yīng)的模型參數(shù)在訓(xùn)練集上產(chǎn)生的均方誤差(MSE)作為算法調(diào)整LSSVM模型的適應(yīng)度函數(shù),定義如下:
(20)
基于OMFO-LSSVM軟測量模型流程主要包括數(shù)據(jù)準(zhǔn)備、模型建立與模型驗(yàn)證三個(gè)過程。首先對控制系統(tǒng)進(jìn)行分析,確定與被測變量相關(guān)的易測變量;然后采集模型所需實(shí)驗(yàn)數(shù)據(jù)、并對數(shù)據(jù)進(jìn)行清洗、選擇等預(yù)處理,按一定比例隨機(jī)確定訓(xùn)練集和測試集;在上述步驟完成后,將采用OMFO算法訓(xùn)練LSSVM模型。將每個(gè)飛蛾的位置映射到LSSVM模型,輸入樣本訓(xùn)練模型,按式(20)計(jì)算群眾中飛蛾的適應(yīng)度值,一旦搜索完成,適應(yīng)度值最大對應(yīng)的飛蛾位置就是最優(yōu)模型參數(shù)值,以求得的最優(yōu)參數(shù)對構(gòu)建最優(yōu)OMFO-LSSVM軟測量器;最后,將采用測試集進(jìn)行模型驗(yàn)證,將測試樣本輸入最優(yōu)OMFO-LSSVM軟測量器并獲得預(yù)測結(jié)果,根據(jù)結(jié)果對模型泛化能力進(jìn)行分析、評估。
汽輪機(jī)是火電機(jī)組中重要設(shè)備之一,包括高、低壓缸系統(tǒng)、再熱系統(tǒng)、除氧器、凝結(jié)水、負(fù)荷自動(dòng)控制等系統(tǒng),其結(jié)構(gòu)復(fù)雜、熱工過程常常難以采用機(jī)理模型進(jìn)行準(zhǔn)確描述。熱耗率是指每產(chǎn)生1 kWh的電能所消耗的熱量。作為機(jī)組最重要指標(biāo)之一,熱耗率指標(biāo)常用來衡量電廠熱經(jīng)濟(jì)性。本文采用OMFO-LSSVM軟測量模型對熱耗率值進(jìn)行仿真預(yù)測實(shí)驗(yàn)。
以某600 MW汽機(jī)為研究對象,確定機(jī)組負(fù)荷、主蒸汽壓力與溫度、過熱蒸汽壓力等12個(gè)易測參數(shù)作為軟測量模型輸入,熱耗率作為模型預(yù)測值[12]。從該機(jī)組的集散控制系統(tǒng)中采集正常運(yùn)行的598組數(shù)據(jù),并離線分析出熱耗率值。為研究模型的預(yù)測性能,假設(shè)離線分析的熱耗率是準(zhǔn)確的。隨機(jī)選擇550組數(shù)據(jù)作為訓(xùn)練樣本,余下的48組數(shù)據(jù)作為測試樣本。采用550組數(shù)據(jù)訓(xùn)練模型,得到最優(yōu)OMFO-LSSVM模型,并利用48組測試樣本進(jìn)行模型預(yù)測,預(yù)測結(jié)果如圖1所示。此外,為了驗(yàn)證該模型性能,將其結(jié)果與MFO-LSSVM和LSSVM進(jìn)行對比。圖2為MFO-LSSVM預(yù)測結(jié)果。圖3為3個(gè)模型的預(yù)測誤差曲線。
圖1 OMFO-LSSVM預(yù)測曲線
圖2 MFO-LSSVM預(yù)測曲線
圖3 預(yù)測誤差對比曲線
從圖1可以看出,OMFO-LSSVM熱耗率預(yù)測曲線與真值曲線幾乎完全重合,預(yù)測誤差較小,反映出OMFO-LSSVM模型泛化性能優(yōu)良。從圖2可以發(fā)現(xiàn),MFO-LSSVM預(yù)測趨勢與真值曲線一致,對于樣本6、8、23、42、43、44,MFO-LSSVM預(yù)測誤差較大。從圖3可以看出,LSSVM模型預(yù)測誤差曲線波動(dòng)范圍最大,其預(yù)測結(jié)果最差;經(jīng)過MFO算法優(yōu)化的LSSVM模型誤差明顯變小,驗(yàn)證了模型參數(shù)是模型泛化能力的關(guān)鍵影響因素;OMFO-LSSVM模型預(yù)測曲線波動(dòng)范圍最小,表明OMFO搜索優(yōu)化的模型參數(shù)最理想,也進(jìn)一步驗(yàn)證了OMFO算法改進(jìn)策略的有效性。
表1給出了3種模型的預(yù)測誤差指標(biāo)??梢钥闯觯琇SSVM模型預(yù)測精度最差,其最大絕對誤差MAE達(dá)到149.85 kJ/(kWh),平均絕對百分誤差MAPE達(dá)到4.52%;均方根誤差RMSE為56.72 kJ/(kWh);而OMFO-LSSVM模型3個(gè)指標(biāo)分別為33.21、0.11、11.49,均是最小的,表明模型精度最高。綜上所述,OMFO-LSSVM模型在熱耗率預(yù)測中取得了最佳效果,驗(yàn)證了OMFO-LSSVM模型的優(yōu)越性。
表1 模型預(yù)測性能比較
針對工業(yè)過程變量無法或難以直接測量的問題,本文提出一種新的LSSVM軟測量模型。所提出的模型與反學(xué)習(xí)OMFO算法相結(jié)合,采用OMFO算法優(yōu)化選擇模型參數(shù),并構(gòu)建OMFO-LSSVM軟測量模型。以某600 MW汽輪機(jī)熱耗率預(yù)測為案例進(jìn)行研究,OMFO-LSSVM模型預(yù)測MAPE指標(biāo)達(dá)到0.11%,與MFO-LSSVM、LSSVM模型相比,OMFO-LSSVM模型具有更高的精度。