(合肥工業(yè)大學(xué) 電氣與自動(dòng)化工程學(xué)院,安徽 合肥 230009)
水泥工業(yè)是我國(guó)國(guó)民經(jīng)濟(jì)建設(shè)的重要基礎(chǔ)材料產(chǎn)業(yè),也是高能源消耗和高污染排放的行業(yè)之一[1],所以節(jié)能環(huán)保的生產(chǎn)方式尤為重要。預(yù)分解是新干法水泥生產(chǎn)技術(shù)的核心步驟[2],而分解爐出口溫度是反映分解爐運(yùn)行工況優(yōu)劣的關(guān)鍵指標(biāo),對(duì)水泥生產(chǎn)的質(zhì)量、產(chǎn)量及能耗起著至關(guān)重要的作用,所以對(duì)分解爐出口溫度的研究具有重要意義[3]。近年來,許多學(xué)者圍繞分解爐溫度的預(yù)測(cè)和控制展開研究。文獻(xiàn)[4]提出基于遺傳算法優(yōu)化的BP網(wǎng)絡(luò)出口溫度預(yù)測(cè)模型,并進(jìn)行了仿真驗(yàn)證;文獻(xiàn)[5]在極限學(xué)習(xí)機(jī)與回歸分析的基礎(chǔ)上,建立了出口溫度的T-S模糊模型;文獻(xiàn)[6]和文獻(xiàn)[7]分別運(yùn)用神經(jīng)網(wǎng)絡(luò)與自適應(yīng)PID的方法,實(shí)現(xiàn)了對(duì)分解爐溫度的控制;文獻(xiàn)[8]提出一種基于參數(shù)優(yōu)化的支持向量回歸的方法預(yù)測(cè)分解爐溫度,取得了預(yù)期的預(yù)測(cè)效果。但是上述研究在關(guān)于影響分解爐溫度的變量選擇上,大都是采用傳統(tǒng)的經(jīng)驗(yàn)法,以風(fēng)(三級(jí)風(fēng))、料(生料量)、煤(喂煤量)等主要變量對(duì)分解爐系統(tǒng)進(jìn)行研究。由于分解爐內(nèi)部結(jié)構(gòu)復(fù)雜、變量眾多、理化反應(yīng)交織,人為經(jīng)驗(yàn)法選取的少數(shù)變量難以全面概括分解爐系統(tǒng)的內(nèi)部規(guī)律,易造成預(yù)測(cè)精度不高,模型的泛化能力較弱等問題。而將多元統(tǒng)計(jì)分析方法與神經(jīng)網(wǎng)絡(luò)算法相結(jié)合的數(shù)據(jù)驅(qū)動(dòng)建模方法,由于包含可能影響系統(tǒng)的全部變量,又具有神經(jīng)網(wǎng)絡(luò)強(qiáng)大的計(jì)算擬合能力,所以能夠更為科學(xué)準(zhǔn)確地把握系統(tǒng)特性,因此更適用于多變量、非線性和不確定性的分解爐出口溫度建模預(yù)測(cè)。
本文提出基于動(dòng)態(tài)主元分析(Dynamic Principal Component Analysis,DPCA)與極限學(xué)習(xí)機(jī)(Extreme Learning Machine,ELM)相結(jié)合的DPCA-ELM預(yù)測(cè)模型對(duì)分解爐出口溫度進(jìn)行預(yù)測(cè)。利用DPCA消除變量之間的相關(guān)性,計(jì)算出各輸入變量在不同時(shí)序下對(duì)輸出的影響,降低數(shù)據(jù)的冗余和噪聲,減少ELM的輸入維度。然后將降維所得的主元作為極限學(xué)習(xí)機(jī)的輸入層,再通過PSO粒子群尋優(yōu)算法求得ELM網(wǎng)絡(luò)的最優(yōu)權(quán)值和偏置,再由方程組計(jì)算確定隱含層至輸出層的權(quán)值,經(jīng)訓(xùn)練、調(diào)參,從而完成對(duì)出口溫度的建模預(yù)測(cè)。經(jīng)仿真驗(yàn)證表明,基于DPCA-ELM的分解爐出口溫度預(yù)測(cè)模型具有良好的預(yù)測(cè)精度,同時(shí)也為其他復(fù)雜、非線性、多變量工業(yè)系統(tǒng)建模提供參考。
主元分析(PCA)的基本原理就是將多維的線性相關(guān)的原始數(shù)據(jù)Xn×m轉(zhuǎn)化為低維且線性無關(guān)的新數(shù)據(jù)Tn×k,其中k (1) X的標(biāo)準(zhǔn)化S又可以表示為得分矩陣和相關(guān)系數(shù)矩陣的外積形式: S=Tn×mRm×m (2) 式中,矩陣R=(r1,r2,…,rm)為S的相關(guān)系數(shù)矩陣;T=(t1,t2,…,tm)為S的得分矩陣。若‖t1‖>‖t2‖>…>‖tm‖,則t1即為第一主元,代表X在其對(duì)應(yīng)方向的投影最大。 取前k個(gè)主元,可得S=TkRk+E,式中E為殘差矩陣,主元Tn×k=(t1,t2,…,tk)即為降維后的新數(shù)據(jù)。 雖然傳統(tǒng)的PCA算法可以降低變量維度,減少數(shù)據(jù)冗余,但是對(duì)于有時(shí)序的系統(tǒng)模型,傳統(tǒng)的PCA會(huì)忽略某些變量對(duì)模型輸出的動(dòng)態(tài)影響,從而影響模型的可靠性,而DPCA可以通過添加前h時(shí)刻的增廣矩陣彌補(bǔ)傳統(tǒng)PCA的靜態(tài)不足的問題。增廣矩陣為 (3) 式中,x為t時(shí)刻在訓(xùn)練集中的m維觀測(cè)向量對(duì)于滯后因子h的確定,由遞推公式(4)遞推至rn(h)>0: (4) 經(jīng)計(jì)算當(dāng)h=2時(shí),rn(h)>0,故確定滯后因子為2。 極限學(xué)習(xí)機(jī)算法是由新加坡學(xué)者黃廣斌等人在2004年提出的一種單隱含層前饋神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法,具有預(yù)測(cè)精度高,訓(xùn)練速度快等優(yōu)點(diǎn)。 對(duì)于單隱含層神經(jīng)網(wǎng)絡(luò),設(shè)有n組多變量輸入樣本Xi=[xi1,xi2,…,xin]T∈Rn,多變量輸出樣本Ti=[ti1,ti2,…,tim]T∈Rm。則網(wǎng)絡(luò)的輸出可以表示為 (5) 式中,j=1,2,…,n;L為隱含層節(jié)點(diǎn)數(shù);βi為輸出權(quán)值;f(x)為網(wǎng)絡(luò)的激活函數(shù);Wi=[wi,1,wi,2,…,wi,n]T為輸入層到隱含層權(quán)值;Xj為網(wǎng)絡(luò)輸入;bi為第i個(gè)隱含層節(jié)點(diǎn)的偏置。網(wǎng)絡(luò)學(xué)習(xí)的目的是實(shí)際輸出Oj與目標(biāo)的誤差盡可能的逼近于0,可以表示為 (6) 等價(jià)于存在βi,Wi和bi,使得式(7)成立。 (7) 式(7)又可以等價(jià)表示為Hβ=T,其中,H是隱含層節(jié)點(diǎn)的輸出,β為輸出層的權(quán)值,T為網(wǎng)絡(luò)期望輸出。式中,β、T、H可以表示為[12] (8) (9) (10) 式中,i=1,2,…,L,求解式(10)等價(jià)于求解損失函數(shù)的最小值: (11) (12) 水泥分解爐作為新干法水泥生產(chǎn)的核心部分,承擔(dān)了燃燒加熱、氣固換熱、物料反應(yīng)與分解等多個(gè)步驟。因此機(jī)理建模預(yù)測(cè)在水泥分解爐系統(tǒng)中的建立顯得尤為困難。故本文采用數(shù)據(jù)驅(qū)動(dòng)建模的方法,建立了基于水泥生產(chǎn)過程中所采集的生產(chǎn)數(shù)據(jù)的DPCA-ELM分解爐出口溫度預(yù)測(cè)模型,并在Matlab環(huán)境下,完成仿真驗(yàn)證。 本文數(shù)據(jù)來自2014年6月,某水泥公司6000 t/d水泥生產(chǎn)線的現(xiàn)場(chǎng)數(shù)據(jù),采集數(shù)據(jù)的時(shí)間間隔為1 min。從穩(wěn)定工況下選取400組作為訓(xùn)練樣本,再選取100組測(cè)試樣本用來測(cè)試模型的有效性。水泥分解爐的系統(tǒng)結(jié)構(gòu)復(fù)雜,其內(nèi)部理化反應(yīng)眾多,故本文參考水泥生產(chǎn)實(shí)際過程和文獻(xiàn)確定與模型輸出相關(guān)的輸入變量,其中包括:生料量、喂煤量、三級(jí)風(fēng)風(fēng)溫和風(fēng)壓、各級(jí)旋風(fēng)筒出口溫度以及氣壓、高溫風(fēng)機(jī)電流、轉(zhuǎn)速等。訓(xùn)練樣本原始數(shù)據(jù)見表1。 表1 訓(xùn)練集樣本原始數(shù)據(jù) 選取如上輸入變量中生料量、喂煤量等19個(gè)變量,經(jīng)計(jì)算滯后因子h=2,故添加前兩個(gè)時(shí)刻的數(shù)據(jù)構(gòu)成主元分析的增廣矩陣,再采用DPCA算法對(duì)輸入變量進(jìn)行降維,以簡(jiǎn)化ELM網(wǎng)絡(luò)輸入單元個(gè)數(shù)。 在進(jìn)行主元分析前,首先要判斷各變量之間是否存在相關(guān)性,以檢驗(yàn)主元分析的適用與否。所以本文采用KMO統(tǒng)計(jì)檢驗(yàn)方法,KMO的值δ越接近1,數(shù)據(jù)越適宜采用主元分析。其檢驗(yàn)公式如下: (13) 式中,rij為所有變量的簡(jiǎn)單相關(guān)系數(shù);aij為所有變量的偏相關(guān)系數(shù)。經(jīng)檢驗(yàn)計(jì)算,篩選后變量的KMO值δ=0.9518,故篩選后的變量非常適宜使用主元分析進(jìn)行降維。 將篩選后的數(shù)據(jù)標(biāo)準(zhǔn)化,消除因量綱不同所產(chǎn)生的不利影響。再求出相關(guān)系數(shù)陣的特征值λ1,λ2,…,λi,…,λ57,及其對(duì)應(yīng)的特征向量p1,p2,…,pi,…,p57,并將特征向量按其對(duì)應(yīng)特征值由大到小排列。計(jì)算特征值累積貢獻(xiàn)率(Cumulative Percent Variance,CPV)其公式為 (14) 式中,分母為所有特征值的累加值;分子為主元的累加值。設(shè)定CPV的期望值為85%,經(jīng)計(jì)算得k為18時(shí),CPV的值達(dá)到85.8077%,故取主元個(gè)數(shù)為18,其特征值及主元貢獻(xiàn)率見表2。 表2 特征值及主元貢獻(xiàn)率 最后由原始數(shù)據(jù)X和主元的特征向量的乘積求得降維后的主元Tn×k=(t1,t2,…,ti,…,t43),式中,ti=Xpi。 將主元作為極限學(xué)習(xí)機(jī)網(wǎng)絡(luò)的輸入層,即網(wǎng)絡(luò)有18個(gè)輸入節(jié)點(diǎn)。選取激活函數(shù)為sigmoid函數(shù),其表達(dá)式為 (15) 選取性能函數(shù)為均方誤差MSE(Mean Squared Error)與擬合優(yōu)度R2(R-square),其表達(dá)式為 (16) (17) 在ELM中,輸入權(quán)值與隱含層偏置隨機(jī)產(chǎn)生,無需迭代,輸出權(quán)值由式(12)確定。但由此產(chǎn)生的參數(shù)隨機(jī)性較大,且所需隱含層節(jié)點(diǎn)數(shù)過多,易導(dǎo)致模型復(fù)雜度加大,泛化能力下降。故本文采用粒子群尋優(yōu)算法(PSO)代替ELM權(quán)值偏置隨機(jī)產(chǎn)生。 PSO優(yōu)化算法的參數(shù)設(shè)置參考文獻(xiàn)[14]所述,并驗(yàn)證其在本模型的可行性。其具體設(shè)置為:粒子數(shù)30;最大和最小慣性權(quán)重分別為0.9和0.4;學(xué)習(xí)因子c1,c2同為1.4961;最大迭代次數(shù)為80次;激活函數(shù)為sigmoid函數(shù);適應(yīng)度函數(shù)為MSE。 PSO算法適應(yīng)度隨迭代次數(shù)變化曲線如圖1所示,當(dāng)?shù)螖?shù)在70次左右時(shí),適應(yīng)度值穩(wěn)定在0.0373不再變化,訓(xùn)練收斂,權(quán)值和偏置尋優(yōu)過程結(jié)束。 圖1 適應(yīng)度隨迭代次數(shù)變化曲線 對(duì)于ELM隱含層節(jié)點(diǎn)個(gè)數(shù)的確定,參考文獻(xiàn)[15],設(shè)定初始隱含層節(jié)點(diǎn)數(shù)為20,再以5為增幅進(jìn)行訓(xùn)練預(yù)測(cè),每個(gè)節(jié)點(diǎn)重復(fù)預(yù)測(cè)20次,并對(duì)所得性能指標(biāo)取平均值。不同隱含層節(jié)點(diǎn)個(gè)數(shù)預(yù)測(cè)的平均性能指標(biāo)如表3所示。 表3 不同隱含層節(jié)點(diǎn)個(gè)數(shù)性能指標(biāo) 由表3看出,隨著隱含層節(jié)點(diǎn)個(gè)數(shù)的增加,訓(xùn)練樣本預(yù)測(cè)效果越好,測(cè)試樣本預(yù)測(cè)效果在節(jié)點(diǎn)數(shù)為80時(shí)預(yù)測(cè)效果最佳,當(dāng)隱含層節(jié)點(diǎn)個(gè)數(shù)由80繼續(xù)增加時(shí),測(cè)試樣本預(yù)測(cè)效果變差。其性能函數(shù)隨節(jié)點(diǎn)數(shù)變化趨勢(shì)如圖2所示。 圖2 預(yù)測(cè)效果隨節(jié)點(diǎn)個(gè)數(shù)變化趨勢(shì) 由圖2可以看出,在節(jié)點(diǎn)個(gè)數(shù)為80時(shí),測(cè)試集MSE最小,擬合優(yōu)度R2最大,對(duì)測(cè)試樣本數(shù)據(jù)的預(yù)測(cè)結(jié)果最佳。故確定隱含層節(jié)點(diǎn)數(shù)為80時(shí),模型預(yù)測(cè)與泛化能力最佳,其訓(xùn)練時(shí)間為50.8255 s。出口溫度預(yù)測(cè)模型如圖3所示。 圖3 DPCA-ELM預(yù)測(cè)模型 其中,Zi為時(shí)滯h為2的原始變量,Xi為動(dòng)態(tài)主元分析降維所得的18個(gè)主元,即ELM的輸入層,W為輸入層權(quán)值,bi為第i個(gè)隱含層節(jié)點(diǎn)的偏置,βi為第i個(gè)隱含層節(jié)點(diǎn)的輸出權(quán)值,y為輸出的預(yù)測(cè)出口溫度。 將選取的100組測(cè)試集樣本變量數(shù)據(jù)導(dǎo)入DPCA-ELM預(yù)測(cè)模型,100組測(cè)試集樣本如表4所示。 表4 測(cè)試集樣本原始數(shù)據(jù) 經(jīng)DPCA-ELM模型預(yù)測(cè)后,得到測(cè)試集預(yù)測(cè)輸出。100組出口溫度預(yù)測(cè)結(jié)果與實(shí)際數(shù)據(jù)對(duì)比及誤差如表5所示。由表5可以看出測(cè)試集預(yù)測(cè)效果良好且穩(wěn)定。 經(jīng)計(jì)算,DPCA-ELM模型預(yù)測(cè)的最大誤差約為5.1294 ℃,平均預(yù)測(cè)誤差約為1.2013 ℃,相對(duì)誤差平均值約為0.1285%。 表5 測(cè)試樣本預(yù)測(cè)結(jié)果與誤差 為了進(jìn)一步驗(yàn)證DPCA-ELM模型的有效性與優(yōu)勢(shì),將其與文獻(xiàn)[4]所提出的GA-BP模型的預(yù)測(cè)效果進(jìn)行對(duì)比。 設(shè)置遺傳算法參數(shù):進(jìn)化代數(shù):100;種群規(guī)模:50;交叉概率:0.7;變異概率:0.1。 重復(fù)試驗(yàn)觀察后,設(shè)置BP神經(jīng)網(wǎng)絡(luò)的隱含層數(shù)為45;激活函數(shù)設(shè)置為動(dòng)量梯度下降法(Gradient Descent with Momentum)函數(shù)traingdm;迭代次數(shù)為200;學(xué)習(xí)步長(zhǎng)為0.01;性能函數(shù)為MSE;目標(biāo)值為0.001。 GA-BP模型的訓(xùn)練時(shí)間為21.7242 s。經(jīng)訓(xùn)練后,建立了遺傳算法優(yōu)化的BP網(wǎng)絡(luò)的出口溫度預(yù)測(cè)模型,將測(cè)試樣本數(shù)據(jù)導(dǎo)入模型,得到測(cè)試樣本預(yù)測(cè)輸出。DPCA-ELM模型和GA-BP模型預(yù)測(cè)結(jié)果與測(cè)試樣本實(shí)際對(duì)比如圖4所示。 由圖4可以看出,基于DPCA-ELM模型的出口溫度預(yù)測(cè)效果良好,GA-BP模型預(yù)測(cè)效果稍差。其預(yù)測(cè)結(jié)果與誤差對(duì)比如表6所示。 由表6可以得出:基于DPCA-ELM的出口溫度預(yù)測(cè)模型具有精度高、擬合度好、訓(xùn)練速度快等優(yōu)勢(shì)。基于GA-BP網(wǎng)絡(luò)的預(yù)測(cè)模型,由于輸入維度高,遺傳算法編碼復(fù)雜,所需迭代參數(shù)較多,故訓(xùn)練速度較慢,泛化能力較弱,影響對(duì)出口溫度預(yù)測(cè)的精度。 圖4 測(cè)試樣本預(yù)測(cè)效果對(duì)比 模型MSER2EmaxEmeanGA-BP10.57910.63257.08122.8773DPCA-ELM2.36750.91315.12941.2013 本文提出了一種數(shù)據(jù)驅(qū)動(dòng)建模方法:首先進(jìn)行KMO統(tǒng)計(jì)檢驗(yàn),驗(yàn)證PCA的適用性,然后計(jì)算出滯后因子,使用DPCA降低影響分解爐出口溫度變量的維度,消除變量之間的相關(guān)性。在此基礎(chǔ)上,構(gòu)建以低維數(shù)據(jù)為輸入層的ELM預(yù)測(cè)模型,再使用PSO算法優(yōu)化參數(shù),通過訓(xùn)練、調(diào)參,最終求得最優(yōu)DPCA-ELM出口溫度預(yù)測(cè)模型,并使用該模型對(duì)測(cè)試樣本進(jìn)行預(yù)測(cè)。最后通過與GA-BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型的對(duì)比分析,體現(xiàn)DPCA-ELM預(yù)測(cè)模型良好的預(yù)測(cè)精度和泛化能力。1.2 極限學(xué)習(xí)機(jī)
2 出口溫度建模預(yù)測(cè)
2.1 數(shù)據(jù)來源與變量篩選
2.2 KMO檢驗(yàn)與PCA降維
2.3 DPCA-ELM預(yù)測(cè)模型參數(shù)設(shè)置與訓(xùn)練
3 仿真驗(yàn)證
3.1 測(cè)試數(shù)據(jù)及預(yù)測(cè)
3.2 預(yù)測(cè)結(jié)果對(duì)比分析
4 結(jié)束語(yǔ)