陳 寧,李彬艷,赫學(xué)實(shí),羅 彪,桂衛(wèi)華,陽(yáng)春華
(中南大學(xué)自動(dòng)化學(xué)院,湖南長(zhǎng)沙 410083)
鋰離子電池正極材料具有能量密度大、循環(huán)壽命長(zhǎng)、安全性能好等優(yōu)點(diǎn),已廣泛應(yīng)用于智能手機(jī)、電動(dòng)汽車等多個(gè)領(lǐng)域,成為當(dāng)今應(yīng)用最廣泛和最有發(fā)展前景的電池材料之一[1].鋰離子電池最重要的組成為正極材料,鋰電池需求的日益增加使得開展正極材料制備過(guò)程的研究對(duì)于提高材料產(chǎn)品一致性意義重大.燒結(jié)過(guò)程是制備過(guò)程最重要的工序,主要在工業(yè)輥道窯中進(jìn)行,國(guó)內(nèi)外對(duì)工業(yè)輥道窯熱處理過(guò)程的建模及優(yōu)化控制等方面進(jìn)行了大量研究.
輥道窯燒結(jié)過(guò)程是一個(gè)復(fù)雜、非線性、強(qiáng)耦合的過(guò)程,同時(shí)也是一個(gè)連續(xù)緩慢發(fā)生化學(xué)反應(yīng)的長(zhǎng)過(guò)程[2].為了對(duì)輥道窯內(nèi)部的溫度與濃度進(jìn)行估計(jì),文獻(xiàn)[3]通過(guò)對(duì)加熱電阻爐各段施加控制信號(hào)來(lái)觀測(cè)爐內(nèi)各段溫度的階躍響應(yīng),并采用階躍響應(yīng)法建立了考慮純時(shí)滯下的輥道窯加熱系統(tǒng)數(shù)學(xué)模型.上述方法是當(dāng)前研究輥道窯爐內(nèi)溫度普遍采用的建模方法.文獻(xiàn)[4]從溫度和總能量的角度,把溫度當(dāng)作集中參數(shù)考慮來(lái)處理,通過(guò)合理的簡(jiǎn)化得到一階含純時(shí)滯的數(shù)學(xué)模型.雖然上述方法可以預(yù)估溫度,但由于進(jìn)行了大量簡(jiǎn)化使得溫度估計(jì)值與真實(shí)值之間存在較大的誤差.所建立的模型與實(shí)際過(guò)程相比存在較大差異,模型的精度一般無(wú)法滿足要求.為解決上述難點(diǎn),從過(guò)程機(jī)理出發(fā),開展輥道窯溫度場(chǎng)建模研究,對(duì)燒結(jié)過(guò)程的優(yōu)化控制具有重要意義.
工業(yè)窯爐內(nèi)溫度場(chǎng)和濃度場(chǎng)等物理場(chǎng)的機(jī)理建模研究可以為本過(guò)程的建模提供有益的參考.文獻(xiàn)[5]根據(jù)傳熱理論對(duì)熱風(fēng)爐的速度場(chǎng)和流體場(chǎng)開展研究,得到了氣流速度場(chǎng)、CO密度場(chǎng)的分布結(jié)果.文獻(xiàn)[6]在建立連續(xù)退火爐的模型時(shí)綜合考慮了爐子部件的輻射傳熱和對(duì)流傳熱,進(jìn)一步提高了模型準(zhǔn)確度.文獻(xiàn)[7]在大型立式淬火爐中采用簡(jiǎn)化區(qū)法計(jì)算了輻射熱通量,提出了一種新的雙外推有限元法求解工件的瞬態(tài)溫度場(chǎng).上述建模方法能夠直接顯示物理場(chǎng)的分布,對(duì)分析物理場(chǎng)的變化特征非常有益.但是,該類方法的求解一般需要依賴數(shù)值仿真軟件,求解復(fù)雜且耗時(shí)長(zhǎng),往往難以用于實(shí)際工業(yè)過(guò)程.
為了提升三元正極材料產(chǎn)品一致性,需要對(duì)輥道窯燒結(jié)過(guò)程的溫度場(chǎng)進(jìn)行優(yōu)化控制研究[8].對(duì)于復(fù)雜工業(yè)系統(tǒng)優(yōu)化控制問題,求解方法主要為基于梯度理論的優(yōu)化方法,如最速下降法、共軛梯度法及非線性規(guī)劃方法等[9–11].這類方法原理簡(jiǎn)單易于實(shí)現(xiàn),但由于屬于局部搜素方法,其尋優(yōu)結(jié)果受初始值的影響很大[12]且無(wú)法保證算法的收斂性,還要求所用的過(guò)程模型顯式可導(dǎo).基于模型的控制方法在實(shí)際應(yīng)用時(shí)由于面臨不確定性、干擾等問題難以取得較好的控制效果,無(wú)法為本文的控制研究提供有益的參考.在上述困難下,基于數(shù)據(jù)的強(qiáng)化學(xué)習(xí)優(yōu)化控制方法的相關(guān)研究應(yīng)運(yùn)而生.
1957年,美國(guó)學(xué)者貝爾曼為求解最優(yōu)控制問題提出了貝爾曼最優(yōu)性原理,該最優(yōu)控制問題的解滿足哈密頓–雅可比–貝爾曼(Hamilton-Jacobi-Bellman,HJB)方程[13].自適應(yīng)動(dòng)態(tài)規(guī)劃(adaptive dynamic programming,ADP)作為強(qiáng)化學(xué)習(xí)方法的主要代表,是一種按照時(shí)間正向順序求解動(dòng)態(tài)規(guī)劃問題中HJB方程的方法[14–15],能有效處理非線性約束,求解效率較高.文獻(xiàn)[16]提出了基于近似動(dòng)態(tài)規(guī)劃的在線無(wú)模型自適應(yīng)控制方法,通過(guò)引入ADP求解最優(yōu)控制問題,有效解決了具有未知?jiǎng)討B(tài)的線性系統(tǒng)離散域和連續(xù)域最優(yōu)控制問題.文獻(xiàn)[17]提出了一種近似策略迭代(policy iteration,PI)方法,通過(guò)使用系統(tǒng)真實(shí)數(shù)據(jù)設(shè)計(jì)了一種基于最小二乘的加權(quán)殘差方法,實(shí)現(xiàn)了無(wú)模型非線性最優(yōu)控制.針對(duì)分布參數(shù)系統(tǒng)的優(yōu)化控制,文獻(xiàn)[18]提出了一種模型部分未知的偏微分方程(partial differential equation,PDE)系統(tǒng)在線自適應(yīng)最優(yōu)控制方法,并引入PI對(duì)HJB方程在線求解;文獻(xiàn)[19]通過(guò)采用加權(quán)殘差法和同步更新策略來(lái)近似哈密頓–雅可比–伊薩克方程的最優(yōu)解,實(shí)現(xiàn)了H∞控制器的優(yōu)化設(shè)計(jì).
目前,神經(jīng)網(wǎng)絡(luò)的權(quán)值更新策略一般選取梯度下降算法或者最小二乘法等,這種參數(shù)估計(jì)方法的準(zhǔn)確性大多依賴于觀測(cè)/預(yù)測(cè)器的性能.在閉環(huán)反饋控制的研究中,常常采用將控制誤差作為控制器的輸入來(lái)減小控制誤差的思想.這種思想近年來(lái)開始被引入到參數(shù)估計(jì)方法中.如文獻(xiàn)[20]通過(guò)改變觀測(cè)器設(shè)計(jì)和結(jié)構(gòu)提出了一種有限時(shí)間內(nèi)的收斂參數(shù)估計(jì)方法,可以增強(qiáng)參數(shù)估計(jì)誤差的收斂性.文獻(xiàn)[21–22]研究了一類基于參數(shù)估計(jì)誤差修正的魯棒自適應(yīng)律設(shè)計(jì)方法,并將其應(yīng)用到ADP中[23–24].上述方法極大地激發(fā)了本文的研究興趣.然而,如何設(shè)計(jì)一種適用于分布參數(shù)系統(tǒng)的基于參數(shù)估計(jì)誤差的ADP的NN權(quán)值自適應(yīng)更新方法,在保證系統(tǒng)穩(wěn)定性的情況下實(shí)現(xiàn)有限時(shí)間內(nèi)NN權(quán)值的快速收斂和權(quán)值逼近誤差的降低,具有一定的挑戰(zhàn)性,同時(shí)也是一個(gè)亟待解決的問題.這也是本文研究的重點(diǎn).
本文在根據(jù)傳熱機(jī)理建立輥道窯二維多孔介質(zhì)能量守恒模型的基礎(chǔ)上,引入角系數(shù)來(lái)構(gòu)建反映熱輻射作用的邊界條件;考慮到豎直方向溫度變化遠(yuǎn)大于水平方向,通過(guò)邊界轉(zhuǎn)換提出一種輥道窯一維溫度場(chǎng)的建模方法.然后,在ADP的框架中,研究一種基于參數(shù)估計(jì)誤差的PI參數(shù)更新方法,來(lái)對(duì)燒結(jié)過(guò)程的溫度場(chǎng)進(jìn)行優(yōu)化控制研究,該方法可以有效保證評(píng)價(jià)網(wǎng)絡(luò)權(quán)值的快速收斂.
正極材料燒結(jié)過(guò)程使用的設(shè)備為輥道窯.輥道窯由升溫段、恒溫段和降溫段組成,各溫段包含多個(gè)子溫區(qū),如圖1.
圖1 輥道窯單一溫區(qū)內(nèi)部結(jié)構(gòu)Fig.1 Structure of a temperature zone in roller kiln
爐內(nèi)包含加熱系統(tǒng)、傳動(dòng)系統(tǒng)和進(jìn)排氣系統(tǒng).加熱系統(tǒng)采用電熱式硅碳棒加熱元件,通過(guò)調(diào)節(jié)通入的電流來(lái)控制其溫度,以保證材料反應(yīng)過(guò)程所需的溫度.傳動(dòng)系統(tǒng)由緊密排列的輥棒構(gòu)成,匣缽(盛放原料的區(qū)域)通過(guò)輥棒以緩慢的速度向前穩(wěn)定地傳送.進(jìn)排氣系統(tǒng)由進(jìn)氣孔、排氣孔構(gòu)成,分別用來(lái)排出燒結(jié)過(guò)程的廢氣和經(jīng)由鼓風(fēng)機(jī)向窯內(nèi)通入所需的氣體,以保證窯爐內(nèi)部所需的氣氛.窯爐內(nèi)部的溫度分布是材料燒結(jié)過(guò)程的關(guān)鍵,工藝要求各溫區(qū)匣缽區(qū)域的溫度盡可能逼近燒結(jié)制度中的溫度設(shè)定值.
建模之前做出如下假設(shè):1)不計(jì)爐壁的散熱;2)不計(jì)流體的熱輻射與熱損失;由于氣體通入速率恒定,且硅碳棒熱輻射作用帶來(lái)的溫度變化遠(yuǎn)大于爐內(nèi)氣體熱對(duì)流,故主要研究硅碳棒溫度變化對(duì)爐內(nèi)溫度場(chǎng)的影響.3)忽略原料間摩擦帶來(lái)的能量損失;4)缽體運(yùn)動(dòng)速度為1.6 m/h,可視為靜止?fàn)顟B(tài).由于匣缽區(qū)域發(fā)生材料制備過(guò)程的主要反應(yīng),以該區(qū)域二維截面為研究對(duì)象建立溫度場(chǎng)模型,如圖2.該區(qū)域可視作為由多孔介質(zhì)組成的近似封閉系統(tǒng),熱量傳遞符合能量守恒定律.因而,匣缽區(qū)域溫度場(chǎng)滿足多孔介質(zhì)下的能量守恒方程[25]:
其中:T為匣缽區(qū)域溫度;t為時(shí)間;ρ1和c1為固體的密度和比熱容;ρ2和c2為氣體密度和比熱容.ρ3c3=(1?γ)ρ2c2+γρ1c1,k3=(1?γ)k2+γk1,vw與vz分別為氣體在w軸和z軸方向上的速度,k1為固體的導(dǎo)熱系數(shù),k2為氣體的導(dǎo)熱系數(shù),ST為匣缽區(qū)域的內(nèi)熱源,γ為孔隙率.由于硅碳棒的熱輻射帶來(lái)的熱量比氣體的熱對(duì)流大,因而在邊界條件的構(gòu)造中主要考慮硅碳棒的熱輻射作用;考慮匣缽上/下表面僅受上/下硅碳棒放熱影響,左右側(cè)面同時(shí)受上下硅碳棒影響.根據(jù)傳熱定律構(gòu)建如下邊界條件:
其中:Qa,b是a對(duì)b的投射輻射,Qa是a的有效輻射.根據(jù)式(7),有限表面A2對(duì)微元表面dA1的角系數(shù)為
其中:rA是A2到dA1的距離,r1和r2為A2到dA1中心連線與其法線的夾角.
根據(jù)式(8),表面A2對(duì)于A1的角系數(shù)可表示為
根據(jù)式(8)和式(9),以硅碳棒p2為例對(duì)角系數(shù)進(jìn)行計(jì)算,可以得到硅碳棒分別對(duì)匣缽上表面、對(duì)左側(cè)面任一微元面的角系數(shù),如下式所示:
采用同樣的方法可以計(jì)算硅碳棒p1對(duì)匣缽下表面的角系數(shù)Fp1→s(z1)和對(duì)右側(cè)面任一微元面的角系數(shù)Fp1→s(z).
由如圖2可知,輥道窯匣缽區(qū)域布局方式沿水平方向具有對(duì)稱性.開展匣缽區(qū)域的建模研究時(shí),可將其沿方向切割,僅對(duì)二維截面的一半?yún)^(qū)域進(jìn)行研究.由于匣缽區(qū)域水平方向的溫度變化非常小,相比之下豎直方向的溫度變化更明顯,即
圖2 匣缽區(qū)域結(jié)構(gòu)圖Fig.2 Structure of saggers area
[27].因此,可以將方向的溫度梯度視為常值,通過(guò)引入式(1)來(lái)建立輥道窯溫度場(chǎng)模型.該模型能夠表征燒結(jié)過(guò)程控制輸入與溫度場(chǎng)的關(guān)系.以匣缽左半?yún)^(qū)域?yàn)槔囟葓?chǎng)模型.在這種情況下,式(1)中方向的溫度梯度變化滿足式(4)和式(6).將式(4)和式(6)代入式(1)可以對(duì)輥道窯溫度場(chǎng)二維模型進(jìn)行化簡(jiǎn),進(jìn)而得到一維溫度場(chǎng)模型
為便于控制器設(shè)計(jì),對(duì)所建立的模型(式(12))進(jìn)行無(wú)因次變換.輥道窯溫度場(chǎng)的控制目標(biāo)為:使穩(wěn)定后匣缽實(shí)際溫度接近溫度設(shè)定值Td(z),且盡可能降低實(shí)際值與設(shè)定值之差.基于此定義如下無(wú)因次的狀態(tài)y(z,t)和控制變量u:
由于ε極小,引入τ=t/ε為快系統(tǒng)常數(shù)且讓?duì)?0,則xf(t)=0.式(23)可以轉(zhuǎn)換成有限維的低階慢子系統(tǒng),即
式中λi為KL分解中所涉及的矩陣特征值,0<ζ <1為一正常數(shù).
其中:Q=.Q和R均為正定對(duì)稱矩陣.由此可將溫度場(chǎng)的最優(yōu)控制轉(zhuǎn)化為低階慢子系統(tǒng)的最優(yōu)控制,并構(gòu)建慢子系統(tǒng)的最優(yōu)控制問題.
本節(jié)提出一種基于參數(shù)估計(jì)誤差的ADP評(píng)價(jià)–執(zhí)行網(wǎng)絡(luò)的參數(shù)辨識(shí)方法,然后開展輥道窯爐內(nèi)溫度場(chǎng)的優(yōu)化控制研究.
根據(jù)式(26),定義哈密頓函數(shù)為
基于慢子系統(tǒng)(式(24))及性能指標(biāo)(式(26))的最優(yōu)控制問題可以轉(zhuǎn)化為求解HJB方程,即
根據(jù)一階最優(yōu)性原理[29],可以對(duì)最優(yōu)控制律進(jìn)行推導(dǎo),如下式所示:
將式(29)代入式(28),HJB方程改寫為
其中對(duì)于V ?(x)滿足V ?(x)∈C1(X),V ?(x)≥0,且V ?(0)=0.同時(shí),V ?(x)與Vu?(x)存在如下關(guān)系:
本文在容許控制無(wú)約束的情況下對(duì)PDE系統(tǒng)的控制律進(jìn)行設(shè)計(jì).對(duì)于容許控制為閉集情況,控制律的設(shè)計(jì)屬于一類更深層次的控制器設(shè)計(jì)問題,是今后可以進(jìn)一步深入研究的內(nèi)容.由于HJB方程(式(30))為非線性方程,且降階系統(tǒng)(式(24))中存在未知部分,理論上無(wú)法解析求解.為了克服這一困難,引入PI方法并基于過(guò)程數(shù)據(jù)在線求解HJB方程.采用PI算法求解HJB方程的步驟如下:
步驟1給定一個(gè)初始控制策略u(píng)0,i=0;
步驟2使用控制策略u(píng)i求解方程:
其中V(i+1)為待求解的代價(jià)函數(shù);
步驟3通過(guò)式(29)更新控制策略獲得ui+1;
步驟4令i=i+1,返回步驟2.
PI算法的每一次迭代均需要對(duì)式(32)進(jìn)行求解.為便于算法執(zhí)行,采用一種評(píng)價(jià)–執(zhí)行網(wǎng)絡(luò)的結(jié)構(gòu),其中評(píng)價(jià)網(wǎng)絡(luò)采用NN技術(shù),用于逼近代價(jià)函數(shù),同時(shí),在利用評(píng)價(jià)NN逼近代價(jià)函數(shù)的過(guò)程中,提出一種基于權(quán)值參數(shù)估計(jì)誤差的NN權(quán)值學(xué)習(xí)算法;執(zhí)行網(wǎng)絡(luò)則用于逼近控制策略.
評(píng)價(jià)NN用來(lái)近似最優(yōu)代價(jià)函數(shù)V ?(x),V ?(x)可以精確表示為
由于真實(shí)的評(píng)價(jià)NN權(quán)值向量往往是未知的,因而評(píng)價(jià)NN的實(shí)際輸出為
為設(shè)計(jì)基于參數(shù)估計(jì)誤差的自適應(yīng)律,運(yùn)用已知的系統(tǒng)信息提取蘊(yùn)含未知參數(shù)估計(jì)誤差的信息.根據(jù)式(34)構(gòu)建輔助矩陣P和輔助向量O,如下式:
其中η6>0為自適應(yīng)增益.由于P?1O=KO=θ?,式(43)能夠直接反映參數(shù)估計(jì)誤差的信息.換言之,本文所設(shè)計(jì)的ADP框架下的評(píng)價(jià)NN權(quán)值更新過(guò)程直接依賴于權(quán)值估計(jì)值與最優(yōu)值的誤差(即參數(shù)估計(jì)誤差).這與ADP的傳統(tǒng)參數(shù)更新方法不同,避免了對(duì)過(guò)程輸入輸出信息的直接使用.
然后,對(duì)執(zhí)行網(wǎng)絡(luò)進(jìn)行設(shè)計(jì).那么,根據(jù)式(29)和式(43)可得,執(zhí)行網(wǎng)絡(luò)的輸出可由式(44)給出
在此基礎(chǔ)上,分析在所提控制方法下閉環(huán)PDE系統(tǒng)的穩(wěn)定性.在此之前,給出如下假設(shè).
引理1考慮由式(37)所設(shè)計(jì)的輔助矩陣P,那么,矩陣P為正定矩陣.換言之,矩陣P滿足λmin(P(t))>δ1,對(duì)于t>0 和δ1>0[21].
定理1對(duì)所研究的PDE系統(tǒng)(式(12)),采用ADP方法實(shí)現(xiàn)其最優(yōu)控制.如果矩陣正定,評(píng)價(jià)NN的權(quán)值參數(shù)自適應(yīng)更新律如式(43)所示.那么,評(píng)價(jià)NN的權(quán)值估計(jì)誤差在有限時(shí)間內(nèi)收斂,即∥∥≤η8,且η8為一個(gè)大于0的小常數(shù).
證構(gòu)建如下李雅普諾夫函數(shù)V():
將式(43)代入式(46)中,同時(shí)對(duì)V()進(jìn)行求導(dǎo),并結(jié)合式(42)中的關(guān)系,可以得到
在此基礎(chǔ)上,需要進(jìn)一步證明在權(quán)值更新律式(43)和控制律式(44)下,低階系統(tǒng)式(24)和原PDE系統(tǒng)式(12)的穩(wěn)定性.
定理2對(duì)于溫度場(chǎng)PDE系統(tǒng)式(12),如果假設(shè)1成立,選擇初始權(quán)值θ0使得u0∈U(?),采用的權(quán)值更新律如式(43)所示,設(shè)計(jì)的控制策略如式(44)所示.那么,存在正常數(shù)η10,η11和ε?,當(dāng)∥x0∥≤η10,∥xf0∥≤η11和ε ∈(0,ε?)時(shí),使得x,xf和滿足半全局一致最終有界(SGUUB),并且閉環(huán)PDE系統(tǒng)式(12)同樣為SGUUB.
在證明之前需要對(duì)PDE系統(tǒng)進(jìn)行改寫,并提供相關(guān)條件.根據(jù)式(43)和式(44),式(12)可改寫為
基于模型降階方法,將式(49)改寫為如下形式:
由于G為充分光滑的向量函數(shù),那么存在一常數(shù)L0>0,使得如下不等式成立[31]:
式中L1–L6均為正實(shí)數(shù).
在考慮穩(wěn)定性之前,還需要推導(dǎo)如下條件:
本節(jié)對(duì)所提的溫度場(chǎng)建模方法和優(yōu)化控制方法進(jìn)行仿真驗(yàn)證與分析,以證明所提建模方法的準(zhǔn)確性和所提控制方法的有效性.
以輥道窯窯爐底部邊緣的中心為坐標(biāo)原點(diǎn)建立的直角坐標(biāo)系如圖2所示.
輥道窯燒結(jié)過(guò)程的相關(guān)物性參數(shù)與坐標(biāo)參數(shù)分別為:密度ρ1=1.225 kg/m3,比熱容c1=1006.43 J/(kg·K),導(dǎo)熱系數(shù)k1=0.0242 W/(m·K),密度ρ2=2719 kg/m3,比熱容c2=871 J/(kg·K),導(dǎo)熱系數(shù)k2=202.4 W/(m·K),孔隙率γ=0.005,輻射率εp1和εp2為0.7,εs=0.3,流速vw=0.0476 m/s,vz=0.003 m/s.匣缽左表面的坐標(biāo)w1=?0.675 m,右表面坐標(biāo)w2=0.675 m,下表面坐標(biāo)z1=0.35 m,上表面坐標(biāo)z2=0.59 m;下部硅碳棒的高度z3=0.1 m,上部硅碳棒的高度z4=0.78 m,硅碳棒的左邊界b1=?0.765 m,硅碳棒的右邊界b2=0.765 m.
以第四溫區(qū)為例,建立燒結(jié)過(guò)程溫度場(chǎng)模型,并給定匣缽區(qū)域初始溫度為T0=490?C.首先,驗(yàn)證并分析所建立的模型在開環(huán)狀態(tài)下的變化趨勢(shì).圖3為所建立的溫度場(chǎng)模型在開環(huán)狀態(tài)(即不加熱)下的溫度變化曲面.由圖3可知,匣缽區(qū)域溫度呈逐漸下降的趨勢(shì),符合自然冷卻下溫度場(chǎng)的變化特征.
圖3 開環(huán)系統(tǒng)狀態(tài)Fig.3 The state of an open-loop temperature field
然后,選取實(shí)際過(guò)程某一時(shí)間段內(nèi)加熱功率基本恒定的情況下輥道窯的上部、下部測(cè)溫點(diǎn)的實(shí)際數(shù)據(jù)來(lái)驗(yàn)證模型的準(zhǔn)確性.給定匣缽上半?yún)^(qū)域的初始溫度為680?C,下半?yún)^(qū)域的初始溫度為640?C.同時(shí),將上部、下部硅碳棒的溫度分別控制在800?C與725?C左右,根據(jù)所建立的模型可以獲得匣缽區(qū)域溫度場(chǎng)的分布及演化過(guò)程.上部、下部測(cè)溫點(diǎn)的溫度預(yù)測(cè)值與真實(shí)值的比較如圖4和圖5所示.
圖5 下測(cè)溫點(diǎn)溫度預(yù)測(cè)值與真實(shí)值的比較Fig.5 The comparison between the predicted and true values of the temperature at the lower measurement point
由圖4–5可知,升溫過(guò)程測(cè)溫點(diǎn)的溫度預(yù)測(cè)值與實(shí)際過(guò)程數(shù)據(jù)的差值隨著溫度的逐漸穩(wěn)定而越來(lái)越小,最后收斂至同一溫度值附近.這表明所建立的模型能夠準(zhǔn)確模擬溫度變化趨勢(shì),與實(shí)際溫度變化過(guò)程匹配,準(zhǔn)確性較好.這可以為三元正極材料燒結(jié)過(guò)程溫度場(chǎng)的優(yōu)化控制奠定良好的基礎(chǔ).
圖4 上測(cè)溫點(diǎn)溫度預(yù)測(cè)值與真實(shí)值的比較Fig.4 The comparison between the predicted and true values of the temperature at the upper measurement point
將所提的溫度場(chǎng)優(yōu)化控制方法用于模型(12),以驗(yàn)證所提方法的有效性.
首先,給出該燒結(jié)過(guò)程的控制目標(biāo),即將匣缽區(qū)域的溫度控制到520?C.然后,通過(guò)設(shè)置=1000,根據(jù)式(13)–(14)對(duì)模型式(12)進(jìn)行無(wú)因次變化,可以得到無(wú)量綱的PDE系統(tǒng)狀態(tài),例如圖3可以通過(guò)上述變換等效轉(zhuǎn)換成圖6.接著,采用KL分解對(duì)模型進(jìn)行降階處理,選取ζ為0.001.對(duì)應(yīng)的空間基函數(shù)?(z)如圖7所示.
圖6 無(wú)因次變換后系統(tǒng)狀態(tài)Fig.6 PDE system states after the dimensionless transformation
圖7 空間基函數(shù)Fig.7 Spatial basis functions
圖8 評(píng)價(jià)NN的權(quán)值范數(shù)Fig.8 The weights norm of critic NN
圖9給出了控制策略u(píng)(x)的變化曲線,其最終會(huì)收斂到0.圖10為閉環(huán)低階子系統(tǒng)的時(shí)間模態(tài)x(t)的軌跡,閉環(huán)PDE系統(tǒng)的狀態(tài)曲面如圖11所示.
圖9 控制策略Fig.9 The control strategy
圖10 閉環(huán)控制下的時(shí)間模態(tài)Fig.10 Time modes under the closed-loop control
圖11 閉環(huán)PDE系統(tǒng)的狀態(tài)Fig.11 The state of the closed-loop PDE system
由圖10–11可知,低階時(shí)間模態(tài)最終會(huì)收斂到0,溫度場(chǎng)PDE系統(tǒng)的狀態(tài)最終接近控制目標(biāo)Td,且與溫度目標(biāo)值之差較小.這基本符合燒結(jié)過(guò)程控制要求,表明了所提優(yōu)化控制方法的有效性.基于參數(shù)估計(jì)誤差的權(quán)值更新方法與基于梯度下降法的參數(shù)更新方法[17]的對(duì)比如圖12.選取基于梯度下降法的參數(shù)更新律的自適應(yīng)增益為1.0.由圖12可知,基于參數(shù)估計(jì)誤差的權(quán)值更新方法收斂速度更快.在這種參數(shù)估計(jì)方法下,溫度場(chǎng)達(dá)到控制目標(biāo)所需時(shí)間進(jìn)一步減少.綜上所述,仿真驗(yàn)證結(jié)果表明了本文所提優(yōu)化控制方法的有效性.
圖12 權(quán)值更新方法的對(duì)比Fig.12 The comparison of weight updating methods
本文主要研究輥道窯溫度場(chǎng)的建模及優(yōu)化控制方法.一方面,在分析輥道窯內(nèi)部傳熱機(jī)理的基礎(chǔ)上,根據(jù)能量守恒定律建立了輥道窯溫度場(chǎng)模型;另一方面,在ADP的框架下,提出了一種基于參數(shù)估計(jì)誤差的評(píng)價(jià)NN權(quán)值更新算法,在保證待估計(jì)參數(shù)快速收斂、減小權(quán)值逼近誤差等基礎(chǔ)上逼近最優(yōu)代價(jià)函數(shù),進(jìn)而獲得最優(yōu)控制律.仿真驗(yàn)證結(jié)果證明了所提方法的有效性.上述方法的研究不僅可以有效解決當(dāng)前窯爐燒結(jié)過(guò)程爐內(nèi)溫度分布難以獲取、控制輸入無(wú)法及時(shí)調(diào)整等制約正極材料產(chǎn)品品質(zhì)提高的難點(diǎn),也能為其他類似的工業(yè)過(guò)程溫度場(chǎng)的建模及優(yōu)化控制研究提供有益的參考.