亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于強(qiáng)化學(xué)習(xí)的重介質(zhì)選煤過(guò)程優(yōu)化控制

        2022-02-11 10:40:06胡金良李彤昀王光輝
        煤炭工程 2022年1期
        關(guān)鍵詞:優(yōu)化策略評(píng)價(jià)

        胡金良,李彤昀,王光輝

        (1.國(guó)能準(zhǔn)能集團(tuán)科學(xué)技術(shù)研究院,內(nèi)蒙古 鄂爾多斯 010300;2.中國(guó)礦業(yè)大學(xué) 信控學(xué)院,江蘇 徐州 221116;3.中國(guó)礦業(yè)大學(xué) 化工學(xué)院,江蘇 徐州 221116)

        在我國(guó)的能源消耗中,煤炭資源占據(jù)著很大的比例。雖然新興能源的發(fā)展在一定程度上緩解了煤炭供給壓力,但我國(guó)以煤炭資源為主的能源結(jié)構(gòu)仍未改變。煤炭洗選是煤炭生產(chǎn)利用過(guò)程中的重要一環(huán),提升煤炭洗選效率具有意義深遠(yuǎn)[1,2]。

        重介質(zhì)淺槽分選是我國(guó)常用的選煤工藝,具有分選精度高、效率好的特點(diǎn)。重介質(zhì)選煤過(guò)程受設(shè)備的各種工藝參數(shù)影響[3],但是在實(shí)際的選煤工藝中,對(duì)精煤質(zhì)量起決定性作用的是重介質(zhì)懸浮液密度。此外灰分是衡量重介質(zhì)選煤精煤質(zhì)量的關(guān)鍵指標(biāo)。因此,通過(guò)調(diào)節(jié)重介質(zhì)懸浮液密度,實(shí)現(xiàn)對(duì)精煤灰分的控制是重介質(zhì)選煤過(guò)程優(yōu)化控制的主要方法。因此,諸多學(xué)者針對(duì)調(diào)節(jié)重介質(zhì)旋流器懸浮液密度,實(shí)現(xiàn)成品煤灰分控制問(wèn)題開(kāi)展了研究,取得豐碩的成果。

        文獻(xiàn)[4]針對(duì)可建模的重介質(zhì)選煤過(guò)程,提出了一種基于模型預(yù)測(cè)控制的重介質(zhì)懸浮液密度在線(xiàn)優(yōu)化方法,并通過(guò)仿真實(shí)驗(yàn)驗(yàn)證了對(duì)灰分控制的有效性。文獻(xiàn)[5]在模型預(yù)測(cè)控制算法中引入前饋控制環(huán)節(jié),增強(qiáng)控制系統(tǒng)的魯棒性。但是重介質(zhì)選煤過(guò)程動(dòng)態(tài)時(shí)變,呈強(qiáng)非線(xiàn)性[6,7],采用上述基于模型的控制方法較難實(shí)現(xiàn)實(shí)時(shí)控制。因而已有采用數(shù)據(jù)驅(qū)動(dòng)的方法進(jìn)行優(yōu)化控制[8]。文獻(xiàn)[9]通過(guò)離線(xiàn)采集的歷史數(shù)據(jù),利用時(shí)間序列的最小二乘支持向量機(jī),建立了密度給定模型。文獻(xiàn)[10]利用歷史數(shù)據(jù)訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型,提出一種寬域運(yùn)行優(yōu)化控制方法。但是上述方法僅考慮對(duì)已出現(xiàn)工況進(jìn)行控制設(shè)計(jì),缺乏對(duì)未知工況自學(xué)習(xí)能力。因此,為了提升精煤灰分產(chǎn)量控制精度和系統(tǒng)響應(yīng)速率,提高控制系統(tǒng)自學(xué)習(xí)能力,本文采用基于強(qiáng)化學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)方法對(duì)重介質(zhì)選煤過(guò)程優(yōu)化控制。

        1 重介質(zhì)選煤過(guò)程及其優(yōu)化控制問(wèn)題分析

        1.1 重介質(zhì)選煤過(guò)程

        本文針對(duì)重介質(zhì)選煤工藝中的重介質(zhì)淺槽分選工藝進(jìn)行研究,其主要包括混料桶、分選槽、排矸刮板和各種儀器儀表。其工藝流程如圖1所示。

        圖1 重介質(zhì)選煤工藝流程圖

        在實(shí)際生產(chǎn)過(guò)程中,原煤與重介質(zhì)懸浮液混合后,泵送入分選槽。在排矸刮板擾動(dòng)的過(guò)程中,高密度物(尾礦)下降并通過(guò)排放口排出,輕密度物(精礦)上升并從溢流堰溢出,剩余的重介質(zhì)懸浮液將與高濃度的介質(zhì)水混合,形成密度相對(duì)穩(wěn)定的合格介質(zhì),并再次與新的原料混合,重復(fù)上述過(guò)程[11,12]。

        不同儀器的型號(hào)和運(yùn)行模式,運(yùn)行狀態(tài)的各種工藝參數(shù)均或多或少影響最終的分選效果。如排矸刮板的渦流方向,當(dāng)其與矸石沉降方向相同時(shí),對(duì)分選效果是有益的;當(dāng)其與矸石沉降方向相反時(shí),會(huì)阻礙分選[3]。

        1.2 重介質(zhì)選煤過(guò)程控制難點(diǎn)

        1)強(qiáng)非線(xiàn)性。煤炭重介質(zhì)選效果主要取決于重介質(zhì)懸浮液密度的高低,但其與凈煤灰分并不是簡(jiǎn)單的線(xiàn)性關(guān)系。又因?yàn)榛旌系V漿的流速與原煤的進(jìn)料速度也呈現(xiàn)非線(xiàn)性特性,因此難以采用基于模型的優(yōu)化控制方法。

        2)動(dòng)態(tài)時(shí)變性。原煤的成分并不是一成不變的,所含有的雜質(zhì)、粒度均持續(xù)波動(dòng)。當(dāng)重介質(zhì)懸浮液狀態(tài)時(shí)變時(shí),其壓力密度也會(huì)受其影響,排矸刮板等設(shè)備運(yùn)行參數(shù)需相應(yīng)調(diào)整,否則會(huì)使得系統(tǒng)處于非經(jīng)濟(jì)最優(yōu)狀態(tài)。

        重介質(zhì)選煤過(guò)程的強(qiáng)非線(xiàn)性與動(dòng)態(tài)時(shí)變性導(dǎo)致無(wú)法建立有效的機(jī)理模型,現(xiàn)有基于模型的優(yōu)化控制方法難以進(jìn)行實(shí)時(shí)過(guò)程優(yōu)化?;趶?qiáng)化學(xué)習(xí)的過(guò)程優(yōu)化控制方法,能夠根據(jù)重介質(zhì)選煤運(yùn)行的歷史數(shù)據(jù)求解最優(yōu)控制,從而有效解決上述問(wèn)題[13,14]。

        2 重介質(zhì)選煤過(guò)程優(yōu)化控制

        2.1 過(guò)程優(yōu)化控制問(wèn)題

        本文在重介質(zhì)懸浮液密度回路控制基礎(chǔ)上,通過(guò)建立運(yùn)行優(yōu)化層實(shí)現(xiàn)對(duì)重介質(zhì)懸浮液密度設(shè)定值優(yōu)化,從而穩(wěn)定控制精煤灰分,保證選煤產(chǎn)品的質(zhì)量。實(shí)際工業(yè)運(yùn)行優(yōu)化層動(dòng)態(tài)特性復(fù)雜,以連續(xù)時(shí)間非線(xiàn)性系統(tǒng)模型進(jìn)行描述:

        其中,r為實(shí)際運(yùn)行時(shí)的系統(tǒng)指標(biāo)值;w為系統(tǒng)的輸入;f(t)和g(t)表示運(yùn)行優(yōu)化層的動(dòng)態(tài)特性。

        對(duì)系統(tǒng)方程進(jìn)行離散化處理,可得:

        r(k+1)=f(r(k))+g(r(k))w(k)

        (2)

        為使運(yùn)行優(yōu)化層實(shí)際系統(tǒng)指標(biāo)能夠快速跟蹤期望設(shè)定值,通過(guò)建立性能評(píng)價(jià)指標(biāo)函數(shù),調(diào)節(jié)輸入?yún)?shù)w,最終實(shí)現(xiàn)實(shí)際運(yùn)行指標(biāo)在理想值附近穩(wěn)定運(yùn)行??紤]跟蹤誤差盡可能為0且限制控制輸入的變化浮動(dòng)不大,從而避免設(shè)定值過(guò)大,導(dǎo)致系統(tǒng)不穩(wěn)定,其評(píng)價(jià)函數(shù)定義:

        式中,γ為實(shí)際運(yùn)行過(guò)程中的歷史數(shù)據(jù)對(duì)當(dāng)前運(yùn)行指標(biāo)評(píng)價(jià)影響的衰減程度,0<γ<1;Q和R分別為半正定和正定矩陣,從而保證系統(tǒng)在期望值附近穩(wěn)定時(shí),評(píng)價(jià)指標(biāo)將接近于定值。

        2.2 基于強(qiáng)化學(xué)習(xí)的設(shè)定值優(yōu)化控制策略

        其中,Q1=[I-I]TQ[I-I]。根據(jù)式(4),從而將求解評(píng)價(jià)函數(shù)最小值的問(wèn)題,轉(zhuǎn)為解非線(xiàn)性過(guò)程的Bellman方程,其方程:

        從而求解LQR問(wèn)題的Hamilton函數(shù):

        H(ζk,wk)=Uk+γV(ζk+1)-V(ζk)

        (6)

        根據(jù)Bellman原理,最優(yōu)值函數(shù)滿(mǎn)足離散時(shí)間HJB(Hamilton-Jacobi-Bellman,HJB)方程:

        可得求解最優(yōu)控制率需滿(mǎn)足[15]:

        令:

        且:

        將式(11)代入到Bellman方程,可得最優(yōu)控制率下的離散時(shí)間HJB方程:

        2.2.1 在線(xiàn)策略提升算法

        由于直接求解HJB方程,會(huì)出現(xiàn)維度災(zāi)問(wèn)題,本文考慮策略迭代算法[16,17],利用Bellman方程評(píng)估當(dāng)前設(shè)定值和更新設(shè)定值,從而在線(xiàn)學(xué)習(xí)求得重介質(zhì)選煤運(yùn)行過(guò)程設(shè)定值優(yōu)化的最優(yōu)解:

        1)策略評(píng)價(jià)。根據(jù)Bellman方程(5)求解wki控制下的值函數(shù):

        2)策略提升。更新系統(tǒng)輸入:

        通過(guò)觀察算法1公式,該策略迭代算法可以配置γ和Q讓運(yùn)行指標(biāo)r穩(wěn)定在在期望值附近,一般,γ接近于1,且Q為半正定矩陣,矩陣元素取值要盡可能大,那么式(13)中的誤差權(quán)重會(huì)足夠大。此外,此算法的策略提升和值函數(shù)是同步更新的,并不是常規(guī)算法中按順序依次迭代值函數(shù)和控制策略。本文采用神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)基于強(qiáng)化學(xué)習(xí)的數(shù)據(jù)驅(qū)動(dòng)算法,即采用兩個(gè)獨(dú)立的神經(jīng)網(wǎng)絡(luò)分別實(shí)現(xiàn)值函數(shù)和系統(tǒng)輸入更新公式。策略提升神經(jīng)網(wǎng)絡(luò)用來(lái)更新算法系統(tǒng)輸入,從而通過(guò)系統(tǒng)運(yùn)行,可以改變值函數(shù)的大小。策略評(píng)價(jià)神經(jīng)網(wǎng)絡(luò)用來(lái)近似估計(jì)值函數(shù),用來(lái)評(píng)價(jià)系統(tǒng)輸入的大小是否合適,并反饋到策略提升過(guò)程。對(duì)于算法 1 需要獲得穩(wěn)定初始控制策略,但在復(fù)雜非線(xiàn)性系統(tǒng)一般是很難的。在實(shí)際工業(yè)過(guò)程的最優(yōu)跟蹤問(wèn)題中,存在大量的歷史數(shù)據(jù),雖然數(shù)據(jù)中的設(shè)定值并不都是最優(yōu)的,但滿(mǎn)足算法1的初始穩(wěn)定控制策略需求。

        圖2 基于強(qiáng)化學(xué)習(xí)設(shè)定值優(yōu)化算法結(jié)構(gòu)圖

        在此基礎(chǔ)上,本文使用基于數(shù)據(jù)驅(qū)動(dòng)強(qiáng)化學(xué)習(xí)設(shè)定值優(yōu)化算法以解決重介質(zhì)選煤運(yùn)行優(yōu)化過(guò)程的非線(xiàn)性跟蹤問(wèn)題。其中,該控制結(jié)構(gòu)采用BP神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)框架的各個(gè)部分,主要分為設(shè)定策略提升神經(jīng)網(wǎng)絡(luò)和策略評(píng)價(jià)神經(jīng)網(wǎng)絡(luò)兩個(gè)部分,其結(jié)構(gòu)如圖2所示,利用強(qiáng)化學(xué)習(xí)理論和歷史數(shù)據(jù),使得兩個(gè)網(wǎng)絡(luò)不斷更新神經(jīng)網(wǎng)絡(luò)權(quán)重,從而實(shí)現(xiàn)自學(xué)習(xí)得到最優(yōu)控制值函數(shù),最終通過(guò)設(shè)定值優(yōu)化執(zhí)行獲得優(yōu)化值。其中設(shè)定策略提升神經(jīng)網(wǎng)絡(luò)和策略評(píng)價(jià)神經(jīng)網(wǎng)絡(luò)均為三層結(jié)構(gòu),并且設(shè)置神經(jīng)網(wǎng)絡(luò)輸入層到隱層的權(quán)重矩陣為Ya和Yc,隱層到輸出層的權(quán)重矩陣設(shè)為Wa和Wc。隱含層神經(jīng)元的數(shù)目設(shè)置為na和nc。

        由此,分別將策略評(píng)價(jià)和策略提升神經(jīng)網(wǎng)絡(luò)定義如下。

        1)策略評(píng)價(jià)神經(jīng)網(wǎng)絡(luò):

        其中,φc=[φc1,φc2,…,φcnc]T∈Rnc×l。

        φc是隱層的激活函數(shù),其數(shù)學(xué)形式采用φcj(·)=sigmoid(·)。

        2)策略提升神經(jīng)網(wǎng)絡(luò):

        式中,φa=[φa1,φa2,…,φana]T∈Rna×l,l=1,2,…,ny表示神經(jīng)網(wǎng)絡(luò)輸出的數(shù)量;φa是隱含層的激活函數(shù)向量,其數(shù)學(xué)形式為φaj(·)=sigmoid(·)。

        通過(guò)更新強(qiáng)化學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)的權(quán)重矩陣,讓神經(jīng)網(wǎng)絡(luò)的輸出分別逼近最優(yōu)值函數(shù)和最優(yōu)系統(tǒng)輸入值。

        2.2.2 基于神經(jīng)網(wǎng)絡(luò)的策略更新方法

        根據(jù)文獻(xiàn)[18,19]對(duì)此分別給出策略提升和策略評(píng)價(jià)神經(jīng)網(wǎng)絡(luò)權(quán)重的更新方法,并且只更新隱含層到輸出層的權(quán)重。

        1)策略評(píng)價(jià)神經(jīng)網(wǎng)絡(luò)更新。

        先定義如下Bellman跟蹤誤差估計(jì)值:

        由上文可知,本文目標(biāo)是將上式誤差調(diào)節(jié)為零,因而將其二次形式作為將策略評(píng)價(jià)網(wǎng)絡(luò)最小化的目標(biāo)形式:

        利用常規(guī)的梯度下降方法,用來(lái)迭代策略評(píng)價(jià)網(wǎng)絡(luò)權(quán)重矩陣Wc:

        其中,lc大于0,用來(lái)表示學(xué)習(xí)率。

        2)策略提升神經(jīng)網(wǎng)絡(luò)更新。

        通過(guò)策略提升神經(jīng)網(wǎng)絡(luò)逼近估計(jì)理想值,要求通過(guò)神經(jīng)網(wǎng)絡(luò)訓(xùn)練使其誤差趨于零。根據(jù)文[20],可以定義策略提升神經(jīng)網(wǎng)絡(luò)估計(jì)誤差為:

        同上,定義策略評(píng)價(jià)神經(jīng)網(wǎng)絡(luò)的最小化目標(biāo)形式:

        采用梯度下降算法,優(yōu)化更新策略提升神經(jīng)網(wǎng)絡(luò)權(quán)重矩陣Wa:

        系統(tǒng)將持續(xù)運(yùn)行直到運(yùn)行次數(shù)超過(guò)預(yù)先設(shè)定次數(shù)或者是滿(mǎn)足式(18)的系統(tǒng)要求,系統(tǒng)不再更新控制策略,算法結(jié)束。

        3 實(shí)驗(yàn)仿真與分析

        為了驗(yàn)證本文方法的有效性,將所提方法與傳統(tǒng)PI控制方法進(jìn)行了比較。本文所提強(qiáng)化學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)采用BP神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)。本文是單入單出的控制結(jié)構(gòu),策略提升和策略評(píng)價(jià)神經(jīng)網(wǎng)絡(luò)分別采用1-8-2和2-8-1結(jié)構(gòu),即策略提升網(wǎng)絡(luò)包括1個(gè)輸入節(jié)點(diǎn),2個(gè)輸出節(jié)點(diǎn),8個(gè)隱層節(jié)點(diǎn);策略評(píng)價(jià)神經(jīng)網(wǎng)絡(luò)包括2個(gè)輸入節(jié)點(diǎn),1個(gè)輸出節(jié)點(diǎn),8個(gè)隱層節(jié)點(diǎn) 。學(xué)習(xí)率la,lc均設(shè)置為0.02。實(shí)驗(yàn)設(shè)置期望的精煤灰分r*為10%,實(shí)驗(yàn)效果如圖3所示。

        圖3 強(qiáng)化學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)方法的輸出曲線(xiàn)

        利用強(qiáng)化學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)方法與PI控制方法效果對(duì)比如圖4所示??梢钥闯觯瑢?shí)際精煤灰分在約10s時(shí),跟蹤上期望值。實(shí)現(xiàn)了重介質(zhì)選煤過(guò)程運(yùn)行優(yōu)化控制,使得每次策略提升神經(jīng)網(wǎng)絡(luò)決策出的重介質(zhì)選煤基礎(chǔ)控制回路輸入量以及過(guò)程輸出量均能夠在較短時(shí)間跟蹤上設(shè)定值,與傳統(tǒng)PI控制方法的實(shí)際精煤灰分含量在約30s時(shí)才跟蹤上期望值相比,本文方法實(shí)現(xiàn)了快速跟蹤。從超調(diào)精度上對(duì)比,采用本文方法的超調(diào)量在0.5%左右,而傳統(tǒng)PI控制的超調(diào)量在2.1%左右,超調(diào)量獲得大幅下降,因而基于強(qiáng)化學(xué)習(xí)的值函數(shù)更新策略使得控制方法實(shí)現(xiàn)自學(xué)習(xí),使得系統(tǒng)獲得更高精度,給實(shí)際重介質(zhì)選煤過(guò)程中帶來(lái)更好的經(jīng)濟(jì)效益。

        圖4 采用傳統(tǒng)PI控制方法的輸出曲線(xiàn)

        4 結(jié) 論

        1)實(shí)際重介質(zhì)選煤過(guò)程復(fù)雜多變且涉及設(shè)備繁多,采用基于模型的優(yōu)化控制方法很難實(shí)時(shí)更新最優(yōu)設(shè)定值。利用數(shù)據(jù)驅(qū)動(dòng)方法,避免對(duì)模型的依賴(lài),通過(guò)以往的數(shù)據(jù)優(yōu)化更新系統(tǒng)設(shè)定值,充分優(yōu)化了選煤過(guò)程的產(chǎn)品質(zhì)量。

        2)引入強(qiáng)化學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)算法對(duì)重介質(zhì)選煤過(guò)程優(yōu)化控制,同步更新的兩個(gè)神經(jīng)網(wǎng)絡(luò)運(yùn)行速率較快,精度較高,可以實(shí)現(xiàn)對(duì)重介質(zhì)選煤過(guò)程的優(yōu)化控制。

        猜你喜歡
        優(yōu)化策略評(píng)價(jià)
        超限高層建筑結(jié)構(gòu)設(shè)計(jì)與優(yōu)化思考
        SBR改性瀝青的穩(wěn)定性評(píng)價(jià)
        石油瀝青(2021年4期)2021-10-14 08:50:44
        民用建筑防煙排煙設(shè)計(jì)優(yōu)化探討
        關(guān)于優(yōu)化消防安全告知承諾的一些思考
        一道優(yōu)化題的幾何解法
        例談未知角三角函數(shù)值的求解策略
        我說(shuō)你做講策略
        高中數(shù)學(xué)復(fù)習(xí)的具體策略
        基于Moodle的學(xué)習(xí)評(píng)價(jià)
        Passage Four
        欧美性猛交xxxx三人| AV中文码一区二区三区| 亚洲av无码一区二区三区性色| 护士奶头又白又大又好摸视频| 亚洲AV一二三四区四色婷婷 | 中文字幕一区二区人妻性色| 国产成人综合久久精品免费| 92精品国产自产在线观看48页| 国内精品嫩模av私拍在线观看| 中文字幕av熟女中文av| 欧洲成人一区二区三区| 亚洲人成国产精品无码果冻| 最新亚洲精品国偷自产在线 | 国产洗浴会所三级av| 日韩精品视频在线观看无| 久久精品国产亚洲7777| 精品乱码卡1卡2卡3免费开放| 999国产一区在线观看| 成人国产乱对白在线观看| 亚洲精品国产av一区二区| 国产一区二区三区亚洲精品| 加勒比日韩视频在线观看| 亚洲色成人www永久在线观看| 亚洲爱婷婷色婷婷五月| 国产精品九九久久一区hh| 国产一区二区三区av免费观看| av国产自拍在线观看| 国产成人小视频| 欧美午夜精品一区二区三区电影| 亚洲AⅤ无码日韩AV中文AV伦| 精品亚洲不卡一区二区| 亚洲成人av在线蜜桃| 看久久久久久a级毛片| 国产午夜影视大全免费观看| 日本一区二区亚洲三区| 国产成人大片在线播放| 亚洲七久久之综合七久久| 无码熟熟妇丰满人妻啪啪| 亚洲国产一区二区三区,| 国产让女高潮的av毛片| 欧美激欧美啪啪片|