亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于B-MAXQ 自適應(yīng)預(yù)測PID 在柴油機(jī)調(diào)速中的研究*

        2020-03-27 09:43:00惠小亮張朦朦李鵬豪張永林
        關(guān)鍵詞:動作

        惠小亮 張朦朦 李鵬豪,2 張永林,2 曹 鈺,2

        (1-重慶紅江機(jī)械有限責(zé)任公司 重慶 402160 2-船舶與海洋工程動力系統(tǒng)國家工程實(shí)驗(yàn)室)

        引言

        調(diào)速器能夠幫助柴油機(jī)根據(jù)外界負(fù)載量的變化自動調(diào)節(jié)供油量,使得噴油泵所提供的油量與外界負(fù)載始終匹配,作為柴油機(jī)控制系統(tǒng)的核心部件,調(diào)速器性能的好壞對柴油機(jī)工作效率起到至關(guān)重要的作用[1-2]。目前,能源的短缺和新排放法的嚴(yán)控對柴油機(jī)的工作性能提出了更高的挑戰(zhàn),故如何設(shè)計(jì)出時效性更好,工作效率更高的調(diào)速器是現(xiàn)階段研究的熱點(diǎn)問題[3]。近些年來,國內(nèi)對柴油機(jī)調(diào)速問題做出了大量的研究,并有大量文獻(xiàn)公開發(fā)表,何毅等人以MMC2017 平臺為基礎(chǔ),進(jìn)行電子調(diào)速的設(shè)計(jì),并提出相應(yīng)的PID 控制算法[4];曹月真等人研究了船舶動力系統(tǒng)電子調(diào)速器的構(gòu)成模式、工作狀態(tài)及設(shè)計(jì)參數(shù),進(jìn)而對船舶電子調(diào)速系統(tǒng)進(jìn)行仿真模型構(gòu)建,并對電子調(diào)速器的系統(tǒng)構(gòu)成進(jìn)行深入研究,對執(zhí)行系統(tǒng)和控制系統(tǒng)等進(jìn)行仿真設(shè)計(jì)[5];馮濤針對現(xiàn)有調(diào)速器反應(yīng)時間長及不能靈活修正控制參數(shù)的缺點(diǎn),提出了一種以發(fā)電機(jī)電流為輸入量,并且改進(jìn)了傳統(tǒng)電子調(diào)速的閉環(huán)控制算法,提出了一種預(yù)知式電子調(diào)速策略[6]。

        楊波等人利用AMESim 軟件進(jìn)行了柴油機(jī)調(diào)速仿真優(yōu)化研究,并且優(yōu)化前后控制閥和執(zhí)行機(jī)構(gòu)的響應(yīng)特性,優(yōu)化后的調(diào)速器控制閥以及執(zhí)行機(jī)構(gòu)能夠很好地滿足準(zhǔn)確性和快速性的要求[7]。從整體上看,針對柴油機(jī)電子調(diào)速器的自適應(yīng)預(yù)測方法研究尚少。

        本文根據(jù)柴油機(jī)工作原理,建立了D6114 型柴油機(jī)平均模型,建立matlab/simulink 仿真模型,提出一種概率統(tǒng)計(jì)Bayes 公式和MAXQ 算法結(jié)合的自適應(yīng)行為預(yù)測算法,即B-MAXQ(Bayes-MAXQ)算法,通過在該算法中增加完成函數(shù)和即時評價函數(shù),使得電子調(diào)速器可根據(jù)當(dāng)前轉(zhuǎn)速和下一時刻的目標(biāo)轉(zhuǎn)速,進(jìn)行執(zhí)行器的PID 最優(yōu)參數(shù)預(yù)測,使得PID 參數(shù)得到更快速的調(diào)整,從而使調(diào)速器更快、更準(zhǔn)確地達(dá)到目標(biāo)轉(zhuǎn)速。柴油機(jī)運(yùn)行過程是連續(xù)的,調(diào)速器調(diào)速過程也是連續(xù)的,那么可根據(jù)轉(zhuǎn)速和PID參數(shù)歷史變化過程為PID 參數(shù)預(yù)測提供經(jīng)驗(yàn)數(shù)據(jù),并且運(yùn)用統(tǒng)計(jì)學(xué)方法建立算法模型,從而預(yù)測未來調(diào)速器的調(diào)速行為。其目的是為使執(zhí)行器在特定的當(dāng)前轉(zhuǎn)速及目標(biāo)轉(zhuǎn)速下會采取特定的PID 參數(shù)組合,從而幫助調(diào)速器作出更好的行為選擇,并且采用此方法使調(diào)速器在工作過程中復(fù)用累積的學(xué)習(xí)經(jīng)驗(yàn)。

        1 電子調(diào)速器的SMDP 模型設(shè)計(jì)

        傳統(tǒng)的MDP 只能在離散狀態(tài)下進(jìn)行工作,然而柴油機(jī)工作過程是連續(xù)的,這導(dǎo)致MDP 無法在此過程使用,故將馬爾科夫決策過程MDP(Markov decision process) 擴(kuò)展為半馬爾可夫決策過程SMDP[8],SMDP 完善了MDP 的狀態(tài)-動作映射機(jī)制,將時間段劃分為多個時間步進(jìn)行動作執(zhí)行[9]。

        將SMDP 用5 元組{S,A,P,R,I}來定義。將S 定義為調(diào)速器的當(dāng)前轉(zhuǎn)速,A 定義為執(zhí)行器PID 參數(shù)的集合;P ∶S*N*S*A→[0,1]是多步轉(zhuǎn)移概率函數(shù),P(s′,N|s,{a})代表執(zhí)行器采取PID 參數(shù)集合{a},調(diào)速器在N 個時刻內(nèi)可由當(dāng)前轉(zhuǎn)速s 轉(zhuǎn)移到目標(biāo)轉(zhuǎn)速s′的概率;R ∶S*A→R 是回報(bào)獎賞函數(shù),r(s,a)是執(zhí)行器在調(diào)速器當(dāng)前轉(zhuǎn)速s 的情況下選擇PID 參數(shù)a后期望取得的總的回報(bào)值,它包含了分析MDP 獲得報(bào)酬的所有必要信息;I 是初始的狀態(tài)分布。SMDP通過PID 參數(shù)-調(diào)速器速度映射關(guān)系,累積獎賞值,從而找到一個獎賞值最大的最優(yōu)策略。

        將SMDP 尋優(yōu)策略應(yīng)用到電子調(diào)速器自適應(yīng)調(diào)速領(lǐng)域,建立MSMDP(Multi-markov decision process)模型[10]。由于柴油機(jī)自適應(yīng)調(diào)速是一種復(fù)雜的非線性時變的動力機(jī)械,常規(guī)的SMDP 模型很難在全工況下取得良好的控制效果,故將SMDP 在決策時間的概念上進(jìn)行擴(kuò)展。

        將5 元組的SMDP 拓展為MSMDP 7 元組{An,S,A,P,R,I,T},由于PID 參數(shù)的選擇會影響齒條位置控制器,從而會影響柴油機(jī)的轉(zhuǎn)速,所以本文將所選的PID 參數(shù)集合看做MSMDP 集合中的行為動作,每個元素定義如下:由于調(diào)速器的調(diào)速過程是連續(xù)的,故該過程可看做是由連續(xù)的n 組PID 參數(shù)共同調(diào)節(jié)的,對于運(yùn)行的總時間為m,那么對于任意的時間段j,j∈m,均能構(gòu)成一個最優(yōu)PID 有限集Aj;A表示工作過程中的聯(lián)合PID 參數(shù)集合,即可表示表示A 中的即時PID 參數(shù)集合。

        其中S、P、R、I 與SMDP 中的定義一致。T 為終止?fàn)顟B(tài),它規(guī)定了決策時刻的選擇,由于最優(yōu)聯(lián)合PID 集合的獲取可能會存在時延誤差,故決策時間的選擇會影響到轉(zhuǎn)移概率P。那么對終止?fàn)顟B(tài)T,其規(guī)定為:聯(lián)合PID 集合A 中,若有即時PID 集合ai完成調(diào)速工作,則執(zhí)行器可重新選擇PID 集合,若未完成此刻PID 調(diào)速過程,則要等到動作完成后才能重新選擇。

        2 B-MAXQ 算法理論

        將MSMDP 應(yīng)用于調(diào)速總?cè)蝿?wù)M 中,M 可分解為子任務(wù)序列{M0,M1,…,Mn},以M0作為根任務(wù),每個子任務(wù)可用4 元組{Si,Ai,Ti,Ri}來定義:

        1)Si為Mi的轉(zhuǎn)速集合。

        2)Ai為子任務(wù)Mi的PID 參數(shù)集合。

        3)Ti為Mi的終止?fàn)顟B(tài)的目標(biāo)轉(zhuǎn)速集,當(dāng)某組PID 執(zhí)行完后,轉(zhuǎn)速達(dá)到最終的目標(biāo)轉(zhuǎn)速集合Ti時,Mi的求解過程結(jié)束。

        4)Ri為完成子任務(wù)Mi的獎賞值,R(s,N|s,a)為執(zhí)行某一組PID 參數(shù)集合后,當(dāng)前轉(zhuǎn)速s∈Si變遷到目標(biāo)轉(zhuǎn)速s′∈Ti的回報(bào)獎賞值,其含義為當(dāng)上層子任務(wù)采取執(zhí)行器PID 參數(shù)集合a 時,由當(dāng)前轉(zhuǎn)速s變成目標(biāo)轉(zhuǎn)速s′是否滿足上層子任務(wù)的要求。如果采取此PID 集合a 后無法達(dá)到上層子任務(wù)所期望的目標(biāo)轉(zhuǎn)速s′,則賦一個較大的負(fù)獎賞值來阻止此PID集合a 的發(fā)生,反之則給出合適的正獎賞值鼓勵此PID 集合a 的發(fā)生。

        根據(jù)MAXQ 學(xué)習(xí)算法將總?cè)蝿?wù)M 進(jìn)行層次劃分,并且定義Vi(s,a)為Mi在當(dāng)前轉(zhuǎn)速s 以及目標(biāo)轉(zhuǎn)速s′執(zhí)行PID 參數(shù)集合a 得到的期望獎賞,得到:

        上述4 個公式為任意某分層策略的評價函數(shù)分解方程。a′代表為達(dá)到目標(biāo)轉(zhuǎn)速s′所運(yùn)行的PID 參數(shù)集合;設(shè)柴油機(jī)此時轉(zhuǎn)速為s,那么R(s′|s,a)表示在轉(zhuǎn)速s 下,執(zhí)行PID 參數(shù)集合a 到達(dá)目標(biāo)轉(zhuǎn)速s′所得到的即時獎賞值。將整個任務(wù)M 自動分解成單個子任務(wù){(diào)M0,M1,…,Mn},V(i,s)為評價函數(shù),它是由復(fù)合動作子任務(wù)函數(shù)C(i,s,a)和基本原子動作函數(shù)V(i,s,a)組成,將根節(jié)點(diǎn)的評價函數(shù)V(a0,s)遞歸分解為單個子任務(wù)的評價函數(shù)和完成函數(shù)C(j,s,a),j=1,2,3,…,n。

        按照以上所述,利用MAXQ 分層算法中的策略π 在當(dāng)前轉(zhuǎn)速s 下進(jìn)行分層。設(shè)Ma0是根任務(wù),策略π選擇了子任務(wù)Ma1,Ma1選擇了Ma2,以此類推進(jìn)行子任務(wù)選擇,直到子任務(wù)Man-1 的策略選擇了原子動作an(最后時刻的PID 參數(shù)集合),則可將根節(jié)點(diǎn)的根任務(wù)值函數(shù)V(a0,s)分解為:

        其中:{a0,a1,…,an}是由MAXQ 算法得到的一條自上而下的節(jié)點(diǎn)路徑,圖1 為V(a0,s)的計(jì)算方法[11]。

        圖1 根節(jié)點(diǎn)值函數(shù)的計(jì)算方法

        將B-MAXQ 工作原理應(yīng)用于電子調(diào)速器調(diào)速過程中,其步驟包括:

        1)建立Mi的轉(zhuǎn)速-PID4 元組序列seq{},其內(nèi)容包括{子任務(wù),原子動作,前置條件,后置條件},其中,Mi代表第i 個子任務(wù),i 為正整數(shù)。子任務(wù)指柴油機(jī)當(dāng)前轉(zhuǎn)速;原子動作指執(zhí)行器PID 的參數(shù)組合,每個子任務(wù)都是由若干個原子動作完成;前置條件為PID 執(zhí)行前一時刻柴油機(jī)需要滿足的速度;后置條件為當(dāng)前目標(biāo)轉(zhuǎn)速。

        建立轉(zhuǎn)速-PID 預(yù)測表Ptable (Prediction table),當(dāng)Mi完成時,那么將此時輸入完整的seq{}序列輸入到轉(zhuǎn)速-PID 預(yù)測表中,并將seq{}序列清空,使得下次執(zhí)行其他子任務(wù)時再使用。

        2)B-MAXQ 概率預(yù)測的理論的構(gòu)建:在已知柴油機(jī)的當(dāng)前轉(zhuǎn)速及目標(biāo)轉(zhuǎn)速的條件下,采用概率統(tǒng)計(jì)方法和Bayes 公式來估計(jì)某一組特定的PID 集合執(zhí)行的概率,設(shè)表示在第j 時刻的電子調(diào)速器認(rèn)為在第i 時刻的s 轉(zhuǎn)速下可能采取某一組PID 參數(shù)集合ak的概率。若電調(diào)在s 轉(zhuǎn)速下探索不同PID 集合的次數(shù)為(Ni)s,以及電調(diào)在探索某一PID 參數(shù)集合ak的次數(shù)為,那么pj(s,i,ak)的計(jì)算公式為:

        3)當(dāng)電子調(diào)速器發(fā)現(xiàn)柴油機(jī)處于s 轉(zhuǎn)速時,根據(jù)當(dāng)前的目標(biāo)轉(zhuǎn)速預(yù)測應(yīng)采取何種PID 參數(shù)集合作為自己的最優(yōu)反應(yīng)策略,執(zhí)行器根據(jù)此時選取的PID參數(shù)集合進(jìn)行齒條位置的調(diào)節(jié),在進(jìn)行一系列連續(xù)動作后,使柴油機(jī)處于目標(biāo)轉(zhuǎn)速s′,那么就可以根據(jù)當(dāng)前PID 參數(shù)集合aj和目標(biāo)轉(zhuǎn)速s′來預(yù)測出執(zhí)行器下一時刻的PID 參數(shù)組合。根據(jù)貝葉斯公式得出:

        式中:p(ai|aj,s′)表示柴油機(jī)處于轉(zhuǎn)速s 并且此時執(zhí)行器的PID 參數(shù)集合為aj時,預(yù)計(jì)執(zhí)行器下一時刻采取PID 參數(shù)集合ai的概率;p(s,|aj,ai)是執(zhí)行器采取聯(lián)合PID 集合ai、aj后到達(dá)目標(biāo)轉(zhuǎn)速s′的轉(zhuǎn)移概率,p(s′|ai)為執(zhí)行器采取PID 集合ai后柴油機(jī)到達(dá)目標(biāo)轉(zhuǎn)速s′的轉(zhuǎn)移概率。由此可將公式作為推廣:執(zhí)行器某時刻的PID 參數(shù)集合記為ak,其余PID 參數(shù)集合為ak′(不含ak),即得到推廣公式為:

        3 基于B-MAXQ 算法的電子調(diào)速的應(yīng)用理論

        以柴油機(jī)電子調(diào)速任務(wù)作為分層模型,每個子任務(wù)是由柴油機(jī)的目標(biāo)速度定義的,當(dāng)執(zhí)行器運(yùn)行某一組PID 參數(shù)時,達(dá)到目標(biāo)轉(zhuǎn)速時,則終止當(dāng)前子任務(wù)。如果獲取到每個子任務(wù)的PID 集合,則可視為獲取整個任務(wù)的調(diào)速策略。

        當(dāng)每個Mi子節(jié)點(diǎn)學(xué)習(xí)完成后則獲取的是局部的PID 參數(shù),每個Mi均有終止?fàn)顟B(tài),若所到達(dá)的終止態(tài)不滿足上層任務(wù)的子目標(biāo)轉(zhuǎn)速,那么就視為此時獲取的PID 參數(shù)是不利于局部優(yōu)化的,對這種策略應(yīng)該賦負(fù)獎賞值加以抑制,因此在各個子任務(wù)中增加即時評價函數(shù)(s 為柴油機(jī)當(dāng)前轉(zhuǎn)速),然后在Vi節(jié)點(diǎn)中增加的完成函數(shù),由決定當(dāng)前的行為策略,而Mi節(jié)點(diǎn)向上層計(jì)算Vi時仍使用C。因此每個子任務(wù)的V 節(jié)點(diǎn)需要構(gòu)建Ci(s,a)(s,a)兩張函數(shù)表,而原子動作i 只需要構(gòu)建V(i,s)(∑P(s′|s,i)R(s′|s,i),P(s′|s,i)表示在執(zhí)行子任務(wù)i 時柴油機(jī)的當(dāng)前轉(zhuǎn)速s,當(dāng)執(zhí)行完畢后達(dá)到柴油機(jī)目標(biāo)轉(zhuǎn)速s′的概率;R(s′|s,i)表示柴油機(jī)的當(dāng)前轉(zhuǎn)速為s,當(dāng)子任務(wù)執(zhí)行完畢后達(dá)到目標(biāo)轉(zhuǎn)速s′的獎勵值),定義(為子任務(wù)的完成函數(shù),V 表示子任務(wù)的值函數(shù))為根據(jù)此刻完成函數(shù)和值函數(shù)V 確定柴油機(jī)達(dá)到目標(biāo)轉(zhuǎn)速s′采取的最佳PID 集合。

        4 B-MAXQ 算法分析

        綜上所述,B-MAXQ 的原理如下:

        4.1 如果Mi是基本動作,具體步驟如下

        1)在柴油機(jī)當(dāng)前轉(zhuǎn)速s 下執(zhí)行動作i(由當(dāng)前的PID 參數(shù)集合直接映射的動作),收到回報(bào)值為r(s,i),觀察新的目標(biāo)轉(zhuǎn)速s′。

        2)更新原子動作獎勵

        3)將當(dāng)前轉(zhuǎn)速s,完成協(xié)作任務(wù)Mi的所有執(zhí)行器PID 參數(shù)集合以及目標(biāo)轉(zhuǎn)速s′壓入序列seq 的開頭。

        4.2 當(dāng)Mi不在終止?fàn)顟B(tài)集Ti中,并且Mi為非基本動作,具體步驟如下

        1)若Mi為協(xié)作子任務(wù)時,包括以下步驟:

        a)利用模擬退火算法來選擇PID 參數(shù)集合aj,令ChildSeq=B-MAXQ(Mi,aj,s),當(dāng)Mi為協(xié)作子任務(wù),以(Mi,aj,s)為研究對象,并且將其輸入到BMAXQ 算法中進(jìn)行迭代求最優(yōu)策略,ChildSeq 為Seq的子序列,當(dāng)每個ChildSeq 均求解成功后,Seq 序列組合成功。其中ChildSeq 為子任務(wù)Mi所執(zhí)行的速度-PID 參數(shù)序列(包括當(dāng)前轉(zhuǎn)速,PID 參數(shù)序列,以及目標(biāo)轉(zhuǎn)速);

        b)根據(jù)當(dāng)前轉(zhuǎn)速s 以及目標(biāo)轉(zhuǎn)速s′去選擇執(zhí)行器PID 參數(shù)序列,當(dāng)前轉(zhuǎn)速s,以及目標(biāo)轉(zhuǎn)速s′所對應(yīng)的執(zhí)行器PID 參數(shù)集合為:

        c)最優(yōu)PID 參數(shù)集合a*計(jì)算如下:

        d)令N=0,對于序列中每一個(s,a),都進(jìn)行 如下運(yùn)算:

        e)將ChildSeq 添加到seq{}首位,并且當(dāng)前轉(zhuǎn)速s 用目標(biāo)轉(zhuǎn)速s′代替;

        f)將seq 序列按層次順序添加到Ptable中。

        2)獎賞函數(shù)、學(xué)習(xí)率?t以及動作策略的設(shè)置,其步驟包含如下:

        a)如表1 為不同精度等級的調(diào)速性能指標(biāo)。學(xué)習(xí)行為的好壞可由獎賞函數(shù)作為評判標(biāo)準(zhǔn)。按照GB/T3475-2008 規(guī)定[12],判斷電子調(diào)速器的性能可由穩(wěn)態(tài)轉(zhuǎn)速波動率、瞬態(tài)調(diào)速率和轉(zhuǎn)速穩(wěn)定時間來平衡。

        表1 不同精度等級的調(diào)速性能指標(biāo)

        本文根據(jù)GB/T3475-2008 標(biāo)準(zhǔn),柴油機(jī)電子調(diào)速器在負(fù)荷突變時以及穩(wěn)態(tài)工作下的獎賞函數(shù)設(shè)計(jì)如下:

        b)理論上講,獎賞值獲得的越高證明PID 選擇得越好,如果想獲得高獎賞值,那么每個PID 都必須選擇最高的Q 值動作,但是在學(xué)習(xí)的初期,選擇最高Q 值的PID 集合往往導(dǎo)致電子調(diào)速器總是采用相同的高Q 值動作,不能探索其它PID 集合,故尋優(yōu)策略會陷入局部最優(yōu)當(dāng)中。為了使PID 參數(shù)集合的選取具有隨機(jī)性,并且能在試探過程中發(fā)現(xiàn)更好的PID參數(shù)集合,那么采用Boltzmann 探索策略,由以完成函數(shù)來定義其探索方式,在轉(zhuǎn)速s 下選擇PID 集合aj的概率定義為:

        c)將學(xué)習(xí)率?t設(shè)置:

        如圖2 所示為一種基于B-MAXQ 的電子調(diào)速方法流程框圖。

        圖2 一種基于B-MAXQ 的電子調(diào)速方法流程框圖

        5 試驗(yàn)過程與結(jié)果

        為了驗(yàn)證本文提出的B-MAXQ 算法的有效性,根據(jù)柴油機(jī)工作原理,建立了D6114 型柴油機(jī)平均模型,如圖3 所示為柴油機(jī)總體模型,如圖4 所示為基于B-MAXQ 算法的柴油機(jī)調(diào)速系統(tǒng)模型,并在matlab/simulink 軟件上進(jìn)行仿真。

        圖3 柴油機(jī)總體模型

        圖4 基于B-MAXQ 算法的柴油機(jī)調(diào)速系統(tǒng)模型

        D6114 柴油機(jī)是由6 個氣缸組成,結(jié)構(gòu)為直列四沖程,行程為135 mm,缸徑為114 mm,額定轉(zhuǎn)速為1 500 r/min,燃油泵為直列柱塞泵。

        試驗(yàn)通過柴油機(jī)起動及穩(wěn)態(tài)試驗(yàn)和加減載試驗(yàn),測試B-MAXQ 自適應(yīng)可預(yù)測調(diào)速算法的調(diào)速性能,并以GB/T3475-2008 作為評價標(biāo)準(zhǔn),其評價調(diào)速性能以對比轉(zhuǎn)速波動率v,瞬態(tài)調(diào)速率δ,轉(zhuǎn)速恢復(fù)時間τ 為主,通過分析試驗(yàn)結(jié)果來驗(yàn)證B-MAXQ 算法性能。

        5.1 起動及穩(wěn)態(tài)試驗(yàn)

        采取B-MAXQ 算法進(jìn)行200 次柴油機(jī)起動控制試驗(yàn),試驗(yàn)數(shù)據(jù)按照試驗(yàn)順序進(jìn)行每50 次為一組記錄,記錄的4 組試驗(yàn)數(shù)據(jù)進(jìn)行擬合圖像,即試驗(yàn)圖像如圖5 所示。

        從試驗(yàn)結(jié)果圖像分析可知:利用B-MAXQ 算法可使柴油機(jī)順利起動,并且起動后可直接、順利、準(zhǔn)確地進(jìn)入低轉(zhuǎn)速控制,過渡過程平穩(wěn)、快速,過渡時間小于2 s。隨著試驗(yàn)次數(shù)的增加,柴油機(jī)轉(zhuǎn)速波動率、瞬態(tài)調(diào)速率以及轉(zhuǎn)速恢復(fù)時間均有不同程度的改善,即隨著試驗(yàn)次數(shù)的增加,柴油機(jī)在起動過程中,柴油機(jī)轉(zhuǎn)速上升迅速,且在一定范圍內(nèi),超調(diào)量變小,轉(zhuǎn)速穩(wěn)定時間變短,轉(zhuǎn)速波動變小。試驗(yàn)證明:使用B-MAXQ 自適應(yīng)行為預(yù)測PID 算法在柴油機(jī)起動過程中,能夠通過自適應(yīng)學(xué)習(xí)自主改善柴油機(jī)的主要性能指標(biāo)。

        圖5 第1~200 次起動試驗(yàn)數(shù)據(jù)擬合圖像

        5.2 加減載試驗(yàn)

        試驗(yàn)中設(shè)定柴油機(jī)的目標(biāo)轉(zhuǎn)速為1 200 r/min,其中以對調(diào)速器的性能要求最高,最能表現(xiàn)調(diào)速器調(diào)速性能的突加100%負(fù)載和突卸100%負(fù)載為主要試驗(yàn)[13],試驗(yàn)進(jìn)行200 次,試驗(yàn)數(shù)據(jù)按照試驗(yàn)順序進(jìn)行每50 次為一組記錄,記錄的4 組試驗(yàn)數(shù)據(jù)進(jìn)行擬合圖像,即試驗(yàn)圖像如圖6 所示,根據(jù)圖像中轉(zhuǎn)速峰值以及穩(wěn)定時間的變化,具體試驗(yàn)數(shù)據(jù)見表2 和表3。

        圖6 第1~200 次100%加減載試驗(yàn)數(shù)據(jù)擬合圖像

        表2 100%突加負(fù)載試驗(yàn)數(shù)據(jù)分析

        表3 100%突減負(fù)載試驗(yàn)數(shù)據(jù)分析

        從試驗(yàn)結(jié)果分析可知:利用B-MAXQ 算法進(jìn)行柴油機(jī)的突加100%負(fù)載和突卸100%負(fù)載均可順利達(dá)到目標(biāo)轉(zhuǎn)速,且過渡過程平穩(wěn),穩(wěn)態(tài)時轉(zhuǎn)速波動小于±70。分析表2、表3 數(shù)據(jù)可知,隨著試驗(yàn)次數(shù)的增加,柴油機(jī)轉(zhuǎn)速波動率、瞬態(tài)調(diào)速率以及轉(zhuǎn)速恢復(fù)時間均有不同程度的改善,即隨著試驗(yàn)次數(shù)的增加,柴油機(jī)在100%加減負(fù)荷過程中,柴油機(jī)在一定范圍內(nèi),超調(diào)量變小,轉(zhuǎn)速穩(wěn)定時間變短,轉(zhuǎn)速波動變小。試驗(yàn)證明:使用B-MAXQ 自適應(yīng)行為預(yù)測算法在柴油機(jī)100%加減負(fù)荷工作過程中,能夠通過自適應(yīng)學(xué)習(xí)自主改善柴油機(jī)的主要性能指標(biāo)。

        6 結(jié)論

        試驗(yàn)結(jié)果表明,基于B-MAXQ 自適應(yīng)預(yù)測PID算法在柴油機(jī)調(diào)速系統(tǒng)中具有更小的超調(diào)率和更短地穩(wěn)定時間,具體結(jié)論如下:

        1)利用概率統(tǒng)計(jì)Bayes 公式和MAXQ 算法結(jié)合所提出的B-MAXQ 自適應(yīng)預(yù)測PID 算法,可實(shí)現(xiàn)執(zhí)行器自主調(diào)節(jié)齒條位置,從而使柴油機(jī)更快更穩(wěn)定地達(dá)到目標(biāo)轉(zhuǎn)速。

        2)B-MAXQ 算法中構(gòu)建轉(zhuǎn)速-PID 集合預(yù)測表以及增加即時評價函數(shù)以及相應(yīng)的完成函數(shù),使調(diào)速過程中學(xué)習(xí)經(jīng)驗(yàn)?zāi)軌虻玫綇?fù)用并且實(shí)現(xiàn)電子調(diào)速器自調(diào)整過程,從而達(dá)到預(yù)測執(zhí)行器PID 參數(shù)集合的目的。

        3)通過進(jìn)行多次柴油機(jī)起動試驗(yàn)以及100%加減負(fù)載試驗(yàn)證明,B-MAXQ 算法在控制柴油機(jī)工作過程中,不僅能夠滿足柴油機(jī)調(diào)速的各項(xiàng)指標(biāo),并且隨著試驗(yàn)次數(shù)的增多,還能在一定范圍內(nèi)自適應(yīng)優(yōu)化自身性能,具有廣泛的實(shí)際應(yīng)用價值。

        猜你喜歡
        動作
        動作不可少(下)
        動作不能少(上)
        巧借動作寫友愛
        下一個動作
        動作描寫要具體
        畫動作
        讓動作“活”起來
        動作描寫不可少
        非同一般的吃飯動作
        神奇的手
        一二三四在线观看免费视频| 日本高清二区视频久二区| 青青青伊人色综合久久| 北岛玲亚洲一区二区三区| 大屁股流白浆一区二区三区| 亚洲一区毛片在线观看| 国产精品毛片一区二区三区| 先锋影音av最新资源| 亚洲AV色无码乱码在线观看| 岛国精品一区二区三区| 青青草一级视频在线观看| 精品国产亚洲av高清日韩专区 | 亚洲一区二区精品久久岳| 蜜桃精品国产一区二区三区| 亚洲国产人成综合网站| 亚洲国产果冻传媒av在线观看| 久久久av波多野一区二区| 丰满人妻被黑人中出849| 亚洲精品视频久久| 综合激情中文字幕一区二区| 精品成人av人一区二区三区 | 国外亚洲成av人片在线观看| 国产成人久久综合热| 国产精品女同久久免费观看| av免费网站不卡观看| 国产精品福利高清在线| 乱中年女人伦| 无套内谢孕妇毛片免费看看| 99热国产在线| 在线不卡av一区二区| 99噜噜噜在线播放| 欧美尺寸又黑又粗又长| 夜夜综合网| 一本久道视频无线视频试看| 婚外情长久的相处之道| 日本爽快片100色毛片| 亚洲日韩欧洲无码av夜夜摸| 无码 制服 丝袜 国产 另类| 国产一区二区三区亚洲精品| 成人免费av高清在线| 日韩夜夜高潮夜夜爽无码 |