中圖分類(lèi)號(hào):TD421.5 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1003-5168(2025)08-0053-04
DOI:10.19968/j.cnki.hnkj.1003-5168.2025.08.009
Abstract: [Purposes] This paper aims to solve the problem of low effciency and high energy consumption caused by insufficient intelligent control of the roadheader cutting head,thus improving its control accuracy.[Methods] A combined system of reinforcement learning and model predictive control was built.The Q-learning algorithm was used to optimize cutting parameters,a Lagrange-Euler dynamics predictive controllr was designed,and a multi-objective model with adjustable weights (O.2\~O.8) was created.[Findings] In 55 MPa rock conditions,the system's tunneling efficiency increased by 1 8 . 1 % (to (202 3 . 8 5 m / h ), energy consumption decreased by 1 7 . 4 % (to ), trajectory error was reduced to 2.8 mm,and control signal fluctuations dropped by 4 9 . 2 % .[Conclusions] This method improves the energy efficiency of the cutting head through algorithm optimization and provides key technical support for smart tunneling equipment.
Keywords: roadheader; cutting head; reinforcement learning
0 引言
掘進(jìn)機(jī)是煤礦開(kāi)采、隧道施工等領(lǐng)域的重要裝備,其工作性能直接影響掘進(jìn)效率、施工進(jìn)度與成本[]。截割頭是掘進(jìn)機(jī)的關(guān)鍵工作部件,其智能化控制水平?jīng)Q定了掘進(jìn)機(jī)的整體性能。近年來(lái),我國(guó)高度重視智能制造的發(fā)展,《中國(guó)制造2025》明確指出要大力推進(jìn)工程機(jī)械、礦山機(jī)械的智能化。掘進(jìn)機(jī)作為代表性裝備,亟須突破截割頭智能控制技術(shù),以提升掘進(jìn)機(jī)的作業(yè)效率、自適應(yīng)能力與安全可靠性。
1掘進(jìn)機(jī)截割頭智能控制系統(tǒng)總體架構(gòu)與邏輯
掘進(jìn)機(jī)截割頭智能控制系統(tǒng)的總體架構(gòu)由數(shù)據(jù)采集與傳感器模塊、控制算法模塊和執(zhí)行機(jī)構(gòu)與反饋模塊組成,各模塊之間緊密耦合,協(xié)同工作,具體如圖1所示。在系統(tǒng)運(yùn)行時(shí),數(shù)據(jù)采集模塊以 5 0 m s 為周期實(shí)時(shí)采集并預(yù)處理傳感器數(shù)據(jù),傳輸至控制算法模塊。該模塊首先調(diào)用RL單元對(duì)截割參數(shù)進(jìn)行優(yōu)化,將截割速度、推進(jìn)速度等參數(shù)的Q 值映射到最優(yōu)值,然后將優(yōu)化結(jié)果輸入MPC單元,生成實(shí)時(shí)控制序列,同時(shí)協(xié)調(diào)平衡各項(xiàng)子目標(biāo),將控制指令下發(fā)至執(zhí)行機(jī)構(gòu),驅(qū)動(dòng)截割頭運(yùn)動(dòng),完成截割作業(yè)。
2截割頭智能控制的關(guān)鍵技術(shù)研究
2.1基于強(qiáng)化學(xué)習(xí)的截割參數(shù)優(yōu)化
掘進(jìn)機(jī)截割頭智能控制系統(tǒng)采用基于強(qiáng)化學(xué)習(xí)(ReinforcementLearning,RL)的方法實(shí)現(xiàn)截割參數(shù)的自適應(yīng)優(yōu)化。該方法以截割速度、推進(jìn)速度等參數(shù)作為智能體(Agent)的動(dòng)作(Action),以截割效率、能耗等指標(biāo)作為環(huán)境狀態(tài),并設(shè)計(jì)切實(shí)可行的獎(jiǎng)勵(lì)函數(shù)(RewardFunction)。在系統(tǒng)運(yùn)行時(shí),Agent通過(guò)與環(huán)境的持續(xù)交互,利用Q-learning算法不斷調(diào)整動(dòng)作策略,使獎(jiǎng)勵(lì)值最大化,從而實(shí)現(xiàn)截割參數(shù)的動(dòng)態(tài)尋優(yōu)[2]。
首先,構(gòu)建截割參數(shù)優(yōu)化的MDP(MarkovDeci-sionProcess)模型,狀態(tài)空間S包含截割功率、推進(jìn)阻力等維度,動(dòng)作空間A涵蓋截割速度在 0 . 5 ~ 2 . 5 范圍內(nèi)的離散值,獎(jiǎng)勵(lì)函數(shù)定義為截割效率與能耗加權(quán)和,權(quán)重系數(shù)可根據(jù)工況在 0 . 2 ~ 0 . 8 間動(dòng)態(tài)調(diào)整。其次,初始化 Q 表
,并設(shè)置學(xué)習(xí)率 α = 0 . 8 ,折扣因子 γ = 0 . 9 5 。在優(yōu)化過(guò)程中,根據(jù)
貪婪策略選取動(dòng)作,獲得即時(shí)獎(jiǎng)勵(lì) r 和下一狀態(tài)
,利用Bellman方程更新 Q 值,具體見(jiàn)式(1)。
其中, r 的計(jì)算公式見(jiàn)式(2)。
式中: 為截割速度,
為截割功率,kW ;
為推進(jìn)速度,
為推進(jìn)阻力,
和
分別為截割效率和能耗的權(quán)重系數(shù)。不斷重復(fù)上述交互學(xué)習(xí)過(guò)程,直至 Q 值收斂。最后,提取 Q 表中每個(gè)狀態(tài)對(duì)應(yīng)的最優(yōu)動(dòng)作值,形成截割參數(shù)優(yōu)化策略。
該方法能夠根據(jù)實(shí)時(shí)工況選取最佳截割參數(shù)組合,在滿(mǎn)足施工要求的同時(shí),兼顧效率與能耗性能。
2.2 模型預(yù)測(cè)控制策略設(shè)計(jì)
掘進(jìn)機(jī)截割頭控制系統(tǒng)的另一關(guān)鍵技術(shù)是模型預(yù)測(cè)控制(ModelPredictiveControl,MPC)策略的設(shè)計(jì)與實(shí)現(xiàn)。在該策略中,首先根據(jù)截割電機(jī)電流、截割扭矩、推進(jìn)阻力等狀態(tài)參數(shù),建立截割頭動(dòng)力學(xué)模型,采用Lagrange-Euler方程描述其運(yùn)動(dòng)特性。具體地,定義廣義坐標(biāo)見(jiàn)式(3)。
式中: 分別為擺臂中心在直角坐標(biāo)系下的位置坐標(biāo),
為擺臂轉(zhuǎn)角,rad,并令 τ
為廣義力矩,
。動(dòng)力學(xué)方程可表示為式(4)。
式中: M ( q ) 為正定對(duì)稱(chēng)的慣性矩陣; 為哥氏力和離心力項(xiàng); G ( q ) 為重力項(xiàng)。基于該模型,設(shè)計(jì)MPC控制器,以截割電機(jī)電壓
為控制量,在狀態(tài)量
采樣周期
時(shí)對(duì)系統(tǒng)進(jìn)行離散化,得到狀態(tài)空間方程見(jiàn)式(5)。
然后,以跟蹤截割速度、姿態(tài)角等參考軌跡為控制目標(biāo),構(gòu)建有限時(shí)域性能指標(biāo)函數(shù),見(jiàn)式(6。
式中: 分別為預(yù)測(cè)時(shí)域和控制時(shí)域, Q , R 分別為狀態(tài)誤差和控制增量的加權(quán)矩陣。在每個(gè)采樣時(shí)刻 k ,求解該優(yōu)化問(wèn)題,得到未來(lái)
步的最優(yōu)控制序列
,并將首元素
作用于對(duì)象[3]。在隨后的 k+1 時(shí)刻,根據(jù)新獲得的狀態(tài)量重復(fù)上述過(guò)程,實(shí)現(xiàn)MPC控制。此外,針對(duì)掘進(jìn)過(guò)程中的擾動(dòng)和參數(shù)攝動(dòng),將魯棒約束納入優(yōu)化指標(biāo),以提高控制系統(tǒng)的魯棒性與自適應(yīng)能力。
2.3截割效率與能耗多目標(biāo)協(xié)調(diào)控制
掘進(jìn)機(jī)截割頭控制系統(tǒng)需要在滿(mǎn)足掘進(jìn)效率要求的同時(shí),盡可能降低系統(tǒng)能耗,因此必須在這兩個(gè)目標(biāo)之間進(jìn)行合理權(quán)衡與協(xié)調(diào)。針對(duì)此問(wèn)題,本研究提出一種多目標(biāo)優(yōu)化控制方法。首先,定義單位截割電能消耗 和單位推進(jìn)油耗
1 L/ m 分別表征截割和推進(jìn)過(guò)程的能源利用效率,其計(jì)算公式分別見(jiàn)式(7)和式(8)。
以上式中: 為截割電機(jī)輸入功率,
為推進(jìn)泵供油流量, L/ m i n :
為截割體積,
為推進(jìn)行程, m ,均在一個(gè)控制周期
內(nèi)進(jìn)行計(jì)算[4]。
然后,構(gòu)建截割效率目標(biāo) 和能耗目標(biāo)
分別表示為截割速度與額定值的偏差平方和單位能耗的加權(quán)和,具體見(jiàn)式(9)和式(10)。
以上式中: 為第 k 個(gè)采樣時(shí)刻的實(shí)際截割速度,
為截割速度設(shè)定值;
和
分別為兩個(gè)能效指標(biāo)的權(quán)重系數(shù)。將
和
歸一化后,構(gòu)建總目標(biāo)函數(shù)
,見(jiàn)式(11)。
式中: 和
分別為歸一化后的效率目標(biāo)和能耗目標(biāo);
為協(xié)調(diào)因子,可根據(jù)工況在 0 . 5 ~ 0 . 8 范圍內(nèi)動(dòng)態(tài)調(diào)整。
在實(shí)際控制過(guò)程中,首先,根據(jù)掘進(jìn)工藝要求確定截割速度、推進(jìn)速度等設(shè)定值及協(xié)調(diào)因子初值。其次,實(shí)時(shí)采集截割電機(jī)電壓電流、推進(jìn)系統(tǒng)壓力流量等信號(hào),計(jì)算單位能耗指標(biāo)。再次,將各項(xiàng)數(shù)據(jù)代人總目標(biāo)函數(shù),以控制變量(如截割電機(jī)轉(zhuǎn)矩、推進(jìn)泵排量等)為優(yōu)化變量,求解多目標(biāo)優(yōu)化問(wèn)題,得到最優(yōu)控制序列[5]。優(yōu)化求解過(guò)程可基于序列二次規(guī)劃等方法,并將控制時(shí)域約束、執(zhí)行機(jī)構(gòu)物理約束等納入其中,以保證解的可行性。最后,將優(yōu)化結(jié)果解析為控制指令,傳輸至數(shù)字液壓泵、變頻器等執(zhí)行單元,實(shí)現(xiàn)截割過(guò)程的協(xié)調(diào)控制。
2.4故障診斷與容錯(cuò)控制方法
掘進(jìn)機(jī)截割頭系統(tǒng)在惡劣的煤礦井下環(huán)境中長(zhǎng)期工作,各類(lèi)故障時(shí)有發(fā)生,嚴(yán)重影響掘進(jìn)效率與設(shè)備可靠性。為此,本研究在智能控制系統(tǒng)中集成了基于多源信息融合的故障診斷與容錯(cuò)控制模塊,實(shí)現(xiàn)截割頭的故障預(yù)警、快速定位與控制重構(gòu)。
故障診斷模塊以振動(dòng)傳感器、電流傳感器等采集的狀態(tài)數(shù)據(jù)為基礎(chǔ),通過(guò)時(shí)頻域分析與特征提取,獲得反映故障特征的指標(biāo)集合。以齒輪箱故障診斷為例,從振動(dòng)加速度信號(hào)中提取均方根值、峭度因子等5個(gè)時(shí)域特征 。隨后,將特征矢量輸人支持矢量機(jī)(SupportVectorMa-chine,SVM)分類(lèi)器,通過(guò)一對(duì)多策略實(shí)現(xiàn)齒輪箱6種典型故障模式(正常、輕微磨損、中度磨損、嚴(yán)重磨損、輕微點(diǎn)蝕、嚴(yán)重點(diǎn)蝕)的多分類(lèi)診斷。SVM分類(lèi)器采用徑向基核函數(shù),懲罰因子 c=1 0 0 ,核函數(shù)參數(shù) g = 0 . 1 。在此基礎(chǔ)上,進(jìn)一步利用D-S(Dempster-Shafer)證據(jù)理論對(duì)多傳感器的診斷結(jié)果進(jìn)行融合,以提高故障診斷的可靠性。融合規(guī)則為Yager組合規(guī)則,置信度閾值為0.7。
當(dāng)監(jiān)測(cè)到截割頭關(guān)鍵部件(如減速機(jī)、液壓馬達(dá)等)發(fā)生故障時(shí),容錯(cuò)控制模塊自動(dòng)啟動(dòng),根據(jù)故障類(lèi)型與嚴(yán)重程度,及時(shí)調(diào)整控制策略,在保證安全的前提下維持設(shè)備運(yùn)行。以截割電機(jī)軸承故障為例,當(dāng)診斷出輕微故障時(shí),通過(guò)PI控制器動(dòng)態(tài)降低電樞電流,使電機(jī)在 6 5 0 ~ 7 2 0 A 范圍內(nèi)低速運(yùn)行;當(dāng)診斷出嚴(yán)重故障時(shí),控制系統(tǒng)下發(fā)停機(jī)指令,同時(shí)報(bào)警提示。此外,對(duì)于執(zhí)行機(jī)構(gòu)(如伺服閥、比例閥等)的常見(jiàn)故障,系統(tǒng)還預(yù)設(shè)了基于自適應(yīng)滑模觀測(cè)器的主動(dòng)容錯(cuò)控制策略。通過(guò)狀態(tài)重構(gòu)與反步控制,在 0 . 1 5 s 內(nèi)完成控制器參數(shù)自校正,保證閥芯位移控制誤差小于 0 . 8 m m ,從而有效抑制執(zhí)行機(jī)構(gòu)故障對(duì)截割質(zhì)量的影響。
總的來(lái)說(shuō),本研究所設(shè)計(jì)的故障診斷與容錯(cuò)控制方法可顯著提高掘進(jìn)機(jī)截割頭的運(yùn)行可靠性,診斷準(zhǔn)確率達(dá) 9 4 . 6 % ,最大程度降低了生產(chǎn)事故的風(fēng)險(xiǎn),為系統(tǒng)穩(wěn)定運(yùn)行提供了可靠保障。
3智能控制系統(tǒng)的仿真與試驗(yàn)驗(yàn)證
3.1控制系統(tǒng)仿真平臺(tái)的搭建與試驗(yàn)設(shè)計(jì)
為驗(yàn)證所設(shè)計(jì)智能控制系統(tǒng)的性能,搭建了基于MATLAB/Simulink的仿真試驗(yàn)平臺(tái)。該平臺(tái)集成了掘進(jìn)機(jī)截割頭動(dòng)力學(xué)模型、強(qiáng)化學(xué)習(xí)控制器和模型預(yù)測(cè)控制器,采樣頻率設(shè)置為 1 . 2 k H z 。該試驗(yàn)選用EBZ-160型掘進(jìn)機(jī)作為研究對(duì)象,其額定截割功率為 1 6 0 k W ,截割頭轉(zhuǎn)速為 。對(duì)照試驗(yàn)采用傳統(tǒng)的分層控制系統(tǒng),該系統(tǒng)包含基于BP神經(jīng)網(wǎng)絡(luò)的參數(shù)優(yōu)化層(隱層節(jié)點(diǎn)數(shù)為12,學(xué)習(xí)率為0.15)和基于滑??刂频膱?zhí)行層(趨近律系數(shù)c= 8 . 5 ,切換系數(shù) ε = 0 . 0 2 )。該試驗(yàn)設(shè)計(jì)采用單因素對(duì)照方法,控制變量包括巖石抗壓強(qiáng)度(固定為 5 5 M P a 、截割深度(固定為 8 0 m m 和工作環(huán)境溫度(固定為
)。變量設(shè)置方面,截割速度在
0 . 8 ~ 2 . 0 m / m i n 范圍內(nèi)以 0 . 2 m / m i n 為步長(zhǎng)變化,推進(jìn)速度在 1 . 0 ~ 2 . 0 m / m i n 范圍內(nèi)以 0 . 2 m / m i n 為步長(zhǎng)變化。智能控制系統(tǒng)參數(shù)配置如下:強(qiáng)化學(xué)習(xí)控制器的學(xué)習(xí)率 設(shè)為0.8,折扣因子 γ 設(shè)為0.95;模型預(yù)測(cè)控制器的預(yù)測(cè)時(shí)域
為50,控制時(shí)域
為10;多目標(biāo)協(xié)調(diào)控制中的效率權(quán)重初始值設(shè)為0.65。每組試驗(yàn)在恒定工況下持續(xù)運(yùn)行 3 0 m i n ,重復(fù)3次以保證數(shù)據(jù)可靠性。性能評(píng)價(jià)指標(biāo)包括掘進(jìn)效率
、單位能耗
軌跡跟蹤誤差L ( m m 、控制信號(hào)波動(dòng)率 ( % ) 和系統(tǒng)穩(wěn)態(tài)誤差 ( % ) 0
3.2試驗(yàn)結(jié)果與性能評(píng)估
本研究針對(duì)所提出的智能控制系統(tǒng)與傳統(tǒng)分層控制系統(tǒng)進(jìn)行了對(duì)比試驗(yàn),獲得了系統(tǒng)在不同工況下的性能數(shù)據(jù)。在典型工況(巖石抗壓強(qiáng)度 5 5 M P a /截割速度 1 . 6 m / m i n 推進(jìn)速度 1 . 4 m / m i n. 截割深度8 0 m m )下的性能對(duì)比結(jié)果見(jiàn)表1。
由表1可知,相較于傳統(tǒng)分層控制系統(tǒng),本研究提出的智能控制系統(tǒng)在各項(xiàng)性能指標(biāo)上均實(shí)現(xiàn)了顯著改善。具體而言,掘進(jìn)效率提升 1 8 . 1 % ,這主要源于強(qiáng)化學(xué)習(xí)算法能夠根據(jù)巖石硬度等工況特征自適應(yīng)優(yōu)化截割參數(shù);單位能耗降低 1 7 . 4 % ,驗(yàn)證了多自標(biāo)協(xié)調(diào)控制策略在效率與能耗之間達(dá)到了良好的平衡;軌跡跟蹤誤差減小 3 7 . 8 % ,控制信號(hào)波動(dòng)率降低了 4 9 . 2 % ,表明模型預(yù)測(cè)控制器具有優(yōu)異的軌跡跟蹤性能和控制信號(hào)平滑性;系統(tǒng)穩(wěn)態(tài)誤差降低了 5 3 . 8 % ,這對(duì)保證掘進(jìn)質(zhì)量和巷道成形精度具有重要意義。在 3 0 m i n 持續(xù)運(yùn)行測(cè)試中,系統(tǒng)各項(xiàng)性能指標(biāo)波動(dòng)范圍均控制在 ± 2 % 以?xún)?nèi),且3組重復(fù)試驗(yàn)的標(biāo)準(zhǔn)差小于 1 . 8 % ,充分驗(yàn)證了所提出控制方案的穩(wěn)定性和可靠性。
4結(jié)語(yǔ)
本研究針對(duì)掘進(jìn)機(jī)截割頭智能控制系統(tǒng)進(jìn)行了分析,提出了基于強(qiáng)化學(xué)習(xí)的截割參數(shù)優(yōu)化、模型預(yù)測(cè)控制策略設(shè)計(jì)及多目標(biāo)協(xié)調(diào)控制方法。試驗(yàn)結(jié)果表明,與傳統(tǒng)分層控制系統(tǒng)相比,本研究所設(shè)計(jì)的智能控制系統(tǒng)在掘進(jìn)效率、單位能耗、軌跡跟蹤等性能指標(biāo)上均有顯著改善,為提升掘進(jìn)裝備的智能化水平提供了有效技術(shù)支持。下一步,可以進(jìn)一步優(yōu)化控制算法,并開(kāi)展基于現(xiàn)場(chǎng)試驗(yàn)數(shù)據(jù)的模型建立和參數(shù)辨識(shí),同時(shí)關(guān)注截割頭的故障診斷與容錯(cuò)控制技術(shù),為掘進(jìn)機(jī)智能化升級(jí)提供更加完備的解決方案。
參考文獻(xiàn):
[1]高磊.懸臂式掘進(jìn)機(jī)自動(dòng)截割控制系統(tǒng)的優(yōu)化設(shè)計(jì)[J].石化技術(shù),2024,31(12):302-303.
[2]陳明.懸臂式掘進(jìn)機(jī)截割部恒功率調(diào)速控制系統(tǒng)研究[J].西部探礦工程,2024,36(12):132-134.
[3]李梅香.煤礦懸臂式掘進(jìn)機(jī)自動(dòng)截割控制系統(tǒng)的優(yōu)化設(shè)計(jì)[J].西部探礦工程,2024,36(12):86-88.
[4]王鵬江.基于多傳感信息的懸臂式掘進(jìn)機(jī)智能截割控制方法研究[D].北京:中國(guó)礦業(yè)大學(xué)(北京),2022.
[5]韓艷贊,史增芳.基于DSP+CPLD的懸臂式掘進(jìn)機(jī)智能控制系統(tǒng)設(shè)計(jì)[J].煤礦機(jī)械,2020,41(9):20-22.
[6]龐明.懸臂式掘進(jìn)機(jī)智能控制系統(tǒng)設(shè)計(jì)研究[J].中國(guó)石油和化工標(biāo)準(zhǔn)與質(zhì)量,2020,40(12):145-146.