王前進(jìn) 楊春雨 馬小平 張春富 彭思敏
主通風(fēng)機(jī)切換過程(Main fan switchover process,MFSP)被廣泛用來保證礦井的持續(xù)安全生產(chǎn)[1].礦井必須配有成對(duì)的主通風(fēng)機(jī),采用輪流運(yùn)行的工作模式.其中,運(yùn)行的一臺(tái)叫工作主通風(fēng)機(jī),另一臺(tái)叫備用主通風(fēng)機(jī).井下供給風(fēng)量作為主通風(fēng)機(jī)切換過程的關(guān)鍵運(yùn)行指標(biāo),對(duì)井下作業(yè)影響很大,因此有必要對(duì)其進(jìn)行實(shí)時(shí)監(jiān)測,保證主通風(fēng)機(jī)切換過程的平穩(wěn)運(yùn)行以提供充足的井下供給風(fēng)量.然而,由于惡劣的井下工作環(huán)境,取壓孔容易出現(xiàn)堵塞現(xiàn)象,導(dǎo)致無法實(shí)時(shí)準(zhǔn)確地監(jiān)測井下供給風(fēng)量狀態(tài).另外,堵塞的取壓孔必須等到大周期(一般半年或一年一次) 的主通風(fēng)機(jī)檢修才能進(jìn)行取壓孔的清理.因此有必要建立井下供給風(fēng)量的準(zhǔn)確可靠性模型,為礦井值守人員提供井下工作狀況和供給風(fēng)量信息.
目前井下供給風(fēng)量模型主要分為兩大類:機(jī)理模型和數(shù)據(jù)驅(qū)動(dòng)模型.主通風(fēng)機(jī)切換過程涉及到兩大動(dòng)力源的過渡,涉及到 4 個(gè)風(fēng)門的切換,涉及到井下供給風(fēng)流的控制等.因此,井下供給風(fēng)量機(jī)理模型包括:主通風(fēng)機(jī)模型可用其特性曲線來表示[2];對(duì)于風(fēng)門支路,首先通過數(shù)據(jù)擬合方法建立風(fēng)門風(fēng)阻與風(fēng)門開度之間的非線性關(guān)系,再采用定常[3-4]或非定常[5-6]不可壓縮Navier-Stokes 方程來建模;對(duì)于地下礦井,由于復(fù)雜多變的井下工作環(huán)境和錯(cuò)綜復(fù)雜的網(wǎng)絡(luò)布局以及頻繁變化的設(shè)備狀態(tài),難以建立模型.通常首先將其近似為一個(gè)長度確定的風(fēng)流支路,再采用類似于風(fēng)門支路的建模方法來建模.井下供給風(fēng)量模型是由上述主要結(jié)構(gòu)的子模型組成,通過基爾霍夫風(fēng)壓和風(fēng)流定律來建立.然而,由于機(jī)理模型一般是基于一定的理論假設(shè)而建立的,如地下礦井的近似化處理,實(shí)際主通風(fēng)機(jī)切換過程要遠(yuǎn)遠(yuǎn)復(fù)雜于機(jī)理模型,因此機(jī)理模型在實(shí)際主通風(fēng)機(jī)切換過程中往往難以應(yīng)用.數(shù)據(jù)驅(qū)動(dòng)的井下供給風(fēng)量建模方法,不需要掌握切換過程的復(fù)雜變化,僅利用數(shù)據(jù)就可以建立井下供給風(fēng)量的估計(jì)模型,因此數(shù)據(jù)驅(qū)動(dòng)井下供給風(fēng)量建模是目前主通風(fēng)機(jī)切換過程建模研究的熱點(diǎn).如,文獻(xiàn)[7]利用靜態(tài)工況下的井下供給風(fēng)量和風(fēng)門分支風(fēng)門風(fēng)阻的數(shù)據(jù),建立了基于RBF 神經(jīng)網(wǎng)絡(luò)的井下供給風(fēng)量模型.
近年,由于具有極快的學(xué)習(xí)速度,且能有效地解決傳統(tǒng)神經(jīng)網(wǎng)絡(luò)收斂速度慢、易陷入局部極小的問題,增量式隨機(jī)權(quán)網(wǎng)絡(luò)(Incremental random weight network,IRWN)已被廣泛用于復(fù)雜工業(yè)過程的建模[8-10].IRWN 本質(zhì)上是一種采用構(gòu)造算法得到的單隱層前饋神經(jīng)網(wǎng)絡(luò)(Single layer feedforward neural network,SLFNN),比傳統(tǒng)神經(jīng)網(wǎng)絡(luò)具有更簡單的結(jié)構(gòu)和更高的計(jì)算效率[11].針對(duì)IRWN 收斂性問題,文獻(xiàn)[12]通過對(duì)一類IRWN 進(jìn)行理論分析和仿真研究,得出一個(gè)結(jié)論:IRWN 的萬能逼近能力只有在一定的約束條件下才能得到保證.因此,尋找保證IRWN 收斂性的約束條件是建立IRWN 的關(guān)鍵.如,文獻(xiàn)[13]提出了一種基于不等式約束條件的隨機(jī)配置網(wǎng)絡(luò)(Stochastic configuration network,SCN),其不僅具有萬能逼近能力,而且具有較快的學(xué)習(xí)速度.與標(biāo)準(zhǔn)IRWN 相比,SCN 算法具有較快的學(xué)習(xí)速度和較高的模型精度,但是SCN 算法依然存在如下的問題:
問題.隨著隱含層節(jié)點(diǎn)數(shù)目的增加,SCN 算法可能存在過擬合和泛化性能差的問題.由于隱含層節(jié)點(diǎn)的增加,使得模型學(xué)習(xí)時(shí)結(jié)構(gòu)較復(fù)雜,致使模型對(duì)已知訓(xùn)練數(shù)據(jù)表現(xiàn)較好,而對(duì)未知數(shù)據(jù)具有較差的測試效果,造成過擬合的問題.由于過擬合的存在,使得模型魯棒性不足、泛化能力差,難以實(shí)際應(yīng)用.
另外,PLC 控制系統(tǒng)已廣泛應(yīng)用于主通風(fēng)機(jī)切換過程[14].由于受PLC 存儲(chǔ)空間、運(yùn)行效率等的限制,需要建立一個(gè)先進(jìn)的小尺寸網(wǎng)絡(luò)來減輕計(jì)算和存儲(chǔ)壓力.因此有必要建立高質(zhì)量、小尺寸的井下供給風(fēng)量估計(jì)模型.
針對(duì)上述問題,在SCN 算法的基礎(chǔ)上,結(jié)合正則化(Regularization,R)技術(shù),本文提出一種新型的改進(jìn)SCN 算法,即RSC 算法.該算法包含兩個(gè)版本:RSC-I 和RSC-II.兩個(gè)版本的算法在相同的不等式約束條件下隨機(jī)分配隱性參數(shù),但采用不同的方式計(jì)算輸出權(quán)重.RSC-I 算法通過求解局部正則化最小二乘問題來確定輸出權(quán)重,而RSC-II 算法采用全局正則化最小二乘法計(jì)算輸出權(quán)重.基準(zhǔn)回歸分析和工業(yè)實(shí)驗(yàn)表明:相比SCN 算法,本文方法不僅具有較高的建模精度和較好的泛化能力,而且還減輕了PLC 存儲(chǔ)和計(jì)算的壓力.
主通風(fēng)機(jī)切換過程如圖1 所示,由兩大動(dòng)力源的過渡、4 個(gè)風(fēng)門的切換2 部分組成.假設(shè)當(dāng)前工作主通風(fēng)機(jī)為一號(hào)主通風(fēng)機(jī),備用主通風(fēng)機(jī)為二號(hào)主通風(fēng)機(jī),那么一號(hào)主通風(fēng)機(jī)、完全關(guān)閉的一號(hào)水平風(fēng)門與二號(hào)垂直風(fēng)門、完全打開的一號(hào)垂直風(fēng)門和地下礦井共同構(gòu)成一個(gè)典型的礦井通風(fēng)系統(tǒng).主通風(fēng)機(jī)切換過程就是切斷一號(hào)主通風(fēng)機(jī)與地下礦井的連接,同時(shí)建立二號(hào)主通風(fēng)機(jī)與地下礦井的連接.礦井通常采用的主通風(fēng)機(jī)切換過程可描述如下:首先,啟動(dòng)二號(hào)主通風(fēng)機(jī),再打開二號(hào)垂直風(fēng)門和一號(hào)水平風(fēng)門;同時(shí),關(guān)閉二號(hào)水平風(fēng)門和一號(hào)垂直風(fēng)門;最后,直到4 個(gè)風(fēng)門完全到位后,才關(guān)閉一號(hào)主通風(fēng)機(jī).
圖1 主通風(fēng)機(jī)切換過程示意圖Fig.1 Diagram of a main fan switchover process
主通風(fēng)機(jī)切換時(shí),井下供給風(fēng)量是由兩臺(tái)主通風(fēng)機(jī)共同提供的,同時(shí)又受井下工作環(huán)境的影響,對(duì)實(shí)現(xiàn)主通風(fēng)機(jī)切換過程閉環(huán)優(yōu)化控制起著重要作用.井下供給風(fēng)量不僅是表征能耗水平和運(yùn)行狀況的重要指標(biāo),而且決定地下礦井工作環(huán)境質(zhì)量、采煤效率和礦井安全生產(chǎn).目前,國內(nèi)外對(duì)主通風(fēng)機(jī)切換過程閉環(huán)控制和運(yùn)行優(yōu)化的研究較少[15-17],并且這些研究成果嚴(yán)重依賴井下供給風(fēng)量的實(shí)時(shí)測量.但是在實(shí)際應(yīng)用中,由于井下供給風(fēng)流含有成分復(fù)雜的氣、液、固三相混合雜質(zhì),致使取壓孔容易發(fā)生堵塞,造成風(fēng)量測量裝置的測量效果不理想.因此,對(duì)井下供給風(fēng)量進(jìn)行有效估計(jì),不僅能為礦井值守人員提供信息來判斷主通風(fēng)機(jī)切換過程運(yùn)行狀態(tài)和井下工作狀況,而且有益于實(shí)現(xiàn)井下供給風(fēng)量的控制和運(yùn)行優(yōu)化.
主通風(fēng)機(jī)切換過程是一個(gè)極其復(fù)雜的過程.其中,包含氣、液、固三相混合雜質(zhì)的井下供給風(fēng)流耦合交錯(cuò),同時(shí)井下工作環(huán)境極其惡劣;地下礦井局部通風(fēng)機(jī)的啟停和井下控制氣流的風(fēng)門狀態(tài)以及作業(yè)人員的變動(dòng),運(yùn)行工況不穩(wěn)定;各類采礦活動(dòng)(回采工作面、電池和燃料充電站、礦石破碎站等)中,污染物產(chǎn)生的速度及其質(zhì)量的變化,運(yùn)行工況動(dòng)態(tài)時(shí)變.這些導(dǎo)致了難以建立準(zhǔn)確可靠的主通風(fēng)機(jī)切換過程模型.
表1 列出了主通風(fēng)機(jī)切換過程的相關(guān)變量.從圖1 可知,影響井下供給風(fēng)量指標(biāo)的關(guān)鍵過程變量為:H1d、H2d、R1c、R1s、R2c、R2s、R0.下面對(duì)上述7 個(gè)變量進(jìn)行具體地分析.
表1 主通風(fēng)機(jī)切換過程相關(guān)變量Table 1 Related variables in the MFSP
1)一號(hào)主通風(fēng)機(jī)壓頭H1d和二號(hào)主通風(fēng)機(jī)壓頭H2d對(duì)井下供給風(fēng)量Q0的影響
對(duì)于主通風(fēng)機(jī),在額定轉(zhuǎn)速下,其風(fēng)壓Hf可描述為主通風(fēng)機(jī)風(fēng)量Qf的函數(shù).根據(jù)該主通風(fēng)機(jī)特性曲線[18],一般將這個(gè)函數(shù)描述為如下二次多項(xiàng)式:
式中,a0,a1和a2為待定常數(shù),根據(jù)風(fēng)機(jī)特性曲線進(jìn)行確定.
根據(jù)風(fēng)機(jī)定律[19],轉(zhuǎn)速N所對(duì)應(yīng)的主通風(fēng)機(jī)風(fēng)壓H可以寫成:
式中,Nf為額定轉(zhuǎn)速,Q為轉(zhuǎn)速N所對(duì)應(yīng)的主通風(fēng)機(jī)風(fēng)量.
從式(2)可知,當(dāng)轉(zhuǎn)速已知時(shí),通過主通風(fēng)機(jī)風(fēng)壓可以得到對(duì)應(yīng)的主通風(fēng)機(jī)風(fēng)量.因此,對(duì)于轉(zhuǎn)速可測的兩臺(tái)主通風(fēng)機(jī),可得:
式中,f1(·) 和f2(·) 為確定的非線性函數(shù).
根據(jù)基爾霍夫風(fēng)流定律[20],從圖1 可得:
由式(3),(4)和式(5)可知,H1d的變化會(huì)引起Q1c的變化;同時(shí)當(dāng)H2d發(fā)生變化時(shí),Q2c也將隨之發(fā)生改變.另外,由式(6)可知,Q0是由Q1c和Q2c共同決定的.因此,H1d和H2d對(duì)井下供給風(fēng)量Q0產(chǎn)生重要影響.
2) 風(fēng)門支路風(fēng)門風(fēng)阻R1c,R1s,R2c和R2s對(duì)井下供給風(fēng)量Q0的影響
由Darcy-Weisbach 方程可知,風(fēng)道壓降與通過風(fēng)道的風(fēng)量之間的函數(shù)關(guān)系是非線性的[2].根據(jù)文獻(xiàn)[21-22],可將這個(gè)函數(shù)關(guān)系寫成:
式中,Hic和His分別為主通風(fēng)機(jī)垂直風(fēng)門和水平風(fēng)門壓降,i為主通風(fēng)機(jī).
由于Hic和His可看作i號(hào)主通風(fēng)機(jī)的負(fù)載,因此它們是由Hid提供的.另外,由式(7)可知,風(fēng)量和風(fēng)阻之間呈現(xiàn)非線性關(guān)系.那么上式可寫成:
式中,η(·) 為非線性函數(shù).
由式(4),(5)和式(8)可知,風(fēng)門風(fēng)阻R1s,R1c,R2c和R2s是影響風(fēng)量Q1s,Q1c,Q2c和Q2s的重要因素.再結(jié)合式(6)可知,上述風(fēng)阻是影響井下供給風(fēng)量Q0的關(guān)鍵過程變量.
3)井下風(fēng)阻R0對(duì)井下供給風(fēng)量Q0的影響
對(duì)于地下礦井,壓降H0與風(fēng)阻R0之間呈現(xiàn)出明顯的非線性特征.用公式描述為:
H0可視為兩臺(tái)主通風(fēng)機(jī)的負(fù)載,其數(shù)值由H1d和H2d共同決定.主通風(fēng)機(jī)切換過程中,R0是不需要進(jìn)行調(diào)節(jié)的,但會(huì)受到一些因素的影響.例如,井下工作人員的變動(dòng),井下控制氣流的風(fēng)門狀態(tài),井下作業(yè)狀況等.上述這些因素都會(huì)引起R0的變化.根據(jù)式(9) 可知,R0的變化會(huì)引起井下供給風(fēng)量Q0的改變.
綜上所述,將主通風(fēng)機(jī)壓頭H1d和H2d、風(fēng)門風(fēng)阻R1s,R1c,R2c和R2s、井下風(fēng)阻R0作為建模輸入變量,就可以實(shí)現(xiàn)井下供給風(fēng)量Q0的估計(jì).這個(gè)非線性映射可描述為:
式中,φ(·) 為未知的非線性函數(shù).
SCN 開始于一個(gè)小尺寸的SLFNN,首先在一個(gè)不等式約束條件下,逐個(gè)選取隱含層節(jié)點(diǎn),同時(shí)自適應(yīng)地選擇隱性參數(shù)的范圍;然后,利用全局最小二乘法確定當(dāng)前網(wǎng)絡(luò)的輸出權(quán)重;最后,直到達(dá)到設(shè)定的最大隱含層節(jié)點(diǎn)數(shù)目或期望的網(wǎng)絡(luò)精度時(shí)結(jié)束隱含層節(jié)點(diǎn)的增加.
令 Γ :={g1,g2,g3,···} 表示一組實(shí)值函數(shù),span(Γ)表示 Γ 張成的函數(shù)空間;令L2(D) 表示定義在D?Rd上 的所有勒貝格可測函數(shù)f=[f1,f2,···,fm]:Rd→Rm的空間.
給定一個(gè)目標(biāo)函數(shù)f:Rd→Rm,假設(shè)存在一個(gè)建立好的帶有L-1 個(gè)隱含層節(jié)點(diǎn)的SLFNN,那么SLFNN 的輸出可表示為:
式中,L=1,2,···,wj和bj分別為第j個(gè)隱含層節(jié)點(diǎn)的輸入權(quán)值和偏置,βj=[βj1,βj2,···,βjm]T為連接第j個(gè)隱含層節(jié)點(diǎn)與輸出層節(jié)點(diǎn)的輸出權(quán)值,gj為第j個(gè)隱含層節(jié)點(diǎn)的激活函數(shù).
根據(jù)式(11),可以得到當(dāng)前網(wǎng)絡(luò)殘差eL-1:
SCN 算法構(gòu)造一個(gè)不等式約束條件來增加第L個(gè)隱含層節(jié)點(diǎn),其不等式約束的形式如下:
式中,?g∈Γ,bg∈R+,使得0<||g||<bg成立,δL的形式為:
式中,0<r<1,uL滿足 l imL→+∞uL=0 和0<uL≤(1-r).
SCN 中表現(xiàn)最好的SCN-III 算法采用全局最小二乘法來計(jì)算輸出權(quán)重:
SCN 中表現(xiàn)最好的SCN-III 算法采用上述方式進(jìn)行隱含層節(jié)點(diǎn)的逐個(gè)增加,直到滿足設(shè)定的條件.
與標(biāo)準(zhǔn)隨機(jī)權(quán)神經(jīng)網(wǎng)絡(luò)(Random vector functional-link networks,RVFLNs) 相比,正則化RVFLNs 不僅能有效避免過擬合問題,而且能通過減小輸出權(quán)重來降低模型復(fù)雜性.
式中,?i為網(wǎng)絡(luò)殘差,C為正則化系數(shù).通過正則化最小二乘法直接計(jì)算輸出權(quán)重β,具體結(jié)果如下:
式中,H=[g1,g2,···,gL],Y=[t1,t2,···,tN]T.
給定神經(jīng)網(wǎng)絡(luò)訓(xùn)練樣本 (x,t),其中,x={x1,x2,···,xN},xi=[xi,1,xi,2,···,xi,d]T∈Rd,t={t1,t2,···,tN},ti=[ti,1,ti,2,···,ti,m]T∈Rm,假設(shè)已經(jīng)搭建一個(gè)帶有L-1 個(gè)隱含層節(jié)點(diǎn)的SLFNN,那么可以得到當(dāng)前網(wǎng)絡(luò)的輸出權(quán)重:
接下來,需要構(gòu)造一個(gè)方案來分配隱性參數(shù),并計(jì)算輸出權(quán)重βL,使得建立的帶有L個(gè)隱含層節(jié)點(diǎn)的SLFNN 具有更高的模型精度.因此,引入如下目標(biāo)代價(jià)函數(shù):
將式(19) 兩邊同時(shí)對(duì)βL求導(dǎo),再結(jié)合eL=eL-1-βLgL,可得:
注 1.從式(19)可知,正則化系數(shù)C起到平衡的作用,在保證模型精度的同時(shí),降低了復(fù)雜度,因此需要對(duì)其進(jìn)行適當(dāng)選擇.本文通過簡單的一維搜索程序來確定合適的正則化系數(shù)C.從定理 1 可知,對(duì)于給定合適的C,RSC 算法不僅保留了SCN 算法收斂速度快的優(yōu)點(diǎn),而且能有效地克服過擬合問題.
注 2.從式(38)可知,正則化系數(shù)C控制和之間的平衡.另外,不等式約束(37)的作用是增大網(wǎng)絡(luò)殘差函數(shù)的下降量,從而加快算法的收斂速度.因此,定理2 所對(duì)應(yīng)的RSC 算法不僅能有效抑制過擬合現(xiàn)象,而且具有較快的收斂速度.
定理 1 和定理2 分別對(duì)應(yīng)本文提出的RSC 算法的兩個(gè)版本,即RSC-I 算法和RSC-II 算法.由于RSC-II 算法比RSC-I 算法具有更快的收斂速度,因此本文著重給出RSC-II 算法的實(shí)現(xiàn)步驟.
式中,hL(x) 為第L個(gè)隱含層節(jié)點(diǎn)輸出.那么當(dāng)前網(wǎng)絡(luò)的隱含層輸出矩陣可寫為HL=[h1,h2,···,hL].
為簡單起見,引入一組變量ξL,q,q=1,2,···,m.其表達(dá)式如下:
RSC-II 算法流程:
給定神經(jīng)網(wǎng)絡(luò)的訓(xùn)練樣本 (x,t),其中,x={x1,x2,···,xN},xi∈Rd,t={t1,t2,···,tN},ti∈Rm;最大隱含層節(jié)點(diǎn)數(shù)為Lmax,期望精度為?,隨機(jī)配置的最大次數(shù)為Tmax; 選擇一組正的標(biāo)量Υ={λmin:Δλ:λmax}.
步驟 1.神經(jīng)網(wǎng)絡(luò)的初始化階段:令e0:=[t1,t2,···,tN]T,給定C>0,一個(gè)充分小的正實(shí)數(shù)ε給定 1-ε<r<1,兩個(gè)空集:Ω andW;
步驟 2.神經(jīng)網(wǎng)絡(luò)的訓(xùn)練階段:隨機(jī)參數(shù)配置和輸出權(quán)重計(jì)算.
當(dāng)L≤Lmax和||e0||F >?時(shí),
隨機(jī)參數(shù)配置:
為驗(yàn)證所提RSC-II 算法的有效性,與SCNIII[13]算法進(jìn)行比較分析.為保證實(shí)驗(yàn)結(jié)果的可靠性,選擇一個(gè)函數(shù)近似、四個(gè)基準(zhǔn)數(shù)據(jù)集和一組主通風(fēng)機(jī)切換過程數(shù)據(jù)作為仿真對(duì)象.所有仿真實(shí)驗(yàn)在MATLAB 2016a 中進(jìn)行,使用CPU 為i5,3.4 GHz,內(nèi)存為8 GB RAM 的PC 機(jī).選擇Sigmoid 函數(shù)g(x)=1/(1+exp(-x))作為兩種算法隱含層節(jié)點(diǎn)的激活函數(shù).將神經(jīng)網(wǎng)絡(luò)的輸入輸出數(shù)據(jù)歸一化到區(qū)間[0,1].
在一定的噪聲水平下對(duì)兩種算法進(jìn)行評(píng)價(jià).選擇均方根誤差(Root mean square error,RMSE)作為評(píng)價(jià)算法泛化能力的指標(biāo).每組進(jìn)行20 次試驗(yàn),選擇20 次試驗(yàn)的平均值(Mean) 和標(biāo)準(zhǔn)差(Standard deviation,STD)作為最終結(jié)果.隨機(jī)參數(shù)的最大配置次數(shù)為Lmax=200,網(wǎng)絡(luò)精度取值為?=0.01.其他相關(guān)參數(shù)的設(shè)定將在具體的仿真實(shí)驗(yàn)中給出.
考慮一個(gè)函數(shù)近似[23]問題:
式中,x∈[0,1].
由rand(0,1)隨機(jī)產(chǎn)生1 000 個(gè)數(shù)據(jù)作為訓(xùn)練樣本,由linspace(0,1,300)等間隔生成300 個(gè)數(shù)據(jù)組成測試樣本.為驗(yàn)證所提RSC-II 算法能有效克服過擬合問題,需要對(duì)訓(xùn)練數(shù)據(jù)進(jìn)行預(yù)處理,即在訓(xùn)練樣本中添加一定比例的異常值.訓(xùn)練樣本中異常值的比例為 5 %,其形式為:
式中,yi∈[0,1] 為歸一化訓(xùn)練樣本的第i個(gè)輸出,i從 [1,2,···,N] 中隨機(jī)選取,r and(0,1) 為 (0,1) 之間的隨機(jī)數(shù).
由式 (37) 和式(38)可知,正則化系數(shù)C嚴(yán)重影響算法的學(xué)習(xí)精度,C的選擇可以提高精度,也可以降低精度.為顯示C對(duì)網(wǎng)絡(luò)性能的影響,針對(duì)不同的C,對(duì)RSC-II 算法進(jìn)行仿真.C在集合{2-20,2-19,···,20,···,219,220}中依次取值,一共有41個(gè)數(shù)值.同時(shí)設(shè)定λmin=100,Δλ=1,Lmax=50.從圖2 可以看出,C越小,RSC-II 算法的訓(xùn)練能力越差,對(duì)測試能力亦是如此.當(dāng)C大于20時(shí),與SCN-III 算法相比,RSC-II 算法顯示出更好的測試性能.另外,對(duì)于一個(gè)合適的正則化系數(shù)C,在相同的訓(xùn)練精度下,RSC-II 算法比SCN-III 算法具有更高的測試精度.因此,在建立網(wǎng)絡(luò)時(shí),需要確定合適的系數(shù)C.那么在下面的仿真實(shí)驗(yàn)中,RSC-II 算法使用合適的正則化系數(shù)C.
圖2 不同 C 下RSC-II 和SCN-III 算法對(duì)函數(shù)近似的訓(xùn)練與測試精度結(jié)果對(duì)比Fig.2 The result comparison of training and testing accuracy of RSC-II and SCN-III on function approximation with varying C
圖3 (a)為包含 5 % 異常值的1 000 個(gè)訓(xùn)練樣本,圖3 (b)為兩種算法對(duì)測試數(shù)據(jù)集的測試性能.可以看出,相比于SCN-III 算法,RSC-II 算法具有更好的擬合能力.從圖4 可知,RSC-II 算法總是獲得比SCN-III 算法更低的測試RMSE.隨著隱含層節(jié)點(diǎn)數(shù)目的增加,RSC-II 的泛化能力得到提高或者基本保持不變,而SCN-III 的性能變差.這是因?yàn)镾CN-III 算法始終存在過擬合問題,并且隨著隱含層節(jié)點(diǎn)的增加,過擬合問題更加嚴(yán)重.RSC-II 算法通過引入正則化系數(shù)用于平衡近似精度和模型復(fù)雜度,可有效避免過擬合問題.表2 給出了兩種算法的具體實(shí)驗(yàn)結(jié)果.
表2 函數(shù)近似的性能比較Table 2 Performance comparisons on the function approximation
圖3 (a)包含5 %異常值的1 000 個(gè)函數(shù)近似訓(xùn)練樣本和目標(biāo)函數(shù);(b)兩種算法對(duì)測試數(shù)據(jù)的近似性能Fig.3 (a) 1 000 training samples containing 5 % outliers for function approximation and target function;(b) Approximation performance on the test dataset by two learning algorithms
圖4 平均兩種算法在測試數(shù)據(jù)集上的測試RMSEFig.4 Average testing RMSE of the two algorithms on the test dataset
為進(jìn)一步驗(yàn)證所提RSC-II 算法的有效性,選取UCI 數(shù)據(jù)庫[24]中的四個(gè)數(shù)據(jù)集進(jìn)行實(shí)驗(yàn).相關(guān)數(shù)據(jù)集的信息和參數(shù)設(shè)置如表3 所示.采用類似于函數(shù)近似問題中的策略進(jìn)行訓(xùn)練數(shù)據(jù)預(yù)處理.首先,從歸一化訓(xùn)練數(shù)據(jù)中隨機(jī)選取 5 % 的樣本;然后,通過式 (47) 對(duì)選中的數(shù)據(jù)進(jìn)行預(yù)處理.
表3 回歸數(shù)據(jù)集與參數(shù)設(shè)置Table 3 Specifications of benchmark problems and some parameter settings
從圖5 可以看出,隨著隱含層節(jié)點(diǎn)數(shù)的增加,SCN-III 算法的測試集RMSE 呈現(xiàn)明顯上升趨勢,而RSC-II 算法的測試集RMSE 趨于平穩(wěn),因此SCN-III 算法出現(xiàn)過擬合現(xiàn)象,而RSC-II 算法未出現(xiàn)過擬合問題.這是因?yàn)殡S著隱含層節(jié)點(diǎn)數(shù)的增加,神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)變得過于復(fù)雜,使得SCN-III 算法出現(xiàn)過擬合問題,對(duì)測試數(shù)據(jù)表現(xiàn)較差.由于RSCIII 算法引入的正則化系數(shù)C起到了平衡模型復(fù)雜度與擬合精度的作用,避免了過擬合問題,對(duì)測試數(shù)據(jù)具有較好的測試效果.兩種算法的具體實(shí)驗(yàn)結(jié)果如表4 所示,其中,(a)、(b)、(c)、(d)分別為Wine Quality、Concrete、Yacht、Airfoil Self-noise 數(shù)據(jù)集.
表4 對(duì)基準(zhǔn)數(shù)據(jù)集的性能對(duì)比Table 4 Performance comparisons on benchmark datasets
圖5 不同 Lmax 下RSC-II 和SCN-III 算法對(duì)基準(zhǔn)數(shù)據(jù)集的測試RMSE 對(duì)比Fig.5 Test RMSE comparison of the RSC-II and SCN-III algorithms on four benchmark datasets with differentLmax
前面兩個(gè)小節(jié)的實(shí)驗(yàn)仿真驗(yàn)證了所提RSC-II算法的有效性,本小節(jié)將其在實(shí)際主通風(fēng)機(jī)切換過程進(jìn)行井下供給風(fēng)量估計(jì).在實(shí)際工業(yè)現(xiàn)場采集1 500 個(gè)樣本作為建模的輸入輸出數(shù)據(jù),其中選擇1 400 個(gè)樣本作為訓(xùn)練數(shù)據(jù),其余100 個(gè)樣本作為測試數(shù)據(jù).采用前面兩個(gè)小節(jié)中類似的方式對(duì)訓(xùn)練數(shù)據(jù)進(jìn)行預(yù)處理,λmin值設(shè)定為1,Δλ也取值為1.
從圖6 可以看出,RSC-II 算法的泛化能力始終優(yōu)于SCN-III 算法的泛化能力.當(dāng)隱含層節(jié)點(diǎn)數(shù)為50 時(shí),兩種算法的性能比較相近.隨著隱含層節(jié)點(diǎn)數(shù)的增加,RSC-II 算法測試集的RMSE 始終保持在較低的水平,而SCN-III 算法測試集的RMSE 上升趨勢明顯.因此,相對(duì)于RSC-II 算法,SCN-III算法出現(xiàn)了較為明顯的過擬合現(xiàn)象.其原因在于當(dāng)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)變得尤為復(fù)雜時(shí),SCN-III 缺乏應(yīng)對(duì)的能力,從而導(dǎo)致泛化能力差、魯棒性不足的問題.引入了正則化系數(shù)C的RSC-II 算法對(duì)模型精度和復(fù)雜度進(jìn)行折中,在保證精度的同時(shí),降低了模型復(fù)雜度.表5 列出了兩種算法實(shí)現(xiàn)的具體實(shí)驗(yàn)結(jié)果.
表5 在實(shí)際MFSP 數(shù)據(jù)集上的性能對(duì)比Table 5 Performance comparisons on the actual MFSP dataset
圖6 平均兩種算法在實(shí)際MFSP 數(shù)據(jù)集上的測試RMSEFig.6 Average testing RMSE of the two algorithms on the actual MFSP dataset
圖7 給出了在Lmax=50 時(shí)兩種算法的測試性能.可以看出,相比于SCN-III 算法,RSC-II 算法的估計(jì)值能很好地?cái)M合實(shí)際值,模型精度較高.綜上,采用RSC-II 方法建立的井下供給風(fēng)量估計(jì)模型可以以很高的精度對(duì)建模數(shù)據(jù)進(jìn)行擬合,尤其是可以避免過擬合問題.另外,隨著主通風(fēng)機(jī)切換過程樣本數(shù)據(jù)的增多,需要適當(dāng)?shù)卦黾与[含層節(jié)點(diǎn)數(shù).結(jié)果表明,基于RSC-II 的建模算法在隱含層節(jié)點(diǎn)數(shù)為170 時(shí)仍表現(xiàn)出良好的泛化性能和預(yù)測精度.因此,本文所提方法能夠用于主通風(fēng)機(jī)切換過程實(shí)現(xiàn)井下供給風(fēng)量的建模.
圖7 Lmax=50 所對(duì)應(yīng)的MFSP 數(shù)據(jù)集的測試性能:(a) SCN-III;(b) RSC-IIFig.7 Test performance at Lmax=50 on the actual MFSP dataset:(a) SCN-III;(b) RSC-II
針對(duì)SCN 算法建模時(shí)存在過擬合和泛化能力差的問題,本文結(jié)合正則化技術(shù),提出一種新型的RSC 算法,用于建立主通風(fēng)機(jī)切換過程井下供給風(fēng)量的估計(jì)模型.與SCN 算法相比,建立的RSC-II模型不僅具有更高的模型精度,而且具有更好的泛化能力.尤為重要的是RSC-II 算法可以有效避免SCN 算法存在的過擬合問題.同時(shí),RSC-II 算法具有與SCN 算法相同的小尺寸特性.因此,基于所提算法建立的模型具有尺寸小、魯棒性強(qiáng)、泛化性能好的優(yōu)點(diǎn),能夠應(yīng)用到實(shí)際主通風(fēng)機(jī)切換過程進(jìn)行井下供給風(fēng)量估計(jì).