張雷,李金學(xué),堵勁松,李龍飛,鄒嚴(yán)頡,張二強(qiáng),李善蓮
1.鄭州輕工業(yè)大學(xué) 電氣信息工程學(xué)院,河南 鄭州 450001;2.中國煙草總公司鄭州煙草研究院,河南 鄭州 450001;3.河南中煙工業(yè)有限責(zé)任公司 技術(shù)中心,河南 鄭州 450000;4.陜西中煙工業(yè)有限責(zé)任公司 技術(shù)中心,陜西 西安 710065
葉絲干燥是卷煙制絲生產(chǎn)的核心工序,卷煙成品的品質(zhì)控制十分重要,其任務(wù)是改善煙絲物理特性、提高感官品質(zhì)。滾筒烘絲機(jī)是葉絲干燥的關(guān)鍵加工設(shè)備,煙絲經(jīng)入料口定量進(jìn)入烘絲筒內(nèi),滾筒轉(zhuǎn)動向前傳送物料,在加熱筒壁和熱風(fēng)的共同作用下,經(jīng)一系列復(fù)雜的物理化學(xué)變化,將煙絲干燥至含水率符合規(guī)范要求。筒壁溫度是過程控制的重要參數(shù),由于滾筒式烘絲機(jī)特殊的設(shè)備結(jié)構(gòu)和密閉生產(chǎn)空間,實際筒壁溫度難以直接在線檢測和控制,造成葉絲含水率的波動,進(jìn)而影響卷煙品質(zhì)。
目前,常見的烘絲干燥過程建模研究方法是機(jī)理模型[1],該方法從化學(xué)、熱工等角度構(gòu)建物質(zhì)反應(yīng)場,對滾筒內(nèi)部的物料運動和溫度場分布進(jìn)行仿真,但機(jī)理模型大多建立在理想條件下,且需要專家經(jīng)驗積累,難以適應(yīng)復(fù)雜多變的工況。數(shù)據(jù)驅(qū)動建模方法無需任何專家經(jīng)驗,僅依賴工業(yè)過程數(shù)據(jù)質(zhì)量,借助人工智能技術(shù)飛速發(fā)展,該方法引起了國內(nèi)外學(xué)者高度關(guān)注[2]。數(shù)據(jù)驅(qū)動建模方法主要有神經(jīng)網(wǎng)絡(luò)(Artificial Neutral Network,ANN)、支持向量機(jī)(Support Vector Machine,SVM)、極限學(xué)習(xí)機(jī)(Extreme Learning Machine,ELM)等[3-4]。神經(jīng)網(wǎng)絡(luò)具備強(qiáng)大的泛化能力,能夠以任意精度逼近復(fù)雜連續(xù)函數(shù),特別適用于解決復(fù)雜工業(yè)過程的非線性建模問題,在鋼鐵、冶金、建材等流程工業(yè)應(yīng)用廣泛。一般神經(jīng)網(wǎng)絡(luò)建模多基于穩(wěn)態(tài)工況假設(shè),然而烘絲干燥過程是一類穩(wěn)態(tài)、非穩(wěn)態(tài)交替出現(xiàn)的動態(tài)工況,傳統(tǒng)方法缺乏對工業(yè)數(shù)據(jù)動態(tài)特征處理能力,建立的軟測量模型存在一定局限性。
循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)[5-6]是具備內(nèi)部反饋結(jié)構(gòu)的動態(tài)神經(jīng)網(wǎng)絡(luò)算法,在處理時序信號上具有顯著優(yōu)勢,廣泛應(yīng)用于語音識別、動態(tài)建模、故障診斷中。經(jīng)典RNN一般采用跨時間梯度反向傳播算法(Back Propagation Through Time,BPTT) 優(yōu)化模型參數(shù),然而很容易產(chǎn)生梯度消失或爆炸及長期依賴問題。為解決上述難題,國外學(xué)者提出了長短期記憶單元(Long Short Time Memory,LSTM)[7-9]和門控循環(huán)單元(Gated Recurrent Unit,GRU)[10-13],通過設(shè)計門函數(shù)調(diào)節(jié)內(nèi)部神經(jīng)元的信息交流,從而更易捕捉時序數(shù)據(jù)中的長期依賴關(guān)系。
基于此,本文擬提出一種基于深度門控循環(huán)單元(Deep Gated Recurrent Unit,DGRU)網(wǎng)絡(luò)的烘絲機(jī)建模新方法。該方法在數(shù)據(jù)預(yù)處理和特征選擇基礎(chǔ)上,通過堆疊門控循環(huán)單元網(wǎng)絡(luò)提取制絲數(shù)據(jù)中深層非線性動態(tài)特征,以端對端方式實現(xiàn)筒壁溫度動態(tài)預(yù)測,以期解決烘絲干燥過程中筒壁溫度難以準(zhǔn)確進(jìn)行在線測量的問題。
在烘絲機(jī)生產(chǎn)過程中,采集了物料流量(X1)、入口物料含水率(X2)、HT蒸汽壓力(X3)、蒸汽流量(X4)、烘絲累積量(X5)、入口實際水分(X6)、工作蒸汽壓力(X7)、區(qū)域1冷凝水溫度(X8)、區(qū)域2冷凝水溫度(X9)、熱風(fēng)溫度(X10)、熱風(fēng)速度(X11)、罩壓力(X12)、烘絲出口溫度(X13)這13個過程變量。由于筒體傾斜且不斷旋轉(zhuǎn),現(xiàn)場儀表和傳感器采集數(shù)據(jù)不可避免地含有一定量的隨機(jī)噪聲和離群點,工業(yè)原始數(shù)據(jù)品質(zhì)通常較差,影響模型預(yù)測精度。為了保證軟測量模型的可靠性,有必要對采集的數(shù)據(jù)作預(yù)處理,主要包括離群點剔除、小波去噪及歸一化處理。
制絲生產(chǎn)現(xiàn)場采集的葉絲干燥數(shù)據(jù)容易受到各種形式干擾(如傳感器故障、過程擾動、狀態(tài)漂移等),故采用基于小波變換的去噪方法消除數(shù)據(jù)隨機(jī)噪聲,如下式所示:
f(t)=s(t)+σ·e(t)
其中s(t)為原始信號,f(t)為含噪聲信號,e(t)為噪聲,σ為噪聲標(biāo)準(zhǔn)差。小波變換去噪的主要目的是抑制信號中的高頻噪聲,從而在f(t)中恢復(fù)真實信號s(t),包括小波分解、高頻系數(shù)的閾值量化處理、信號重構(gòu)3個步驟,其中小波變換參數(shù)選擇“Sqtwolog”基函數(shù)。
以入口物料含水率為例,預(yù)處理對比效果如圖1所示。由圖1可知,采用小波去噪后,在保持?jǐn)?shù)據(jù)主趨勢同時,能夠減少曲線毛刺,提高建模樣本質(zhì)量。
圖1 物料含水率預(yù)處理效果Fig.1 Preprocess result of material moisture content
烘絲機(jī)干燥過程變量(控制參數(shù)和狀態(tài)變量)存在一定相關(guān)性和冗余性,如果建模中直接采用全部變量,容易增加模型復(fù)雜度,導(dǎo)致預(yù)測準(zhǔn)確率下降和收斂速度緩慢。因此,本文采用最大相關(guān)最小冗余算法(Maximum Relevance and Minimum Redundancy,mRMR)[14],選擇與筒壁溫度相關(guān)性最強(qiáng)的特征作為模型初始輸入變量。集合S中變量X和輸出Y的最大相關(guān)性定義為:
其中,S為集合中變量個數(shù),原始變量間可能存在一定冗余性,因此,最小冗余定義為:
則最終目標(biāo)函數(shù)為:
maxφ(D,R)=D-R
式中φ代表變量相關(guān)性較大同時與其他特征相似性較小的特征。實踐中常采用增量式策略搜索最優(yōu)特征集合。
烘絲干燥過程運行工況復(fù)雜多變,傳統(tǒng)淺層GRU網(wǎng)絡(luò)特征提取能力有限,難以準(zhǔn)確反映實際工況動態(tài)變化。本文通過堆疊GRU提取工業(yè)數(shù)據(jù)中深層非線性動態(tài)特征,將其輸入全連接層用于估計筒壁溫度。GRU 是一種特殊的RNN單元,在RNN基礎(chǔ)上添加更新門zt和重置門rt,通過門控單元控制內(nèi)部神經(jīng)元信息傳輸。相對于LSTM算法,GRU網(wǎng)絡(luò)參數(shù)更少,在保證預(yù)測精度前提下,提高收斂速度。GRU網(wǎng)絡(luò)基本結(jié)構(gòu)如圖2所示。
圖2 GRU網(wǎng)絡(luò)基本結(jié)構(gòu)Fig.2 The structure of GRU network
在GRU中,對應(yīng)t時刻隱層的輸入xt,更新門zt,重置門rt,隱層輸出ht,上一時刻隱層輸出的計算方式如下所示:
堆疊GRU網(wǎng)絡(luò)提取烘絲機(jī)運行數(shù)據(jù)中隱含的動態(tài)信息后,將其作為輸入變量送入全連接層網(wǎng)絡(luò),用于建立輔助變量與筒壁溫度之間的預(yù)測模型,以端對端方式實現(xiàn)筒壁溫度在線預(yù)測。全連接層網(wǎng)絡(luò)定義如下:
oi=g(Wihi+bi)
其中,oi和hi分別代表第i個全連接層的輸出和輸入,Wi和bi代表第i個全連接層的權(quán)值和偏置。
基于DGRU的筒壁溫度動態(tài)預(yù)測算法流程如圖3所示,離線訓(xùn)練和在線預(yù)測步驟如下。
圖3 基于DGRU的筒壁溫度動態(tài)預(yù)測算法流程Fig.3 Flow chart of cylinder wall temperature prediction by DGRU Algorithm
離線訓(xùn)練:
1)采集現(xiàn)場工業(yè)數(shù)據(jù),進(jìn)行預(yù)處理;
2)采用mRMR方法進(jìn)行特征選擇,確定最佳輸入變量;
3)確定合適的延遲時間,進(jìn)行輸入變量時序重構(gòu);
4)確定模型結(jié)構(gòu)和參數(shù),將時序數(shù)據(jù)按一定比例劃分為訓(xùn)練集和測試集;
5)DGRU算法中采用雙層網(wǎng)絡(luò)結(jié)構(gòu),其中激活函數(shù)為tanh,并采用BTTP算法對DGRU模型進(jìn)行訓(xùn)練;
6)確定全連接層網(wǎng)絡(luò)參數(shù),采用梯度下降法訓(xùn)練,若精度滿足要求則訓(xùn)練結(jié)束,否則重復(fù)步驟5)。
在線預(yù)測:
7)對任意測試數(shù)據(jù)進(jìn)行預(yù)處理、特征選擇、時序重構(gòu)操作;
8)基于已訓(xùn)練的DGRU模型,計算模型輸出;
9)反歸一化目標(biāo)輸出值,獲取最終預(yù)測值。
以河南中煙工業(yè)有限責(zé)任公司的兩段式滾筒烘絲機(jī)(簡稱烘絲機(jī)) 為實驗對象,烘絲機(jī)以一定傾斜角(1.5°~5°)轉(zhuǎn)動運行,煙絲在滾筒前滾動前進(jìn),直到出料口落下。物料向前傳送,蒸汽在壓力輸送下,從主管路由旋轉(zhuǎn)接頭進(jìn)入烘絲機(jī),一路進(jìn)入烘筒內(nèi)熱交換裝置,另一路進(jìn)入熱風(fēng)系統(tǒng)的空氣加熱器,熱風(fēng)由管道輸送到前室進(jìn)入烘筒,與煙絲充分接觸。煙絲在蒸汽加熱的筒壁和熱風(fēng)的共同作用下,完成葉絲干燥。
從現(xiàn)場DCS數(shù)據(jù)庫中采集2020年1月2日至2020年2月28日生產(chǎn)數(shù)據(jù)進(jìn)行仿真實驗,在實際干燥工藝中,一般更注重烘絲機(jī)區(qū)域1的溫度控制,因此本文以區(qū)域1溫度作為模型輸出。此外,原始葉絲干燥數(shù)據(jù)包括料頭、料尾段,這些數(shù)據(jù)不利于建模,因此選取穩(wěn)定生產(chǎn)階段數(shù)據(jù)。采樣間隔10 s,實驗數(shù)據(jù)如表1所示。
實驗測試環(huán)境如下:OS為 Windows 10教育版 (64 bit);CPU為Intel(R) Core(TM ) i7-11700 2.50 GHz;RAM為16.0 GB;Python版本為3.6.0;TensorFlow-GPU 版本為1.12.0。為了驗證本文方法的有效性,將DGRU算法與經(jīng)典ELM、RNN和GRU算法對比,ELM采用Matlab2018版本,激活函數(shù)為Sigmoid,采用單隱含層結(jié)構(gòu),節(jié)點數(shù)為40。RNN、GRU分別采用單隱含層網(wǎng)絡(luò)架構(gòu),隱含層單元個數(shù)設(shè)置為140,最大迭代次數(shù)為 100,時間步長為1,初始學(xué)習(xí)率為 0.000 1。同時采用Dropout技術(shù),以避免訓(xùn)練過程中的過擬合問題。DGRU算法模型參數(shù)見表2。
表1 實驗數(shù)據(jù)信息Table 1 Information of experimental data
此外,滾筒烘絲干燥過程中采集了大量熱工數(shù)據(jù),但各數(shù)據(jù)(熱風(fēng)溫度、蒸汽壓力、物料流量等)量綱差異較大,對模型收斂速度和復(fù)雜度有重要影響,需對數(shù)據(jù)進(jìn)行歸一化消除量綱影響。
根據(jù)1.2節(jié)所述的mRMR算法,計算各輸入變量與區(qū)域1筒壁溫度之間的互信息值,見表3。采用mRMR算法后,與區(qū)域1滾筒溫度密切相關(guān)的變量排序為X8,X2,X9,X3,X5,X6,X7,X11,X13,X10,X4,X12,X1。綜合現(xiàn)場專家知識和實踐經(jīng)驗,最終選取區(qū)域1冷凝水溫度(X8)、入口物料含水率(X2)、HT蒸汽壓力(X3)、入口實際水分(X6)、工作蒸汽壓力(X7)、熱風(fēng)溫度(X11) 6個變量作為軟測量模型最佳輸入。
烘絲機(jī)干燥過程是個大滯后的非線性動態(tài)系統(tǒng),為了實現(xiàn)筒壁溫度的準(zhǔn)確預(yù)測,需考慮輸入與輸出變量的時序及時滯關(guān)系[15-16],故建立非線性動態(tài)映射關(guān)系如下:
Y(t)=fDGRU{X(t),X(t-1),X(t-2)}
其中,延遲時間為2個時刻,代表將當(dāng)前采樣時刻和前2個時刻的輸入變量作為動態(tài)模型的綜合輸入。
表2 DGRU算法模型參數(shù)Table 2 Model parameters of DGRU algorithm
表3 輸入與輸出變量之間的互信息值Table 3 Mutual information between input and output variables
為客觀評價模型性能,采用均方根誤差 (Root Mean Square Error,RMSE)、平均絕對誤差 (Mean Absolute Error,MAE)和相關(guān)系數(shù)(Correlation Coefficient,CC)3個評價指標(biāo):
4種算法下筒壁溫度預(yù)測的對比結(jié)果見表4。為了更直觀地顯示算法預(yù)測效果,選取測試集2的烘絲機(jī)筒壁溫度的預(yù)測值和真實值結(jié)果作圖,其對比曲線詳見圖4。
由表4可知,在3組測試集上,ELM網(wǎng)絡(luò)的整體評價指標(biāo)最差,結(jié)合圖4發(fā)現(xiàn)ELM預(yù)測曲線與真實值具有較大偏差,說明靜態(tài)網(wǎng)絡(luò)無法捕捉烘絲干燥過程的動態(tài)特性。而采用RNN和GRU動態(tài)遞歸網(wǎng)絡(luò)算法,其評價指標(biāo)和預(yù)測性能均得到明顯改善,這表明遞歸神經(jīng)網(wǎng)絡(luò)能夠有效捕捉烘絲過程的動態(tài)時序特性,但單層RNN和GRU屬于淺層網(wǎng)絡(luò),泛化能力有限,其預(yù)測性能不高。本文所提DGRU算法具有最小的RMSE和MAE,以及最大的CC,進(jìn)一步由圖4可知,基于DGRU的筒壁溫度預(yù)測值相比其他方法能夠更好地擬合真實值的變化趨勢,模型輸出值與實際值擬合較好,絕大多數(shù)誤差控制在0.1范圍內(nèi),能實現(xiàn)較高的預(yù)測精度。
表4 4種算法下筒壁溫度預(yù)測的結(jié)果對比Table 4 Quantitative comparison of cylinder wall temperature prediction by four methods
圖4 4種算法下筒壁溫度預(yù)測值和真實值對比曲線Fig.4 Comparison between predictive and actual curves of cylinder wall temperature by four different methods
此外,測試集2在4種算法下的預(yù)測誤差箱體圖如圖5所示。由圖5可以清晰看到ELM和RNN算法的誤差中值及均值距離零刻度線有不同程度的偏離,GRU和DGRU的誤差中值及均值非常接近零刻度線,其中DGRU算法造成的異常點更少,表明其具備更佳的平均預(yù)測準(zhǔn)確度。基于DGRU算法的筒壁溫度相關(guān)系數(shù)如圖6所示。由圖6可知,筒壁溫度預(yù)測值和真實值趨勢一致,預(yù)測較準(zhǔn)確。
圖5 4種算法下的預(yù)測誤差箱體圖Fig.5 Prediction error boxplot by four different methods
圖6 基于DGRU算法的筒壁溫度相關(guān)系數(shù)Fig.6 Correlation coefficient of cylinder wall temperature by DGRU method
針對烘絲機(jī)筒壁溫度難以準(zhǔn)確進(jìn)行在線檢測的問題,本文提出了基于DGRU的筒壁溫度動態(tài)預(yù)測方法,為烘絲機(jī)筒壁溫度在線檢測提供了新的技術(shù)手段。該方法先對現(xiàn)場工業(yè)數(shù)據(jù)進(jìn)行小波去噪、歸一化等預(yù)處理操作;然后采用最大相關(guān)最小冗余選取與筒壁溫度相關(guān)性最大的輸入變量,簡化模型復(fù)雜度,提高模型性能;最后利用堆疊GRU網(wǎng)絡(luò)和全連接層的深度學(xué)習(xí)方法預(yù)測在線溫度。基于煙廠實際烘絲數(shù)據(jù),實驗結(jié)果表明DGRU算法造成的異常點較少,預(yù)測值和真實值趨勢一致,在預(yù)測準(zhǔn)確性方面明顯優(yōu)于傳統(tǒng)算法,能夠提高筒體壁溫度預(yù)測精度。在未來研究工作中,可重點研究注意力機(jī)制方法,以進(jìn)一步提高模型預(yù)測精度。