高立秀 陳得麗 萬興淼 王星皓 朱知元 李永華 佘 迪 孔維熙
(紅云紅河煙草〔集團〕有限責任公司曲靖卷煙廠,云南 曲靖 655001)
切絲后含水率是煙葉制絲生產環(huán)節(jié)的一項重要工藝指標,其符合性和穩(wěn)定性對后續(xù)工序過程的穩(wěn)定控制具有重要作用。目前,中國煙葉制絲線主要通過人工倒推估算潤葉加料出口含水率和松散回潮出口含水率以實現(xiàn)切后含水率的控制。由于影響切絲后含水率的因素較多,如環(huán)境溫濕度、貯葉時間及部分人為操作習慣等,簡單估算無法實現(xiàn)前后工序參數(shù)協(xié)同和精準控制。鐘文焱等[1]提出了一種利用多元回歸分析計算松散回潮機回潮加水比例,實現(xiàn)烘絲含水率控制的方法,但該方法的模型解釋度不高,僅考慮了車間環(huán)境溫濕度和貯葉時間,未涉及其他影響變量。李貴川等[2]通過設定環(huán)境溫濕度T、空氣相對濕度R、生產設備海拔高度H,其在卷煙加工過程中保持恒定不變,測量各節(jié)點煙絲水分重量百分比值,計算各工序卷煙水分變化值,從而確定烘絲入口水分設定值。
制絲車間松散回潮工序至切絲工序的工藝流程如圖1所示,試驗擬將切絲前工序分離,采取“分段建模在先,串聯(lián)預測在后”的方式建立數(shù)學模型。其中,分段建模包括:① 投料段模型(水分儀1至水分儀3),使用XGBoost模型建模預測;② 車間溫濕度預測模型,使用SARIMAX模型預測未來數(shù)小時車間環(huán)境溫濕度;③ 切絲段模型(水分儀3至水分儀4),使用神經(jīng)網(wǎng)絡模型建模,蒙特卡洛仿真進行預測。旨在提高切絲后含水率的穩(wěn)定性與符合性,為下一步的烘絲工序和摻配加香工序的平穩(wěn)控制提供依據(jù)。
圖1 工藝流程圖
從制造執(zhí)行系統(tǒng)(MES)中提取2020年3月1日—6月27日云煙(A)牌號生產的448批次穩(wěn)態(tài)數(shù)據(jù),包含16個特征變量,其中,松散回潮出口含水率、松散回潮片區(qū)溫度、松散回潮片區(qū)濕度、潤葉加料工藝流量、加料流量、潤葉加料片區(qū)溫度、潤葉加料片區(qū)濕度、潤葉加料出口溫度、薄片含水率、薄片摻加流量、潤葉加料機蒸汽添加值、潤葉加料出口含水率屬于投料段模型變量;潤葉加料出口含水率、貯葉時間、切絲片區(qū)溫度、切絲片區(qū)濕度、切絲后含水率屬于切絲段模型變量。對原始數(shù)據(jù)進行有效數(shù)據(jù)篩選:對缺失值使用熱卡填補法填充[3],對異常值進行3σ原則識別并剔除,對松散回潮出口含水率標準偏差、潤葉加料出口含水率滿足能力(CP)、切絲后含水率過程能力指數(shù)(CPK)不滿足工藝考核標準的數(shù)據(jù)進行剔除。從時序數(shù)據(jù)庫提取2019年6月27日—2020年6月27日10~23點的溫濕度的時序數(shù)據(jù),并進行間隔1 h的采樣作為溫濕度的歷史數(shù)據(jù),使用采集時的日期和時間作為數(shù)據(jù)序號。
數(shù)據(jù)需除去量綱的影響以描述客觀規(guī)律,選擇Z-score 標準化方法,按式(1)對所有數(shù)據(jù)進行標準化。
(1)
式中:
x——原始數(shù)據(jù);
μ——樣本均值;
σ——樣本方差。
使用Anconda3-5.1開發(fā)環(huán)境和Python 3.6.3 實現(xiàn)代碼[4]。數(shù)據(jù)預處理完成后,需選擇有意義的變量輸入模型進行訓練。原始特征變量中的濕度均是相對濕度,即當前濕空氣中水蒸氣內分壓力和相同溫度下飽和濕空氣內水蒸氣分壓力的比值,根據(jù)干燥理論,物料水分散失主要與濕空氣中的水蒸氣分壓有關,而且空氣中的溫度和相對濕度是兩個相互影響的變量,因此按式(2)~式(4)計算濕空氣的焓值[5],去除變量的交互性。
I=(1.01+1.88H)T+2 491H,
(2)
(3)
(4)
式中:
I——濕空氣的焓值,kJ/kg;
H——空氣中的濕含量,kg水/kg干空氣;
RH——相對濕度,%;
PV——濕空氣的飽和壓力,Pa;
T——濕空氣的溫度,℃。
由式(2)構造出兩個新的變量:松散回潮片區(qū)濕空氣的焓值和潤葉加料片區(qū)濕空氣的焓值,故投料段模型共包括14個特征變量。通過遞歸特征消除法(RFE)[6]剔除冗余的特征,提高模型精確度,減少運行時間。選取樹模型作為基準模型,通過反復構建基準模型,選出影響最大的變量并重復該過程,直至遍歷所有變量。投料段13個輸入變量經(jīng)遞歸特征消除法后的影響系數(shù)見表1。
由表1可知,經(jīng)遞歸特征消除法(RFE)計算后,剔除冗余的特征:松散回潮片區(qū)溫度、松散回潮片區(qū)濕度、潤葉加料片區(qū)溫度、潤葉加料片區(qū)濕度、薄片摻加流量。最終的投料段模型的輸入變量(經(jīng)標準化后)見表2。
表1 投料段輸入變量的影響系數(shù)表
表2 投料段模型的變量
(5)
(6)
(7)
切絲段模型的最終變量定義及選擇見表3。
集成學習是指將幾種機器學習技術組合成一個預測模型的元算法,可以有效提升預測效果。集合方法通常分為bagging和boosting兩種,前者主要用于降低方差,后者主要用于降低偏差,文中建立投料段預測模型需最大程度減小預測偏差,所以選用boosting集成方法。其中GBDT算法[7]是boosting方法的代表之一,XGBoost算法[7-8]是在GBDT算法基礎上進行改進,不僅實現(xiàn)了并行近似直方圖算法以高效生成分割點,并通過正則化項解決了GBDT的過擬合問題,其準確度高、不易過擬合、可擴展性強。
表3 切絲段模型的變量
因此,選用XGBoost算法構建投料段模型,并直接預測松散回潮出口含水率Y。XGBoost模型經(jīng)貝葉斯調參進行模型參數(shù)優(yōu)化后,得到模型的樹個數(shù)為130棵,樹的最大深度為7,最小葉子節(jié)點樣本權重和為4,節(jié)點分裂所需的最小損失函數(shù)下降值gamma為0.01,隨機采樣比例subsample為0.8,有效防止過擬合和欠擬合。模型預測效果驗證標準為松散回潮出口含水率預測值誤差在±0.2%,判定為預測準確,預測效果優(yōu)。
投料段XGBoost模型預測效果見圖2。由圖2可知,松散回潮出口含水率預測值和實際值曲線吻合度較高,模型得分為92.37,均方誤差MSE為0.005,且預測結果誤差均控制在0.3%內,預測準確率(誤差在±0.2%內)為86.49%,預測效果優(yōu)。
物料完成潤葉加料工序后,需經(jīng)過4~72 h貯葉才進行切絲,即潤葉加料出口含水率是“現(xiàn)在值”,切絲片區(qū)環(huán)境溫濕度和切絲后含水率屬于“未來值”。作為切絲段神經(jīng)網(wǎng)絡模型輸入變量的切絲片區(qū)溫濕度是當前不能確定的變量。所以在使用神經(jīng)網(wǎng)絡模型對切絲出口水分進行預測前,需對切絲片區(qū)溫濕度變量進行預測。選擇SARIMAX對環(huán)境溫濕度進行預測[9-11],建立濕度預測SARIMAX(1,1,1)×(0,1,1,14)模型,濕度模型中AR為0.467 5,MA為-0.703 4,SMA為-0.942 6;溫度模型為SARIMAX(0,1,1)×(1,1,1,14),溫度模型中MA為-0.196 6,AR為0.334 5,SMA為-0.908 8。
濕度、溫度預測模型分別如式(8)、式(9)所示。
圖2 XGBoost模型預測效果
(8)
(9)
式中:
xt——溫度或濕度的時間序列;
μt——隨機成分;
B——移動算子。
溫濕度模型預測結果見圖3。由圖3可知,溫濕度模型的預測得分分別為88.12,87.49,MES分別為0.16,0.28,預測值和實際值吻合度較高。
圖3 溫濕度模型預測結果
模型預測效果準確的標準為切絲后含水率實際值與期望值的誤差在±0.15%內,同時實際切絲后含水率CPK≥1.33,預測效果優(yōu)。神經(jīng)網(wǎng)絡預測效果見圖4。由圖4可知,切絲后含水率預測值和實際值曲線吻合度較高,訓練集模型得分為96.81,測試集模型得分為90.36,均方誤差為0.02;測試集預測結果誤差控制在±0.15%以內,模型預測效果優(yōu)。
通過預先構建3種預測模型,在滿足切絲后含水率預測值與工藝標準值誤差最小這一控制條件下,對潤葉加料及松散回潮兩個工序的物料含水率進行預測,保證切絲后含水率的穩(wěn)定性與符合性。其中潤葉加料出口的含水預測最優(yōu)值可以直接作為輸入變量用于松散回潮出口含水率的預測中,而松散回潮出口的含水率可以直接作為松散回潮智能控制系統(tǒng)的目標值,由此在控制物料含水率的同時解決了松散回潮出口含水率、潤葉加料出口含水率和切絲后含水率之間的質量指標關聯(lián)匹配問題。切絲后含水率預測及控制流程圖如圖6所示。
圖4 神經(jīng)網(wǎng)絡模型預測效果
圖5 蒙特卡洛仿真映射圖
圖6 切絲后含水率預測及控制流程圖
云煙(A)牌號從2020年7月1日起應用切絲后含水率預測模型指導實際生產,2020年7月1日—9月30日共生產185批,切絲后含水率實際值與標準值之間的誤差分布情況見表4。對比2019年同期,其預測誤差在±0.15內(改進前占比為62.57%,改進后占比達83.24%)。
切絲含水率CPK分布情況見表5。由表5可知,切絲含水率CPK達標合格率改進前為91.44%,改進后為97.30%,提升了5.86%,有效保證了后續(xù)工序的加工穩(wěn)定性。
表4 云煙(A)牌號切絲后含水率誤差分布
表5 云煙(A)牌號切絲含水率CPK分布
通過構建投料段XGBoost模型、溫濕度SARIMAX預測模型、切絲段神經(jīng)網(wǎng)絡模型,將預測的潤葉加料出口含水率最優(yōu)值直接用于松散回潮出口含水率的預測,松散回潮出口含水率預測最優(yōu)值可作為智能加水控制系統(tǒng)的目標值,由此在控制物料含水率的同時解決了松散回潮、潤葉加料和切絲工序的指標關聯(lián)匹配問題。仿真結果表明,云煙(A)牌號切絲后含水率的準確率提升至83.24%,切絲后含水率CPK合格率提升至97.30%,說明模型預測效果較好。同時模型適用于其他牌號卷煙水分控制,可通過進一步優(yōu)化模型參數(shù),從而提升切絲后含水率的控制精度。試驗模型仍存在一定的提升空間及改善之處,如當生產計劃臨時改變以及天氣驟變導致算法學習的歷史數(shù)據(jù)無法快速更新,其預測會存在一定誤差。