張雪嫣,黎曉東,孫潔香
(北京機(jī)械工業(yè)自動(dòng)化研究所有限公司 生產(chǎn)力中心,北京 100120)
當(dāng)前煙草行業(yè)和公司為順應(yīng)時(shí)代的大潮和國(guó)家發(fā)展的需要正積極推進(jìn)智能化建設(shè),行業(yè)內(nèi)對(duì)智能工藝的研究目前處于萌芽階段。目前,煙草行業(yè)已基本實(shí)現(xiàn)卷煙生產(chǎn)過(guò)程與物流配送的自動(dòng)化,以及管理決策的信息化,擁有了一定的智能制造應(yīng)用基礎(chǔ)。但是,卷煙生產(chǎn)過(guò)程中的工藝控制方面,如烘絲段冷卻水分控制仍需要大量的人工干預(yù)工作,但這種控制流程存在的干預(yù)滯后、質(zhì)量不穩(wěn)定等問(wèn)題,需要利用新的技術(shù)進(jìn)行工藝質(zhì)量控制提升途徑的探索。
目前,大量相關(guān)研究聚焦于針對(duì)滾筒烘絲機(jī)自身系統(tǒng)結(jié)構(gòu)的優(yōu)化[1~3],而忽略了控制過(guò)程中的干預(yù)滯后問(wèn)題。針對(duì)這一問(wèn)題,通過(guò)對(duì)煙絲冷卻水分的實(shí)時(shí)預(yù)測(cè)以及智能決策,解決數(shù)據(jù)的時(shí)效性問(wèn)題。因此,首先需要通過(guò)數(shù)據(jù)相關(guān)性分析對(duì)烘絲段設(shè)備參數(shù)與冷卻水分之間的關(guān)聯(lián)度進(jìn)行分析排序,從而篩選出其中與冷卻水分相關(guān)性較大的設(shè)備參數(shù)。用于對(duì)各領(lǐng)域中的各種數(shù)據(jù)之間的關(guān)聯(lián)進(jìn)行挖掘的算法主要有Apriori算法、CART算法、隨機(jī)森林算法等[4]。相較于Apriori算法和CART算法,隨機(jī)森林算法具有噪聲和異常值的較高容忍度,并且在處理高維度數(shù)據(jù)方面具有較強(qiáng)優(yōu)勢(shì),可對(duì)非線性、具有共線性和交互作用的數(shù)據(jù)進(jìn)行有效分析,并同時(shí)給出變量重要性評(píng)分等特點(diǎn)[5],因此本課題選用隨機(jī)森林算法進(jìn)行冷卻水分與烘絲段設(shè)備參數(shù)的相關(guān)性分析。
在制絲生產(chǎn)中煙絲冷卻水分的穩(wěn)定性是評(píng)價(jià)制絲質(zhì)量的關(guān)鍵指標(biāo),煙絲冷卻水分是指冷卻風(fēng)選后的冷卻水分檢測(cè)值,是前序工藝流程綜合影響的結(jié)果。對(duì)冷卻水分工藝質(zhì)量的評(píng)價(jià)的指標(biāo)是均值、標(biāo)準(zhǔn)偏差和置信度。目前對(duì)冷卻水分的控制是擋車(chē)工憑借人工經(jīng)驗(yàn)通過(guò)制絲集控系統(tǒng)修正烘絲機(jī)的筒壁溫度設(shè)定值配合烘絲機(jī)的PID控制,使最終煙絲的冷卻水分滿足工藝標(biāo)準(zhǔn)要求。在批次生產(chǎn)開(kāi)始階段,擋車(chē)工對(duì)筒壁溫度的干預(yù)比較頻繁,此時(shí)主要參考當(dāng)前的來(lái)料水分、上一批次的筒壁溫度均值及設(shè)定值、冷卻水分目標(biāo)值等參數(shù),烘絲機(jī)的溫度控制主要是前饋控制起作用。在生產(chǎn)的穩(wěn)定階段人工干預(yù)比較少,此階段風(fēng)選后水分儀可正常檢測(cè)煙絲,可形成煙絲水分的反饋控制,因此過(guò)程階段主要是前饋控制和反饋控制的綜合作用。正常生產(chǎn)時(shí)烘絲機(jī)的筒壁溫度范圍為130℃~132℃,最小的調(diào)整刻度是0.1℃,冷卻水分的工藝標(biāo)準(zhǔn)因牌號(hào)不同略有差異,一般是12.1% 左右。
當(dāng)前控制流程下存在的主要問(wèn)題:
1)對(duì)筒壁溫度的干預(yù)滯后性大。擋車(chē)工對(duì)筒壁溫度的干預(yù)依據(jù)是長(zhǎng)期工作經(jīng)驗(yàn)的積累,屬于針對(duì)異常情況的應(yīng)對(duì)性控制,每次干預(yù)5min~6min之后的冷卻水分的檢測(cè)值才是人工干預(yù)值的響應(yīng)結(jié)果。
2)質(zhì)量控制不穩(wěn)定。工作過(guò)程中人工經(jīng)驗(yàn)的積累具有差異性,對(duì)質(zhì)量控制手段受多種因素干擾,無(wú)法保證質(zhì)量控制的穩(wěn)定性。
3)難以復(fù)制好的控制實(shí)例。人工的操作經(jīng)驗(yàn)難以量化,沒(méi)有統(tǒng)一的評(píng)價(jià)標(biāo)準(zhǔn),每個(gè)批次的生產(chǎn)狀態(tài)都存在隨機(jī)差異性,工藝質(zhì)量控制精準(zhǔn)的批次的干預(yù)操作也難以復(fù)制。
4)質(zhì)量提升空間小。在當(dāng)前人工經(jīng)驗(yàn)控制的模式下,工藝質(zhì)量的提升空間很小,需要利用新技術(shù)探尋新的控制模式,開(kāi)拓質(zhì)量提升的空間。
提升煙絲質(zhì)量穩(wěn)定性、實(shí)現(xiàn)工藝質(zhì)量精準(zhǔn)控制的前提,就是解決筒壁溫度干預(yù)滯后問(wèn)題。為此需要實(shí)現(xiàn)對(duì)煙絲冷卻水分及筒壁溫度的實(shí)時(shí)預(yù)測(cè),
斯皮爾曼相關(guān)性系數(shù)也稱(chēng)為秩相關(guān)系數(shù)或等級(jí)相關(guān)系數(shù),由Carl Spearman提出[6,7]。斯皮爾曼相關(guān)系數(shù)被定義成等級(jí)變量之間的皮爾遜相關(guān)系數(shù)。對(duì)于樣本容量為n的樣本,n個(gè)原始數(shù)據(jù)被轉(zhuǎn)換成等級(jí)數(shù)據(jù),相關(guān)系數(shù)ρ為:
在實(shí)際應(yīng)用中,忽略變量間的連結(jié),可以將相關(guān)系數(shù)ρ的計(jì)算簡(jiǎn)化為:
斯皮爾曼相關(guān)系數(shù)只需要滿足兩個(gè)變量的觀測(cè)值是成對(duì)的等級(jí)評(píng)定資料或是由連續(xù)變量觀測(cè)資料轉(zhuǎn)化得到的等級(jí)資料這一條件即可應(yīng)用,相對(duì)于皮爾遜相關(guān)系數(shù)來(lái)說(shuō),對(duì)數(shù)據(jù)的要求條件相對(duì)寬松。也就是說(shuō),不論兩個(gè)變量的樣本容量的大小、總體分布形態(tài)如何,都可以使用斯皮爾曼相關(guān)系數(shù)來(lái)進(jìn)行研究。
隨機(jī)森林算法應(yīng)用集成學(xué)習(xí)的思想,是由一組決策樹(shù)組成的分類(lèi)器,每個(gè)決策樹(shù)都是使用隨機(jī)向量構(gòu)建 的[8]。隨機(jī)森林算法具有較高的容噪性,適用于處理高維度數(shù)據(jù),可對(duì)非線性、具有共線性和交互作用的數(shù)據(jù)進(jìn)行有效分析,并同時(shí)給出變量重要性評(píng)分。一般變量重要性評(píng)分的表述方式有兩種,通過(guò)Gini指數(shù)表述和通過(guò)OOB錯(cuò)誤率進(jìn)行表述。而針對(duì)于連續(xù)變量來(lái)說(shuō),基于Gini指數(shù)的變量重要性評(píng)分是無(wú)偏的,且當(dāng)信噪比較低時(shí),其準(zhǔn)確性要高于基于OOB錯(cuò)誤率的變量重要性評(píng)分。因此將通過(guò)Gini指數(shù)定義變量重要性評(píng)分VIM,具體如下所述[9]。
將Gini指數(shù)用GI來(lái)表示,假設(shè)有m個(gè)特征X1,X2,X3,…,Xm,則每個(gè)特征Xj的Gini指數(shù)評(píng)分,即第j個(gè)特征在隨機(jī)森林中所有決策樹(shù)中節(jié)點(diǎn)分裂不純度的平均改變量可以表示為:
其中,K表示有K個(gè)類(lèi)別,pmk表示節(jié)點(diǎn)m中類(lèi)別k所占的比例。
特征XiXj在節(jié)點(diǎn)m的重要性,即節(jié)點(diǎn)m分枝前后的Gini指數(shù)變化量可表示為:
其中,GIl和GIr分別表示分枝后兩個(gè)新節(jié)點(diǎn)的Gini指數(shù)。
假設(shè)特征Xj在決策樹(shù)i中出現(xiàn)的節(jié)點(diǎn)在集合M中,那么Xj在第i顆樹(shù)的重要性為:
假設(shè)隨機(jī)森林中共有n顆樹(shù),那么:
最后,歸一化處理可得變量重要性評(píng)分表示如下:
本文采用國(guó)內(nèi)某卷煙廠制絲生產(chǎn)線MES導(dǎo)出過(guò)程數(shù)據(jù)進(jìn)行分析。數(shù)據(jù)已經(jīng)進(jìn)行了料頭和料尾處理,并通過(guò)擬合參數(shù)與冷卻水分的關(guān)系找到對(duì)冷卻水分比較重要的參數(shù),已知筒壁溫度最重要,通過(guò)調(diào)節(jié)筒壁溫度來(lái)控制冷卻水分在合理的范圍內(nèi)。經(jīng)過(guò)統(tǒng)計(jì)一共收集了106個(gè)批次,共68323條數(shù)據(jù),覆蓋KLD烘絲段用蒸汽流量、SIROX烘絲分汽缸壓力、冷卻除塵風(fēng)機(jī)負(fù)壓值、熱風(fēng)蒸汽閥門(mén)開(kāi)度等60個(gè)設(shè)備參數(shù)。不同牌號(hào)的冷卻水分要求是相同的,因此分析不分牌號(hào)進(jìn)行。
首先對(duì)數(shù)據(jù)中的部分無(wú)效數(shù)據(jù)進(jìn)行處理,隨后對(duì)數(shù)據(jù)進(jìn)行固定值篩選。由于烘絲段冷卻水分隨著各設(shè)備參數(shù)的變化而不斷改變,因此可以認(rèn)為參數(shù)值恒定的設(shè)備參數(shù),包括KLD熱風(fēng)風(fēng)機(jī)頻率、排潮風(fēng)機(jī)電機(jī)頻率、氣鎖電機(jī)頻率恒定、SIROX除塵房排潮風(fēng)機(jī)頻率與冷卻除塵風(fēng)機(jī)運(yùn)行頻率,與冷卻水分無(wú)關(guān),在此后的分析中將不做考慮。
對(duì)刪篩后的55個(gè)參數(shù)應(yīng)用斯皮爾曼相關(guān)系數(shù)對(duì)數(shù)據(jù)相關(guān)性進(jìn)行分析。首先,分別計(jì)算各參數(shù)與冷卻水分的相關(guān)系數(shù),與冷卻水分相關(guān)性較高的參數(shù)有SIROX閥前蒸汽溫度(新增)、SIROX閥前蒸汽壓力(新增)、KLD除水量(1/h)、KLD烘后水分、KLD一次減壓后蒸汽壓力、KLD排潮溫度、SIROX蒸汽溫度、SIROX后溫度、KLD烘絲段用蒸汽流量、SIROX閥后蒸汽壓力、SIROX蒸汽流量以及SIROX蒸汽閥門(mén)開(kāi)度。
隨后,進(jìn)一步對(duì)兩兩參數(shù)間的斯皮爾曼相關(guān)系數(shù)進(jìn)行計(jì)算,圖1所示為線性相關(guān)系數(shù)最高的前15個(gè)特征的關(guān)系矩陣。分析可得,SIROX蒸汽體積累計(jì)量(m3)與SIROX蒸汽質(zhì)量累計(jì)量(kg)、SIROX蒸汽體積流量與SIROX蒸汽流量、1區(qū)筒壁溫度與2區(qū)工作蒸汽壓力、葉絲累計(jì)量與SIROX蒸汽質(zhì)量累計(jì)量(kg)、1區(qū)工作蒸汽壓力與1區(qū)筒壁溫度等兩兩參數(shù)間存在較強(qiáng)的線性相 關(guān)性。
圖1 關(guān)系矩陣(前15個(gè)參數(shù))
首先,設(shè)定生成樹(shù)數(shù)量為300棵,改變特征參數(shù)數(shù)量,分別對(duì)53、43、33個(gè)特征參數(shù)進(jìn)行分析,得到如圖2所示結(jié)果。對(duì)比3次相關(guān)性分析結(jié)果,可知以下11個(gè)特征:KLD排潮溫度、KLD烘后溫度、SIROX蒸汽體積累計(jì)量、冷卻溫度、葉絲累計(jì)量、SIROX蒸汽質(zhì)量累計(jì)量、SIROX閥后蒸汽壓力、SIROX蒸汽流量、SIROX蒸汽體積流量、KLD烘后水分、SIROX蒸汽閥門(mén)開(kāi)度,對(duì)冷卻水分的綜合評(píng)價(jià)最高,且沒(méi)有隨著特征的篩選出現(xiàn)重要性減弱的跡象,雖然前11個(gè)特征的重要性排序稍有變化,但是總體趨勢(shì)沒(méi)有變化。其中尤其是KLD排潮溫度影響最大。
隨后,保持特征參數(shù)數(shù)量為53不變,改變生成樹(shù)數(shù)量,分別設(shè)定生成樹(shù)數(shù)量為500、600、700、1000來(lái)進(jìn)行相關(guān)性分析,對(duì)比結(jié)果如圖3所示。生成樹(shù)數(shù)量從500棵增加到1000棵的過(guò)程中,前11特征參數(shù)沒(méi)有變化,只是得分排名順序稍有不同。其中KLD排潮溫度的重要性得分仍然最高。而且從500~1000的結(jié)果來(lái)看,數(shù)據(jù)并沒(méi)有明顯的變化,初步可以得出,生成500棵決策樹(shù)基本可以滿足相關(guān)性分析需要。
圖2 特征值數(shù)量改變分析結(jié)果對(duì)比
圖3 決策樹(shù)數(shù)量改變分析結(jié)果對(duì)比
為進(jìn)一步提高分析效率與準(zhǔn)確率,對(duì)具有強(qiáng)線性相關(guān)的特征參數(shù)進(jìn)行篩選,刪除的特征參數(shù)包括:SIROX蒸汽質(zhì)量累計(jì)量、SIROX蒸汽流量、1區(qū)筒壁溫度、2區(qū)筒壁溫度、1區(qū)回水溫度、KLD2區(qū)蒸汽薄膜閥開(kāi)度、KLD烘前水分、SIROX閥后蒸汽壓力、SIROX閥前蒸汽溫度、SIROX烘后溫度及KLD除水量等11個(gè)特征參數(shù)。篩除特征后,通過(guò)運(yùn)行500棵決策樹(shù)對(duì)余下特征參數(shù)進(jìn)行相關(guān)性分析,得到結(jié)果如表1所示。
表1 與冷卻水分相關(guān)性較高的特征參數(shù)
表1(續(xù))
其中,KLD排潮溫度仍然具有很高的重要性度量,而與筒壁溫度相關(guān)的工作蒸汽壓力也在第一梯度中。此外,KLD烘后溫度、SIROX蒸汽體積累計(jì)量、SIROX蒸汽體積流量、葉絲累計(jì)量以及冷卻溫度也與冷卻水分具有較高的相關(guān)性。
本研究以煙草烘絲設(shè)備參數(shù)為研究對(duì)象,應(yīng)用斯皮爾曼相關(guān)系數(shù)及隨機(jī)森林等方法對(duì)其與烘絲段煙絲冷卻水分之間的相關(guān)性進(jìn)行分析,從而為實(shí)現(xiàn)煙絲冷卻水分及筒壁溫度的實(shí)時(shí)預(yù)測(cè)網(wǎng)絡(luò)提供有效參數(shù),為解決筒壁溫度干預(yù)滯后問(wèn)題奠定基礎(chǔ)。