鄭松潘 李曉剛
摘 要:卷煙制絲過(guò)程含水率的控制是保障制絲加工質(zhì)量穩(wěn)定性非常重要的環(huán)節(jié),為充分挖掘歷史生產(chǎn)批次中已有的優(yōu)質(zhì)控制模式,本文提出一種基于知識(shí)圖譜尋優(yōu)的煙絲含水率控制方法,通過(guò)對(duì)影響煙絲含水率關(guān)鍵工況的識(shí)別,從知識(shí)圖譜的批次實(shí)體出發(fā),抽取和挖掘歷史批次和工況的相互關(guān)系及關(guān)聯(lián)規(guī)則形成知識(shí)庫(kù),指導(dǎo)批次生產(chǎn)時(shí)相關(guān)操作參數(shù)的下達(dá),改變以往需要部分依靠經(jīng)驗(yàn)和主觀判斷的含水率控制模式,顯著提升了烘絲前煙絲含水率的合格率和穩(wěn)定性。
關(guān)鍵詞:含水率控制;知識(shí)圖譜;批次尋優(yōu)
引言
在卷煙工業(yè)制絲環(huán)節(jié),煙絲的含水率是評(píng)價(jià)煙絲質(zhì)量最重要的參數(shù)之一[1-2]。制絲主要生產(chǎn)環(huán)節(jié)包括松散回潮-潤(rùn)葉加料-切絲烘絲-加香-裝箱[3],其中對(duì)煙絲含水率有較大影響的工序主要是松散回潮和烘絲[4-5],前者對(duì)煙葉進(jìn)行加水回潮,后者對(duì)煙絲進(jìn)行烘干,但在兩道工序之間生產(chǎn)線較長(zhǎng)且煙絲需入柜存儲(chǔ),煙絲的含水率在車間環(huán)境和不同工況的影響下存在較大波動(dòng),無(wú)法保證煙絲在烘絲入口時(shí)含水率達(dá)到工藝要求。
本文通過(guò)引入知識(shí)圖譜的構(gòu)建,對(duì)歷史工況進(jìn)行規(guī)則學(xué)習(xí),挖掘其中的內(nèi)在聯(lián)系,形成歷史工況知識(shí)庫(kù)。當(dāng)車間準(zhǔn)備投入生產(chǎn)時(shí),只需提交當(dāng)前已知的工況數(shù)據(jù),尋優(yōu)模型將給出與當(dāng)前工況最相似且含水率控制最優(yōu)的歷史批次方案,指導(dǎo)車間進(jìn)行加水比例等操作參數(shù)設(shè)置。
1 基于知識(shí)圖譜構(gòu)建知識(shí)庫(kù)
1.1知識(shí)圖譜
知識(shí)圖譜是人工智能技術(shù)的重要分支之一[6-7],它以結(jié)構(gòu)化圖的形式描述客觀世界中概念、實(shí)體及其之間的關(guān)系,在這里引入三元組“實(shí)體-關(guān)系-實(shí)體”進(jìn)行知識(shí)表示,每個(gè)實(shí)體用唯一確定的ID表示,通過(guò)“屬性-屬性值”描述知識(shí)實(shí)體的內(nèi)在特性,知識(shí)實(shí)體之間通過(guò)關(guān)系構(gòu)成網(wǎng)狀的知識(shí)結(jié)構(gòu),并通過(guò)對(duì)實(shí)體、屬性之間的關(guān)系抽取,將這些關(guān)系形成圖譜的邊信息最終構(gòu)成圖譜知識(shí)庫(kù)。
1.2實(shí)體識(shí)別
在構(gòu)建知識(shí)圖譜時(shí),首先需要確定圖譜中的節(jié)點(diǎn)[8],通常采用現(xiàn)實(shí)實(shí)體作為節(jié)點(diǎn)對(duì)象,將每個(gè)實(shí)體作為一個(gè)知識(shí)單元,在檢索尋優(yōu)時(shí)能夠返回以實(shí)體為單元的相關(guān)信息。而在制絲生產(chǎn)過(guò)程中,通常以批次為最小生產(chǎn)單元,批次內(nèi)的各個(gè)工況屬性之間存在復(fù)雜的相互關(guān)系,本文將批次實(shí)體作為研究對(duì)象搭建知識(shí)圖譜,通過(guò)高結(jié)構(gòu)化的數(shù)據(jù)模型形成知識(shí)庫(kù)后,供后續(xù)工況尋優(yōu)搭建基礎(chǔ)。
設(shè)用于知識(shí)表述的三元組形式為:
TP={E,R,ET} (1)
其中E為所有批次實(shí)體的集合,R為實(shí)體之間的關(guān)系集合,ET為批次實(shí)體內(nèi)所有工況數(shù)據(jù)的屬性集。
1.3關(guān)系抽取
實(shí)體與屬性之間的關(guān)系抽取是形成知識(shí)圖譜的關(guān)鍵[9],本文基于關(guān)聯(lián)分析方法FP-growth進(jìn)行關(guān)聯(lián)規(guī)則的挖掘,構(gòu)建批次間各個(gè)關(guān)鍵工況之間,以及各工況與煙絲含水率之間的關(guān)聯(lián)關(guān)系,形成圖譜的邊信息。
通常關(guān)聯(lián)規(guī)則表達(dá)式形如“X→Y”,如“松散加水比例為5.6時(shí)→烘絲入口含水率為19.5”,則可以認(rèn)為是一個(gè)簡(jiǎn)單的兩種工況屬性之間的關(guān)聯(lián)規(guī)則。當(dāng)然,在實(shí)際生產(chǎn)環(huán)境下,工況屬性之間的關(guān)系不會(huì)這么簡(jiǎn)單直接,而是通過(guò)不同的工況關(guān)系相互作用、相互關(guān)聯(lián)而產(chǎn)生不同的生產(chǎn)結(jié)果,我們通過(guò)挖掘批次及各工況之間復(fù)雜的關(guān)聯(lián)規(guī)則進(jìn)行關(guān)系抽取。
首先提取上述三元組中的所有生產(chǎn)批次實(shí)體作為項(xiàng)目集E={E1,E2。。。En},而T={t1,t2…tm}是所有工況屬性的事務(wù)集合,每個(gè)事務(wù)ti包含的項(xiàng)集都是批次E內(nèi)的工況子集,在關(guān)聯(lián)分析中,包含0個(gè)或多個(gè)項(xiàng)的集合被稱為項(xiàng)集。在關(guān)聯(lián)分析中,通過(guò)支持度(s)來(lái)表述某個(gè)規(guī)則在給定所有批次數(shù)據(jù)集中出現(xiàn)的頻繁程度,而置信度(c)則表述在出現(xiàn)X事務(wù)的前提下同時(shí)含有Y的頻繁程度,其具體定義分別如下:
其中,N是批次內(nèi)所有工況事務(wù)的總數(shù)。若某工況之間的關(guān)聯(lián)規(guī)則支持度較低,則說(shuō)明其出現(xiàn)的概率較低,實(shí)際意義不大,而置信度則度量其可進(jìn)行推理的可靠性。則關(guān)系抽取的主要工作是構(gòu)建滿足最小支持度閾值的頻繁項(xiàng)集,和從頻繁項(xiàng)集中提取高置信度的規(guī)則。
(1)構(gòu)建頻繁項(xiàng)集
FP-growth算法[10]通過(guò)構(gòu)建FP-tree來(lái)壓縮事務(wù)數(shù)據(jù)庫(kù)中的信息,從而更加有效地產(chǎn)生頻繁項(xiàng)集。FP-tree其實(shí)是一棵前綴樹(shù),按支持度降序排列,支持度越高的頻繁項(xiàng)離根節(jié)點(diǎn)越近,從而使得更多的頻繁項(xiàng)可以共享前綴。
在此之前,因?yàn)楣r參數(shù)基本是連續(xù)的線性數(shù)值,如環(huán)境溫度20℃與20.1℃的0.1℃差異在實(shí)際生產(chǎn)中我們認(rèn)為是可以忽略不記的,而在FP-growth掃描事務(wù)數(shù)據(jù)庫(kù)時(shí)則認(rèn)為其是兩種數(shù)據(jù)項(xiàng),會(huì)給初始算法構(gòu)建增加不必要的大量負(fù)擔(dān)。為避免該情況的發(fā)生,我們需要對(duì)所有工況屬性的事務(wù)集合T進(jìn)行數(shù)據(jù)項(xiàng)的初始化,即給所有工況進(jìn)行階段劃分,如溫度19.5℃-20.5℃均劃分入溫度20℃的初始事務(wù)集內(nèi),而精度更高的匹配工作在尋優(yōu)時(shí)完成。
劃分好工況數(shù)據(jù)后,即可對(duì)事務(wù)集合T按批次進(jìn)行事務(wù)數(shù)據(jù)庫(kù)的構(gòu)建,如表3所示:
首先,對(duì)該事務(wù)數(shù)據(jù)庫(kù)中所有批次的工況項(xiàng)進(jìn)行一次掃描,計(jì)算每一批次生產(chǎn)記錄中各種工況的支持度,然后按支持度進(jìn)行排序,將其中低于支持度閾值的項(xiàng)進(jìn)行剔除,保留其中的頻繁項(xiàng)集L,在此基礎(chǔ)上進(jìn)行二次掃描,構(gòu)建FP-tree,具體算法如下:
1) 創(chuàng)建tree根節(jié)點(diǎn)root,標(biāo)記為null;
2) 對(duì)每條事務(wù)集合ti中的工況屬性按照已有頻繁項(xiàng)集L中的次序排序得到[p/P]格式的頻繁項(xiàng)集,其中p表示首個(gè)工況項(xiàng),P表示工況頻繁項(xiàng)集中除去p后的剩余工況屬性組成的項(xiàng)表,將得到項(xiàng)表逐一插入tree節(jié)點(diǎn);
3) 掃描所有批次下的工況項(xiàng)后,對(duì)前綴一致的工況項(xiàng)進(jìn)行計(jì)數(shù)加1,不一致則新增一個(gè)節(jié)點(diǎn),直至最終FP樹(shù)形成。
(2)規(guī)則挖掘
對(duì)形成的FP樹(shù)從底部開(kāi)始挖掘其頻繁規(guī)則。以上圖為例,在FP樹(shù)中以d結(jié)尾的子樹(shù)共2個(gè),分別是<(b:5),(a:3),(d:1)>和<(b:5),(c:2),(d:2)>。假設(shè)此處支持度閾值設(shè)置為2,而工況d在兩個(gè)子樹(shù)中分別為(d:1)、(d:2),則顯然d自身是個(gè)頻繁項(xiàng)(d:3);
從末端d向上延生子樹(shù)可以挖出(c:2),(b:3),分別滿足支持度閾值,則以d為前綴形成頻繁項(xiàng)規(guī)則(dc:2)和(db:3);
然后再分別遞歸d的兩個(gè)分支子樹(shù),第1個(gè)子樹(shù)中<b,a>與d同時(shí)出現(xiàn)只有1次,記為<(b:1),(a:1),(d:1)>,則不符合支持度閾值需剔除;
而第2個(gè)子樹(shù)中<b,c>與d同時(shí)出現(xiàn)有2次,記為<(b:2),(c:2),(d:2)>,則以d為前綴形成頻繁項(xiàng)規(guī)則(dbc:2);
至此,可以得出以d為前綴的頻繁項(xiàng)規(guī)則為(d:3),(dc:2),(db:3), (dcb:2)。同理,可得其他節(jié)點(diǎn)前綴的頻繁規(guī)則為(a:3),(ab:3),(b:5),(c:3),(cb:3)。
通過(guò)FP-growth構(gòu)建的生產(chǎn)工況間的關(guān)聯(lián)規(guī)則知識(shí)庫(kù)形成后,支持新的批次工況信息的實(shí)時(shí)導(dǎo)入,實(shí)現(xiàn)知識(shí)圖譜的動(dòng)態(tài)更新,為后續(xù)工況尋優(yōu)提供不斷優(yōu)化的基礎(chǔ)庫(kù)。
2基于知識(shí)庫(kù)的工況尋優(yōu)
(1)工況導(dǎo)入
在匹配尋優(yōu)之前,我們需要輸入除了加水比例、蒸汽比例等可操作的工況參數(shù),并基于此進(jìn)行歷史工況的尋優(yōu)以及操作參數(shù)的推薦。
其中部分工況信息是已經(jīng)確定的,例如物料流量、加料比例、當(dāng)前環(huán)境溫濕度,以及烘絲入口煙絲含水率標(biāo)準(zhǔn)值等,而部分工況信息則需要進(jìn)行另行計(jì)算或從外部獲取,如生產(chǎn)時(shí)長(zhǎng)=批次重量/物料流量;貯葉時(shí)長(zhǎng)則需導(dǎo)入MES生產(chǎn)運(yùn)行系統(tǒng)中的排產(chǎn)計(jì)劃進(jìn)行推導(dǎo);外部未來(lái)環(huán)境溫濕度需要獲取當(dāng)?shù)靥鞖忸A(yù)報(bào)數(shù)據(jù)等,通過(guò)一系列的信息維護(hù)最終完成工況導(dǎo)入。
(2)規(guī)則匹配
在尋優(yōu)前需對(duì)導(dǎo)入的工況進(jìn)行初始事務(wù)集劃分,即按前述劃分規(guī)則進(jìn)行工況屬性的初始化,構(gòu)造形如“a:(物料流量:2000)、b:(加料比例:3.0)”形式的工況屬性項(xiàng),并依此與知識(shí)庫(kù)中的關(guān)聯(lián)規(guī)則進(jìn)行遍歷匹配,定位與導(dǎo)入的工況屬性項(xiàng)有高相似度的工況事務(wù)集,其中相似度按屬性項(xiàng)的匹配數(shù)量進(jìn)行計(jì)算,本文將相似度大于80%的工況事務(wù)集定義為高相似度。
(3)尋優(yōu)推薦
當(dāng)定位到一組高相似度的工況事務(wù)集后,需將其對(duì)應(yīng)的歷史批次工況進(jìn)行還原,與本次導(dǎo)入的初始工況作原始數(shù)據(jù)精度的尋優(yōu)匹配,將其中相似度最高且滿足最終烘絲入口煙絲含水率標(biāo)準(zhǔn)的歷史批次進(jìn)行推薦,車間工藝員與操作工按該批次的加水比例、蒸汽比例數(shù)值進(jìn)行操作設(shè)置,即可生產(chǎn)出烘絲入口含水率達(dá)標(biāo)的煙絲。
3應(yīng)用與結(jié)果
(1)應(yīng)用數(shù)據(jù)選取
本文選取龍巖煙草工業(yè)有限責(zé)任公司制絲二區(qū)2018年1月1日-2020年12月31日某牌號(hào)煙絲在松散回潮、潤(rùn)葉加料、切絲烘絲三個(gè)工段共計(jì)11240個(gè)的生產(chǎn)批次數(shù)據(jù)進(jìn)行知識(shí)庫(kù)的構(gòu)建,并對(duì)2021年6月8日-14日實(shí)際生產(chǎn)的5個(gè)批次基于構(gòu)建的知識(shí)庫(kù)進(jìn)行工況尋優(yōu)應(yīng)用試驗(yàn)。
(2)應(yīng)用結(jié)果
通過(guò)知識(shí)庫(kù)尋優(yōu)后,5個(gè)批次的工況尋優(yōu)推薦結(jié)果如表4所示,其中4個(gè)批次都獲取到了高相似度的歷史批次推薦,并按照推薦值對(duì)加水比例和蒸汽比例進(jìn)行操作設(shè)置,而其中1個(gè)較極端工況的批次,工藝員也在低相似度工況的輔助下進(jìn)行了操作參數(shù)下達(dá),最終煙絲在烘絲入口的含水率均達(dá)到工藝標(biāo)準(zhǔn)要求(19.8±0.5),且含水率與標(biāo)準(zhǔn)的絕對(duì)差值平均為0.165。而表5為本文方法應(yīng)用前后同期煙絲含水率的各項(xiàng)對(duì)比數(shù)值,可以看出,通過(guò)本文工況尋優(yōu)推薦后的煙絲含水率在合格率和穩(wěn)定性上都有了一定提升。
4.總結(jié)
本文提出一種基于知識(shí)圖譜尋優(yōu)的煙絲含水率控制方法,通過(guò)對(duì)影響煙絲含水率關(guān)鍵工況的識(shí)別,從知識(shí)圖譜的批次實(shí)體出發(fā),導(dǎo)入歷史生產(chǎn)批次數(shù)據(jù),按照FP-growth關(guān)聯(lián)規(guī)則算法抽取批次與工況之間的相互關(guān)系,挖掘其關(guān)聯(lián)規(guī)則形成知識(shí)庫(kù)。當(dāng)有批次需要生產(chǎn)時(shí),只需提前將該批次已知工況導(dǎo)入知識(shí)庫(kù)進(jìn)行匹配尋優(yōu),即可檢索到相似度最高且最終烘絲入口煙絲含水率最接近標(biāo)準(zhǔn)值的歷史批次,通過(guò)將歷史最優(yōu)批次的相關(guān)參數(shù)操作進(jìn)行復(fù)刻,顯著提升了烘絲前煙絲含水率的合格率和穩(wěn)定性,同時(shí)改變了以往需要部分依靠經(jīng)驗(yàn)和主觀判斷的含水率控制模式,以數(shù)據(jù)驅(qū)動(dòng)企業(yè)高質(zhì)量發(fā)展。
但該尋優(yōu)方法仍存在少數(shù)極端工況無(wú)法檢索到優(yōu)質(zhì)歷史批次的情況,仍需加以人工輔助,未來(lái)將進(jìn)一步進(jìn)行極端工況的針對(duì)性模型學(xué)習(xí),讓知識(shí)庫(kù)得到更廣泛更有效的應(yīng)用。
參考文獻(xiàn)
[1] 邢蕾. 煙草制絲過(guò)程中含水率在線監(jiān)測(cè)及控制改進(jìn)[D]. 2016.
[2] 尤長(zhǎng)虹, 張楚安, 彭傳新. 制絲質(zhì)量評(píng)價(jià)方法的設(shè)計(jì)與應(yīng)用[J]. 煙草科技, 2001.
[3] 魏玉玲, 陰耕云, 李紹臣,等. 幾個(gè)重要制絲工序?qū)緹煙熃z填充值和碎絲率的影響[J]. 云南大學(xué)學(xué)報(bào):自然科學(xué)版, 2010(S1):183-186.
[4] 朱東風(fēng). 影響松散回潮后煙片含水率的分析與控制[J]. 科技創(chuàng)新導(dǎo)報(bào), 2013(21):94-95.
[5] 羊一濤, 周沅楨, 李杰,等. 烘絲工序物料含水率過(guò)程控制評(píng)價(jià)方法研究[C]// 中國(guó)煙草學(xué)會(huì)學(xué)術(shù)年會(huì)優(yōu)秀論文集. 0.
[6] 朱記偉, 蔣雅麗, 翟曌,等. 基于知識(shí)圖譜的國(guó)內(nèi)外BIM領(lǐng)域研究對(duì)比[J]. 土木工程學(xué)報(bào), 2018, v.51(02):113-120.
[7] Gottschalk S , Demidova E . EventKG: A Multilingual Event-Centric Temporal Knowledge Graph[J]. 2018.
[8] Mai G , Janowicz K , Cai L , et al. SE‐KGE: A location‐aware Knowledge Graph Embedding model for Geographic Question Answering and Spatial Semantic Lifting[J]. Transactions in GIS, 2020, 24(3).
[9] Grainger T , Aljadda K , Korayem M , et al. The Semantic Knowledge Graph: A compact, auto-generated model for real-time traversal and ranking of any relationship within a domain[J]. 2016.
[10] 王新宇, 杜孝平, 謝昆青. FP-growth算法的實(shí)現(xiàn)方法研究[J]. 計(jì)算機(jī)工程與應(yīng)用, 2004, 40(009):174-176.