韋偉 胡亮 王偉偉 張玉
摘 ?要:在自動(dòng)化技術(shù)愈發(fā)成熟的背景下,卷煙工業(yè)設(shè)備功能復(fù)雜、精確度提高、設(shè)備之間的關(guān)聯(lián)性增強(qiáng),目前對(duì)設(shè)備的風(fēng)險(xiǎn)健康狀態(tài)評(píng)估僅停留在計(jì)劃性維修,難以保證設(shè)備的可靠性水平。文章結(jié)合煙廠設(shè)備的實(shí)際情況,從設(shè)備運(yùn)行積累的大量數(shù)據(jù)進(jìn)行挖掘,利用Apriori算法找出與工藝指標(biāo)存在關(guān)聯(lián)關(guān)系的參數(shù),利用熵權(quán)法確定權(quán)重。建立設(shè)備綜合健康狀態(tài)評(píng)價(jià)模型,計(jì)算出綜合健康指數(shù)來判斷設(shè)備的健康情況。最后通過案例分析驗(yàn)證了此方法的可用性,為設(shè)備維修保養(yǎng)的決策方案提供依據(jù)。
關(guān)鍵詞:卷煙工業(yè);健康狀態(tài)評(píng)價(jià);Apriori算法;健康指數(shù)
中圖分類號(hào):TP271 ? ?文獻(xiàn)標(biāo)志碼:B
DOI:10.13714/j.cnki.1002-3100.2023.09.012
Abstract: In the context of increasingly mature automation technology, the function of cigarette industry equipment is complex, the accuracy is improved, and the correlation between equipment is also enhanced. At present, the risk health status assessment of equipment only stays in the planned maintenance, which is difficult to ensure the reliability level of equipment. In this paper, combined with the actual situation of tobacco factory equipment, a large amount of data accumulated from the operation of equipment is mined, and the Apriori algorithm is used to find out the parameters associated with process indicators, and the entropy weight method is used to determine the weight. The comprehensive health status evaluation model of equipment is established, and the comprehensive health index is calculated to judge the health status of equipment. Finally, the feasibility of this method is verified by case analysis, which provides a basis for the decision-making scheme of equipment maintenance.
Key words: cigarette industry; assessment of health status; Apriori algorithm; health index
0 ?引 ?言
隨著自動(dòng)化技術(shù)在卷煙工業(yè)企業(yè)的廣泛應(yīng)用,卷煙工廠在設(shè)備運(yùn)行及產(chǎn)品生產(chǎn)過程中,積累了大量歷史數(shù)據(jù),在看似雜亂無章的數(shù)據(jù)中,卻記錄了設(shè)備真實(shí)的運(yùn)行狀態(tài)。在此背景下,通過對(duì)相關(guān)數(shù)據(jù)進(jìn)行深度研究和挖掘,開展設(shè)備健康風(fēng)險(xiǎn)的評(píng)價(jià),以確保設(shè)備的安全高效運(yùn)行。
設(shè)備健康度普遍用0到1的范圍來描述設(shè)備的健康狀態(tài),其中1代表設(shè)備十分健康,0表示設(shè)備處于故障狀態(tài)。目前有很多學(xué)者對(duì)設(shè)備的健康風(fēng)險(xiǎn)進(jìn)行研究。韋偉等[1]通過卷煙廠設(shè)備管理的實(shí)際需求,構(gòu)建TOPSIS模型作為核心算法,引入熵權(quán)法確定權(quán)重來進(jìn)行健康狀態(tài)的評(píng)價(jià)。楊帆等[2]提出一種基于最優(yōu)等級(jí)數(shù)的多位特征量開關(guān)柜健康狀態(tài)評(píng)價(jià)方法,解決了評(píng)價(jià)等級(jí)數(shù)的主觀設(shè)定問題。劉博元等[3]以系統(tǒng)運(yùn)行的實(shí)時(shí)大數(shù)據(jù)為基礎(chǔ),通過信息熵原理利用大數(shù)據(jù)分析的方法,對(duì)系統(tǒng)的健康度做出實(shí)時(shí)評(píng)估。袁偉中等[4]也有通過BP神經(jīng)網(wǎng)絡(luò)對(duì)設(shè)備參數(shù)進(jìn)行回歸估計(jì),獲得歷史數(shù)據(jù)和訓(xùn)練數(shù)據(jù),構(gòu)建殘差與參數(shù)分?jǐn)?shù)的映射關(guān)系,計(jì)算嚴(yán)重等級(jí)和工況運(yùn)行等級(jí)。趙麗琴等[5]提出利用指數(shù)函數(shù)對(duì)各參數(shù)的權(quán)重動(dòng)態(tài)變化進(jìn)行研究,來更精確地評(píng)價(jià)設(shè)備的健康度。李鑫等[6]采用基于模糊無量綱處理和改進(jìn)的層次分析法(AHP),結(jié)合綜合變權(quán)綜合原理對(duì)設(shè)備的健康狀態(tài)進(jìn)行評(píng)估。
如今煙廠設(shè)備的健康評(píng)價(jià)指標(biāo)與對(duì)應(yīng)參數(shù)的關(guān)系是人工預(yù)設(shè)好固定的,沒有對(duì)新的數(shù)據(jù)采集系統(tǒng)中實(shí)時(shí)采集的1 000多個(gè)參數(shù)(大數(shù)據(jù)環(huán)境)進(jìn)行一次挖掘,發(fā)現(xiàn)參數(shù)之間的關(guān)聯(lián)關(guān)系。通過TOPSIS法計(jì)算機(jī)平臺(tái)綜合評(píng)價(jià)得分的方法,僅靠最后得分來判斷設(shè)備健康狀態(tài)不夠嚴(yán)謹(jǐn)。本文通過研究每個(gè)關(guān)鍵參數(shù)與設(shè)備運(yùn)行過程中設(shè)備的各種狀態(tài)的關(guān)聯(lián)性,通過Apriori算法挖掘參數(shù)之間的關(guān)聯(lián)關(guān)系,進(jìn)而確定評(píng)價(jià)的參數(shù)指標(biāo)。利用熵權(quán)法客觀地對(duì)參數(shù)權(quán)重進(jìn)行確定。建立設(shè)備綜合健康狀態(tài)評(píng)價(jià)模型,對(duì)各指標(biāo)數(shù)據(jù)進(jìn)行綜合健康指數(shù)統(tǒng)計(jì),得出設(shè)備的健康狀態(tài),為設(shè)備的保養(yǎng)、維修的決策方案提供建議。
1 ?基本理論
1.1 ?基于Apriori算法的關(guān)聯(lián)規(guī)則挖掘
Apriori算法步驟的核心是使用一種稱為逐層搜索的迭代方法,其中K項(xiàng)集用于探索項(xiàng)K+1項(xiàng)集[7]。關(guān)聯(lián)規(guī)則的挖掘是一個(gè)兩步的過程,即先找出所有的頻繁項(xiàng)集,再由頻繁項(xiàng)集產(chǎn)生強(qiáng)關(guān)聯(lián)規(guī)則。具體步驟如下:
第一步:通過掃描數(shù)據(jù)庫,收集滿足最小支持度的項(xiàng),找出頻繁1項(xiàng)集的集合,該集合記為L。最小支持度的計(jì)算公式如下:
SupportA= ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?(1)
其中:A表示項(xiàng)集,D表示事務(wù)數(shù)據(jù)庫。
第二步:用L找出頻繁2項(xiàng)集的集合L,使用L找出L,如此下去,直到不能再找到頻繁K項(xiàng)集。每找出一個(gè)L需要一次數(shù)據(jù)庫的完整掃描。
第三步:由找出的頻繁項(xiàng)集產(chǎn)生強(qiáng)關(guān)聯(lián)規(guī)則。根據(jù)設(shè)定的置信度來判斷是否具有關(guān)聯(lián)規(guī)則,最小置信度的計(jì)算公式如下:
confidenceA∪B= ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? (2)
第四步:根據(jù)最小置信度篩選出具有相關(guān)性的參數(shù),算法結(jié)束。
Apriori算法使用頻繁項(xiàng)集的先驗(yàn)性質(zhì)來壓縮搜索空間,在大規(guī)模數(shù)據(jù)中尋找變量之間的有趣性關(guān)系,具體操程如圖1所示。
1.2 ?基于熵權(quán)法確定權(quán)重
熵權(quán)法的原理是從各項(xiàng)指標(biāo)所提供信息量的大小不同而確定其目標(biāo)權(quán)重的一種方法。這是一種客觀賦權(quán)法,其步驟主要如下:
(1)計(jì)算各二級(jí)指標(biāo)對(duì)一級(jí)指標(biāo)所占的比重,即第i個(gè)一級(jí)評(píng)價(jià)指標(biāo)第j項(xiàng)指標(biāo)占所有評(píng)價(jià)第j項(xiàng)指標(biāo)之和的比重。
p= ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? (3)
(2)計(jì)算第j項(xiàng)指標(biāo)的熵值E:
E=-plnp ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? (4)
其中:E>0, 若p=0時(shí),則E=0。
(3)計(jì)算第j項(xiàng)指標(biāo)的熵權(quán)W:
W= ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? (5)
但在實(shí)際處理中,第j項(xiàng)指標(biāo)差異越大,對(duì)評(píng)價(jià)的結(jié)果影響就越大,熵值則越小。因此,這里做進(jìn)一步處理。得到的熵值之間確定其權(quán)重,計(jì)算公式為:
W=, 0≤W≤1 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?(6)
W=1 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?(7)
通過構(gòu)建上述模型可以得到各個(gè)指標(biāo)的熵權(quán)W=w,w,…,w。
1.3 ?設(shè)備綜合健康狀態(tài)評(píng)價(jià)模型
健康指數(shù)是一種將設(shè)備健康程度進(jìn)行量化的指標(biāo),通過全面分析設(shè)備運(yùn)行中各指標(biāo)數(shù)據(jù)的狀態(tài)信息和實(shí)際運(yùn)作工況情況所得到的介于0和1之間的單一數(shù)值,其值越大表示設(shè)備的健康程度越高,1代表最優(yōu)狀態(tài),0代表處于完全失效[8]。健康指數(shù)的具體計(jì)算過程如下:
h= ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? (8)
其中:h為設(shè)備特征參數(shù)x的健康指數(shù);x為實(shí)際測(cè)量值,x和x是該參數(shù)的最小和最大值;是指該參數(shù)的最優(yōu)值。
基于卷接機(jī)組多設(shè)備綜合健康指數(shù)HI的表達(dá)式如下:
HI=wρh ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?(9)
其中:HI為基于設(shè)備狀態(tài)的系統(tǒng)綜合健康指數(shù),HI∈0,1;w是熵權(quán)法獲得各參數(shù)的權(quán)重;ρ是各指標(biāo)的權(quán)值,n是參數(shù)的個(gè)數(shù),m是指標(biāo)數(shù)目。
根據(jù)卷煙工業(yè)的實(shí)際生產(chǎn)經(jīng)驗(yàn),建立設(shè)備系統(tǒng)健康指數(shù)與運(yùn)行狀況評(píng)價(jià)等級(jí)之間的映射關(guān)系,對(duì)設(shè)備健康狀態(tài)劃分為4個(gè)等級(jí),如表1所示。
2 ?模型計(jì)算應(yīng)用實(shí)例
以某卷煙廠設(shè)備機(jī)組為例,機(jī)組中存在大量運(yùn)行數(shù)據(jù),設(shè)備健康狀態(tài)的預(yù)估始終只能根據(jù)事后數(shù)據(jù)顯示,無法利用運(yùn)行數(shù)據(jù)提前預(yù)知對(duì)設(shè)備的維護(hù)保養(yǎng)。且對(duì)設(shè)備的輪保無法做到合理化安排,使設(shè)備維護(hù)保養(yǎng)更加科學(xué)化和明細(xì)化。本文提出對(duì)設(shè)備即時(shí)的評(píng)價(jià)模型步驟主要有以下幾步:
首先從各系統(tǒng)中獲取大量的設(shè)備實(shí)時(shí)數(shù)據(jù),將它們存入格式化的表格中,再將這些大數(shù)據(jù)進(jìn)行清洗和數(shù)據(jù)預(yù)處理,獲得篩選數(shù)據(jù)。利用這些數(shù)據(jù)進(jìn)行Apriori算法來尋找哪些參數(shù)的變動(dòng)對(duì)設(shè)定的指標(biāo)之間存在同步的關(guān)系,從而確定評(píng)價(jià)指標(biāo);第二步是利用這些參數(shù)的標(biāo)準(zhǔn)值和閾值來對(duì)實(shí)時(shí)收集的參數(shù)進(jìn)行健康度的計(jì)算;第三步是利用熵權(quán)法計(jì)算出評(píng)價(jià)指標(biāo)的權(quán)重;最后利用健康度和權(quán)重對(duì)設(shè)備綜合健康狀態(tài)進(jìn)行評(píng)估。具體流程如圖2所示:
2.1 ?評(píng)級(jí)指標(biāo)的挖掘
設(shè)備系統(tǒng)中每2秒采集一次數(shù)據(jù),且設(shè)置有1 000多個(gè)傳感器,且數(shù)據(jù)量巨大,根據(jù)卷接機(jī)組設(shè)備采集的數(shù)據(jù)形式,無法直接使用Apriori算法進(jìn)行運(yùn)行,必須做一次數(shù)據(jù)處理。具體做法如下:
步驟1:去除重復(fù)值,得到數(shù)據(jù)表。
步驟2:將數(shù)據(jù)表轉(zhuǎn)化為稀疏矩陣。即每一個(gè)參數(shù)與本身上一個(gè)狀態(tài)相比,若改變了記為1,若沒有變動(dòng)就記為0。
步驟3:對(duì)狀態(tài)性固定指標(biāo)數(shù)據(jù)進(jìn)行去除,即稀疏矩陣中全為0的列的參數(shù)。
步驟4:對(duì)累計(jì)變化量數(shù)據(jù)進(jìn)行去除,即稀疏矩陣中全為1的列的參數(shù)。
固定其第一列,因數(shù)據(jù)巨大,僅展示部分?jǐn)?shù)據(jù)預(yù)處理的結(jié)果,如表2所示。
利用Python語言編程對(duì)Apriori算法實(shí)現(xiàn),使用了Pycharm開發(fā)調(diào)試工具,在Windows10操作系統(tǒng)下進(jìn)行運(yùn)行。設(shè)置的置信度為80%,支持度為20%,根據(jù)控制變量法,每次只改變第一列數(shù)據(jù),觀察數(shù)據(jù)變化。以煙支空頭平均剔除率為例,如表3所示。
2.2 ?卷接機(jī)組設(shè)備評(píng)價(jià)計(jì)算結(jié)果
根據(jù)選擇出來的參數(shù),依據(jù)式(3)至式(7)計(jì)算出各參數(shù)的權(quán)值,再根據(jù)式(8)對(duì)其參數(shù)的健康指數(shù)進(jìn)行計(jì)算,具體的計(jì)算結(jié)果如表4所示。
由公式(9)計(jì)算得到卷接設(shè)備綜合健康指數(shù)值HI為0.660,可知該卷包設(shè)備運(yùn)行狀態(tài)處于建議輪保狀態(tài)。
3 ?結(jié) ?論
通過對(duì)設(shè)備參數(shù)大數(shù)據(jù)的關(guān)聯(lián)關(guān)系挖掘,更好地發(fā)現(xiàn)參數(shù)之間的關(guān)系,不預(yù)先確定參數(shù)進(jìn)行設(shè)備健康的評(píng)價(jià),更具有一定的客觀性。建立了多特征參數(shù)健康狀態(tài)評(píng)價(jià)模型,將參數(shù)的波動(dòng)情況集中到整體設(shè)備的健康狀態(tài)評(píng)價(jià),并進(jìn)行量化,進(jìn)而判斷設(shè)備的健康情況。從而更接近做到事前維修保養(yǎng)。對(duì)設(shè)備的維護(hù)保養(yǎng)更加精細(xì),更有利于提高生產(chǎn)效率。
參考文獻(xiàn):
[1] 韋偉,戴文靜. 基于改進(jìn)TOPSIS法的健康評(píng)價(jià)模型研究[J]. 設(shè)備管理與維修,2021(13):17-19.
[2] 楊帆,鄧一帆,李東東,等. 基于最優(yōu)等級(jí)數(shù)的多維特征量開關(guān)柜健康狀態(tài)評(píng)價(jià)方法[J]. 高電壓技術(shù),2020,46(11):3934-3942.
[3] 劉博元,王煥鋼,范文慧,等. 基于大數(shù)據(jù)的復(fù)雜生產(chǎn)線系統(tǒng)健康度實(shí)時(shí)評(píng)估方法[J]. 清華大學(xué)學(xué)報(bào)(自然科學(xué)版),2014,54(10):1377-1383.
[4] 袁偉中,沈利,鄭必君,等. 基于多維參數(shù)動(dòng)態(tài)偏差的電廠設(shè)備健康評(píng)價(jià)方法[J]. 信息技術(shù)與信息化,2021(11):48-51.
[5] 趙麗琴,劉昶,易發(fā)勝. 基于動(dòng)態(tài)權(quán)重的設(shè)備健康狀態(tài)評(píng)估方法[J]. 計(jì)算機(jī)系統(tǒng)應(yīng)用,2020,29(9):198-204.
[6] 李鑫,劉瑩瑩,李贛華,等. 基于模糊變權(quán)原理的衛(wèi)星健康評(píng)估方法[J]. 系統(tǒng)工程與電子技術(shù),2014,36(3):476-480.
[7] 劉文雅,徐永能. 基于改進(jìn)Apriori算法的地鐵故障關(guān)聯(lián)規(guī)則挖掘[J]. 兵器裝備工程學(xué)報(bào),2021,42(12):210-215.
[8] 張彥如,耿夢(mèng)曉. 基于健康指數(shù)的設(shè)備運(yùn)行狀態(tài)評(píng)價(jià)與預(yù)測(cè)[J]. 合肥工業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版),2015,38(10):1318-1323.