亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于離散傅里葉變換的過程工業(yè)報警泛濫序列聚類分析及應用

        2016-05-11 02:13:32陳忠圣高慧慧徐圓朱群雄北京化工大學信息科學與技術學院北京100029
        化工學報 2016年3期
        關鍵詞:相似度聚類分析

        陳忠圣,高慧慧,徐圓,朱群雄(北京化工大學信息科學與技術學院,北京 100029)

        ?

        基于離散傅里葉變換的過程工業(yè)報警泛濫序列聚類分析及應用

        陳忠圣,高慧慧,徐圓,朱群雄
        (北京化工大學信息科學與技術學院,北京 100029)

        摘要:報警泛濫是過程工業(yè)報警管理中普遍存在且難以解決的問題。報警泛濫序列聚類分析有助于報警根源分析和預警。針對目前報警泛濫序列相似度測量方法存在的缺陷,如對報警序列長度限制、計算復雜、依賴參數(shù),采用基于離散傅里葉變換的方法在頻域對報警泛濫序列進行相似性分析,提出了離散傅里葉功率譜的歐氏距離作為度量報警泛濫序列相似度距離的方法,計算不同報警泛濫的相似度距離,再通過非加權組平均法獲得報警泛濫序列的聚類樹狀圖,根據相似度距離,確定報警泛濫的模式,幫助操作員確定異常根源,做出快速響應。TE仿真過程在不同干擾下的應用實例驗證了該方法的有效性、準確性。

        關鍵詞:報警泛濫序列;離散傅里葉變換;相似度;聚類分析

        2015-12-16收到初稿,2015-12-30收到修改稿。

        聯(lián)系人:朱群雄。第一作者:陳忠圣(1994—),男,碩士研究生。

        引 言

        報警系統(tǒng)通常為過程變量設置了4類報警限[1]: HH(高高)、H(高)、L(低)、LL(低低)。當過程變量超過了預先設置報警限,報警產生,報警系統(tǒng)記錄相應報警信息,主要包括報警時間(time)、報警變量(tag)、報警類型(alarm type)。由于報警系統(tǒng)的設計缺陷和維護不當,大量的誤報警和滋擾報警引發(fā)了報警泛濫。報警泛濫的存在,淹沒了許多關鍵報警,過量的報警,遠遠超出了操作員的處理水平,給操作員的決策和診斷帶來困難,嚴重威脅生產安全。

        EEMUA將報警泛濫定義為10 min內操作員遭遇至少10個報警[1-4]。近三十多年的研究成果為報警管理開發(fā)了各種方法和工具,但報警泛濫仍然是報警管理中難以解決的問題[3,5]。在基于相似性的技術框架下,異常序列檢測關鍵點是相似性度量[4]。文獻[6]采用字符串距離(Levenshtein距離)度量連續(xù)報警的相似度,結合動態(tài)規(guī)劃算法,計算編輯距離矩陣,用層次聚類的方法對連續(xù)報警聚類,解決了連續(xù)報警序列識別的問題,但當報警序列長度較長時,帶來較大的時間與計算開銷。文獻[7]采用基于Sorgenfrei系數(shù)和相關性時延分布的方法檢測相關報警,通過對時延進行統(tǒng)計分析,實現(xiàn)對關聯(lián)報警的識別,但計算復雜。文獻[8]采用高斯核函數(shù)將歷史報警數(shù)據轉換成連續(xù)的偽隨機時間序列以降低對誤報、漏報和抖動報警的影響,用SVD對報警聚類簇進行分解,制定多變量報警策略,但該方法依賴于高斯核函數(shù)的方差與偽隨機序列的采樣率的整定。文獻[9]采用帶時延的滑動窗口模型計算報警序列的相似度,通過結合報警序列相似度分析與過程數(shù)據的因果分析,解決連續(xù)報警傳播通道的識別問題,但報警序列的相似度依賴于時延的準確估計?;贒FT相似度測量是一種非比對的方法,計算簡單、實現(xiàn)方便、不依賴其他參數(shù)。目前,大多數(shù)序列相似度度量方法只在時域對序列進行相似性分析,而基于DFT相似度測量在頻域對序列進行相似性分析,且不受序列長度的影響。與許多非比對相似度測量方法不同,前者在變換前后不丟失序列信息,在序列分類和比較中更加準確[10]。

        為了克服已有的報警泛濫序列相似度度量方法計算復雜、依賴參數(shù)等缺陷,本文采用基于DFT相似度測量方法挖掘報警泛濫序列簇(模式)。以離散傅里葉功率譜的歐氏距離作為報警泛濫序列相似度距離的度量,計算報警泛濫序列間的距離矩陣,再通過非加權組平均法(unweighted pair group method with arithmetic mean,UPGMA)獲得報警泛濫序列的聚類樹狀圖,工作流程可歸納為4個步驟,如圖1所示。一個報警泛濫簇(模式)通常相應于一個特定的潛在異常(干擾),報警泛濫簇可通過對歷史報警聚類分析獲得,報警泛濫簇對應的根本原因,可由專家分析獲得。一旦發(fā)現(xiàn)當前發(fā)生的報警泛濫屬于某個報警泛濫簇,操作員可由此確定異常的根本原因,快速做出應對措施。因此,本文的方法在動態(tài)報警抑制方面具有潛在的應用前景。

        1 基于DFT相似度測量方法描述

        1.1 報警泛濫序列的二進制序列表示

        報警系統(tǒng)運行過程中,產生大量的報警數(shù)據,報警數(shù)據以報警日志的形式記錄在報警數(shù)據庫中[11]。設T為報警類型集,T={HH,H,L,LL},a(a∈T)表示一種報警類型。x(n)表示過程信號序列,xtp,a表示針對報警類型a的報警閾值,報警信號序列與過程信號序列x(n)之間的關系為

        圖1 基于離散傅里葉變換的報警序列聚類分析工作流程Fig.1 Work flow chart of discrete Fourier transform-based alarm flood sequence cluster analysis

        式中,n表示時間單元,a∈T。報警數(shù)據可由式(1)直接轉化成多報警的時間序列S。連續(xù)報警序列S={s,Ts,Te},表示處于時間間隔[Ts,Te]的先后報警序列。W={w,ts,te}是序列S上的寬度為Width的時間窗口,且W?S,ts>Ts,te<Te。給定第i個窗口Wi,起點時刻Ti,終點時刻Tend,窗口寬度Width=Tend?Ti,滑動步長step,報警序列S被分割成一系列等寬度的時間窗口。依據EEMUA制定的基準,若10 min內至少有10個報警產生,則視為報警泛濫。本文設定窗口寬度Width為10 min,統(tǒng)計窗口Wi內的報警個數(shù),若numi≥10,窗口Wi對應的序列Seqj為報警泛濫序列,i≥j,Seqj表示第j個報警泛濫序列。由式(1),報警泛濫序列Seq(n)可分解為4個子序列,xHH(n)、xH(n)、xL(n)、xLL(n)分別表示報警類型為高高(HH)、高(H)、低(L)、低低(LL)報警泛濫子序列。圖2列出了2個報警泛濫序列和相應的4個子序列。

        1.2 離散傅里葉變換

        圖2 用4個二進制序列表示報警泛濫序列Fig.2 Alarm flood sequence representation using 4 binary sequences

        圖3 TE過程工藝流程Fig.3 Process flow diagram of Tennessee Eastman process

        離散傅里葉變換是數(shù)字信號分析的重要工具,它能將時域上有限長信號的采樣變換為頻域上有限長的采樣序列。報警泛濫序列的離散傅里葉變換頻譜分析可以檢測出原始報警信號潛在的周期信息,識別重復報警,為預警提供信息。時域上長度為N的采樣信號序列xa(n)的離散傅里葉變換為

        令XHH(k)、XH(k)、XL(k)、XLL(k)分別表示報警子序列xHH(n)、xH(n)、xL(n)、xLL(n)的離散傅里葉變換。定義信號xa在頻率k下的離散傅里葉變換功率譜PS(k)為

        1.3 用DFT功率譜構建報警泛濫序列相似距離矩陣

        離散傅里葉變換給出了原始報警序列xa(n)在頻域中的唯一表達Xa(k),Xa(k)包含了完整的xa(n)信息。報警泛濫子序列xa(n)的DFT功率譜PS(k)包含了第k個位置的報警分布信息,因此采用DFT功率譜度量不同報警泛濫序列的相似度。

        由DFT功率譜的定義可知,不同長度的報警泛濫序列的DFT功率譜長度不同,所以原始的DFT功率譜不能直接用于度量不同長度報警泛濫序列相似性。采用均勻縮放變換[10]將不同長度的DFT功率譜轉化成相同長度的DFT功率譜。該方法將較短序列中一個或兩個連續(xù)的元素加入原始序列中,從而擴展原始序列。令PSN表示長度為N的原始DFT功率譜,PSM表示長度為M,由原始DFT功率譜PSN均勻縮放變換得到的擴展DFT功率譜,定義原始DFT功率譜PSN到擴展DFT功率譜PSM的均勻縮放變換

        圖4 不同干擾下報警泛濫序列聚類樹狀圖Fig.4 Dendrograms of alarm flood sequences under different disturbances

        M的大小取決于報警泛濫序列的最大長度。經過均勻縮放后,擴展DFT功率譜可直接用于度量不同長度報警泛濫序列的相似度。一個報警泛濫序列,對應一個M維頻域向量PSM,對于m個報警泛濫序列,有m個M維向量PSM1,PSM2,…,PSMm,計算向量PSM兩兩之間的歐氏距離,歸一化后,得到報警泛濫序列相似距離矩陣Dm×m。

        D(i,j) ∈[0,1],D(i,j)越接近1(0),報警泛濫序列Seqi和Seqj越相似(不相似)。

        2 實例研究

        2.1 TE過程

        TE過程[12-14](Tennessee Eastman process)用于化工過程模擬,是一個真實的化工仿真平臺。主要包含5個操作單元:兩相反應器、冷凝器、氣液分離器、回收壓縮機、汽提塔。該過程包括4個不可逆放熱反應,4種反應物,生成2種產品(G和H),伴隨1種副產品(F)產生,12個操縱變量,41個測量變量,20種過程干擾。工藝流程如圖3所示,TE過程部分干擾見表1。

        2.2 TE過程用UPGMA獲得報警泛濫序列的聚類樹狀圖

        圖5 報警泛濫序列比對(Seq 558與Seq 560,10個比對)Fig.5 Alarm flood sequences alignment(Seq 558 and Seq 560, number of alignment is equal to 10)

        報警泛濫序列聚類分析有助于報警根源分析和預警。通過聚類分析,可以找到不同報警泛濫序列的共同泛濫模式。通常,一個報警泛濫模式對應于一個異常狀況,獲取泛濫模式意味著找到了引發(fā)報警泛濫的根源。同時,通過相似性技術,若發(fā)生的報警與匹配池中的候選泛濫模式具有極高的相似性,能預測未來發(fā)生的報警情況,實現(xiàn)預警。

        表1 TE部分干擾[12]Table 1 Partial disturbances in TE process[12]

        UPGMA是一種自下而上的凝聚層次聚類方法,通過比較節(jié)點的相似距離,構造聚類樹狀圖。UPGMA工作過程為:首先將相似距離最小的2個節(jié)點聚成一簇,生成新的節(jié)點,再比較新節(jié)點與其他節(jié)點的相似距離,把相似距離最小的2個節(jié)點聚成一簇,如此反復,直到形成一棵完整的聚類樹。

        基于DFT相似度測量方法,得到報警泛濫序列相似距離矩陣D,再通過UPGMA進行聚類,獲得報警泛濫序列的聚類樹狀圖。

        圖6 報警泛濫序列比對(Seq 558與Seq 549,8個比對)Fig.6 Alarm flood sequences alignment(Seq 558 and Seq 549, number of alignment is equal to 8)

        運行TE過程15 h,將前2 h視作開車階段。為41個測量變量用3δ法設置H、L報警限,5δ法設置HH、LL報警限。為使系統(tǒng)狀態(tài)達到充分穩(wěn)定,讓系統(tǒng)運行時間足夠長,在開車階段后,分別施加干擾:IDV 1、IDV 2、IDV 4,共產生3 個12000組歷史數(shù)據集。IDV 1、IDV 2、IDV 4 是TE過程典型的干擾[14],相同干擾下產生的報警泛濫序列具有高度的相似性,通過UPGMA獲得聚類樹狀圖。

        圖7 用UPGMA方法獲得報警泛濫序列聚類樹狀圖Fig.7 Dendrograms of alarm flood sequences by UPGMA

        用基于游程分布定量測量的方法[15]消除抖動報警,合并5 s內出現(xiàn)的相同報警,對3個數(shù)據集消除抖動報警后的報警情況如表2所示。

        在干擾IDV 1下,時刻145~159和226~235對應的報警泛濫片段如圖2所示。通過基于DFT相似度測量方法,在DFT功率譜空間中,計算M維頻域向量PSM的歐氏距離,構造相似距離矩陣D,用UPGMA獲得干擾IDV 1、IDV 2、IDV 4下報警泛濫序列的相似距離聚類樹狀圖。圖4(a)~(c)分別顯示了在干擾IDV 1、IDV 2、IDV 4下32次報警泛濫序列的聚類結果。

        表2 不同干擾下的報警情況Table 2 Alarming results under different disturbances

        相似距離閾值將聚類樹狀圖劃分成不同的簇,相似距離閾值是根據聚類結果簡單設定的,而不是計算獲得的[16]。調整相似距離閾值,在0.5左右時,同一干擾下的報警泛濫序列基本聚為一類。由于同類干擾下,報警泛濫序列相似度高,因此本文用比對的方法驗證上述結果的合理性。以圖4(c)中報警泛濫序列Seq 558、Seq 560、Seq 549為例,序列Seq 558、Seq 560在聚類樹狀圖中直接鄰接,相似性較高,而Seq 558和Seq 549不直接鄰接,相似性較低。

        由圖5和圖6,序列Seq 558與Seq 560的比對個數(shù)比序列Seq 558與Seq 549的比對個數(shù)多。因此序列Seq 560比Seq 549更相似于Seq 558,驗證了圖4聚類結果的合理性。

        為了進一步論證聚類結果的正確性,分別隨機選取來自數(shù)據集1、2、3各20個報警泛濫序列,用基于DFT相似度測量方法處理后,再用UPGMA聚類,取得良好的聚類效果,如圖7所示。

        圖7中,來自數(shù)據集1(在干擾IDV 1下產生)的報警泛濫序列聚集到藍色一簇,來自數(shù)據集2(在干擾IDV 2下產生)的報警泛濫序列聚集到綠色一簇,來自數(shù)據集3(在干擾IDV 4下產生)的報警泛濫序列聚集到紅色一簇。除356/2等8個序列不能正確聚類外,其余序列均能正確聚類,準確度為86.67%。

        圖8 用k-means方法的聚類結果Fig.8 Clustering result by k-means method (k=3, silhouette=0.2379)

        為了更進一步驗證本文提出的基于DFT方法的有效性和UPGMA聚類算法的優(yōu)越性,采用上述相同數(shù)據集,先用基于DFT相似度測量方法計算相似距離矩陣,再用k-means方法進行聚類。多次選取不同的初始中心點k,最后確定k為3。用k-means方法的聚類結果如圖8所示,共有11個序列不能正確聚類,準確度為81.67%。

        3 結 論

        針對傳統(tǒng)的報警泛濫序列相似度度量方法計算復雜、依賴參數(shù)等缺陷,本文提出了DFT功率譜作為度量報警泛濫序列相似度距離的方法,結合

        UPGMA和k-means聚類方法,形成了一種適合解決過程工業(yè)報警泛濫的聚類分析方法,解決了報警泛濫模式匹配問題,在一定程度上抑制了報警泛濫現(xiàn)象。該方法計算簡單、實現(xiàn)方便、不依賴其他參數(shù)。TE仿真過程不同干擾下的應用實例表明,該方法準確、有效。

        References

        [1] ZHU J F, SU Y D, ZHAO J S, et al. A dynamic alarm management strategy for chemical process transitions [J]. Journal of Loss Prevention in the Process Industries, 2013, 30: 1-12.

        [2] EEMUA. Alarm Systems: A Guide to Design, Management and Procurement[M]. 2nd ed. London: Engineering Equipment and Materials Users’ Association, 2007.

        [3] JASON C L, PETER B ,MISCHA T, et al. Addressing alarm flood situations in the process industries through alarm summary display design and alarm response strategy [J]. International Journal of Industrial Ergonomics, 2014, 44: 395-406.

        [4] CHENG Y, IZADI I, CHEN T W. Pattern matching of alarm flood sequences by a modified Smith–Waterman algorithm [J]. Chemical Engineering Research and Design, 2013, 91: 1085-1094.

        [5] ZHU Q X, GAO H H, LIU F F, et al. Research process of alarm system in process industries [J]. Computers and Applied Chemistry, 2014, 31(2): 129-134.

        [6] AKATSUKA S, NODA M. Similarity analysis of sequential alarms in plant operation data by using levenshtein distance[C]// PSE ASIA, Proc. 6th International Conference on Process Systems Engineering. Kuala: PSE ASIA Press, 2013: 129-134.

        [7] YANG Z J, WANG J D, CHEN T W. Detection of correlated alarms based on similarity coefficients of binary data [J]. IEEE Transactions on Automation Science and Engineering, 2013, 10(4): 1014-1025.

        [8] YANG F, SHAH S L, XIAO D Y, et al. Improved correlation analysis and visualization of industrial alarm data [J].ISA Transactions, 2012, 51: 499-506.

        [9] WANG J, LI H G, HUANG, J W, et al. A data similarity based analysis to consequential alarms of industrial processes [J]. Journal of Loss Prevention in the Process Industries, 2015, 35: 29-34.

        [10] YIN C C, CHEN Y, STEPHEN S T Y. A measure of DNA sequence similarity by Fourier transform with applications on hierarchical clustering [J]. Journal of Theoretical Biology, 2014, 359: 18-28.

        [11] DANEELS A, SALTER W. What is scada?[C]//Trieste, InternationalConference on Accelerator and Large Experimental Physics Control Systems: Italy, Conf.Proc., 1999:339-343.

        [12] DOWNS J J, VOGEL E F. A plant-wide industry process control problem [J]. Computers Chem. Engng., 1993, 17(3):245-255.

        [13] LYMAN P R, GEORGAKIS C. Plant-wide control of the Tennessee Eastman process [J].Computers Chem. Eng., 1995, 19(3): 321-331.

        [14] KANADIBHOTLA R S, RIGGS J B. Nonlinear model based control of a recycle reactor process [J]. Computers Chem. Engng., 1995, 19(8): 933-948.

        [15] NAGHOOSI E, IZADI I, CHEN T W. Estimation of alarm chattering [J]. Journal of Process Control, 2011, 21: 1243-1249.

        [16] NISHIGUCHI J, TAKAI T. IPL2 and 3 performance improvement method for process safety using event correlation analysis [J]. Computers and Chemical Engineering, 2010, 34: 2007-2013.

        研究論文

        Received date: 2015-12-16.

        Foundation item: supported by the National Natural Science Foundation of China (61473026).

        Discrete Fourier transform-based alarm flood sequence cluster analysis and applications in process industry

        CHEN Zhongsheng, GAO Huihui, XU Yuan, ZHU Qunxiong
        (College of Information Science & Technology, Beijing University of Chemical Technology, Beijing 100029, China)

        Abstract:Alarm floods is a prevalent and difficult problem in alarm management of process industry. Alarm cluster analysis is helpful for alarm root cause analysis and alarm prediction. Aiming at the deficiencies of the current similarity measurement methods for alarm flood sequences, such as limitation of length of alarm sequences, computational complexity, depending on parameters, the discrete Fourier transform (DFT)-based method is employed to analysis on similarity among alarm flood sequences in the frequency domain. The Euclidean distance of the DFT power spectra of alarm flood sequences is proposed as a similarity distance metric for alarm floods, similarity distances of different alarm floods are evaluated. Dendrograms of alarm flood sequences by Unweighted Pair Group Method with Arithmetic mean (UPGMA) is obtained, according to similarity distance, determine the pattern of alarm floods and help operators identify the root cause of the abnormal for a rapid response. An application case of TE simulation process under different disturbances demonstrates validation and accuracy of the proposed method.

        Key words:alarm flood sequence; discrete Fourier transform; similarity; cluster analysis

        DOI:10.11949/j.issn.0438-1157.20151912

        中圖分類號:TP 277; TQ 086; TE 687

        文獻標志碼:A

        文章編號:0438—1157(2016)03—0788—09

        基金項目:國家自然科學基金項目(61473026)。

        Corresponding author:Prof. ZHU Qunxiong, zhuqx@buct.edu.cn

        猜你喜歡
        相似度聚類分析
        改進的協(xié)同過濾推薦算法
        模糊Petri網在油田開發(fā)設計領域的應用研究
        基于聚類分析研究貴州省各地區(qū)經濟發(fā)展綜合評價
        商情(2016年39期)2016-11-21 08:45:54
        新媒體用戶行為模式分析
        農村居民家庭人均生活消費支出分析
        大經貿(2016年9期)2016-11-16 16:16:46
        相似度算法在源程序比較中的應用
        基于省會城市經濟發(fā)展程度的實證分析
        中國市場(2016年33期)2016-10-18 12:16:58
        基于聚類分析的互聯(lián)網廣告投放研究
        科技視界(2016年20期)2016-09-29 12:32:48
        基于灰度的圖像邊緣檢測與匹配算法的研究
        “縣級供電企業(yè)生產經營統(tǒng)計一套”表輔助決策模式研究
        小妖精又紧又湿高潮h视频69| 亚洲一区二区女优av| 射进去av一区二区三区| 丰满少妇被猛烈进入高清播放 | 中文字幕人妻熟女人妻洋洋| 天天躁日日躁狠狠躁一区| 国产精品日本一区二区三区| 青青草狠吊色在线视频| 消息称老熟妇乱视频一区二区| 日本一本久道| 一区二区三区国产亚洲网站 | 日韩精品极品视频在线观看免费| 婷婷开心深爱五月天播播| 欧美片欧美日韩国产综合片| 精品视频一区二区三区日本| 国产成+人+综合+亚洲欧美丁香花| 成人国产精品999视频| 色综合久久五月天久久久| 亚洲av无一区二区三区| 性高湖久久久久久久久| 精品国产av无码一道| av是男人的天堂免费| 亚洲午夜无码毛片av久久| a级毛片在线观看| 小13箩利洗澡无码免费视频| 久久精品亚洲精品国产区| 亚洲av成人精品日韩在线播放| 欧美午夜一区二区福利视频| 一区二区三区午夜视频在线观看| 91九色人妻精品一区二区三区 | 亚洲国产精品免费一区| 女人av天堂国产在线| 色噜噜狠狠一区二区三区果冻| 国产欧美曰韩一区二区三区| 国产人妖伦理视频在线观看| 天堂网www资源在线| 波多野结衣视频网址| 少妇又色又爽又刺激的视频| 国内精品久久久久影院优| 人妻人人澡人人添人人爽人人玩| 毛片av中文字幕一区二区|