周彩云,何曙光
(天津大學(xué) 管理與經(jīng)濟(jì)學(xué)部,天津 300072)
?
基于RTC方法的EWMA控制圖研究
周彩云,何曙光
(天津大學(xué) 管理與經(jīng)濟(jì)學(xué)部,天津 300072)
在現(xiàn)代生產(chǎn)制造系統(tǒng)中,快速檢測制造過程產(chǎn)品質(zhì)量特性的偏移,對(duì)于確保過程穩(wěn)定運(yùn)行具有重要作用。基于實(shí)時(shí)對(duì)比(Real Time Contrasts, RTC)方法,以隨機(jī)森林作為分類器,分別構(gòu)造了多元過程監(jiān)控的休哈特(Shewhart)類控制圖和指數(shù)加權(quán)移動(dòng)平均(Exponentially Weighted Moving Average, EWMA)控制圖。最后通過仿真實(shí)驗(yàn),對(duì)10維和100維多元正態(tài)分布過程和2維的非正態(tài)過程監(jiān)控的平均運(yùn)行鏈長(Average Run Length, ARL)進(jìn)行了比較分析,結(jié)果表明,基于RTC方法的EWMA控制圖在監(jiān)控高維復(fù)雜數(shù)據(jù)偏移上具有一定的優(yōu)勢。
多元過程控制;實(shí)時(shí)對(duì)比;隨機(jī)森林;平均運(yùn)行鏈長;EWMA控制圖
統(tǒng)計(jì)過程控制是用來檢測正常生產(chǎn)過程中產(chǎn)品質(zhì)量特性的異常波動(dòng),從而對(duì)生產(chǎn)過程的異常趨勢進(jìn)行預(yù)警。隨著現(xiàn)代制造系統(tǒng)的不斷發(fā)展特別是自動(dòng)化傳感設(shè)備在制造過程中的廣泛使用,研究人員在制造過程中可以實(shí)時(shí)采集到大量質(zhì)量數(shù)據(jù)。此外,數(shù)據(jù)的維度隨著制造系統(tǒng)復(fù)雜度的增加而不斷增加,數(shù)據(jù)往往不再服從簡單分布并且具有分類型數(shù)據(jù)和數(shù)值型數(shù)據(jù)混合等特征,從而對(duì)傳統(tǒng)的多元統(tǒng)計(jì)過程控制技術(shù)提出了新的要求[8]。
在多元控制領(lǐng)域,Hotelling[1]的T2控制圖,Lowry等[2]的MEWMA控制圖,Crosier[3]的MCUSUM控制圖等傳統(tǒng)的多元控制方法均已被用來檢測多元過程變化。作為休哈特類型的控制圖,T2控制圖僅使用當(dāng)前樣本的信息對(duì)過程進(jìn)行監(jiān)控,因而對(duì)中小偏移的檢測并不敏感。針對(duì)這一問題,Crosier[3]提出了多元累積和控制圖(MCUSUM),Lowery等[2]提出了多元指數(shù)加權(quán)移動(dòng)平均控制圖(MEWMA)。此外,T2控制圖假設(shè)變量服從多元正態(tài)分布,然而在復(fù)雜制造過程中,質(zhì)量數(shù)據(jù)往往并不服從正態(tài)分布,甚至分布很難驗(yàn)證。為解決這一問題,Hwang等[4]提出了人工對(duì)比方法,將監(jiān)控問題轉(zhuǎn)換成有監(jiān)督的學(xué)習(xí)問題。在人工對(duì)比方法的基礎(chǔ)上,Hu和Runger等[6]用時(shí)間加權(quán)信息來控制人工對(duì)比方法產(chǎn)生的監(jiān)控統(tǒng)計(jì)量,提高了人工對(duì)比方法的性能;Li等[7]用人工對(duì)比方法考慮了變點(diǎn)問題。
隨著數(shù)據(jù)維度的增加,比如過程維度p高達(dá)100時(shí),T2統(tǒng)計(jì)量的監(jiān)控效率會(huì)大大降低。Deng等[8]提出了實(shí)時(shí)對(duì)比(RTC)方法,它不僅可以檢測高維度復(fù)雜數(shù)據(jù)的偏移,同時(shí)對(duì)多元正態(tài)分布和非正態(tài)分布數(shù)據(jù)的偏移都適用。在Deng的文章中,Deng等[8]采用的休哈特(Shewhart)控制圖存在對(duì)小變異不敏感的情況?;诖?,本文采用RTC方法,并運(yùn)用EWMA控制圖對(duì)RTC統(tǒng)計(jì)量進(jìn)行監(jiān)控, 將RTC方法和EWMA控制圖的優(yōu)勢結(jié)合起來,以提高過程監(jiān)控的效果。
仿真實(shí)驗(yàn)在matlab2010環(huán)境下進(jìn)行,研究了對(duì)10維和100維的多元正態(tài)分布數(shù)據(jù)以及2維的非正態(tài)數(shù)據(jù)的平均運(yùn)行鏈長(Average Run Length, ARL),并對(duì)EWMA控制圖和Shewhart控制圖監(jiān)控RTC統(tǒng)計(jì)量的仿真結(jié)果進(jìn)行了比較。
假設(shè)有一個(gè)受控參考數(shù)據(jù)集S0=R1,R2,...,RN1(參考數(shù)據(jù)通常在正常生產(chǎn)條件下搜集得到),樣本個(gè)數(shù)為N1,參考數(shù)據(jù)集的分布f0(R)未知。生產(chǎn)過程中單個(gè)觀測值可以不斷地被獲取,在每一時(shí)刻t,從系統(tǒng)獲得一個(gè)p維的觀測結(jié)果值。這些實(shí)時(shí)獲取的數(shù)據(jù)流被定義為S1=Xi|i=1,2,...,t,其中t代表當(dāng)前時(shí)間點(diǎn),Xi代表當(dāng)前的觀測值。
將參考數(shù)據(jù)集S0和滑窗中的實(shí)時(shí)數(shù)據(jù)集XW(t)標(biāo)記上不同的類標(biāo)簽。S0的類別標(biāo)記為1,XW(t)的類別標(biāo)記為0。定義一個(gè)變量y來表示數(shù)據(jù)集的類別標(biāo)簽,記
此時(shí),問題被轉(zhuǎn)化成有監(jiān)督的學(xué)習(xí)問題。
選取一個(gè)合適的監(jiān)督學(xué)習(xí)工具對(duì)兩類數(shù)據(jù)集進(jìn)行訓(xùn)練,根據(jù)監(jiān)督工具輸出的結(jié)果得到參考數(shù)據(jù)集和實(shí)時(shí)數(shù)據(jù)流的類別概率估計(jì)值。
本文定義以下步驟來利用RTC方法得到監(jiān)控模型的監(jiān)控統(tǒng)計(jì)量,即類別概率估計(jì)值:
1)將收集到的正常狀態(tài)下的參考數(shù)據(jù)集S0與滑窗中的實(shí)時(shí)觀測數(shù)據(jù)流XW(t)結(jié)合在一起,得到矩陣X={R1,R2,...,RN1,Xi,Xi+1,...,Xw+i-1},其中i=1,2,...,n-w+1;
2)將參考數(shù)據(jù)集S0類別標(biāo)記為0,滑窗中的實(shí)時(shí)數(shù)據(jù)流XW(t)的每個(gè)觀測值類別均標(biāo)記為1;
3)用監(jiān)督學(xué)習(xí)工具對(duì)數(shù)據(jù)樣本進(jìn)行訓(xùn)練,此處選用隨機(jī)森林(randomforest)作為監(jiān)督學(xué)習(xí)工具;
4)將滑窗中的數(shù)據(jù)集輸入訓(xùn)練過的決策樹(DecisionTree,DT)模型中
5)獲取滑窗中實(shí)時(shí)數(shù)據(jù)流XW(t)的每個(gè)觀測值被歸為類別1的概率,這個(gè)概率值被定義為p(Xk|t),其中k=i,i+1,...,i+w-1;
RTC方法獲取監(jiān)控統(tǒng)計(jì)量的流程圖如圖1所示。
圖1 RTC方法獲取監(jiān)控統(tǒng)計(jì)量
此處分類工具選取的是隨機(jī)森林(randomforest),randomforest利用Breiman的隨機(jī)森林算法(基于Breiman和Cutler的初始Fortran代碼)來進(jìn)行分類和回歸[9]。隨機(jī)森林是由多個(gè)決策樹構(gòu)成的集成分類器,以此來提高單個(gè)決策樹的分類性能。它通過對(duì)大量的分類樹的計(jì)算得到分類結(jié)果。在輸入向量中對(duì)一個(gè)新對(duì)象分類,將輸入向量放到每個(gè)樹下。每棵樹將給出其分類信息,所有的樹對(duì)其分類信息進(jìn)行打分。隨機(jī)森林將在所有樹中搜尋得分最高的打分結(jié)果。相對(duì)于人工神經(jīng)網(wǎng)絡(luò)(ANN)和支持向量機(jī)(SVMs)來說,隨機(jī)森林自身具有以下優(yōu)點(diǎn):
1)可以有效的處理大量數(shù)據(jù);
2)在不去除變量的情況下,處理數(shù)以千計(jì)的輸入變量;
3)給出變量在分類中的重要值估計(jì);
4)在森林建立過程中生成一個(gè)內(nèi)部無偏的總體誤差估計(jì);
5)對(duì)于樣本量不等的數(shù)據(jù)集,可以平衡誤差[10]。
此外,它擁有的特征選擇算法不僅可以降低模型復(fù)雜度,還可以提高模型的解釋能力。
ARL0代表過程受控時(shí)的平均運(yùn)行鏈長,即當(dāng)過程受控時(shí),控制圖檢測到一個(gè)失控信號(hào)所需要的觀測值的平均個(gè)數(shù)。ARL1代表過程失控時(shí)的平均運(yùn)行鏈長,即當(dāng)偏移產(chǎn)生時(shí),控制圖檢測到一個(gè)失控信號(hào)所需要的觀測值的平均個(gè)數(shù)。通常情況下,給定過程受控狀態(tài)的平均運(yùn)行鏈長ARL0,調(diào)整受控狀態(tài)下的控制線(controllimit,CL),接著根據(jù)受控狀態(tài)調(diào)整得到的控制線模擬失控狀態(tài)的平均運(yùn)行鏈長ARL1;模擬得到的失控平均鏈長(ARL1)越小,代表控制圖的檢測效果越好。
使用蒙特卡洛方法模擬10維和100維的受控?cái)?shù)據(jù)各100個(gè),受控?cái)?shù)據(jù)服從f0(X)分布,均值向量為零向量,協(xié)方差矩陣為單位協(xié)方差矩陣,將這些數(shù)據(jù)集作為各自的參考數(shù)據(jù)集S0。然后分別模擬10維和100維的受控?cái)?shù)據(jù)100個(gè),失控?cái)?shù)據(jù)100個(gè),數(shù)據(jù)均服從多元正態(tài)分布。受控?cái)?shù)據(jù)均值向量為零向量,失控?cái)?shù)據(jù)的均值偏移設(shè)定為前五個(gè)變量均值各偏移1。變量間協(xié)方差矩陣均為單位協(xié)方差矩陣。
偏移的大小由下面的公式得出:
其中μ1和μ2分別是偏移前后的均值向量,∑是單位協(xié)方差矩陣。
圖
圖
圖
圖
利用EWMA控制圖監(jiān)控時(shí),時(shí)間加權(quán)信息被考慮進(jìn)來。
Ζi=λpi+(1-λ)Ζi-1
其中Z0=0,λ是平滑系數(shù),pi是t時(shí)刻計(jì)算得到的RTC統(tǒng)計(jì)量:
同理,每當(dāng)Zi≥CL0時(shí),得到一個(gè)運(yùn)行鏈長RLk,計(jì)算使ARL接近200的控制線CL。
模擬失控?cái)?shù)據(jù)時(shí),由于滑窗內(nèi)需要十個(gè)數(shù)據(jù),而我們每次觀測得到的數(shù)據(jù)是單個(gè)觀測值,所以t=1時(shí)刻,滑窗中前九個(gè)數(shù)據(jù)仍為受控?cái)?shù)據(jù)。第十個(gè)數(shù)據(jù)開始為失控觀測數(shù)據(jù),以后每一時(shí)刻觀測得到的失控?cái)?shù)據(jù)依次移入滑窗中。根據(jù)受控狀態(tài)下的控制線CL,計(jì)算失控狀態(tài)下平均運(yùn)行鏈長。
對(duì)于非正態(tài)分布數(shù)據(jù)偏移的監(jiān)控情況,本文參考Deng和Runger[8]的文章中提到的2維非正態(tài)分布關(guān)系,即X2=X12+ε,其中X1服從[-2,2]的均勻分布,ε服從標(biāo)準(zhǔn)正態(tài)分布。參考數(shù)據(jù)為100個(gè),偏移設(shè)定為從聯(lián)合分布偏移到多元正態(tài)分布。仿真模擬過程與多元正態(tài)過程類似,觀測數(shù)據(jù)仍用滑窗處理。受控狀態(tài)下,ARL0仍設(shè)定為200。最后,將基于RTC方法的EWMA控制圖模擬的失控平均運(yùn)行鏈長ARL1與Shewhart類控制圖以及Deng和Runger[8]的文章中運(yùn)用MEWMA控制圖監(jiān)控的失控平均鏈長對(duì)比。Deng和Runger[8]的文章中提到,MEWMA控制圖監(jiān)控2維非正態(tài)分布數(shù)據(jù)的受控平均鏈長接近200時(shí),失控平均鏈長大于200。
表1為基于RTC方法的EWMA控制圖和Shewhart控制圖監(jiān)控10維和100維正態(tài)分布數(shù)據(jù)偏移狀態(tài)下平均運(yùn)行鏈長(ARL1)以及傳統(tǒng)的多元控制圖的監(jiān)控結(jié)果。
表1 10維和100維多元正態(tài)分布數(shù)據(jù)ARL0和ARL1模擬結(jié)果
表2為基于RTC方法的EWMA控制圖和Shewhart監(jiān)控2維非正態(tài)分布數(shù)據(jù)偏移狀態(tài)下平均運(yùn)行鏈長結(jié)果。
表2 2維非正態(tài)分布數(shù)據(jù)(X2=X12+ε)ARL0和ARL1模擬結(jié)果
由表2結(jié)果可知,基于RTC方法的EWMA控制圖監(jiān)控效果優(yōu)于Shewhart類控制圖;且EWMA控制圖的平滑系數(shù)λ=0.7時(shí),2維非正態(tài)分布數(shù)據(jù)失控平均鏈長最小。這一結(jié)果也遠(yuǎn)小于運(yùn)用MEWMA控制圖監(jiān)控2維非正態(tài)分布數(shù)據(jù)的失控平均鏈長。
RTC方法是一種有效的監(jiān)控高維復(fù)雜系統(tǒng)的方法;EWMA控制圖對(duì)制造過程中質(zhì)量特性小偏移敏感。本文將二者的優(yōu)勢結(jié)合起來,基于RTC方法構(gòu)建EWMA控制圖和Shewhart控制圖。通過仿真實(shí)驗(yàn),模擬了10維和100維多元正態(tài)分布數(shù)據(jù)和2維非正態(tài)分布(X2=X12+ε)數(shù)據(jù)的偏移情況。仿真實(shí)驗(yàn)結(jié)果表明,RTC方法結(jié)合EWMA控制圖在監(jiān)控高維復(fù)雜數(shù)據(jù)偏移上具有一定優(yōu)勢。
[1]Hotelling,H.Multivariatequalitycontrol-illustratedbytheairtestingofsamplebombsights.InTechniquesofStatisticalAnalysis, 1947:111-184.
[2]Lowry,C,Woodall,W,Champ,C.andRigdon,S.,Amultivariateexponentiallyweightedmovingaveragechart.Technometrics, 1992, 34: 46-53.
[3]Crosier,R.B.Multivariategeneralizationsofcumulativesumqualitycontrolschemes.Technometrics, 1988, 30(3): 291-303.
[4]Hwang,W.,Runger,G.,andTuv,E.Multivariatestatisticalprocesscontrolwithartificialcontrasts.IIETransactions, 2007, 39(6): 659-669.
[5]Hu,J., Runger, G., and Tuv, E. Tuned artificial contrasts to detect signals. International Journal of Production Research, 2007, 45(23): 5527-5534.
[6]Hu, J., Runger, G. Time-based detection of changes to multivariate patterns. Annals of Operations Research, 2010, 174(1): 67-81.
[7]Li, F., Runger, G.C., and Tuv, E. Supervised learning for change-point detection. International Journal of Production Research, 2006, 44(14): 2853-2868.
[8]Deng H., Runger G., and Tuv, E. System monitoring with real-time contrasts. Journal of Quality Technology, 2012, 44(1): 9-27.
[9]Breiman L, Friedman J, Olshen R, Stone C. Classification and Regression Trees.1984.
[10]Breiman L. Random forests, Machine Learning, 2001, 45(1): 5-32.
[11]Breiman L. Bagging Predictors. Machine Learning, 1996, 26(2): 123-140.
[12]張祥敢,劉長安,方文濤.基于改進(jìn)BP神經(jīng)網(wǎng)絡(luò)的控制圖模式識(shí)別系統(tǒng)[J].組合機(jī)床與自動(dòng)化加工技術(shù),2011(9): 43-46.
[13]郭紅旗,王春峰.統(tǒng)計(jì)過程控制在制造數(shù)據(jù)質(zhì)量中的應(yīng)用[J].組合機(jī)床與自動(dòng)化加工技術(shù),2007(10): 103-105.
(編輯 李秀敏)
Research on EWMA Control Chart with RTC Method
ZHOU Cai-yun,HE Shu-guang
(School of Management and Economics,Tianjin University,Tianjin 300072,China)
Detection of product quality characteristic changes is significant to ensure the stable operation of multivariate process in modern manufacturing industries. This paper uses RTC method and applies random forest as classifying tool to construct Shewhart-type control chart and EWMA control chart of multivariate process monitoring respectively. Then, numerical examples are used to calculate and analyze ARLs of 10&100 dimensional normal data and 2 dimensional non-normal data. Results show that the method of EWMA control chart combining RTC statistic is effective and better than other methods in monitoring high dimensional complex data.
multivariate statistical process control, real time contrasts, random forest, average run length, EWMA control chart
1001-2265(2014)01-0057-04
10.13462/j.cnki.mmtamt.2014.01.016
收稿日期:2013-05-13;修回日期:2013-06-15
周彩云(1988—),女,湖北襄陽人,天津大學(xué)碩士研究生,研究方向?yàn)橘|(zhì)量管理,(E-mail)zhoucaiyun2007@126.com;通訊作者:何曙光(1975—),男,內(nèi)蒙古人,天津大學(xué)教授,博士,研究方向?yàn)橘|(zhì)量工程,(E-mail)huguanghe@tju.edu.cn。
TH165;TG65
A