張 媛,陳 震,潘爾順,奚立峰
(上海交通大學(xué) 機(jī)械與動(dòng)力工程學(xué)院,上海 200240)
統(tǒng)計(jì)過程控制(Statistical Process Control, SPC)是廣泛應(yīng)用于現(xiàn)代質(zhì)量管理的控制方法,休哈特控制圖是其中常用的工具。傳統(tǒng)的SPC理論基于一個(gè)基本假設(shè):過程的觀測(cè)數(shù)據(jù)相互獨(dú)立。然而在現(xiàn)代化的制造環(huán)境下,過程數(shù)據(jù)往往具有一定的自相關(guān)性,如果仍運(yùn)用常規(guī)控制圖進(jìn)行過程監(jiān)控,則會(huì)造成大量的虛發(fā)警報(bào),對(duì)質(zhì)量管理工作產(chǎn)生誤導(dǎo)[1]。
自20世紀(jì)70年代,許多學(xué)者展開了對(duì)自相關(guān)過程進(jìn)行有效統(tǒng)計(jì)控制的研究。文獻(xiàn)[2]使用過程原始觀測(cè)值構(gòu)建控制圖,通過調(diào)整控制限使數(shù)據(jù)間的自相關(guān)性消失。Alwan等[3]率先提出的殘差控制圖,通過對(duì)自相關(guān)數(shù)據(jù)擬合自回歸移動(dòng)平均模型(Auto-Regressive and Moving Average models, ARMA),得到觀測(cè)值與擬合值的殘差序列,由時(shí)間序列理論可知,殘差序列是獨(dú)立同分布的,因此能夠運(yùn)用常規(guī)控制圖進(jìn)行分析監(jiān)控,這也是該領(lǐng)域的主流研究方向。Lu等[4]對(duì)比分析了Shewhart、CUSUM控制圖對(duì)一階自相關(guān)過程數(shù)據(jù)的殘差序列具有不同的檢測(cè)效果;Dawod等[5]研究了基于魯棒性和高效率的ARMA選型問題。此外,也有學(xué)者提出,結(jié)合使用SPC和工業(yè)過程控制(Engineering Process Control, EPC),能更有效地提高過程質(zhì)量并降低成本[6]。近些年,在自相關(guān)控制圖的研究中加入貝葉斯理論和神經(jīng)網(wǎng)絡(luò)等技術(shù)成為一種趨勢(shì)[7-8]。何楨等[9]以神經(jīng)網(wǎng)絡(luò)特有的模式識(shí)別技術(shù)監(jiān)控自相關(guān)過程中的均值突變;Pan等[10]研究了用向量自回歸模型擬合多元自相關(guān)過程;崔敬巍等[11]提出以貝葉斯動(dòng)態(tài)模型為基礎(chǔ)的自相關(guān)控制圖,具有建模迅速的優(yōu)勢(shì)。
與神經(jīng)網(wǎng)絡(luò)類似,隱馬爾科夫(Hidden Markov Models, HMM)模型也是一種有效的預(yù)測(cè)算法,是語(yǔ)音識(shí)別、圖像處理等領(lǐng)域內(nèi)的重要工具。關(guān)于HMM改進(jìn)研究的最新方向之一是基于狀態(tài)過程或觀測(cè)過程的變化。Shen等[12]討論了隱狀態(tài)為多個(gè)馬氏鏈過程的HMM模型,并驗(yàn)證了這種模型結(jié)構(gòu)能有效應(yīng)用于嘈雜環(huán)境中說話者的語(yǔ)音識(shí)別問題;Wang等[13]利用連續(xù)觀測(cè)的HMM模型對(duì)刀具狀態(tài)進(jìn)行監(jiān)控,并預(yù)測(cè)其剩余壽命。
將HMM方法與過程控制理論相結(jié)合的研究也受到一些學(xué)者的關(guān)注[14]。Yu[15]提出以HMM模型為基礎(chǔ)綜合考慮局部信息(馬氏距離)和全局信息(負(fù)對(duì)數(shù)似然概率),能有效監(jiān)控非線性多模態(tài)過程;Li等[16]建立了一種基于增距映射的HMM模型,提高了參數(shù)估計(jì)的效率,可應(yīng)用于大規(guī)模動(dòng)態(tài)過程的監(jiān)控和故障診斷問題;Alshraideh等[17]運(yùn)用標(biāo)準(zhǔn)HMM(SHMM, Standard HMM)對(duì)一階自相關(guān)過程進(jìn)行擬合[17],但標(biāo)準(zhǔn)HMM認(rèn)為各觀測(cè)值之間條件獨(dú)立,觀測(cè)序列的概率分布僅與當(dāng)前的隱含狀態(tài)有關(guān),而不考慮觀測(cè)值自身在時(shí)域上的相關(guān)性。針對(duì)這一問題,本文提出一種自相關(guān)HMM(Autocorrelaion HMM, AHMM)模型,并結(jié)合殘差控制圖發(fā)展了基于此模型的過程監(jiān)控方法,相比ARMA殘差控制圖,該方法具有較強(qiáng)的可操作性和更高的預(yù)測(cè)精度。
HMM是在Markov鏈的基礎(chǔ)上發(fā)展起來的一種不完全統(tǒng)計(jì)模型,它包含兩個(gè)隨機(jī)過程:①不能被直接觀測(cè)到的Markov鏈,描述隱藏狀態(tài)的轉(zhuǎn)移;②描述觀測(cè)值與隱藏狀態(tài)關(guān)系的隨機(jī)過程。通常,一個(gè)標(biāo)準(zhǔn)的HMM由5個(gè)基本元素組成,包括隱藏狀態(tài)、狀態(tài)轉(zhuǎn)移概率、初始狀態(tài)概率、觀測(cè)序列和觀測(cè)概率分布,各元素的具體描述為:
(1)有限的隱藏狀態(tài)集
S={S1,S2,…,SN},
(1)
式中N為隱藏狀態(tài)的個(gè)數(shù),可以通過模型選擇方法確定,如交叉驗(yàn)證。
(2)狀態(tài)轉(zhuǎn)移概率
A={aij},其中
aij=P(qt+1=Sj|qt=Si),
(2)
式中qt為時(shí)刻t時(shí)的隱藏狀態(tài)。
(3)初始狀態(tài)概率
π={πi},其中
(3)
(4)觀測(cè)序列
O={y1,…,yT},
(4)
式中T為觀測(cè)序列的長(zhǎng)度。
(5)觀測(cè)概率分布
B={bj(·)},其中
bj(yt)=P(yt|qt=Sj),1≤j≤N。
(5)
N和T隱藏在其他參數(shù)中,因此取λ=(A,B,π)作為參數(shù)集,定義標(biāo)準(zhǔn)的HMM。
標(biāo)準(zhǔn)HMM,觀測(cè)值被認(rèn)為是相互獨(dú)立的,即任意時(shí)刻t出現(xiàn)的觀測(cè)量?jī)H依賴于當(dāng)前所處的狀態(tài),而與t時(shí)刻以前的觀測(cè)值和狀態(tài)無關(guān)。本文所考慮的觀測(cè)值自相關(guān)情況下的AHMM,認(rèn)為任意時(shí)刻t出現(xiàn)某觀測(cè)量的概率不但依賴于系統(tǒng)當(dāng)前所處的狀態(tài),而且依賴于t-1時(shí)刻出現(xiàn)的觀測(cè)值。
考慮一階自相關(guān)的觀測(cè)過程。記t時(shí)刻的狀態(tài)為Si,觀測(cè)值yt的條件概率分布的均值為t-1時(shí)刻觀測(cè)值yt-1的一階線性函數(shù),且yt與t-1時(shí)刻的狀態(tài)無關(guān)。假設(shè)觀測(cè)值的條件概率分布滿足高斯分布,則對(duì)于給定的模型λ,當(dāng)前觀測(cè)值yt在狀態(tài)Si下的條件概率分布均值為
μ(yt|yt-1,qt=Si)=ciyt-1+ci,0,
(6)
式中ci和ci,0為相關(guān)系數(shù)。構(gòu)造兩個(gè)二維向量,列向量x(t)=(yt-1,1)′和橫向量Ci=(ci,ci,0),則式(6)中的均值可表示為
μ(yt|yt-1,qt=Si)=Cix(t)。
(7)
bi,yt-1(yt)=P(yt|yt-1,qt=Si,λ)
(8)
Baum-Welch算法是常見且有效的HMM參數(shù)估計(jì)方法。因?yàn)榭紤]了觀測(cè)值之間的相關(guān)性,所以本文重新推導(dǎo)了基于Baum-Welch算法的參數(shù)估計(jì)表達(dá)式。對(duì)于未知參數(shù)集λ={A,C,π,σ2},給定觀測(cè)序列O={y1,…,yT},求使P(O|λ)最大的λ*即為參數(shù)估計(jì)值。
首先定義正向變量(forward variable),αt(i)為到時(shí)刻t觀測(cè)到部分序列{y1,…,yt}且此時(shí)的狀態(tài)是Si的概率,即
αt(i)=P(y1…yt,qt=Si|λ)。
(9)
αt(i)可通過以下遞歸方法計(jì)算:
(1)初始化
α1(i)=πibi,y0(y1),1≤i≤N。
(10)
式中y0為初始時(shí)刻t=0時(shí)的觀測(cè)量。
(2)遞歸
1≤t≤T-1,1≤j≤N。
(11)
再定義一個(gè)反向變量(backward variable),βt(i)為到時(shí)刻t觀測(cè)到部分序列{yt+1,…,yT}且此時(shí)的狀態(tài)是Si的概率,即
βt(i)=P(yt+1…yT|qt=Si,λ)。
(12)
類似地,βt(i)也可通過遞歸方法計(jì)算:
(1)初始化
βT(i)=1,1≤i≤N。
(13)
(2)遞歸
1≤t≤T-1,1≤i≤N。
(14)
在給定觀測(cè)O和參數(shù)λ時(shí),系統(tǒng)在t時(shí)刻處于狀態(tài)Si的概率γt(i)和系統(tǒng)在t時(shí)刻處于狀態(tài)Si且t+1時(shí)刻處于狀態(tài)Sj的概率ξt(i,j),可分別由以下各式得到:
(15)
(16)
針對(duì)AHMM的參數(shù)估計(jì)方法,即基于Baum-Welch算法的更新算法可闡述如下:
步驟1求期望(E)。給定當(dāng)前參數(shù)λ(k),計(jì)算γt(i)和ξt(i,j)的值。
步驟2最大化(M)。由E步的計(jì)算結(jié)果可推導(dǎo)得到模型參數(shù)集的重新估計(jì)值為
(17)
(18)
(19)
(20)
(21)
將新的估計(jì)值記為λ(k+1),返回E步,循環(huán)迭代直至結(jié)果收斂,得到最終的參數(shù)估計(jì)值λ*。
下面結(jié)合改進(jìn)的AHMM模型及Roberts和Wlan提出的殘差控制圖理論,構(gòu)造基于自相關(guān)觀測(cè)的過程監(jiān)控方法。在合理設(shè)定隱藏狀態(tài)個(gè)數(shù)N的前提下,自相關(guān)HMM模型能夠較準(zhǔn)確地?cái)M合自相關(guān)過程的觀測(cè)數(shù)據(jù),利用所得的殘差序列可以建立常規(guī)控制圖對(duì)過程進(jìn)行監(jiān)控。具體實(shí)施步驟分為兩個(gè)階段:首先通過對(duì)歷史觀測(cè)數(shù)據(jù)進(jìn)行模型訓(xùn)練,得到AHMM模型,進(jìn)而實(shí)現(xiàn)對(duì)觀測(cè)數(shù)據(jù)的預(yù)測(cè);其次利用過程觀測(cè)的預(yù)測(cè)值和實(shí)際值建立殘差控制圖。
已知觀測(cè)O和參數(shù)λ,時(shí)刻T+1的觀測(cè)量為yT+1的條件概率為
qT=Si,O,λ)P(qT=Si|O,λ)
P(qT+1=Sj|qT=Si)γi(T)
(22)
(23)
式中yT+1的積分上下限由具體過程觀測(cè)值的取值范圍決定。
第一階段中確定的AHMM模型和數(shù)據(jù)預(yù)測(cè)方法是殘差控制圖建立的基礎(chǔ)。
對(duì)殘差序列e構(gòu)建單值控制圖(X控制圖),其控制限為:
(24)
延長(zhǎng)上述X控制圖的控制線,將其轉(zhuǎn)化為控制用控制圖。運(yùn)用AHMM模型對(duì)T+1時(shí)刻的觀測(cè)值進(jìn)行預(yù)測(cè),將其與實(shí)際值之差,即eT+1在控制圖上描點(diǎn),對(duì)后續(xù)各時(shí)刻重復(fù)此項(xiàng)操作。若發(fā)現(xiàn)異常點(diǎn),需要立刻找出失控原因并采取措施加以消除,從而實(shí)現(xiàn)對(duì)過程質(zhì)量的監(jiān)控。
劉艷榮在《自相關(guān)過程中控制圖的應(yīng)用研究》里分析了一組轉(zhuǎn)化率數(shù)據(jù)[18],該組數(shù)據(jù)具有自相關(guān)性,但因?yàn)榫挡▌?dòng)導(dǎo)致的非平穩(wěn)性,不能使用簡(jiǎn)單的ARMA模型對(duì)其進(jìn)行擬合,而需要利用差分對(duì)數(shù)據(jù)進(jìn)行平穩(wěn)化處理。經(jīng)過分析驗(yàn)證,最終選定了ARIMA(0,1,1)模型,擬合結(jié)果如圖1a所示。
利用本文提出的AHMM模型對(duì)該組轉(zhuǎn)化率數(shù)據(jù)進(jìn)行擬合得到的結(jié)果如圖1b所示。對(duì)比圖1b和圖1a可以看出,除去3個(gè)峰值點(diǎn),AHMM模型能更貼切地反映出數(shù)值的變化趨勢(shì)。
另有某鋼廠熱軋過程的一組溫度數(shù)據(jù)[19],由自相關(guān)和偏自相關(guān)函數(shù)圖判斷該過程符合AR(1)模型(即ARIMA(1,0,0)模型),擬合結(jié)果如圖2a所示。利用AHMM模型對(duì)該組溫度數(shù)據(jù)進(jìn)行擬合,結(jié)果如圖2b所示。
以上兩個(gè)案例都反映,盡管AHMM模型在預(yù)測(cè)初期存在一定偏差,但是隨著數(shù)據(jù)資料的累積,預(yù)測(cè)誤差迅速減小,從而體現(xiàn)了其強(qiáng)大的學(xué)習(xí)能力。整體來看,基于AHMM預(yù)測(cè)的精確度明顯高于ARIMA模型。表1列出的預(yù)測(cè)誤差方差、平均絕對(duì)誤差和平均相對(duì)誤差絕對(duì)值3項(xiàng)參數(shù)的對(duì)比,也有力地說明了這一優(yōu)勢(shì)。此外,對(duì)于案例一中的非平穩(wěn)時(shí)間序列,AHMM模型無需對(duì)數(shù)據(jù)采取平穩(wěn)化處理,在實(shí)際應(yīng)用中減少了數(shù)據(jù)處理的工作量。
表1 兩種模型預(yù)測(cè)精度相關(guān)參數(shù)表
基于AHMM的預(yù)測(cè)結(jié)果,進(jìn)一步建立兩個(gè)案例的殘差控制圖(如圖3和圖4)。圖3顯示轉(zhuǎn)化率數(shù)據(jù)對(duì)應(yīng)的第38,69,83個(gè)點(diǎn)落在了控制限之外,為異常點(diǎn),這一結(jié)果與文獻(xiàn)[18]中的分析一致,這些數(shù)據(jù)對(duì)應(yīng)的時(shí)刻確實(shí)有“異常原因”存在。同時(shí)也說明圖1b中的預(yù)測(cè)值在3個(gè)峰值點(diǎn)的偏離是合理的,因其不符合數(shù)據(jù)正常的波動(dòng)趨勢(shì)。
圖4中所有的殘差數(shù)據(jù)均落入控制圖上下控制限范圍內(nèi),說明熱軋溫度比較平穩(wěn),以此為指標(biāo)監(jiān)控?zé)彳堖^程可判斷該過程正常,這一結(jié)論也與實(shí)際相符。
平均運(yùn)行鏈長(zhǎng)(Average Run Length, ARL)是評(píng)價(jià)控制圖性能的一個(gè)重要指標(biāo)。本文采用蒙特卡洛模擬法,通過計(jì)算監(jiān)視過程均值偏移的ARL,比較ARMA,SHMM,AHMM 3種模型在自相關(guān)過程中捕捉均值偏移異常的靈敏度。仿真數(shù)據(jù)由最簡(jiǎn)單的自相關(guān)過程AR(1)模型產(chǎn)生。
AR(1)模型可以表示為yt=μ+φyt-1+εt,設(shè)μ=100,εt~N(0,1),自相關(guān)系數(shù)φ分別取0.5和0.7,通過MATLAB仿真產(chǎn)生400個(gè)數(shù)據(jù),依次訓(xùn)練3種模型。對(duì)于任一模型,通過擬合得到400個(gè)訓(xùn)練數(shù)據(jù)的預(yù)測(cè)值,進(jìn)而與真值相減得到殘差,利用殘差序列計(jì)算出控制圖的控制限,用于后序ARL的計(jì)算。過程失控時(shí),均值偏移量分別取1σ,2σ,針對(duì)3種模型分別進(jìn)行了800組仿真,得到其對(duì)應(yīng)的控制圖ARL如表2所示。
表2 基于AR(1)、標(biāo)準(zhǔn)HMM、AHMM模型的殘差控制圖ARL
由表中數(shù)據(jù)可以看出,與AR(1)模型相比,基于HMM模型的殘差控制圖對(duì)異常的捕捉更靈敏,而AHMM模型的表現(xiàn)最為優(yōu)異,這與其對(duì)數(shù)據(jù)擬合的高精度有著必然的關(guān)系。值得注意的是,仿真數(shù)據(jù)根據(jù)AR(1)模型的表達(dá)式生成,可以認(rèn)為數(shù)據(jù)的變化趨勢(shì)與AR(1)模型完全契合,對(duì)于一般性的自相關(guān)過程,AR(1)模型的表現(xiàn)會(huì)更差。
對(duì)比兩種HMM模型的殘差控制圖ARL,考慮到AHMM能更準(zhǔn)確地描繪數(shù)據(jù)間的相關(guān)關(guān)系,當(dāng)數(shù)據(jù)的相關(guān)系數(shù)增大時(shí),它對(duì)均值偏移異常的捕捉速度有顯著的提高,而標(biāo)準(zhǔn)HMM模型只是通過狀態(tài)過程的變化來預(yù)測(cè)數(shù)據(jù)的波動(dòng)趨勢(shì),因此其表現(xiàn)并沒有隨著數(shù)據(jù)相關(guān)性的增加而明顯提升。
正如文獻(xiàn)[17]指出的,利用ARMA模型對(duì)數(shù)據(jù)進(jìn)行擬合時(shí),需要經(jīng)過多次嘗試來確定自回歸項(xiàng)和移動(dòng)平均項(xiàng)的系數(shù),對(duì)于非平穩(wěn)數(shù)據(jù)還要確定差分的階數(shù),這一過程中往往需要以經(jīng)驗(yàn)為依據(jù)進(jìn)行主觀判斷,因此選型過程存在一定的誤差概率。而HMM模型的確定更有據(jù)可循,只要選定合適的狀態(tài)數(shù)即可,簡(jiǎn)化了選型過程,在生產(chǎn)實(shí)際中減少了一定的時(shí)間和人力成本。
在連續(xù)生產(chǎn)過程中,采集到的數(shù)據(jù)往往具有相關(guān)性,經(jīng)典控制理論無法發(fā)揮作用。殘差控制圖是解決自相關(guān)過程監(jiān)控問題的有力工具,通常要以ARMA模型的數(shù)據(jù)預(yù)測(cè)為基礎(chǔ),但其存在選型過程復(fù)雜、對(duì)異常識(shí)別不夠迅速等問題。本文提出的基于自相關(guān)HMM模型建立殘差控制圖,參數(shù)確定簡(jiǎn)便,并且能準(zhǔn)確地把握數(shù)據(jù)的變動(dòng)趨勢(shì),提高了生產(chǎn)實(shí)際中對(duì)自相關(guān)過程進(jìn)行質(zhì)量監(jiān)控的效率,具有良好的應(yīng)用前景。
本文對(duì)HMM進(jìn)行優(yōu)化建模時(shí),利用一階線性函數(shù)來描述觀測(cè)的自相關(guān)性。未來可以進(jìn)一步研究高階非線性函數(shù)在HMM 模型中對(duì)觀測(cè)序列自相關(guān)性的表達(dá),從而更準(zhǔn)確地捕捉觀測(cè)的變化趨勢(shì)。