張 媛,陳 震,潘爾順,奚立峰
(上海交通大學 機械與動力工程學院,上海 200240)
統(tǒng)計過程控制(Statistical Process Control, SPC)是廣泛應用于現(xiàn)代質(zhì)量管理的控制方法,休哈特控制圖是其中常用的工具。傳統(tǒng)的SPC理論基于一個基本假設:過程的觀測數(shù)據(jù)相互獨立。然而在現(xiàn)代化的制造環(huán)境下,過程數(shù)據(jù)往往具有一定的自相關性,如果仍運用常規(guī)控制圖進行過程監(jiān)控,則會造成大量的虛發(fā)警報,對質(zhì)量管理工作產(chǎn)生誤導[1]。
自20世紀70年代,許多學者展開了對自相關過程進行有效統(tǒng)計控制的研究。文獻[2]使用過程原始觀測值構建控制圖,通過調(diào)整控制限使數(shù)據(jù)間的自相關性消失。Alwan等[3]率先提出的殘差控制圖,通過對自相關數(shù)據(jù)擬合自回歸移動平均模型(Auto-Regressive and Moving Average models, ARMA),得到觀測值與擬合值的殘差序列,由時間序列理論可知,殘差序列是獨立同分布的,因此能夠運用常規(guī)控制圖進行分析監(jiān)控,這也是該領域的主流研究方向。Lu等[4]對比分析了Shewhart、CUSUM控制圖對一階自相關過程數(shù)據(jù)的殘差序列具有不同的檢測效果;Dawod等[5]研究了基于魯棒性和高效率的ARMA選型問題。此外,也有學者提出,結合使用SPC和工業(yè)過程控制(Engineering Process Control, EPC),能更有效地提高過程質(zhì)量并降低成本[6]。近些年,在自相關控制圖的研究中加入貝葉斯理論和神經(jīng)網(wǎng)絡等技術成為一種趨勢[7-8]。何楨等[9]以神經(jīng)網(wǎng)絡特有的模式識別技術監(jiān)控自相關過程中的均值突變;Pan等[10]研究了用向量自回歸模型擬合多元自相關過程;崔敬巍等[11]提出以貝葉斯動態(tài)模型為基礎的自相關控制圖,具有建模迅速的優(yōu)勢。
與神經(jīng)網(wǎng)絡類似,隱馬爾科夫(Hidden Markov Models, HMM)模型也是一種有效的預測算法,是語音識別、圖像處理等領域內(nèi)的重要工具。關于HMM改進研究的最新方向之一是基于狀態(tài)過程或觀測過程的變化。Shen等[12]討論了隱狀態(tài)為多個馬氏鏈過程的HMM模型,并驗證了這種模型結構能有效應用于嘈雜環(huán)境中說話者的語音識別問題;Wang等[13]利用連續(xù)觀測的HMM模型對刀具狀態(tài)進行監(jiān)控,并預測其剩余壽命。
將HMM方法與過程控制理論相結合的研究也受到一些學者的關注[14]。Yu[15]提出以HMM模型為基礎綜合考慮局部信息(馬氏距離)和全局信息(負對數(shù)似然概率),能有效監(jiān)控非線性多模態(tài)過程;Li等[16]建立了一種基于增距映射的HMM模型,提高了參數(shù)估計的效率,可應用于大規(guī)模動態(tài)過程的監(jiān)控和故障診斷問題;Alshraideh等[17]運用標準HMM(SHMM, Standard HMM)對一階自相關過程進行擬合[17],但標準HMM認為各觀測值之間條件獨立,觀測序列的概率分布僅與當前的隱含狀態(tài)有關,而不考慮觀測值自身在時域上的相關性。針對這一問題,本文提出一種自相關HMM(Autocorrelaion HMM, AHMM)模型,并結合殘差控制圖發(fā)展了基于此模型的過程監(jiān)控方法,相比ARMA殘差控制圖,該方法具有較強的可操作性和更高的預測精度。
HMM是在Markov鏈的基礎上發(fā)展起來的一種不完全統(tǒng)計模型,它包含兩個隨機過程:①不能被直接觀測到的Markov鏈,描述隱藏狀態(tài)的轉移;②描述觀測值與隱藏狀態(tài)關系的隨機過程。通常,一個標準的HMM由5個基本元素組成,包括隱藏狀態(tài)、狀態(tài)轉移概率、初始狀態(tài)概率、觀測序列和觀測概率分布,各元素的具體描述為:
(1)有限的隱藏狀態(tài)集
S={S1,S2,…,SN},
(1)
式中N為隱藏狀態(tài)的個數(shù),可以通過模型選擇方法確定,如交叉驗證。
(2)狀態(tài)轉移概率
A={aij},其中
aij=P(qt+1=Sj|qt=Si),
(2)
式中qt為時刻t時的隱藏狀態(tài)。
(3)初始狀態(tài)概率
π={πi},其中
(3)
(4)觀測序列
O={y1,…,yT},
(4)
式中T為觀測序列的長度。
(5)觀測概率分布
B={bj(·)},其中
bj(yt)=P(yt|qt=Sj),1≤j≤N。
(5)
N和T隱藏在其他參數(shù)中,因此取λ=(A,B,π)作為參數(shù)集,定義標準的HMM。
標準HMM,觀測值被認為是相互獨立的,即任意時刻t出現(xiàn)的觀測量僅依賴于當前所處的狀態(tài),而與t時刻以前的觀測值和狀態(tài)無關。本文所考慮的觀測值自相關情況下的AHMM,認為任意時刻t出現(xiàn)某觀測量的概率不但依賴于系統(tǒng)當前所處的狀態(tài),而且依賴于t-1時刻出現(xiàn)的觀測值。
考慮一階自相關的觀測過程。記t時刻的狀態(tài)為Si,觀測值yt的條件概率分布的均值為t-1時刻觀測值yt-1的一階線性函數(shù),且yt與t-1時刻的狀態(tài)無關。假設觀測值的條件概率分布滿足高斯分布,則對于給定的模型λ,當前觀測值yt在狀態(tài)Si下的條件概率分布均值為
μ(yt|yt-1,qt=Si)=ciyt-1+ci,0,
(6)
式中ci和ci,0為相關系數(shù)。構造兩個二維向量,列向量x(t)=(yt-1,1)′和橫向量Ci=(ci,ci,0),則式(6)中的均值可表示為
μ(yt|yt-1,qt=Si)=Cix(t)。
(7)
bi,yt-1(yt)=P(yt|yt-1,qt=Si,λ)
(8)
Baum-Welch算法是常見且有效的HMM參數(shù)估計方法。因為考慮了觀測值之間的相關性,所以本文重新推導了基于Baum-Welch算法的參數(shù)估計表達式。對于未知參數(shù)集λ={A,C,π,σ2},給定觀測序列O={y1,…,yT},求使P(O|λ)最大的λ*即為參數(shù)估計值。
首先定義正向變量(forward variable),αt(i)為到時刻t觀測到部分序列{y1,…,yt}且此時的狀態(tài)是Si的概率,即
αt(i)=P(y1…yt,qt=Si|λ)。
(9)
αt(i)可通過以下遞歸方法計算:
(1)初始化
α1(i)=πibi,y0(y1),1≤i≤N。
(10)
式中y0為初始時刻t=0時的觀測量。
(2)遞歸
1≤t≤T-1,1≤j≤N。
(11)
再定義一個反向變量(backward variable),βt(i)為到時刻t觀測到部分序列{yt+1,…,yT}且此時的狀態(tài)是Si的概率,即
βt(i)=P(yt+1…yT|qt=Si,λ)。
(12)
類似地,βt(i)也可通過遞歸方法計算:
(1)初始化
βT(i)=1,1≤i≤N。
(13)
(2)遞歸
1≤t≤T-1,1≤i≤N。
(14)
在給定觀測O和參數(shù)λ時,系統(tǒng)在t時刻處于狀態(tài)Si的概率γt(i)和系統(tǒng)在t時刻處于狀態(tài)Si且t+1時刻處于狀態(tài)Sj的概率ξt(i,j),可分別由以下各式得到:
(15)
(16)
針對AHMM的參數(shù)估計方法,即基于Baum-Welch算法的更新算法可闡述如下:
步驟1求期望(E)。給定當前參數(shù)λ(k),計算γt(i)和ξt(i,j)的值。
步驟2最大化(M)。由E步的計算結果可推導得到模型參數(shù)集的重新估計值為
(17)
(18)
(19)
(20)
(21)
將新的估計值記為λ(k+1),返回E步,循環(huán)迭代直至結果收斂,得到最終的參數(shù)估計值λ*。
下面結合改進的AHMM模型及Roberts和Wlan提出的殘差控制圖理論,構造基于自相關觀測的過程監(jiān)控方法。在合理設定隱藏狀態(tài)個數(shù)N的前提下,自相關HMM模型能夠較準確地擬合自相關過程的觀測數(shù)據(jù),利用所得的殘差序列可以建立常規(guī)控制圖對過程進行監(jiān)控。具體實施步驟分為兩個階段:首先通過對歷史觀測數(shù)據(jù)進行模型訓練,得到AHMM模型,進而實現(xiàn)對觀測數(shù)據(jù)的預測;其次利用過程觀測的預測值和實際值建立殘差控制圖。
已知觀測O和參數(shù)λ,時刻T+1的觀測量為yT+1的條件概率為
qT=Si,O,λ)P(qT=Si|O,λ)
P(qT+1=Sj|qT=Si)γi(T)
(22)
(23)
式中yT+1的積分上下限由具體過程觀測值的取值范圍決定。
第一階段中確定的AHMM模型和數(shù)據(jù)預測方法是殘差控制圖建立的基礎。
對殘差序列e構建單值控制圖(X控制圖),其控制限為:
(24)
延長上述X控制圖的控制線,將其轉化為控制用控制圖。運用AHMM模型對T+1時刻的觀測值進行預測,將其與實際值之差,即eT+1在控制圖上描點,對后續(xù)各時刻重復此項操作。若發(fā)現(xiàn)異常點,需要立刻找出失控原因并采取措施加以消除,從而實現(xiàn)對過程質(zhì)量的監(jiān)控。
劉艷榮在《自相關過程中控制圖的應用研究》里分析了一組轉化率數(shù)據(jù)[18],該組數(shù)據(jù)具有自相關性,但因為均值波動導致的非平穩(wěn)性,不能使用簡單的ARMA模型對其進行擬合,而需要利用差分對數(shù)據(jù)進行平穩(wěn)化處理。經(jīng)過分析驗證,最終選定了ARIMA(0,1,1)模型,擬合結果如圖1a所示。
利用本文提出的AHMM模型對該組轉化率數(shù)據(jù)進行擬合得到的結果如圖1b所示。對比圖1b和圖1a可以看出,除去3個峰值點,AHMM模型能更貼切地反映出數(shù)值的變化趨勢。
另有某鋼廠熱軋過程的一組溫度數(shù)據(jù)[19],由自相關和偏自相關函數(shù)圖判斷該過程符合AR(1)模型(即ARIMA(1,0,0)模型),擬合結果如圖2a所示。利用AHMM模型對該組溫度數(shù)據(jù)進行擬合,結果如圖2b所示。
以上兩個案例都反映,盡管AHMM模型在預測初期存在一定偏差,但是隨著數(shù)據(jù)資料的累積,預測誤差迅速減小,從而體現(xiàn)了其強大的學習能力。整體來看,基于AHMM預測的精確度明顯高于ARIMA模型。表1列出的預測誤差方差、平均絕對誤差和平均相對誤差絕對值3項參數(shù)的對比,也有力地說明了這一優(yōu)勢。此外,對于案例一中的非平穩(wěn)時間序列,AHMM模型無需對數(shù)據(jù)采取平穩(wěn)化處理,在實際應用中減少了數(shù)據(jù)處理的工作量。
表1 兩種模型預測精度相關參數(shù)表
基于AHMM的預測結果,進一步建立兩個案例的殘差控制圖(如圖3和圖4)。圖3顯示轉化率數(shù)據(jù)對應的第38,69,83個點落在了控制限之外,為異常點,這一結果與文獻[18]中的分析一致,這些數(shù)據(jù)對應的時刻確實有“異常原因”存在。同時也說明圖1b中的預測值在3個峰值點的偏離是合理的,因其不符合數(shù)據(jù)正常的波動趨勢。
圖4中所有的殘差數(shù)據(jù)均落入控制圖上下控制限范圍內(nèi),說明熱軋溫度比較平穩(wěn),以此為指標監(jiān)控熱軋過程可判斷該過程正常,這一結論也與實際相符。
平均運行鏈長(Average Run Length, ARL)是評價控制圖性能的一個重要指標。本文采用蒙特卡洛模擬法,通過計算監(jiān)視過程均值偏移的ARL,比較ARMA,SHMM,AHMM 3種模型在自相關過程中捕捉均值偏移異常的靈敏度。仿真數(shù)據(jù)由最簡單的自相關過程AR(1)模型產(chǎn)生。
AR(1)模型可以表示為yt=μ+φyt-1+εt,設μ=100,εt~N(0,1),自相關系數(shù)φ分別取0.5和0.7,通過MATLAB仿真產(chǎn)生400個數(shù)據(jù),依次訓練3種模型。對于任一模型,通過擬合得到400個訓練數(shù)據(jù)的預測值,進而與真值相減得到殘差,利用殘差序列計算出控制圖的控制限,用于后序ARL的計算。過程失控時,均值偏移量分別取1σ,2σ,針對3種模型分別進行了800組仿真,得到其對應的控制圖ARL如表2所示。
表2 基于AR(1)、標準HMM、AHMM模型的殘差控制圖ARL
由表中數(shù)據(jù)可以看出,與AR(1)模型相比,基于HMM模型的殘差控制圖對異常的捕捉更靈敏,而AHMM模型的表現(xiàn)最為優(yōu)異,這與其對數(shù)據(jù)擬合的高精度有著必然的關系。值得注意的是,仿真數(shù)據(jù)根據(jù)AR(1)模型的表達式生成,可以認為數(shù)據(jù)的變化趨勢與AR(1)模型完全契合,對于一般性的自相關過程,AR(1)模型的表現(xiàn)會更差。
對比兩種HMM模型的殘差控制圖ARL,考慮到AHMM能更準確地描繪數(shù)據(jù)間的相關關系,當數(shù)據(jù)的相關系數(shù)增大時,它對均值偏移異常的捕捉速度有顯著的提高,而標準HMM模型只是通過狀態(tài)過程的變化來預測數(shù)據(jù)的波動趨勢,因此其表現(xiàn)并沒有隨著數(shù)據(jù)相關性的增加而明顯提升。
正如文獻[17]指出的,利用ARMA模型對數(shù)據(jù)進行擬合時,需要經(jīng)過多次嘗試來確定自回歸項和移動平均項的系數(shù),對于非平穩(wěn)數(shù)據(jù)還要確定差分的階數(shù),這一過程中往往需要以經(jīng)驗為依據(jù)進行主觀判斷,因此選型過程存在一定的誤差概率。而HMM模型的確定更有據(jù)可循,只要選定合適的狀態(tài)數(shù)即可,簡化了選型過程,在生產(chǎn)實際中減少了一定的時間和人力成本。
在連續(xù)生產(chǎn)過程中,采集到的數(shù)據(jù)往往具有相關性,經(jīng)典控制理論無法發(fā)揮作用。殘差控制圖是解決自相關過程監(jiān)控問題的有力工具,通常要以ARMA模型的數(shù)據(jù)預測為基礎,但其存在選型過程復雜、對異常識別不夠迅速等問題。本文提出的基于自相關HMM模型建立殘差控制圖,參數(shù)確定簡便,并且能準確地把握數(shù)據(jù)的變動趨勢,提高了生產(chǎn)實際中對自相關過程進行質(zhì)量監(jiān)控的效率,具有良好的應用前景。
本文對HMM進行優(yōu)化建模時,利用一階線性函數(shù)來描述觀測的自相關性。未來可以進一步研究高階非線性函數(shù)在HMM 模型中對觀測序列自相關性的表達,從而更準確地捕捉觀測的變化趨勢。