吳 倩 陳 童 尹東亮
(1.海軍工程大學海軍艦船振動與噪聲研究所 武漢 430033)(2.船舶振動噪聲重點實驗室 武漢 430033)(3.海軍工程大學管理工程與裝備經(jīng)濟系 武漢 430033)
大型復雜裝備或高新技術設備結(jié)構(gòu)精密、維修難度大,針對其制定合理、高效的維修策略往往能增加裝備使用時限,提高系統(tǒng)可靠性。在該類裝備實際使用過程中,一般通過故障檢測判斷系統(tǒng)狀態(tài),選擇合適的維修方式[1]。預防性維修可提前排除故障隱患,但其維修不完全,并不能使裝備系統(tǒng)“修復如新”;換件維修[3]在裝備失效后更換備件,更換后裝備系統(tǒng)“修復如新”。這兩類維修方式可貫穿裝備使用全過程,相互補充促進,是較為常用的兩種維修保障方式[2~3]。因此,結(jié)合該類裝備使用與維修特點,合理控制檢測節(jié)點,判斷系統(tǒng)是否需要維修,從而選擇合適的維修方式并確定下次檢測節(jié)點以制定維修策略是科學、合理的。該決策過程循環(huán)反復,同時系統(tǒng)性能具有隨機性,可看作是一個與時間相關的隨機序貫決策問題[4],半馬爾科夫決策過程(Semi-MDP)[5]被廣泛應用于該領域。
Zhang等[6]通過結(jié)合各類維修行為提出了一個基于點的值迭代算法,有效提高了Semi-MDP在狀態(tài)轉(zhuǎn)移不確定和觀測不確定情況下機器維修中的適用性;Jiang等[7]將城市列車車輪受到直徑或法蘭厚度超限的狀態(tài)監(jiān)測和定期檢查過程模擬為Semi-MDP,考慮不完全車輪保養(yǎng),最大限度地減少每單位時間維護成本;Srinivasan等[8]考慮系統(tǒng)當前狀況以及劣化速度的不確定性,采用了部分可觀察的半馬爾可夫決策過程(POSMDP)對維修決策進行了優(yōu)化。
在對這類復雜裝備進行維修策略優(yōu)化建模時,由于其集成度高、組成部件相關性強,往往將其整體看做單部件系統(tǒng),以便于解析建模,同時較為符合實際情況,如艦船動力系統(tǒng)、核電系統(tǒng)等。而裝備系統(tǒng)失效過程一般由系統(tǒng)內(nèi)部劣化機理和外部環(huán)境因素共同作用產(chǎn)生。系統(tǒng)內(nèi)部性能和工作效率一般隨著時間推移不斷退化,直至失效,如機械磨損、橡膠老化等;同時外部環(huán)境因素影響使系統(tǒng)受到?jīng)_擊也會造成系統(tǒng)劣化,影響裝備內(nèi)部性能,如機械設備腐蝕,電子元件電壓不穩(wěn)等,這兩者共同作用,使系統(tǒng)表現(xiàn)出多狀態(tài)特性。因此,考慮外部沖擊的退化系統(tǒng)于20世紀70年代被提出[9],廣泛應用于系統(tǒng)維修策略研究中。
Zhou等[10]考慮不完全預防性維修,假設維修后系統(tǒng)失效率服從指數(shù)分布,沖擊與退化過程為泊松分布,分析了以維修費用最低為目標的維修策略;張延靜等[11]針對同時受自然退化和隨機沖擊影響的單部件系統(tǒng),假設沖擊過程為泊松過程,沖擊量服從正態(tài)分布,提出了基于狀態(tài)的維修策略,建立了一個成本率函數(shù);Huang等[12]利用指數(shù)分布建立了包含連續(xù)平滑的退化和沖擊過程的設備維修模型,獲得了最優(yōu)的劣化閾值和平均費用率。
上述研究為了求解方便,一般假設部件壽命、維修時間等服從指數(shù)分布、正態(tài)分布等各類典型分布,這在一定程度上導致模型解析難度大,適用范圍窄。為了解決這一問題,Neuts[13]在 1975 年首次將Phase-type(PH)分布作為指數(shù)分布的一般化形式提出。PH分布族在經(jīng)歷過大量運算后依然具有封閉性,同時能近似擬合非負半軸上的任何概率分布,可將各類典型分布統(tǒng)一表示為PH形式,降低了解析計算難度,又具有一般性,使得其被廣泛應用于各類隨機模型。
Ruiz-Castro等[14]研究了考慮外部沖擊與內(nèi)部退化的多狀態(tài)設備系統(tǒng),利用PH分布對隨機檢測間隔時間進行描述,對預防性維修閾值、時機進行了優(yōu)化;Montoro-Cazorla等[15]假設系統(tǒng)沖擊來源由馬爾可夫過程決定,預防性維修時間服從PH分布,系統(tǒng)失效后換件,得出了故障發(fā)生率等參數(shù);Yu等[16]考慮系統(tǒng)受沖擊過程為PH更新過程,經(jīng)歷一定次數(shù)維修后更換備件,備件采購時間服從PH分布,建立了系統(tǒng)更換優(yōu)化模型。
綜上,本文以考慮隨機沖擊的單部件退化系統(tǒng)為研究對象,系統(tǒng)所有性能參數(shù)等只能通過檢測獲得,系統(tǒng)接受隨機檢測,單一維修臺可進行不完全預防性維修和換件維修兩種維修活動,將系統(tǒng)性能劃分為多個離散狀態(tài),建立了基于PH分布的系統(tǒng)維修策略優(yōu)化模型,解決了隨機檢測與兩類維修活動綜合優(yōu)化的問題,利用值迭代算法,確定了系統(tǒng)最佳的預防性維修控制閾和各狀態(tài)對應的檢測間隔時間,以達到長期運行條件下的平均費用率最低且系統(tǒng)穩(wěn)態(tài)可用度滿足要求。最后,通過算例驗證了模型的正確性與適用性,演示了費用參數(shù)變化對最佳策略的影響。
定義1[17]:若一個非負隨機變量X服從連續(xù)PH分布,那么它的分布函數(shù)為
其中:
1)t≥0,e是全部元素都為1的列向量;
2)α是次隨機矩陣,含m個非負元素的行向量,m為正整數(shù),αe≤1;
3)T是m階矩陣,該矩陣對角線元素全為負,其他元素非負,矩陣可逆,且每行元素之和是非正的。
定義2[17]:連續(xù)時間馬爾科夫鏈{I(t),t≥0},其狀態(tài)空間由m+1個狀態(tài){1,2,3,…,m,m+1}組成,無窮小生成元表示為
其中,T為PH分布的生成元。由于每一行元素之和均為0,則可得T0=-Te。狀態(tài)m+1的轉(zhuǎn)移概率為0,則狀態(tài)m+1為吸收態(tài)。
定義3[18]:一個m×n階矩陣A和一個p×q階矩陣B的Kronecker積被定義為
根據(jù)式(3),可得出Kronecker積有如下性質(zhì):
定義4[18]:一個m階矩陣 A和一個n階矩陣 B的Kronecker和被定義為
其中,In和Im分別表示m和n階的單位矩陣。
假設某單部件系統(tǒng)隨運行時間的推移性能不斷退化,同時運行過程中會受到外部隨機沖擊的影響,沖擊會對系統(tǒng)造成一定的損傷,加快系統(tǒng)退化。系統(tǒng)內(nèi)包含單一維修臺,維修臺始終處于完好狀態(tài),可進行預防性維修工作,系統(tǒng)失效后立即更換。
下面對問題做進一步假設:
1)在系統(tǒng)運行過程中,系統(tǒng)所有性能參數(shù)、沖擊次數(shù)、沖擊損傷量只能通過檢測獲得,為了建模方便,將系統(tǒng)劃分為n個狀態(tài),每個狀態(tài)i所對應的系統(tǒng)性能參數(shù)范圍不同,根據(jù)檢測結(jié)果確定系統(tǒng)所處狀態(tài)i。檢測時間tin也服從連續(xù)PH分布,有f階PH表示(δ,R)。檢測時系統(tǒng)停機,不會繼續(xù)劣化。
2)將系統(tǒng)n個狀態(tài)劃分為四部分,i=1為全新狀態(tài);當2≤i≤m時,不需要進行預防性維修,為完好狀態(tài)集;當m+1≤i≤n時,需要進行預防性維修,為劣化狀態(tài)集;當i=n+1時,系統(tǒng)維修費用及難度較高,為失效狀態(tài),直接更換,系統(tǒng)各狀態(tài)停留時間服從PH分布,有hi階PH表示(αi,Ti)。
令Pij=[Pij]n×n表示系統(tǒng)受到退化影響由狀態(tài)i轉(zhuǎn)移到狀態(tài) j的狀態(tài)轉(zhuǎn)移概率矩陣,其中1≤i,j≤n 。 根 據(jù) PH 分 布 的 定 義 ,P0=(P1(n+1)P2(n+1)P3(n+1))T為系統(tǒng)受到退化影響轉(zhuǎn)移到失效狀態(tài)的概率矩陣,即轉(zhuǎn)移到狀態(tài)i=n+1的概率。
3)外部隨機沖擊對系統(tǒng)造成一定的損傷量,根據(jù)系統(tǒng)狀態(tài)劃分,將損傷量大小轉(zhuǎn)化為系統(tǒng)狀態(tài)劣化程度,即在某次檢測時,發(fā)現(xiàn)系統(tǒng)在兩次相鄰檢測之間受到一定次數(shù)的隨機沖擊,這些沖擊所造成的損傷量可使系統(tǒng)由狀態(tài)i瞬間退化到狀態(tài)i*,i<i*。令隨機沖擊到達為PH更新過程,有ρ階PH表示 (λ,W)。
令Dij=[Dij]n×n表示系統(tǒng)在兩次相鄰檢測之間受到退化和外部沖擊共同作用由狀態(tài)i轉(zhuǎn)移到狀態(tài) j 的 概 率 矩 陣 ,其 中 1≤i,j≤n 。D0=(D1(n+1)D2(n+1)D3(n+1))T表示系統(tǒng)在狀態(tài)受到?jīng)_擊與退化雙重影響突發(fā)失效的概率,即轉(zhuǎn)移到狀態(tài)i=n+1的概率。
4)預防性維修時間tma服從PH分布,有l(wèi)階的PH表示(θ,S),系統(tǒng)更換時間tre服從PH分布,有v階PH表示(γ,B)??紤]不完全預防性維修,系統(tǒng)修復后不會修復如新,而是處于完好狀態(tài),即i≠1,在狀態(tài)i對系統(tǒng)進行維修后系統(tǒng)處于狀態(tài) j的概率矩陣為 O32=[Oij](n-m)×(m-1),其中 m+1≤i≤n ,2≤j≤m。
5)系統(tǒng)預防性維修時間、檢測時間、更換時間以及各狀態(tài)停留時間相互獨立。
在t=0時刻,系統(tǒng)以完好狀態(tài)開始運行,期間會經(jīng)歷退化、隨機沖擊、檢測、不完全預防性維修、直至失效更換,如圖1所示。
圖1 系統(tǒng)運行時間軸
6)系統(tǒng)檢測費用、預防性維修費用、因檢測或失效造成的停機損失、系統(tǒng)更換費用分別為cin、cmi(1≤i≤n)、ci(1≤i≤n+1)、cr,其中,cmi(1≤i≤n)表示不同狀態(tài)i的維修費用不同,同時因系統(tǒng)失效造成的停機損失cn+1應比因檢測造成的停機損失大,故 cn+1>ci,1≤i≤n。
7)檢測采取隨機檢測,檢測方式?jīng)Q定了維修決策過程中的狀態(tài)轉(zhuǎn)移情況,檢測間隔時間與當前狀態(tài)有關,需要根據(jù)當前狀態(tài)確定下一次決策點,即檢測間隔時間,令其服從一般分布,概率分布函數(shù)為Γ(t),表示該次檢測距前一次系統(tǒng)維修決策后開始運行的時間間隔。由于PH分布具有較強的適用性,可以在非負半軸上近似擬合任意分布,故可假設檢測間隔時間服從PH分布,有g階PH表示 (ζ,U)。
8)根據(jù)系統(tǒng)運行狀態(tài)轉(zhuǎn)移圖可以看出,從系統(tǒng)開始運行到系統(tǒng)失效更換完成構(gòu)成一個壽命周期T。若經(jīng)過時間t系統(tǒng)運行所需費用為C(t),那么由更新過程相關理論可得系統(tǒng)長期運行平均費用率ψ可以看作是部件壽命周期內(nèi)的平均費用率,即
其中,E(C(T))、E(T)是由檢測間隔時間和維修控制閾(即臨界狀態(tài)m+1)決定的。
9)若經(jīng)過時間t系統(tǒng)正常工作時間為t*,可得系統(tǒng)長期運行穩(wěn)態(tài)可用度As:
10)目標函數(shù):通過優(yōu)化檢測間隔時間和確定維修控制閾使得平均費用率最低,穩(wěn)態(tài)可用度As大于。
根據(jù)半馬爾可夫決策過程的定義,劃分六元組{S,A(i),pij(a),T(·|i,j,a),r(u,i,a,j,t),V|i,j∈ S,a∈A(i)},根據(jù)問題假設具體參數(shù)含義如下:
1)系統(tǒng)狀態(tài)空間S:考慮外部沖擊與內(nèi)部退化的相關性,將系統(tǒng)狀態(tài)空間劃分為S={1,2,…,n+1};
2)決策行動集:A(i)={a,Γ(t,φi)}。其中,φi表示根據(jù)在該次隨機檢測點所確定的系統(tǒng)所處狀態(tài)i決定決策行動從而確定檢測間隔時間,再由此作為參數(shù)得出檢測間隔時間所服從分布的具體數(shù)
3)系統(tǒng)狀態(tài)轉(zhuǎn)移矩陣:根據(jù)PH分布的定義將系統(tǒng)狀態(tài)轉(zhuǎn)移矩陣Pij轉(zhuǎn)化為系統(tǒng)劣化的Q矩陣,其中系統(tǒng)狀態(tài)轉(zhuǎn)移主要由以下情況造成:退化和沖擊、預防性維修、替換;
4)轉(zhuǎn)移時間Δt:考慮檢測時間、維修時間和替換時間,則兩次決策時間間隔可表示為:(1)檢測系統(tǒng)狀態(tài)i≤m,不進行預防性維修,系統(tǒng)檢測后繼續(xù) 工 作 ,Δt=φi+tin;(2) 檢 測 系 統(tǒng) 狀 態(tài)m+1≤i≤n,進行預防性維修,Δt=φi+tin+tma;(3)檢測系統(tǒng)狀態(tài)i=n+1,系統(tǒng)失效替換如新,Δt=φi+tin+tre;
5)報酬空間:即費用空間,包括系統(tǒng)檢測費用、預防性維修費用、因檢測或失效造成的停機損失、系統(tǒng)更換費用;
6)決策準則:當系統(tǒng)長期運行時,即t→∞,平均費用率最低,穩(wěn)態(tài)可用度As大于a*s。
該半馬爾可夫決策過程模型狀態(tài)空間S離散,各狀態(tài)i下的行動集A(i)有限,故存在最優(yōu)的平穩(wěn)策略。
假設Π為該模型維修策略平穩(wěn)決策集,策略f 是 S→A(i)的 映 射 ,則 f=(f(i)=(a,φi)∈A(i))i=1,…,n+1,其中i∈S 。
令 t(f)=diag[t(i,f(i))]n×n,其中 t(i,f(i))是決策過程的策略 f下在狀態(tài)i停留的時間,i=1,…,n。
令 r(f)=diag[r(i,f(i))](n+1)×(n+1),其中 r(i,f(i))是決策過程的策略 f下在狀態(tài)i的費用。則該半馬爾可夫決策過程模型可簡化為{S,A(i),pij(f(i)),t(i,f(i)),r(i,f(i)),V|i,j∈S,f(i)∈A(i)}。
假設在某一時刻,單部件系統(tǒng)處于狀態(tài)i的x位相,若兩次相鄰檢測間經(jīng)受了沖擊則處于狀態(tài)(i,j)的x位相,檢測工作、維修臺預防性維修工作以及系統(tǒng)更換工作的位相分別表示為Y(t)、Z(t)、J(t)。系統(tǒng)是否經(jīng)受過沖擊只有通過檢測才能發(fā)現(xiàn),同時隨著時間推移系統(tǒng)不斷退化。根據(jù)系統(tǒng)部件狀態(tài)轉(zhuǎn)移規(guī)律以及檢測和維修更換模式,可將系統(tǒng)劃分為11個不同狀態(tài),表示為Ω={H0,H1,H2,H3,H4,H5,H6,H7,H8,H9,H10},具體含義如下。
H0={i,x,y(t);2≤i≤m,1≤x≤hi,1≤y(t)≤f}表示通過檢測得出系統(tǒng)部件經(jīng)歷了退化,無外部沖擊,處于完好狀態(tài),系統(tǒng)正常運行,不進行預防性維修;
H1={(i,j),x,y(t);1≤j≤ρ,2≤i≤m,1≤x≤hi,1≤y(t)≤f}表示通過檢測得出系統(tǒng)部件經(jīng)歷了退化和外部沖擊,處于完好狀態(tài),系統(tǒng)正常運行,不進行預防性維修;
H2={i,x,y(t);m+1≤i≤n,1≤x≤hi,1≤y(t)≤f}表示通過檢測得出系統(tǒng)部件經(jīng)歷了退化,無外部沖擊,處于劣化狀態(tài),需要進行預防性維修;
H3={i,x,z(t);m+1≤i≤n,1≤x≤hi,1≤z(t)≤l}表示系統(tǒng)部件經(jīng)歷了退化,無外部沖擊,處于劣化狀態(tài),根據(jù)檢測結(jié)果對其進行預防性維修;
H4={(i,j),x,y(t);1≤ j≤ρ,m+1≤ i≤ n,1≤x≤hi,1≤y(t)≤f}表示通過檢測得出系統(tǒng)部件經(jīng)歷了退化和外部沖擊,處于劣化狀態(tài),需要進行預防性維修;
H5={(i,j),x,z(t);1≤j≤ρ,m+1≤ i≤n,1≤x≤hi,1≤z(t)≤l}表示系統(tǒng)部件經(jīng)歷了退化和外部沖擊,處于劣化狀態(tài),根據(jù)檢測結(jié)果對其進行預防性維修;
H6={i,x,y(t);i=n+1,1≤x≤hi,1≤y(t)≤f} 表示通過檢測得出系統(tǒng)部件經(jīng)歷了退化,無外部沖擊,處于失效狀態(tài),需要進行更換;
H7={i,x,z(t);i=n+1,1≤x≤hi,1≤z(t)≤l} 表示系統(tǒng)部件經(jīng)歷了退化,無外部沖擊,處于失效狀態(tài),根據(jù)檢測結(jié)果對其進行更換;
H8={(i,j),x,y(t);1≤j≤ρ,i=n+1,1≤x≤hi,1≤y(t)≤f}表示通過檢測得出系統(tǒng)部件經(jīng)歷了退化和外部沖擊,處于失效狀態(tài),需要進行更換;
H9={(i,j),x,z(t);1≤j≤ρ,i=n+1,1≤x≤hi,1≤z(t)≤l}表示系統(tǒng)部件經(jīng)歷了退化和外部沖擊,處于失效狀態(tài),根據(jù)檢測結(jié)果對其進行更換;
H10={i,x;i=1,1≤x≤hi}表示系統(tǒng)處于全新狀態(tài),無退化和外部沖擊影響。
根據(jù)系統(tǒng)狀態(tài)空間劃分,為便于表示系統(tǒng)狀態(tài)轉(zhuǎn)移,可將Pij、Dij以及Oik根據(jù)系統(tǒng)部件不同狀態(tài)表示如下:
其中,P2、P3分別表示系統(tǒng)在完好狀態(tài)、劣化狀態(tài)內(nèi)部轉(zhuǎn)移的概率矩陣,P12、P13分別表示系統(tǒng)從全新狀態(tài)向完好狀態(tài)、劣化狀態(tài)轉(zhuǎn)移的概率矩陣,P23分別表示系統(tǒng)從完好狀態(tài)向劣化狀態(tài)轉(zhuǎn)移的概率矩陣,P1(n+1),P2(n+1)、P3(n+1)分別表示系統(tǒng)從全新狀態(tài)、完好狀態(tài)、劣化狀態(tài)向失效狀態(tài)轉(zhuǎn)移的概率矩陣,D同理亦然。
根據(jù)劃分的11個狀態(tài)空間,構(gòu)建狀態(tài)轉(zhuǎn)移圖如圖2。
圖2 系統(tǒng)狀態(tài)轉(zhuǎn)移圖
下面根據(jù)系統(tǒng)狀態(tài)轉(zhuǎn)移圖對其狀態(tài)轉(zhuǎn)移情況進行說明。
1)各狀態(tài)空間內(nèi)部轉(zhuǎn)移分析
H0內(nèi)部轉(zhuǎn)移:該轉(zhuǎn)移為系統(tǒng)部件自身轉(zhuǎn)移。系統(tǒng)部件均處于完好狀態(tài),其內(nèi)部轉(zhuǎn)移存在兩種情況:在水平i(2≤i≤m)的內(nèi)部轉(zhuǎn)移,轉(zhuǎn)移矩陣為diag(T2,…,Tm);從 水 平 i進 入 水 平 j( 2≤i<j≤m )的轉(zhuǎn)移,矩陣為 diag()P2diag(α2,…,αm)。令矩 陣 為 diag(T2,…,Tm)?diag()P2diag(α2,…,αm),階數(shù)為 ρgfh*。
同理可得:
H1內(nèi) 部 轉(zhuǎn) 移 矩 陣 為 diag(T20,…,Tm0)D2diag(α2,…,αm)?W0λ?Igf,階數(shù)為 ρgfh*;
H3內(nèi)部轉(zhuǎn)移矩陣為 S?Iρf(n-m),階數(shù)為ρ(n-m)fl;
H5內(nèi)部轉(zhuǎn)移矩陣為 S?Iρf(n-m),階數(shù)為ρ(n-m)fl;
H7內(nèi)部轉(zhuǎn)移矩陣為B?Iρf,階數(shù)為 ρfv;
H9內(nèi)部轉(zhuǎn)移矩陣為B?Iρf,階數(shù)為 ρfv;
H10內(nèi)部轉(zhuǎn)移矩陣為 T1?Iρfg,階數(shù)為 ρgfh1;
H2、H4、H6、H8的內(nèi)部轉(zhuǎn)移矩陣均為0。
2)不同狀態(tài)空間轉(zhuǎn)移分析
從H0到H1的狀態(tài)轉(zhuǎn)移:系統(tǒng)被檢測出經(jīng)歷了退化和外部沖擊,但依然處于完好狀態(tài),轉(zhuǎn)移矩陣為Q01=U0?δ?diag(T20,…,Tm0)D2diag(α2,…,αm)?W0λ?R0?ζ,階數(shù)為 ρgfh*;
從H0到H2的狀態(tài)轉(zhuǎn)移:系統(tǒng)被檢測出經(jīng)歷了內(nèi)部退化,從完好狀態(tài)退化到劣化狀態(tài),轉(zhuǎn)移矩陣 為 Q02=U0?δ?diag(T20,…,Tm0)P23diag(αm+1,…,αn)?Iρf;
從H0到H4的狀態(tài)轉(zhuǎn)移:系統(tǒng)被檢測出經(jīng)歷了退化和外部沖擊,從完好狀態(tài)轉(zhuǎn)移到劣化狀態(tài),轉(zhuǎn)移矩陣為Q04=U0?δ?diag()D23diag(αm+1,…,αn)?W0λ?If;
從H0到H6的狀態(tài)轉(zhuǎn)移:系統(tǒng)被檢測出經(jīng)歷了內(nèi)部退化,從完好狀態(tài)退化到失效狀態(tài),轉(zhuǎn)移矩陣為Q06=U0?δ?diag()P2(n+1)? Iρf;
從H0到H8的狀態(tài)轉(zhuǎn)移:系統(tǒng)被檢測出經(jīng)歷了退化和外部沖擊,從完好狀態(tài)轉(zhuǎn)移到失效狀態(tài),轉(zhuǎn)移 矩 陣 為 Q08=U0?δ?diag()D2(n+1)?W0λ?If;
從H2到H3的狀態(tài)轉(zhuǎn)移:系統(tǒng)被檢測出處于劣化狀態(tài),需要進行預防性維修,檢測結(jié)束進入維修工作,轉(zhuǎn)移矩陣為Q23=R0?θ?Iρf(n-m);
從H3到H0的狀態(tài)轉(zhuǎn)移:對系統(tǒng)進行不完全預防性維修后由劣化狀態(tài)返回到完好狀態(tài),轉(zhuǎn)移矩陣為[Q30Q31]=[S0?O32diag(α2,…,αm)? ζ? Iρf0] ;
同理{H0,H1,H2,H3,H4,H5,H6,H7,H8,H9,H10}中各個狀態(tài)之間的轉(zhuǎn)移矩陣如下:
結(jié)合PH分布的定義,根據(jù)上述對系統(tǒng)狀態(tài)轉(zhuǎn)移的分析,就可得出系統(tǒng)轉(zhuǎn)移矩陣Q如下:
系統(tǒng)在兩相鄰檢測之間的轉(zhuǎn)移時間包括檢測間隔時間、檢測時間、維修時間和替換時間,決策點為系統(tǒng)開始本次檢測的時間點,則從本次決策點到下次決策的平均決策間隔時間可表示為
系統(tǒng)穩(wěn)態(tài)可用度就是系統(tǒng)處于工作狀態(tài)下的穩(wěn)態(tài)概率,即系統(tǒng)停留在狀態(tài)集H0∪H1∪H10的穩(wěn)態(tài)概率。系統(tǒng)在經(jīng)歷長時間運行之后會進入穩(wěn)定狀態(tài)。當系統(tǒng)處于穩(wěn)態(tài)時,其各狀態(tài)在相互轉(zhuǎn)移的過程中停留在每個狀態(tài)的概率可以構(gòu)成穩(wěn)態(tài)概率向量 π ,與各狀態(tài)相 對 應 可分解為 π=(π0,π1,π2,π3,π4,π5,π6,π7,π8,π9,π10),根據(jù)穩(wěn)態(tài)概率向量的相關性質(zhì)可知其滿足下列方程組:
故系統(tǒng)穩(wěn)態(tài)可用度As可表示為
系統(tǒng)費用函數(shù)包括從現(xiàn)決策點到下次決策的系統(tǒng)檢測費用、預防性維修費用或系統(tǒng)更換費用、因檢測或失效造成的停機損失費用。根據(jù)現(xiàn)決策點系統(tǒng)所處狀態(tài),考慮系統(tǒng)同時受到內(nèi)部退化和外部沖擊進入失效狀態(tài)的概率較大,可將系統(tǒng)費用函數(shù)表示為
其中,i*為系統(tǒng)在狀態(tài)i經(jīng)過不完全預防性維修所返回的狀態(tài),找出狀態(tài)i對應的Oij矩陣第i行中的最小值,其所對應的列即為狀態(tài)i*所對應的列。
根據(jù)決策準則的相關要求和模型假設,可以看出劣化部件在有限時間內(nèi)不會發(fā)生無窮多次狀態(tài)轉(zhuǎn)移,從而建立最優(yōu)方程。PH分布在非負半軸上可近似擬合其他隨機分布,其將狀態(tài)i劃分為hi個相位i",根據(jù)系統(tǒng)狀態(tài)空間S將系統(tǒng)各狀態(tài)相位集設為S"={s"}i=1,…,n+1={(1,…,h1),(h1+1,…,h2),…,(hn+1,…,hn+1)},而各相位僅具有概率意義,并無實際物理意義。因此一個狀態(tài)i下hi個相位所做出的維修決策應一致才符合實際情況,故可先建立系統(tǒng)長期運行平均費用率最低的最優(yōu)方程為
同時,決策目標函數(shù)為系統(tǒng)長期運行平均費用率最低且穩(wěn)態(tài)可用度As大于。在迭代計算的各步所得維修策略的基礎上,根據(jù)所得的檢測間隔時間數(shù)值進行擬合,表示為PH分布形式,帶入狀態(tài)轉(zhuǎn)移矩陣求解計算穩(wěn)態(tài)概率向量得出穩(wěn)態(tài)可用度判斷其是否滿足要求,再進行下一步迭代,直至兩者同時達到最優(yōu),具體流程見圖3。
圖3 最優(yōu)決策求解思路圖
為了便于求解計算,一般將半馬爾科夫決策六元組轉(zhuǎn)化為馬爾科夫決策五元組。針對于該模型,可將轉(zhuǎn)移時間與報酬函數(shù)相結(jié)合合二為一,轉(zhuǎn)化為馬爾科夫決策五元組,具體分析如下。
根據(jù)系統(tǒng)兩決策點間的轉(zhuǎn)移時間公式可以看出,必存在正常數(shù)κ,使得則令t*=1 κ,可轉(zhuǎn)化馬爾科夫決策五元組如下:
{S,A(i),pij(f(i)),r?(i,f(i)),V|i,j∈ S,f(i)∈ A(i)}
故系統(tǒng)長期運行平均費用率最低的最優(yōu)方程可轉(zhuǎn)化為
為了求解最優(yōu)方程XX,得出ε-最佳平穩(wěn)策略,采用值迭代算法,下面對具體步驟做進一步描述。
步驟1:初始假設
任取迭代初值v0(j"),給定ε并且置n=0;
步驟2:選擇策略 f0
特別地,當i=n+1時,對應策略為(a=2,Γ(t,φ1)) 。
步驟3:計算vn+1(j")
步驟4:最優(yōu)判斷
算法停止;否則將n增加1,轉(zhuǎn)入步驟3。
該算例包括兩部分:1)根據(jù)模型問題描述,假設該單部件系統(tǒng)狀態(tài)可劃分為6個,各狀態(tài)停留時間分別服從不同的PH分布,建立不完全預防性維修優(yōu)化模型,通過值迭代算法求解計算得出ε-最佳平穩(wěn)策略,驗證模型的正確性與適用性;2)分析費用參數(shù)cin變化對最佳策略的影響,證明隨機檢測的良好特性。
假設該單部件系統(tǒng)具有6個不同狀態(tài),其中{6}表示系統(tǒng)處于失效狀態(tài),6個狀態(tài)的所分別對應的檢測間隔時間為確定性數(shù)值,可擬合為PH分布,有g階PH表示(ζ,U),且檢測時間、不完全維修時間、系統(tǒng)替換時間忽略不計。系統(tǒng)檢測費用、預防性維修費用、系統(tǒng)更換費用以及因失效造成的停機損失費用分別為cin=1、cm4=6、cm5=8、cr=12、cn+1=10,則系統(tǒng)在各狀態(tài)的停留時間以及隨機沖擊到達過程的PH表示如表1。
另:
根據(jù)上述假設條件,建立系統(tǒng)狀態(tài)轉(zhuǎn)移矩陣,采用上述的值迭代算法,令ε=1×10-4,穩(wěn)態(tài)可用度As大于0.97,經(jīng)過63次迭代,可得出滿足終止原則的迭代結(jié)果,如表2所示。
由表2可以看出,經(jīng)過63次迭代,可得出優(yōu)化維修策略,此時,系統(tǒng)平均費用率最低為0.1025,穩(wěn)態(tài)可用度As=0.9839,滿足決策準則,驗證了模型的正確性和適用性。
在上節(jié)算例的基礎上,增加cin,分析系統(tǒng)各狀態(tài)最佳檢測間隔時間的變化,如圖4所示。
表1 系統(tǒng)各狀態(tài)停留時間以及隨機沖擊到達過程的PH表示
表2 迭代過程相關數(shù)據(jù)
圖4坐標軸橫坐標為檢測費用cin的變化,系統(tǒng)部件各個狀態(tài)均需檢測得出,因此從圖中可以看出,當檢測費用在整體費用中所占比例越來越大時,檢測間隔隨之提升,這是由于最優(yōu)策略目標是達到系統(tǒng)平均費用率最低,為減少費用,需增加檢測間隔,降低檢測次數(shù)。同時,當cin=5時,與預防性維修費用一致,此時為了減少費用,應當降低預防性維修控制閾,將狀態(tài)3和狀態(tài)4合為同一劣化狀態(tài),這樣既提高了預防性維修效果,又可減少檢測次數(shù),從整體上降低了平均費用;當cin=8時,與換件維修費用一致,為了減少費用可將狀態(tài)3、4、5看做一個狀態(tài)。
圖4 檢測費用變化對維修策略的影響
本文以考慮隨機沖擊的單部件退化系統(tǒng)為研究對象,系統(tǒng)內(nèi)有單一維修臺,可進行不完全預防性維修和換件維修兩種維修活動,維修活動由隨機檢測結(jié)果決定,將系統(tǒng)性能劃分為多個離散狀態(tài),建立了基于PH分布的系統(tǒng)維修策略優(yōu)化模型,利用值迭代算法,確定了系統(tǒng)最佳的預防性維修控制閾和各狀態(tài)對應的檢測間隔時間,以達到長期運行條件下的平均費用率最低且系統(tǒng)穩(wěn)態(tài)可用度滿足要求。最后,通過算例進行了63次迭代得出了最優(yōu)策略,驗證了模型的正確性與適用性,同時演示了檢測費用參數(shù)變化對最佳策略的影響,具有一定的工程實踐價值。