宮 華, 李作華, 劉洪濤, 郝永平
(1.沈陽理工大學 理學院,遼寧 沈陽 110159; 2.遼寧華興機電有限公司,遼寧 錦州 121017; 3.沈陽理工大學 裝備工程學院,遼寧 沈陽 110159)
軍用產(chǎn)品的可靠性水平是軍事儲備中衡量產(chǎn)品質(zhì)量的一項關(guān)鍵技術(shù)指標,是衡量國家軍事后勤保障技術(shù)水平的重要依據(jù)。武器系統(tǒng)等產(chǎn)品大部分處于貯存、維護和檢測等非工作狀態(tài),具有長期貯存、一次性使用的典型特征。由于貯存環(huán)境溫度、濕度、年限等因素影響,產(chǎn)品的質(zhì)量與存儲壽命必然隨之發(fā)生變化。若達到實際貯存壽命而超期服役,則增加了武器產(chǎn)品貯存和使用的不安全性。而未達到實際貯存壽命而提前退役的,將會造成大量的經(jīng)濟損失。因此,針對武器產(chǎn)品貯存可靠性進行科學準確預測研究,預知產(chǎn)品質(zhì)量與儲存變化規(guī)律,能夠為軍方提供訂購生產(chǎn)、儲備布局和維護檢測的決策依據(jù)。然而可靠性工程中所收集的各種貯存可靠性數(shù)據(jù),對數(shù)據(jù)自身規(guī)律的解析不足。如何有效地利用已知歷史數(shù)據(jù),挖掘數(shù)據(jù)本身所隱藏的信息進行可靠性預測,將數(shù)據(jù)轉(zhuǎn)化為決策以提高軍事政策制定與評估的科學化和智能化程度,是實現(xiàn)軍事現(xiàn)代化的必然要求。
貯存可靠性預測是指預測產(chǎn)品在一定的貯存條件下和一定的貯存時間內(nèi)保持產(chǎn)品指定功能能力的概率值。針對數(shù)學機理模型和加速壽命試驗的貯存可靠性預測已有很多學者進行了相關(guān)研究。Mense等人[1]詳細綜述了貯存可靠性的評估模型與方法。Zhang等人[2]針對初始故障參數(shù)測量提出E-Bayes估計方法對貯存可靠性進行預測。Zheng等人[3]基于測試數(shù)據(jù)的通道對系統(tǒng)貯存可靠性進行評估。Su等人[4]、Zhang等人[5]基于指數(shù)分布前提下研究考慮定期檢測的產(chǎn)品貯存可靠性預測問題。Si等人[6]針對剩余貯存壽命建立二階連續(xù)時間齊次馬爾可夫預測模型。Wang等人[7]基于狀態(tài)監(jiān)測影響的隨機濾波預測剩余壽命。趙志草等人[8]在應(yīng)力下失效分布函數(shù)基礎(chǔ)上對加速壽命試驗進行可靠性評估。盡管上述文獻從機理模型出發(fā)對可靠性預測方面進行了相關(guān)研究,但傳統(tǒng)的貝葉斯等機理模型很大程度上依賴于先驗分布及對機理的認知。而軍品的結(jié)構(gòu)、功能、失效模式、貯存的環(huán)境條件等雖然相似,但對貯存可靠性變化影響差異較大,指標與相關(guān)變量之間具有非線性關(guān)系。在機理不明確條件下,傳統(tǒng)的數(shù)學機理模型所建立的貯存可靠性預測方法并不適用。
在可靠性預測方法上已有在人工神經(jīng)網(wǎng)絡(luò)及智能優(yōu)化預測方法的相關(guān)研究。鄒心遙等人[9]將支持向量機和Bayes方法結(jié)合評估小子樣可靠性。章恩澤等[10]提出區(qū)間多目標粒子群算法解決可靠性優(yōu)化問題。Liu等人[11]針對導彈部件在變溫條件下的貯存可靠性評估進行研究。陳海建等人[12]提出基于BP和RBF兩種神經(jīng)網(wǎng)絡(luò)對彈藥貯存可靠性進行預測方法研究。已有研究表明人工神經(jīng)網(wǎng)絡(luò)對可靠性的預測研究具有較好的預測效果。尤其是神經(jīng)網(wǎng)絡(luò)描述輸入輸出可實現(xiàn)任意復雜的非線性函數(shù)映射,容錯能力強,易于實現(xiàn)。然而許多軍用產(chǎn)品試驗樣品不多,需要長期觀測且樣本量偏少。盡管文獻中已有基于人工神經(jīng)網(wǎng)絡(luò)對可靠性進行的預測研究,但在基于小子樣的貯存可靠性預測的泛化能力受到一定影響,進而影響預測結(jié)果。當樣本數(shù)據(jù)量不充分時,如何有效利用貯存歷史數(shù)據(jù)挖掘出產(chǎn)品可靠性變化,改進神經(jīng)網(wǎng)絡(luò)預測方法及分析質(zhì)量規(guī)律是亟待解決的問題。
綜上分析,本文從數(shù)據(jù)、模型、預測方法上對貯存可靠性預測進行研究,主要貢獻如下:(1)針對貯存年限、可靠度的歷史數(shù)據(jù),基于年限與可靠度的時間序列建立貯存可靠度預測模型。直接從數(shù)據(jù)中揭示變化規(guī)律作為輸入與可靠度作為輸出之間的關(guān)系,消除由于不明確機理帶來的模型誤差。(2)為提高預測的泛化能力,采用橫向數(shù)據(jù)進行樣本數(shù)據(jù)集擴充,提高樣本的數(shù)量與質(zhì)量,解決樣本量偏少對預測的泛化能力和精度影響。(3)將粒子群(PSO)算法的全局搜索和BP神經(jīng)網(wǎng)絡(luò)的局部搜索相結(jié)合,通過迭代預測未來武器產(chǎn)品貯存的變化趨勢。引入進化策略改進PSO算法,根據(jù)進化狀態(tài)優(yōu)化BP神經(jīng)網(wǎng)絡(luò)的拓撲結(jié)構(gòu),進行神經(jīng)網(wǎng)絡(luò)權(quán)值和閾值優(yōu)化,提高神經(jīng)網(wǎng)絡(luò)收斂速度和訓練質(zhì)量,提高貯存可靠性預測精度。
貯存可靠度R(t)是保持規(guī)定功能的概率,是衡量儲存可靠性的指標,表示為:R(t)=P(ξ>t),其中ξ為產(chǎn)品失效前貯存的時間,t為規(guī)定的貯存時間。根據(jù)產(chǎn)品的可靠性結(jié)構(gòu)、壽命模型及其他試驗數(shù)據(jù),利用概率方法對產(chǎn)品或部件可靠度的特征量R(t)進行統(tǒng)計推斷。貯存壽命的可靠性預測是指通過貯存可靠度的已知數(shù)據(jù)對未來時刻的可靠度進行估計。設(shè)某型號部件可靠度在年份時間序列t1,t2,…,tn上的貯存可靠度為R(t1),R(t2),…,R(tn),對于未來年份tn+1的可靠度R(tn+1)進行預測,預測函數(shù)表示為:R(tn+1)=f(R(t1),R(t2),…,R(tn),tn+1)。年份與可靠度形成時間序列作為數(shù)據(jù)的輸入與輸出,進行神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的訓練與測試。
BP神經(jīng)網(wǎng)絡(luò)是一種包括正向傳播和反向傳播學習的有監(jiān)督、多層前饋神經(jīng)網(wǎng)絡(luò)。前向傳播過程是指訓練樣本由輸入層通過隱含層訓練進行網(wǎng)絡(luò)輸出。當輸出值與期望輸出值誤差較大時,轉(zhuǎn)入誤差反向傳播過程。通過誤差值調(diào)整神經(jīng)網(wǎng)絡(luò)的權(quán)值和閾值,使得網(wǎng)絡(luò)輸出逼近期望值。設(shè)輸入層為n個神經(jīng)元,表示在時間序列t1,t2,…,tn上貯存可靠度的歷史數(shù)據(jù),輸出層m為1個神經(jīng)元,代表貯存可靠度在tn+1時刻的預測值。
BP神經(jīng)網(wǎng)絡(luò)訓練過程描述如下:
Step1輸入數(shù)據(jù)和輸出數(shù)據(jù)的歸一化處理:
(1)
其中Rmax和Rmin表示數(shù)據(jù)集中貯存可靠度的最大值和最小值,為貯存可靠度的歷史數(shù)據(jù)實際值。
Step2計算隱含層所有節(jié)點的輸出,i=1,…,n;j=1,…,h,
(2)
(3)
其中節(jié)點j的激活變量為netj,輸入層節(jié)點i到隱含層節(jié)點j的連接權(quán)值為wij,節(jié)點j的輸出閾值與輸出量分別為bj和yj,選用S型函數(shù)f(·)為隱含層激活函數(shù)。
Step3計算神經(jīng)網(wǎng)絡(luò)的輸出結(jié)果:
(4)
其中隱含層節(jié)點j到輸出層連接權(quán)值為woj,輸出層閾值為bo,第k組訓練樣本的可靠度預測值為Rk,輸出層激活函數(shù)為g(·)。
Step4運用反向傳播,修正神經(jīng)網(wǎng)絡(luò)的權(quán)值和閾值,最小化訓練誤差MSE:
(5)
粒子群算法[14](PSO)是一種來源于對鳥群覓食行為模擬的智能優(yōu)化算法。隨機初始化一群粒子,通過迭代找到個體極值與全局極值更新粒子的位置,尋求最優(yōu)解。假設(shè)存在N個粒子的種群在D維解空間中進行搜索,Xi=(xi1,…,xiD)代表第i個粒子的位置矢量,Vi=(vi1,…,viD)為第i個粒子的飛行速度,i=1,…,N。根據(jù)公式(6)(7)更新自身的速度和位置,產(chǎn)生新種群。由適應(yīng)度函數(shù)計算每個粒子的適應(yīng)度值,進而確定個體與全局最優(yōu)值。
(6)
(7)
(8)
其中wmax和wmin分別為慣性權(quán)重的最大值和最小值,通常取0.9和0.4,Tmax為最大迭代次數(shù)。
本文根據(jù)粒子群的進化狀態(tài)采用Schwefel[15]提出的進化策略,使用適應(yīng)高斯突變優(yōu)化參數(shù)。進化策略產(chǎn)生小高斯突變的概率較大,能有效避免局部最優(yōu),提高PSO優(yōu)化算法收斂速度尋求全局最優(yōu)解。進化策略(ES)思想為:將粒子狀態(tài)劃分為正常和早熟兩種狀態(tài),設(shè)置閾值limit,記錄全局最優(yōu)值連續(xù)沒有更新的次數(shù)。若次數(shù)>limit時Pg沒有更新,則認為種群處于早熟狀態(tài),否則為正常狀態(tài)。早熟狀態(tài)時通過改變步長的速度,粒子速度更新公式為(9)(10),重新更新Pib和Pg。
(9)
(10)
訓練樣本的數(shù)量、質(zhì)量、初始權(quán)值和網(wǎng)絡(luò)結(jié)構(gòu)復雜性等影響自身的擬合程度和預測精度,是影響網(wǎng)絡(luò)泛化能力的決定因素。由于BP神經(jīng)網(wǎng)絡(luò)初始權(quán)值的隨機性可能會導致不同預測精度,訓練容易陷入局部最優(yōu),存在多個局部極值,使得網(wǎng)絡(luò)結(jié)構(gòu)難以確定。而武器產(chǎn)品長期儲存,樣本數(shù)據(jù)的數(shù)量不夠充分,直接采用BP神經(jīng)網(wǎng)絡(luò)進行預測,其泛化能力及預測精度均受到影響。本文采用以下三種方法進行神經(jīng)網(wǎng)絡(luò)的改進與優(yōu)化。(1)擴大樣本數(shù)量,避免過擬合。(2)根據(jù)輸入層、輸出層的神經(jīng)單元數(shù)和樣本數(shù)量,確定隱含層節(jié)點數(shù),避免參數(shù)的盲目選擇。(3)基于改進的進化策略PSO算法,優(yōu)化初始權(quán)值閾值,克服BP神經(jīng)網(wǎng)絡(luò)的缺點,提高預測精度。
對于樣本數(shù)據(jù)量不充分的數(shù)據(jù)集,不同的輸入數(shù)據(jù)集選擇方法將導致不同預測結(jié)果。本文采用橫向數(shù)據(jù)集作為輸入數(shù)據(jù)集。
將原始數(shù)據(jù)按照時間序列從1到n進行編號,確定輸入數(shù)據(jù)集維度d=5。假設(shè)i為樣本選擇的開始點,則訓練樣本的第一組輸入為R(ti+1),…,R(ti+d),輸出為R(ti+d+1)。訓練樣本的第二組輸入為R(ti+d+1),…,R(ti+2d),輸出為R(ti+2d+1)。以此類推,訓練樣本的第k組輸入為R(ti+(k-1)d+1),…,R(ti+kd),輸出為R(ti+kd+1)。測試樣本根據(jù)下列規(guī)則進行選擇:測試樣本的第一組輸入為R(ti+2),…,R(ti+d+1),輸出為R(ti+d+2)。測試樣本的第二組輸入為R(ti+d+2),…,R(ti+2d+1),輸出為R(ti+2d+2)。以此類推,測試樣本的第k組輸入為R(ti+(k-1)d+2),…,R(ti+kd+1),輸出為R(ti+kd+2)。訓練集與測試集的選擇過程如圖1所示。
圖1 構(gòu)造數(shù)據(jù)集的過程
粒子群算法具有較強的全局搜索最優(yōu)解能力,BP神經(jīng)網(wǎng)絡(luò)具有較強的局部搜索最優(yōu)能力,其初始權(quán)值和閾值在[0,1]之間產(chǎn)生。因此,將權(quán)值閾值定義為PSO中的粒子位置,基于進化策略,將種群分為正常和早熟狀態(tài)。通過最優(yōu)粒子位置的尋優(yōu)過程優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu),提高算法的收斂速度和貯存可靠度的預測精度。
ES-PSO-BP模型的整體流程如圖2所示,算法具體描述如下。
圖2 ES-PSO-BP模型的流程圖
Step1數(shù)據(jù)集歸一化,構(gòu)建網(wǎng)絡(luò)結(jié)構(gòu)。
Step2根據(jù)年限形成的可靠度時間序列,確定訓練樣本集與測試樣本集。
Step3初始化粒子群參數(shù)。種群規(guī)模、最大迭代次數(shù)、權(quán)值、學習因子、狀態(tài)劃分閾值limit等參數(shù)。
Step4在[0,1]范圍隨機初始化N個粒子的位置與速度,粒子維度D=(n+m)*h+h+m。
Step5計算粒子的初始個體與全局最優(yōu)適應(yīng)度值。設(shè)定粒子的適應(yīng)度函數(shù)為BP神經(jīng)網(wǎng)絡(luò)的訓練誤差函數(shù),根據(jù)適應(yīng)度值確定粒子個體最優(yōu)和種群全局最優(yōu)值。
Step6根據(jù)種群進化狀態(tài),更新粒子速度與位置。比較全局最優(yōu)值連續(xù)沒有更新的次數(shù)與閾值limit。若次數(shù)>limit時,種群處于早熟狀態(tài),則根據(jù)進化策略式(9)與(10)更新粒子速度和位置產(chǎn)生新種群。否則處于正常狀態(tài),根據(jù)式(6)與(7)更新粒子的速度和位置產(chǎn)生新種群。粒子的速度和位置不能超過[-vmax,vmax]和[-xmax,xmax]的范圍。
Step7計算粒子的適應(yīng)度值與全局最優(yōu)適應(yīng)度值,若當前粒子適應(yīng)度值優(yōu)于歷史最優(yōu)值,則更新當前個體最優(yōu)值為Pib,同時更新全局最優(yōu)位置Pg。若達到最大迭代次數(shù),則轉(zhuǎn)向Step 8,否則回到Step 6。
Step8將Pg映射到BP神經(jīng)網(wǎng)絡(luò)的權(quán)值與閾值。對BP神經(jīng)網(wǎng)絡(luò)進行網(wǎng)絡(luò)訓練,若隱含層節(jié)點數(shù)滿足最大值hmax,執(zhí)行Step 9,否則執(zhí)行Step 4。
Step9根據(jù)網(wǎng)絡(luò)訓練性能指標確定隱含層節(jié)點數(shù),輸入測試樣本集進行貯存可靠度預測。
為驗證本文所提出的算法對貯存可靠性預測的有效性,以某彈藥部件的貯存歷史可靠度數(shù)據(jù)為例進行實驗。R(t1),R(t2),…,R(tn)形成的時間序列為BP神經(jīng)網(wǎng)絡(luò)的輸入數(shù)據(jù),R(tn+1)為網(wǎng)絡(luò)的輸出值即預測值。根據(jù)歷史數(shù)據(jù),選取某型號彈藥部件4年(48個月)的平均貯存可靠度數(shù)據(jù),樣本數(shù)據(jù)如表1所示。將原始數(shù)據(jù)按照時間序列從1到48進行編號,確定輸入數(shù)據(jù)集維度d=5。
表1 樣本數(shù)據(jù)集
為說明ES-PSO-BP算法預測的準確性,將BP、PSO-BP和ES-PSO-BP神經(jīng)網(wǎng)絡(luò)三種算法進行對比分析。參數(shù)設(shè)置如下:
BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu):輸入n=5,輸出m=1,選取“tansig”和“purelin”為傳遞函數(shù)。選取動量BP法“traingdm”為訓練函數(shù),最大訓練次數(shù)設(shè)為10000,期望誤差設(shè)置為0.001,學習率為0.01。由經(jīng)驗公式計算的隱含層節(jié)點數(shù)的取值范圍:h0=4,hmax=13。
ES-PSO算法:粒子數(shù)N=30,解的維度(及粒子位置的維度)D=(n+m)*h+h+m=78。學習因子c1=c2=2.0,閾值limit=10,最大迭代次數(shù)Tmax=100。
選取4個性能指標評估預測精度:
平均誤差:
(11)
平均絕對誤差:
(12)
均方差:
(13)
平均絕對百分誤差:
(14)
需要指出:MAE表示平均絕對誤差值,避免誤差有正有負的中和問題。MSE表示預測均方誤差平均值,用來評價預測結(jié)果的變化程度,其中MSE值越小表明預測效果越好。MAPE用來評價預測方法的準確性。
對BP神經(jīng)網(wǎng)絡(luò)、PSO-BP和ESPSO-BP在節(jié)點數(shù)[4,13]范圍內(nèi)依次進行50次試驗,訓練結(jié)果的平均數(shù)據(jù)如表2所示。本文通過網(wǎng)絡(luò)MAPE值確定隱含層節(jié)點數(shù),三種網(wǎng)絡(luò)都在隱含層節(jié)點數(shù)為8時取到最小的MAPE值,三種網(wǎng)絡(luò)訓練效果都較好。因此,選取隱含層節(jié)點數(shù)8進行網(wǎng)絡(luò)訓練。
表2 三種網(wǎng)絡(luò)訓練的性能指標
如圖3、圖4所示,網(wǎng)絡(luò)均可以達到期望誤差精度MSE=0.001,但ES-PSO-BP神經(jīng)網(wǎng)絡(luò)收斂速度最快,BP網(wǎng)絡(luò)在迭代4877次達到期望誤差,PSO-BP網(wǎng)絡(luò)迭代530次,而ES-PSO-BP網(wǎng)絡(luò)迭代274次可實現(xiàn)收斂。從MSE變化曲線可知,PSO-BP和ES-PSO-BP網(wǎng)絡(luò)的訓練過程明顯比BP網(wǎng)絡(luò)更平穩(wěn)。圖5~7表明,BP神經(jīng)網(wǎng)絡(luò)的訓練擬合精度達到98.42%,PSO-BP網(wǎng)絡(luò)達到98.43%,而ES-PSO-BP網(wǎng)絡(luò)達到98.45%。顯然ES-PSO-BP網(wǎng)絡(luò)訓練擬合精度逼近能力最強,與BP和PSO-BP網(wǎng)絡(luò)相比,相應(yīng)的貯存可靠度的預測精度最高。圖8表明ES-PSO算法找到6次最優(yōu)解,適應(yīng)度值為0.001,均方差MSE更小。
圖3 PSO-BP網(wǎng)絡(luò)訓練曲線
圖4 ES-PSO-BP網(wǎng)絡(luò)訓練曲線
圖5 BP網(wǎng)絡(luò)訓練擬合精度
圖6 PSO-BP網(wǎng)絡(luò)訓練擬合精度
圖7 ES-PSO-BP網(wǎng)絡(luò)訓練擬合精度
圖8表明PSO-BP粒子尋優(yōu)過程迭代6次后收斂,出現(xiàn)早熟現(xiàn)象。當全局最優(yōu)值連續(xù)10次不變時,提出的進化策略優(yōu)化PSO-BP算法,從ES-PSO收斂曲線中可以看出粒子多次跳出最優(yōu)值進行搜索,避免了過度擬合與陷入局部最優(yōu)。表3對彈藥貯存可靠度進行的三種預測模型結(jié)果進行對比,ES-PSO-BP網(wǎng)絡(luò)模型的魯棒性和預測性能更好,獲得更小的AE、MAE、MSE和MAPE值。與BP神經(jīng)網(wǎng)絡(luò)與PSO-BP網(wǎng)絡(luò)相比,圖9~10表明ES-PSO-BP網(wǎng)絡(luò)的預測值更逼近期望預測值,絕對誤差和與誤差波動范圍更小。
表3 三種網(wǎng)絡(luò)的預測結(jié)果的比較
圖8 PSO與ES-PSO的收斂曲線
針對軍用產(chǎn)品非線性結(jié)構(gòu)及機理不確定情況,根據(jù)貯存年限和可靠度歷史數(shù)據(jù)構(gòu)造時間序列,采用橫向數(shù)據(jù)集方法擴充數(shù)據(jù),提高樣本的數(shù)量與質(zhì)量,從而建立貯存可靠度預測數(shù)學模型。通過進化策略改進粒子群的方法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)中的網(wǎng)絡(luò)權(quán)值和閾值,通過確定隱含層節(jié)點數(shù)訓練網(wǎng)絡(luò)模型,優(yōu)化神經(jīng)網(wǎng)絡(luò)的拓撲結(jié)構(gòu)。實驗結(jié)果表明,本文提出的ES-PSO-BP算法與BP神經(jīng)網(wǎng)絡(luò)、PSO-BP算法相比,能夠顯著提升神經(jīng)網(wǎng)絡(luò)收斂速度和訓練質(zhì)量,提高貯存可靠性預測精度,進而提升軍事決策與評估的科學能力。