徐 達 關(guān) 矗 周 誠 李 闖
1. 陸軍裝甲兵學院,北京 100072 2. 中國人民解放軍63850部隊,吉林白城 137000
武器裝備系統(tǒng)在進行維修性試驗評價時,常由于時間緊、任務(wù)重以及試驗環(huán)境和條件復(fù)雜等多方面因素的影響,導(dǎo)致裝備試驗階段現(xiàn)場數(shù)據(jù)樣本量不足,無法對裝備維修性進行精確評估[1]。針對此問題,有學者通過數(shù)據(jù)融合方法,充分利用裝備在前期各階段收集獲取的驗前數(shù)據(jù)和現(xiàn)場試驗數(shù)據(jù)進行加權(quán)融合,統(tǒng)計評判和推測以擴大數(shù)據(jù)量[2]。然而,在應(yīng)用融合算法時,往往會忽略一個重要問題:驗前數(shù)據(jù)是武器裝備系統(tǒng)在不同的試驗階段和狀態(tài)下獲取的,每個階段試驗條件的不同會導(dǎo)致多源驗前數(shù)據(jù)之間產(chǎn)生差異,差異較大的數(shù)據(jù)若直接融合,必會降低維修性評估的準確性和可信性。因此,需要對驗前數(shù)據(jù)與現(xiàn)場數(shù)據(jù)進行一致性檢驗,分析是否服從同一分布,以判別該驗前數(shù)據(jù)能否參與數(shù)據(jù)融合[3]。
本文針對驗前數(shù)據(jù)能否與現(xiàn)場數(shù)據(jù)融合的問題,提出了一種基于圖對比說明法和Wilcoxon秩和檢驗法的一致性檢驗方法,分別從定性和定量兩個方面對裝備維修性驗前數(shù)據(jù)進行判別以決定是否能用于數(shù)據(jù)融合。
有效的驗前數(shù)據(jù)應(yīng)該能夠反映該裝備維修性的統(tǒng)計特征,即驗前數(shù)據(jù)和現(xiàn)場數(shù)據(jù)服從或近似服從同一總體分布,以此作為前提才能保證良好的多源數(shù)據(jù)融合精度[4]。一致性檢驗技術(shù)作為多源數(shù)據(jù)融合的重要步驟,用來判別驗前數(shù)據(jù)與現(xiàn)場數(shù)據(jù)總體分布的差異程度,以確定該驗前數(shù)據(jù)能否與現(xiàn)場數(shù)據(jù)相融合。
對驗前數(shù)據(jù)和現(xiàn)場數(shù)據(jù)采取定性分析以確定兩者是否服從同一分布類型,譬如驗前數(shù)據(jù)服從指數(shù)分布,而現(xiàn)場數(shù)據(jù)服從正態(tài)分布,則直接判定該驗前數(shù)據(jù)不能融合;即使服從同一分布類型,也可能出現(xiàn)分布參數(shù)相差極大的情況導(dǎo)致不能融合,所以需要進一步做定量分析,更為精確的確定兩者的一致性,流程如圖1所示。
一致性檢驗具有一套明確的方法體系,針對不同種類不同情況的數(shù)據(jù)有其相適應(yīng)的檢驗方法,如圖2所示。定性分析常采用圖對比說明法,而定量分析又分動態(tài)和靜態(tài)檢驗。動態(tài)檢驗常用于隨機過程產(chǎn)生的試驗數(shù)據(jù),譬如導(dǎo)彈在每一飛行時刻產(chǎn)生的數(shù)據(jù),包括Theil不等式系數(shù)法,最大熵譜法等;靜態(tài)試驗用于測試隨機變量的觀測值,包括參數(shù)檢驗法和非參數(shù)檢驗法。參數(shù)檢驗法往往用于已知試驗數(shù)據(jù)的未知參數(shù)總體分布類型,需要針對不同分布參數(shù)情況假設(shè)對應(yīng)的檢驗統(tǒng)計量,常用置信區(qū)間法和假設(shè)檢驗法,但該方法操作難度大,計算極其繁瑣[5];非參數(shù)檢驗法主要針對未知試驗數(shù)據(jù)的總體分布類型及參數(shù)的情況,包含K-S檢驗法,Preason檢驗法,Wilcoxon秩和檢驗法和Mood檢驗法。K-S檢驗法和Preason檢驗法可以對任意兩樣本進行檢驗,但要求數(shù)據(jù)量至少大于50個樣本,Wilcoxon秩和檢驗法和Mood檢驗法在樣本量較小的情況下依然能夠保持檢驗的有效性[6]。
圖1 一致性檢驗流程圖
圖2 一致性檢驗法分類圖
通過分析某型坦克多源維修性試驗數(shù)據(jù)的特點,發(fā)現(xiàn)其非實時數(shù)據(jù),不適用于動態(tài)檢驗,且樣本量普遍較小,故選擇圖對比說明法進行初步的定性分析,通過對比圖形特點及差異進行目視判別2種數(shù)據(jù)服從的分布類型和一致性,以決定是否進行檢驗功效更高的定量分析。若圖形對比出現(xiàn)明顯差異可直接判定一致性較差,不能融合;反之則由靜態(tài)檢驗中的Wilcoxon秩和檢驗法進行更為精確的定量分析。
針對獲取的多源維修性數(shù)據(jù)樣本,可以采取計算和操作較為簡便的圖對比說明法對其一致性檢驗進行初步定性分析,即通過對比驗前數(shù)據(jù)和現(xiàn)場數(shù)據(jù)的擬合曲線形態(tài)特征及擬合相似程度進行檢驗。該方法具有簡便且有效的檢驗功效,同時也為接下來采取定量檢驗的必要性作出判斷。
將某型坦克在性能試驗階段的維修性試驗數(shù)據(jù)作為驗前數(shù)據(jù),對該型坦克在作戰(zhàn)試驗階段進行維修性試驗,獲取維修性試驗數(shù)據(jù)作為現(xiàn)場數(shù)據(jù)。根據(jù)專家經(jīng)驗,裝甲裝備的維修時間大多服從對數(shù)正態(tài)分布[7],因此假設(shè)該坦克維修時間也服從對數(shù)正態(tài)分布,對維修性驗前數(shù)據(jù)和現(xiàn)場數(shù)據(jù)進行取對數(shù)處理并整理,見表1和表2。
表1 某型坦克維修性驗前數(shù)據(jù)
表2 某型坦克維修性現(xiàn)場數(shù)據(jù)
對表1和表2的維修性驗前數(shù)據(jù)和現(xiàn)場數(shù)據(jù)采用直方圖法進行分析,再生成散點圖擬合曲線,估測2種維修性數(shù)據(jù)所服從的總體分布。步驟如下:
1)分別找到表1和2中的最短維修時間x1min=2.789,x2min=2.931和最長維修時間x1max=3.913,x2max=3.783。取a1略小于x1min,b1略小于x2min;a2略大于x1max,b2略大于x2max,即a1=2.70,b1=4.00,a2=2.90,b2=3.80。
2)根據(jù)驗前數(shù)據(jù)和現(xiàn)場數(shù)的樣本量n=15和極差值b1-a1=1.30,b2-a2=0.90,由式(1)計算直方圖分組數(shù)K=10,即將兩組維修性試驗數(shù)據(jù)各分為10組。
K=1+3.32ln(n)或K=1.52(n-1)0.4
(1)
3)求取驗前數(shù)據(jù)分布直方圖的步長Δ=(a2-a1)/K=0.13,故驗前數(shù)據(jù)分布直方圖的各分點為a1,…,a1+kΔ,k=n-1,應(yīng)盡量避免區(qū)間分點值與試驗樣本中的任意維修時間值重疊,現(xiàn)場數(shù)據(jù)直方圖各分點同理類推。
4)統(tǒng)計所有維修時間樣本落入各區(qū)間的頻數(shù)ni,并轉(zhuǎn)化為頻率fi=ni/n,見表3和表4,以區(qū)間分點作橫坐標,概率密度作縱坐標建立維修時間分布直方圖(圖3和圖5),并據(jù)此生成散點圖,通過數(shù)據(jù)擬合得到維修時間概率密度曲線(圖4和圖6),及高斯擬合精度參數(shù)(表5),從而分析判斷其服從的總體分布類型。
表3 維修性驗前數(shù)據(jù)概率密度及累積頻率
表4 維修性現(xiàn)場數(shù)據(jù)概率密度及累積頻率
分別對數(shù)據(jù)采取線性、二次方、三次方和高斯曲線擬合,通過對殘差值進行對比分析,發(fā)現(xiàn)高斯曲線擬合的殘差值最小,如圖7所示,故選擇該法進行擬合以達到較好的擬合效果。
圖3 驗前數(shù)據(jù)分布直方圖
圖4 驗前數(shù)據(jù)高斯擬合曲線
圖5 現(xiàn)場數(shù)據(jù)分布直方圖
圖6 現(xiàn)場數(shù)據(jù)高斯擬合曲線
圖7 殘差對比圖
對直方圖,高斯擬合曲線的趨勢觀察分析,初步判定驗前數(shù)據(jù)和現(xiàn)場數(shù)據(jù)的擬合曲線均服從正態(tài)分布,又根據(jù)擬合精度數(shù)據(jù)可以判斷兩者的擬合程度皆較好。
單純依靠目視判別2種數(shù)據(jù)服從對數(shù)正態(tài)分布往往會受到很多質(zhì)疑,因此引入國際上廣泛應(yīng)用的Epps-Pulley檢驗法來對上述結(jié)果進行進一步驗證與分析[8]。該方法主要適用于正態(tài)分布,且對很多備擇假設(shè)具有較為精準的檢驗功效,要求樣本量不得小于8個。以驗前數(shù)據(jù)為例,假設(shè)該驗前數(shù)據(jù)樣本服從對數(shù)正態(tài)分布,步驟如下:
(2)
(3)
(4)
(5)
4)根據(jù)驗前數(shù)據(jù)樣本量n和上述得到的A,B值,代入式(6)計算該驗前數(shù)據(jù)樣本的檢驗統(tǒng)計量TEP=0.2733。設(shè)定顯著性水平α=0.05,在EP檢驗表中找到n=15,1-α=0.95所對應(yīng)的標準分位數(shù)TEP=0.3584,發(fā)現(xiàn)該驗前數(shù)據(jù)樣本的TEP值小于對應(yīng)的標準值,故接受原假設(shè),認為驗前數(shù)據(jù)服從對數(shù)正態(tài)分布。
(6)
同理,現(xiàn)場數(shù)據(jù)也通過了Epps-Pulley檢驗,即服從對數(shù)正態(tài)分布。綜上所述,經(jīng)過直方圖法和高斯擬合曲線,可以初步目視判別2種數(shù)據(jù)服從對數(shù)正態(tài)分布,且發(fā)現(xiàn)驗前數(shù)據(jù)和現(xiàn)場數(shù)據(jù)的分布具有較高的相似性,進而確定兩者服從同一分布類型,為驗證判斷的準確性,最后引入對數(shù)據(jù)正態(tài)性具有較高檢驗功效的Epps-Pulley檢驗法,均通過了檢驗,充分證明二者之間是相容的。
通過圖對比說明法從定性角度對驗前數(shù)據(jù)和現(xiàn)場數(shù)據(jù)進行擬合與檢驗,對2種數(shù)據(jù)的一致性進行了初步檢驗,但有專家學者指出單一的圖對比說明法并不能作為充足的證據(jù)證明一致性,因此本文在此基礎(chǔ)上采用非參數(shù)檢驗中的Wilcoxon秩和檢驗法,從定量的角度對驗前數(shù)據(jù)和現(xiàn)場數(shù)據(jù)的一致性進行更為精確的分析檢驗。
Wilcoxon秩和檢驗法適用于對試驗中抽取的2個小樣本數(shù)據(jù)是否服從同一總體分布。該法對樣本的要求小,可在未知樣本分布類型及分布參數(shù)的情況下進行檢驗,得到較為精確的結(jié)果[9-11]。由于驗前數(shù)據(jù)X1=(x1,x2,…,xn1)的分布F(x)和現(xiàn)場數(shù)據(jù)X2=(x1,x2,…,xn2)的分布G(x)未知,故給定統(tǒng)計假設(shè)H0:F(x)和G(x)近似服從同一總體分布;H1:F(x)和G(x)不服從同一總體分布?,F(xiàn)用秩和檢驗法對2種數(shù)據(jù)的一致性進行檢驗,步驟如下:
1)將驗前數(shù)據(jù)和現(xiàn)場數(shù)據(jù)混合,按照升序或降序排列,為每個數(shù)據(jù)的排名次序進行編號,見表6,得到次序統(tǒng)計量w。
w1≤w2≤…≤wn1+n2
2)若驗前數(shù)據(jù)樣本X1=(x1,x2,…,xn1)中的任一數(shù)值xk與次序統(tǒng)計量中的wj相等,則記j為驗前數(shù)據(jù)xk的秩rk(xk),即rx(xk)=j。將驗前數(shù)據(jù)樣本X1中的每個數(shù)據(jù)的秩代入式(7),求和T,以此作為檢驗的統(tǒng)計量,根據(jù)表6計算可得,驗前數(shù)據(jù)的秩和T為223。
(7)
表6 維修性驗前數(shù)據(jù)與現(xiàn)場數(shù)據(jù)混合排序
3)設(shè)定顯著性水平α=0.1,將兩數(shù)據(jù)樣本量n1=n2=15,及其秩和T=223代入式(8)左側(cè)得1.39,根據(jù)查表可知μ0.05=1.96,代入式(8)成立,則認為兩樣本數(shù)據(jù)近似服從同一總體分布,即假設(shè)H0成立。
(8)
以某型坦克在性能試驗和作戰(zhàn)試驗階段的維修性數(shù)據(jù)為例,從定性角度分析,借助直方圖法對驗前數(shù)據(jù)和現(xiàn)場數(shù)據(jù)進行數(shù)理統(tǒng)計,初步分析數(shù)據(jù)大致分布情況,再采用高斯擬合曲線進行擬合,初步分析其分布情況和曲線趨勢,判定驗前數(shù)據(jù)和現(xiàn)場數(shù)據(jù)均服從對數(shù)正態(tài)分布,且利用Epps-Pulley檢驗法對判定結(jié)果進行檢驗且得以證實。為進一步精準判定兩種數(shù)據(jù)的一致性,采用非參數(shù)檢驗的Wilcoxon秩和檢驗從定量的角度進行分析,如檢驗結(jié)果表明驗前數(shù)據(jù)和現(xiàn)場數(shù)據(jù)通過了數(shù)據(jù)融合前的一致性檢驗,則驗前數(shù)據(jù)直接可以用來擴充數(shù)據(jù)樣本量,進而開展裝備維修性評價。