宋貴寶 劉澤坤 羅亞民 李一夫
Bootstrap自助法實質(zhì)是利用重抽樣技術(shù)來評估不確定性,利用再生子樣對未知參數(shù)進行統(tǒng)計推斷,其關(guān)鍵在于獲得可信程度高的再生子樣。Bootstrap自助法是一種對中等數(shù)量規(guī)模的樣本進行統(tǒng)計推斷的較優(yōu)方法,在小子樣和特小子樣條件下再生子樣可信度不高[1]。
新時期條件下,導(dǎo)彈更新?lián)Q代速度加快、單枚造價高昂。針對導(dǎo)彈命中精度進行的評定試驗,現(xiàn)場試驗次數(shù)和觀測數(shù)據(jù)少,直接運用Bootstrap法,產(chǎn)生的再生子樣重復(fù)率高,其統(tǒng)計推斷結(jié)果偏差較大。同時,在導(dǎo)彈生產(chǎn)定型階段存在著大量的驗前信息。如何利用驗前信息去擴充現(xiàn)場試驗觀測樣本,改進Bootstrap自助法再生子樣的獲取方式,提高再生子樣的真實程度,是一個值得研究的問題。
基于此,本文針對對地攻擊導(dǎo)彈命中精度的評定問題,選取圓概率偏差CEP指標(biāo),采用非參數(shù)Bootstrap法,通過利用各類通過相容性檢驗的驗前信息來完善現(xiàn)場試驗觀測樣本,并引入重要度抽樣的思想,保護更為寶貴的原始觀測樣本數(shù)據(jù),提高再生子樣的真實程度和最終評定結(jié)果準(zhǔn)確性。
2.1 圓概率偏差CEP
命中精度表現(xiàn)了導(dǎo)彈武器系統(tǒng)彈藥相對于固定目標(biāo)點的落點散布特性,客觀反映了導(dǎo)彈武器系統(tǒng)對目標(biāo)的命中能力。對戰(zhàn)術(shù)彈道導(dǎo)彈和攻擊地面目標(biāo)的飛航導(dǎo)彈進行命中精度的評定,其實質(zhì)就是通過獲取各類試驗信息,對導(dǎo)彈武器系統(tǒng)的命中精度進行統(tǒng)計推斷。其中,圓概率偏差(CEP)是導(dǎo)彈武器系統(tǒng)命中精度評定最常用的指標(biāo)。
圓概率偏差(CEP)指的是在穩(wěn)定的發(fā)射條件下,向目標(biāo)發(fā)射的導(dǎo)彈武器系統(tǒng),有50%概率落入以期望彈著點(散步中心)為圓心、R為半徑的散布圓(等概率圓)內(nèi),該散布圓半徑R即為圓概率偏差CEP[2]。
針對平面目標(biāo)射擊,以目標(biāo)為圓心,射擊方向為縱軸,垂直于射擊方向為橫軸,(X,Z)表示落點偏差坐標(biāo)并服從正態(tài)分布,縱橫向獨立,(X,Z)~N(μX,μZ,σ2X,σ2Z)。如下式所示:
式中,當(dāng)P=50%時,R即為圓概率偏差CEP;μX、μZ為縱橫向射擊準(zhǔn)確度(系統(tǒng)誤差)要求,σX、σZ為縱橫向射擊密集度(標(biāo)準(zhǔn)差)要求,因此圓概率偏差CEP可綜合反映四個指標(biāo)(μX,μZ,σ2X,σ2Z),能夠很好的融合射擊準(zhǔn)確度和密集度進行表征。
2.2 命中精度縱橫向聯(lián)合檢驗
從工程應(yīng)用的角度考慮,對圓概率偏差CEP進行評定,直接尋找相關(guān)統(tǒng)計量較為困難。一般來說,由于系統(tǒng)誤差可采用各種手段進行補償修正,當(dāng)系統(tǒng)誤差遠小于隨機散布偏差時,對導(dǎo)彈命中精度CEP的評定試驗,可轉(zhuǎn)化為對射擊密集度(標(biāo)準(zhǔn)差)σ的評定。
假定系統(tǒng)誤差造成的落點偏差經(jīng)過補償修正,射擊無系統(tǒng)誤差,且落點散布為圓散布。對落點偏差坐標(biāo)(X,Z),有X ~ N(0,σ2X),Z ~ N(0,σ2Z)。
記σ2X?DX,σ2Z?DZ,則對于圓概率偏差CEP的評定,可轉(zhuǎn)化為對射擊密集度σ的評定[3],且當(dāng)σX= σZ= σ0時,可得:
當(dāng)σX≠σZ時,可得:
3.1 Bootstrap法原理
設(shè)某型導(dǎo)彈靶場試驗現(xiàn)場觀測i.i.d.樣本X={X1,X2,…,Xn}來自未知總體分布,Xi~ F(x),θ=θ(F)是總體分布F的未知數(shù),由子樣X1,X2,…,Xn作經(jīng)驗分布Fn,= ( )
Fn為θ的估計,記估計誤差:
將估計值 θ(j)(F )作為θ(F)的子樣,可作出θ(F)的抽樣分布,并由此出發(fā),作出關(guān)于θ的統(tǒng)計推斷[4~6]。
3.2 再生子樣獲取的抽樣方法
獲取再生子樣,首先要確定抽樣分布函數(shù)Fn。根據(jù)分布函數(shù)Fn中是否含有待定參數(shù),再生子樣的抽樣方式可分為非參數(shù)抽樣和參數(shù)抽樣。這里介紹非參數(shù)抽樣法。
將獲得的i.i.d子樣X1,X2,…,Xn按從小到大排序,可得 X={X(1),X(2),…,X(n)},且X(1)≤ X(2)≤ … ≤ X(n)??蓸?gòu)造經(jīng)驗分布函數(shù)如下[7]:
產(chǎn)生服從該經(jīng)驗分布函數(shù)的再生子樣步驟如下:
每次產(chǎn)生一個[1,n]區(qū)間上均勻分布的隨機整數(shù)η,則可根據(jù)η產(chǎn)生新的樣本點X(η);重復(fù)該過程n次,可得到一組再生子樣X*。
由經(jīng)驗分布函數(shù)可知,每個樣本點Xi都有相同的被抽中概率,特別是抽樣次數(shù)很大時,每個樣本點的出現(xiàn)頻率都趨近于 1/n[8]。
3.3 區(qū)間估計
對于參數(shù)θ,假定根據(jù)Bootstrap法產(chǎn)生的i組再生子樣所獲得的關(guān)于θ的參數(shù)估計為j* ,將j*按照大小順序排列,可得:
因此,給定某一水平α,通過區(qū)間截取,可獲得置信度水平為1-α的Bootstrap區(qū)間估計為
非參數(shù)Bootstrap抽樣法中產(chǎn)生的新的再生子樣均包含在原樣本中,且當(dāng)原樣本數(shù)量足夠時,產(chǎn)生的再生子樣中包含有重復(fù)子樣的概率極低。但是該方法的缺陷在于,當(dāng)待抽樣的原樣本的數(shù)量較少時,尤其是小子樣、特小子樣情況下(如n≤5),重抽樣的再生子樣會出現(xiàn)“退化”現(xiàn)象,即會多次出現(xiàn)兩組子樣相同的情況[9]。
因此考慮利用可信的驗前信息,對現(xiàn)場試驗數(shù)據(jù)進行補充,擴大待抽樣的原樣本容量,并引入重要度抽樣的思想保護現(xiàn)場試驗數(shù)據(jù),提高Bootstrap方法產(chǎn)生的再生子樣與真實分布的相符合程度。
4.1 驗前信息相容性KS檢驗
導(dǎo)彈在生產(chǎn)定型等過程中的驗前信息種類繁多。在應(yīng)用這些驗前信息前,必須對驗前信息和現(xiàn)場試驗信息進行相容性檢驗,本節(jié)采用KS檢驗法。
假定有來自于總體分布F(x)的樣本:
其經(jīng)驗分布函數(shù)為Fm(x)。
另有來自總體分布G(y)的樣本:
其經(jīng)驗分布函數(shù)為Gn(y)。
取檢驗統(tǒng)計量
并給定顯著性水平α,若
則可認(rèn)為兩樣本不屬于同一總體,否則屬于同一總體。式中
Dl,α可通過查找柯爾莫格洛夫檢驗臨界值表得出。
4.2 基于驗前信息的改進Bootstrap抽樣
假定有n組現(xiàn)場觀測數(shù)據(jù)為
且(Xi,Zi) ~ N(0,0,σX2,σZ2)。另有NF組已經(jīng)通過顯著性水平為α的KS檢驗的驗前信息落點偏差數(shù)據(jù)為
為避免現(xiàn)場試驗數(shù)據(jù)被大量驗前信息所“湮沒”,引入重要度抽樣的思想[10~11],根據(jù)不同類信息源的臨界檢驗水平αL(即超過該水平無法通過相容性檢驗)來映射信息源的置信度ωi。
工程上相容性檢驗的水平一般取0.1~0.4,因此采用以下從臨界檢驗水平αL到置信度ωi的線性映射:
假定存在p類驗前信息源,每類信息源的臨界檢驗水平為 αL(i)(i=1,2 ,…,p),則有線性映射:
根據(jù)置信度確定重要度。先令現(xiàn)場試驗子樣本的置信度ε0為1,則p類驗前信息源的重要度為
將上述兩組數(shù)據(jù)相混合,可以得到能夠產(chǎn)生再生子樣X*的待抽樣樣本:
現(xiàn)場試驗子樣本的重要度為
4.3 改進區(qū)間估計法
針對傳統(tǒng)區(qū)間估計方法估計效率不高,且總體分布非對稱時效果不佳的不足,本節(jié)采用Bootstrap-t區(qū)間估計法。
Bootstrap-t區(qū)間估計相關(guān)步驟如下:
1)根據(jù)觀測子樣X獲得參數(shù)θ的估計值 和標(biāo)準(zhǔn)差 se();
2)由經(jīng)驗函數(shù)再抽取k組再生子樣本為
并由各子樣本分別獲得估計值 *i和估計標(biāo)
3)取統(tǒng)計量
并根據(jù)大小順序排列 t*i,得到
則給定某一水平α,通過區(qū)間截取,可獲得置信度水平為1-α的Bootstrap區(qū)間估計為
某型對地攻擊導(dǎo)彈進行命中精度評定,經(jīng)過現(xiàn)場靶場試射,得到5組真實縱橫向落點偏差值數(shù)據(jù),且服從正態(tài)分布N(0,502),具體數(shù)據(jù)見表1。
表1 現(xiàn)場觀測樣本數(shù)據(jù)
另有兩類通過了KS相容性檢驗的驗前信息,一類是改進前相似型號試射的6組驗前數(shù)據(jù)(臨界檢驗水平αL1為0.1),另一類是模擬彈道仿真試驗的6組驗前數(shù)據(jù)(臨界檢驗水平αL2為0.2),兩類驗前數(shù)據(jù)均服從正態(tài)分布N(0,552),具體數(shù)據(jù)見表2、表3。
根據(jù)式(16)線性映射,可得相似型號試射信息的置信度為1/2,彈道仿真信息的置信度為2/3;
表2 改進前相似型號試射驗前信息數(shù)據(jù)
表3 模擬彈道仿真驗前信息數(shù)據(jù)
根據(jù)式(17)、式(18),可得相似型號試射驗前信息分配權(quán)重為
彈道仿真信息分配重要度為
現(xiàn)場真實數(shù)據(jù)分配重要度為
因此,相似型號試射驗前數(shù)據(jù)的6個子樣本每個被抽中概率約為0.038;彈道仿真信息的6個子樣本每個被抽中概率約為0.052;現(xiàn)場真實數(shù)據(jù)5個樣本,每個被抽中的概率約為0.092。
根據(jù)圖2仿真步驟進行抽樣,設(shè)定再生子樣的容量為20(即每20個新產(chǎn)生的數(shù)據(jù)為一組再生子樣),共抽取2000組。由獲得的子樣本相關(guān)數(shù)據(jù),分別進行縱、橫向射擊密集度(標(biāo)準(zhǔn)差)點估計、置信度80%的區(qū)間估計以及計算圓概率偏差CEP值。仿真步驟如下:
根據(jù)仿真流程,所獲得的仿真結(jié)果與分析結(jié)論如下:
1)基于驗前信息的改進Bootstrap法與經(jīng)典統(tǒng)計方法的仿真結(jié)果見表4。
分析可知,經(jīng)典統(tǒng)計方法直接應(yīng)用現(xiàn)場觀測樣本與驗前信息共17個樣本數(shù)據(jù),該方法并不產(chǎn)生再生子樣,其σX與σZ的點估計要大于采用重要度抽樣的自助法的σX與σZ的點估計,且經(jīng)典統(tǒng)計方法區(qū)間估計遠不夠精確,如σX的80%置信區(qū)間估計,經(jīng)典統(tǒng)計方法的[46.4407,73.8400]區(qū)間范圍遠大于自助法的[42.3384,61.5753]區(qū)間范圍;
表4 縱、橫向射擊密集度σ估計結(jié)果(1)
2)采用重要度抽樣的Bootstrap法與不采用重要度抽樣的Bootstrap法的統(tǒng)計推斷數(shù)據(jù)見表5。
表5 縱、橫向射擊密集度σ估計結(jié)果(2)
分析可知,相比于不采用重要度抽樣,采用重要度抽樣的評估結(jié)果更接近現(xiàn)場觀測樣本的分布特征,如σX的點估計51.9537更接近σ0的估計值50;σX的80%置信區(qū)間估計[42.3384,61.5753]比區(qū)間[43.5150,64.6456]更接近正態(tài)分布 N(0,502);
3)射擊密集度σ分布(以σX為例)見下圖3、4。
分析可知,采用重要度抽樣的改進自助法,其射擊密集度σX的區(qū)間(總體)分布更近似于正態(tài)分布,且σX的點估計和區(qū)間估計,更接近于現(xiàn)場觀測樣本的分布N(0,502),其真實性和可信程度更好。
綜上可知,在小子樣條件下,基于驗前信息的改進Bootstrap法所產(chǎn)生的再生子樣,其可信程度比改進前Bootstrap法產(chǎn)生的再生子樣可信度更高,其統(tǒng)計推斷結(jié)果相比于經(jīng)典統(tǒng)計方法也更加得精確,因此該方法能夠為小子樣條件下導(dǎo)彈命中精度的評定提供一種可供參考的結(jié)果。
本文結(jié)合某型對地攻擊導(dǎo)彈的現(xiàn)場試驗數(shù)據(jù),選取射擊密集度σ作為命中精度評定指標(biāo),針對非參數(shù)Bootstrap法不適用于小子樣條件下統(tǒng)計推斷的缺陷,通過綜合利用各類真實的驗前信息數(shù)據(jù),引入重要度抽樣思想,對Bootstrap再生子樣的獲取方式進行改進。仿真結(jié)果表明,基于驗前信息的改進Bootstrap法所獲得的σ估計與置信區(qū)間,其結(jié)果的真實性更好,能夠為導(dǎo)彈命中精度評定試驗提供一定的參考。
當(dāng)然,Bootstrap自助法作為一種原始樣本信息的“提攜”手段,在小子樣甚至特小子樣條件下應(yīng)用,存在著許多可以改進之處。如現(xiàn)場數(shù)據(jù)的大致分布已知時能否采用參數(shù)Bootstrap法(原始樣本仍是小子樣條件),落點縱橫向偏差非獨立時如何應(yīng)用驗前信息,各類驗前信息的重要度如何更好地進行分配,再生子樣的容量如何設(shè)定才能更加合理等。這些問題值得進行更為深入地研究。
[1]唐雪梅,蔡洪,楊華波等.導(dǎo)彈武器精度分析與評估[M].北京:國防工業(yè)出版社,2015:250-263.
[2]王正明,盧芳云,段曉君等.導(dǎo)彈試驗的設(shè)計與評估[M].北京:科學(xué)出版社,2010:438-440.
[3]張宗梅,宋維軍,李雙喜等.一種融合驗前信息的特小子樣精度評估方法[J].航天控制,2011,29(6):49-53.
[4]Davison,A.C.(Anthony Christopher),Hinkley,D.V.Bootstrap Methods and Their Application[J].Technometrics,1997,42(2):216-217.
[5]雷鳴,張麗群.基于Bootstrap方法的艦空導(dǎo)彈武器系統(tǒng)制導(dǎo)精度評定[J].現(xiàn)代防御技術(shù),2014,42(5):60-64.
[6]劉新愛,陳勇男,王如根.基于自助法的導(dǎo)彈命中精度評定[J].戰(zhàn)術(shù)導(dǎo)彈技術(shù),2004(06):32-34.
[7]孫錦,李國林等.基于Bootstrap的反艦導(dǎo)彈靶場試驗小樣本數(shù)據(jù)分析方法研究[J].計算機與數(shù)字工程,2014,42(1):48-51.
[8]Pérez M C I,Manteiga W G.Bootstrap for the conditional distribution function with truncated and censored data[J].Annals of the Institute of Statistical Mathematics,2003,55(2):331-357.
[9]劉思雨,張敏強.Bootstrap平均數(shù)假設(shè)檢驗樣本容量探討[J].統(tǒng)計與決策,2016(14):26-28.
[10]唐雪梅,李榮,胡正東等.武器裝備綜合試驗與評估[M].北京:國防工業(yè)出版社,2013:33-82
[11]胡正東,曹淵,張士峰等.特小子樣試驗下導(dǎo)彈精度評定的Bootstrap方法[J].系統(tǒng)工程與電子技術(shù),2008,30(8):1493-1497.
[12]劉建,吳翊,譚璐.對Bootstrap方法的自助抽樣的改進[J].數(shù)學(xué)理論與應(yīng)用,2006(1):71-74.
[13]Duan X.APPLICABILITY OF BOOTSTRAP METHOD IN SMALL SAMPLE CASE[J].Journal of Ballistics,2003(3):1-5.
[14]金振中,李曉斌等.戰(zhàn)術(shù)導(dǎo)彈試驗設(shè)計[M].北京:國防工業(yè)出版社,2013:96-143
[15]郭齊勝,羅小明,潘高田.武器裝備試驗理論與檢驗方法[M].北京:國防工業(yè)出版社,2013:188-191.
[16]GJB5207-2004.地地戰(zhàn)術(shù)導(dǎo)彈批抽檢飛行試驗驗收方法[S].國防科學(xué)技術(shù)工業(yè)委員會批準(zhǔn),2004.
[17]GJB2899-97.飛航導(dǎo)彈飛行試驗精度分析和命中精度評定方法[S].國防科學(xué)技術(shù)工業(yè)委員會批準(zhǔn),1997.
[18]樊立明,吳鵬,萬偉.基于Bayes自助法的小子樣命中精度評估[C]//The International Conference on Computational Intelligence and Industrial Application.2010:3-4.
[19]曹裕華.裝備試驗設(shè)計與評估[M].北京:國防工業(yè)出版社,2016:183-189.
[20]徐英,王松山,柳輝等.裝備試驗與評價概論[M].北京:北京理工大學(xué)出版社,2016:29-46.
[21]趙喜春.導(dǎo)彈命中精度綜合鑒定方法研究[J].現(xiàn)代防御技術(shù),2008,36(3):33-36.
[22]謝紅衛(wèi),孫志強,李欣欣等.多階段小樣本數(shù)據(jù)條件下裝備試驗評估[M].北京:國防工業(yè)出版社,2016:156-167.