張志輝
(91404單位,河北 秦皇島 066001)
在導(dǎo)彈命中等成敗型試驗(yàn)過(guò)程中,為節(jié)省兵力彈藥,減少成本,往往采用實(shí)彈射擊、半實(shí)物仿真、數(shù)字仿真等多種手段分別進(jìn)行試驗(yàn)。試驗(yàn)后,各種手段獲得試驗(yàn)結(jié)果往往差異較大,如何判斷哪些樣本集可用、哪些不可用,一直困擾著決策者。本文從數(shù)理統(tǒng)計(jì)的方法入手,檢驗(yàn)各手段獲得的成敗型樣本集是否可用。
各手段獲得的試驗(yàn)結(jié)果可信度是不一致的,實(shí)彈射擊試驗(yàn)考核全面,更接近實(shí)戰(zhàn),相對(duì)于其他手段可信度最高。因此,可以采納作為參考標(biāo)準(zhǔn)。而其他手段,或多或少采用了一些模擬手段,低于實(shí)彈射擊試驗(yàn)的可信度,這些手段獲得的樣本是否可用的問(wèn)題,就歸結(jié)為這些手段獲得的樣本集是否與實(shí)彈射擊試驗(yàn)樣本集來(lái)自同一分布[1-3]。
參數(shù)假設(shè)檢驗(yàn)方法是一種檢驗(yàn)兩個(gè)樣本集是否來(lái)自同一分布的有效手段[4-6]。在精度等類型試驗(yàn)中,因其滿足正態(tài)分布,可以直接采用數(shù)理統(tǒng)計(jì)中正態(tài)總體的參數(shù)假設(shè)檢驗(yàn)方法來(lái)評(píng)判[7-12]。下面簡(jiǎn)要介紹其中的兩個(gè)正態(tài)總體均值的假設(shè)檢驗(yàn)。
假設(shè)H0:μ1=μ2;H1:μ1≠μ2。
拒絕區(qū)域?yàn)閃={|u|≥uα2}[1]。其中uα2可查詢標(biāo)準(zhǔn)正態(tài)分布表直接獲得。
但成敗型試驗(yàn),單個(gè)樣本滿足0-1分布,多次試驗(yàn)的成功數(shù)量滿足二項(xiàng)分布,是離散型分布[1],無(wú)現(xiàn)成的方法可用于評(píng)判。下面根據(jù)兩個(gè)正態(tài)總體均值的假設(shè)檢驗(yàn)思路,研究二項(xiàng)分布的假設(shè)檢驗(yàn)方法。
設(shè)采用試驗(yàn)手段一獲得成功數(shù)量X,其服從二項(xiàng)分布,記為X~B(m,p1),其概率[1]為
設(shè)采用試驗(yàn)手段二獲得成功數(shù)量Y,其服從二項(xiàng)分布,記為Y~B(n,p2),其概率為
下面采用假設(shè)檢驗(yàn)方法,檢驗(yàn)成敗型試驗(yàn)兩種手段獲得的樣本集是否來(lái)自同一分布,即是檢驗(yàn)p1和p2是否相同。
假設(shè)檢驗(yàn)方法的基本原理就是利用小概率事件不應(yīng)當(dāng)發(fā)生,若發(fā)生則拒絕假設(shè)H0。假設(shè)檢驗(yàn)最根本的目標(biāo)是找到拒絕區(qū)域。因此,對(duì)于二項(xiàng)分布這樣的離散分布,需要找到小概率區(qū)域(或稱為小概率事件集),且該小概率事件集中所有事件發(fā)生的概率和為顯著性水平α。
兩種手段相互獨(dú)立,若p1=p2=p,則X、Y同時(shí)發(fā)生的事件(x,y)概率[1]為
當(dāng)假設(shè)檢驗(yàn)對(duì)象為連續(xù)分布時(shí),其拒絕區(qū)域的特點(diǎn)為區(qū)間分布大,概率密度低,拒絕區(qū)域內(nèi)發(fā)生概率為α。二項(xiàng)分布為離散性分布時(shí),無(wú)法同連續(xù)分布一樣擁有概率密度函數(shù),從而找到拒絕區(qū)域。但二項(xiàng)分布事件的總數(shù)是有限的,每個(gè)事件發(fā)生的概率是已知的(可通過(guò)式(3)進(jìn)行計(jì)算),因此可以較容易地把區(qū)間分布廣、概率密度低的小概率事件集尋找到。
對(duì)于離散型分布,找到拒絕區(qū)域的方法,就是把所有可能事件按照一定方法進(jìn)行排序,取其中一部分作為拒絕事件集,該拒絕事件集必須滿足區(qū)間分布廣、概率密度低等特點(diǎn)。
首先極易想到的方案1:按照事件發(fā)生概率從大到小進(jìn)行排序,把小于p0所有事件作為拒絕事件集,且這些事件累計(jì)概率為α。但使用過(guò)程中發(fā)現(xiàn),該方案拒絕事件集中包含相似度極高的事件,如(0,0),顯然不符合基本認(rèn)知。因此,方案1不可行,排序方案還必須考慮到相似度問(wèn)題。
方案2:模仿正態(tài)分布均值的檢驗(yàn)方法,構(gòu)造檢驗(yàn)統(tǒng)計(jì)量Z,即
其中,Z越小,相似度越大。
事件按照Z(yǔ)值從小到大進(jìn)行排序。為了直觀地顯示,計(jì)算間隔為0.05時(shí)所有事件的概率累計(jì),當(dāng)m=100,n=10,p=0.6時(shí),其累計(jì)概率(類似概率密度)分布如圖1所示。
從圖1可以看出,拒絕區(qū)域必然選擇相似度低、累計(jì)概率小、區(qū)域分布大的右側(cè)。取拒絕區(qū)域?yàn)閆≥zα,如圖1中陰影部分。
圖1 m=100,n=10,p=0.6,間隔為0.05時(shí)的累計(jì)概率分布情況Fig.1 The cumulative probability distribution when the interval is 0.05,m=100,n=10,p=0.6
其中P{Z≥zα}=α,zα是與m、n、α、p有關(guān)的變量。m、n是試驗(yàn)前設(shè)計(jì)的樣本量,是已知的;α為顯著性水平,一般取0.1;但p為單個(gè)樣本成功的概率,是未知的。當(dāng)然想構(gòu)造一個(gè)更加合適的統(tǒng)計(jì)量,使得拒絕區(qū)域與p無(wú)關(guān)。但實(shí)際情況是,無(wú)論構(gòu)建什么樣的檢驗(yàn)統(tǒng)計(jì)量,其僅僅能決定各事件的排序位置,而各事件發(fā)生概率(依然是用式(3)計(jì)算)與p直接相關(guān),即統(tǒng)計(jì)量一旦確定,則各事件排序位置就已確定。改變p值,則改變了各事件的發(fā)生概率,zα必然隨之變化移動(dòng)。因此,無(wú)論構(gòu)建什么樣的檢驗(yàn)統(tǒng)計(jì)量,拒絕事件集必然與p有關(guān)。綜上所述,方案2是較優(yōu)的選項(xiàng)。
采用上述方法計(jì)算時(shí),p為不確定量,需要事先做假設(shè),一般采用設(shè)計(jì)值或?qū)<掖蚍址绞将@得。當(dāng)m、n存在公倍數(shù)時(shí),會(huì)出現(xiàn)多個(gè)事件的Z值相同情況,此時(shí),該多個(gè)事件應(yīng)當(dāng)同時(shí)拒絕或同時(shí)不拒絕。
某一導(dǎo)彈試驗(yàn)中,采用仿真的方式X獲得10個(gè)樣本,采用實(shí)彈射擊Y獲得3個(gè)樣本。其中假設(shè)p=0.9。
利用Excel軟件,枚舉所有可能事件,用式(3)計(jì)算各事件的發(fā)生概率,同時(shí)用式(4)計(jì)算各事件的統(tǒng)計(jì)量Z值。對(duì)各事件按照Z(yǔ)值從大到小進(jìn)行排序,計(jì)算所有事件前面的概率累計(jì)值(含該事件)。
α取0.1,查看Excel中概率累計(jì)值,其大于α對(duì)應(yīng)的zα為0.36,因此Z≥0.36時(shí),事件被拒絕,即該事件及前面所有事件為拒絕事件,拒絕事件集為(4~10,0),(7~10,1),(0~3,2),(0~6,3)等22個(gè)事件??梢钥闯?,差異較大的事件均在拒絕事件集中,與日常認(rèn)知相符。
若試驗(yàn)結(jié)果恰好屬于上述拒絕事件集,則認(rèn)為仿真方式與實(shí)彈射擊不滿足同一分布,即仿真試驗(yàn)肯定存在問(wèn)題,獲得試驗(yàn)樣本不具備任何參考價(jià)值,應(yīng)當(dāng)檢查完善仿真模型,重新設(shè)計(jì)試驗(yàn)。
在成敗類實(shí)際試驗(yàn)中,在不同的研制階段,能獲得多個(gè)試驗(yàn)結(jié)果,在同一個(gè)研制階段,采用不同的手段也能獲得多個(gè)試驗(yàn)結(jié)果,各試驗(yàn)結(jié)果有時(shí)存在較大差異,一般都有基本的認(rèn)知,與可信度最高的試驗(yàn)結(jié)果差異越大,越不能使用,但具體如何界定存在困難。本文根據(jù)正態(tài)分布總體的參數(shù)假設(shè)檢驗(yàn)方法,充分考慮相似度要求,構(gòu)造了恰當(dāng)?shù)臋z驗(yàn)統(tǒng)計(jì)量,找到了拒絕事件集,有效地解決了兩個(gè)二項(xiàng)分布總體是否來(lái)自同一分布的判斷問(wèn)題,為是否使用該試驗(yàn)結(jié)果的決策提供了界定標(biāo)準(zhǔn)。該方法可推廣運(yùn)用于所有發(fā)生概率已知的離散分布試驗(yàn)中。