宮 雷, 許世蒙, 李春洋, 杜建華, 馬潤(rùn)波
(1. 裝甲兵工程學(xué)院基礎(chǔ)部, 北京 100072; 2. 裝甲兵工程學(xué)院技術(shù)保障工程系, 北京 100072; 3. 裝甲兵工程學(xué)院科研部, 北京 100072)
基于雙層Bayes分析的3維編織復(fù)合材料彈道侵徹異常點(diǎn)檢驗(yàn)
宮 雷1, 許世蒙1, 李春洋2, 杜建華3, 馬潤(rùn)波1
(1. 裝甲兵工程學(xué)院基礎(chǔ)部, 北京 100072; 2. 裝甲兵工程學(xué)院技術(shù)保障工程系, 北京 100072; 3. 裝甲兵工程學(xué)院科研部, 北京 100072)
在3維編織復(fù)合材料的彈道侵徹測(cè)試數(shù)據(jù)異常點(diǎn)檢驗(yàn)中,將仿真數(shù)據(jù)作為試驗(yàn)數(shù)據(jù)的先驗(yàn)信息,采用Bayes方法檢驗(yàn)?zāi)P托问胶蛥?shù):應(yīng)用2步估計(jì)方法推導(dǎo)出關(guān)鍵參數(shù)的后驗(yàn)分布,應(yīng)用小概率判別法檢驗(yàn)出異常點(diǎn)。數(shù)據(jù)統(tǒng)計(jì)分析結(jié)果表明:綜合仿真數(shù)據(jù)與試驗(yàn)數(shù)據(jù)提供的信息,采用雙層Bayes分析法檢驗(yàn)異常點(diǎn)是行之有效的。
異常點(diǎn);雙層Bayes分析;3維編織復(fù)合材料;先驗(yàn)分布
3維編織復(fù)合材料彈道侵徹測(cè)試數(shù)據(jù)分析中的異常點(diǎn)是指與數(shù)據(jù)集的主體存在一定偏差的點(diǎn)[1],如果這些異常點(diǎn)被忽視或處置不當(dāng),將會(huì)影響分析結(jié)果的準(zhǔn)確性和有效性,甚至得到與實(shí)際情況嚴(yán)重不符的結(jié)果。傳統(tǒng)彈道測(cè)試數(shù)據(jù)異常點(diǎn)的診斷主要采用基于統(tǒng)計(jì)、基于偏移、基于距離、基于密度等方法[2-3],但在小樣本、非重尾情況下,某些測(cè)量值與異常點(diǎn)表現(xiàn)非常類似,判斷其是小概率事件還是較大概率事件,是常態(tài)還是偶發(fā)態(tài),是正常點(diǎn)還是異常點(diǎn)等,很多問(wèn)題亟待解決。
通過(guò)現(xiàn)代仿真技術(shù)可較為真實(shí)地描述系統(tǒng)的運(yùn)行、演變及其發(fā)展過(guò)程,生成的仿真數(shù)據(jù)可作為試驗(yàn)數(shù)據(jù)的先驗(yàn)信息。而Bayes方法可充分利用先驗(yàn)信息,并綜合樣本信息進(jìn)行Bayes統(tǒng)計(jì)推斷[4]。本文將Bayes分析引入異常點(diǎn)判別中,將仿真數(shù)據(jù)作為試驗(yàn)數(shù)據(jù)的先驗(yàn)信息,并與試驗(yàn)數(shù)據(jù)有機(jī)結(jié)合,以此來(lái)檢驗(yàn)試驗(yàn)數(shù)據(jù)中是否存在異常點(diǎn),為3維編織復(fù)合材料的彈道侵徹測(cè)試數(shù)據(jù)異常點(diǎn)分析提供了一種使用少量試驗(yàn)數(shù)據(jù)便可高精度判別異常點(diǎn)的方法。
1.1 異常點(diǎn)產(chǎn)生的原因
應(yīng)用Bayes方法檢驗(yàn)異常點(diǎn)時(shí),產(chǎn)生異常點(diǎn)主要有如下3個(gè)原因。
1) 模型使用不當(dāng)導(dǎo)致的數(shù)據(jù)異常。此處的模型使用不當(dāng)是指數(shù)據(jù)分析時(shí)模型形式的選擇不當(dāng)。數(shù)學(xué)模型是用字母、數(shù)字及其他數(shù)學(xué)符號(hào)建立起來(lái)的等式或不等式,以及圖表、圖像、框圖等描述客觀事物的特征及其內(nèi)在聯(lián)系的數(shù)學(xué)結(jié)構(gòu)表達(dá)式[4],如線性模型、指數(shù)模型、非參數(shù)模型等。實(shí)踐中,由于人們對(duì)現(xiàn)實(shí)問(wèn)題理解的偏差和對(duì)數(shù)學(xué)知識(shí)的誤用,應(yīng)用模型時(shí)都會(huì)或多或少、直接或間接地導(dǎo)致數(shù)據(jù)表現(xiàn)異常。
2) 先驗(yàn)分布應(yīng)用錯(cuò)誤導(dǎo)致的數(shù)據(jù)異常。原則上講,任何分布都可作為未知參數(shù)的先驗(yàn)分布[5],但無(wú)論選用何種先驗(yàn)分布,最后都要看Bayes統(tǒng)計(jì)推斷的效果。最常用的參數(shù)先驗(yàn)分布是無(wú)信息先驗(yàn)分布與共軛先驗(yàn)分布,其中:無(wú)信息先驗(yàn)分布基于同等無(wú)知原則;共軛先驗(yàn)分布的優(yōu)點(diǎn)是未知參數(shù)的先驗(yàn)分布與后驗(yàn)分布屬于同一分布族。在實(shí)際應(yīng)用中,選取先驗(yàn)分布時(shí)應(yīng)對(duì)所考察的事件有較為透徹的了解,這樣才能使確定的先驗(yàn)分布更符合實(shí)際需求。若無(wú)信息先驗(yàn)分布選擇不正確,會(huì)導(dǎo)致先驗(yàn)信息運(yùn)用不當(dāng),進(jìn)而浪費(fèi)對(duì)目標(biāo)已有的正確認(rèn)識(shí);應(yīng)用共軛先驗(yàn)分布常犯的錯(cuò)誤是過(guò)于重視計(jì)算的方便性而忽略先驗(yàn)的合理性[5-6]。
3) 模型中參數(shù)使用錯(cuò)誤導(dǎo)致的數(shù)據(jù)異常。參數(shù)估計(jì)的核心是根據(jù)樣本估計(jì)總體分布的未知參數(shù)。在新材料研發(fā)中,由于試驗(yàn)條件等因素的限制,有關(guān)新材料的數(shù)據(jù)嚴(yán)重缺失,需要應(yīng)用仿真數(shù)據(jù)來(lái)估計(jì)模型參數(shù),而這些參數(shù)是否適用于試驗(yàn)數(shù)據(jù)模型還需要進(jìn)一步驗(yàn)證。
1.2 檢驗(yàn)步驟
利用雙層Bayes方法檢驗(yàn)3維編織復(fù)合材料試驗(yàn)數(shù)據(jù)中異常點(diǎn)的步驟如下。
1) 模型形式檢驗(yàn)。設(shè)試驗(yàn)數(shù)據(jù)集為(Y,X)。仿真數(shù)據(jù)分析表明Y與X間的關(guān)系服從某一經(jīng)驗(yàn)?zāi)P?,但該模型是否適用于試驗(yàn)數(shù)據(jù),還需進(jìn)一步分析。采用Bayes方法檢驗(yàn)?zāi)P偷乃悸肥牵呵蟪雒總€(gè)數(shù)據(jù)點(diǎn)適用于仿真數(shù)據(jù)模型的后驗(yàn)概率,若后驗(yàn)概率很小的數(shù)據(jù)點(diǎn)足夠多,則認(rèn)為該模型不適用于試驗(yàn)數(shù)據(jù)[5]。實(shí)踐中多采用比較分析法,即首先以試驗(yàn)數(shù)據(jù)為樣本點(diǎn)導(dǎo)出其模型形式,并與經(jīng)驗(yàn)?zāi)P托问较啾容^,若二者形式一致,則不需要重新建模,進(jìn)入步驟2);否則,重新分析機(jī)理,進(jìn)一步了解研究對(duì)象的性質(zhì),修正經(jīng)驗(yàn)?zāi)P汀?/p>
2) 先驗(yàn)分布確定。由于模型參數(shù)多且相互關(guān)聯(lián),參數(shù)先驗(yàn)分布的確定較為困難,且即使能得出參數(shù)的先驗(yàn)分布,某些參數(shù)的先驗(yàn)分布對(duì)實(shí)際問(wèn)題的作用也不大,因此確定參數(shù)先驗(yàn)分布時(shí),應(yīng)首先從實(shí)際問(wèn)題出發(fā),選擇關(guān)鍵參數(shù),然后再確定其先驗(yàn)分布。Box等[6]提出了確定參數(shù)先驗(yàn)分布的最佳方法:首先,主觀估計(jì)出參數(shù)先驗(yàn)分布的幾個(gè)分位數(shù);然后,選擇合適的先驗(yàn)分布密度形式,并依據(jù)極大似然法計(jì)算超參數(shù)。
3) 模型參數(shù)確定。在Bayes決策問(wèn)題中,表示未知參數(shù)點(diǎn)估計(jì)的決策函數(shù)稱為未知參數(shù)的Bayes估計(jì),其與損失函數(shù)密切相關(guān):若已知未知參數(shù)的先驗(yàn)分布,則Bayes估計(jì)在平方損失下,為其后驗(yàn)分布的均值;在絕對(duì)損失下,為其后驗(yàn)分布的中位數(shù);在0-1損失下,為其后驗(yàn)極大似然估計(jì)[7]。
采用Bayes方法檢驗(yàn)異常點(diǎn)的流程如圖1所示。
圖1 Bayes方法檢驗(yàn)異常點(diǎn)的流程
2.1 試驗(yàn)設(shè)計(jì)與測(cè)試結(jié)果
試驗(yàn)[8]采用的纖維材料為荷蘭Tarpon 1000型、對(duì)位芳族聚酞胺纖維長(zhǎng)絲束合股,基體為熱固性環(huán)氧樹脂,采用縱橫陣列編織機(jī)進(jìn)行織造;發(fā)射采用7.62 mm步槍標(biāo)準(zhǔn)彈,56式彈道發(fā)射槍;用2組錫箔作計(jì)時(shí)觸發(fā)器,共測(cè)試13組子彈的入射速度與剩余速度,結(jié)果如表1所示。
表1 3維編織復(fù)合材料彈道侵徹試驗(yàn)入射速度與剩余速度的測(cè)試結(jié)果 m/s
2.2 異常點(diǎn)分析
2.2.1 模型形式
練軍[8]在考察3維編織復(fù)合材料細(xì)觀結(jié)構(gòu)的基礎(chǔ)上,建立了與3維編織復(fù)合材料具有相同纖維體積的單向板細(xì)觀模型,通過(guò)精細(xì)化標(biāo)準(zhǔn)細(xì)觀結(jié)構(gòu)模型與細(xì)觀結(jié)構(gòu)模型的彈道侵徹破壞過(guò)程的有限元分析,揭示了3維編織復(fù)合材料在彈道沖擊下的破壞模式,計(jì)算出彈體貫穿靶體后的剩余速度,這些仿真數(shù)據(jù)可信度高,對(duì)判斷試驗(yàn)數(shù)據(jù)中的異常點(diǎn)極具借鑒意義。仿真數(shù)據(jù)分析表明:3維編織復(fù)合材料彈道侵徹試驗(yàn)中,剩余速度與入射速度應(yīng)呈線性關(guān)系。
圖2為3維編織復(fù)合材料彈道侵徹試驗(yàn)數(shù)據(jù)中剩余速度對(duì)入射速度的散點(diǎn)圖。
圖2 3維編織復(fù)合材料彈道侵徹試驗(yàn)中剩余速度對(duì)入射速度散點(diǎn)圖
由圖2可以看出:剩余速度與入射速度的線性關(guān)系顯著,且剩余速度隨著入射速度的增大而增大。此判斷與仿真數(shù)據(jù)分析結(jié)果一致,因此,在3維編織復(fù)合材料彈道侵徹試驗(yàn)數(shù)據(jù)分析中可不改變模型形式,將采用一元線性回歸模型來(lái)刻畫剩余速度與入射速度的關(guān)系,即
Y=βX+ε,
(1)
式中:Y為剩余速度;X為入射速度;ε~N(μ0,σ02),為誤差。
2.2.2 參數(shù)先驗(yàn)分布
1) Δβi近似服從正態(tài)分布,即Δβi~N(μ,σ2),其中:μ、σ2均未知,且相互獨(dú)立。
2)μ在1.134附近取值的概率大,μmin=0,但接近0的概率極小,μ的概率密度函數(shù)為鐘形曲線。
由此可認(rèn)為:μ的先驗(yàn)分布π(μ)為正態(tài)分布,即π(μ)~N(μ1,σ12)。根據(jù)3-σ法則,設(shè)1.134-3σ1=0,可得σ1=0.378,則π(μ)~N(1.134,0.3782)。
2.2.3 模型參數(shù)的Bayes估計(jì)
在試驗(yàn)數(shù)據(jù)中,Δβ=X~N(μ,σ2),即
采用2步估計(jì)法估計(jì)模型參數(shù)。
(2)
2) 估計(jì)μ。未知參數(shù)μ的先驗(yàn)分布為π(μ|σ2)~N(μ1,σ12),根據(jù)文獻(xiàn)[4],在方差已知的前提下,若正態(tài)總體均值的先驗(yàn)分布為正態(tài)分布,則在平方損失、絕對(duì)損失、0-1損失下,未知參數(shù)Bayes估計(jì)μB均為后驗(yàn)均值[13-15], 即
(3)
2.2.4 異常點(diǎn)檢驗(yàn)
3維編織復(fù)合材料彈道侵徹試驗(yàn)中剩余速度對(duì)入射速度的變化率如表2所示。
表2 3維編織復(fù)合材料彈道侵徹試驗(yàn)中剩余速度對(duì)入射速度的變化率
|P{μ<3.40}-P{μ0≥3.40}|=0.94,
|P{μ<3.00}-P{μ0≥3.00}|=0.87,
|P{μ<0.03}-P{μ0≥0.03}|=0.71,
|P{μ<2.90}-P{μ0≥2.90}|=0.85,
由此可知:2、4、9號(hào)數(shù)據(jù)點(diǎn)可懷疑為異常點(diǎn);8號(hào)數(shù)據(jù)點(diǎn)雖然不超過(guò)顯著性水平0.85,但由于顯著性水平較高,也是值得關(guān)注的數(shù)據(jù)點(diǎn),實(shí)踐中可結(jié)合其他方法來(lái)復(fù)檢其異常性;其余數(shù)據(jù)點(diǎn)均為非異常點(diǎn)。
1) 雙層Bayes方法在檢驗(yàn)?zāi)P托问胶蛥?shù)時(shí)均采用Bayes方法,將仿真數(shù)據(jù)處理為先驗(yàn)信息,有效實(shí)現(xiàn)了仿真數(shù)據(jù)與試驗(yàn)數(shù)據(jù)的信息融合,從而通過(guò)少量試驗(yàn)數(shù)據(jù)便可挖掘出更多信息,且具有很好的精度。
2) 試驗(yàn)設(shè)計(jì)時(shí)不應(yīng)采用入射速度相差不大的數(shù)據(jù)點(diǎn);否則,易導(dǎo)致Δβi偏大,從而將由樣本數(shù)據(jù)的隨機(jī)性產(chǎn)生的數(shù)據(jù)點(diǎn)誤判為異常點(diǎn)。
3) 采用數(shù)據(jù)點(diǎn)的變化率來(lái)檢驗(yàn)異常點(diǎn),會(huì)存在1個(gè)數(shù)據(jù)異常點(diǎn)帶動(dòng)其前后2個(gè)非異常點(diǎn)顯示異常的情況,因此,應(yīng)用雙層Bayes方法檢驗(yàn)異常點(diǎn)時(shí)應(yīng)考慮與其他方法相結(jié)合。
4) 為了更好地探索3維編織復(fù)合材料彈道侵徹?cái)?shù)據(jù)的規(guī)律性,應(yīng)結(jié)合試驗(yàn)設(shè)計(jì)來(lái)研究異常點(diǎn)的分析方法。
[1]HawkinsD.IdentificationofOutliers[M].London:ChapmanandHall, 1980:1-58.
[2]BarnettV,LewisT.OutliersinStatisticalData[M].NewYork:JohnWiley, 1994:72-134.
[3]VelascoF,VelmaP.ImportanceofSleeknessandKurtosisStatisticalTestsforOutlierDetectionandEliminationinEvaluationofGeochemicalReferenceMaterials[J].MathematicalGeology, 1998, 30(1): 109-128.
[4]MeerschaertMM.數(shù)學(xué)建模方法與分析[M].劉來(lái)福,楊淳,黃海洋,譯. 北京:機(jī)械工業(yè)出版社, 2007:1-24.
[5] 茆詩(shī)松,王靜龍,濮曉龍.高等數(shù)理統(tǒng)計(jì)[M].北京:高等教育出版社, 2006:307-391.
[6]BoxGEP,TiaoGC.ABayesianApproachtoSomeOutlierProblems[J].Biometrika,1988, 55(3):119-129.
[7]BergerJO.統(tǒng)計(jì)決策論及貝葉斯分析[M].賈乃光,譯.北京:中國(guó)統(tǒng)計(jì)出版社, 2006:59-128.
[8] 練軍.三維編織復(fù)合材料彈道侵徹的數(shù)值模擬[D].上海:東華大學(xué), 2006.
[9] 陳玲. 線性模型中參數(shù)型經(jīng)驗(yàn)Bayes估計(jì)若干問(wèn)題研究[D].合肥:中國(guó)科學(xué)技術(shù)大學(xué),2011.
[10] 宮雷,許世蒙,杜建華,等. 3維編織復(fù)合材料彈道測(cè)試數(shù)據(jù)的異常點(diǎn)分析[J]. 裝甲兵工程學(xué)院學(xué)報(bào),2014,28(5):94-97.
[11] 韋來(lái)生,張偉平.貝葉斯分析[M].合肥:中國(guó)科學(xué)技術(shù)大學(xué)出版社, 2013:33-80.
[12] 丁曉,韋來(lái)生. 雙指數(shù)分布位置參數(shù)的經(jīng)驗(yàn)Bayes估計(jì)問(wèn)題[J]. 數(shù)學(xué)雜志,2005,33(4):413-420.
[13] 楊亞寧.正態(tài)分布參數(shù)的經(jīng)驗(yàn)Bayes檢驗(yàn)[J].中國(guó)科學(xué)技術(shù)大學(xué)學(xué)報(bào),1992,22(1):12-21.
[14] 劉榮玄,朱少平. 正態(tài)模型刻度參數(shù)的經(jīng)驗(yàn)貝葉斯估計(jì)的漸近性[J]. 統(tǒng)計(jì)與決策,2009, 18(17):158-160.
[15] 仇麗莎,韋來(lái)生. 正態(tài)總體均值和誤差方差同時(shí)的經(jīng)驗(yàn)Bayes估計(jì)[J].中國(guó)科學(xué)院大學(xué)學(xué)報(bào),2013,30(4):454-461.
(責(zé)任編輯: 王生鳳)
Outliers Test of 3D Braided Composite’s Ballistic Data Based on Double Bayesian Analysis
GONG Lei1, XU Shi-meng1, LI Chun-yang2, DU Jian-hua3, MA Run-bo1
(1. Department of Fundamental Courses, Academy of Armored Force Engineering, Beijing 100072, China; 2. Department of Technical Support Engineering, Academy of Armored Force Engineering, Beijing 100072, China; 3. Department of Science Research, Academy of Armored Force Engineering, Beijing 100072, China)
In the outliers test of 3D braided composite’s ballistic penetration test data, taking the simulation data as the prior of experimental data, Bayes method is adopted in the test of model and parameters, the method of two-step estimation is used to deduce posterior distribution of key parameter, and the outliers is examined by the little probability discriminant method. The data statistical analysis result shows that it is an effective method to test the outliers with the double Bayesian analysis method using the information provided by simulation data and experimental data.
outlier; double Bayesian analysis; 3D braided composite; prior distribution
1672-1497(2015)04-0107-04
2015-04-07
國(guó)家自然科學(xué)基金資助項(xiàng)目(51001117); 北京自然科學(xué)基金資助項(xiàng)目(3132024)
宮 雷(1980-),男,講師,碩士。
O21
A
10.3969/j.issn.1672-1497.2015.04.022