薄 云,廖學軍,白洪波,白 宇
(1.航天工程大學研究生院,北京 101416;2.中國白城兵器試驗中心,吉林 白城 137001;3.航天工程大學航天保障系,北京 102206;4.國防大學聯(lián)合勤務學院,北京 100858)
在純理性的情況下,任何戰(zhàn)爭的結局都是由交戰(zhàn)雙方對于作戰(zhàn)結果的可控性決定的。如果交戰(zhàn)的一方能夠以更大的概率保證部署了某種作戰(zhàn)力量即可達成作戰(zhàn)意圖,那么,這一方將以更大的概率獲勝[1-2]。從這一角度來說,武器裝備試驗鑒定的最終目的是盡可能精確地回答“在指定的作戰(zhàn)條件下,按特定參數(shù)配置的武器裝備能在多大程度上達成作戰(zhàn)意圖”,從而確保這些武器裝備一旦被列裝,指戰(zhàn)員能以盡可能大的概率作出正確的作戰(zhàn)部署。
試驗與鑒定[3]達成這一目的的基本保證是一系列的科學分析和統(tǒng)計技術。它們使得試驗與鑒定不僅能夠回答試驗應當選擇怎樣的試驗條件、試驗多少次、怎樣控制試驗進程,而且能夠回答作出這些選擇的科學依據(jù)。但是,作戰(zhàn)試驗[4-5]這一新的試驗類型卻給如何應用這些技術提出了嚴峻挑戰(zhàn)。它強調在近似實戰(zhàn)的環(huán)境下,由典型的作戰(zhàn)人員按照作戰(zhàn)條令規(guī)定的作戰(zhàn)流程“試用”武器裝備,通過分析該武器裝備完成既定作戰(zhàn)任務的程度,和適應該類作戰(zhàn)任務的程度,給出是否批量訂購的意見和戰(zhàn)法改進的建議[6-7]。顯然,鮮明的實戰(zhàn)化特色使得作戰(zhàn)試驗呈現(xiàn)高度的動態(tài)化特征,從而與統(tǒng)計學嚴控試驗條件以提升結果精度的要求相抵觸。
考慮到和平環(huán)境下最具作戰(zhàn)真實性的軍事行動是演習訓練,如果結合演習訓練開展作戰(zhàn)試驗,不僅能滿足“實戰(zhàn)化”需求,還將大幅節(jié)約試驗經(jīng)費。問題的關鍵便在于合理設計作戰(zhàn)試驗,以滿足科學分析與統(tǒng)計學要求的結果精度。本文對該類設計所需考慮的模型背景與影響因素進行了研究,創(chuàng)新提出了觀測式作戰(zhàn)試驗的構想,并以案例進行了演示,可為后續(xù)的相關試驗提供有益參考。
一般認為依據(jù)科學分析與統(tǒng)計學技術開展的試驗研究最早源于R·A·Fisher 于1920 年開展的農(nóng)業(yè)統(tǒng)計與分析工作,后經(jīng)幾代學者的繼承發(fā)展,逐漸形成了功能完備、形式規(guī)范的方法體系,大力促進了實證科技的高速發(fā)展,深刻影響了當今社會[8-9]。為更好地應用這套方法體系,需要按照其基本思想和術語將作戰(zhàn)試驗模型化,具體可分5 部分,如圖1所示。
圖1 作戰(zhàn)試驗推理模型
一是處理。它是研究者根據(jù)研究目的施加或觀察的,能作用于試驗對象并引起直接或間接效應的因素。在作戰(zhàn)試驗中,處理即為被試裝備。
二是受試對象。它是接受處理并作為觀察對象的基本單位。在作戰(zhàn)試驗中,受試對象即為操控武器裝備的最小規(guī)模的作戰(zhàn)力量。例如:操控傳感器的操作員是針對部件級武器裝備的受試對象;配備單兵作戰(zhàn)系統(tǒng)的特種作戰(zhàn)人員是系統(tǒng)級武器裝備的受試對象;新型突擊裝甲步兵營是體系級武器裝備的受試對象。
三是效應。它是處理因素作用于受試對象的反映或結果。在作戰(zhàn)試驗中,效應通常以各種參數(shù)指標的形式表達出來。
四是非處理因素。它是除了處理之外,對效應產(chǎn)生影響的其他因素。在作戰(zhàn)試驗中,非處理因素即作戰(zhàn)單元操控被試裝備模擬執(zhí)行作戰(zhàn)任務的背景條件,通常包含了作戰(zhàn)想定、地形地貌、天時天候、電磁環(huán)境、模擬威脅等因素。
五是數(shù)據(jù)分析。它是基于一定的統(tǒng)計學方法,根據(jù)測得的效應的實際值,推斷處理是否發(fā)揮預想的作用。在作戰(zhàn)試驗中,數(shù)據(jù)分析通常需要參照給定的指標閾值,或與基線作戰(zhàn)力量作對比,以考察被試裝備是否具有宣稱的效應。
為保證作戰(zhàn)試驗得出的結論切實反映武器裝備的真實效能與適用性情況,須按如下步驟推理:
步驟1:確認X 是否發(fā)生;
步驟2:確認Y 是否發(fā)生;
步驟3:確認Y 是因為X 才發(fā)生。
其中,X 指與被試武器裝備功能、性能相關的事件,它是作戰(zhàn)試驗推理模型的自變量,例如:經(jīng)更新的紅外模塊正常運轉;Y 指與作戰(zhàn)效能或適用性相關的事件,它是作戰(zhàn)試驗推理模型的因變量,例如:發(fā)現(xiàn)可疑目標。按照作戰(zhàn)試驗的基本構成,根據(jù)推理邏輯順利實施作戰(zhàn)試驗包括如下頁圖2 所示的4個關鍵環(huán)節(jié)。
這是作戰(zhàn)試驗結論推理的起點。它要求試驗前組織合適的操作培訓,試驗中按照指定的戰(zhàn)術戰(zhàn)法操控被試裝備模擬作戰(zhàn)任務。它對應的是推理的步驟1,該環(huán)節(jié)不利于結論有效性的風險有3個方面。
一是被試裝備無法啟動被考核的功能。包括該武器裝備沒有宣稱的功能、故障頻繁,或存在安全隱患必須停止使用等。
二是作戰(zhàn)人員操控裝備的技能水平未達到作戰(zhàn)需求。主要指的是作戰(zhàn)人員通過試前的操作培訓并未達到要求的技能水平。
三是沒有機會實施新能力。主要指的是在某種試驗條件下,模擬實施的作戰(zhàn)行動可能沒有機會實施待試的某項功能。
即作戰(zhàn)試驗要能夠根據(jù)武器裝備不同的運用場景,以量化的方式,度量出各自作戰(zhàn)效果的差異情況。它對應的是推理的步驟2,該環(huán)節(jié)不利于結論有效性的風險有6 個方面:
一是被試的多臺(同型)裝備功能一致性較差,實際的作戰(zhàn)水平差異明顯。這增大了結果的方差,使得結果的置信區(qū)間變寬[10],降低對于作戰(zhàn)應用的指導作用。
二是作戰(zhàn)人員熟練程度不一致。即參試的作戰(zhàn)人員雖經(jīng)過培訓,但是操控水平差異明顯。
三是試驗條件存在漂移。主要指試驗的某科目在多次重復實施時,試驗條件的某些因素水平發(fā)生了變化。
四是數(shù)據(jù)收集的正確性不一致。主要指的是針對參數(shù)指標的測量方法在實施過程中存在一定的出錯率,使得試驗數(shù)據(jù)偏離真值。
五是試驗功效[11]太低。主要指的是試驗的數(shù)據(jù)分析設計沒有充分考慮驗前信息,沒有在科目中設置具有統(tǒng)計代表性的試驗條件,從而難以高效利用試驗資源,得出試驗的正確結論。
六是違反了統(tǒng)計假設條件。主要指的是試驗的數(shù)據(jù)分析使用了某種統(tǒng)計技術,但實際的數(shù)據(jù)并不符合該統(tǒng)計技術的假設前提,因此,錯誤使用了該技術,使得試驗結果的可靠性降低[10]。
即作戰(zhàn)試驗要通過試驗設計和任務實施,使得作戰(zhàn)效果的成因能夠分離出來,證明被試武器裝備是作戰(zhàn)效果發(fā)生變化的原因。它對應的是推理的步驟3,該環(huán)節(jié)不利于結論有效性的風險有4個方面:
一是被試裝備在前后的多次試驗中功能有差異。主要指的是作戰(zhàn)試驗的某些科目需要試驗多次,但被試裝備的作戰(zhàn)效果隨著時間的推移會變得更好或更差。在這種情況下,不當?shù)脑囼烅樞虬才艜恋K解釋作戰(zhàn)效果的成因[12]。
二是在各模擬作戰(zhàn)中,作戰(zhàn)人員操控武器裝備的熟練程度會隨著參試時間而遞增[13]。在這種情況下,作戰(zhàn)人員對于武器操作的學習效應會妨礙解釋其他成因。
三是在各模擬作戰(zhàn)中,數(shù)據(jù)采集人員隨著試驗工作的推進,更加熟練數(shù)據(jù)采集工作,從而提升數(shù)據(jù)采集的準確性和精度,造成不同時間點數(shù)據(jù)偏離真值程度不一致、離散程度有差異[13]。
四是隨著模擬作戰(zhàn)任務的實施,試驗條件發(fā)生變化。主要指的是隨著時間的推進,模擬作戰(zhàn)任務的天氣條件、藍軍作戰(zhàn)能力等試驗條件可能會變得更好或更差,從而難以解釋效果成因[13]。
這是作戰(zhàn)試驗結論推理最核心的環(huán)節(jié),即作戰(zhàn)試驗的結果應不僅僅只適用于被試的特定武器裝備,還應當能夠推廣到大批量生產(chǎn)的同一型號其他武器裝備。該環(huán)節(jié)不利于結論有效性的風險有4 個方面:
一是被試功能無法代表作戰(zhàn)使命。主要指被試的功能只反映了作戰(zhàn)使命的一部分,或者無法反映未來作戰(zhàn)的實際情況,甚至考察的功能可能不會出現(xiàn)在未來的作戰(zhàn)中。
二是作戰(zhàn)人員不具有作戰(zhàn)單元的代表性。主要指作戰(zhàn)人員的訓練水平可能達不到所需的強度,或者通過加強訓練,使得參試作戰(zhàn)人員的技能水平低于或者大大高于未來使用該裝備的作戰(zhàn)人員的水平。
三是度量尺度不能反映重要的效應。主要是試驗的度量手段分辨率不高,無法區(qū)別水平相近的作戰(zhàn)效果,或者采用了過多的定性判斷,使得武器裝備被衡量出的作戰(zhàn)水平對于其作戰(zhàn)部署的指導性有限。
四是作戰(zhàn)想定的真實性有限。主要指作戰(zhàn)想定并不能反映戰(zhàn)場的實際情況,比如作戰(zhàn)人員對于想定的作戰(zhàn)場景非常熟悉、藍軍的作戰(zhàn)行動和實際有差異、作戰(zhàn)的配置和實際情況不同等。
通過以上分析可以看出,影響作戰(zhàn)試驗結論有效性的因素主要分為3 個方面,第一是真實性的問題,包括裝備是否具有生產(chǎn)代表性和場景是否具有作戰(zhàn)典型性;第二是測試能力的問題,即盡可能精確地度量不同作戰(zhàn)效果的差異;第三是提高試驗的信噪比,即盡可能控制噪聲信息,以準確判斷作戰(zhàn)效果的成因[8]。在實踐中可以結合部隊的日常演訓,盡可能提升作戰(zhàn)試驗的真實性,在現(xiàn)有的測試能力之下,利用科學分析與統(tǒng)計技術,盡可能提升試驗的信噪比。
基于科學分析與統(tǒng)計學的試驗設計技術,提升結果信噪比的關鍵是盡可能充分地實現(xiàn)隨機化和區(qū)組化[14],以盡可能滿足統(tǒng)計檢驗的假設條件和降低被試裝備以外的因素對于試驗結果的影響。但是由于作戰(zhàn)試驗的實戰(zhàn)化特征,顯然無法隨機地試用武器裝備,而是盡可能遵照作戰(zhàn)規(guī)律來試用武器裝備。所以,為了盡可能地應用這些技術方法,可以參照以下流程來組織試訓結合式的作戰(zhàn)試驗。
第1 步,以作戰(zhàn)試驗準入審核的形式,確認被試武器裝備的技術性能參數(shù)和相關生產(chǎn)工藝已基本固定,抽樣的被試武器裝備具有生產(chǎn)代表性;
第2 步,確認考核指標,以及指標可能的影響因素;
第3 步,確定考核指標,及各影響因素的測試方法和結果檢驗方案;
第4 步,根據(jù)考核指標、影響因素的結果檢驗方案,確定試驗的終止條件;
第5 步,以部隊完全自主的方式試用被試武器裝備,以觀測的方式采集指標及影響因素的實際數(shù)據(jù);
第6 步,到達試驗終止條件后,分析觀測數(shù)據(jù),評估被試裝備的作戰(zhàn)效果,考察各因素對于作戰(zhàn)效果的影響程度,提出鑒定意見和裝備改進及戰(zhàn)法應用的相關建議。
設擬通過作戰(zhàn)試驗考核問題為航母甲板改進方案驗收。原甲板內日起降機次約120 架,經(jīng)一系列技術升級改造之后,裝備研制方應按合同規(guī)定將起降機次提升至135 架以上。
由于航母甲板改進后,需立即保障艦隊每日戰(zhàn)備,而在此期間,甲板人員有很多的實時決策會影響出動架次,如在一個典型的彈射周期內,有多架授命飛機待飛和備用飛機待命,若彈射器或飛機發(fā)生故障,甲板人員需要根據(jù)故障部位、修復時間、任務優(yōu)先級等因素,選擇等待修復、轉移發(fā)射器、使用備用機、取消發(fā)射或其他的應對方案,因此,該作戰(zhàn)試驗無法按照常規(guī)的試驗設計方法,以隨機化、區(qū)組化的方式控制這些影響因素,只能按照作戰(zhàn)規(guī)程,由甲板人員實時決策應對方案。
考慮到完全按照作戰(zhàn)流程來實施作戰(zhàn)試驗,則各項作戰(zhàn)指標是在真實的系統(tǒng)噪聲背景下采集數(shù)據(jù)的,雖然最終各指標的考核結果未必完全是因被試裝備這個處理因素而產(chǎn)生,但它至少也反映了被試裝備與真實作戰(zhàn)環(huán)境結合下能夠產(chǎn)生的作戰(zhàn)效果,因此,以這種方式實施的作戰(zhàn)試驗至少能夠回答在這種作戰(zhàn)環(huán)境下,為達成這種作戰(zhàn)使命,是否適宜批量訂購這種被試裝備。試驗策劃與實施的難點在于科學判定何時終止試驗,即滿足什么條件即可認為作戰(zhàn)試驗已充分實施。具體步驟為:
第1 步,審閱甲板在技術升級改造期間的試驗記錄,確認甲板的各項性能指標已達到可接受的技術穩(wěn)定性,可安全實施作戰(zhàn)試驗,并且各項技術工藝也已基本成熟,可推廣至其他的甲板改造。
第2 步,確認試驗的主要指標為出動架次,其他指標及它們的含義如表1 所示;對出動架次Y 可能有影響的因素包括飛機機型(共有6 個)和任務類型(共有6 個)。
第3 步,確定測試方法為:測量5 個指標的實際值,其中,時間指標要求精確到分(min);在測量時間指標的同時,記錄2 個影響因素的實際值。確定結果的檢驗方案為:以假設檢驗[10]的方式考核指標;以回歸分析[10]的方式考察非被試裝備因素對于作戰(zhàn)結果的影響。
第4 步,確定試驗的終止條件。
假設檢驗的顯著性水平為0.05、統(tǒng)計功效大于0.80。通過查閱歷史數(shù)據(jù)和性能試驗結果,計算統(tǒng)計功效的變化規(guī)律,得如圖3、圖4 所示結果。可見在顯著性水平為0.05 的情況下,當飛行日大于6 d 時,統(tǒng)計功效大于0.80,而當每個飛行日的出動架次大于135 時,統(tǒng)計檢驗的功效也將大于0.80。故對于出動架次這個指標來說,6 個飛行日之后,即可終止試驗。
圖3 按飛行日計算的統(tǒng)計功效
圖4 按每飛行日出動的架次計算的統(tǒng)計功效
另外,通過分析演訓計劃可以看出,艦隊在6個飛行日中,按各機型或各任務出動的飛機架次都將超過35 架次,而通過分析如圖5 所示的其他指標的歷史數(shù)據(jù),計算統(tǒng)計功效的變化規(guī)律,得如圖6所示結果。可見,在顯著性水平為0.05 的情況下,各任務、各機型比較下的各時間指標統(tǒng)計檢驗功效也將大于0.80,故對于這些指標來說,6 個飛行日,也可終止試驗。
圖5 停航時間的歷史數(shù)據(jù)分布
圖6 時間指標隨樣本量變化的統(tǒng)計功效
第5 步、第6 步,按照正常演訓程序做好數(shù)據(jù)觀測,并作結果評估,即可在保證作戰(zhàn)試驗盡可能實戰(zhàn)化的條件下,實現(xiàn)以上指標考核的精確化。
通過比較第2 節(jié)作戰(zhàn)試驗有效性的影響因素可以看出,試訓結合式作戰(zhàn)試驗是在完全真實的數(shù)據(jù)噪聲下開展武器裝備的“試用”的,完全匹配武器裝備的作戰(zhàn)使命,具有非戰(zhàn)時最好的作戰(zhàn)真實性和噪聲背景的一致性。同時,利用統(tǒng)計技術在試前確定試驗的截止條件,可以盡可能滿足結論推理所需的統(tǒng)計功效和假設前提,因此,也盡可能高地提升了結論的精確性。由于試訓結合式作戰(zhàn)試驗的這些優(yōu)良特性,不斷補試增加的數(shù)據(jù)和原有的數(shù)據(jù)仍然具有很好的一致性,因此,階段性地實施試訓結合式作戰(zhàn)試驗會帶來更好的試驗綜合效益。
但也應當看到,試訓結合式作戰(zhàn)試驗的實施也是需要一定前提條件的:一是被試武器裝備應當具有較好的指標穩(wěn)定性,且已基本固定生產(chǎn)工藝,這樣才能將試驗結論推廣至批量訂購的決策建議;二是武器裝備應在擬試驗部隊培訓或試用了一段時間,以確保作戰(zhàn)人員操控技能的穩(wěn)定性;三是數(shù)據(jù)采集應盡可能自動化,避免人為采集造成的前后數(shù)據(jù)不一致的問題。因此,可適當采用作戰(zhàn)試驗準入審核的方式,以盡可能滿足這些條件。