霍士偉 郭圣明 唐宇波
(1.國防大學 北京 100091)(2.國防科技大學信息通信學院 西安 710106)
隨著人工智能技術(shù)的快速發(fā)展和在軍事領(lǐng)域的廣泛運用,作戰(zhàn)指揮方式由傳統(tǒng)的以指揮員決策向人機協(xié)同的智能作戰(zhàn)指揮方式轉(zhuǎn)變。其中,智能化戰(zhàn)場態(tài)勢評估是實現(xiàn)智能化作戰(zhàn)指揮的基礎(chǔ)和關(guān)鍵,是科學完成兵力優(yōu)化、火力分配等指揮決策的前提[1]。
目前智能戰(zhàn)場態(tài)勢評估方法主要有基于知識推理的評估方法和基于機器學習的評估方法。其中基于知識推理的評估方法主要包括基于模板匹配的方法[2]、案例推理的方法[3]、D-S 證據(jù)理論方法[4]、模糊邏輯方法[5]等?;谥R推理的方法能夠較好地處理戰(zhàn)場態(tài)勢評估中信息的不確定性,但是普遍存在難以構(gòu)建完備的知識庫問題,對具有高度非線性、涌現(xiàn)性的復(fù)雜戰(zhàn)場態(tài)勢難以有效評估,原因在于這類評估方法的知識表示大多是基于人的經(jīng)驗,推理過程有太多主觀因素,無法從戰(zhàn)場全局實現(xiàn)戰(zhàn)場態(tài)勢的自主表示和推理[6]。以神經(jīng)網(wǎng)絡(luò)[7]、支持向量機[8]為代表的機器學習評估方法能夠直接從大量戰(zhàn)場態(tài)勢數(shù)據(jù)中學習規(guī)律,實現(xiàn)對復(fù)雜戰(zhàn)場態(tài)勢的表示和認知,避免了構(gòu)建知識庫的復(fù)雜過程,同時避免了人的主觀因素影響。目前,基于機器學習的智能戰(zhàn)場態(tài)勢評估成為當前作戰(zhàn)指揮決策領(lǐng)域的研究熱點,并取得了大量成果。但是,基于機器學習的評估方法需要大量標記樣本數(shù)據(jù)來進行模型訓練,而在戰(zhàn)場環(huán)境下,要獲得充足的滿足模型訓練要求的帶標簽樣本數(shù)據(jù)是比較困難的。相對而言,我們能夠獲得較多的無標記數(shù)據(jù),但是為這些數(shù)據(jù)添加標簽則需要花費大量的人力和時間。在這種情況下,直接將傳統(tǒng)機器學習方法用于戰(zhàn)場態(tài)勢評估,會造成評估準確性不高。因此,研究如何利用無標簽樣本來輔助機器學習模型訓練對基于機器學習的戰(zhàn)場態(tài)勢評估具有重要意義。
半監(jiān)督學習是一種可有效利用無標簽樣本來輔助機器學習模型訓練的方法,可有效提高標記樣本不足條件下模型的精度和泛化性能[9]。其中自訓練半監(jiān)督學習是一種簡單且適應(yīng)性強的半監(jiān)督學習方法[10]。本文以自訓練半監(jiān)督學習方法為模型整體訓練框架,以適用于小樣本條件下分類的支持向量機模型為基礎(chǔ)分類器,提出了基于自訓練半監(jiān)督學習的戰(zhàn)場態(tài)勢評估模型,為解決標記樣本不足條件下的智能戰(zhàn)場態(tài)勢評估問題提供了思路。通過實驗,驗證了該模型在戰(zhàn)場態(tài)勢評估標記樣本不足條件下的可行性和有效性。
自訓練半監(jiān)督學習是一種簡單且適應(yīng)性強的半監(jiān)督學習方法[10]。自訓練半監(jiān)督學習方法首先利用現(xiàn)有的少量有標簽樣本進行監(jiān)督式學習,然后將學習得到的分類模型對無標簽樣本進行分類預(yù)測,也就是為無標簽樣本添加偽標簽,然后根據(jù)一定的偽標簽選擇策略選擇偽標簽準確率較高的數(shù)據(jù)加入訓練集重新訓練分類模型。迭代上述過程,直到算法達到預(yù)定條件。自訓練方法實現(xiàn)簡單,適應(yīng)性強,可廣泛用于各種領(lǐng)域標記樣本不足的分類和預(yù)測場景。
本文結(jié)合自訓練半監(jiān)督學習和支持向量機分類模型設(shè)計了戰(zhàn)場態(tài)勢評估模型,如圖1所示。模型以小樣本條件下表現(xiàn)較好的支持向量機模型作為基分類器,以適用戰(zhàn)場態(tài)勢評估中的初始標記樣本較少的特點。針對戰(zhàn)場態(tài)勢評估過程中存在大量無標簽樣本和少量帶標簽樣本的情況,通過自訓練的半監(jiān)督學習方法利用無標簽樣本來對支持向量機模型進行輔助訓練來提高模型的準確性和泛化性能。
圖1 基于自訓練半監(jiān)督學習的戰(zhàn)場態(tài)勢評估思路
基于半監(jiān)督學習的戰(zhàn)場態(tài)勢評估基本流程如下。
1)對原始戰(zhàn)場態(tài)勢數(shù)據(jù)進行預(yù)處理,區(qū)分為有標簽樣本和無標簽樣本;
2)利用數(shù)據(jù)集中的有標簽樣本作為訓練集對支持向量機模型進行訓練,得到初始評估模型;
3)利用訓練得到的初始評估模型對的無標簽樣本進行評估,評估結(jié)果作為樣本偽標簽,根據(jù)一定的偽標簽樣本選擇策略,從偽標簽樣本中選擇樣本標注準確率高的樣本加入訓練集,利用新訓練集對支持向量機模型進行重新訓練;
4)重復(fù)上述訓練模型、對無標簽樣本添加偽標簽、選擇偽標簽樣本重新訓練模型的過程,直到模型達到所需要求。
在基于半監(jiān)督學習的戰(zhàn)場態(tài)勢評估模型中,基學習器性能的好壞直接關(guān)系著整個模型的性能。由于戰(zhàn)場態(tài)勢評估中初始帶標簽樣本數(shù)據(jù)較少,而支持向量機模型可以很好地適用小樣本數(shù)據(jù)集的分類問題,因此本文選擇支持向量機模型作為基分類器。
支持向量機是一種基于統(tǒng)計學習理論的機器學習方法,它基于結(jié)構(gòu)風險最小化原則對數(shù)據(jù)進行分類,將原始數(shù)據(jù)通過核函數(shù)映射到高維空間中,然后采用線性超平面對數(shù)據(jù)進行分類,解決了低維數(shù)據(jù)空間中線性不可分的問題[11]。常用的核函數(shù)有常用的核函數(shù)主要有線性核函數(shù)、多項式核函數(shù)、高斯核函數(shù)、Sigmoid核函數(shù)。
SVM分類的建模和求解主要過程如下:對于樣本集 D={(x1,y1),(x2,y2),…,(xm,ym)},y∈{-1,1},對于線性可分問題,可以通過線性方程劃分超平面:wtx+b=0,樣本中任意點到超平面距離為
在應(yīng)用支持向量機進行戰(zhàn)場態(tài)勢評估時,需要選取適當?shù)暮撕瘮?shù)。核函數(shù)選擇一般通過實驗比較的方法選擇分類效果最好的核函數(shù)。本文通過實驗比較選擇線性核函數(shù)作為核函數(shù)。線性核函數(shù)是樣本特征在原始空間的內(nèi)積,參數(shù)少,且執(zhí)行速度快。
對于自訓練半監(jiān)督學習來說,偽標記樣本選擇策略是模型性能好壞的關(guān)鍵。偽標記樣本選擇策略的目的是將無標簽樣本中被正確標記可能性較高的樣本選擇出來加入有標簽樣本中構(gòu)成新的訓練集,這樣才能夠進一步提高模型的精度和泛化性能。如果將錯誤標記的偽標簽樣本加入新的訓練集,則可能造成模型性能的下降。本文采用基于馬氏距離的偽標記樣本選擇策略[12]。偽標記樣本選擇策略的主要過程如下。
結(jié)合上述基于支持向量機的戰(zhàn)場態(tài)勢分類模型和基于馬氏距離的偽標簽樣本選擇策略,本節(jié)設(shè)計了基于自訓練半監(jiān)督學習的戰(zhàn)場態(tài)勢評估算法,算法步驟如下。
本節(jié)利用文獻[13]提供的戰(zhàn)場態(tài)勢評估數(shù)據(jù)對第3節(jié)中的評估模型進行實驗驗證。實驗硬件環(huán)境為Intel i3-4030U CPU,主頻1.9GHz,內(nèi)存4G,編程環(huán)境為Matlab2018a,并包括支持向量機算法的libsvm工具包。
實驗數(shù)據(jù)共包括200條戰(zhàn)場態(tài)勢評估數(shù)據(jù),輸入變量包括敵我兵力數(shù)量對比、敵我防御能力對比、敵我攻擊能力對比等7維特征,戰(zhàn)場態(tài)勢評估等級為樣本標簽,戰(zhàn)場態(tài)勢評估等級包括絕對優(yōu)勢、優(yōu)勢、均勢、劣勢、絕對劣勢5個等級。為了適應(yīng)評估模型的要求,針對實驗數(shù)據(jù)中的5種戰(zhàn)場態(tài)勢等級(絕對優(yōu)勢、優(yōu)勢、均勢、劣勢、絕對劣勢),分別設(shè)置對應(yīng)的5類標簽值(1、2、3、4、5)。部分實驗數(shù)據(jù)如表1所示。
表1 部分實驗數(shù)據(jù)
原始驗數(shù)據(jù)集為有標簽的樣本集,為了支持本文的半監(jiān)督學習方法實驗驗證。從全部樣本中抽取x個樣本作為有標簽訓練樣本,抽取t個樣本作為測試樣本,抽取w個樣本為無標簽訓練樣本。為了對所提模型性能進行比較分析,設(shè)置以下條件下的對比實驗:1)單獨的支持向量機評估模型使用有標簽樣本進行訓練;2)利用本文提出的自訓練半監(jiān)督學習的評估模型同時使用有標簽樣本和無標簽樣本進行訓練。另外,通過設(shè)置不同的實驗條件(實驗條件包括有標簽樣本數(shù)x、無標簽樣本數(shù)w和偽標簽樣本選擇閾值θ),在不同實驗條件下比較模型的性能。
針對不同實驗條件進行了實驗驗證,實驗結(jié)果如表2所示。由表中結(jié)果可以看出,在三種條件下,本文提出的基于半監(jiān)督學習的戰(zhàn)場態(tài)勢評估模型同時利用有標簽和無標簽樣本進行訓練,相對于只采用有標簽樣本的支持向量機模型來說,在評估準確率方面都有一定的提高。實驗表明,在具有大量無標簽樣本和少量有標簽樣本條件下,通過自訓練無監(jiān)督學習方法通過利用無標簽樣本進行輔助訓練,可以提高模型的準確率和泛化性能。
表2 實驗結(jié)果
在基于自訓練無監(jiān)督學習的空中目標威脅評估算法中,樣本選擇閾值θ是一個重要參數(shù)。為了探討其取值規(guī)律,本節(jié)進一步通過實驗對其進行分析。在x=40,t=48,w=88固定不變條件下,對θ分別取1~30進行對比實驗,結(jié)果如表3所示。由表中結(jié)果可以看出,當θ取值為17~22時,模型評估準確率最高,為79%;當取值過大或過小時,模型的準確率都會下降。其中原因在于,當樣本選擇閾值θ過大時,會將過多的判斷錯誤的偽標簽數(shù)據(jù)加入新的訓練集,而這些判斷錯誤的偽標簽樣本會造成模型準確率的下降。當樣本選擇閾值θ過小時,能夠加入新訓練集的偽標簽樣本數(shù)量較少,同樣無法有效提高模型的準確率。因此,在實際應(yīng)用中,要通過反復(fù)實驗來確定合適的樣本選擇閾值取值范圍。
表3 樣本選擇閾值分析實驗結(jié)果
為解決標記樣本不足條件下基于機器學習的戰(zhàn)場態(tài)勢評估準確率和泛化性能低的問題,結(jié)合自訓練半監(jiān)督學習和支持向量機模型提出了基于自訓練半監(jiān)督學習的戰(zhàn)場態(tài)勢評估模型,設(shè)計了基于馬氏距離的偽標記樣本選擇策略。實驗表示,在標記樣本不足條件下,本文提出的模型同時利用有標簽和無標簽樣本進行訓練,相對于只采用有標簽樣本的支持向量機模1型來說,在評估準確率方面都有較大的提高。為標記樣本不足條件下的戰(zhàn)場態(tài)勢評估提供了新的解決思路。