林圣琳 李偉 楊明 馬萍
目前建模與仿真技術(shù)已成為人們認(rèn)識(shí)和改造現(xiàn)實(shí)世界的重要手段.由于仿真是一種基于模型的活動(dòng),仿真模型是否可信成為用戶十分關(guān)注的問題.驗(yàn)證是仿真模型可信度評(píng)估的重要步驟[1],包含概念模型驗(yàn)證和結(jié)果驗(yàn)證.仿真結(jié)果驗(yàn)證最直接而有效的方法是,在相同輸入條件下度量仿真輸出與參考輸出數(shù)據(jù)之間的一致性程度.然而,針對(duì)復(fù)雜系統(tǒng)建立的仿真模型往往具有不確定性、多元異類(動(dòng)、靜態(tài))輸出,且各輸出變量間可能存在相關(guān)性,此時(shí),若仍采用傳統(tǒng)仿真結(jié)果驗(yàn)證方法將導(dǎo)致驗(yàn)證結(jié)果不準(zhǔn)確.因此,考慮相關(guān)性及不確定性的多元輸出仿真結(jié)果驗(yàn)證是需要重點(diǎn)研究的問題.
由于仿真模型和參考系統(tǒng)的輸入及模型參數(shù)通常含有不確定性,加之仿真模型運(yùn)行和實(shí)際實(shí)驗(yàn)過程中引入的不確定性因素和誤差,導(dǎo)致仿真模型和參考系統(tǒng)的輸出為隨機(jī)變量或不確定的時(shí)間序列[2].考慮不確定性的影響,靜態(tài)輸出結(jié)果驗(yàn)證方法的研究多數(shù)集中在概率框架,形成了以參數(shù)估計(jì)[3?5]、假設(shè)檢驗(yàn)[6?7]、貝葉斯因子[8?10]、證據(jù)距離[11]、概率分布差異法[12?13]為代表的5 種解決方案.其中,Oberkampf 等針對(duì)參考數(shù)據(jù)稀疏的情況,采用插值和回歸分析的方法估計(jì)參考輸出的均值和標(biāo)準(zhǔn)差,并與仿真輸出的相應(yīng)統(tǒng)計(jì)量進(jìn)行對(duì)比,得到置信區(qū)間形式的驗(yàn)證結(jié)果[5];同時(shí),假設(shè)檢驗(yàn)和貝葉斯因子方法在靜態(tài)仿真輸出結(jié)果驗(yàn)證中的應(yīng)用日趨完善,Jiang 等將貝葉斯區(qū)間假設(shè)檢驗(yàn)應(yīng)用于模型的分等級(jí)評(píng)估中[14];考慮到固有和認(rèn)知不確定性的影響,文獻(xiàn)[11]采用證據(jù)理論對(duì)動(dòng)靜態(tài)輸出進(jìn)行描述,并引入證據(jù)距離度量仿真和參考輸出的一致性;Ferson等提出了概率分布差異與u-pooling 相結(jié)合的方法,用于處理稀疏參考數(shù)據(jù)情況下的單輸出仿真結(jié)果驗(yàn)證問題[12],該方法以其原理簡單、可操作性強(qiáng)等優(yōu)點(diǎn)得到了廣泛應(yīng)用.
考慮不確定性的同時(shí),復(fù)雜仿真模型可能存在多個(gè)輸出變量的情況,且各變量間可能存在函數(shù)或相關(guān)關(guān)系.在單變量靜態(tài)輸出結(jié)果驗(yàn)證方法的基礎(chǔ)上,針對(duì)多元輸出仿真結(jié)果驗(yàn)證方法的研究取得了一定的進(jìn)展.例如,Rebba 等最先提出了假設(shè)檢驗(yàn)、貝葉斯因子與協(xié)方差相結(jié)合的多元輸出結(jié)果驗(yàn)證方法,并引入了非正態(tài)驗(yàn)證數(shù)據(jù)轉(zhuǎn)化為正態(tài)數(shù)據(jù)的方法以滿足假設(shè)檢驗(yàn)的條件[15];Jiang 等將區(qū)間貝葉斯因子方法進(jìn)行推廣,將其應(yīng)用至多元靜態(tài)輸出結(jié)果驗(yàn)證問題中[16];Zhan 等提出了基于概率主成分分析(Probabilistic principal component analysis,PPCA)與貝葉斯因子相結(jié)合的方法,用于解決帶有不確定性和相關(guān)性的多元?jiǎng)討B(tài)輸出結(jié)果驗(yàn)證問題[17].同時(shí),Li 等將概率積分變換(Probability integral transformation,PIT)與概率分布差異法相結(jié)合,將多變量累積概率分布轉(zhuǎn)化為單變量概率分布的形式,采用概率分布差異法計(jì)算仿真和參考輸出累積概率分布的差異[18];Zhao 等分別計(jì)算仿真和參考輸出與相應(yīng)總體分布的馬氏距離,進(jìn)而得到仿真和參考輸出馬氏距離的累積概率分布,并應(yīng)用概率分布差異法計(jì)算兩者的差異[19].
從單變量驗(yàn)證到多變量驗(yàn)證,各變量間的關(guān)系是研究的重點(diǎn),現(xiàn)有驗(yàn)證方法存在驗(yàn)證結(jié)果不夠準(zhǔn)確和全面的問題.利用傳統(tǒng)單變量驗(yàn)證(或結(jié)合多種預(yù)處理方法)對(duì)各變量進(jìn)行分別驗(yàn)證再綜合,一是對(duì)帶有相關(guān)性的多個(gè)驗(yàn)證結(jié)果進(jìn)行加權(quán)綜合導(dǎo)致最終驗(yàn)證結(jié)果不夠準(zhǔn)確;二是未考慮多變量間相關(guān)性的驗(yàn)證將導(dǎo)致驗(yàn)證結(jié)果不全面.此外,對(duì)復(fù)雜仿真模型進(jìn)行結(jié)果驗(yàn)證,其輸出變量間的關(guān)系不夠明確.此時(shí)需首先明確輸出變量間的關(guān)系(獨(dú)立/函數(shù)/相關(guān)關(guān)系)再進(jìn)行驗(yàn)證,現(xiàn)有的多變量驗(yàn)證方法僅適用于變量間關(guān)系已知的情況.同時(shí),多變量驗(yàn)證方法均利用協(xié)方差矩陣度量變量間的相關(guān)性,這對(duì)非線性等其他相關(guān)關(guān)系將不再適用,導(dǎo)致多變量間相關(guān)性度量不夠準(zhǔn)確.
為解決上述問題,提出基于變量選擇和概率分布差異相結(jié)合的多元輸出仿真結(jié)果驗(yàn)證方法,對(duì)具有不確定性的多元異類輸出進(jìn)行聯(lián)合驗(yàn)證.第1 節(jié)對(duì)多元輸出結(jié)果驗(yàn)證問題進(jìn)行描述與分析,指出現(xiàn)有方法存在的問題;第2 節(jié)給出多元靜、動(dòng)態(tài)輸出的相關(guān)性分析及變量選擇方法;第3 節(jié)提出基于數(shù)據(jù)特征提取和聯(lián)合概率分布差異的多元輸出仿真結(jié)果驗(yàn)證方法;第4 節(jié)給出應(yīng)用實(shí)例與對(duì)比實(shí)驗(yàn)結(jié)果;第5 節(jié)給出本文結(jié)論.
用S表示系統(tǒng),Ss和Sr分別表示仿真模型和參考系統(tǒng),用As={as1,as2,···,asp}和Ar={ar1,ar2,···,arp}分別表示仿真模型和參考系統(tǒng)的輸入變量集,p為輸入變量個(gè)數(shù),Ys={ys1,ys2,···,ysm}和Yr={yr1,yr2,···,yrm}分別表示仿真模型和參考系統(tǒng)的輸出變量集,m為輸出變量個(gè)數(shù),多元異類輸出集Ys、Yr中的靜態(tài)輸出表示為隨機(jī)變量,動(dòng)態(tài)輸出表示為多個(gè)時(shí)間序列集合的形式.假設(shè)ysi、ysj分別為仿真模型的某一動(dòng)態(tài)和靜態(tài)輸出,則有
式中,i,j ∈[1,m],且=j;N為時(shí)間序列的長度;t1,t2,···,tN表示時(shí)間序列的時(shí)刻點(diǎn);考慮不確定性的影響,需要進(jìn)行多次仿真和實(shí)際實(shí)驗(yàn),n為重復(fù)實(shí)驗(yàn)次數(shù).用C(Ys,Yr)表示在As=Ar時(shí),Ys相對(duì)于Yr的一致性程度,且C(Ys,Yr)∈(0,1].當(dāng)Ys與Yr完全一致,則有C(Ys,Yr)=1;當(dāng)Ys相對(duì)于Yr的一致性程度越差,表示仿真模型越不可信,則有C(Ys,Yr)→0[1].
假設(shè)YsJ ∈Rns×m與YrJ ∈Rnr×m為多元仿真模型和參考系統(tǒng)的靜態(tài)輸出變量,ns、nr表示仿真和實(shí)際實(shí)驗(yàn)的重復(fù)運(yùn)行次數(shù).針對(duì)帶有相關(guān)性的多元靜態(tài)輸出結(jié)果驗(yàn)證方法主要有:
1)基于假設(shè)檢驗(yàn)和馬氏距離相結(jié)合的方法.文獻(xiàn)[16]給出基于似然比檢驗(yàn)和馬氏距離相結(jié)合的驗(yàn)證方法,得到最終一致性結(jié)果.
2)基于主成分分析的方法[17].對(duì)YsJ和YrJ進(jìn)行降維,去除變量間相關(guān)性,得到新的輸出變量和,η ≤m為主成分的個(gè)數(shù),而后采用現(xiàn)有靜態(tài)輸出驗(yàn)證方法對(duì)若干主成分進(jìn)行逐一驗(yàn)證并綜合得到最終驗(yàn)證結(jié)果.
3)基于概率分布差異的方法[18].分別計(jì)算m維YsJ和YrJ的聯(lián)合累積概率分布(Cumulative distribution function,CDF)函數(shù)并作差,獲得仿真和參考輸出數(shù)據(jù)的差異,得到[0,+∞)的誤差度量結(jié)果.
針對(duì)帶有相關(guān)性的多元?jiǎng)討B(tài)輸出結(jié)果驗(yàn)證問題,常用方法為基于數(shù)據(jù)特征和主成分分析相結(jié)合的方法[17].首先分別提取動(dòng)態(tài)輸出數(shù)據(jù)的特征矩陣,而后采用基于主成分分析的多元靜態(tài)輸出驗(yàn)證方法獲得最終驗(yàn)證結(jié)果.針對(duì)上述多元輸出仿真結(jié)果驗(yàn)證方法進(jìn)行分析,存在以下問題需要進(jìn)一步研究:
1)復(fù)雜仿真模型常存在多元輸出變量間的相關(guān)或獨(dú)立關(guān)系未知的情況,目前方法均是在變量關(guān)系已知的前提下進(jìn)行研究,存在一定局限性;
2)利用主成分分析獲取的多元輸出變量的主成分是線性變換后的結(jié)果,被提取主成分所代表的變量含義不夠明確,同時(shí)對(duì)多元輸出變量進(jìn)行降維將導(dǎo)致驗(yàn)證信息丟失,使驗(yàn)證結(jié)果不夠準(zhǔn)確和全面;
3)采用協(xié)方差矩陣度量變量相關(guān)性,需假設(shè)變量樣本服從正態(tài)分布,且僅能描述多元輸出變量間的線性關(guān)系,無法度量變量間非線性等其他相關(guān)關(guān)系,進(jìn)而導(dǎo)致變量間相關(guān)性度量不準(zhǔn)確;
4)基于聯(lián)合概率分布差異法可直接度量多元靜態(tài)輸出變量間的差異,需要已知變量間的獨(dú)立或相關(guān)關(guān)系,同時(shí),處理多元?jiǎng)討B(tài)輸出存在局限,得到的差異度量結(jié)果無法刻畫仿真模型的可信度.
為解決上述問題,可采用基于變量選擇和概率分布差異相結(jié)合的多元輸出仿真結(jié)果驗(yàn)證方法,考慮不確定性的影響,對(duì)選取到具有相關(guān)性的多變量進(jìn)行聯(lián)合驗(yàn)證.首先,引入變量選擇方法分別對(duì)Ys、Yr進(jìn)行相關(guān)性分析,提取相關(guān)變量子集(又稱相關(guān)變量組,子集中各變量是相關(guān)的,各子集中變量數(shù)的和為輸出變量總數(shù)),進(jìn)而得到多個(gè)獨(dú)立的變量子集;同時(shí),提取相同變量子集中多變量的數(shù)據(jù)特征,對(duì)于靜態(tài)輸出選取數(shù)據(jù)本身作為變量特征,對(duì)于動(dòng)態(tài)輸出選取距離、形狀以及頻譜特征;而后計(jì)算變量子集中多個(gè)變量關(guān)于某特征的聯(lián)合CDF 差異,并將其轉(zhuǎn)化為可信度;最后將多個(gè)變量子集關(guān)于若干數(shù)據(jù)特征的一致性與多個(gè)動(dòng)態(tài)輸出均值曲線的一致性進(jìn)行綜合得到仿真模型可信度.
為明確復(fù)雜仿真模型中多元輸出變量間的獨(dú)立或相關(guān)關(guān)系,引入數(shù)據(jù)挖掘領(lǐng)域的相應(yīng)方法對(duì)多變量進(jìn)行相關(guān)性分析,進(jìn)而提取相關(guān)變量子集.本文僅考慮同種類型(靜態(tài)或動(dòng)態(tài))輸出變量間的相關(guān)性,利用分形維數(shù)和互信息方法分別對(duì)靜、動(dòng)態(tài)輸出變量進(jìn)行相關(guān)性分析.
對(duì)隨機(jī)變量的相關(guān)性分析集中于Pearson 相關(guān)系數(shù),它僅能度量變量的線性關(guān)系,并對(duì)變量間強(qiáng)相關(guān)性較敏感,其結(jié)果受奇異值的影響較大,無法適應(yīng)具有非線性、不確定性以及非正態(tài)分布的數(shù)據(jù)集.其他一些相關(guān)系數(shù),如Kendall 系數(shù)、Spearman系數(shù)等雖可以描述非線性相關(guān)關(guān)系,但卻不能完整地刻畫變量間的相關(guān)性結(jié)構(gòu).此外,數(shù)據(jù)挖掘領(lǐng)域常用的變量選擇方法,如奇異值分解法(Singular value decomposition,SVD)、主成分分析法(Principal component analysis,PCA)、基于神經(jīng)網(wǎng)絡(luò)的方法(Neural networks,NN)、基于k-鄰近方法(K-nearest neighbor,KNN)、基于決策樹的方法(Decision tree,DT)、基于貝葉斯網(wǎng)絡(luò)的方法(Bayesian network,BN)以及基于分形維數(shù)的方法(Fractal dimension,FD)等,具有不同的特點(diǎn),對(duì)其進(jìn)行對(duì)比分析如表1 所示.
由表1 可知,SVD 和PCA 方法得到的變量子集失去了其原有的含義,且只能對(duì)具有線性相關(guān)性的變量集進(jìn)行分析;而基于機(jī)器學(xué)習(xí)的方法需要訓(xùn)練樣本集作為支撐,其運(yùn)行速度受到變量個(gè)數(shù)的影響較大,導(dǎo)致變量個(gè)數(shù)較多時(shí)運(yùn)行速度較慢;而基于分形維數(shù)的方法不僅能夠度量線性相關(guān)性,還能度量非線性等其他相關(guān)關(guān)系,具有不需要訓(xùn)練樣本集和運(yùn)行速度快等優(yōu)點(diǎn).因此,本文引入基于分形維數(shù)[20]的方法對(duì)多元輸出變量進(jìn)行分析,提取相關(guān)變量子集.假設(shè)YsJ、YrJ為仿真和參考多元靜態(tài)輸出變量集,以為例給出YsJ的相關(guān)變量子集提取步驟如下.
步驟1.根據(jù)自相似性原理計(jì)算的局部固有維度pD(·):
表1 常用變量選擇方法對(duì)比Table 1 Comparison of general variable selection methods
式中,r表示將劃分成2υ個(gè)相等大小區(qū)間的長度,υ為劃分深度,表示中落入第i個(gè)區(qū)間的樣本個(gè)數(shù);
步驟2.設(shè)c=1,移除YsJ中的變量,ξ為預(yù)定義的固有維度閾值,排除的變量為獨(dú)立變量,并按照pD(·)大小將進(jìn)行降序排列,形成新變量集其變量個(gè)數(shù)為;
步驟3.計(jì)算直到
步驟4.若,則算法結(jié)束;
步驟5.設(shè)相關(guān)性變量超集并提取ξSGc中的相關(guān)變量子集ξGc和相關(guān)變量基ξBc,具體算法見文獻(xiàn)[20],并設(shè)循環(huán)變量j=k+1;
步驟6.若,則執(zhí)行下一步,否則轉(zhuǎn)至步驟8;
步 驟 7.對(duì)于ξBc中的每個(gè)變量,若同時(shí)成立,則將加入ξGc;
步驟8.執(zhí)行j ←j+1,若,則轉(zhuǎn)至下一步,否則轉(zhuǎn)至步驟6;
步驟9.移除中ξGc ?ξBc的變量,并輸出相關(guān)變量子集ξGc和相關(guān)變量基ξBc;
步驟10.執(zhí)行c ←c+1,并轉(zhuǎn)至步驟3.
通過上述步驟提取YsJ和YrJ的相關(guān)變量子集如下.
式中,βs、βr分別為提取YsJ和YrJ相關(guān)變量子集的個(gè)數(shù),msi、mrj分別為中變量的個(gè)數(shù),且有ms1+ms2+···+msi=mr1+mr2+···+mrj=m.
與隨機(jī)變量不同,多元?jiǎng)討B(tài)輸出變量與時(shí)間有關(guān),其相關(guān)性分析與變量選擇需從時(shí)間序列整體的角度進(jìn)行分析.一些傳統(tǒng)的隨機(jī)變量相關(guān)性分析方法對(duì)于多元?jiǎng)討B(tài)變量同樣適用,例如Pearson 系數(shù)、Kendall 系數(shù)、Spearman 系數(shù)等,但無法用于動(dòng)態(tài)輸出變量具有多個(gè)樣本(時(shí)間序列)的情況.此外,一些統(tǒng)計(jì)學(xué)分析方法,如Granger 因果關(guān)系分析[21]、典型相關(guān)分析[22]、Copula 分析[23]、灰色關(guān)聯(lián)分析[24]以及互信息分析[25]等同樣能夠用于多變量的相關(guān)性分析.Granger 因果關(guān)系分析只能定性地分析變量間的因果關(guān)系,而無法得到定量的結(jié)果;典型相關(guān)分析對(duì)觀測值的順序不會(huì)做出響應(yīng),因此無法解決時(shí)間序列問題;Copula 分析需要建立在對(duì)邊緣分布的合理假設(shè)之上,使其應(yīng)用受到限制;灰色關(guān)聯(lián)分析僅從形狀相關(guān)性的角度對(duì)時(shí)間序列進(jìn)行分析,其相關(guān)性度量不夠全面.
基于互信息的相關(guān)性分析方法能夠度量動(dòng)態(tài)輸出變量間任意類型的關(guān)系,互信息以信息熵為理論基礎(chǔ),它能夠度量變量取值的不確定性程度,進(jìn)而描述變量的信息含量大小[26],通常用于多種類型時(shí)間序列的特征提取和結(jié)構(gòu)化預(yù)測[27].然而,互信息同樣存在不能完整刻畫變量集相關(guān)性結(jié)構(gòu)的缺點(diǎn),因此本文引入類可分性和變量可分性提取多元?jiǎng)討B(tài)輸出的相關(guān)變量子集[28].假設(shè)YsD、YrD為仿真和參考多元?jiǎng)討B(tài)輸出變量集,同樣以YsD為例,給出變量選擇步驟如下.
步驟1.計(jì)算YsD的m×m維互信息矩陣,具體算法見文獻(xiàn)[26];
步驟2.分別計(jì)算每一維變量的類間離散度?bi和類內(nèi)離散度?wi:
式中,Csam為樣本類別總數(shù),qi為屬于第i類的樣本個(gè)數(shù),按照每個(gè)變量的類可分離性大小,進(jìn)行變量排序:
步驟3.取Ji值最大的變量為變量子集的第一個(gè)變量;
步驟4.選擇使下式最大的變量為的下一個(gè)變量:
步驟5.當(dāng)則算法終止,其中,ε為預(yù)設(shè)值,否則轉(zhuǎn)至步驟4.通過上述步驟得到相關(guān)變量子集如下:
式中,i=1,2,···,βs,j=1,2,···,βr.βs、βr的含義與式(3)相同.
考慮不確定的影響,若對(duì)每一時(shí)刻的多元?jiǎng)討B(tài)輸出變量進(jìn)行分析勢必導(dǎo)致維數(shù)爆炸.為此提出基于特征的驗(yàn)證方法,首先提取用戶關(guān)注的輸出數(shù)據(jù)特征,而后計(jì)算每個(gè)特征下多變量聯(lián)合概率分布的差異,并將其轉(zhuǎn)化為可信度結(jié)果,最后綜合多個(gè)驗(yàn)證結(jié)果得到模型可信度.
針對(duì)于靜態(tài)輸出,選取數(shù)據(jù)本身作為變量特征.假設(shè)Ys ∈Rns×m與Yr ∈Rnr×m為多元仿真和參考靜態(tài)輸出變量,其數(shù)據(jù)特征描述為
對(duì)于動(dòng)態(tài)輸出ysij(t)、yrik(t),i=1,2,···,m,j=1,2,···,ns,k=1,2,···,nr則選取ns、nr次系統(tǒng)運(yùn)行得到的輸出均值曲線作為基準(zhǔn),與每次實(shí)驗(yàn)得到的輸出曲線進(jìn)行對(duì)比,求取相應(yīng)的均值曲線的第l個(gè)特征:
式中,Li為第i個(gè)輸出的特征數(shù),Φl(·)為第l個(gè)特征度量模型.
提取動(dòng)態(tài)輸出特征前,需要先對(duì)動(dòng)態(tài)輸出進(jìn)行歸類[1].以第j個(gè)動(dòng)態(tài)輸出的第i次實(shí)現(xiàn)yij(t)為例,其對(duì)應(yīng)的時(shí)間變化序列為[t1,t2,···,tN].則定義yij(t)隨時(shí)間變化的頻率為:
式中,Fij ≥0 為yij(t)的變化頻率;?yij(tk)=yij(tk+1)?yij(tk);?tk=tk+1?tk;給定F0為判斷時(shí)間序列變化快慢的臨界值,若Fij ≥F0,則認(rèn)為yij(t)為速變數(shù)據(jù),否則為緩變數(shù)據(jù).
為刻畫不確定性對(duì)系統(tǒng)輸出的影響, 從距離和形狀兩方面提取緩變數(shù)據(jù)的特征. 在前期工作[29]的基礎(chǔ)上, 給出第j個(gè)仿真輸出的第i次實(shí)現(xiàn)ysij(t)與其均值曲線的距離和形狀差異的度量公式如下.
式中,i= 1,2,··· ,α,j= 1,2,··· ,β. 若Gsi和Grj均為靜態(tài)輸出變量子集, 則Li= 1; 若Gsi和Grj均為緩變輸出變量子集, 則Li= 2; 若Gsi和Grj均為速變輸出變量子集, 則Li=1. 需要說明的是, 在某些特殊仿真應(yīng)用中, 除了上述特征外, 通常還需關(guān)注數(shù)據(jù)本身的一些特征, 例如控制系統(tǒng)階躍響應(yīng)中的上升時(shí)間、超調(diào)量以及穩(wěn)態(tài)誤差, 位置數(shù)據(jù)中的變化趨勢, 測量數(shù)據(jù)中的噪聲等. 在進(jìn)行實(shí)際驗(yàn)證中, 特征矩陣包含兩部分內(nèi)容, 一部分為上文給出的數(shù)據(jù)特征, 另一部分為根據(jù)具體領(lǐng)域知識(shí)確定的數(shù)據(jù)特征.
將υ維空間劃分為等尺寸的ρυ個(gè)區(qū)域,遍歷υ維變量的ρ個(gè)取值區(qū)間,若則F(x1,x2,···,xυ)=0;若則F(x1,x2,···,xυ)=k/ρυ等.如果變量集x1,x2,···,xυ在第k個(gè)區(qū)間內(nèi)的樣本量為1,則F在x1,x2,···,xυ點(diǎn)的跳躍度為1/ρυ,如果變量集x1,x2,···,xυ在第k個(gè)區(qū)間內(nèi)有ε個(gè)樣本,則F在x1,x2,···,xυ點(diǎn)的跳躍度是ε/ρυ.給出EEElsi和聯(lián)合CDF 間的差異如下.
為計(jì)算聯(lián)合CDF 的差異D(Fr,Fs),可將上式改寫為下面積分之差的形式:
式中x=[x1,x2,···,xυ].假設(shè)分別用估計(jì)Is和Ir,并用估計(jì),則的方差為:
其 中,x=x1,x2,···,xυ,gs(x)、gr(x)是 兩個(gè)密度函數(shù),Hs(x)=Fs(x)/gs(x),Hr(x)=Fr(x)/gr(x).首先,由gs(x)、gr(x)各產(chǎn)生P個(gè)相互獨(dú)立的υ維隨機(jī)數(shù)Ts1,···,TsP和Tr1,···,TrP,并計(jì)算
采用逆變換方法由同一個(gè)υ維聯(lián)合均勻分布U(0,1)產(chǎn)生Ts1,···,TsP和Tr1,···,TrP,能夠保證兩組隨機(jī)數(shù)具有較高的正相關(guān)程度,進(jìn)而使較小,對(duì)的估計(jì)值趨于穩(wěn)定.
需要說明的是,D(Fs,Fr)∈[0,∞)僅是仿真和參考輸出特征的聯(lián)合CDF 的差異(如圖1 所示),其取值范圍為[0,∞),此時(shí)無法給出仿真和參考輸出的一致性程度(即取值為[0,1]的相對(duì)值).因此,提出將D(Fs,Fr)向可信度C(Fs,Fr)轉(zhuǎn)化的公式如下.
性質(zhì)1.非負(fù)性:C(Fs,Fr)≥0;
性質(zhì)2.交換性:C(Fs,Fr)=C(Fr,Fs);
性質(zhì)3.有界性:C(Fs,Fr)∈[0,1];
性質(zhì)4.同一性:C(Fs,Fr)=1,當(dāng)且僅當(dāng)Fs=Fr.
圖1 參考與仿真輸出的CDF 對(duì)比Fig.1 Comparing CDF curves of reference and simulation output
基于前文所述方法,給出考慮相關(guān)性的多元輸出仿真結(jié)果驗(yàn)證流程如圖2 所示.
1)考慮不確定因素的影響,分別進(jìn)行n次仿真運(yùn)行和實(shí)際試驗(yàn),獲取多元仿真和參考輸出Ys={Ys1,Ys2,···,Ysm},Yr={Yr1,Yr2,···,Yrm};
圖2 考慮相關(guān)性的多元輸出仿真結(jié)果驗(yàn)證方法流程Fig.2 Procedures of multivariate simulation result validation under correlation
2)利用多元輸出變量選擇方法提取Ys、Yr的相關(guān)變量子集Gsi,i=1,···,βs,Grj,j=1,···,βr;
3)若βs=βr且Gsi=Grj,則依據(jù)式(8)~(13)提取Gsi、Grj中各變量的數(shù)據(jù)特征反之,若βs=βr或的相關(guān)變量子集,則認(rèn)為該仿真模型不可信,即C=0,算法結(jié)束;
5)依據(jù)式(15)~(19)計(jì)算特征變量集的聯(lián)合CDF:Fsil、Frjl的差異
7)通過2)可知,α個(gè)相關(guān)變量子集之間是相互獨(dú)立的,且用戶關(guān)注的多個(gè)數(shù)據(jù)特征(包括位置、形狀、頻譜)間也可認(rèn)為是獨(dú)立的,進(jìn)而可采用加權(quán)方法綜合多個(gè)可信度結(jié)果l=1,···,Li;i=1,···,βs;j=1,···,βr.圖2 中“Integrate(·)”表示加權(quán)綜合算子.同時(shí)第σ個(gè)動(dòng)態(tài)輸出的均值曲線可認(rèn)為是對(duì)系統(tǒng)輸出的一次抽樣,不考慮不確定性影響時(shí)的多元輸出數(shù)據(jù)是近似獨(dú)立的,進(jìn)而綜合得到最終驗(yàn)證結(jié)果如下所示.
其中,σ=1,···,mdynamic表示第σ個(gè)動(dòng)態(tài)輸出變量,ζ=1,···,Lσ表示動(dòng)態(tài)輸出均值曲線的第ζ個(gè)特征,wl、wζ代表第l、ζ個(gè)數(shù)據(jù)特征的可信度結(jié)果權(quán)重,wi代表第i個(gè)相關(guān)變量子集的一致性分析結(jié)果權(quán)重,代表相關(guān)變量子集和動(dòng)態(tài)輸出均值曲線一致性的權(quán)重.
為驗(yàn)證本文方法的有效性,針對(duì)文獻(xiàn)[2]中給出的某飛行器縱向平面內(nèi)末制導(dǎo)階段的仿真模型進(jìn)行結(jié)果驗(yàn)證.該模型包括飛行器制導(dǎo)模型和目標(biāo)運(yùn)動(dòng)模型.圖3 給出縱向平面內(nèi)彈目相對(duì)運(yùn)動(dòng)幾何關(guān)系.目標(biāo)以恒定速度vT沿x軸向右行駛.假設(shè)飛行器無動(dòng)力飛行且航向已對(duì)準(zhǔn)目標(biāo),忽略地球自轉(zhuǎn),給出以時(shí)間為自變量的飛行器縱向質(zhì)心運(yùn)動(dòng)方程
式中,v為速度,θ為彈道傾角,h為高度,d為水平距離.阻力D=0.5ρv2SCD(Ma,α),升力L=0.5ρv2SCL(Ma,α).CD與CL分別為阻力系數(shù)與升力系數(shù).α為攻角,馬赫數(shù)Ma=v/vs,S為參考面積,M為質(zhì)量,αM為法向加速度,λ為視線角.聲速vs與大氣密度ρ根據(jù)1976 年美國標(biāo)準(zhǔn)大氣計(jì)算.相應(yīng)的制導(dǎo)律設(shè)計(jì)可見文獻(xiàn)[30].根據(jù)上述信息建立該飛行器縱向平面內(nèi)末制導(dǎo)仿真模型.
圖3 縱向平面內(nèi)彈目相對(duì)運(yùn)動(dòng)幾何關(guān)系Fig.3 Geometrical relationship of relative missile-target movement in longitudinal plane
利用此仿真模型精確研究此飛行器在末制導(dǎo)階段的特性,需要考慮其受到的不確定性因素.飛行器升力與阻力均存在不確定性,引入升力系數(shù)擾動(dòng)CLC,與阻力系數(shù)擾動(dòng)CDC模擬阻力系數(shù)與升力系數(shù)的不確定性,因此有升力L=0.5ρv2SCLCCL(Ma,α),阻力D=0.5ρv2SCDCCD(Ma,α),分別采用不同分布對(duì)CLC和CDC進(jìn)行描述.同時(shí),大氣密度會(huì)影響升力和阻力,因每次飛行環(huán)境不同需考慮其不確定性的影響,采用大氣密度系數(shù)Cρ表示.此外,飛行器進(jìn)入末制導(dǎo)階段時(shí)的初始視線角λ0與彈道傾角θ0亦具有不確定性.選取仿真模型和參考系統(tǒng)的不確定參數(shù)如表2 所示.
表2 飛行器末制導(dǎo)過程的不確定參數(shù)取值Table 2 Uncertainty parameters values in the terminal guidance process of flight vehicle
選取用戶關(guān)注的多元輸出變量如表3 所示.選取靜態(tài)輸出變量有飛行器的最終落點(diǎn)位置坐標(biāo)(xf,zf)和目標(biāo)終點(diǎn)位置坐標(biāo)(xT f,zT f),同時(shí)選取待驗(yàn)證的動(dòng)態(tài)輸出變量有彈道傾角θ、攻角α、視線角λ、彈目相對(duì)距離DMT、目標(biāo)速度vT.利用拉丁超立方抽樣法,對(duì)模型不確定性參數(shù)進(jìn)行抽樣,給定初始樣本數(shù)為1 000,運(yùn)行仿真模型共得到1 000 組輸出.改變飛行器模型參數(shù)(見表2),采用拉丁超立方抽樣獲得的1 000 組數(shù)據(jù)作為參考輸出.系統(tǒng)輸出數(shù)據(jù)的包絡(luò)線如圖4~10 所示.其中目標(biāo)速度vT、目標(biāo)終點(diǎn)位置zT f為恒定值,未在圖中標(biāo)出.
表3 待驗(yàn)證的模型輸出Table 3 Model outputs to be validated
利用本文方法對(duì)該飛行器末制導(dǎo)仿真輸出進(jìn)行驗(yàn)證.首先利用多元輸出變量選擇方法分別對(duì)仿真和參考的動(dòng)靜態(tài)輸出變量進(jìn)行相關(guān)性分析及變量選擇,得到相關(guān)性分析結(jié)果如表4 所示.通過分析可知,仿真和參考輸出變量具有相同的變量子集,動(dòng)態(tài)輸出變量θ、α、λ、DMT具有相關(guān)性,故將其歸為一類.vT為定值(不隨時(shí)間改變)并與變量子集I 相互獨(dú)立;靜態(tài)輸出xf、xT f具有相關(guān)性,通過驗(yàn)證可知兩者滿足線性關(guān)系(如圖11 所示),同時(shí)zf與xf相互獨(dú)立(如圖12 所示),進(jìn)而可得zf與xf相互獨(dú)立,zT f為定值0 形成了變量子集III.由上述分析結(jié)果驗(yàn)證了變量選擇方法的有效性.
圖4 彈道傾角輸出包絡(luò)線Fig.4 Envelope lines of launch angle
圖5 攻角輸出包絡(luò)線Fig.5 Envelope lines of angle of attack
圖6 視線角輸出包絡(luò)線Fig.6 Line-of-sight angle envelopes
圖7 彈目相對(duì)距離輸出包絡(luò)線Fig.7 Envelope lines of the missile-target relative distance
圖8 飛行器落點(diǎn)X坐標(biāo)輸出散點(diǎn)圖Fig.8 Scatter diagram of X-direction drop point coordinates of the flight vehicle
圖9 目標(biāo)終點(diǎn)位置X坐標(biāo)輸出散點(diǎn)圖Fig.9 Scatter diagram of X-direction terminal point coordinates of the target vehicle
根據(jù)表4 的變量選擇結(jié)果求取各變量子集關(guān)于某特征的聯(lián)合CDF,選取動(dòng)態(tài)輸出的位置和形狀特征,分別求取變量子集I 的聯(lián)合CDF,變量子集II為恒定值在驗(yàn)證過程中直接采用相對(duì)誤差方法進(jìn)行一致性分析即可;對(duì)于靜態(tài)輸出變量子集I 關(guān)于數(shù)據(jù)本身的聯(lián)合CDF 如圖13 所示,變量子集II 的CDF 曲線如圖14 所示.進(jìn)而得到動(dòng)態(tài)輸出均值曲線的一致性結(jié)果(見表5)以及多個(gè)變量組關(guān)于多個(gè)特征的CDF 差異和可信度結(jié)果(見表6).依據(jù)式(21)綜合多個(gè)可信度結(jié)果得到最終驗(yàn)證結(jié)果為0.82,由于仿真和參考輸出變量vT、zT f均相等且恒為0,故在計(jì)算模型可信度時(shí)不予考慮,為方便計(jì)算采用均權(quán)的方式進(jìn)行綜合.
圖10 飛行器落點(diǎn)Z坐標(biāo)輸出散點(diǎn)圖Fig.10 Scatter diagram of the terminal point of the target in the Zdirection
表4 多元輸出變量選擇結(jié)果Table 4 Variables selection results of multiple outputs
圖11 飛行器落點(diǎn)X坐標(biāo)與目標(biāo)終點(diǎn)位置X坐標(biāo)間的關(guān)系Fig.11 Relationship of X-direction coordinates between drop point of flight vehicle and terminal point of target
圖12 飛行器落點(diǎn)X方向坐標(biāo)與Z方向坐標(biāo)間的關(guān)系Fig.12 Relationship between X-direction and Z-direction coordinates of the drop point of flight vehicle
圖13 仿真和參考靜態(tài)輸出變量子集I 的聯(lián)合CDF 對(duì)比Fig.13 JCDF comparison of variable subset I between static simulation and reference output
圖14 仿真和參考靜態(tài)輸出變量子集II 的CDF 對(duì)比Fig.14 Comparison of variable subset II between static simulation and reference output
此外,為進(jìn)一步驗(yàn)證本文方法對(duì)參數(shù)不確定性度量的有效性,針對(duì)上述應(yīng)用實(shí)例分別設(shè)計(jì)兩組驗(yàn)證實(shí)驗(yàn)(不確定性參數(shù)取值見表7).固定仿真模型和參考系統(tǒng)的不確定性參數(shù)大氣密度系數(shù)Cρ、升力系數(shù)CD、阻力系數(shù)CL和初始視線角λ0的取值.分別調(diào)節(jié)仿真模型初始彈道傾角θ0的均值和方差,得到最終驗(yàn)證結(jié)果如圖15~16 所示.通過實(shí)驗(yàn)可得,該方法能夠度量仿真模型不確定參數(shù)取值的離散程度對(duì)驗(yàn)證結(jié)果的影響,證明過大或過小的參數(shù)不確定度均會(huì)降低模型的可信度;同時(shí)該方法能夠度量不確定性參數(shù)的均值差異對(duì)驗(yàn)證結(jié)果的影響.綜上所述,所提方法能夠用于解決帶有相關(guān)性的多元輸出仿真結(jié)果驗(yàn)證問題.
表5 動(dòng)態(tài)輸出均值曲線的一致性分析結(jié)果Table 5 Consistency analysis results of the mean curves of dynamic outputs
表6 仿真和參考輸出變量子集的一致性分析結(jié)果Table 6 Consistency analysis results of the variables subset of the simulation and reference outputs
表7 驗(yàn)證實(shí)驗(yàn)的不確定參數(shù)取值Table 7 Uncertainty parameters values for validation experiments
針對(duì)帶有相關(guān)性的多元輸出仿真模型驗(yàn)證問題,提出了考慮不確定性的聯(lián)合驗(yàn)證方法.首先對(duì)多變量輸出提取相關(guān)變量子集,并對(duì)各輸出變量提取數(shù)據(jù)特征,利用聯(lián)合CDF 差異法度量各相關(guān)變量子集的一致性程度,進(jìn)而綜合得到模型可信度.利用單變量驗(yàn)證方法進(jìn)行多變量驗(yàn)證時(shí)需要滿足輸出變量相互獨(dú)立的條件.本文方法考慮了多變量間的相關(guān)關(guān)系,基于相關(guān)變量子集進(jìn)行聯(lián)合驗(yàn)證,較單變量驗(yàn)證方法應(yīng)用更合理;同時(shí)在驗(yàn)證前引入了變量相關(guān)性分析,使其能夠適應(yīng)輸出變量之間關(guān)系未知的情況,使驗(yàn)證結(jié)果更準(zhǔn)確,但也增加了計(jì)算開銷.此外,該方法能夠度量不確定性因素對(duì)模型可信度的影響.
圖15 實(shí)驗(yàn)組I 驗(yàn)證結(jié)果Fig.15 Validation result of experiment I
圖16 實(shí)驗(yàn)組II 驗(yàn)證結(jié)果Fig.16 Validation result of experiment II
需要說明的是,本文僅考慮同一類型輸出(動(dòng)態(tài)或靜態(tài))存在相關(guān)性的情況,涉及的變量選擇方法本質(zhì)上屬于數(shù)據(jù)挖掘方法,為確保方法的準(zhǔn)確性要求具備足夠的樣本容量,對(duì)于參考數(shù)據(jù)缺乏的情況,可采用專家給出參考數(shù)據(jù)的大致分布,或可利用已有的歷史數(shù)據(jù)、可信度較高且類似的半實(shí)物/純數(shù)字仿真模型所產(chǎn)生的數(shù)據(jù)代替.此外,刻畫動(dòng)態(tài)輸出的數(shù)據(jù)特征不限于距離、形狀及頻譜,可依據(jù)具體應(yīng)用需求而定(例如,超調(diào)量、相位誤差等).后續(xù)將對(duì)動(dòng)態(tài)、靜態(tài)輸出間的相關(guān)性分析及變量選擇方法進(jìn)行研究;同時(shí)針對(duì)參考數(shù)據(jù)缺乏以及存在認(rèn)知和固有混合不確定性時(shí)的多元輸出仿真結(jié)果驗(yàn)證問題展開進(jìn)一步研究.