陳 沖,徐清宇,程 欣,李克奇,甄 磊
(北方自動控制技術研究所,太原 030006)
現(xiàn)今的模擬仿真訓練系統(tǒng)中,對于溫度、風力、云、霧、沙塵、降雨量等氣象環(huán)境的仿真主要是以復現(xiàn)歷史戰(zhàn)場氣象環(huán)境數(shù)據(jù)來實現(xiàn)的。主要是通過對歷史戰(zhàn)場氣象環(huán)境數(shù)據(jù)的挖掘進行復現(xiàn),主要方法包括基于K 均值聚類算法的氣象數(shù)據(jù)挖掘、基于蟻群算法的戰(zhàn)場氣象環(huán)境數(shù)據(jù)挖掘,和基于氣象預測相關數(shù)據(jù)挖掘模型的戰(zhàn)場氣象環(huán)境數(shù)據(jù)挖掘。其中最常用的是氣象預測相關數(shù)據(jù)挖掘模型的戰(zhàn)場氣象環(huán)境數(shù)據(jù)挖掘方法。
在模擬仿真訓練過程中,單一的對歷史戰(zhàn)場氣象環(huán)境的再現(xiàn),已經(jīng)遠遠不能滿足對于多變戰(zhàn)場環(huán)境的仿真需求。針對陸軍模擬仿真訓練系統(tǒng)其在訓練過程中對虛擬戰(zhàn)場氣象環(huán)境的干預,需要在合理可控的預測區(qū)間內(nèi)對調(diào)理作出響應。本文所提出的基于戰(zhàn)場氣象環(huán)境歷史數(shù)據(jù)的模糊預測算法,是在擬合區(qū)間內(nèi)對氣象數(shù)據(jù)的模糊預測擬合,滿足陸戰(zhàn)場仿真系統(tǒng)中對多變戰(zhàn)場氣象環(huán)境的要求。
對于氣象環(huán)境預報來說,用到最多的是被廣為熟知的氣象預報專家系統(tǒng)。該系統(tǒng)是以氣象環(huán)境學知識為基礎,并以推理機系統(tǒng)產(chǎn)生的邏輯推斷為依據(jù)來預報氣象環(huán)境。通常包括知識獲取、知識庫、數(shù)據(jù)庫、推理機、輸出解釋和資料處理與預報參數(shù)采集等6 部分分系統(tǒng)。知識獲取分系統(tǒng)是利用壓縮后的預報因子和因子群,將從氣象環(huán)境預報員和氣象領域專家得到的知識轉變?yōu)橄到y(tǒng)可識別的形式,并將其寄存于知識庫分系統(tǒng)中。推理機分系統(tǒng)是利用氣象學知識產(chǎn)生的規(guī)則,對氣象環(huán)境數(shù)據(jù)進行邏輯判斷。知識庫分系統(tǒng)是氣象預報專家系統(tǒng)的核心部分,知識的獲取、解析、推理和預報都建立在知識庫分系統(tǒng)的基礎上。數(shù)據(jù)庫分系統(tǒng)是用來存儲氣象信息數(shù)據(jù)的,主要包括歷史氣象數(shù)據(jù)資料和實時氣象數(shù)據(jù)資料兩部分內(nèi)容。輸出解釋分系統(tǒng)是通過人機互操作的形式將系統(tǒng)的各種信息提供給用戶,使系統(tǒng)具備一定的可理解性。資料處理與預報參數(shù)分系統(tǒng)又可以稱之為學習系統(tǒng),通過與外界環(huán)境進行交互不斷完善自身的性能。
隨著數(shù)據(jù)處理技術的不斷發(fā)展,對氣象環(huán)境數(shù)據(jù)處理能力在不斷提高,獲取到的氣象環(huán)境數(shù)據(jù)量也在不斷增加,氣象環(huán)境數(shù)據(jù)的殘缺、冗余和混亂現(xiàn)象越來越明顯。通過專家和人工獲取的知識已經(jīng)不能滿足對復雜數(shù)據(jù)總體特性準確描述的需求,因數(shù)據(jù)量爆炸式增長而出現(xiàn)的知識匱乏現(xiàn)象也日漸顯露。在氣象環(huán)境數(shù)據(jù)量龐大的今天,知識獲取逐漸成為制約氣象預報專家系統(tǒng)發(fā)展的核心問題。
數(shù)據(jù)挖掘是利用多種分析工具在海量數(shù)據(jù)中尋求構建模型和數(shù)據(jù)之間關系的過程,并利用這些數(shù)據(jù)和模型間關系對數(shù)據(jù)更進一步預測。數(shù)據(jù)挖掘在氣象預報中首先要做的是對氣象數(shù)據(jù)的描述,并對統(tǒng)計變量進行計算。隨著數(shù)據(jù)庫和數(shù)據(jù)挖掘技術的發(fā)展,數(shù)據(jù)挖掘在氣象預報中的應用越來越多。從最早在氣象環(huán)境數(shù)據(jù)處理中用到的統(tǒng)計學回歸和聚類分析方法,到現(xiàn)今所用到的數(shù)據(jù)挖掘技術、氣象環(huán)境數(shù)據(jù)處理技術也在不斷變革。
由于氣象數(shù)據(jù)和電力負荷數(shù)據(jù)之間存在著極大的不確定性關系,在計算機系統(tǒng)中的電力負荷預測上,開始出現(xiàn)了大量的研究和試驗。大量研究表明,氣象變化是導致計算機系統(tǒng)電力負荷變化的因素之一。
雖然上面所提到的兩種方法對于戰(zhàn)場氣象環(huán)境數(shù)據(jù)都能起到預測作用,但是針對陸軍模擬仿真訓練系統(tǒng),所要實現(xiàn)的不僅僅是對戰(zhàn)場氣象環(huán)境數(shù)據(jù)的準確預測,還有在仿真過程中在不影響整體系統(tǒng)環(huán)境數(shù)據(jù)的基礎上,對虛擬戰(zhàn)場氣象環(huán)境在合理范圍內(nèi)的干預和調(diào)理。針對以上問題,本文提出了一種基于歷史戰(zhàn)場氣象環(huán)境數(shù)據(jù)的模糊預測算法設計。
對戰(zhàn)場氣象環(huán)境進行精準的預測,是在對戰(zhàn)場氣象環(huán)境數(shù)據(jù)進行準確分析后的基礎上完成的。原始氣象環(huán)境數(shù)據(jù)中所存在的數(shù)據(jù)冗余、雜亂和不完整等問題,會直接影響到數(shù)據(jù)挖掘和模糊預測的效果,所以在對氣象數(shù)據(jù)進行挖掘和模糊預測前,要根據(jù)氣象數(shù)據(jù)特性,利用現(xiàn)有的數(shù)據(jù)清理、集成、變換和規(guī)約等預處理技術,可以提升戰(zhàn)場氣象環(huán)境數(shù)據(jù)的質量,提高挖掘和預測的效率。
數(shù)據(jù)清理主要是用來填補遺漏數(shù)據(jù)、消除異常數(shù)據(jù)和平滑噪聲數(shù)據(jù),能有效糾正錯誤數(shù)據(jù)。
數(shù)據(jù)集成是指將不同數(shù)據(jù)源的數(shù)據(jù)整合到一起,形成一個統(tǒng)一的數(shù)據(jù)集合,為數(shù)據(jù)挖掘和模糊預測提供完整的數(shù)據(jù)基礎。以給出的兩個屬性A 和B 數(shù)據(jù)集合為例,其中n 是集合A、B 的元素個數(shù),A與B 是集合A、B 的均值,σA與σB是集合A、B 的標準差。根據(jù)集合A、B 的數(shù)值屬性,使用下式分析集合A、B 數(shù)值屬性間的互相關關系:
數(shù)據(jù)變化是指采用規(guī)范化和屬性構造等方法,將原始氣象環(huán)境數(shù)據(jù)轉變?yōu)檫m合挖掘和預測的形式。常用的規(guī)范化方法有最小-最大規(guī)范化、零均值規(guī)范化和十基數(shù)變換規(guī)范化。
1)最小-最大規(guī)范化法:假設minA和maxA為A 屬性的最小值與最大值。最小-最大規(guī)范化是對A 的值線性變換,將其映射到區(qū)間[newminA,newmaxA]中,其映射公式如下:
2)零均值規(guī)范化法:將集合A 的數(shù)值屬性值v基于A 的平均值和標準差進行處理,其中A、σA為集合A 的均值和標準差,利用下式規(guī)范為v':
3)十基數(shù)變換規(guī)范化法:通過移動集合A 的小數(shù)點位置,將集合A 的屬性值v 規(guī)范化為v',其中j 是使得max(|v'|)<1 的最小整數(shù)。而小數(shù)點的移動位數(shù)取決于A 的最大絕對值。
數(shù)據(jù)歸約技術是對氣象環(huán)境原始數(shù)據(jù)集進行屬性選擇和部分采樣等處理,得到原數(shù)據(jù)集的精簡集合。該精簡數(shù)據(jù)集不僅減小了原始數(shù)據(jù)集的數(shù)據(jù)量,還保持了原數(shù)據(jù)集的完整性。
對于模糊預測在歷史氣象數(shù)據(jù)挖掘應用來說,主流的是在K 均值聚類算法的基礎上,引入隸屬關系形成的模糊K 均值聚類的氣象數(shù)據(jù)挖掘算法,其在一定程度上增加了數(shù)據(jù)挖掘的準確率。以主從隸屬的依附關系,根據(jù)隸屬度關系進行分類模糊,提高某幾類數(shù)據(jù)挖掘的準確率。但在氣象數(shù)據(jù)模糊預測中,所要求的是對于整個時間段內(nèi)氣象數(shù)據(jù)的挖掘預測,不存在隸屬關系,就需要來尋求其他的關于氣象數(shù)據(jù)挖掘的模糊預測。
本文所提出的基于模擬訓練歷史數(shù)據(jù)的氣象環(huán)境數(shù)據(jù)模糊預測算法,其通過時間序列分析氣象環(huán)境數(shù)據(jù)之間的關聯(lián)性,通過模擬訓練的歷史氣象環(huán)境數(shù)據(jù)挖掘時間序列變化的規(guī)律,來對未來氣象環(huán)境數(shù)據(jù)進行模糊預測。模型計算的模糊帶包絡覆蓋了實際值變化的曲線,能夠在模擬仿真訓練過程中滿足用戶在真實可能性的基礎上,實現(xiàn)對虛擬戰(zhàn)場環(huán)境數(shù)據(jù)定制。模糊時間序列曲線擬合預測過程主要包括以下內(nèi)容。
以某一虛擬戰(zhàn)場環(huán)境數(shù)據(jù)來說,假設該戰(zhàn)場環(huán)境某月的歷史平均數(shù)據(jù)為一組實數(shù)x1,x2,…xT,利用它們構造一組模糊數(shù),設當t=1 和T 時,
在給出的歷史年份T 內(nèi)取不同的正整數(shù)k 值,計算趨勢方程:
設pi為三角模糊函數(shù),則它的估計值p^i可以設為:
得到pi的估計值p^i,則得到趨勢方程為:
此時可代入未來時間,SVt*()也是一個三角模糊數(shù),當時間變動時SVt*(t)不是一條曲線,而是一個曲線帶,曲線帶的上下兩條邊界曲線分別為f1(t)=β(t)+S(t)和f2(t)=β(t)-S(t),中心線為f0(t)=β(t),
Box-Muller 算法核心是先產(chǎn)生一組服從均勻分布的隨機數(shù),再將該組均勻分布的隨機數(shù)通過變化轉換為正態(tài)分布的隨機數(shù)。
在(0,1]值域內(nèi)生成u1和u2,且u1、u2為相互獨立的兩個隨機數(shù):
u1=rand()*1.0/RAND_MAX;
u2=rand()*1.0/RAND_MAX;
其中,RAND_MAX 為定義的字符常量,rand()為產(chǎn)生在0-RAND_MAX 區(qū)間值的函數(shù),由此算出一個正態(tài)分布的隨機數(shù)字Z:
Z=R*cos(a);
其中,R=sqrt(-2*log(u2));a=2*π*u1;
得到一個均值為0,標準差為1 統(tǒng)計量,映射到一個均值為β(t),標準偏差為S(t)的統(tǒng)計量X:
X =β(t)+ Z * S(t),即為默認的預測值函數(shù)。
為了驗證算法的可行性和有效性,本文采取戰(zhàn)場環(huán)境中的天氣溫度數(shù)據(jù)來進行算法的可行性實現(xiàn),并與歷史數(shù)據(jù)挖掘到的溫度數(shù)據(jù)進行比較,驗證該算法的有效性。利用MATLAB 工具以虛擬仿真訓練戰(zhàn)場氣象環(huán)境中的氣溫為例,來繪制戰(zhàn)場環(huán)境的歷史氣溫挖掘數(shù)據(jù)和本文設計算法得到的預測溫度數(shù)據(jù)。
本文以中部戰(zhàn)區(qū)某戰(zhàn)場2020 年7 月份的日平均溫度作為樣本數(shù)據(jù)來進行預測,以1999-2019 年前20 年的該戰(zhàn)場7 月份日平均氣溫數(shù)據(jù)進行挖掘獲得7 月份日平均溫度的歷史數(shù)據(jù),氣溫數(shù)據(jù)來源于中國氣象數(shù)據(jù)網(wǎng)。由于數(shù)據(jù)繁多復雜,這里直接給出原始數(shù)據(jù)經(jīng)過預處理后的2020 年7 月份和前20 年中部某戰(zhàn)場的日平均氣溫數(shù)據(jù),如表1 和表2所示。
表1 2020 年中部某戰(zhàn)場7 月日平均溫度
對于所要預測擬合的2020 年7 月份太原市的日平均氣溫本文以前20 年的溫度為樣本,利用本文算法給出預測擬合區(qū)間,并在該區(qū)間內(nèi)進行預測擬合,同時與常用的歷史數(shù)據(jù)挖掘得到的數(shù)據(jù)進行比較,分析該算法的有效性,所得到的結果如圖1~圖4 所示。
表2 前20 年7 月份中部某戰(zhàn)場日平均溫度
圖1 2020 年7 月份日平均氣溫
圖3 歷史氣溫數(shù)據(jù)挖掘曲線
從上圖中可以看出本文所提出的利用歷史數(shù)據(jù)來進行戰(zhàn)場環(huán)境的模糊預測模擬,相比歷史數(shù)據(jù)挖掘所得到的環(huán)境數(shù)據(jù)更加貼合實際戰(zhàn)場環(huán)境數(shù)據(jù),且其在擬合區(qū)間內(nèi)進行戰(zhàn)場環(huán)境的數(shù)據(jù)預測擬合思想,更加符合在模擬仿真訓練過程中對虛擬戰(zhàn)場環(huán)境的實時戰(zhàn)場干預和調(diào)理。
圖4 擬合區(qū)間內(nèi)算法預測擬合的曲線
虛擬戰(zhàn)場環(huán)境仿真數(shù)據(jù)通過模糊時間序列算法預測得出的是一個可能性區(qū)間,在該合理區(qū)間內(nèi)可以進行預測擬合曲線的自定義。預測方程系數(shù)不是確定的數(shù),而是一組模糊數(shù);預測的是一個區(qū)間,而不是一個確定值,在該區(qū)間內(nèi)可以對陸軍模擬仿真訓練過程中的虛擬戰(zhàn)場氣象環(huán)境進行合理的干預調(diào)理。