鄔美春 左永剛 陳福澤 黨海鵬
(陸軍勤務(wù)學(xué)院 重慶 401331)
隨著科技的不斷進步,大量運用高精尖技術(shù)的武器被投送到戰(zhàn)場,導(dǎo)致現(xiàn)代化局部戰(zhàn)爭變得復(fù)雜化、多樣化,戰(zhàn)場態(tài)勢也發(fā)生重大改變,這使得人員對裝備的依賴度越來越高,大大增加油料裝備保障的難度和成本。從最近幾次局部沖突中可以看出,占據(jù)信息優(yōu)勢的一方能很快掌控局勢,人員和裝備補給較為迅速。
隨著軍隊改革步伐的不斷加快,新型裝備也在快速列裝,但大量不同型號的武器裝備給后勤裝備保障部門的保障能力帶來較大的壓力。近年來,我軍推動了后勤保障建設(shè)向信息化轉(zhuǎn)型,在精確化保障、規(guī)范化管理、科學(xué)化建設(shè)等方面取得了創(chuàng)新發(fā)展。但我們同時也應(yīng)該看到在裝備信息智能化保障方面還存在不足,傳統(tǒng)低效單一化的保障模式仍然存在。因此,尋求新技術(shù)、新手段提高裝備保障的信息化水平,對提升軍隊作戰(zhàn)能力具有重要意義。
大數(shù)據(jù)深度挖掘技術(shù)作為一種較為日漸成熟的數(shù)據(jù)處理手段,能夠快速理清需求和供應(yīng)之間復(fù)雜的關(guān)系,提供最優(yōu)的解決方案。將常年累積的裝備保障信息進行了處理,建立裝備保障預(yù)測模型,為提升裝備保障能力提供了新思路。劉洪偉[1]分析了常用的保障模式,針對信息化裝備具備數(shù)據(jù)下載、加注的保障特點,并需要定期進行更換的特點,完成裝備保障信息化模型的建立及系統(tǒng)實現(xiàn)。焦敬義等[2]利用數(shù)據(jù)挖掘技術(shù)對裝備保障信息資源中大量數(shù)據(jù)進行挖掘,為裝備保障部門的正確決策提供科學(xué)的依據(jù)是裝備信息管理的重要內(nèi)容。
上述研究表明,大數(shù)據(jù)技術(shù)對裝備保障信息化建設(shè)具有一定的指導(dǎo)作用,但目前研究還遠遠不足。本文基于大數(shù)據(jù)挖掘技術(shù),建立了裝備保障信息化管理模型,并驗證了模型的可靠性,為提升裝備保障水平提供了有價值的參考。
目前,后勤保障建設(shè)信息化水平不斷提高,油料裝備保障作為其中的重要組成部分,信息化建設(shè)也取得了較大的進展。為滿足不同類型裝備及作戰(zhàn)形式的油料裝備保障需求,各級后勤裝備保障部門依據(jù)實際需求,搭建了許多不同類型的裝備保障平臺。然而,由于數(shù)據(jù)種類繁瑣、通用性較差,平臺之間的關(guān)聯(lián)性不強、數(shù)據(jù)利用效率較低,出現(xiàn)了許多“信息孤島”,造成一定程度上的資源浪費。
為了對標(biāo)現(xiàn)代戰(zhàn)爭,必須要運用大數(shù)據(jù)思維和精確算法,準確掌握后勤保障需求、供應(yīng)、保障數(shù)據(jù)信息,暢通保障鏈路。在建立后勤大數(shù)據(jù)資源庫的基礎(chǔ)上,通過電腦與人腦的有機結(jié)合,運用精確算法,實現(xiàn)缺什么補什么的目標(biāo)。通過依托后勤大數(shù)據(jù)平臺,統(tǒng)籌平戰(zhàn)時可動用的各類資源及分布情況,通過深度計算和精確計算,對軍內(nèi)資源和地方資源、部隊資源和聯(lián)勤資源、自我資源和友鄰資源進行測算、統(tǒng)籌、優(yōu)化和設(shè)計,生成適應(yīng)作戰(zhàn)需求的后勤供應(yīng)保障方案。
大數(shù)據(jù)時代的到來,既是挑戰(zhàn)、更是機遇。以數(shù)據(jù)為坐標(biāo),統(tǒng)籌后勤整體建設(shè),積極搶占數(shù)據(jù)保障主權(quán),實現(xiàn)我軍后勤和裝備信息化建設(shè)的跨越式發(fā)展。
當(dāng)前物聯(lián)網(wǎng)、大數(shù)據(jù)和云計算的發(fā)展,掀起了第三次信息化浪潮[2]。隨著數(shù)據(jù)量的積累,傳統(tǒng)的數(shù)據(jù)處理模式已經(jīng)不能滿足任務(wù)需求,大數(shù)據(jù)處理技術(shù)應(yīng)運而生。大數(shù)據(jù)具有數(shù)據(jù)體量大(Volume)、處理速度快(Velocity)、數(shù)據(jù)類別大(Variety)、數(shù)據(jù)真實性高(Veracity)、價值密度低,商業(yè)價值(Value)高[3]等特點[3]。表1表達了傳統(tǒng)數(shù)理統(tǒng)計與大數(shù)據(jù)處理技術(shù)的異同。
表1 大數(shù)據(jù)與傳統(tǒng)統(tǒng)計學(xué)的不同
大數(shù)據(jù)計算體系由數(shù)據(jù)存儲系統(tǒng)、數(shù)據(jù)處理系統(tǒng)、數(shù)據(jù)應(yīng)用系統(tǒng)三個基本系統(tǒng)組成。具體如圖1所示。
圖1 大數(shù)據(jù)分層計算系統(tǒng)
三個階層各有不同的作用。相較于傳統(tǒng)的關(guān)系型數(shù)據(jù)庫系統(tǒng),大數(shù)據(jù)的數(shù)據(jù)存儲系統(tǒng)較為復(fù)雜的多[4~8]。主要表現(xiàn)為關(guān)系型數(shù)據(jù)庫通過外鍵關(guān)聯(lián)來建立表與表之間的關(guān)系,非關(guān)系型數(shù)據(jù)庫通常指數(shù)據(jù)以對象的形式存儲在數(shù)據(jù)庫中,而對象之間的關(guān)系通過每個對象自身的屬性來決定。對于數(shù)據(jù)處理系統(tǒng)而言,可按照功能和相似度對不同算法進行分類[9~12]。計算處理模型需要針對不同數(shù)據(jù)的類型、不同處理方式需要不同的計算模型來提供計算范式和數(shù)據(jù)處理邏輯。
對于油料裝備保障系統(tǒng)而言,數(shù)據(jù)是分析數(shù)據(jù)之間內(nèi)在規(guī)律以及建立模型的關(guān)鍵,但油料裝備活動包括裝備發(fā)展規(guī)劃與計劃、研究設(shè)計、試驗定型、生產(chǎn)制造、籌措、供應(yīng)與調(diào)撥、編配、儲備、分級與轉(zhuǎn)級、日常保管、日常操作使用、戰(zhàn)時運用、維護保養(yǎng)、維修與搶修、退役與報廢和教學(xué)與培訓(xùn)等。各種類型信息之間難以互聯(lián),因此,在數(shù)據(jù)存儲層要對數(shù)據(jù)進行歸一化處理。
建模的目的是實現(xiàn)油料裝備的快速化、智能化保障。大數(shù)據(jù)平臺構(gòu)建,應(yīng)該以油料裝備管理人員的業(yè)務(wù)應(yīng)用需求的先導(dǎo),只要弄清需求才能提出具體的應(yīng)對措施,從而根據(jù)需求進行相應(yīng)建模。魏忠平等[13]從業(yè)務(wù)和技術(shù)兩個方面論述了油料裝備保障應(yīng)滿足的主要需求,本文以此需求為出發(fā)點進行模型建立。
通過大數(shù)據(jù)技術(shù)建立模型可分為幾個步驟:
1)數(shù)據(jù)收集:在現(xiàn)有軍事綜合網(wǎng)的基礎(chǔ)上,組織對采集數(shù)據(jù)的分類、甄別和統(tǒng)計、梳理。
2)數(shù)據(jù)歸一化處理:制定歸一化指標(biāo)規(guī)則,對不同類型的數(shù)據(jù)進行歸一化處理。
3)數(shù)據(jù)清洗:為保障模型的可靠性,應(yīng)摒棄不合理的離散數(shù)據(jù)。
4)特征提取與數(shù)據(jù)擬合:以MIC作為相關(guān)性評價指標(biāo),找出黏性系數(shù)相關(guān)性較高的參數(shù),通過泛函網(wǎng)絡(luò)自適應(yīng)擬合方法,給出各參數(shù)之間的大數(shù)據(jù)特征函數(shù)[14~15]。
根據(jù)裝備保障信息管理需要解決的問題,進行數(shù)據(jù)采集,然后不同的數(shù)據(jù)進行權(quán)重設(shè)置。具體流程圖如圖2。
圖2 建立模型流程圖
數(shù)據(jù)的歸一化是數(shù)據(jù)分析的關(guān)鍵,對數(shù)據(jù)樣本的處理方法至關(guān)重要。本文所獲取的樣本當(dāng)中,有些樣本獲取的年代較久,有些樣本較新,有些樣本來源于實戰(zhàn),而有些樣本則來源于訓(xùn)練或是仿真實驗等。這些因素決定著樣本在關(guān)系挖掘過程中的重要程度是不一樣的,若不考慮這諸多的不同而將每個樣本的懲罰系數(shù)設(shè)置為一樣,則必然使所得模型的精度與泛化能力受損,影響模型的使用。因此,本文選取樣本加權(quán)最小二乘支持向量回歸模型處理數(shù)據(jù)。
設(shè)有N個訓(xùn)練樣本(xi,yi)。因此在標(biāo)準最小二乘支持向量優(yōu)化問題中引入樣本權(quán)vi,就變?yōu)槿缦聝?yōu)化問題:
其相應(yīng)的對偶問題為
由上式可以到最終的擬合函數(shù)為
其中 Kf(x,xi)=K(VTx,VTxi)為加權(quán)核函數(shù)。
在確定了模型之后,就將模型轉(zhuǎn)化為計算a、b值的問題。由于a、b非線性的關(guān)系。最大互信息系數(shù)作為一種非線性相關(guān)度量,具有普適性、公平性和對稱性等優(yōu)點。普適性是指在樣本量足夠大(包含了樣本的大部分信息)時,能夠捕獲各種各樣有趣的關(guān)聯(lián),而不限定于特定的函數(shù)類型(如線性函數(shù)、指數(shù)函數(shù)或周期函數(shù)),或者說能均衡覆蓋所有的函數(shù)關(guān)系。公平性是指在樣本量足夠大時能為不同類型單噪聲程度相似的相關(guān)關(guān)系給出相近的系數(shù)。例如,對于一個充滿相同噪聲的線性關(guān)系和一個正弦關(guān)系,一個好的評價算法應(yīng)該給出相同或相近的相關(guān)系數(shù)。MIC與其它相關(guān)性算法對比如表2所示,MIC是一種計算復(fù)雜度低,適用于線性與非線性數(shù)據(jù),魯棒性高的相關(guān)系數(shù)算法[16~18]。
MIC源于互信息概念,它可以看成是一個隨機變量中包含的關(guān)于另一個隨機變量的信息量,或者說是一個隨機變量由于已知另一個隨機變量而減少的不確定性。簡而言之,互信息可理解為聯(lián)合分布與邊緣分布的相對熵,但是一般情況下聯(lián)合概率計算比較麻煩。
MIC是針對兩個離散在二維空間中變量之間的關(guān)系,使用散點圖來表示,將當(dāng)前二維空間在x,y方向分別劃分為一定的區(qū)間數(shù),然后查看當(dāng)前的散點在各個方格中落入的情況,這就是聯(lián)合概率的計算,這樣就解決了在互信息中的聯(lián)合概率難求的問題。MIC的計算方法如下所示:
式中:a,b是在x,y方向上劃分格子的個數(shù),本質(zhì)上就是網(wǎng)格分布,B是變量,一般取數(shù)據(jù)量的0.6次方。
對于給定i和 j的情況下 M(X,Y,D,i,j)的計算方法,即:給定很多(i,j)值,計算每一種情況下M(X,Y,D,i,j)的值,將所有M(X,Y,D,i,j)中的最大那個值作為MIC值。MIC計算分為三個步驟:1)給定i,j,對 X ,Y 構(gòu)成的散點圖進行i列 j行網(wǎng)格化,并求出最大的互信息值;2)對最大的互信息值進行歸一化;3)選擇不同尺度下互信息的最大值作為MIC值。
從已有的數(shù)據(jù)庫中選取14組樣本數(shù)據(jù),共分為4類(a.信息化時代、訓(xùn)練演習(xí)、同類裝備2組數(shù)據(jù);b.信息化時代、訓(xùn)練演習(xí)、近似裝備6組數(shù)據(jù);c.半機械化半信息化時代、實戰(zhàn)、近似裝備3組數(shù)據(jù);d.信息化時代、仿真實驗、同類裝備3組數(shù)據(jù))。進行訓(xùn)練,并另選擇8組數(shù)據(jù)(信息化時代、訓(xùn)練演習(xí)、同類裝備)進行精度測試。訓(xùn)練數(shù)據(jù)如表2所示。
表2 訓(xùn)練數(shù)據(jù)
利用該模型對測試樣本進行測試所得結(jié)果如圖3及表3所示。
圖3 測試結(jié)果
表3 不同方法的測試結(jié)果
研究分析了目前油料裝備保障的現(xiàn)狀,介紹了大數(shù)據(jù)挖掘技術(shù)的原理,關(guān)鍵技術(shù)及系統(tǒng)組成?;诖髷?shù)據(jù)技術(shù)建立了樣本加權(quán)的最小二乘支持向量回歸模型,并進行模型的可靠性驗證,結(jié)果表明本文所提出的能夠較好地預(yù)測在復(fù)雜戰(zhàn)場環(huán)境下,油料裝備保障的最優(yōu)時間,能夠為油料裝備保障信息化建設(shè)提供有價值的參考。