陳效真,周 姣,董燕琴,魏宗康,王常虹
(1.國家慣性技術(shù)產(chǎn)品質(zhì)量監(jiān)督檢驗中心,北京100039;2.北京航天控制儀器研究所,北京100039;3.火箭軍裝備研究院,北京100094;4.哈爾濱工業(yè)大學(xué)空間控制與慣性技術(shù)研究中心,哈爾濱150080)
高精度慣性導(dǎo)航系統(tǒng)作為戰(zhàn)略導(dǎo)彈武器系統(tǒng)中制導(dǎo)和控制的關(guān)鍵部件,是武器系統(tǒng)實現(xiàn)精確打擊的關(guān)鍵[1-4]。高精度慣性導(dǎo)航系統(tǒng)產(chǎn)品的研制、驗收和應(yīng)用分為4個階段運行,期間生成了海量的數(shù)據(jù)。第一階段是研制階段,由設(shè)計和生產(chǎn)單位完成,生成了大量元件、儀表和單機的測試數(shù)據(jù);第二階段是控制系統(tǒng)綜合測試階段,生成了大量的靜動態(tài)試驗仿真數(shù)據(jù)、地面模擬飛行數(shù)據(jù);第三階段是飛行試驗和靶試階段,重點在于收集遙外測數(shù)據(jù),驗證天地一致性;第四階段是裝備服役階段,生成了大量的儲存、年檢及性能退化數(shù)據(jù)。不同時期從不同側(cè)面反映了產(chǎn)品特性,每個階段數(shù)據(jù)各具特色,形成不同特征的數(shù)據(jù)包,但是各階段自成體系,由此形成數(shù)據(jù) “孤島”。這些 “孤島”之間缺乏溝通互補,雖為同類,但由于型號不同,組織建設(shè)的制約導(dǎo)致慣性導(dǎo)航系統(tǒng)借鑒和應(yīng)用的藩籬,難以形成高精度慣性導(dǎo)航系統(tǒng)全壽命周期測試大數(shù)據(jù)體系。
慣性導(dǎo)航測試數(shù)據(jù)的分析是高精度慣性導(dǎo)航系統(tǒng)研制、驗收和應(yīng)用中的難題。目前,很大部分數(shù)據(jù)采用人工判讀集合單機數(shù)據(jù)庫存儲的方式進行,這種依賴人工的數(shù)據(jù)分析在面對海量的大數(shù)據(jù)時,存在耗時、低效、成本高等諸多缺點,并且測試人員很難通過肉眼從海量的原始數(shù)據(jù)中理解問題的本質(zhì)。如何將這些海量數(shù)據(jù)背后隱含的有價值信息挖掘出來,幫助測試人員分析和解決問題,提高慣性導(dǎo)航系統(tǒng)的精度已成為當務(wù)之急和應(yīng)勢之舉。
大數(shù)據(jù)是指無法在一定時間范圍內(nèi)用常規(guī)軟件工具進行捕捉、管理和處理的數(shù)據(jù)集合,需要新處理模式才能具有更強的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn),它具有規(guī)模性(Volume)、實時高速性(Velocity)、 多樣性(Variety)、 低價值密度(Value)和真實性(Veracity)5個特征。目前,高精度慣性導(dǎo)航系統(tǒng)在全壽命周期的數(shù)據(jù)也具備上述5個特征。同時,高精度慣性導(dǎo)航系統(tǒng)還具備新的特征,例如,在出廠階段重點在于對慣性測量裝置低階誤差系數(shù)的穩(wěn)定性考核,在控制系統(tǒng)綜合測試階段重點在于對慣性測量系統(tǒng)高階誤差和動態(tài)導(dǎo)航精度的估計和評估,在裝備服役階段重點在于對測試數(shù)據(jù)的保持能力和飛行試驗的遙外測數(shù)據(jù)收集和比對,驗證高精度慣性導(dǎo)航系統(tǒng)的天地一致性。高精度慣性導(dǎo)航系統(tǒng)的數(shù)據(jù)同一產(chǎn)品子樣少,同類型號多;數(shù)據(jù)生成周期長,同類產(chǎn)品試驗頻次多;數(shù)據(jù)高密度壁壘致使數(shù)據(jù)分散,關(guān)聯(lián)度不緊密,顯性度不夠。因此,亟需建立一個高精度慣性導(dǎo)航系統(tǒng)全壽命周期測試大數(shù)據(jù)體系,通過數(shù)據(jù)挖掘?qū)崿F(xiàn)同類產(chǎn)品數(shù)據(jù)對比和經(jīng)驗遞推,以保障慣性導(dǎo)航系統(tǒng)精度、可靠性、壽命及天地一致性等應(yīng)用性能。
本文首先介紹了大數(shù)據(jù)發(fā)展現(xiàn)狀;其次詳細分析了慣性導(dǎo)航測試系統(tǒng)數(shù)據(jù)采集、數(shù)據(jù)管理及數(shù)據(jù)應(yīng)用中存在的問題,提出大數(shù)據(jù)管理分析系統(tǒng)的需求和目標;最后,結(jié)合數(shù)據(jù)管理和分析中的關(guān)鍵技術(shù),構(gòu)建了慣性導(dǎo)航測試系統(tǒng)以數(shù)據(jù)采集層、數(shù)據(jù)支撐層和數(shù)據(jù)應(yīng)用層為3大模塊的大數(shù)據(jù)分析平臺基本框架。為高精度慣性導(dǎo)航系統(tǒng)優(yōu)化設(shè)計、提升精度、保障產(chǎn)品可靠性、合理預(yù)估系統(tǒng)壽命及適應(yīng)未來戰(zhàn)爭提供了發(fā)展思路。
在試驗不變的條件下,重復(fù)試驗多次,隨機事件的頻率近似于它的概率,這是大數(shù)據(jù)定理的基礎(chǔ)。有規(guī)律的隨機事件在大量重復(fù)出現(xiàn)的條件下,往往呈現(xiàn)幾乎必然的統(tǒng)計特性。2010年,《Science》刊登文章指出,雖然人們的出行模式有很大不同,但大多數(shù)是可以預(yù)測的。這意味著能夠根據(jù)個體之前的行為軌跡預(yù)測未來行蹤的可能性,從此開啟了大數(shù)據(jù)理論研究的先河。牛津大學(xué)網(wǎng)絡(luò)學(xué)院互聯(lián)網(wǎng)治理與監(jiān)管專業(yè)教授舍恩伯格在 《大數(shù)據(jù)時代》一書中指出,大數(shù)據(jù)不是隨機樣本,而是全體數(shù)據(jù);不是精確性,而是混雜性;不是因果關(guān)系,而是相關(guān)關(guān)系。在這樣一個數(shù)據(jù)大量產(chǎn)生和積累的時代,從海量的數(shù)據(jù)金礦中發(fā)現(xiàn)暗藏的規(guī)律,就能夠搶占先機,先發(fā)制人。
隨著信息化與工業(yè)化的融合發(fā)展,信息技術(shù)滲透到了工業(yè)企業(yè)產(chǎn)業(yè)鏈的各個環(huán)節(jié)。生產(chǎn)和測試線上高速運轉(zhuǎn)的機器所產(chǎn)生的數(shù)據(jù)量不亞于計算機數(shù)據(jù),數(shù)據(jù)量大,種類多,實時性高。隨著工業(yè)大數(shù)據(jù)的逐漸積累,數(shù)據(jù)挖掘?qū)槠髽I(yè)取得更多的價值,促進企業(yè)進行經(jīng)濟效益提升、安全生產(chǎn)和節(jié)能減排等方面的改進。
時至今日,一款型號慣性導(dǎo)航系統(tǒng)的輸出已由單一數(shù)據(jù)轉(zhuǎn)變?yōu)橛蓴?shù)據(jù)、符號、噪聲等因素多信息的集成。大數(shù)據(jù)分析平臺能夠跨越視覺、文字、語言、圖形、符號、聽覺、音響、噪聲等不同類型的媒體數(shù)據(jù),對現(xiàn)實物理精密結(jié)構(gòu)實體知識、機理、功能、精度、壽命進行統(tǒng)一表征,構(gòu)建現(xiàn)實物理精密結(jié)構(gòu)實體跨媒體知識圖譜、模型、標準、理論,實現(xiàn)跨媒體現(xiàn)實物理精密結(jié)構(gòu)實體的知識演化、推理、預(yù)警、預(yù)測、評價、評估、演繹、饋補、優(yōu)化、簡化,實現(xiàn)數(shù)據(jù)的深度挖掘和物理機理的深入關(guān)聯(lián)理解。因此,利用新興的大數(shù)據(jù)技術(shù)分析高精度慣性導(dǎo)航系統(tǒng)測試數(shù)據(jù)已成為提高測試效率和準確性、實踐和檢驗現(xiàn)代自主智能控制理論、推動慣性技術(shù)應(yīng)用優(yōu)化的必然手段,是慣性導(dǎo)航技術(shù)適應(yīng)現(xiàn)代多維立體交叉戰(zhàn)爭,實現(xiàn)多元裝備自主智能多信息融合協(xié)同精確打擊的有效解決辦法。
當前,我國在高精度慣性導(dǎo)航系統(tǒng)研制仿真測試方面,雖然已經(jīng)取得了長足的進步,但仍存在很多不足,與慣性導(dǎo)航技術(shù)產(chǎn)品的研制需求極不適應(yīng),例如機理不清、模型簡單、精度不高、激勵方法陳舊、流程繁瑣、使用復(fù)雜等諸多關(guān)鍵問題。從技術(shù)上講,高精度慣性導(dǎo)航系統(tǒng)在生產(chǎn)工藝上已經(jīng)將產(chǎn)品的生產(chǎn)精度提高到極致,而目前大部分瓶頸問題在于高精度慣性導(dǎo)航系統(tǒng)測試技術(shù)沒有足夠的計算能力,處理海量數(shù)據(jù)困難,因此,要把這些龐大的工程數(shù)據(jù)利用起來,為數(shù)據(jù)分析提供高性能并行計算是必要的基礎(chǔ)能力。大數(shù)據(jù)是現(xiàn)代信息技術(shù)的重要發(fā)展方向之一,實現(xiàn)大數(shù)據(jù)的共享和分析將為高精度慣性導(dǎo)航系統(tǒng)帶來難以估量的經(jīng)濟價值和工作效率,同時也會對慣性導(dǎo)航技術(shù)發(fā)展產(chǎn)生巨大的推動作用。高精度慣性導(dǎo)航系統(tǒng)有必要順應(yīng)當前趨勢,向著互聯(lián)共享、虛擬化、自動化、模塊化、集成化、綜合化、智能化、網(wǎng)絡(luò)化、協(xié)同化、實戰(zhàn)化、標準化的方向發(fā)展,將海量的測試數(shù)據(jù)加以利用,因此,對高精度慣性導(dǎo)航系統(tǒng)大數(shù)據(jù)測試平臺的建設(shè)需求十分緊迫。
數(shù)據(jù)采集是數(shù)據(jù)挖掘和分析的前提,同時也是分析解決問題,提升產(chǎn)品性能的第一步。
在目前的高精度慣性導(dǎo)航測試過程中,數(shù)據(jù)的采集和應(yīng)用存在嚴峻問題。其中包括:1)數(shù)據(jù)可信度不強。由于測試過程中環(huán)境、操作流程等數(shù)據(jù)沒有完整記錄,導(dǎo)致測試過程中產(chǎn)生的干擾被帶入采集數(shù)據(jù),數(shù)據(jù)的準確性降低,可信度不強。2)數(shù)據(jù)與物理行為映射關(guān)系不清。數(shù)據(jù)的產(chǎn)生受到多種物理行為的影響,在誤差的分析過程中,有限的測試數(shù)據(jù)很難將各種物理因素的影響分離出來,因而在誤差補償過程中物理機理不明確,針對性差。3)全生命周期數(shù)據(jù)采集積累、統(tǒng)籌分析、系統(tǒng)協(xié)同應(yīng)用管理、風險預(yù)測預(yù)判不力。其中,生產(chǎn)、測試和貯存各階段中只關(guān)心階段內(nèi)的數(shù)據(jù),各階段之間銜接不緊密,缺乏全局總體的數(shù)據(jù)觀測,導(dǎo)致風險預(yù)測能力差。4)行業(yè)壁壘嚴重。從元器件到裝配及使用過程中,各部門間數(shù)據(jù)傳遞缺乏,原始數(shù)據(jù)和問題被保留,系統(tǒng)整體性差。這些問題導(dǎo)致慣性系統(tǒng)的物理機械性能測試不準確,進而直接降低高精度慣性導(dǎo)航系統(tǒng)精度、可靠性和儲存壽命。
高精度慣性導(dǎo)航系統(tǒng)測試過程中產(chǎn)生的數(shù)據(jù)具有數(shù)據(jù)量大、類型復(fù)雜多樣及關(guān)聯(lián)性強的特點,如何在這些數(shù)據(jù)之間建立連接,為測試人員提供便捷的數(shù)據(jù)瀏覽界面是測試數(shù)據(jù)分析是否成功的重要因素。若能夠?qū)崿F(xiàn)對全部歷史數(shù)據(jù)的自由追溯查詢,則質(zhì)量過程控制的力度將大幅度提升,實現(xiàn)高精度慣性導(dǎo)航系統(tǒng)不同階段間所有數(shù)據(jù)內(nèi)容的橫縱比對,必然將大幅提升高精度慣性導(dǎo)航系統(tǒng)的測試質(zhì)量和效率。
慣性導(dǎo)航測試系統(tǒng)目前的數(shù)據(jù)處理手段和管理手段已經(jīng)無法適應(yīng)當前高精度慣性導(dǎo)航系統(tǒng)研制的要求,存在的主要問題包括:1)測試數(shù)據(jù)量大,但數(shù)據(jù)采集設(shè)備與數(shù)據(jù)管理服務(wù)器不互連,雖然使用TDM對數(shù)據(jù)進行了處理并存儲在關(guān)系型數(shù)據(jù)庫中,但依然可能導(dǎo)致數(shù)據(jù)不一致性問題。2)數(shù)據(jù)類型多,缺乏統(tǒng)一管理,數(shù)據(jù)導(dǎo)入過程復(fù)雜、效率低,導(dǎo)致數(shù)據(jù)更新的時效性差。3)對于大數(shù)據(jù),無法使用存儲介質(zhì)進行設(shè)備與服務(wù)器之間的數(shù)據(jù)交換,導(dǎo)致大量數(shù)據(jù)浪費。4)數(shù)據(jù)利用率低,分析困難,無法利用大數(shù)據(jù)處理方法來進行高精度慣性導(dǎo)航系統(tǒng)可靠性評估與故障診斷。5)高精度慣性導(dǎo)航系統(tǒng)數(shù)據(jù)處理與分析方法不規(guī)范,共享性差,導(dǎo)致推廣困難,重復(fù)工作。6)數(shù)據(jù)自動判讀的深度與廣度不夠,導(dǎo)致測試覆蓋性不全,容易漏掉產(chǎn)品的質(zhì)量問題。據(jù)統(tǒng)計,一個測試任務(wù)結(jié)束時,往往會產(chǎn)生GB量級的文檔甚至TB量級的測試數(shù)據(jù),這些數(shù)據(jù)的利用還存在著嚴重不足。一方面,數(shù)據(jù)查找非常不方便,測試人員在資料收集上浪費大量時間;另一方面,一旦設(shè)備出現(xiàn)故障,這些數(shù)據(jù)可能會丟失,給企業(yè)帶來損失。
面對高精度慣性導(dǎo)航系統(tǒng)測試過程中產(chǎn)生的諸多問題,大數(shù)據(jù)技術(shù)將成為提升高精度慣性導(dǎo)航系統(tǒng)測試效率和準確性的有效方案。因此,高精度慣性導(dǎo)航系統(tǒng)迫切需要建設(shè)一個高效統(tǒng)一的數(shù)據(jù)管理和分析系統(tǒng),提升測試準確性和效率,完善企業(yè)的知識積累。
在慣性導(dǎo)航測試技術(shù)中主要以精度、可靠性、儲存維修指標和退役指標評價高精度慣性導(dǎo)航系統(tǒng)4類重要的應(yīng)用性能。目前的慣性導(dǎo)航系統(tǒng)數(shù)據(jù)應(yīng)用中,每一類指標的數(shù)據(jù)采集中都存在問題,具體如圖1所示。下面針對高精度慣性導(dǎo)航系統(tǒng)的4類指標,分析慣性導(dǎo)航測試系統(tǒng)數(shù)據(jù)采集中存在的具體問題。
(1)精度
慣性導(dǎo)航測試系統(tǒng)中精度指標包括設(shè)計指標、測試指標、試驗指標和環(huán)境指標。其中,設(shè)計指標來源于高精度慣性導(dǎo)航系統(tǒng)最初的理論設(shè)計,測試指標來源于生產(chǎn)制造過程,試驗指標來源于出廠驗收階段,而環(huán)境指標則來源于應(yīng)用過程。目前,對于各階段精度的測試,指標體系不完善,概念不一致,行業(yè)應(yīng)用存在差異。在行業(yè)體系的上下游指標要求不標準、設(shè)置不規(guī)范不配套、關(guān)系不科學(xué)、標準體系不完善、參數(shù)不配套、量化細化差,導(dǎo)致精度測試數(shù)據(jù)可操作性差。
(2)可靠性
高精度慣性導(dǎo)航系統(tǒng)的可靠性包括穩(wěn)定性、可靠性和壽命3個方面。在高精度慣性導(dǎo)航系統(tǒng)可靠性的測試中,由于測試數(shù)據(jù)有限,小子樣很難對系統(tǒng)的性能有效估計。同時,可靠性的經(jīng)驗公式通常在少量干擾下能夠較準確地預(yù)估,而對于高精度慣性導(dǎo)航系統(tǒng),結(jié)構(gòu)和應(yīng)用環(huán)境復(fù)雜,經(jīng)驗數(shù)據(jù)無法準確估計系統(tǒng)可靠性。在實際測試過程中,可靠性的3個方面通常單獨考慮,而忽略了三者之間的物理聯(lián)系。
(3)儲存壽命
在儲存過程中,高精度慣性導(dǎo)航系統(tǒng)需要滿足功能的可靠性,同時還要求滿足精度指標的穩(wěn)定性。這些性能需要在檢測和維修的數(shù)據(jù)中真實反應(yīng),但目前慣性導(dǎo)航測試系統(tǒng)中對于儲存壽命的判讀缺乏可信度。首先,儲存環(huán)境中各因素對高精度慣性導(dǎo)航系統(tǒng)組件性能的影響因子無法準確確定;其次,缺乏高精度慣性導(dǎo)航系統(tǒng)失效判據(jù),不能判別系統(tǒng)功能的可靠性,更無法判斷系統(tǒng)精度的變化。
(4)退役
在高精度慣性導(dǎo)航系統(tǒng)退役檢測中包括退役、鑒定和評判3項指標,由于數(shù)據(jù)積累較少,3項指標的準確性和完備性不足。對于3項指標標準的完善和統(tǒng)一,仍然需要大量試驗和數(shù)據(jù)的積累。
慣性導(dǎo)航測試系統(tǒng)大數(shù)據(jù)管理分析系統(tǒng)的建立是為了提供并行計算平臺,并且高效地對慣性導(dǎo)航平臺產(chǎn)生的海量測試數(shù)據(jù)進行處理,進而對數(shù)據(jù)進行管理、融合、分析、挖掘,實現(xiàn)慣性導(dǎo)航測試數(shù)據(jù)分析處理的統(tǒng)一化、批量化、自動化、模板化、重用化。如圖2所示,該目標的實現(xiàn)是完善當前高精度慣性導(dǎo)航系統(tǒng)測試,提高其準確性和高效性不可或缺的步驟。
為了高效合理地管控平臺生產(chǎn)的海量測試數(shù)據(jù),需要建立標準統(tǒng)一、體系完善的數(shù)據(jù)中心。多型號全過程產(chǎn)品數(shù)據(jù)中心是要將系列型號產(chǎn)品參數(shù)、系列品種產(chǎn)品參數(shù)生產(chǎn)過程中的原材料性能參數(shù)、物理成型幾何參數(shù)、元器件性能參數(shù)、儀表集成過程參數(shù)、測試試驗激勵參數(shù)、系統(tǒng)集成性能參數(shù)、環(huán)境適應(yīng)性參數(shù)、儲存應(yīng)用過程參數(shù)、功能精度失效參數(shù)等全方位多角度的產(chǎn)品參數(shù)通過測試采集下來,形成融合理論數(shù)據(jù)、設(shè)計數(shù)據(jù)、制造數(shù)據(jù)、測試數(shù)據(jù)、試驗數(shù)據(jù)、應(yīng)用數(shù)據(jù)、失效數(shù)據(jù)等大量數(shù)據(jù)的全參數(shù)媒體數(shù)據(jù)庫;建立完善的指標體系和標準體系,解決試驗測試中精度標準不統(tǒng)一、可操作性差、可靠性分析預(yù)估不準確、儲存環(huán)境影響量化困難、壽命數(shù)據(jù)缺失等核心關(guān)鍵問題。實現(xiàn)數(shù)據(jù)采集存儲格式統(tǒng)一化、歷史數(shù)據(jù)縱向分析和橫向?qū)Ρ扰炕⑵脚_數(shù)據(jù)處理算法重用化、單元測試與總裝測試數(shù)據(jù)判讀自動化、測試判讀報告模塊化,避免數(shù)據(jù)遺漏和缺失,顯著提高數(shù)據(jù)檢索效率,形成各類型號產(chǎn)品數(shù)據(jù)體系的完整 “檔案”,實現(xiàn)準確高效的取用數(shù)據(jù)。
如圖3所示,為了更好地挖掘數(shù)據(jù)價值,有效地積累和利用測試數(shù)據(jù),需要依托數(shù)據(jù)管理分析系統(tǒng)。結(jié)合完備的性能參數(shù)、過程參數(shù),跨越視覺、文字、語言等不同類型的媒體數(shù)據(jù),利用智能動態(tài)優(yōu)化技術(shù),建立慣性導(dǎo)航測試系統(tǒng)大數(shù)據(jù)網(wǎng)絡(luò)媒體推理應(yīng)用平臺,實現(xiàn)數(shù)據(jù)的深度挖掘,實現(xiàn)對現(xiàn)實物理精密結(jié)構(gòu)實體知識、機理、功能、精度、壽命的統(tǒng)一表征,實現(xiàn)數(shù)據(jù)和物理機理的深入關(guān)聯(lián)和理解。
大數(shù)據(jù)網(wǎng)絡(luò)媒體推理應(yīng)用平臺的建設(shè)需要實現(xiàn)測試數(shù)據(jù)的機器學(xué)習、自主學(xué)習、深度學(xué)習和強化學(xué)習,以智能動態(tài)優(yōu)化(IDO)為支撐,利用遺傳算法、粒子群算法、果蠅優(yōu)化算法等先進的數(shù)據(jù)挖掘和分析方法,實現(xiàn)數(shù)據(jù)價值的深入挖掘,從而解決高精度慣性導(dǎo)航系統(tǒng)中表征體系的統(tǒng)一、關(guān)聯(lián)映射的理解和推導(dǎo)、標準體系的優(yōu)化與完善、誤差模型的準確識別和科學(xué)模型的預(yù)估等關(guān)鍵重大問題。
在大數(shù)據(jù)挖掘和機器學(xué)習的基礎(chǔ)上,大數(shù)據(jù)理論可以進一步推進產(chǎn)品設(shè)計改進和性能提升。一方面,依據(jù)對慣性導(dǎo)航系統(tǒng)機理、設(shè)計、生產(chǎn)、測試及應(yīng)用過程中大數(shù)據(jù)的挖掘,可以全面分析系統(tǒng)性能。從產(chǎn)品和型號設(shè)計的角度,可以分析慣性導(dǎo)航系統(tǒng)設(shè)計精度指標分配是否合理,從而在生產(chǎn)過程中對精度的提升有的放矢;從產(chǎn)品和型號的生產(chǎn)角度,可以分析生產(chǎn)和設(shè)計的一致性是否充分發(fā)揮,機械和電氣系統(tǒng)是否滿足兼容性的要求,從而完善設(shè)計方案;從產(chǎn)品和型號的應(yīng)用角度,可以分析系統(tǒng)機動性能、準備時長、使用精度等性能是否滿足實際需求。另一方面,相對于過去的樣本代替全體的統(tǒng)計方法,大數(shù)據(jù)將使用全局的數(shù)據(jù),統(tǒng)計出來的結(jié)果更為準確。這樣,利用大數(shù)據(jù)平臺將慣性導(dǎo)航系統(tǒng)的設(shè)計、生產(chǎn)和應(yīng)用環(huán)節(jié)緊密聯(lián)系,實現(xiàn)一體化。
基于這樣的高精度慣性導(dǎo)航系統(tǒng)大數(shù)據(jù)管理分析系統(tǒng)框架,一方面,從基本原理的角度可以構(gòu)建現(xiàn)實物理精密結(jié)構(gòu)實體跨媒體知識圖譜、模型、標準、理論,實現(xiàn)跨媒體現(xiàn)實物理精密結(jié)構(gòu)實體的知識演化、推理、預(yù)警、預(yù)測、評價、評估、演繹、饋補、優(yōu)化、簡化;另一方面,從實戰(zhàn)應(yīng)用的角度可以實現(xiàn)現(xiàn)代自主智能控制理論驗證和實踐,從而推動慣性技術(shù)應(yīng)用優(yōu)化,適應(yīng)現(xiàn)代多維立體交叉戰(zhàn)爭中多元裝備自主智能多信息融合協(xié)同精確打擊模式的需求。因此,高精度慣性導(dǎo)航系統(tǒng)測試技術(shù)中大數(shù)據(jù)管理分析平臺的建立是深入理解數(shù)據(jù)物理機理、優(yōu)化系統(tǒng)設(shè)計、提高精度、提升產(chǎn)品可靠性及準確預(yù)估系統(tǒng)壽命等慣性導(dǎo)航關(guān)鍵技術(shù)的必經(jīng)之路。
為了實現(xiàn)高效地慣性導(dǎo)航系統(tǒng)數(shù)據(jù)管理,分析和挖掘體系,需要高精度慣性導(dǎo)航系統(tǒng)全壽命周期測試大數(shù)據(jù)平臺。其中,應(yīng)用的大數(shù)據(jù)關(guān)鍵技術(shù)包括大數(shù)據(jù)形成技術(shù)、大數(shù)據(jù)分析技術(shù)、大數(shù)據(jù)應(yīng)用技術(shù)和大數(shù)據(jù)資源統(tǒng)籌共享技術(shù)這4個方面。
高精度慣性導(dǎo)航系統(tǒng)大數(shù)據(jù)的形成是大數(shù)據(jù)數(shù)據(jù)庫建立的源頭,是數(shù)據(jù)分析和挖掘的基礎(chǔ)[5-6],數(shù)據(jù)的形成需要保證數(shù)據(jù)的可靠性和完備性??煽啃詮臏y試機理、測試方法、測試激勵和測試采集的過程中都要嚴格把關(guān),保證每個環(huán)節(jié)數(shù)據(jù)真實有效地反映慣導(dǎo)系統(tǒng)的性能。完備性要記錄和保留高精度慣性導(dǎo)航系統(tǒng)從研制、生產(chǎn)、驗收和應(yīng)用各環(huán)節(jié)的測試數(shù)據(jù),形成完整的測試鏈條,建立產(chǎn)品和型號的完備檔案。
為實現(xiàn)針對高精度慣性導(dǎo)航系統(tǒng)海量測試數(shù)據(jù)的有效利用分析,采用以Hadoop為基礎(chǔ)的并行大數(shù)據(jù)計算分析平臺,進而實現(xiàn)高精度慣性導(dǎo)航系統(tǒng)測試數(shù)據(jù)的管理、分析、挖掘,完成平臺的可靠性預(yù)測與故障診斷等功能。
針對航天大數(shù)據(jù)的特點和處理需求,目前較多采用分布式文件系統(tǒng)來存儲航天數(shù)據(jù)。將數(shù)據(jù)存儲在物理上分散的多個節(jié)點上,對這些資源進行統(tǒng)一的管理和分配,并向用戶提供文件系統(tǒng)訪問接口,可以解決本地文件系統(tǒng)在大小、文件數(shù)量和打開文件數(shù)等方面受限的問題。
在高精度慣性導(dǎo)航系統(tǒng)測試數(shù)據(jù)存儲方面,為面對不斷增長的平臺測試數(shù)據(jù)量及分析需求,可采用HDFS分布式數(shù)據(jù)存儲代替?zhèn)鹘y(tǒng)的以O(shè)rcale為代表的單點存儲模式。HDFS為流式數(shù)據(jù)訪問,可以一次寫入,多次讀取,數(shù)據(jù)通常由數(shù)據(jù)源生成或從數(shù)據(jù)源復(fù)制而來,非常適合當前高精度慣性導(dǎo)航系統(tǒng)產(chǎn)生的海量數(shù)據(jù)存儲與分析[7-9]。
在高精度慣性導(dǎo)航系統(tǒng)測試數(shù)據(jù)分析方面,Hive技術(shù)提供了一種類SQL語言(HiveQL),可以查詢存儲在HDFS中的數(shù)據(jù)。高精度慣性導(dǎo)航系統(tǒng)大數(shù)據(jù)分析可視為一種數(shù)據(jù)倉儲應(yīng)用程序,而傳統(tǒng)的數(shù)據(jù)倉儲往往使用SQL作為查詢語言。Hive降低了在HDFS上進行慣性導(dǎo)航測試數(shù)據(jù)查詢的難度,更便于開發(fā)人員進行數(shù)據(jù)庫設(shè)計和業(yè)務(wù)分析[10-12]。
在高精度慣性導(dǎo)航系統(tǒng)大數(shù)據(jù)分析結(jié)果展示以及用戶交互方面,基于JEE+Structs2的Web前端技術(shù)可以用來與Hive以及HDFS進行無縫連接。利用當前廣泛使用的JDBC數(shù)據(jù)操作技術(shù),測試人員可以方便地上傳慣性導(dǎo)航平臺測試數(shù)據(jù)到分布式系統(tǒng),并進行存儲分析,分析結(jié)果也可以通過Web頁面方便快速地瀏覽。
高精度慣性導(dǎo)航系統(tǒng)大數(shù)據(jù)測試分析過程中,針對系統(tǒng)數(shù)據(jù)所涉及的挖掘算法是測試過程的核心[13-18],算法模型的普適性、擴展性、容錯性是設(shè)計過程中必須考慮的要素。高精度慣性導(dǎo)航系統(tǒng)測試數(shù)據(jù)挖掘目標是從海量的測試數(shù)據(jù)中通過算法搜索出數(shù)據(jù)中的隱藏信息,再將這些信息用于指導(dǎo)高精度慣性導(dǎo)航系統(tǒng)的生產(chǎn)測試過程,這一過程可以被視為高精度慣性導(dǎo)航系統(tǒng)中的自動化故障診斷。高精度慣性導(dǎo)航系統(tǒng)測試數(shù)據(jù)的分析挖掘較適合使用基于統(tǒng)計的故障診斷方法,該方法以統(tǒng)計學(xué)和人工智能為技術(shù)基礎(chǔ),不需要提供除數(shù)據(jù)以外的任何先驗知識,采用從數(shù)據(jù)中提取的客觀規(guī)則對問題的不確定性進行描述,將大量數(shù)據(jù)融合成有序的層次化故障診斷知識。
故障診斷與健康預(yù)測是一個復(fù)雜的過程,牽涉到大量的試驗數(shù)據(jù)與復(fù)雜的計算模型。故障診斷算法通常與設(shè)計、制造、裝配以及維護保障等工作緊密結(jié)合,核心是對特定模型進行描述、歸納形成故障模式集。該集合可具備多種形態(tài),如先驗知識集、邏輯規(guī)則集、設(shè)備功能模型集等,分別從專家經(jīng)驗、設(shè)備運行過程以及設(shè)備數(shù)學(xué)模型等角度挖掘故障模式。
航天數(shù)據(jù)安全是一個復(fù)雜而重要的問題,軍用航天中的關(guān)鍵數(shù)據(jù)通常采用加解密方式傳輸[19-20]。而大數(shù)據(jù)系統(tǒng)通常是分布式的網(wǎng)絡(luò)系統(tǒng),雖然具有數(shù)據(jù)高效共享的優(yōu)點,但在數(shù)據(jù)安全方面卻存在一定隱患。大數(shù)據(jù)的特點必然會給加解密方式帶來新的挑戰(zhàn),但也有一些相應(yīng)的可行方案,如利用大數(shù)據(jù)的數(shù)據(jù)價值密度低的特點,在續(xù)傳輸?shù)南嗤瑤瑘D像中插入少量的密文,從而大幅提高數(shù)據(jù)的安全性。
結(jié)合數(shù)據(jù)存儲、數(shù)據(jù)分析、數(shù)據(jù)展示、挖掘算法和數(shù)據(jù)安全這5個方面,可以初步構(gòu)架大數(shù)據(jù)平臺框架,如圖4所示。
在初步設(shè)計框架基礎(chǔ)上,應(yīng)在后續(xù)工作中逐步完善慣性導(dǎo)航測試系統(tǒng)數(shù)據(jù)分析挖掘功能,完成高精度慣性導(dǎo)航系統(tǒng)數(shù)據(jù)分析的遠期規(guī)劃,最終將高精度慣性導(dǎo)航系統(tǒng)大數(shù)據(jù)分析平臺應(yīng)用在生產(chǎn)實踐中,實現(xiàn)高精度慣性導(dǎo)航系統(tǒng)測試的自動化故障診斷,幫助測試人員快速提高測試效率和準確度。
大數(shù)據(jù)分析系統(tǒng)的整體框架包括多源數(shù)據(jù)采集層、數(shù)據(jù)平臺支撐層和數(shù)據(jù)平臺應(yīng)用層3大數(shù)據(jù)模塊[21-22],如圖5所示。在多源數(shù)據(jù)采集層中,測試設(shè)備將各類測試數(shù)據(jù)采集匯入網(wǎng)絡(luò)數(shù)據(jù)交換設(shè)備,通過數(shù)據(jù)預(yù)處理傳遞給數(shù)據(jù)平臺支撐層。平臺支撐層將數(shù)據(jù)存儲進入數(shù)據(jù)庫,并完成數(shù)據(jù)備份與修復(fù)。最后,當數(shù)據(jù)平臺應(yīng)用層發(fā)送數(shù)據(jù)請求,數(shù)據(jù)平臺支撐層通過數(shù)據(jù)流準確快速地將數(shù)據(jù)傳遞給平臺應(yīng)用層。數(shù)據(jù)平臺應(yīng)用層一方面通過數(shù)據(jù)統(tǒng)計和分析生成形式多樣、可讀性好的判讀報告,另一方面通過數(shù)據(jù)挖掘、機器學(xué)習、人工智能等手段分析系統(tǒng)性能,為產(chǎn)品質(zhì)量的提升、高精度慣性導(dǎo)航系統(tǒng)精度的提高打下基礎(chǔ)。
在高精度慣性導(dǎo)航系統(tǒng)應(yīng)用及儲存過程中,通過完整的大數(shù)據(jù)處理平臺可以實現(xiàn)長期的監(jiān)測慣性導(dǎo)航系統(tǒng)的健康檢測和故障診斷。對于平臺使用數(shù)據(jù)的異常能夠由頂層到底層精確溯源,異常部位準確判斷,快速精準解決問題,從而實現(xiàn)故障監(jiān)測的及時性、早期故障檢測的靈敏性、故障定位和評價的準確性及故障診斷的魯棒性[23]。
大數(shù)據(jù)資源統(tǒng)籌共享技術(shù)要求在保證數(shù)據(jù)安全的基礎(chǔ)上,數(shù)據(jù)形成過程中的參與者打破壁壘,建立數(shù)據(jù)云,形成共享。數(shù)據(jù)共享平臺通常采用分布式系統(tǒng)構(gòu)架,由一個數(shù)據(jù)總中心和若干分中心組成,從而實現(xiàn)數(shù)據(jù)整合、數(shù)據(jù)交換和數(shù)據(jù)共享,形成資源統(tǒng)籌共享服務(wù)網(wǎng)絡(luò)[24-25]。數(shù)據(jù)的采集、集成和整合由車間、研究所、控制系統(tǒng)、總裝測試和靶場測試等底層元數(shù)據(jù)單元完成,并上傳至分中心。各階段用戶通過數(shù)據(jù)總中心索引分中心數(shù)據(jù),形成數(shù)據(jù)多點互通。
對于底層元數(shù)據(jù)單元,數(shù)據(jù)的加工處理規(guī)范化,形成包含數(shù)據(jù)標識信息、內(nèi)容信息、時間和空間覆蓋信息、人員和權(quán)責信息、關(guān)聯(lián)信息、技術(shù)信息等各個方面信息的結(jié)構(gòu)化數(shù)據(jù),便于用戶檢索查找[26]。
本文依據(jù)高精度慣性導(dǎo)航測試系統(tǒng)數(shù)據(jù)采集和數(shù)據(jù)管理中存在的大量嚴峻問題,分析了大數(shù)據(jù)在慣性導(dǎo)航測試系統(tǒng)中的使用需求。結(jié)合數(shù)據(jù)分析中數(shù)據(jù)采集、數(shù)據(jù)存儲、數(shù)據(jù)分析、數(shù)據(jù)展示、挖掘算法、數(shù)據(jù)安全的關(guān)鍵技術(shù),構(gòu)建了慣性導(dǎo)航測試系統(tǒng)以多源數(shù)據(jù)采集層、數(shù)據(jù)平臺支撐層和數(shù)據(jù)平臺應(yīng)用層為3大模塊的大數(shù)據(jù)分析平臺基本框架。利用大數(shù)據(jù)資源統(tǒng)籌共享技術(shù)進行數(shù)據(jù)挖掘和決策分析,從而優(yōu)化產(chǎn)品應(yīng)用。大數(shù)據(jù)平臺為高精度慣性導(dǎo)航系統(tǒng)優(yōu)化設(shè)計、提升精度、保障產(chǎn)品可靠性、合理預(yù)估系統(tǒng)壽命及適應(yīng)未來戰(zhàn)爭提供了重要支撐,當以重視。
[1]張炎華,王立端,戰(zhàn)興群,等.慣性導(dǎo)航技術(shù)的新進展及發(fā)展趨勢[J]. 中國造船, 2008, 49(s1): 134-144.ZHANG Yan-hua, WANG Li-duan, ZHAN Xing-qun, et al.The new advancement and trend of inertial navigation technology [J].Shipbuilding of China, 2008, 49(s1):134-144.
[2] 周世勤.新型慣性技術(shù)的發(fā)展[J].飛航導(dǎo)彈,2001(6): 70-77.ZHOU Shi-qin.The development of new types of inertial technology [J].Aerodynamic Missile Journal, 2001(6):70-77.
[3]謝世富.導(dǎo)航技術(shù)與系統(tǒng)發(fā)展述評[J].電子質(zhì)量,1995(1): 9-16.XIE Shi-fu.The development overview of inertial technol-ogy and system [J].Electronics Quality, 1995(1): 9-16.
[4]薛連莉,陳少春,陳效真.2016年國外慣性技術(shù)發(fā)展與回顧[J]. 導(dǎo)航與控制, 2017, 16(3): 105-112+84.XUE Lian-li, CHEN Shao-chun, CHEN Xiao-zhen.Development and review of foreign inertial technology in 2016[J].Navigation and Control, 2017, 16(3): 105-112+84.
[5]李水平,陳意云,黃劉生.數(shù)據(jù)采掘技術(shù)回顧[J].小型微型計算機系統(tǒng), 1998, 19(4): 74-81.LI Shui-ping, CHEN Yi-yun, HUANG Liu-sheng.A technology overview of data mining [J].Journal of Chinese Computer Systems, 1998, 19(4): 74-81.
[6]韓京宇,徐立臻,董逸生.數(shù)據(jù)質(zhì)量研究綜述[J].計算機科學(xué), 2008, 35(2): 1-5+12.HAN Jing-yu, XU Li-zhen, DONG Yi-sheng. An overview of data quality research [J].Computer Science,2008, 35(2): 1-5+12.
[7]唐箭.云存儲系統(tǒng)的分析與應(yīng)用研究[J].電腦知識與技術(shù), 2009, 5(20): 5337-5338+5340.TANG Jian.Research and application of the cloud computation storage system [J].Computer Knowledge and Technology, 2009, 5(20): 5337-5338+5340.
[8]陳全,鄧倩妮.云計算及其關(guān)鍵技術(shù)[J].計算機應(yīng)用, 2009, 29(9): 2562-2567.CHEN Quan,DENG Qian-ni.Cloud computing and its key techniques [J].Journal of Computer Applications,2009, 29(9): 2562-2567.
[9]羅春榮.國外網(wǎng)絡(luò)數(shù)據(jù)庫:當前特點與發(fā)展趨勢[J].中國圖書館學(xué)報, 2003, 29(3): 44-47.LUO Chun-rong.Online databases in foreign countries:present characteristics and development trends[J].Journal of Library Science in China, 2003, 29(3): 44-47.
[10]高翔,王勇.數(shù)據(jù)融合技術(shù)綜述[J].計算機測量與控制, 2002, 10(11): 706-709.GAO Xiang,WANG Yong.Survey of multisensor information fusion [J].Computer Measurement & Control,2002, 10(11): 706-709.
[11]林士敏,田鳳占,陸玉昌.用于數(shù)據(jù)采掘的貝葉斯分類器研究[J]. 計算機科學(xué), 2000, 27 (10):73-76.LIN Shi-min, TIAN Feng-zhan, LU Yu-chang.Studies on Bayesian classifier in data mining [J].Computer Science, 2000, 27(10): 73-76.
[12]胡金星,吳煥萍,潘懋,等.基于格網(wǎng)劃分的海量DEM數(shù)據(jù)生成[J].計算機輔助設(shè)計與圖形學(xué)學(xué)報,2004, 16(1): 41-44.HU Jin-xing, WU Huan-ping, PAN Mao, et al.Massive DEM creation with grid partitioning approach [J].Journal of Computer Aided Design & Computer Graphics,2004, 16(1): 41-44.
[13]黃解軍,潘和平,萬幼川.數(shù)據(jù)挖掘技術(shù)的應(yīng)用研究[J]. 計算機工程與應(yīng)用, 2003, 39(2): 45-48.HUANG Jie-jun, PAN He-ping, WAN You-chuan.Application research on the technology of data mining [J].Computer Engineering and Applications, 2003, 39(2):45-48.
[14]汪明.數(shù)據(jù)挖掘綜述[J].河北軟件職業(yè)技術(shù)學(xué)院學(xué)報, 2001, 14(1): 48-55.WANG Ming.Survey of data mining [J].Journal of Hebei Software Institute, 2001, 14(1): 48-55.
[15]談恒貴,王文杰,李游華.數(shù)據(jù)挖掘分類算法綜述[J]. 微型機與應(yīng)用, 2005, 24(2): 4-6+9.TAN Heng-gui, WANG Wen-jie, LI You-hua.An overview of data mining sorting algorithms[J].Microcomputer & Its Applications, 2005, 24(2): 4-6+9.
[16]呂安民,林宗堅,李成名.數(shù)據(jù)挖掘和知識發(fā)現(xiàn)的技術(shù)方法[J]. 測繪科學(xué), 2000, 25(4): 36-39.LV An-min, LIN Zong-jian, LI Cheng-ming.Technique methods of data mining and KDD [J].Developments in Surveying and Mapping, 2000, 25(4): 36-39.
[17]張雪英.國外先進數(shù)據(jù)挖掘工具的比較分析[J].計算機工程, 2003, 29(16): 1-3.ZHANG Xue-ying.Analysis and comparison of overseas leading data mining tools [J].Computer Engineering,2003, 29(16): 1-3.
[18]馬江洪,張文修,徐宗本.數(shù)據(jù)挖掘與數(shù)據(jù)庫知識發(fā)現(xiàn): 統(tǒng)計學(xué)的觀點[J]. 工程數(shù)學(xué)學(xué)報, 2002, 19(1):1-13.MA Jiang-hong, ZHANG Wen-xiu, XU Zong-ben.Data mining and knowledge discovery in database:a statistical viewpoint[J].Chinese Journal of Engineering Mathematics, 2002, 19(1): 1-13.
[19]周水庚,李豐,陶宇飛,等.面向數(shù)據(jù)庫應(yīng)用的隱私保護 研 究 綜 述 [J]. 計 算 機 學(xué) 報, 2009, 32(5):847-861.ZHOU Shui-geng, LI Feng, TAO Yu-fei, et al.Privacy preservation in database applications: a survey [J].Chinese Journal of Computers, 2009, 32(5): 847-861.
[20]張云勇,陳清金,潘松柏,等.云計算安全關(guān)鍵技術(shù)分析[J]. 電信科學(xué), 2010, 26(9): 64-69.ZHANG Yun-yong, CHEN Qing-jin, PAN Song-bai, et al.Key security technologies on cloud computing [J].Telecommunications Science, 2010, 26(9): 64-69.
[21]李敏強,紀仕光,陳富贊,等.數(shù)據(jù)倉庫系統(tǒng)的結(jié)構(gòu)與設(shè)計研究[J]. 決策與決策支持系統(tǒng), 1997, 7(2):23-31.LI Min-qiang, JI Shi-guang, CHEN Fu-zan, et al.Date warehouse architecture and system design [J].Journal of Decision and Decision Support Systems, 1997, 7(2): 23-31.
[22]錢曉江.物流信息系統(tǒng)體系結(jié)構(gòu)[J].東南大學(xué)學(xué)報(自然科學(xué)版), 2001, 31(6): 40-44.QIAN Xiao-jiang.Architecture design of logistics information system [J].Journal of Southeast University (Natural Science Edition), 2001, 31(6): 40-44.
[23]王宏鼎,童云海,譚少華,等.異常點挖掘研究進展[J]. 智能系統(tǒng)學(xué)報, 2006, 1(1): 67-73.WANG Hong-ding, TONG Yun-hai, TAN Shao-hua, et al.Research progress on outlier mining [J].CAAI Transactions on Intelligent Systems, 2006, 1(1): 67-73.
[24]王常力.分布式控制系統(tǒng)的現(xiàn)狀與發(fā)展[J].電氣時代, 2004(1): 82-86.WANG Chang-li.The status and development of distributed computer control dystems [J].Electric Age, 2004(1): 82-86.
[25]蔣良孝,蔡之華.分布式數(shù)據(jù)挖掘研究[J].計算機與現(xiàn)代化, 2002(9): 4-7.JIANG Liang-xiao,CAI Zhi-hua.The research of the distributed data mining [J].Computer and Modernization,2002(9): 4-7.
[26]連立貴,金鳳,蔡家楣.數(shù)據(jù)倉庫中的數(shù)據(jù)提?。跩].計算機工程, 2001, 27(9): 61-62+99.LIAN Li-gui, JIN Feng, CAI Jia-mei.Data extraction in data warehouse [J].Computer Engineering, 2001, 27(9): 61-62+99.