崔家連,饒世鈞
(海軍大連艦艇學院,遼寧 大連 116018)
隨著水面艦艇編隊偵察預(yù)警手段多樣化,情報收集能力大幅提升,情報處理能力的發(fā)展卻滯后于情報的收集能力,情報優(yōu)勢不能及時轉(zhuǎn)變?yōu)闆Q策優(yōu)勢。未來水面艦艇編隊作戰(zhàn)樣式,必然是基于信息網(wǎng)絡(luò)的一體化作戰(zhàn)樣式,地理空間上涵蓋陸、海、空、天,物理空間上涵蓋聲、光、電、磁、網(wǎng),導(dǎo)致情報數(shù)據(jù)多源異構(gòu)類型復(fù)雜。高通量、高分辨率傳感器和網(wǎng)絡(luò)技術(shù)手段的廣泛運用,導(dǎo)致偵察情報中圖像情報高清化,并且由于傳感器自身、人為因素、偽裝欺騙、氣象環(huán)境影響等原因,導(dǎo)致情報中存在大量重復(fù)、虛假、沖突、孤立數(shù)據(jù),影響情報分析結(jié)果的準確性和時效性。如何構(gòu)建一個智能化、自動化的情報處理平臺,縮短從傳感器到艦載武器的響應(yīng)時間,對未來水面艦艇編隊遂行防空反導(dǎo)、遠程打擊等任務(wù)有著重要的意義,也是奪取??湛刂茩?quán)的關(guān)鍵因素。
大數(shù)據(jù)時代,信息技術(shù)賦予了情報科學新的內(nèi)涵,著力發(fā)展專業(yè)型、計算型、戰(zhàn)略型、政策型和方法型等“五型融合”的情報研究新范式。本文將重點探究大數(shù)據(jù)技術(shù)在艦艇編隊情報組織運用中的應(yīng)用問題,并探討相應(yīng)的解決方案。
通常認為,大數(shù)據(jù)有4 個特點:數(shù)據(jù)量大(Volume)、數(shù)據(jù)類型繁多(Variety)、處理速度快(Velocity)和價值密度低(Value),即“4V”特征。在艦艇編隊情報領(lǐng)域主要表現(xiàn)出以下幾個特點(圖1):
圖1 艦艇編隊情報數(shù)據(jù)特點
(1)數(shù)據(jù)量大。在長期軍事訓(xùn)練和作戰(zhàn)行動的背景下,艦艇編隊已經(jīng)積累電子偵察、氣象水文等大量歷史數(shù)據(jù);岸基、空基、天基等各類偵察預(yù)警手段,源源不斷的產(chǎn)生海量數(shù)據(jù),水面艦艇編隊情報數(shù)據(jù)量已經(jīng)從TB 過渡到PB 級。
(2)數(shù)據(jù)類型繁多。無人機、預(yù)警機、衛(wèi)星、艦載傳感器等手段協(xié)同探測,艦艇編隊情報涵蓋了圖像情報、信號情報、測量與特征情報、技術(shù)情報等多種情報類型。其中,結(jié)構(gòu)化數(shù)據(jù)有AIS、電子偵察數(shù)據(jù)、雷達目標數(shù)據(jù)等;非結(jié)構(gòu)化數(shù)據(jù)有可見光圖像、紅外圖像、視頻、上級通報等。各種數(shù)據(jù)數(shù)據(jù)類型、位置精度、延時周期、來源層次等方面均存在較大差異。
(3)處理速度快。不同于傳統(tǒng)情報數(shù)據(jù)的“數(shù)據(jù)包”形式,大數(shù)據(jù)時代情報數(shù)據(jù)更多來源于各類傳感器、偵察設(shè)備產(chǎn)生的“流”數(shù)據(jù)。面對不斷產(chǎn)生的新數(shù)據(jù),為了避免“獲取即過時”的尷尬局面,大數(shù)據(jù)環(huán)境下艦艇編隊情報工作必須快速響應(yīng),在動態(tài)環(huán)境中完成數(shù)據(jù)獲取與分析工作,確保情報分析結(jié)果的時效性。
(4)價值密度低。艦艇編隊數(shù)據(jù)量增長的同時,有效、可用的有效信息比例卻在下降。編隊預(yù)警探測設(shè)備自身因素、人為因素、復(fù)雜電磁環(huán)境等原因,導(dǎo)致編隊情報數(shù)據(jù)中出現(xiàn)大量重復(fù)、缺失、沖突、孤立數(shù)據(jù)。同時敵方欺騙干擾、偽裝佯動更加使得獲取的數(shù)據(jù)虛實難辨、真假混雜。
大數(shù)據(jù)條件下,艦艇編隊情報工作處于一個全新的數(shù)據(jù)生態(tài)系統(tǒng),給情報工作帶來了深刻的影響,數(shù)據(jù)獲取、分析、使用模式與以往大為不同,使得情報工作的思維必須轉(zhuǎn)變以適應(yīng)新的形勢(圖2):
圖2 大數(shù)據(jù)條件下情報思維的變化
(1)采樣思維到全樣本思維的轉(zhuǎn)變。情報工作正在從隨機采樣分析轉(zhuǎn)變?yōu)槿珮颖緮?shù)據(jù)分析,尤其是在遠海作戰(zhàn)條件下,交戰(zhàn)區(qū)域存在大量中立、民用目標,必須對全部數(shù)據(jù)進行分析,以破除“情報迷霧”。
(2)因果關(guān)系到相關(guān)性關(guān)系的轉(zhuǎn)變。情報分析的邏輯基礎(chǔ),從嚴密的因果關(guān)系推理,轉(zhuǎn)變?yōu)槠驅(qū)ふ蚁嚓P(guān)性關(guān)系。這是因為在海量的情報數(shù)據(jù)中尋找到因果關(guān)系需要采取擬合算法和模擬推演,時間代價較大。例如,美國雷神公司通過大數(shù)據(jù)分析,發(fā)現(xiàn)某國潛艇在某一海域活動時,該國反潛巡邏機即不出現(xiàn)在這一海域,進而摸出了該國潛艇活動規(guī)律。
(3)注重精確到注重效率的轉(zhuǎn)變。以往由于采取采樣而非全樣的方法,局部微小的誤差放大到數(shù)據(jù)全集就可能導(dǎo)致情報分析結(jié)果出現(xiàn)致命的方向性錯誤。所以,以往的情報分析注重追求算法的精確性。但是由于采取全樣本數(shù)據(jù)分析,大數(shù)據(jù)條件下局部錯誤不會被方法放大,由追求精確性轉(zhuǎn)變?yōu)樽非笮市裕踔量梢赃_到“秒級”響應(yīng)。
(4)單一來源到多源融合的轉(zhuǎn)變。在情報大數(shù)據(jù)時代,情報數(shù)據(jù)的信息粒度日益細小,數(shù)據(jù)碎片化現(xiàn)象日益明顯。橫看成嶺側(cè)成峰,不同來源的數(shù)據(jù)可能從不同角度揭露不同的真相。通過將多源異構(gòu)數(shù)據(jù)匯聚成統(tǒng)一結(jié)構(gòu)的數(shù)據(jù)集合,將大量相關(guān)數(shù)據(jù)聚合到一起,經(jīng)過數(shù)據(jù)清洗和互補,可以更好地揭示數(shù)據(jù)之間的關(guān)系,預(yù)測發(fā)展趨勢,提升判情的準確性。
大數(shù)據(jù)條件下,艦艇編隊情報分析流程更加注重情報數(shù)據(jù)的采集、分析、處理,數(shù)據(jù)是整個情報組織運用中的核心與基礎(chǔ)。傳統(tǒng)情報分析流程與大數(shù)據(jù)條件下情報分析流程對比如圖3所示。
圖3 傳統(tǒng)情報流程與大數(shù)據(jù)環(huán)境下情報流程對比
信息始終是情報的基礎(chǔ),這一點無論是在傳統(tǒng)流程中還是在大數(shù)據(jù)流程中都沒有改變,信息搜集始終是情報工作中一個重要內(nèi)容。但是在大數(shù)據(jù)條件下,信息的搜集更加強調(diào)對于批量數(shù)據(jù)的自動獲取,而不是傳統(tǒng)的尋找稀疏的秘密信息。
從流程對比中可以明顯看出,大數(shù)據(jù)條件下多出了信息融合與數(shù)據(jù)清洗環(huán)節(jié)。這是由于大數(shù)據(jù)環(huán)境下,情報加工與傳統(tǒng)流程相比內(nèi)容上發(fā)生較大變化。一方面,當前艦艇編隊情報數(shù)據(jù)環(huán)境發(fā)生較大變化,數(shù)據(jù)多源異構(gòu)、類型復(fù)雜,一種數(shù)據(jù)只能揭示一個方面或者幾個方面的內(nèi)容;另一方面,將多種信息融合到一起,能夠更加全面的展示事物的本質(zhì)和潛在規(guī)律。
水面艦艇編隊情報處理平臺總體架構(gòu)設(shè)計,首先需要立足于編隊海量異構(gòu)情報的分析應(yīng)用需求,基于Hadoop平臺強大的異構(gòu)數(shù)據(jù)處理能力,利用分布式文件系統(tǒng)HDFS(Hadoop Distributed File System)和大數(shù)據(jù)集處理MapReduce 架構(gòu),構(gòu)建經(jīng)濟、高效、可靠的處理集群;其次,為解決廣泛獲取的數(shù)據(jù)獲得的信息優(yōu)勢與同時造成的決策劣勢之間的矛盾,基于大數(shù)據(jù)全樣本分析的優(yōu)勢,將分布式數(shù)據(jù)庫中的全局數(shù)據(jù)進行閱讀、識別、抽取、關(guān)聯(lián)、分析和理解,各集群進行并行處理,深度挖掘分析數(shù)據(jù)之間的關(guān)聯(lián)性和隱藏的潛在規(guī)律,去偽存真,消減戰(zhàn)場的不確定性;最后,為了增強平臺的魯棒性和靈敏性,平臺采取綜合化、一體化、層次化的開放式系統(tǒng)架構(gòu),上層結(jié)構(gòu)指導(dǎo)下層運行,下層結(jié)構(gòu)為上層結(jié)構(gòu)提供功能支撐,各模塊功能上相互獨立,業(yè)務(wù)上相互協(xié)同,標準化接口設(shè)計,實現(xiàn)即插即用和無縫銜接。
系統(tǒng)整體采用面向服務(wù)的分布式的體系結(jié)構(gòu),編隊各成員之間可以共享情報數(shù)據(jù),具備分布式的存儲和計算能力;面向服務(wù)是著眼于編隊靈活編組的需求,單個成員或系統(tǒng)的更新不必影響編隊整體的情報處理能力,具備較強的容災(zāi)備份能力,整體架構(gòu)如圖4所示。
圖4 基于大數(shù)據(jù)的艦艇編隊情報處理平臺體系架構(gòu)
基礎(chǔ)資源層是是整個平臺運行的基礎(chǔ),包括數(shù)據(jù)資源和基礎(chǔ)設(shè)施兩部分?;A(chǔ)設(shè)施提供整個平臺建立和運行所必須的存儲、計算、通信等基礎(chǔ)設(shè)施資源和調(diào)度、管理、監(jiān)控所需的軟件資源;數(shù)據(jù)資源將各探測預(yù)警分系統(tǒng)的數(shù)據(jù)整合為一體,提供結(jié)構(gòu)、維度統(tǒng)一的數(shù)據(jù)資源,具備數(shù)據(jù)的搜集和整合能力。
信息支撐層為平臺提供大數(shù)據(jù)運算的環(huán)境,主要分為軟件支撐和信息服務(wù)兩部分。軟件支撐搭建了大數(shù)據(jù)運算的平臺,SQL/NoSQL 數(shù)據(jù)庫用于提供編隊海量異構(gòu)數(shù)據(jù)的存儲和管理模塊,Hadoop、Spark、Storm 為平臺提供了分布式處理環(huán)境。信息服務(wù)則是為平臺的構(gòu)建和運行提供功能性的模塊支持,包括數(shù)據(jù)預(yù)處理、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)校驗、融合處理等信息服務(wù)。
情報服務(wù)層則是在信息支撐層提供的協(xié)同和共享環(huán)境中,依托各功能模塊,實現(xiàn)特定的情報處理功能并生成相應(yīng)的情報產(chǎn)品。情報服務(wù)層包括綜合情報、作戰(zhàn)情報、目標情報、動向情報、情報態(tài)勢、情報服務(wù)等情報產(chǎn)品,為各類情報產(chǎn)品的生成提供服務(wù)。
指揮決策層是基于情報服務(wù)層生成的相關(guān)情報產(chǎn)品,面向具體情報作戰(zhàn)應(yīng)用的功能實現(xiàn)層。主要功能包括為海戰(zhàn)場偵察監(jiān)視、兩棲編隊海上作戰(zhàn)、對海/ 陸打擊等作戰(zhàn)行動和行為預(yù)測、態(tài)勢共享、指揮控制等提供情報保障。
基于大數(shù)據(jù)的水面艦艇編隊情報處理平臺系統(tǒng)運行流程如圖5所示。不同于以往以平臺為中心或自上而下垂直的“煙囪式”結(jié)構(gòu),整個運行流程以數(shù)據(jù)為中心,數(shù)據(jù)在不同系統(tǒng)不同平臺之間流轉(zhuǎn),貫穿“偵—控—打—評”全過程,將戰(zhàn)術(shù)、技術(shù)和裝備有機結(jié)合。
圖5 基于大數(shù)據(jù)的艦艇編隊情報處理平臺運行流程
根據(jù)不同類型作戰(zhàn)任務(wù)需求,平臺動態(tài)接引多種情報源和數(shù)據(jù),包括雷達、偵察衛(wèi)星、電子偵察、航空偵察等多種情報來源,也包括報文、視頻、圖像、電磁等多種結(jié)構(gòu)的數(shù)據(jù)載體,預(yù)留接口接引輿論、法律、政治等開源情報。各節(jié)點采集的數(shù)據(jù)按照“隸屬優(yōu)先、節(jié)點自治”的原則,匯集到分布式數(shù)據(jù)庫中,便于進一步的處理和分析。各功能模塊對數(shù)據(jù)進行預(yù)處理、壓縮,以節(jié)省海戰(zhàn)場珍稀的帶寬資源,并提取數(shù)據(jù)特征,在各資料庫中選取合適的算法對其進行處理,形成綜合態(tài)勢,支持戰(zhàn)術(shù)行動。在情報處理和分發(fā)過程中,采取MapReduce 模式,Map 階段將情報處理任務(wù)分發(fā)至平臺各節(jié)點,Reduce 階段將各節(jié)點的處理結(jié)果整合,形成最終結(jié)果。整個過程通過將任務(wù)分解,各節(jié)點并行處理,加速情報處理進程。
平臺生產(chǎn)的各類情報產(chǎn)品,可以根據(jù)不同分發(fā)規(guī)則,分別進行強制分發(fā)、訂閱分發(fā)和推薦分發(fā)。不同于傳統(tǒng)平臺以編指為中心依據(jù)指揮關(guān)系“點—點”的分發(fā)模式,將情報產(chǎn)品分別劃分為編隊級的偵察預(yù)警情報、單艦級的戰(zhàn)術(shù)指揮情報和火力單元級的跟蹤制導(dǎo)情報進行推送,以滿足不同級別用戶對于情報不同覆蓋區(qū)域、不同精度、不同信息粒度的需求。這樣可以縮減不同級別用戶從海量情報數(shù)據(jù)中獲得所需情報的時間,加強情報保障的時效性。
為充分調(diào)動計算資源和提升數(shù)據(jù)利用率,打破信息壁壘,按照“分布式組織管理,集中式分發(fā)共享”的原則,平臺采用分布式存儲和分布式計算的技術(shù),對情報搜集、存儲、計算資源進行統(tǒng)一管理,根據(jù)情報保障任務(wù)需求,協(xié)調(diào)調(diào)度共同完成分析任務(wù)。采用傳統(tǒng)的關(guān)系型數(shù)據(jù)庫檢索、存儲現(xiàn)在艦艇編隊海量的異構(gòu)數(shù)據(jù)效率會非常低下,而平臺采用的HBase 這類非關(guān)系型數(shù)據(jù)庫具有無可比擬的性能優(yōu)勢。
(1)真實的態(tài)勢感知功能。綜合利用各種偵察手段,將貫穿作戰(zhàn)全過程的偵察預(yù)警、指揮決策、效果評估等各環(huán)節(jié)獲得的數(shù)據(jù)存儲到數(shù)據(jù)庫中,通過對情報數(shù)據(jù)的挖掘,較為準確的還原戰(zhàn)場真實態(tài)勢,可以應(yīng)用于目標識別、偵察預(yù)警、查證敵人位置、網(wǎng)電攻防等。
(2)迅捷的輔助決策功能。充分利用大數(shù)據(jù)技術(shù)分布式計算的效率優(yōu)勢,從充斥著虛假、缺失、孤立等“臟數(shù)據(jù)”的海量數(shù)據(jù)中,快速提取出有價值的情報,增強預(yù)測性,為指揮員優(yōu)化作戰(zhàn)決策和完善行動方案提供情報支持。
(3)高效的資源調(diào)度功能。在多維的戰(zhàn)場空間中,通過構(gòu)建的網(wǎng)絡(luò)化作戰(zhàn)環(huán)境,對編隊所屬的各類偵察預(yù)警設(shè)備和武器平臺協(xié)同管理,加速從傳感器到艦載武器的過程,以實現(xiàn)整體作戰(zhàn)效能的最大化。
(4)便利的模塊服務(wù)功能。通過面向情報用戶的服務(wù)體系架構(gòu),對平臺各部分功能軟件進行模塊化封裝,包括數(shù)據(jù)預(yù)處理、數(shù)據(jù)壓縮、數(shù)據(jù)存儲、數(shù)據(jù)挖掘、特征提取等,形成功能模塊軟件庫,在編隊各成員、各系統(tǒng)、各節(jié)點之間共享。
編隊海上活動面臨的氣象、電磁環(huán)境日益復(fù)雜,ISR(情報、監(jiān)視、偵察)系統(tǒng)傳感器種類和數(shù)量越來越多,??栈顒拥母黝惸繕嗽絹碓矫芗⌒突?、隱身化目標探測難度越來越大,這些都增加了編隊情報獲取的難度。因此需要根據(jù)預(yù)警、跟蹤、打擊、評估不同階段的探測需求和作戰(zhàn)規(guī)則,對傳感器、存儲、計算、通信等資源協(xié)同使用,優(yōu)化資源利用,獲取高質(zhì)量數(shù)據(jù)。云計算分為基礎(chǔ)設(shè)施即服務(wù)(IaaS)、平臺即服務(wù)(PaaS)、軟件即服務(wù)(SaaS)三個層次。陸基核心節(jié)點作為處理中心,利用其最大峰值的計算和存儲能力,提供最高級別的Iaas、Paas 和Saas 服務(wù);編隊作為中心節(jié)點,在極限通信條件下提供低于核心節(jié)點的服務(wù)能力。核心節(jié)點、中心節(jié)點、邊緣節(jié)點通過網(wǎng)絡(luò)互聯(lián),靈活編組,構(gòu)建聯(lián)合作戰(zhàn)云環(huán)境。通過將編隊探測資源、存儲資源、計算資源虛擬化,整合廣泛分布的各類設(shè)備,構(gòu)建廣域共享的開放式“云”架構(gòu)體系,實現(xiàn)ISR 系統(tǒng)分布式探測、資源互通共享,增強各系統(tǒng)之間的互聯(lián)互通互操作能力。
研究符合編隊海上作戰(zhàn)特點的大數(shù)據(jù)分析計算架構(gòu)技術(shù),開發(fā)支持海量異構(gòu)情報數(shù)據(jù)采集、存儲、計算和挖掘等大數(shù)據(jù)軟件系統(tǒng),構(gòu)建支撐實時、動態(tài)、精準情報分析的大數(shù)據(jù)平臺。Hadoop 可以為大規(guī)模分布式情報采集和融合提供高容錯性分布式和結(jié)構(gòu)化存儲、跨節(jié)點快速處理功能;Spark 面向內(nèi)存提供高保密的情報數(shù)據(jù)讀取和處理,支持面向指揮作戰(zhàn)應(yīng)用的大數(shù)據(jù)分析處理功能;Storm 針對不間斷的情報數(shù)據(jù)流提供大規(guī)模、實時、容錯計算功能。批處理封裝在Hadoop 內(nèi)核中,由MapReduce 作業(yè)執(zhí)行,并得到Hadoop 生態(tài)內(nèi)其他組件如Hive、Pig 的支持;Spark 通過內(nèi)存計算,可以滿足編隊對歷史數(shù)據(jù)挖掘的需求,其GraphX組件支持對圖結(jié)構(gòu)的情報數(shù)據(jù)處理;Storm 基于其對流數(shù)據(jù)的處理優(yōu)勢,用以支持編隊短周期的快速指揮決策和控制。Hadoop+Spark+Storm 搭建了情報處理的典型框架,可以滿足艦艇編隊情報分析的要求。由于各類數(shù)據(jù)在編隊內(nèi)部廣泛流通,需要充分考慮無連接、斷續(xù)連接、低帶寬等極限條件下的通信能力。
與激增的情報數(shù)據(jù)同步增長的還有隱藏在各類數(shù)據(jù)背后的潛在信息,傳統(tǒng)的建模分析方法難以應(yīng)對復(fù)雜多變的目標實際行為。面對存儲在分布式數(shù)據(jù)庫中質(zhì)量良莠不齊、類型復(fù)雜多樣的各類數(shù)據(jù),采取數(shù)據(jù)挖掘技術(shù),對情報數(shù)據(jù)進行清洗、預(yù)處理,結(jié)合傳統(tǒng)的分類、聚類、關(guān)聯(lián)等方法和貝葉斯網(wǎng)絡(luò)、機器學習、決策樹、神經(jīng)網(wǎng)絡(luò)等數(shù)據(jù)挖掘處理方法,可以較為準確的掌握目標作戰(zhàn)能力和作戰(zhàn)意圖,對其背景、態(tài)勢、特征、行為進行分析。例如,對于目標潛在行為方向的挖掘可以采用基于時空聚類的方法,采用BP 神經(jīng)網(wǎng)絡(luò)求解輸入數(shù)據(jù)與輸出結(jié)果之間的關(guān)系。
艦艇編隊大數(shù)據(jù)情報處理平臺具有以下優(yōu)點:一是可以從海量的數(shù)據(jù)中快速提取出情報,形成覆蓋較大范圍的目標運動特征,加速打擊速度;二是可以自主關(guān)聯(lián)、整合、挖掘目標的威脅情況,為各級指揮員提供作戰(zhàn)決策和優(yōu)化方案的重要依據(jù);三是能將片面、孤立的碎片化信息通過關(guān)聯(lián)整合提升為對整體、全域的認知層次,從不同方面揭示戰(zhàn)場態(tài)勢全貌。大數(shù)據(jù)情報處理技術(shù),艦艇編隊防空反導(dǎo)、對海/陸打擊、反潛作戰(zhàn)有著重要的應(yīng)用價值,可廣泛應(yīng)用于各類作戰(zhàn)行動。