張維明 楊國利 朱承 劉俊先
20世紀末,特別是最近十年來,信息與網(wǎng)絡(luò)技術(shù)的飛速發(fā)展,人們面臨著眾多系統(tǒng)在網(wǎng)絡(luò)環(huán)境中的集成、交互與演化的問題.隨著系統(tǒng)集成的興起,許多超級系統(tǒng)出現(xiàn),但是這種建設(shè)-集成-再建設(shè)-再集成的思路導(dǎo)致目標差異過大、共識難以形成、整體作用喪失等問題.因此,體系時代呼喚體系方法來解決問題.
體系[1]一般定義為處于某一動態(tài)環(huán)境中的若干相互聯(lián)系、相互制約的獨立系統(tǒng),通過各自有目的的行為,為完成共同使命而形成的整體.通常,體系具備以下屬性:成員系統(tǒng)獨立,相互關(guān)聯(lián)協(xié)同,組織因素凸顯,共同完成使命,演化成型涌現(xiàn).理解和認識體系及其特征,需要進一步明確以下幾點:
1)體系需要解決大規(guī)模、結(jié)構(gòu)化和異構(gòu)性系統(tǒng)的建模問題.
2)體系需要處理不完全信息下參與雙方的動態(tài)博弈問題.
3)體系需要注重拓撲結(jié)構(gòu)和行動策略的自適應(yīng)調(diào)整.
在軍事領(lǐng)域,隨著科學(xué)技術(shù)的不斷進步,計算機軟硬件的更新?lián)Q代,以及人工智能和大數(shù)據(jù)科學(xué)的突飛猛進,網(wǎng)絡(luò)信息體系已經(jīng)逐步演變?yōu)樾畔⒒瘧?zhàn)爭下作戰(zhàn)體系的基本形態(tài).構(gòu)建有效的網(wǎng)絡(luò)信息體系,在敵我博弈中不斷演化,需要從以下兩點出發(fā),提高認識水平,做到有的放矢.
1)從認識問題的角度出發(fā),需要建立網(wǎng)絡(luò)信息時代的科學(xué)思維和理論體系.具體而言,對現(xiàn)代信息技術(shù)的認識需要從物質(zhì)論轉(zhuǎn)移到關(guān)系論,從原子論轉(zhuǎn)移到比特論,從個體論轉(zhuǎn)移到群體論,從決定論轉(zhuǎn)移到概率論,從機械論轉(zhuǎn)移到體系論.
2)從解決問題的角度出發(fā),需要應(yīng)用體系工程的思想解決網(wǎng)絡(luò)信息體系的構(gòu)建、博弈與演化問題.具體而言,需要對使命需求與能力空間進行匹配,通過對現(xiàn)有系統(tǒng)的動態(tài)配置,引導(dǎo)其協(xié)同交互,在不完全信息下的動態(tài)博弈過程中,增強其魯棒性、敏捷性和適應(yīng)性[2].
圖1 網(wǎng)絡(luò)信息體系示意圖
在網(wǎng)絡(luò)信息體系中,各種軍事實體以網(wǎng)絡(luò)為中心,通過信息互通,實現(xiàn)敏捷適應(yīng),其中體系思維和體系方法在此發(fā)揮著重要的作用.從體系的角度出發(fā),通過在最佳時機投入有效手段,對各種實體、資源、環(huán)境進行合理運用,實現(xiàn)快速響應(yīng)、精確判斷和科學(xué)實施,利用結(jié)構(gòu)優(yōu)勢塑造損敵利我的戰(zhàn)場狀態(tài).特別需要指出的是,所謂的體系優(yōu)勢并不單純強調(diào)技術(shù)的領(lǐng)先、裝備的性能和力量的規(guī)模,而是通過信息共享、精確規(guī)劃、密切協(xié)同來達到結(jié)構(gòu)優(yōu)勢的凸顯.
這種圍繞網(wǎng)絡(luò)信息體系實施信息化作戰(zhàn)的機制可以通過圖1進行展現(xiàn),其中信息環(huán)路和作戰(zhàn)環(huán)路是網(wǎng)絡(luò)信息體系的兩條重要主線[3].網(wǎng)絡(luò)信息體系將軍事力量、信息處理、后勤保障和指揮決策通過一系列通信鏈路和指控關(guān)系進行互聯(lián)、互通、互操作、互理解、互遵循和互協(xié)同[3].作戰(zhàn)活動通過戰(zhàn)場觀察、情報獲取、信息處理、規(guī)劃決策、指揮控制、行動毀傷、后勤保障等形成閉環(huán).信息傳輸用以實現(xiàn)戰(zhàn)場感知、作戰(zhàn)經(jīng)驗、情報知識、指揮命令等各種形式符號的表達與共享.作戰(zhàn)環(huán)路中的行動都是建立在信息環(huán)路的基礎(chǔ)之上,并且依賴信息環(huán)路的驅(qū)動和引導(dǎo).現(xiàn)實場景中,如何將這兩條主線嵌入到網(wǎng)絡(luò)拓撲中,然后通過動態(tài)的網(wǎng)絡(luò)拓撲刻畫一般性的作戰(zhàn)模式是網(wǎng)絡(luò)作戰(zhàn)體系研究的核心問題.
自適應(yīng)網(wǎng)絡(luò)[2]作為研究復(fù)雜動力系統(tǒng)的有效工具,已經(jīng)廣泛應(yīng)用于網(wǎng)絡(luò)信息傳播[4],演化博弈論[5?8],自組織協(xié)同[9]等領(lǐng)域.這些系統(tǒng)的拓撲結(jié)構(gòu)和個體狀態(tài)都隨著時間的推移,不斷發(fā)展變化,并且相互影響,相互依賴.鑒于網(wǎng)絡(luò)信息體系在時空維度的動態(tài)性符合自適應(yīng)網(wǎng)絡(luò)的特征,即信息環(huán)路的動態(tài)性對應(yīng)拓撲結(jié)構(gòu)的重組,作戰(zhàn)環(huán)路的動態(tài)性對應(yīng)個體行動策略的調(diào)整,因此,可以借助自適應(yīng)網(wǎng)絡(luò)的有關(guān)理論推動網(wǎng)絡(luò)信息體系的研究.但是,必須考慮網(wǎng)絡(luò)信息體系的一些特有性質(zhì),比如異質(zhì)節(jié)點和異質(zhì)鏈路導(dǎo)致拓撲結(jié)構(gòu)的狀態(tài)不能單純依賴節(jié)點類型與聯(lián)通程度,另外節(jié)點的屬性服從馬爾科夫過程特性,隨作戰(zhàn)行動的進行發(fā)生變化,并引起行動策略空間的變化.因此,本文一個重要內(nèi)容就是研究網(wǎng)絡(luò)拓撲和行動策略如何在雙方博弈過程中不斷影響、不斷演化.
由于網(wǎng)絡(luò)信息體系的演化需要借助大量歷史數(shù)據(jù)來對未來體系動態(tài)性、適應(yīng)性和魯棒性進行仿真模擬和評估預(yù)測.因此,如何定性-定量刻畫體系的動態(tài)演化過程是該研究的關(guān)鍵.
下面,將從體系建模、體系博弈和體系演化3個層次闡述網(wǎng)絡(luò)信息體系的運作模式,文章整體架構(gòu)如圖2所示,其中網(wǎng)絡(luò)信息體系拓撲結(jié)構(gòu)和行動策略的調(diào)整源于對體系博弈過程中歷史數(shù)據(jù)的挖掘分析和統(tǒng)計學(xué)習(xí).具體而言,緊密圍繞網(wǎng)絡(luò)拓撲和行動策略這兩條主線,在體系博弈過程中不斷進行狀態(tài)追蹤、數(shù)據(jù)挖掘、統(tǒng)計學(xué)習(xí)以及毀傷預(yù)測,為體系演化(結(jié)構(gòu)重組和策略調(diào)整)提供定性-定量依據(jù).體系建模、體系博弈與體系演化構(gòu)成的循環(huán)構(gòu)架能夠促使網(wǎng)絡(luò)信息體系不斷進行適應(yīng)性調(diào)整,在動態(tài)過程中實現(xiàn)作戰(zhàn)意圖.
圖2 網(wǎng)絡(luò)信息體系建模、博弈與演化研究架構(gòu)
現(xiàn)代信息化戰(zhàn)爭中,網(wǎng)絡(luò)信息體系通常將各種軍事實體、組織關(guān)系和行動策略進行有效整合,在物理域、信息域、認知域和社會域?qū)崿F(xiàn)有機統(tǒng)一.在這種體系中,各個成員彼此獨立,為實現(xiàn)共同使命,進行協(xié)同關(guān)聯(lián),并隨著外界條件的影響,網(wǎng)絡(luò)結(jié)構(gòu)將進行演化發(fā)展.構(gòu)建該類體系,需要以使命需求為依據(jù)[10],在全局高度遵循“自頂向下”分解原則對作戰(zhàn)使命需求進行分解;在局部作戰(zhàn)單元和基礎(chǔ)設(shè)施層面上遵循“自底向上”的聚合原則進行資源的整合.
為有效構(gòu)建作戰(zhàn)體系,將網(wǎng)絡(luò)信息體系通過以下形式進行展現(xiàn)[11?12]即
其中,N代表作戰(zhàn)實體單元,E代表組織通信關(guān)系,A代表行動策略集合.這樣通過網(wǎng)絡(luò)鉸鏈,實現(xiàn)信息互通,促進科學(xué)決策,整合作戰(zhàn)力量,達到作戰(zhàn)目的.這種抽象模式能夠突出網(wǎng)絡(luò)拓撲結(jié)構(gòu)對信息流和行動流的融合作用,進而實現(xiàn)各個單元相互關(guān)聯(lián)協(xié)同,以松耦合的方式相互作用和相互影響.
作戰(zhàn)實體單元包含:
其中,C2(Command&Control)代表指揮控制單元,包含各類通信系統(tǒng)、數(shù)據(jù)處理、分析和計算平臺,以及規(guī)劃決策、指揮控制實體,根據(jù)這些實體的內(nèi)在屬性,它們往往具有不同層次的指揮權(quán)限、數(shù)據(jù)密級和處理能力.F(Force)為火力打擊單元,包含各種作戰(zhàn)打擊力量,如戰(zhàn)斗機、驅(qū)逐艦、坦克、火炮等,這些火力打擊單元的作戰(zhàn)能力一般由打擊強度、打擊半徑和機動速度等因素決定.I(Intelligence)代表情報偵察單元,包含各類雷達站、預(yù)警機、偵察衛(wèi)星等戰(zhàn)場信息獲取實體,其工作能力取決于探測半徑與探測精度.另外,L(Logistics)代表各類后勤保障單元,包含各種裝備、給養(yǎng)、彈藥、油料的供給部門,這些單元保證作戰(zhàn)行動的可持續(xù)性.上述各類單元涵蓋了C4ISR系統(tǒng)的核心要素.
組織通信關(guān)系用以展現(xiàn)一系列基本的信息交互模式,實現(xiàn)信息的上傳下達,即
這些基本鏈路的形成依賴作戰(zhàn)實體單元的功能和角色,為實現(xiàn)某一能力提供信息通道.在上述關(guān)系中,C2?C2代表指揮控制單元之間的信息共享和協(xié)同決策關(guān)系;C2?X代表各類指揮控制關(guān)系,其中X.∈{I,F,L};I?C2表示戰(zhàn)場信息的上傳;I?F表示探測信息輔助實施精確火力打擊;L?Y表示后勤保障單元對各類作戰(zhàn)實體提供的供給服務(wù)援助和基礎(chǔ)設(shè)施維護,其中,Y∈{C2,I,F}.
行動策略集合:
其中,C2A代表指揮控制單元的行動策略集,包含情報接收、數(shù)據(jù)融合、信息挖掘、運籌決策等行為.FA為火力打擊單元的行動策略集,包括進攻、防御、迂回、包圍、機動等行為.IA為情報偵察單元的行動策略集,包含開機、探測、移動、傳輸?shù)刃袨?LA為后勤保障單元行動策略集,包含給養(yǎng)運送、線路維護、能源供給、物資轉(zhuǎn)移等行為.這些行動策略都是為實現(xiàn)使命任務(wù)服務(wù)的,作戰(zhàn)實體單元的能力通過這一系列的行動進行體現(xiàn),作戰(zhàn)環(huán)路的正常運行也是建立在這些行動策略有效實施的基礎(chǔ)之上.然而,這些行動策略的運作籌劃和動態(tài)調(diào)整必須依賴信息在網(wǎng)絡(luò)結(jié)構(gòu)中傳輸流動.
網(wǎng)絡(luò)信息體系模型如圖3所示.通過作戰(zhàn)實體單元和組織通信關(guān)系的空間部署,獲得網(wǎng)絡(luò)拓撲結(jié)構(gòu),在此基礎(chǔ)上融入作戰(zhàn)行動策略,即可獲得網(wǎng)絡(luò)信息體系中個體的行動狀態(tài).拓撲結(jié)構(gòu)和行動狀態(tài)在時間維度上的運動,構(gòu)成了復(fù)雜自適應(yīng)體系的耦合動態(tài)性.上述體系構(gòu)建過程將要素、結(jié)構(gòu)、機制融入的到信息網(wǎng)絡(luò)中,形成各種作戰(zhàn)能力(包括情報偵察能力、態(tài)勢感知能力、指揮決策能力、精確打擊能力、綜合保障能力等),完成作戰(zhàn)使命.這種體系形式從時空兩個維度刻畫了作戰(zhàn)過程的動態(tài)性,其中時間維度主要體現(xiàn)行動策略的執(zhí)行部署次序,而空間維度主要體現(xiàn)各個單元結(jié)構(gòu)關(guān)系.
網(wǎng)絡(luò)信息體系構(gòu)建完成之后,在使命任務(wù)驅(qū)動下,將面臨敵我雙方的策略博弈.由于戰(zhàn)爭迷霧帶來的信息不透明和稍縱即逝的戰(zhàn)機,如何及時準確地把握對方行動策略并判斷不同策略下雙方的交互收益是體系博弈的關(guān)鍵.
傳統(tǒng)博弈論(game theory)[13]通常關(guān)注二元對稱策略下的完全信息靜態(tài)博弈,即博弈雙方的策略空間都是{C,D},其交互收益矩陣滿足以下形式:
在該條件下,當某一博弈參與者選擇C而對方同樣選擇C時,兩人得到相同的收益R;當某一參與者選擇C而對方選擇D時,其收益為S對方收益為T;反之亦然.當二者都選擇D時,兩人仍然獲得相同的收益P.人們根據(jù)交互矩陣中參數(shù)的相對大小得到不同的博弈場景.其中最經(jīng)典的莫過于囚徒困境,T>R>P>S,在此約束下,策略D為占優(yōu)策略.隨著時間的推進,出現(xiàn)穩(wěn)定均衡狀態(tài)(即納什均衡),個體的理性選擇導(dǎo)致整體收益達到最低.
在類似假設(shè)條件下,可以構(gòu)建三元對稱策略博弈下的交互收益矩陣:
在該矩陣中,每個博弈參與者都有3種可供選擇的策略,個體之間的交互關(guān)系更為復(fù)雜,決策過程呈現(xiàn)出更多的不確定性.在此情形下,純策略均衡將會很難出現(xiàn),即不存在一個恒定的策略使己方在博弈中無需改變選擇,人們會以一定的概率分布隨機選擇策略集中的策略,使得其他博弈參與者各個可能存在的策略之間無差異.
圖3 網(wǎng)絡(luò)信息體系構(gòu)建要素及各個要素之間的關(guān)系
隨著博弈雙方策略空間多樣性的出現(xiàn),上述完全對稱的交互收益矩陣將不再適用,人們開始關(guān)注非對稱矩陣交互形式.另外,由于作戰(zhàn)行動是在時空維度全面推進的,作戰(zhàn)實體單元的行動策略集通常會依賴于其所處的狀態(tài)空間,例如由于戰(zhàn)爭損耗,某火力打擊單元的打擊強度和范圍可能下降,甚至完全處于失效狀態(tài).那么,在這種條件下,博弈雙方的行動策略空間將隨時間發(fā)生變化.與此同時,交互矩陣的收益參數(shù)也會依賴其當前所處的狀態(tài)空間并隨時間變化,因此,交互狀態(tài)空間也是服從馬爾科夫過程特性的.
在上述二元對稱博弈的基礎(chǔ)上,將非對稱策略和馬爾科夫特性結(jié)合,動態(tài)調(diào)整博弈雙方行動策略集和交互矩陣,使其服從如下形式:
其中,{Ct,Dt}為己方行動策略集合,{ct,dt}為對方行動策略集合.在此場景下,我方策略Ct在對方選擇ct時能夠獲得收益為Rt,對方獲得收益為rt.其他博弈場景以此類推.在這種動態(tài)條件下,行動策略的選擇既要充分考慮雙方的行動策略空間,又要判斷交互狀態(tài)空間.特別需要指出的是,上述內(nèi)容闡述了單步博弈場景,即博弈雙方在給定交互狀態(tài)、給定行動策略集合條件下的風(fēng)險決策過程.考慮到馬爾科夫過程的后續(xù)影響,當前狀態(tài)下的最優(yōu)策略可能導(dǎo)致在接下來的狀態(tài)中所有策略都將處于劣勢.例如,在上述交互矩陣中,如果收益參數(shù)呈現(xiàn):
那么最優(yōu)策略將會是Dt.但是,假設(shè)當前狀態(tài)下的最優(yōu)策略會導(dǎo)致后續(xù)狀態(tài)的博弈劣勢:
那么在此場景下我方的任何策略選擇都將被對方占優(yōu).
網(wǎng)絡(luò)信息體系博弈將是不確定信息下的動態(tài)博弈,雙方的策略由一系列同步行動和次序行動交織混合.研究體系博弈需要明確有效的行動策略空間和交互收益參數(shù),而獲取上述信息需要準確把握己方、對方以及環(huán)境之間的關(guān)系,然后進行科學(xué)的仿真預(yù)測.
和許多自適應(yīng)系統(tǒng)[14?17]類似,作戰(zhàn)體系適應(yīng)性和靈活性的一個重要特征就是面向使命目標,各個單元能夠根據(jù)當前態(tài)勢進行動態(tài)調(diào)整.兵無常勢,水無常形,體系同樣不可能一成不變.因此,需要網(wǎng)絡(luò)信息體系具備動態(tài)演化特征,能夠進行改造和調(diào)整,具有新能力,適應(yīng)新環(huán)境,履行新使命.
復(fù)雜體系不斷演化的流程如圖4所示.在該演化流程中,體系的拓撲結(jié)構(gòu)和行動策略是在體系目標和博弈歷史數(shù)據(jù)的驅(qū)動下不斷進行螺旋式的適應(yīng)性調(diào)整.具體而言,作戰(zhàn)體系為應(yīng)對某種使命環(huán)境和對方行動策略,需要不斷進行目標分析,明確行動規(guī)劃,通過數(shù)據(jù)挖掘和統(tǒng)計學(xué)習(xí),獲得演化特征,對當前體系進行魯棒性分析和適應(yīng)性分析,根據(jù)評估結(jié)果指導(dǎo)拓撲結(jié)構(gòu)和行動策略的調(diào)整.不斷重復(fù)上述過程,即可保證作戰(zhàn)體系在行動過程中的結(jié)構(gòu)優(yōu)勢和策略優(yōu)勢.
圖4 作戰(zhàn)體系演化流程示意圖
在敵我雙方博弈過程中,對方的行動策略往往是未知的.獲取對方行動策略空間以及對應(yīng)的概率分布對我方使命任務(wù)的及時調(diào)整和作戰(zhàn)計劃的順利實施具有十分重要的作用.基于此,在狀態(tài)追蹤和情報獲取的基礎(chǔ)上,數(shù)據(jù)挖掘和統(tǒng)計學(xué)習(xí)的手段方法能夠有助于我方準確得到對方狀態(tài)空間、策略集合、轉(zhuǎn)移概率等有用信息.借助這些信息,可以開展理論計算和數(shù)值仿真,預(yù)測作戰(zhàn)行動方案的未來形態(tài)和毀傷效果,并通過體系測度指標,進行魯棒性分析和適應(yīng)性分析,對網(wǎng)絡(luò)結(jié)構(gòu)和行動策略的反饋提供有效的定性-定量指導(dǎo).
1)理論解析:構(gòu)建連續(xù)時間的馬爾科夫鏈,刻畫重要實體或模塊的動力學(xué)方程.基于圖演化的微分方程組[17](如圖5所示)能夠快速獲得某觀測變量在一系列規(guī)則驅(qū)動下(節(jié)點增減、狀態(tài)變化、關(guān)系變化等)的動態(tài)過程以及將來的穩(wěn)定狀態(tài).需要指出的是,該方法構(gòu)建過程比較復(fù)雜,需要通過一系列近似技術(shù)(Mean-field,pair approximation等)才能實現(xiàn)方程組的閉包.
圖5 作戰(zhàn)體系實體模塊演化微分方程示意圖
另外,通過基于圖微分方程的理論解析關(guān)注的是具備特定結(jié)構(gòu)和狀態(tài)的實體或子圖,這些變量在整個網(wǎng)絡(luò)中面對同樣的規(guī)則呈現(xiàn)無差異性.然而,在網(wǎng)絡(luò)信息體系中幾乎所有實體和關(guān)系都是異構(gòu)的,因此,需要對這些變量進行預(yù)處理操作,進行模糊表示,才能獲得該類變量的動態(tài)演化形式.這種在預(yù)處理過程中的近似行為必然會導(dǎo)致過程/結(jié)構(gòu)預(yù)測結(jié)果上的誤差.
2)數(shù)值仿真:在轉(zhuǎn)移規(guī)則和概率的基礎(chǔ)上,通過構(gòu)建多主體系統(tǒng),對網(wǎng)絡(luò)信息體系進行動態(tài)性仿真.這類方法能夠?qū)崟r獲得各個變量狀態(tài),以及各種變量的瞬時分布,而且結(jié)果準確性較高.但是由于仿真過程中不可避免的隨機波動,需要進行大量重復(fù)試驗才能獲得穩(wěn)定狀態(tài)分布,這就導(dǎo)致了較大的計算成本和時間成本.
通過上述兩種預(yù)測技術(shù),將會獲得體系未來形態(tài)(結(jié)構(gòu),狀態(tài),策略等).在體系測度的基礎(chǔ)上,通過一系列定性-定量的評估,即可對網(wǎng)絡(luò)拓撲和行動策略進行調(diào)整(例如:提升打擊能力,更改行動策略,增加平臺系統(tǒng),改變使命任務(wù),調(diào)整組織結(jié)構(gòu)等),實現(xiàn)網(wǎng)絡(luò)信息體系對作戰(zhàn)過程和環(huán)境的自適應(yīng).
上述框架涵蓋了基于數(shù)據(jù)挖掘的演化規(guī)則預(yù)測,基于理論解析和數(shù)值仿真的毀傷評估和針對拓撲結(jié)構(gòu)和行動策略的體系調(diào)整,這3個要素相輔相成、缺一不可、層層遞進,其中數(shù)據(jù)是基礎(chǔ),評估是手段,調(diào)整是目的.
網(wǎng)絡(luò)信息體系在不斷發(fā)展變化中,展現(xiàn)出越來越多的特性,包括復(fù)雜性、敏捷性、演化性、涌現(xiàn)性、可變性、分布性、重用性、自主性、支配性、異構(gòu)性、規(guī)模性、交互性等等[1].從本質(zhì)上看,這些體系一般會圍繞3個基本性質(zhì):適應(yīng)性、涌現(xiàn)性和不確定性,其中適應(yīng)性導(dǎo)致體系的結(jié)構(gòu)和過程不斷改變,涌現(xiàn)性是演化的結(jié)果,是每個個體不斷進行交互后以自組織的方式產(chǎn)生出來的,不確定性取決于網(wǎng)絡(luò)信息時代事物的不可度量、不可預(yù)測和不完備可知.
本研究提出的理論和方法努力嘗試將宏觀的體系問題變成一系列可以刻畫的微觀問題,期間采用了許多假設(shè).任何一個系統(tǒng)的有效運作一定是內(nèi)部邏輯自洽的,同時有自己的邊界,一旦出了這個邊界,對應(yīng)邏輯立即失效.對網(wǎng)絡(luò)信息體系的研究需要從世界觀和方法論兩個層面展開,結(jié)合軍事領(lǐng)域的問題對體系建模、體系博弈和體系演化進行系統(tǒng)性研究.