楊 凱,張連怡,梅 錚,張 晗
(北京仿真中心 航天系統(tǒng)仿真重點實驗室,北京 100854)
隨著建模與仿真技術(shù)在多學(xué)科中的不斷應(yīng)用,仿真平臺越來越數(shù)字化、網(wǎng)絡(luò)化、智能化、集成化、虛擬化、協(xié)同化。建模與仿真技術(shù)一直隨著信息技術(shù)的發(fā)展而不斷變化,從最初的集中式仿真,逐漸發(fā)展成分布式仿真、并行仿真、基于Web 的仿真、云仿真、高效能仿真[1-2]等不同的仿真模式。高效能仿真是指融合了新興計算機科學(xué)技術(shù)(如云計算、物聯(lián)網(wǎng)、大數(shù)據(jù)、服務(wù)計算、邊緣計算等)、現(xiàn)代建模與仿真技術(shù)、高性能計算系統(tǒng)技術(shù)等,借助智能化高效能計算機,以優(yōu)化“系統(tǒng)建模、仿真運行、結(jié)果分析/處理”等整體性能為目標的仿真系統(tǒng)。
平行應(yīng)急管理系統(tǒng)(PeMS)[3]是人工社會、計算實驗、平行執(zhí)行有機結(jié)合的社會計算平行實驗[4]綜合解決方案在突發(fā)危機事件應(yīng)急管理領(lǐng)域的具體應(yīng)用,是基于人工社會仿真方法進行突發(fā)危機事件應(yīng)急管理的一種嘗試。平行應(yīng)急管理系統(tǒng)的核心是突發(fā)危機事件、承災(zāi)載體和應(yīng)急管理,圍繞突發(fā)事件,對應(yīng)急管理過程實施一體化、實時化、智能化仿真。該應(yīng)急管理仿真系統(tǒng)借助計算機實驗過程對應(yīng)急管理策略進行分析評估,給出平行執(zhí)行實施應(yīng)急管理方案,是一種解決“預(yù)測-應(yīng)對”型非常規(guī)突發(fā)危機事件應(yīng)急管理問題的重要途徑。這種基于人工社會的應(yīng)急管理建模與仿真系統(tǒng)具有大規(guī)模、多領(lǐng)域、多樣、異質(zhì)、不完備、復(fù)雜時空演化等特點,給“預(yù)測-應(yīng)對”型應(yīng)急管理帶來了極大挑戰(zhàn)。本文就面向平行應(yīng)急管理的高效能仿真方法展開論述。
平行應(yīng)急管理是指通過可控制可觀測的仿真實驗實現(xiàn)突發(fā)事件情景在人工社會系統(tǒng)中的涌現(xiàn),進一步認識突發(fā)事件的產(chǎn)生、發(fā)展、轉(zhuǎn)化和衰亡的演化特征與規(guī)律,對應(yīng)急管理策略的有效性進行驗證并探索更加優(yōu)化的管理策略,最后將優(yōu)化的應(yīng)急管理策略運用到真實社會中,對真實社會進行科學(xué)有效的控制。平行應(yīng)急管理仿真方法解決實際社會系統(tǒng)中不可準確預(yù)測、難以拆分還原、無法重復(fù)實驗等復(fù)雜性問題。目前,平行應(yīng)急管理仿真都是基于可計算組織理論的建模仿真方法,具體分為基于系統(tǒng)動力學(xué)的人工社會學(xué)仿真[5]、基于Agent的人工社會學(xué)仿真[6-8]、基于社會網(wǎng)絡(luò)分析(SNA)的人工社會學(xué)仿真方法3類。系統(tǒng)動力學(xué)主要從宏觀系統(tǒng)角度對人工社會演化過程進行仿真,Agent模型是通過微觀行為和微觀過程仿真涌現(xiàn)的宏觀行為,SNA 方法則對人工社會關(guān)系網(wǎng)絡(luò)進行研究?;诙郃gent構(gòu)建復(fù)雜人工社會系統(tǒng),并執(zhí)行計算實驗是當前比較理想的方法。1991年,蘭德公司[9]提出了人工社會的思想,用于研究信息技術(shù)對人工社會的影響。隨著多Agent建模與仿真技術(shù)的發(fā)展,用于人工社會和人工社會研究的各種建模與仿真平臺得以設(shè)計和開發(fā),如Repast[10],Start Logo[11],Swarm[12]等平臺。
本文就面向平行應(yīng)急管理的高效能仿真方法進行了研究。針對人工社會應(yīng)急管理仿真規(guī)模龐大的特點,借助高效能仿真平臺的云仿真并行仿真調(diào)度方法實現(xiàn)超實時平行大規(guī)模仿真;針對人工社會Agent模型的異質(zhì)、動態(tài)的模型特點,通過開展自適應(yīng)模型參數(shù)學(xué)習方法實現(xiàn)演化模型建模;針對人工社會應(yīng)急管理評估需求不斷調(diào)整的特點,通過采用自組織增量學(xué)習[13]等方法進行仿真模型在線評估。因此,借助高效能仿真平臺的先進建模仿真手段對人工社會平行應(yīng)急管理進行研究,提升現(xiàn)有平行應(yīng)急管理仿真能力是一個重要的研究問題。
本文提出了面向平行應(yīng)急管理高效能建模仿真方法,研究基于半監(jiān)督機器學(xué)習的應(yīng)急管理仿真建模、基于知識的人工社會初始情景構(gòu)建、基于增量學(xué)習的仿真模型在線評估等方法。運用高效能仿真云中的并行作業(yè)調(diào)度進行大規(guī)模仿真執(zhí)行,機器學(xué)習模型訓(xùn)練等。
基于“預(yù)測-應(yīng)對”應(yīng)急管理仿真的特點,初步形成了應(yīng)急管理仿真建模的方法論,依托突發(fā)危機事件情景構(gòu)建方法,建立應(yīng)急管理模型體系,采用應(yīng)急領(lǐng)域模型工程的技術(shù),開發(fā)模型體系中的模型?;贏gent 模型的個體交互特點,建立基于個體Agent模型用于行為模式描述,建立交互模型,以個體作為結(jié)點,交互關(guān)系作為邊來構(gòu)建復(fù)雜網(wǎng)絡(luò)交互模式,并對人工社會群體行為進行模擬推演。在優(yōu)化自適應(yīng)Agent模型的參數(shù)時,采用基于半監(jiān)督主動學(xué)習的模型參數(shù)學(xué)習方法。在有限數(shù)量有標記的模擬仿真樣本和大量無標記樣本的基礎(chǔ)上,使用小樣本學(xué)習,具有很強的泛化能力,不會過分依賴樣本的質(zhì)量和數(shù)量,實現(xiàn)復(fù)雜自適應(yīng)Agent模型的參數(shù)學(xué)習。
參考情景分析與應(yīng)急管理等領(lǐng)域的研究成果,從語義層次抽象出概念,利用網(wǎng)絡(luò)本體語言(OWL)描述語義化模型本體并構(gòu)建描述邏輯(DL)分析各本體語義聯(lián)系,同時對人工社會初始情景進行了研究。明確了人工社會初始情景的概念,結(jié)合突發(fā)事件應(yīng)對法對突發(fā)事件的分類,設(shè)計了初始情景描述框架,用于規(guī)范初始情景的描述。初始情景由初始社會、活動規(guī)則、事件和應(yīng)對措施四個要素組成。其中,初始社會描述人工社會初始構(gòu)建時的狀態(tài)和建立人工社會分類圖譜;活動規(guī)則對人工社會關(guān)系網(wǎng)絡(luò)與演化規(guī)則進行抽象描述,具體人工社會規(guī)則包括道德規(guī)則、法律規(guī)則等;事件分為源事件和衍生事件,包括教育、醫(yī)療、購物等;應(yīng)對措施是針對應(yīng)急突發(fā)事件所采取應(yīng)對措施的集合。
為解決復(fù)雜仿真模型協(xié)同推演實時評估困難、過程時效性低的問題,擬開展復(fù)雜仿真模型在線評估方法研究。基于增量學(xué)習算法建立需求特征與實時過程數(shù)據(jù)的動態(tài)映射關(guān)系,進而建立起一套全新的基于“多維特征映射、在線演化評估”的方法,實現(xiàn)復(fù)雜人工社會仿真模型協(xié)同仿真過程的在線評估。將模型仿真數(shù)據(jù)及其動態(tài)演化模式融合,設(shè)計基于自組織增量學(xué)習神經(jīng)網(wǎng)絡(luò),對歷史數(shù)據(jù)和參考數(shù)據(jù)進行在線增量聚類,劃分標注可信數(shù)據(jù)集和不可信范圍。一方面對模型數(shù)據(jù)進行在線比對,另一方面利用已評估數(shù)據(jù)實時更新網(wǎng)絡(luò),實現(xiàn)模型在線評估,并實時關(guān)聯(lián)模型評估因素,從而形成一個包含仿真數(shù)據(jù)采集、模型特征關(guān)聯(lián)二階認知圖自動構(gòu)建、模型演化規(guī)律一致性的動態(tài)分析、模型在線評估的智能化評估方法。
在高效能仿真云中,針對作業(yè)運行時間不能估計且沒有進程遷移支持、作業(yè)運行時間不能估計但有進程遷移支持、作業(yè)運行時間可以估計但沒有進程遷移支持、作業(yè)運行時間可以估計且有進程遷移支持這4種現(xiàn)實情況,分別設(shè)計了4種作業(yè)調(diào)度算法。對于仿真作業(yè)調(diào)度采用自適應(yīng)嘗試運行方法,嘗試將一些根據(jù)現(xiàn)有調(diào)度算法不能部署到處理器上運行的作業(yè)提前部署到處理器上執(zhí)行,一旦這種搶占運行違背調(diào)度公平性,則停止一些搶占作業(yè)并將它們重新放回到等待隊列中。這種調(diào)度算法是對現(xiàn)有廣泛使用算法的增強改進,在易實現(xiàn)性、輕便性等方面有著和現(xiàn)有算法一樣的優(yōu)勢,且能提供遠優(yōu)于現(xiàn)有算法的調(diào)度性能。
將面向平行應(yīng)急管理的高效能仿真方法用于社會公共安全風險防控領(lǐng)域,對社會媒體網(wǎng)絡(luò)用戶實時輿論監(jiān)控等建模仿真分析,以檢測異常網(wǎng)絡(luò)用戶行為。社會媒體可加強網(wǎng)民間的組織和動員能力,同時影響社會運動和群體行為的形態(tài)。網(wǎng)絡(luò)用戶群體組織的發(fā)展首先是從個體發(fā)展而來,然后發(fā)展到群體。在發(fā)生、發(fā)展的過程中,受到多種因素影響,在這些因素背后又有其特定的關(guān)系支撐著其群體的發(fā)展壯大,轉(zhuǎn)化衰變。大多數(shù)活動的根源是多種因素的綜合體,這一論述雖然不能涵蓋網(wǎng)絡(luò)組織產(chǎn)生的所有原因,但在一定程度上有助于認識該組織的根源。由于該產(chǎn)物受各種因素交互影響,故應(yīng)深入分析這些因素,構(gòu)建網(wǎng)絡(luò)組織及其外部環(huán)境模型,對其形成、轉(zhuǎn)化及衰變模型進行模擬推演,分析時空維度下網(wǎng)民行為內(nèi)在關(guān)聯(lián),進行自動化異常行為模式檢測。
基于Agent的網(wǎng)絡(luò)群體組織模型如圖1所示。在對網(wǎng)絡(luò)群體組織關(guān)聯(lián)關(guān)系研究中,將對外部影響因素進行分析。網(wǎng)絡(luò)群體組織是一個開放的復(fù)雜系統(tǒng),組織為了求得生存、發(fā)展和實現(xiàn)其目標,不斷地與外界環(huán)境進行物質(zhì)、信息、能量和資源交換。該部分采用指數(shù)隨機圖模型的社會網(wǎng)絡(luò)分析法研究內(nèi)外部的綜合影響,如圖1(a)所示。在此網(wǎng)絡(luò)中,組織與外界環(huán)境的能量交換表現(xiàn)為:組織、后勤、信息、信念、技能、話題/任務(wù)/目標,這六要素構(gòu)成了一個復(fù)雜的自適應(yīng)系統(tǒng)。從單一的影響因素出發(fā),全面分析影響網(wǎng)絡(luò)組織發(fā)生、發(fā)展的具體因素,然后綜合這些影響因素,從系統(tǒng)學(xué)的角度去認識其影響因素和問題,研究層次分析和影響圖等方法,進一步分析網(wǎng)絡(luò)組織影響因素關(guān)系,構(gòu)建演化的關(guān)鍵要素及關(guān)系模型,為仿真演化模型研究建立基礎(chǔ)。
在對網(wǎng)絡(luò)群體組織Agent模型建模的分析研究中,通過采用異構(gòu)多Agent模型建模方法,如圖1(b)所示。該方法能對網(wǎng)絡(luò)群體組織的復(fù)雜行為進行刻畫。通過對內(nèi)外部因素的研究,給出了網(wǎng)絡(luò)群體組織Agent模型。模型的六要素為:內(nèi)部特征、環(huán)境實體、環(huán)境特征、學(xué)習算法、動作及通信信息。結(jié)合網(wǎng)絡(luò)群體組織演化規(guī)則,得到網(wǎng)絡(luò)群體組織Agent演化模型。群體組織模型的參數(shù)學(xué)習問題也是復(fù)雜自適應(yīng)網(wǎng)絡(luò)群體Agent模型研究的重要方向。在模型參數(shù)生成方面,采用半監(jiān)督機器學(xué)習和主動學(xué)習方法,將目前已有的模擬仿真結(jié)果樣本作為標記數(shù)據(jù),結(jié)合真實世界樣本空間作為無標記數(shù)據(jù),為現(xiàn)有的仿真模型訓(xùn)練出具有實際意義的模型參數(shù),并對網(wǎng)絡(luò)群體Agent 模型進行模擬仿真。
圖1 基于Agent的網(wǎng)絡(luò)群體組織模型Fig.1 Agent-based network group organization model
為解決沒有對智能行為提供直接描述方法的問題,將模型形式化建模思想引入到智能體中,研究一種能對智能性和協(xié)作性進行描述的離散事件系統(tǒng)規(guī)范。在形式化描述規(guī)范的基礎(chǔ)上,給定Agent原子模型與耦合模型的形式化描述,通過智能體模型間的相互協(xié)作,可動態(tài)修改知識庫中的信息,提高了模型獨立處理事務(wù)的能力,同時也更貼近實際,增強了自治性;為實現(xiàn)Agent在分布式交互仿真能力方面的擴充,研究協(xié)同仿真建模方法,并分析了通信機制,分別建立了Agent的知識更新與屬性更新,以及Agent的模型耦合與實例交互間的映射,對模型進行模擬推演。在模擬推演過程中,進行仿真數(shù)據(jù)提取,如圖2所示。
針對模型時域和空間域兩個方面展開分類分析,并設(shè)計數(shù)據(jù)動態(tài)采集策略。從時域方面將模型演化模式分為收斂模式、循環(huán)模式、混沌模式等,通過時間窗均勻滾動和尺度變換分別采集模型演化數(shù)據(jù)和仿真參考數(shù)據(jù),并采用動態(tài)時間規(guī)整和感知點檢測的方法對上述數(shù)據(jù)進行篩選。通過多點逐步檢測定位時域數(shù)據(jù)中的峰值和谷值點,一方面考察各關(guān)鍵點間數(shù)據(jù)波動趨勢,另一方面考察以多個關(guān)鍵點為一組的時域數(shù)據(jù)波動規(guī)律,按照上述演化模式對其進行分類采集。用空間域方法研究仿真數(shù)據(jù)分布概率,并從對象、模型軌跡參數(shù)、模型協(xié)同參數(shù)劃分空間模塊,以及不同空間模塊所需采集數(shù)據(jù)量,采用序列模式挖掘等方法對其演化模式進行挖掘?;谠隽繉W(xué)習方法的異常行為檢測流程為:利用自組織增量學(xué)習網(wǎng)絡(luò)將對歷史仿真行為數(shù)據(jù)進行模式聚類,并將當前仿真行為模式與聚類模式進行匹配和對比,得出異常行為檢測結(jié)果。首先將模型對應(yīng)的歷史行為模式數(shù)據(jù)經(jīng)自適應(yīng)降維和特征提取等方法提取關(guān)鍵點壓縮,然后通過動態(tài)聚類的方式生成多個歷史行為模式團簇。新的仿真行為模式能以增量動態(tài)訓(xùn)練的方式逐條加入并改變團簇結(jié)構(gòu),形成行為模式模型的一個參考類庫。當獲取到所需場景下仿真行為模式樣本時,可對其進行在線壓縮,并針對壓縮后的樣本尋找最近團簇,形成新的行為模式。如果當前行為模式無法加入任何行為團簇時,對行為模式進行實時對比分析,實現(xiàn)異常行為檢測。
在模型訓(xùn)練過程中,采用高效能仿真平臺機器學(xué)習模型分布式訓(xùn)練。分布式模型訓(xùn)練分為數(shù)據(jù)分布、模型分布和混合分布,高效能仿真平臺分布式訓(xùn)練采用數(shù)據(jù)分布方法。對于數(shù)據(jù)分布式來說,每一個計算節(jié)點都有一個完整模型的副本,在各個機器上處理數(shù)據(jù)集的不同部分。數(shù)據(jù)分布并行訓(xùn)練方法需要組合各個工作節(jié)點的結(jié)果,并且在節(jié)點之間更新模型參數(shù),如圖3所示。圖3(a)是一種最簡單的方法,隨機配置網(wǎng)絡(luò)模型參數(shù),將參數(shù)發(fā)布到各個計算節(jié)點,在每個節(jié)點,用數(shù)據(jù)集的一部分進行訓(xùn)練,將各個工作節(jié)點參數(shù)的均值作為全局參數(shù),該模型訓(xùn)練法稱為參數(shù)平均法。參數(shù)平均法的結(jié)果在數(shù)學(xué)上等同于用單個機器進行訓(xùn)練,但是網(wǎng)絡(luò)通信和同步的開銷非常巨大,使得額外計算節(jié)點帶來效益收益低。有一種與參數(shù)平均類似的方法,稱為“基于更新”的同步數(shù)據(jù)并行化,如圖3(b)所示。兩者的區(qū)別在于同步數(shù)據(jù)并行化只傳遞更新信息(即梯度和沖量等)。當進一步放寬同步更新條件后,得到“基于更新”的異步數(shù)據(jù)并行化,如圖3(c)所示。一旦計算得到新的更新信息就立即將其應(yīng)用于參數(shù)更新,提高并行分布模型訓(xùn)練效率。
圖2 基于Agent的網(wǎng)絡(luò)群體仿真模型評估Fig.2 Agent-based network population simulation model evaluation
圖3 高效能仿真平臺分布式機器學(xué)習模型訓(xùn)練Fig.3 High-performance simulation platform distributed machine learning model training
本文對面向平行應(yīng)急管理的高效能仿真方法進行了研究,重點介紹了面向人工社會的應(yīng)急管理仿真建模、初始情景構(gòu)建、仿真在線評估、云仿真并行作業(yè)調(diào)度等方法。以社會公共安全風險防控領(lǐng)域的社會媒體網(wǎng)絡(luò)用戶異常行為檢測為應(yīng)用背景,基于模擬推演研究了網(wǎng)絡(luò)組織行為模式,基于增量學(xué)習方法進行異常行為自動化檢測。面向平行應(yīng)急管理高效能方法需要進一步解決的問題和研究的內(nèi)容包括:1)當前高效能仿真平臺不同領(lǐng)域仿真系統(tǒng)彼此獨立,應(yīng)考慮后續(xù)成果的延續(xù)性;2)當前不同領(lǐng)域仿真資源缺乏統(tǒng)一管理,應(yīng)提高不同領(lǐng)域仿真資源的多元融合性;3)后續(xù)應(yīng)研究支撐不同領(lǐng)域仿真用戶的需求,提升高效能仿真平臺對用戶的友好性。