文/孫紅燕,王少華,王芳
以數(shù)字信息系統(tǒng)為研究對(duì)象,本文首先簡(jiǎn)要闡述了數(shù)據(jù)融合的概念;其次深入分析了多源異構(gòu)監(jiān)測(cè)數(shù)據(jù)融合方式;再次圍繞多源數(shù)據(jù)融合在線監(jiān)測(cè)方法展開討論,如構(gòu)建在線監(jiān)測(cè)平臺(tái)、細(xì)化在線監(jiān)測(cè)流程等;最后對(duì)系統(tǒng)運(yùn)行效果進(jìn)行了說明,旨在為相關(guān)人員提供參考。
作為評(píng)估數(shù)字信息系統(tǒng)安全性能的重要工具之一,多源異構(gòu)數(shù)據(jù)融合在線監(jiān)測(cè)的重要性不言而喻。近年來(lái),這種監(jiān)測(cè)方式在數(shù)字信息系統(tǒng)監(jiān)測(cè)中的應(yīng)用較為廣泛。實(shí)踐證明,該檢測(cè)方式在實(shí)時(shí)獲取并融合多源異構(gòu)數(shù)據(jù)、提升數(shù)字信息系統(tǒng)結(jié)構(gòu)安全性等方面均表現(xiàn)出顯著的積極作用。
數(shù)據(jù)融合是指將具有相同結(jié)構(gòu)的數(shù)據(jù)資源融合成實(shí)用、準(zhǔn)確的表現(xiàn)形式,確保單一數(shù)據(jù)和監(jiān)測(cè)點(diǎn)的準(zhǔn)確性。在一般情況下,多源異構(gòu)信息融合可依據(jù)數(shù)據(jù)融合形式分為數(shù)據(jù)層、特征層以及決策融合層。其中,數(shù)據(jù)層通常作為數(shù)據(jù)融合的最底層,其主要借助傳感器監(jiān)測(cè)的方式完成初步分析和集成,并通過提取相關(guān)融合數(shù)據(jù),明確數(shù)字信息系統(tǒng)的時(shí)程特性。當(dāng)前,這種方式主要用于融合原始信息、處理海量信息數(shù)據(jù)等方面。特征層是數(shù)據(jù)融合的中間層,其不僅需要提取不同類型的監(jiān)測(cè)值以及觀測(cè)指標(biāo)的特征向量,還需要將獲得的特征向量進(jìn)行充分融合,進(jìn)而得到所需信息數(shù)據(jù)。特征層簡(jiǎn)單靈活,因而被廣泛應(yīng)用于融合應(yīng)用中。決策層是數(shù)據(jù)融合的最高層,在實(shí)際應(yīng)用中,技術(shù)人員需要做好專家決策系統(tǒng)分析和數(shù)據(jù)庫(kù)推導(dǎo)等工作。相較于特征層,決策層在處理觀測(cè)指標(biāo)特征向量時(shí),需要利用模式識(shí)別的方式,做好不同類型傳感器的監(jiān)測(cè)工作,并通過多源異構(gòu)監(jiān)測(cè)對(duì)數(shù)字信息系統(tǒng)的運(yùn)行狀態(tài)做出進(jìn)一步評(píng)估,以確保其兼具數(shù)據(jù)層、特征層的特性。[1]
多源異構(gòu)監(jiān)測(cè)數(shù)據(jù)融合方式的運(yùn)行原理是,將不同量綱作為監(jiān)測(cè)指標(biāo),以達(dá)到數(shù)據(jù)融合的目的。當(dāng)前,技術(shù)人員在采用多源異構(gòu)監(jiān)測(cè)數(shù)據(jù)時(shí)應(yīng)按照以下三個(gè)步驟進(jìn)行:(1)利用小波分析方式,監(jiān)測(cè)不同監(jiān)測(cè)點(diǎn)原始時(shí)間序列產(chǎn)生的誤差,避免干擾因素的產(chǎn)生;(2)將不同監(jiān)測(cè)點(diǎn)的類型和去噪時(shí)間序列融合為同一個(gè)綜合序列;(3)將監(jiān)測(cè)指標(biāo)綜合序列有機(jī)地融合為綜合監(jiān)測(cè)信息序列,且該綜合監(jiān)測(cè)信息序列除包含位移、應(yīng)力信息外,還應(yīng)包括傾斜度監(jiān)測(cè)數(shù)據(jù)信息。
此外,在數(shù)字信息系統(tǒng)監(jiān)測(cè)過程中,監(jiān)測(cè)數(shù)據(jù)主要為低頻信號(hào)和平穩(wěn)信號(hào)??紤]到小波閾值去噪法主要是依據(jù)原始監(jiān)測(cè)數(shù)據(jù)進(jìn)行后續(xù)去噪處理的,因此,在對(duì)小波閾值進(jìn)行去噪處理時(shí),技術(shù)人員首先需要合理選擇小波基函數(shù)與分解層數(shù),并將其分解為不同的尺度層;其次,技術(shù)人員應(yīng)依據(jù)閾值的計(jì)算和函數(shù)處理方式,完成對(duì)小波系數(shù)的限制;最后,技術(shù)人員應(yīng)對(duì)閾值進(jìn)行重新架構(gòu),同時(shí)做好高頻系數(shù)和低頻系數(shù)的處理,從而獲得去噪后的監(jiān)測(cè)序列。
在構(gòu)建在線監(jiān)測(cè)平臺(tái)過程中,考慮到數(shù)字信息系統(tǒng)內(nèi)部數(shù)據(jù)監(jiān)測(cè)工作較為復(fù)雜,且具有監(jiān)測(cè)時(shí)間較長(zhǎng)、監(jiān)測(cè)內(nèi)容相對(duì)較多等特點(diǎn),如果繼續(xù)使用傳統(tǒng)的人工實(shí)時(shí)監(jiān)測(cè)技術(shù),可能會(huì)因監(jiān)測(cè)工作量過多而降低監(jiān)測(cè)工作質(zhì)量。為了切實(shí)解決上述問題,技術(shù)人員應(yīng)放棄常規(guī)做法,并引入多源異構(gòu)數(shù)據(jù)融合技術(shù),將其與監(jiān)控內(nèi)容相關(guān)的數(shù)據(jù)進(jìn)行有效整合,以此提升監(jiān)測(cè)工作的質(zhì)量與效率。具體來(lái)說,在實(shí)際應(yīng)用過程中,面向服務(wù)架構(gòu)模型作為一種組件模型,可以通過對(duì)分布式粗粒度進(jìn)行有效組合等方式,實(shí)現(xiàn)對(duì)不同信息的靈活調(diào)用,并將對(duì)應(yīng)信息用于多源異構(gòu)數(shù)據(jù)的整合分析工作中,進(jìn)而在解決信息孤島問題的同時(shí),為監(jiān)測(cè)及后續(xù)工作的順利推進(jìn)提供有力支持。需要注意的是,該在線監(jiān)測(cè)平臺(tái)的通信接口應(yīng)使用Web Service進(jìn)行搭建,并及時(shí)建立通信協(xié)議,以確保構(gòu)建數(shù)據(jù)的格式符合標(biāo)準(zhǔn)。
在本次研究中,在線檢測(cè)平臺(tái)主要由數(shù)據(jù)層、交換層、集成層與用戶層四部分構(gòu)成。其中,數(shù)據(jù)層主要負(fù)責(zé)接收、存儲(chǔ)系統(tǒng)數(shù)據(jù)信息;交換層的主要任務(wù)是確保數(shù)據(jù)信息完成異構(gòu)數(shù)據(jù)與XML(可擴(kuò)展標(biāo)記語(yǔ)言)格式數(shù)據(jù)的雙向轉(zhuǎn)換;集成層又可細(xì)分為平臺(tái)管理中心、數(shù)據(jù)交換服務(wù)中心、數(shù)據(jù)中心三個(gè)部分,在具體應(yīng)用過程中,其主要負(fù)責(zé)系統(tǒng)維護(hù)管理、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)存儲(chǔ)備份等工作;用戶層則是面向用戶的人機(jī)交互系統(tǒng),其主要負(fù)責(zé)用戶登錄、權(quán)限管理等工作。[2]
技術(shù)人員對(duì)多源異構(gòu)數(shù)據(jù)進(jìn)行在線監(jiān)測(cè)的主要流程如下。第一步,采集數(shù)字信息系統(tǒng)性能數(shù)據(jù)。第二步,融合采集來(lái)的多源異構(gòu)數(shù)據(jù),并通過評(píng)價(jià)模型對(duì)融合數(shù)據(jù)進(jìn)行分析,以明確異常數(shù)據(jù)及產(chǎn)生異常的原因。第三步,預(yù)測(cè)指標(biāo)數(shù)據(jù)變化趨勢(shì),并以此判斷系統(tǒng)實(shí)時(shí)性能態(tài)勢(shì)。第四步,將異常數(shù)據(jù)導(dǎo)入預(yù)警平臺(tái),由平臺(tái)對(duì)其進(jìn)行格式化處理;與此同時(shí),平臺(tái)將基于關(guān)聯(lián)挖掘策略捕獲同類信息,并將捕獲的信息合并成壓縮包發(fā)送給對(duì)應(yīng)的工作人員,進(jìn)而為其后續(xù)工作的順利開展提供理論依據(jù)。
此外,上文提及的性能數(shù)據(jù)主要涉及應(yīng)用性能、基礎(chǔ)資源和網(wǎng)絡(luò)性能三個(gè)方面。其中,應(yīng)用性能又可細(xì)分為服務(wù)端重置率、并發(fā)連接數(shù);基礎(chǔ)資源主要是指內(nèi)存占比和CPU 占比;網(wǎng)絡(luò)性能則以網(wǎng)絡(luò)延時(shí)、吞吐量等為主要內(nèi)容。
1.數(shù)據(jù)融合
數(shù)據(jù)融合的步驟具體如下:首先,將數(shù)據(jù)格式化,并確保數(shù)據(jù)標(biāo)識(shí)、存儲(chǔ)格式完全一致;其次,檢測(cè)異常值、缺失值,并視情況對(duì)相關(guān)數(shù)據(jù)進(jìn)行處理或者填充;最后,對(duì)數(shù)據(jù)進(jìn)行脫敏,再按照所屬類別進(jìn)行分類存儲(chǔ)。
2.異常檢測(cè)
在通常情況下,“明確監(jiān)測(cè)要點(diǎn)”步驟所使用的評(píng)價(jià)模型應(yīng)內(nèi)置異常檢測(cè)、異常定位等功能模塊。其中,異常檢測(cè)模塊主要用于自動(dòng)檢測(cè)數(shù)據(jù),并將異常數(shù)據(jù)上傳至異常定位模塊;異常定位模塊則負(fù)責(zé)以事件、指標(biāo)數(shù)據(jù)之間存在關(guān)聯(lián)為依據(jù),通過因果推導(dǎo)的方式對(duì)根因事件所處位置加以明確。
(1)異常檢測(cè)模塊。該模塊可通過檢測(cè)動(dòng)態(tài)閾值及固定閾值的方式,確定數(shù)據(jù)異常情況。其中,動(dòng)態(tài)閾值法多用于對(duì)周期性、趨勢(shì)性明顯的數(shù)據(jù)進(jìn)行檢測(cè),它可先行依托指數(shù)平滑法確定數(shù)據(jù)趨勢(shì),再將其分段處理,并對(duì)動(dòng)態(tài)時(shí)間窗口進(jìn)行設(shè)定,進(jìn)而將各周期內(nèi)相同時(shí)間窗口所對(duì)應(yīng)的數(shù)據(jù)劃入正態(tài)分布陣營(yíng),并在此基礎(chǔ)上根據(jù)數(shù)據(jù)特點(diǎn)確定動(dòng)態(tài)閾值。固定閾值法則多用于對(duì)波動(dòng)相對(duì)平穩(wěn)的數(shù)據(jù)進(jìn)行檢測(cè)。通常,技術(shù)人員需要先借助服務(wù)器端對(duì)恒定閾值進(jìn)行設(shè)定,再對(duì)比數(shù)據(jù)值、閾值大小。如果數(shù)據(jù)值不在標(biāo)準(zhǔn)閾值范圍內(nèi),那么該數(shù)據(jù)可視為異常數(shù)據(jù),反之則屬于正常數(shù)據(jù)。
(2)異常定位模塊。該模塊主要由異常診斷樹、關(guān)聯(lián)分析兩部分組成。其中,異常診斷樹主要以歷史經(jīng)驗(yàn)為依據(jù),對(duì)異常數(shù)據(jù)根因進(jìn)行挖掘;關(guān)聯(lián)分析的核心功能是對(duì)異常數(shù)據(jù)相關(guān)事件或指標(biāo)進(jìn)行挖掘,進(jìn)而為后續(xù)問題定位提供理論依據(jù)。[3]
3.預(yù)測(cè)數(shù)據(jù)
對(duì)數(shù)據(jù)、系統(tǒng)性能態(tài)勢(shì)進(jìn)行預(yù)測(cè)的具體步驟如下:首先,針對(duì)序列數(shù)據(jù)進(jìn)行建模,并對(duì)線性成分進(jìn)行預(yù)測(cè);其次,基于LSTM(長(zhǎng)短記憶網(wǎng)絡(luò))模型預(yù)測(cè)非線性成分;最后,將線性、非線性成分對(duì)應(yīng)的預(yù)測(cè)值相加,即可得出最終結(jié)果。
實(shí)踐證明,本文所設(shè)計(jì)的多源數(shù)據(jù)融合在線監(jiān)測(cè)體系可以依托數(shù)據(jù)采集平臺(tái)對(duì)信息系統(tǒng)相關(guān)數(shù)據(jù)進(jìn)行采集,進(jìn)而達(dá)到實(shí)時(shí)監(jiān)測(cè)的目的。簡(jiǎn)單來(lái)說,該系統(tǒng)所搭載的功能模塊能夠?qū)λ杉瘮?shù)據(jù)進(jìn)行融合,在降低后續(xù)數(shù)據(jù)處理難度的前提下,為提高結(jié)果的精度提供有力保障。完成融合處理后,評(píng)價(jià)模型將對(duì)數(shù)據(jù)異常情況進(jìn)行檢測(cè),并在確定疑似根因后,自動(dòng)將相關(guān)信息上傳至預(yù)警平臺(tái),從而確保工作人員及時(shí)、準(zhǔn)確地了解系統(tǒng)的運(yùn)行狀態(tài)。
綜上所述,數(shù)字信息系統(tǒng)狀態(tài)監(jiān)測(cè)主要依據(jù)監(jiān)測(cè)指標(biāo)對(duì)監(jiān)測(cè)點(diǎn)進(jìn)行分析,并基于產(chǎn)生不同量綱的監(jiān)測(cè)數(shù)據(jù)得出所需數(shù)據(jù)信息。在實(shí)際應(yīng)用中,技術(shù)人員需要對(duì)原始數(shù)據(jù)進(jìn)行充分、全面的評(píng)估,以確保系統(tǒng)的整體安全。事實(shí)證明,采用多源異構(gòu)監(jiān)測(cè)分析的方式,能夠?qū)?shù)據(jù)進(jìn)行綜合性分析和實(shí)時(shí)監(jiān)測(cè),且數(shù)據(jù)監(jiān)測(cè)結(jié)果科學(xué)、準(zhǔn)確,能夠?yàn)閿?shù)字信息系統(tǒng)的穩(wěn)定、高效運(yùn)行奠定良好基礎(chǔ)。