盧韋帆,尹秀霞
(南昌大學理學院數(shù)學系,江西南昌 330031)
隨著計算機網(wǎng)絡和無線通信技術(shù)的發(fā)展,網(wǎng)絡化控制系統(tǒng)(networked control systems,NCSs)飛速發(fā)展,引領了新的一輪產(chǎn)業(yè)的變革.網(wǎng)絡的一系列問題(帶寬資源的有限、數(shù)據(jù)丟包等)一同引入到控制系統(tǒng),大大降低了網(wǎng)絡化控制系統(tǒng)的性能[1-2].由此可見,在開放的網(wǎng)絡環(huán)境下,控制信息的安全性凸顯重要.網(wǎng)絡化控制系統(tǒng)最為常見的一種網(wǎng)絡攻擊手段-拒絕服務(denial-of-service,DoS)攻擊.DoS攻擊是一種資源耗盡型攻擊,它的攻擊目的主要是讓被攻擊的主機和服務器拒絕用戶的正常訪問,占用大量的帶寬資源,最終使得服務器資源被耗盡,造成服務器癱瘓.對于網(wǎng)絡化控制系統(tǒng),DoS攻擊會阻止遠程控制器和執(zhí)行器接收反饋信號或控制信號.在DoS攻擊下,由于缺少反饋測量信號或控制信號,網(wǎng)絡化控制系統(tǒng)將變得不穩(wěn)定[3-5].
在有限的帶寬資源下,保證網(wǎng)絡化控制系統(tǒng)的物理設備安全、信息傳輸安全、控制安全,構(gòu)建一個能夠及時應對惡意網(wǎng)絡攻擊且安全高效的工業(yè)網(wǎng)絡化控制系統(tǒng),從而實現(xiàn)DoS攻擊下網(wǎng)絡化控制系統(tǒng)預測補償控制已經(jīng)成為控制相關領域亟待研究的方向.目前,已經(jīng)有了幾種控制設計方案.文獻[6]對于功率受限的DoS攻擊下線性時變網(wǎng)絡化控制系統(tǒng)的穩(wěn)定性進行了研究.文獻[7]提出了一個由DoS攻擊頻率和DoS攻擊持續(xù)時間限制的更加通用的DoS攻擊模型.基于類似的想法,文獻[8]對動態(tài)輸出反饋控制器的DoS攻擊模型進行了擴展.文獻[9]討論了零和博弈框架應用于處理具有通信約束和DoS攻擊的線性網(wǎng)絡化控制系統(tǒng)的最優(yōu)控制和調(diào)度問題.文獻[10]研究了一種DoS攻擊下基于狀態(tài)反饋的彈性控制器的設計方案.文獻[11]探討控制器與DoS攻擊補償方案的合成問題.值得注意的是,除了上述少數(shù)研究外,大多數(shù)現(xiàn)有的研究成果都沒有考慮NCSs的安全問題,僅討論了控制設計方案.
NCSs除了DoS攻擊引起的安全問題外,由于網(wǎng)絡帶寬資源非常有限,減少對網(wǎng)絡帶寬資源的頻繁使用也是一個亟待解決的問題.通過事件觸發(fā)控制(eventtriggered control,ETC)來減少網(wǎng)絡帶寬的消耗已被廣泛研究(文獻[12]對單一連續(xù)時間系統(tǒng)的研究和文獻[13-14]對多智能體系統(tǒng)的研究),這使得ETC成為有限的帶寬資源問題的一個極具前途的解決方案.
基于上述研究,開發(fā)出一種基于觀測器的輸出反饋控制方案,既能保持系統(tǒng)穩(wěn)定性,又能主動補償DoS攻擊造成的控制信息丟失,同時大大節(jié)省網(wǎng)絡帶寬資源,更適合現(xiàn)實工業(yè)生產(chǎn)中的場景.本文提出了一種新穎的基于觀測器的預測控制方案,如圖1所示,稱為基于觀測器的記憶型事件觸發(fā)預測控制(observer memory-based event-triggered predictive control,OBMETPC).在這個框架下,本文將研究基于觀測器的預測控制系統(tǒng),以主動補償由于DoS攻擊造成的數(shù)據(jù)丟失.并利用預測控制的基本思想、線性矩陣不等式(linear matrix inequality,LMI)和Lyapunov穩(wěn)定性理論來解決記憶型事件觸發(fā)矩陣、觀測器增益矩陣和控制器增益矩陣的聯(lián)合設計問題.這項工作是對預測控制(predictive control,PC)和DoS攻擊下的事件觸發(fā)機制(event-triggered,ET)成果的重大拓展.OB-METPC的優(yōu)點有以下4個方面.
圖1 DoS攻擊下NCSs的結(jié)構(gòu)框架Fig.1 Framework of NCSs under DoS attacks
1) OB-METPC的通信方案不同于PC[15-16]的通信方案,后者采用了時間觸發(fā)的通信方案.而本文則基于記憶型事件觸發(fā)通信方案(memory event-triggered systems,METS)來設計控制器,極大程度上減少了對帶寬資源的占用.同時,充分利用歷史觸發(fā)狀態(tài)信息,使得預測控制的數(shù)據(jù)包更加合理.
2) 與現(xiàn)有的DoS攻擊的預測控制補償方案[17]相比,本文提出的OB-METPC的另一個優(yōu)點是結(jié)合了PC和ET的優(yōu)點[11,16,18-19].通過模型和靜態(tài)觀測器的結(jié)合,解決無法直接獲得被控裝置狀態(tài)信息的問題,還可以主動補償DoS攻擊導致的數(shù)據(jù)包丟失,極大提高了DoS攻擊下NCSs的穩(wěn)定性.
3) 與最新的DoS攻擊補償方案相比,文獻[11]中的方法只考慮了從控制器到執(zhí)行器的DoS攻擊.本文所提出的新穎的OB-METPC解決了傳感器到控制器和控制器到執(zhí)行器兩個通信通道上都存在DoS攻擊的情況,更符合現(xiàn)實工業(yè)生產(chǎn)的控制場景.
4) 給出觀測器增益矩陣L、控制器增益矩陣K和事件觸發(fā)矩陣Φ的聯(lián)合設計準則.
本文的其余部分如下:第2節(jié)為DoS攻擊下的網(wǎng)絡化控制系統(tǒng)的問題描述和系統(tǒng)建模;第3節(jié)涉及OBMETPC的穩(wěn)定性分析;第4節(jié)通過仿真實例驗證了DoS攻擊下OB-METPC的可行性;最后,第5節(jié)得出最終結(jié)論.
本文的符號定義見表1.
表1 符號說明Table 1 Notation
網(wǎng)絡化控制系統(tǒng)的動態(tài)演化規(guī)律用以下離散系統(tǒng)來描述:
其中:x(t)∈Rn為狀態(tài)矢量,u(t)∈Rm為控制矢量,y(t)∈Rq為輸出矢量.A,B,C為系統(tǒng)(1)的適當維數(shù)矩陣,K為反饋增益矩陣.系統(tǒng)(1)的初始狀態(tài)是x(t0)x(0).
全維狀態(tài)觀測器描述如下:
觀測器的誤差系統(tǒng)可以描述成
為了提高網(wǎng)絡帶寬資源的利用率,本文在傳感器側(cè)引入記憶型事件觸發(fā)裝置1,用于判斷是否需要向控制器側(cè)發(fā)送數(shù)據(jù)包.如圖1所示,引入緩沖區(qū)1用于儲存前m個觸發(fā)狀態(tài).當有新的觸發(fā)狀態(tài)(tk+1)存入緩沖區(qū)1則會相應剔除歷史觸發(fā)狀態(tài)(tk+1-m),使得緩沖區(qū)1中始終儲存最新的m個成功觸發(fā)的狀態(tài).
其中:記憶型事件觸發(fā)裝置1中的事件觸發(fā)方案為:假設成功觸發(fā)事件觸發(fā)裝置1的時間為tk(k1,2,···),成功觸發(fā)記憶型事件觸發(fā)裝置1的觀測器狀態(tài)信息為(tk).下一個觸發(fā)時刻為
假設1系統(tǒng)(1)采用等時采樣.采樣周期為h,所有數(shù)據(jù)包都帶有時間戳.
假設2系統(tǒng)(A,B)完全能控,系統(tǒng)(A,C)完全能觀.
考慮如下可變攻擊時長的周期性DoS攻擊[20]:
其中:T表示DoS攻擊周期;Toff表示一個DoS攻擊周期內(nèi)系統(tǒng)不遭受DoS攻擊的安全時長,n ∈Z+表示DoS攻擊周期數(shù),IDoS0表示無DoS攻擊,IDoS1表示有攻擊,攻擊模型見圖2.
圖2 周期性DoS攻擊Fig.2 Periodic DoS attacks
假設4一個周期內(nèi)DoS攻擊的持續(xù)攻擊時間為DoS的攻擊強度γ.
假設5考慮的DoS攻擊導致的數(shù)據(jù)包丟失率是100%,相鄰兩次DoS攻擊的時間間隔大于M.
假設6對正整數(shù)n,DoS攻擊周期T和系統(tǒng)采樣周期h之間有如下大小關系:
目前關于DoS攻擊下預測控制器的研究大多是基于時間觸發(fā)機制.為了對DoS攻擊進行有效補償?shù)耐瑫r減少占用網(wǎng)絡帶寬資源,本節(jié)將事件觸發(fā)機制和預測控制結(jié)合而成事件觸發(fā)預測控制器.與此同時,為了更加充分地利用到歷史的觸發(fā)狀態(tài),本文設計了OB-METPC.假設系統(tǒng)的預測模型是已知的,基于METS的預測控制器設計結(jié)構(gòu)如圖3所示.
圖3 DoS攻擊下NCSs記憶型事件觸發(fā)預測控制器Fig.3 METPC of NCSs under DoS attacks
為主動補償DoS攻擊導致的狀態(tài)數(shù)據(jù)包的丟失,在緩沖區(qū)3中選擇前m個控制序列包用于預測新的狀態(tài)信息.一旦預測控制器成功接收到觀測器狀態(tài)(tsi),預測控制器(11)基于(tsi)展開預測
為了減小需要發(fā)送的預測控制序列數(shù)據(jù)包的大小,在預測控制器中引入記憶型事件觸發(fā)裝置2.成功觸發(fā)的預測控制序列被打包成單個數(shù)據(jù)包,并通過通信網(wǎng)絡發(fā)送到執(zhí)行器端.是之后第1個觸發(fā)記憶型事件觸發(fā)裝置2時刻
在記憶型事件觸發(fā)裝置2中引入緩沖區(qū)2用于儲存前m個成功觸發(fā)狀態(tài).成功觸發(fā)記憶型事件觸發(fā)裝置2的預測狀態(tài)數(shù)據(jù)包
卡爾曼濾波用狀態(tài)方程和遞推方法進行估計,根據(jù)前一個估計值和最近一個測量數(shù)據(jù)來估計信號的當前值,其解以估計值的形式給出??柭鼮V波算法如下[8]。
由式(11)可得,基于METS的反饋控制序列
則li個預測控制序列
存儲在緩沖器3中,供預測控制模型選擇合適的控制序列進行預測.然后,預測控制序列U()將通過通信網(wǎng)絡傳輸?shù)綀?zhí)行器端,并且儲存在緩沖區(qū)4中,供ZOH選擇后發(fā)送給執(zhí)行器,從而主動補償DoS攻擊對系統(tǒng)的影響.
引理1由文獻[18],比較觀測器(2)、記憶型事件觸發(fā)預測控制器(8)和預測模型(10),有必要提出以下關系用于證明閉環(huán)系統(tǒng)的穩(wěn)定性:
引理2對于矩陣R >0和SST,有
其中ρ是任意的常數(shù)(見文獻[12]).
根據(jù)觀測器(2)、記憶型事件觸發(fā)預測控制器(8)、預測模型(10)和引理1,事件觸發(fā)條件(7)下主動補償DoS攻擊的閉環(huán)系統(tǒng)表示為
由事件觸發(fā)條件(7)可得
本節(jié)將設計出METS(7)下觀測器增益矩陣L、狀態(tài)反饋控制器增益矩陣K和事件觸發(fā)矩陣Φ.
注3引入矩陣不等式(54)用于解決A-LC引起的非線性項問題.首先單獨求解矩陣不等式(54)以解得L,再把解得的L代入矩陣不等式(53)中進一步求解相應矩陣不等式.
此定理的證明通過以下步驟完成:
步驟1構(gòu)造Lyapunov函數(shù)
其中P,Q,R是對稱正定矩陣.
步驟3由Schur補定理可得
對式(56)分別左乘、右乘對角矩陣
則矩陣不等式(56)可轉(zhuǎn)化為
這一節(jié),將OB-METPC應用于智能電網(wǎng)中的配電測試饋線的4-總線模型[21].設采樣周期為h0.02 s,DoS攻擊周期為T2 s,觸發(fā)參數(shù)為τ0.0064,m4,μ00.1,μ10.2,μ20.3,μ30.4,ρ1,其他參數(shù)具體可參見文獻[21].設矩陣C為
基于定理1,運用MATLAB求解得到相應的控制器增益矩陣K、觀測器增益矩陣L和事件觸發(fā)矩陣Φ分別為
通過比較不同攻擊強度的DoS攻擊來驗證OBMETPC主動補償攻擊的有效性.其次,通過基于OBMETPC的3個不同模擬實驗結(jié)果與其他兩種主流DoS攻擊補償方案(分別為基于觀測器事件觸發(fā)預測控制OB-ETPC[22-23]和事件觸發(fā)控制ETC[24-25])相比.
情況1DoS攻擊下基于上述所求的K和L的OB-METPC和OB-ETPC的系統(tǒng)狀態(tài)響應和事件間隔分別如圖4和圖5所示.
圖4 DoS攻擊下OB-METPC的狀態(tài)響應和觸發(fā)間隔Fig.4 State responses and triggering intervals of OBMETPC under DoS attacks
圖5 DoS攻擊下OB-ETPC的狀態(tài)響應和觸發(fā)間隔Fig.5 State responses and triggering intervals of OBETPC under DoS attacks
如圖4和圖5所示,無論是基于OB-METPC還是基于OB-ETPC的網(wǎng)絡化控制系統(tǒng),都能夠在遇到DoS攻擊時維持系統(tǒng)狀態(tài)穩(wěn)定.基于OB-METPC和OBETPC能夠完全補償任何攻擊強度的DoS攻擊(例如γ1 s或γ1.5 s)所造成的數(shù)據(jù)包丟失.其中:攻擊強度γ1 s時攻擊區(qū)間為(0 s,0.5 s)∪(1 s,1.5 s)∪(2 s,2.5 s)∪(3 s,3.5 s)∪(4 s,4.5 s)∪(5 s,5.5 s);γ1.5 s時攻擊區(qū)間為(0 s,0.75 s)∪(1 s,1.75 s)∪(2 s,2.75 s)∪(3 s,3.75 s)∪(4 s,4.75 s)∪(5 s,5.75 s).
由表2和表3可得,在500次采樣時間內(nèi),當NCSs遭遇弱DoS攻擊后達到系統(tǒng)穩(wěn)定時,基于OB-METPC的控制系統(tǒng)需要135個數(shù)據(jù)包;而基于OB-ETPC的控制系統(tǒng)所需的數(shù)據(jù)包數(shù)量為82個.當NCSs遭遇強DoS攻擊時,系統(tǒng)的穩(wěn)定在OB-METPC的控制下僅需25個數(shù)據(jù)包,而在OB-ETPC則需要46個.
表2 DoS攻擊(γ1 s)下3種方案的對比Table 2 Comparison of the three schemes under DoS attacks(γ1 s)
表2 DoS攻擊(γ1 s)下3種方案的對比Table 2 Comparison of the three schemes under DoS attacks(γ1 s)
表3 DoS攻擊(γ1.5 s)下3種方案的對比Table 3 Comparison of the three schemes under DoS attacks(γ1.5 s)
表3 DoS攻擊(γ1.5 s)下3種方案的對比Table 3 Comparison of the three schemes under DoS attacks(γ1.5 s)
基于圖6-7,NCSs的快速性指標調(diào)節(jié)時間及平穩(wěn)性指標超調(diào)量,在改善系統(tǒng)動態(tài)性能方面,OB-METPC要優(yōu)于OB-ETPC.在兩種事件觸發(fā)機制的觸發(fā)次數(shù)相差不大的前提下,基于OB-METPC的網(wǎng)絡化控制系統(tǒng)收斂于0.9%誤差帶的調(diào)節(jié)時間僅需1.34 s,而基于OB-ETPC的網(wǎng)絡化控制系統(tǒng)收斂于2%誤差帶則需2.1 s.除此之外,基于OB-METPC的網(wǎng)絡化控制系統(tǒng)的超調(diào)量為σ%7.583%,而基于OB-ETPC的網(wǎng)絡化控制系統(tǒng)的超調(diào)量σ%>9.7%.OB-METPC不僅能夠減少數(shù)據(jù)傳輸量,還能有效提升系統(tǒng)的動態(tài)性能.
圖6 DoS攻擊下OB-METPC的動態(tài)性能Fig.6 Dynamic performance of OB-METPC under DoS attacks
圖7 DoS攻擊下OB-ETPC的動態(tài)性能Fig.7 Dynamic performance of OB-ETPC under DoS attacks
情況2在弱DoS攻擊(γ1 s)下,基于上述所求的K和L的OB-METPC和基于ETC的系統(tǒng)狀態(tài)響應和事件觸發(fā)間隔分別如圖8和圖9所示.基于ETC,OB-ETPC和OB-METPC3種方案的控制系統(tǒng)的比較見表2.由于仿真實例是在弱DoS攻擊的上限進行的,基于ETC的方案遭受弱DoS攻擊范圍內(nèi)的任意攻擊,能夠在一段時間后保持系統(tǒng)穩(wěn)定.
圖8 DoS攻擊(γ=1 s)下OB-METPC的狀態(tài)響應和觸發(fā)間隔Fig.8 State responses and triggering intervals of OBMETPC under DoS attacks(γ=1 s)
圖9 DoS攻擊(γ=1 s)下ETC的狀態(tài)響應和觸發(fā)間隔Fig.9 State responses and triggering intervals of ETC under DoS attacks(γ=1 s)
情況3在強DoS攻擊(γ1.5 s)下,基于上述所求的K和L的OB-METPC和基于ETC的系統(tǒng)狀態(tài)響應和事件觸發(fā)間隔分別如圖10和圖11所示.基于ETC,OB-ETPC和OB-METPC3種方案的控制系統(tǒng)的比較見表3,其中:基于ETC的控制方案無法有效地維持系統(tǒng)的性能,最終基于ETC的控制系統(tǒng)失去穩(wěn)定性.然而,由于OB-METPC可以完全補償DoS攻擊,在遭受強DoS攻擊后,基于OB-METPC的控制系統(tǒng)仍然能夠保持穩(wěn)定.
圖10 DoS攻擊(γ=1.5 s)下OB-METPC的狀態(tài)響應和觸發(fā)間隔Fig.10 State responses and triggering intervals of OBMETPC under DoS attacks(γ=1.5 s)
圖11 DoS攻擊(γ=1.5 s)下ETC的狀態(tài)響應和觸發(fā)間隔Fig.11 State responses and triggering intervals of ETC under DoS attacks(γ=1.5 s)
注4由于仿真實驗中系統(tǒng)的狀態(tài)是連續(xù)進行,即DoS攻擊的補償瞬間完成.因此,定義預測控制補償比(χ)來衡量仿真實驗中預測控制的補償作用,其中預測控制補償比為仿真實驗中執(zhí)行端數(shù)據(jù)包的接收量與事件觸發(fā)裝置1的觸發(fā)次數(shù)(即通過事件觸發(fā)裝置1的數(shù)據(jù)包發(fā)送量)之比.基于OBMETPC能有效減少調(diào)節(jié)時間,從而達到了提升系統(tǒng)動態(tài)性能的效果.
本文研究了在DoS攻擊下網(wǎng)絡化控制系統(tǒng)中基于靜態(tài)觀測器的記憶型事件觸發(fā)預測控制問題.OBMETPC是一種解決DoS攻擊問題新穎的方法.仿真實驗結(jié)果表明,在系統(tǒng)中引入觀測器和預測模型對補償DoS攻擊有重大影響.建立METS大大減少了預測控制序列補償數(shù)據(jù)包的大小,同時充分利用了歷史的觸發(fā)狀態(tài),使得預測的數(shù)據(jù)包更加合理.實際應用表明該方法不僅可以主動補償DoS攻擊、改善系統(tǒng)的動態(tài)性能,還可以減少帶寬資源占用,保證了DoS攻擊下NCSs的穩(wěn)定性能.
在未來研究中,OB-METPC有望解決通信失敗下多智能體系統(tǒng)的一致性控制問題[5,13-14].