葉成蔭, 井元偉
(1.東北大學信息科學與工程學院,遼寧沈陽 110819;2.遼寧石油化工大學計算機與通信工程學院,遼寧撫順 113001)
隨著傳輸控制協(xié)議(transmission control protocol,TCP)應(yīng)用的快速增長,網(wǎng)絡(luò)擁塞越來越頻繁。主動隊列管理(active queue management,AQM))成為擁塞控制的研究熱點。文獻[1]對TCP網(wǎng)絡(luò)的非線性動態(tài)模型進行了線性化處理后得到了一個線性定常TCP網(wǎng)絡(luò)模型,并分析了隨機早期丟棄(random early discard,RED)算法不穩(wěn)定的原因。然而依據(jù)該模型設(shè)計的AQM控制器[2]在魯棒性方面遇到了一些困難,因為TCP網(wǎng)絡(luò)的高度變化使得網(wǎng)絡(luò)參數(shù)很難長時間保持在常值。對于時變TCP網(wǎng)絡(luò)而言,由于滑??刂葡到y(tǒng)中的滑動模態(tài)與系統(tǒng)的攝動和外界干擾無關(guān)[3],因此滑模控制在TCP網(wǎng)絡(luò)擁塞避免方面取得了較好的效果[4]。但以上文獻只適用于線性系統(tǒng)模型。文獻[5]基于非線性TCP網(wǎng)絡(luò)動態(tài)模型[6]設(shè)計了一種滑模控制器,增強了系統(tǒng)的魯棒性,但是這類控制器要求TCP負載和往返時延的界必須事先獲得。然而在實際應(yīng)用中,由于TCP負載和往返時延具有較大突發(fā)性和時變性,它們的界很難確定,從而造成控制器在實際中很難實現(xiàn)。文獻[7]利用擁塞窗口和往返時延信息設(shè)計了一種非線性主動隊列管理控制器,但是由于擁塞窗口信息在路由器端很難獲得,使得控制器在實際應(yīng)用中很難實現(xiàn)。
徑向基函數(shù)(radial basis function,RBF)神經(jīng)網(wǎng)絡(luò)具有良好的非線性逼近能力[8],若將滑??刂婆cRBF神經(jīng)網(wǎng)絡(luò)相結(jié)合設(shè)計控制器,則能進一步提高控制效果。近年來,在電力系統(tǒng)和電機磁鏈等領(lǐng)域取得了一些較好的成果[9-10],但在TCP網(wǎng)絡(luò)的擁塞控制方面則鮮有報道。
本文首先將TCP網(wǎng)絡(luò)的非線性動態(tài)模型轉(zhuǎn)換成仿射非線性形式。然后基于滑模變結(jié)構(gòu)的控制理論設(shè)計了一個滑??刂破?。然而由于TCP負載和往返時延具有較大突發(fā)性和時變性,使得網(wǎng)絡(luò)系統(tǒng)參數(shù)是未知時變的,從而導(dǎo)致滑??刂破髟趯嶋H應(yīng)用中很難實現(xiàn)。為此,本文使用RBF神經(jīng)網(wǎng)絡(luò)逼近網(wǎng)絡(luò)系統(tǒng)參數(shù),依據(jù)李雅普諾夫理論設(shè)計了RBF神經(jīng)網(wǎng)絡(luò)權(quán)值的自適應(yīng)律,采用RBF神經(jīng)網(wǎng)絡(luò)的輸出作為滑??刂破鞯膮?shù),從而使得滑??刂破饕子趯崿F(xiàn)。
文獻[6]采用基于速率的流體流分析方法,給出了TCP網(wǎng)絡(luò)非線性動態(tài)模型為
式中:r(t)為TCP連接的源端發(fā)送速率;q(t)為瞬時隊列長度;N(t)為TCP網(wǎng)絡(luò)的負載;R(t)為往返時延;Tp為傳播時延;C0為鏈路帶寬;0≤p(t)≤1為分組丟棄/標記概率,可以看作用于調(diào)節(jié)發(fā)送速率和鏈路隊列長度的控制輸入。
令eq=q(t)-qd,qd為期望的隊列長度。記x1=eq,x2=,則有
于是非線性模型(1)可表示為
滑模變結(jié)構(gòu)控制器的設(shè)計由兩部分組成。首先,設(shè)計具有良好的動態(tài)特性的滑動模面為
接著,設(shè)計使滑動模態(tài)存在的滑??刂破鱱(t),為
其中:ueq為滑模等效控制;us(t)為切換控制,用于實現(xiàn)對網(wǎng)絡(luò)系統(tǒng)的攝動和外加干擾的魯棒控制;ρ>0是切換增益。
定理1 系統(tǒng)(4)在控制律(6)、(7)和(8)的作用下能在有限時間內(nèi)到達滑動模面,并保證滑動模面是漸近穩(wěn)定的,即使滑動模態(tài)存在條件<0成立。
證明:選取Lyapunov函數(shù)如下
于是,對V關(guān)于時間t求導(dǎo),得到
將式(6)、式(7)和式(8)代入,得到
當t→∞時,s(t)→0,滑動模面s(t)=0總能在有限時間內(nèi)到達,而且是漸近穩(wěn)定的。
在實際應(yīng)用中,由于TCP負載N(t)和往返時延R(t)具有較大突發(fā)性和時變性,所以f(t)和g(x,t)是未知時變的,控制器很難實現(xiàn)??刹捎肦BF網(wǎng)絡(luò)的輸出(t)和(x,t)代替f(t)和g(x,t),實現(xiàn)自適應(yīng)神經(jīng)滑??刂?。
RBF神經(jīng)網(wǎng)絡(luò)具有如下形式,即
式中:y(x,ω)是神經(jīng) RBF 網(wǎng)絡(luò)的輸出;x=[x1,x2]是輸入狀態(tài)向量;ω∈Rn是RBF神經(jīng)網(wǎng)絡(luò)的權(quán)向量;向量φ(x)∈Rn是高斯型函數(shù),其形式為
式中:ci∈R2n是第i個神經(jīng)元的中心位置;σi∈R是第i個神經(jīng)元的寬度。
采用RBF網(wǎng)絡(luò)建立(t)和(x,t)的模型,網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。
圖1 RBF網(wǎng)絡(luò)結(jié)構(gòu)Fig.1 RBF network structure
為了進一步分析,引進如下假設(shè):
假設(shè)1 對于任意給定的逼近精度ε,存在權(quán)向量w和v,使得和分別逼近于f和g,即存在權(quán)向量w和v,使得
成立。
令wt和vt分別表示權(quán)向量w和v在t時刻的估計值,控制律(7)和(8)改寫為
式中:
由中值定理可以得到
則RBF網(wǎng)絡(luò)的權(quán)值采取自適應(yīng)機制在線調(diào)整為
令Θ=[wv]T,則 RBF網(wǎng)絡(luò)的權(quán)值誤差為(t)=Θt-Θ,逼近誤差為η(t)=Ο(‖(t)‖2)+Ο(ε)。
定理2 如果假設(shè)1成立,且滿足ρ(t)>‖η(t)‖,則系統(tǒng)(4)在控制律(6)、(13)和(14)以及自適應(yīng)律(19)的作用下能在有限時間內(nèi)到達滑動模面,并保證滑動模面是漸近穩(wěn)定的。
證明:考慮如下李雅普諾夫函數(shù):
將控制律(6)、(13)和(14)代入得到
由假設(shè)1以及式(17)、式(18)和式(19)得到
當選擇滑模切換增益ρ(t)>‖η(t)‖時,
當t→∞時,s(t)→0,滑動模面s(t)=0總能在有限時間內(nèi)到達,而且是漸近穩(wěn)定的。
參照文獻[1],網(wǎng)絡(luò)參數(shù)的選擇為,N=100,C0=1 250 分組/s,R=0.2 s,qd=100 分組?;C婵刂茀?shù)c=10,切換增益ρ=10。神經(jīng)元的中心ci在0和1之間隨機取值,神經(jīng)元的寬度σi都取1。為了便于性能分析,本文對文獻[2]提出的比例積分(proportional-integral,PI)控制器和文獻[5]提出的滑模控制(sliding mode control,SMC)與本文的神經(jīng)滑模控制器(neural sliding mode control,NSMC)進行了仿真,仿真結(jié)果如圖2~圖5所示。
從圖2可以看出,當網(wǎng)絡(luò)參數(shù)確定時,PI控制器、SMC控制器和NSMC控制器都能使瞬時隊列長度穩(wěn)定在期望值附近。但是PI控制器產(chǎn)生的波動較大,收斂時間也比較長;NSMC控制器和SMC控制器都具有較好的收斂性能,能較快地收斂到期望值附近。
圖2 網(wǎng)絡(luò)參數(shù)確定時隊列長度比較Fig.2 Comparison of queue lengths with fixed network parameters
從圖3可以看出,當網(wǎng)絡(luò)負載N從100變化到200,其它網(wǎng)絡(luò)參數(shù)不變時,PI控制器顯示出較大的穩(wěn)態(tài)誤差和較慢的暫態(tài)響應(yīng);SMC與NSMC相比,在穩(wěn)態(tài)過程中隊列長度變化有較大幅度振蕩。
當往返時延R從0.2 s變化到0.3 s,其它網(wǎng)絡(luò)參數(shù)不變時的仿真結(jié)果如圖4所示。PI控制器經(jīng)過較大地振蕩之后能夠收斂于期望值,而且在穩(wěn)態(tài)過程中,隊列長度變化比較劇烈;NSMC同SMC相比,能使隊列長度很快收斂于期望值,并且穩(wěn)態(tài)時的隊列長度變化較小而且平緩。
圖3 較大TCP負載時隊列長度比較Fig.3 Comparison under higher TCP loads
圖4 較大往返時延時隊列長度比較Fig.4 Comparison with larger round-trip time
當往返時延R從0.2 s變化到0.3 s,網(wǎng)絡(luò)負載N從100變化到200時,仿真結(jié)果如圖5所示。PI控制器的收斂速度較慢,隊列長度波動較大;SMC控制器在開始時隊列長度變化比較劇烈,而NSMC控制器的隊列長度變化比較平緩。
圖5 網(wǎng)絡(luò)參數(shù)變化時隊列長度比較Fig.5 Comparison of queue lengths with variable network parameters
針對TCP網(wǎng)絡(luò)的擁塞控制問題,將滑??刂婆cRBF神經(jīng)網(wǎng)絡(luò)相結(jié)合設(shè)計了一種主動隊列管理算法。該算法具有以下特點:
1)由于TCP負載和往返時延具有較大的突發(fā)性和時變性,使得網(wǎng)絡(luò)系統(tǒng)參數(shù)是未知時變的。為此,使用RBF神經(jīng)網(wǎng)絡(luò)逼近網(wǎng)絡(luò)系統(tǒng)參數(shù),從而使得控制器易于實現(xiàn)。
2)基于李雅普諾夫穩(wěn)定性理論設(shè)計了RBF神經(jīng)網(wǎng)絡(luò)權(quán)值的自適應(yīng)律,使得網(wǎng)絡(luò)系統(tǒng)參數(shù)得到了較好的估計,并且保證了網(wǎng)絡(luò)系統(tǒng)的穩(wěn)定性。
3)采用RBF神經(jīng)網(wǎng)絡(luò)的輸出作為滑??刂破鞯膮?shù)設(shè)計了一種主動隊列管理算法,使得系統(tǒng)狀態(tài)能在有限時間內(nèi)到達滑動模面,并保證滑動模面是漸近穩(wěn)定的,而且瞬時隊列長度具有較好的暫態(tài)和穩(wěn)態(tài)性能。
本文設(shè)計控制器時,未考慮到無響應(yīng)流對系統(tǒng)造成的影響,這將是下一步的研究工作。
[1]HOLLOT C,MISRA V,GONG W B.A control theoretic analysis of RED[C]//Proceedings of IEEE INFOCOM,April 22-26,2001,Anchorage,USA.2001:1510-1519.
[2]HOLLOT C,MISRA V,TOWSLEY D,et a1.On designing improved controllers for AQM routers supporting TCP flows[C]//Proceedings of the IEEE INFOCOM,April 22-26,2001,Anchorage,USA.2001:1726-1734.
[3]WANG S P,GAO W B.Robustness and invariance of variable structure systems with multiple inputs[C]//Proceedings of the A-merican Control Conference,June 21-23,1995,Seattle,USA.1995:1035-1039.
[4]REN F Y,LIN C,YING X H.Design a congestion controller based on sliding mode variable structure control[J].Computer Communications,2005,28(9):1050-1061.
[5]YAN P,GAO Y,?ZBAY H.A variable structure control approach to active queue management for TCP with ECN[J].IEEE Transactions on Control Systems Technology,2005,13(2):203-215.
[6]KELLY F P.Mathematical modeling of the Internet[C]//Mathematics Unlimited-2001 and Beyond,January 25,2001,Berlin,Germany.2001:685-702.
[7]陳瑋,王銀河,井元偉,等.TCP網(wǎng)絡(luò)主動隊列管理的非線性狀態(tài)反饋跟蹤控制[J].電機與控制學報,2009,13(5):762-765.
CHEN Wei,WANG Yinhe,JING Yuanwei,et al.Nonlinear state feedback tracking control algorithm for active queue management of TCP network[J].Electric Machines and Control,2009,13(5):762-765.
[8]PARK J,SANDBERG I W.Universal approximation using radial basis function networks[J].Neural Computation,1991,3(2):246-257.
[9]徐慶宏,戴先中.基于在線學習RBF神經(jīng)網(wǎng)絡(luò)的汽門開度自適應(yīng)補償控制方法[J].電機與控制學報,2010,14(2):13-19.
XU Qinghong,DAI Xianzhong.Online learning RBF neural network-based adaptive compensative control scheme for governor system[J].Electric Machines and Control,2010,14(2):13-19.
[10]劉國榮,張道祿.電機磁鏈神經(jīng)網(wǎng)絡(luò)觀測器的研究[J].電機與控制學報,2011,15(8):81-87.
LIU Guorong,ZHANG Daolu.A study of motor flux neural network observer[J].Electric Machines and Control,2011,15(8):81-87.