李業(yè)謙,熊紅云
(1.中山大學(xué)南方學(xué)院,廣州 510970;2.中南大學(xué)自動化學(xué)院,長沙 410083)
隨信息技術(shù)的發(fā)展,現(xiàn)大部分大學(xué)都建立校園網(wǎng)。本文以某目標學(xué)校為例,學(xué)校已實現(xiàn)有線網(wǎng)絡(luò)與無線網(wǎng)絡(luò)全覆蓋。建校初期主要以有線為主,后來逐漸隨著學(xué)校信息化建設(shè)需求,改為無線網(wǎng)絡(luò)為主。學(xué)校區(qū)域分布明確,主要分為學(xué)生宿舍區(qū)域、教學(xué)實驗區(qū)域、行政辦公區(qū)域以及其他場館等區(qū)域。
學(xué)校采用目前很多高校采用五層無線網(wǎng)絡(luò)框架結(jié)構(gòu),移動設(shè)備層、接入層、匯聚層、核心層、出口應(yīng)用層。其中移動設(shè)備層主要是移動終端,包括個人電腦、移動電話等;接入層主要為移動設(shè)備層提供無線網(wǎng)絡(luò)接入,典型設(shè)備如無線路由或AP;匯聚層是樓宇或者片區(qū)的信息匯聚點,為接入層提供數(shù)據(jù)匯聚、傳輸、管理等服務(wù);核心層主要功能是實現(xiàn)骨干網(wǎng)絡(luò)之間的優(yōu)化傳輸;應(yīng)用層為管理者提供分析與審計等。
SNMP(Simple Network Management Protocol,簡單網(wǎng)絡(luò)管理協(xié)議)運行在ISO/OSI參考模型的應(yīng)用層,目前主流的網(wǎng)絡(luò)設(shè)備都支持SNMP協(xié)議。網(wǎng)絡(luò)技術(shù)人員可以使用SNMP對網(wǎng)絡(luò)設(shè)備的運行情況進行監(jiān)管,通過SNMP反饋的狀態(tài)事件信息,能及時發(fā)現(xiàn)網(wǎng)絡(luò)中存在的問題并處理。因此為了得到精準的數(shù)據(jù),在匯聚設(shè)備的啟用SNMP協(xié)議,實時收集匯聚設(shè)備的狀態(tài),包括各個端口的上行和下載的數(shù)據(jù)包數(shù)量,從而進行統(tǒng)計計算分析。
接入節(jié)點網(wǎng)絡(luò)負載的采集的包含SNMP數(shù)據(jù)報文的數(shù)據(jù)包,在SNMP管理系統(tǒng)中規(guī)定了SNMP報文是由管理站和代理這兩部分進行管理信息交換。其中SNMP報文格式由公共SNMP首部、get/set首部和trap首部與變量綁定三部分組成。同時將讀取的SNMP數(shù)據(jù)包進行解析,按照網(wǎng)絡(luò)節(jié)點編號為關(guān)鍵值進行存儲,構(gòu)建智慧校園無線網(wǎng)絡(luò)接入節(jié)點不同時間、負載等信息的數(shù)據(jù)庫。
為了統(tǒng)計了解各個樓宇、每層接入的網(wǎng)絡(luò)負載情況,在匯聚的端口進行了實時狀態(tài)統(tǒng)計,由于學(xué)校內(nèi)主要的網(wǎng)絡(luò)負載在學(xué)生群體、教學(xué)實驗區(qū)域和圖書館區(qū)域,本次數(shù)據(jù)主要針對這三部分區(qū)域網(wǎng)絡(luò)負載進行采集,并分別計算各個棟樓宇的網(wǎng)絡(luò)上行和下行的數(shù)據(jù)包數(shù)據(jù)進行統(tǒng)計分析。
為了更好說明智慧校園無線網(wǎng)絡(luò)負載特性,以及簡化模型,提出如下假設(shè):
(1)整個無線網(wǎng)絡(luò)的主體拓撲結(jié)構(gòu)相對不變;
(2)智慧校園無線網(wǎng)絡(luò)中的用戶數(shù)是不變的;
(3)在特定時間條件下,每個用戶只容許接入一個無線設(shè)備;
(4)在一定的時間范圍內(nèi),用戶的空間位置相對固定;
(5)無線網(wǎng)絡(luò)中的接入節(jié)點可容許接入數(shù)是有上限要求;
(6)在特定時刻用戶能容許上傳或上傳數(shù)據(jù);
(7)無線網(wǎng)絡(luò)中的樓宇數(shù)是固定的。
基于上述提出的假設(shè),下面提出與智慧校園無線網(wǎng)絡(luò)相關(guān)的定義與模型。
記C智慧校園無線網(wǎng)絡(luò),于是可以建立加入C的樓宇集合:
其中b?C表示樓宇b屬于網(wǎng)絡(luò)C。不失一般性,設(shè)學(xué)校無線網(wǎng)絡(luò)中內(nèi)有m棟樓宇,于是無線網(wǎng)絡(luò)樓宇集合可以表示為B={b1,b2,…,bm}。
假設(shè)所有樓宇的層數(shù)相同,部署接入節(jié)點個數(shù)相同,可以建立某樓宇bi的接入節(jié)點集合:
設(shè)某個特定的時間范圍內(nèi)T(T∈[tstart,tend]),接入節(jié)點需要上傳的數(shù)據(jù)量與下載數(shù)據(jù)量隨時間之間的函數(shù)關(guān)系分別為q(t),p(t),于是可以得到該特定事件范圍內(nèi)接入節(jié)點需要上傳與下載總的數(shù)據(jù)量:
定義1:(接入節(jié)點平均負載,Access Points Aver?age Load)對于某時間T(T∈[tstart,tend])接入節(jié)點平均負載(LAP)即為上傳數(shù)據(jù)量(QAP)與下載數(shù)據(jù)量(PAP)的總和與時間的比值。其計算方法:
假設(shè)總用戶在時間T內(nèi)通過AP需要上傳與下載數(shù)據(jù)量是恒定的,即總用戶上傳與現(xiàn)在的帶寬恒定。不妨記為BWQ,BWP,于是公式(4)可以進一步轉(zhuǎn)化為:
定理1:如果每個用戶的上傳與下載帶寬恒定且相同,則接入節(jié)點平均負載與接入人數(shù)成正比。
證明:AP節(jié)點接入的總用戶數(shù)按照上傳和下載可以表示為:
其中Nq,Np為上傳用戶總連接數(shù)。
因為每個用戶的上傳與下載帶寬恒定且相同,不失一般性,記為bw。于是用戶在時間T內(nèi)通過AP需要的帶寬可以表示為:
將公式(7)代入公式(5)可以得到:
將公式(6)代入公式(8)得到:
證畢。
根據(jù)定義1和上述描述,可以得到樓宇在熱定時間的平均負載。
定義2:(樓宇平均負載,Network Building Average Load)對于某時間 T(T∈[tstart,tend])樓宇平均負載(LB)即為上傳數(shù)據(jù)量(QB與下載數(shù)據(jù)量(PB)的總和與時間的比值。其計算方法:
上述對接入節(jié)點與樓宇的平均負載進行了建模,下面針對AP負載大數(shù)據(jù)數(shù)學(xué)描述。假設(shè)所有的AP負載大數(shù)據(jù)為BD={bd1,bd2,…,bdf}其中任意一條數(shù)據(jù)可以描述為:
其中APID,nAP,bAP,trecord,bwAP分別表示AP的編號、接入用戶數(shù)、屬于樓宇編號、時間、帶寬開銷。
為了統(tǒng)計每個接入節(jié)點、樓宇在不同時間片段(K)的網(wǎng)絡(luò)負載,根據(jù)實際分析時間片可以分為三種情況:
結(jié)合上述分析,為了減少數(shù)據(jù)檢索過程數(shù)據(jù)的搜索的次數(shù),基于禁忌搜索算法提出如下算法,具體步驟如下:
Step1:根據(jù)用戶需求輸入需要分析網(wǎng)絡(luò)負載的接入節(jié)點與樓宇編號,同時輸入統(tǒng)計時間需求T;
Step2:根據(jù)公式(12)計算得到,時間片段的大小,并將分析時間區(qū)間T劃分為多個片段;
Step3:循環(huán)逐條讀取大數(shù)據(jù)BD
Step4:判斷信息是否為禁忌表信息,如果是返回第三步,如果不是進行下一步操作;
Step5:判斷無線網(wǎng)絡(luò)負載數(shù)據(jù)bdi是否輸入接入節(jié)點ID一直,如果不一致跳轉(zhuǎn)第三步;如果相同進行下一步;
Step6:將當(dāng)前無線網(wǎng)絡(luò)節(jié)點信息中的負載信息,相對應(yīng)的存入時間片段內(nèi);
Step7:根據(jù)bdi相對應(yīng)的樓宇信息,判斷是否為目標樓宇接入節(jié)點的網(wǎng)絡(luò)負載信息,如果是則進行下一步,如果不是跳轉(zhuǎn)到第9步;
Step8:將相應(yīng)的網(wǎng)絡(luò)負載計算存入對應(yīng)目標樓宇的網(wǎng)絡(luò)負載信息集合中
Step9:按照公式(9)等公式計算目標接入節(jié)點的網(wǎng)絡(luò)負載;同時將該信息存在禁忌表中;
Step10:當(dāng)大數(shù)據(jù)BD數(shù)據(jù)讀取完畢后,輸出目標時間段中目標樓宇與接入節(jié)點的網(wǎng)絡(luò)負載信息。
在學(xué)校里,每棟功能樓宇相對比較獨立,學(xué)校會設(shè)置不同的區(qū)域,如學(xué)生公寓、實驗教學(xué)、圖書館等樓宇。因此將校園中無線網(wǎng)絡(luò)樓宇分為多個子區(qū),同時基于接入節(jié)點網(wǎng)絡(luò)信息,對接入節(jié)點按照樓宇進行分類。接入節(jié)點ap與樓宇b之間的函數(shù)關(guān)系aij(api,bj)的表示:
于是根據(jù)公式(13),以接入節(jié)點為行,樓宇為列構(gòu)建其隸屬關(guān)系矩陣:
為得到特定時刻t智慧校園的無線網(wǎng)絡(luò)的負載特性,首先將時刻t進行分辨率細化,在[t-δ,t+δ]即視為時刻t;然后結(jié)合網(wǎng)絡(luò)實施的框架,以樓宇為目標,通過大數(shù)據(jù)統(tǒng)計所有樓宇在時刻t的無線網(wǎng)絡(luò)負載。根據(jù)公式(13)和公式(14)可知設(shè)計如表1的空間維度無線網(wǎng)絡(luò)負載特性算法。
表1 空間維度無線網(wǎng)絡(luò)負載特性算法
網(wǎng)絡(luò)流量采集設(shè)備通過定時對設(shè)備進行流量數(shù)據(jù)進行采集,然后計算出一定時間的平均流量,形成網(wǎng)絡(luò)設(shè)備節(jié)點流量情況。本文為了更好地展現(xiàn)實驗結(jié)果,分別通過按天、周和年進行分析對比。通過流量圖形化界面展示的節(jié)點網(wǎng)絡(luò)中指定端口的帶寬和網(wǎng)絡(luò)線路負載情況,有利于網(wǎng)絡(luò)管理人員通過查看各個指定的關(guān)鍵節(jié)點的流量和負載使用情況,便于對節(jié)點作出相應(yīng)的預(yù)警機制。為此為了分析和驗證結(jié)果,采集了目標學(xué)校一年的網(wǎng)絡(luò)用戶數(shù)據(jù)包,用于實驗。
圖1-圖3分別是通過數(shù)據(jù)采樣并進行數(shù)據(jù)可視化處理得出某關(guān)鍵節(jié)點流量情況,并按天、周、年的流量數(shù)據(jù)做了可視化展示,其中綠色區(qū)域為下行負載,藍色線下區(qū)域代表是上行負載情況。根據(jù)按天和周流量圖不難看出此關(guān)鍵節(jié)點每天網(wǎng)絡(luò)負載都出現(xiàn)高峰期與低谷期,其中網(wǎng)絡(luò)高峰期集中在 12:00-24:00,且 12:00-14:00 和 17:30-20:00 以及 21:30-24:00 為全天網(wǎng)絡(luò)負載最高峰,而凌晨00:00-08:00為全天網(wǎng)絡(luò)負載相對低,尤其是凌晨3:00-07:00網(wǎng)絡(luò)為全天最低。根據(jù)經(jīng)驗,一所學(xué)校網(wǎng)絡(luò)主要負載在學(xué)生宿舍出口區(qū)域,根據(jù)流量的情況可以估算在宿舍區(qū)域上網(wǎng)用戶數(shù)量。從負載流量圖可以看出網(wǎng)絡(luò)負載高峰期為學(xué)生集中使用網(wǎng)絡(luò)的時間段,從周統(tǒng)計總負載流量看出周一至周五的每天有網(wǎng)絡(luò)負載三個高峰期,出現(xiàn)高峰期主因?qū)W生下課在宿舍使用網(wǎng)絡(luò),而周末也類似,但只有一個高峰期與低谷期,主要由于學(xué)生在周末白天和晚上均無需上課,所以白天和晚上用網(wǎng)都處于平緩的高峰期。
圖1 按天統(tǒng)計總負載流量
圖2 按周統(tǒng)計總負載流量
根據(jù)按年的流量負載圖,可以看出有兩個明顯的低谷期,分別為7月下旬-8月底和1月下旬-3月初,根據(jù)學(xué)校的慣例都可以判斷出此兩個時間段為學(xué)生放寒暑假,學(xué)生基本離校,用網(wǎng)人數(shù)固然很低。但細心留意不難發(fā)現(xiàn),1月下旬-3月初流量基本為0,而7月下旬-8月底尚有小量流量,通過分析得出暑假期間尚有部分學(xué)生留校工作和學(xué)習(xí),而寒假基本都回家過年了。另外在10月初也有一個明顯的低谷期,這正是學(xué)校放國慶長假,學(xué)生大多放假外出或離校,網(wǎng)絡(luò)負載自然下降。
根據(jù)上述的網(wǎng)絡(luò)負載流量情況說明和分析,進一步驗證網(wǎng)絡(luò)具有特定的時間性。
為了驗證無線網(wǎng)絡(luò)負載具有空間特性,通過采集目標學(xué)校同一天不同區(qū)域的大量數(shù)據(jù)進行流量負載進行分析驗證。為了說明空間區(qū)域特性,本文通過對教學(xué)實驗區(qū)域、圖書館、學(xué)生宿舍三個區(qū)域進行對比分析。
圖4 目標學(xué)校教學(xué)實驗區(qū)域一天流量圖
圖5 目標學(xué)校圖書館區(qū)域一天流量圖
圖6 目標學(xué)校某棟學(xué)生宿舍一天流量圖
圖4-圖6為目標學(xué)校三個區(qū)域的負載情況,顏色的深淺代表當(dāng)前時間的網(wǎng)絡(luò)負載情況,綠色代表當(dāng)前節(jié)點負載輕,紅色代表當(dāng)前節(jié)點負載重。從圖可以看出隨時間的變化網(wǎng)絡(luò)負載變化,且三個區(qū)域在同一個時間段,負載情況發(fā)生不一致的變化,根據(jù)三區(qū)域的對比分析得到:
(1)每天22:00至次日7點教學(xué)實驗區(qū)域以及圖書館已經(jīng)停止對外服務(wù),此時教學(xué)實驗區(qū)域和圖書館網(wǎng)絡(luò)負載最低;
(2)學(xué)生去圖書館網(wǎng)絡(luò)比去實驗教學(xué)區(qū)域使用網(wǎng)絡(luò)要早,意味著不少學(xué)在7:30前到達圖書館,而8:00后學(xué)生才開始上課并使用網(wǎng)絡(luò)。
(3)明顯看出當(dāng)教學(xué)和圖書館高峰期時,學(xué)生宿舍網(wǎng)絡(luò)使用迎來小低谷,而學(xué)生宿舍網(wǎng)絡(luò)高峰期間,在教學(xué)實驗和圖書館卻是低谷期,學(xué)生使用網(wǎng)絡(luò)有明顯的時間與空間特性。
(4)學(xué)生離開教學(xué)實驗區(qū)或圖書館等公共區(qū)域基本一般會回宿舍區(qū)域繼續(xù)網(wǎng)絡(luò),一般學(xué)生會在晚上24:00開始就寢,網(wǎng)絡(luò)負載所需帶寬開始下降。
(5)一般上午早起的學(xué)生會去圖書館或去上課,若上午沒課安排,一般會稍微晚起些,為此宿舍區(qū)域上午06:00-09:00的網(wǎng)絡(luò)負載不高且上升比較緩慢。
圖7 目標校園區(qū)域上午10-12點網(wǎng)絡(luò)負載熱力圖
針對目標學(xué)校的無線網(wǎng)絡(luò)負載情況進一步分析說明校園無線網(wǎng)絡(luò)具有空間特性,為此對目標學(xué)校的某天上午 10:00-12:00 以及晚上 21:00-23:00 這兩個時間段進行數(shù)據(jù)分析得出,在上午10:00-12:00時間段,從圖7的熱力圖看出,教學(xué)試驗區(qū)網(wǎng)絡(luò)負載相對于圖書館和學(xué)生宿舍區(qū)域重,而圖書館區(qū)域也比學(xué)生宿舍區(qū)域重,學(xué)生宿舍區(qū)域相對負載比較輕。而反之在晚上21:00-23:00,從圖8熱力圖看出,學(xué)生宿舍區(qū)域為網(wǎng)絡(luò)負載最重,圖書館相對較輕,而教學(xué)試驗區(qū)域網(wǎng)絡(luò)負載為最輕。
從熱力和流量圖結(jié)果,給網(wǎng)絡(luò)技術(shù)人員或網(wǎng)絡(luò)管理人員作為對不同區(qū)域不同時間網(wǎng)絡(luò)負載情況進行網(wǎng)絡(luò)均衡調(diào)整提供有力的參考價值。
本文針對智慧校園無線網(wǎng)絡(luò)負載的時空特性,以學(xué)校五層網(wǎng)絡(luò)框架結(jié)構(gòu)為基礎(chǔ)條件,結(jié)合SNMP協(xié)議設(shè)計了無線網(wǎng)絡(luò)負載的大數(shù)據(jù)采集方法。通過大數(shù)據(jù)的分析,得出了目標校園無線網(wǎng)絡(luò)負載實際存在的時空特性,并進行相關(guān)的數(shù)學(xué)描述,為下一步實驗的建模提供了重要的依據(jù)。
圖8 目標校園區(qū)域晚上21-23點網(wǎng)絡(luò)負載熱力圖