文 /王石 董琰 楊貴福 李向龍
高速緩存設備(Cache)可以緩存互聯網資源,縮短用戶對內容的訪問距離,將互聯網內容本地化,大大提升用戶用網體驗,因而逐漸成為網絡應用熱點。
校園網用戶的與日俱增,校園網面臨的壓力越來越大。體現為帶寬日趨緊張,尤其BT、P2P下載、在線視頻、音樂、網絡游戲等網絡應用占用大量帶寬,嚴重影響教學、科研、辦公活動,導致用戶用網體驗下降。
多數高校采取限應用、限速、限連接數等手段加以調控,雖有效果但配置不夠靈活,同時網絡用戶反響也相對激烈。本文從新的角度闡述這種問題,通過布置高速緩存設備(Cache)以疏導的方式緩解帶寬壓力,并提出Cache性能分析方法以證明這種方案對用戶用網體驗有較大提升。
Cache設備能實現自動按需緩存內容,在網絡使用高峰期減少HTTP下載,視頻下載和P2P下載等對互聯網骨干的流量壓力,幫助用戶獲得更高的網絡帶寬使用效率。系統(tǒng)還有效地改進對HTTP、視頻、P2P和非P2P等應用的網絡響應速度,增加了用戶體驗。
對于經常使用P2P下載和在線視頻的用戶,他們可以用更快的速度透明地從系統(tǒng)中訪問到已緩存的內容,而無需占用互聯網骨干帶寬。系統(tǒng)通過疏導的方式而不只通過限制和禁止等手段來控制HTTP下載視頻觀看和P2P下載對網絡的影響。Cache把占用大量帶寬的HTTP、視頻和P2P流量限制在寬帶網絡內部,幫助用戶優(yōu)化網絡流量,為提供更多更好的服務創(chuàng)造更好條件。
Cache提供HTTP與流媒體加速服務的整個業(yè)務流程可以通過圖1描述:
1.客戶端發(fā)起HTTP請求到原始網站下載文件或視頻;
2.交換機將HTTP請求鏡像到Cache監(jiān)聽網卡,Cache截獲了用戶的訪問請求;
3.如果Cache已經緩存有該用戶請求的資源,Cache通過通信網卡向客戶端發(fā)出HTTP302重定向,客戶端執(zhí)行重定向動作,發(fā)起新的HTTP請求到Cache下載;如果Cache上沒有緩存該用戶請求的資源,則執(zhí)行第4步;
4.如果Cache尚未緩存該用戶請求的資源,屬于訪問未命中,Cache不會給用戶發(fā)送任何報文,也不影響用戶從外網正常下載,而是在系統(tǒng)中增加一次訪問請求記錄;Cache上有一個觸發(fā)緩存的閾值,默認2次(可以在界面修改),當Cache監(jiān)測到不同的兩個用戶請求同一個資源時,會觸發(fā)Cache對資源進行緩存,緩存后如果再有用戶請求,就進行第3步,引導用戶將直接從Cache下載資源。
圖1 Cache業(yè)務流程
圖2 部署Cache后的網絡拓撲
圖3 緩存效益比例隨時間變化
布置方案
如圖2所示,CNC是校區(qū)1某運營商網絡出口,TEL是校區(qū)2另一運營商網絡出口。Switch1和Switch2分別是兩個校區(qū)核心交換機。設備Cache1和Cache2分別代表校區(qū)1和校區(qū)2待測Cache。s1和s2分別代表Cache1和Cache2的服務流量,即從Cache流向校園網的流量;d1和d2分別代表Cache1和Cache2從因特網下載的流量;g1和g2分別代表校區(qū)1和校區(qū)2的用戶訪問因特網的上行流量;在兩臺核心交換機上分別設置mir1和mir2鏡像g1和g2流量。
當測試進行時,因為mir1鏡像了g1,所以Cache1獲得了校區(qū)1用戶的下載請求,如果符合策略的匹配條件,Cache1也向因特網提交一次該下載請求,并因此產生流量d1。當相同的下載請求再次在mir1/g1偵測到,Cache1代替因特網回應該次請求,并產生流量s1。流量d1對校園網對外出口產生負面作用,s1起到正面作用。因此,使用Cache1產生的效益為:
由于mir1鏡像g1,所以Cache1只監(jiān)測連接到Switch1上的用戶的請求。同理,mir2只監(jiān)測連接到Switch2上的用戶的請求。Switch1和Swithch2由萬兆光纖鏈路連接。校區(qū)2用戶訪問CNC,數據經過萬兆光纖,由Cache2緩存;校區(qū)1用戶訪問TEL,數據經過萬兆光纖,由Cache1緩存。
使用SNMP協(xié)議分別獲取Switch1和Switch2的流量數據,每小時采集一次,通過用戶實際下載流量、待測Cache為用戶提供的流量s1+s2、待測Cache設備從因特網下載流量d1+d2計算采用待測Cache設備后產生的效益。
緩存策略
針對優(yōu)酷、百度、土豆、搜狐、迅雷、樂視六個視頻網站所有文件進行緩存測試。單個資源存在兩個以上校內用戶訪問即開始下載,對內網提供緩存服務。
如圖3緩存效益比例隨時間變化所示,橫坐標是時間,以小時為單位,每24小時標注一個刻度,共14天(14*24小時);縱坐標是效益比例,按公式3計算。
緩存效益比例隨時間周期變化,約每天一個周期,效益比例大致在0%至約35%間波動。在用戶活動較頻繁的白天和前半夜,效益比例較高,在用戶活動稀少的后半夜,效益比例較低。
極個別時,約第217小時,有效益尖峰達到約48.08%。此時可能有在短時間內若干用戶集中訪問同一校外資源。
如圖4所示,橫坐標是時間,以小時為單位,每24小時標注一個刻度,共14天(14*24小時);縱坐標是流量,單位KB。其中橙色虛線是用戶流量,藍色實線是緩存效益。
效益和用戶流量呈周期變化,周期約一天。在用戶活動較頻繁的白天和前半夜,緩存效益較高,用戶流量較大;在用戶活動稀少的后半夜,緩存效益較低,用戶流量較小。緩存效益及效益比例(參見圖3緩存效益比例隨時間變化)隨用戶流量變化而變化,成正相關。
大多數每日高峰,總流量達到我校出口帶寬(TEL+CNC)上限。第7天是周日,總流量下降,相對其他的周一至周五表現異常。
Cache下載占總流量比例隨時間變化
Cache根據監(jiān)聽用戶請求而從互聯網下載的流量,是Cache所產生的負面效果。這一效果已納入對緩存的效益計算中,圖5顯示Cache下載隨時間變化的情況。
下載數據峰值約35%,去除特異數據以后,大多數日周期的峰值約20%,此時學校下載總流量中有約20%是由Cache導致的。
如圖6所示,橙色虛線代表緩存效益比例,藍色實線代表下載比例??芍б娲笥谙螺d,Cache總體帶來正面效果。下載約為緩存效益的一半。
如果Cache調整下載策略,即僅在或多在用戶使用出口的低峰期下載數據,而在高峰期少下載或不下載數據,負面作用可望降低,效益及效益比例可以提高。
平均效益
平均效益約占總流量的18.17%。
緩存效益隨時間以每天為周期變化,與用戶流量正相關,平均占總流量的18.17%。
圖4 效益比例與用戶流量隨時間變化
圖5 Cache下載占總流量比例隨時間變化
圖6 下載與緩存效益的比例
Cache下載的流量帶來負面效果。下載的流量總體低于服務流量,起正面效果。效益計算已考慮到Cache下載帶來的負面影響。如果適當調整Cahce下載及資源站點構成等策略,Cache帶來的正面效果可望提升而負面效果可望降低,可進一步提高設備利用率及服務性能。
流量高峰時刻Cache提供的下載速度為校園網內網所提供的速度,僅受千兆網卡和校園網流控策略限制,用戶體驗比直接從因特網下載更好。流量低谷時,雖然效益較低,但是此時段出口帶寬空閑足夠大,不會由于出口帶寬受限而導致用戶體驗降低(受目標文件的站點及路徑的限制)。
Cache測試期間,用戶在訪問設備已經緩存的資源時,幾乎能達到理論上的最大值。