Aggregate Port(稱 AP)是將多個物理鏈路捆綁在一起形成一個邏輯鏈接,可以用于擴展鏈路帶寬,提供更高的連接可靠性。本文中所發(fā)生的故障就是在端口聚合時發(fā)生的故障,希望對大家有所啟示。
筆者單位兩臺RG8610設備(一臺核心、一臺無線控制)之間原通過1000Mb的電路進行連接,隨著無線覆蓋區(qū)域擴大,用戶數(shù)量不斷增加,無線與核心設備之間流量也增大,1000Mb無法滿足兩者之間通訊所需要帶寬。
圖1 端口丟包統(tǒng)計
端口聚合是最快解決兩者之間通訊帶寬不足方式,于是在兩設備之間配置端口聚合。增加一條物理線路,使原來設備之間由一條1000Mb的物理線路變成了由2條1000Mb線路組成2000Mb的邏輯線路。
端口聚合配置成功后,Aggregate P o r t 顯 示2000000Kbit。通過幾天的運行,用戶反映無線速度顯示改善,但在幾天后,通過網(wǎng)管平臺對網(wǎng)絡設備進行檢查時,發(fā)現(xiàn)該AP端口每天存在大量的Dropped 的情況(如圖1)。
Dropped情況的存在,說明端口存在傳輸質(zhì)量不佳的問題。首先考慮是增加的電路是否質(zhì)量不好(電口或網(wǎng)線),于是更換了網(wǎng)線,故障未能解決。再次更換聚合電口,故障依舊存在(如圖2),說明物理線路和端口沒有問題。
對次聚合端口下兩個端口進行單獨進行分析發(fā)現(xiàn),發(fā)生Dropped最多的總是端口號較?。╣i1/15)的,后面的端口(gi1/24)則很少發(fā)生。再次利用網(wǎng)管平臺對兩個端口流量情況進行查詢,發(fā)現(xiàn)端口Gi1/15(如圖3)每天通過流量很大,在高峰期會達到1GB,而Gi1/24(如圖4)平時幾乎沒有。
只有當高峰時才會有流量通過,這說明兩條線路流量沒有平衡,只有當?shù)谝粭l線路流量跑滿時第二條線路才會有流量,于是更改AP流量平衡方式。再次觀察發(fā)現(xiàn)AP下Dropped情況幾乎沒有了,故障解決。
RG8610設備聚合端口流量平衡有 dst-ip、dst-mac、src-dst-ip、src-dst-mac、src-ip、src-mac、src-dstip-l4port等,默認方式是:源地址 IP(src-ip),根據(jù)不同應用環(huán)境可以實現(xiàn)不同功能。本文中的故障是將默認的src-ip改為src-dst-ip后將流量均衡兩條線路上。之所以出現(xiàn)Dropped情況,是因為默認狀態(tài)下以一條線路為主,只有當一條線路流量超過實際帶寬時才會啟動下條線路進行分流。當一個端口利用率達到80%以后,端口的傳輸質(zhì)量就會直線下降,影響傳輸,造成用戶體驗效果變差。理想傳輸效果建議帶寬利用率不超過60%,最差也不能超80%。因此,將流量均衡地分擔在兩條以上線路中,使之達到最佳傳輸效果。
圖2 聚合端口情況
圖3 聚合成員端口gi1/15統(tǒng)計
圖4 聚合成員端口統(tǒng)計
聚合端口應用使用戶在不擴展業(yè)務板情況下,可以捆綁兩條以上物理線路,實現(xiàn)兩設備之間線路的擴容,降低單個線路傳輸壓力,提高了傳輸質(zhì)量,資金投入較少,容易實現(xiàn)。但在實際應用中還是有些問題需要注意。
1.AP中所有物理端口必須具有相同屬性(如1000MB全雙工等)。
2.聚合端口設備所允許AP數(shù)量及AP下屬端口的最大數(shù)量是以最低的一方為準(如RG-8600系列支持最大AP數(shù)量為128,每個AP下面最大端口值為8,而RG-N18K系列支持256AP和最大端口8,華為S12K系列交換機默認則是128AP和最大端口8,高端設備支持自行配置,但總端口數(shù)量不變)。
3.是否支持跨板卡聚合要是具體產(chǎn)品說明為準,建議不做跨板卡聚合。
4.不同廠商設備之間聚合質(zhì)量穩(wěn)定性因設備品牌有限無法具體測試。