BRAS即寬帶遠程接入服務器,是面向?qū)拵ЬW(wǎng)絡應用的新型接入網(wǎng)關,它位于骨干網(wǎng)的邊緣層,可以完成用戶帶寬的IP網(wǎng)的數(shù)據(jù)接入。通常作為核心設備位于網(wǎng)絡結(jié)構(gòu)的最上層,主要完成兩方面功能,一是網(wǎng)絡承載功能:負責終結(jié)用戶的PPPoE連接、匯聚用戶的流量功能;二是控制實現(xiàn)功能:與認證系統(tǒng)、計費系統(tǒng)和客戶管理系統(tǒng)及服務策略控制系統(tǒng)相配合,實現(xiàn)用戶接入的認證、計費和管理功能。
筆者單位的BRAS設備和上層路由器依靠BGP動態(tài)路由互聯(lián),兩者之間路由的學習,保證了數(shù)據(jù)的正常轉(zhuǎn)發(fā)。相反的,如果路由學習錯誤,就會導致數(shù)據(jù)無法轉(zhuǎn)發(fā),從而影響互聯(lián)網(wǎng)業(yè)務。本文從用戶反映網(wǎng)絡故障,撥號成功打不開網(wǎng)頁這一現(xiàn)象開始排查,并運用ping、trace和show命令,將網(wǎng)絡故障準確定位在了BRAS上地址池設置重復,進而導致路由學習錯誤,并最終引發(fā)網(wǎng)絡故障。接下來就詳細介紹一下網(wǎng)絡故障的處理過程。
圖1 查看路由器 10.219.144.0路由學習情況
近日,某同事向我們反映,有部分互聯(lián)網(wǎng)用戶出現(xiàn)故障,具體故障現(xiàn)象是撥號成功但打不開網(wǎng)頁,需要多次撥號后,才能正常上網(wǎng)。
根據(jù)用戶反映的時間節(jié)點大都在晚上,我們在機房搭建測試環(huán)境。經(jīng)過多次撥號后抓取到了故障現(xiàn)象,即撥號成功打不開網(wǎng)頁。使用ipconfig查看到設備撥號成功后的IP地址是10.219.144.2,Ping網(wǎng)關10.219.144.1是沒有問題的,也沒有丟包和延遲大的現(xiàn)象發(fā)生。但是Ping核心路由器(10.253.0.19)就出現(xiàn)超時的現(xiàn)象,這樣就可以斷定問題出現(xiàn)在路由器和BRAS之間。
為了進一步驗證故障的環(huán)節(jié)出現(xiàn)在路由器和BRAS之間,我們使用trace命令對互聯(lián)網(wǎng)出口進行了跟蹤,發(fā)現(xiàn)數(shù)據(jù)只能跟蹤到BRAS,根本到達不了路由器。接下來登錄到核心路由器上,使用命令show ip fordwing route查看關于10.219.144.0路由的學習情況,如圖1所示。
通過圖1可以看到,在核心路由器上可以學習到兩條包含10.219.144.0網(wǎng)段的路由,即10.219.144.0/22和10.219.144.0/24,這兩條路由均來自不同的方向,其 中10.253.139.50即出現(xiàn)故障的BRAS,而10.253.139.2是另外一臺BRAS。路由器學習這兩條路由都能將他們轉(zhuǎn)發(fā)出去,但是數(shù)據(jù)回程的時候,它會根據(jù)路由最長匹配原則優(yōu)先匹配10.219.144.0/24的地址段,從而轉(zhuǎn)發(fā)給10.253.139.2這臺 BRAS,這樣發(fā)生故障的BRAS用戶就上不網(wǎng),因為它所在網(wǎng)段的子網(wǎng)掩碼比較短。
通過上面查看路由轉(zhuǎn)發(fā)明細,可以查看到路由轉(zhuǎn)發(fā)存在問題,具體情況是同一個網(wǎng)段從兩個方向?qū)W習到。根據(jù)路由最長匹配原則,在路由轉(zhuǎn)發(fā)的過程中匹配上子網(wǎng)掩碼較長的網(wǎng)段,從而導致路由轉(zhuǎn)發(fā)到其他BRAS設備。
找到故障的誘因后,登錄到故障的BRAS上,將IP地址重復的地址池做了相應的修改,從而達到解決故障的目的。具體配置命令即:
上面通過進入地址池,首先刪除了原有地址池的IP地址,然后在vbui接口下刪除了接口地址,緊接著又重新定義接口地址,最后在地址池中添加IP地址段即可。在完成BRAS上新的地址池配置工作后,使用測試環(huán)境PPPoE撥號后可以獲取到新地址池的IP地址10.219.212.2/32,該 IP地址訪問Internet也沒有問題,故障得到解決。
從得知用戶故障,并根據(jù)故障出現(xiàn)的時間節(jié)點,而后在機房搭建測試的環(huán)境抓取故障現(xiàn)象,并使用一系列ping、trace和 show命 令,準確定位了故障原因即路由在轉(zhuǎn)發(fā)上出現(xiàn)異常。具體原因是同一個網(wǎng)段路由轉(zhuǎn)發(fā)出去沒有問題,但是路由回程時會根據(jù)路由最長匹配的原則,轉(zhuǎn)發(fā)到其他BRAS設備,從而導致路由轉(zhuǎn)發(fā)故障。根據(jù)故障原因,通過修改重復的IP地址池后故障得到解決。
通過此次故障的排查,充分認識到IP地址池設置重復帶來的負面影響,為此我們將設置專人保管IP地址,專人專用,從而杜絕IP地址重復配置的事件發(fā)生,并及時做到數(shù)據(jù)的更新,同時在新的IP地址添加后,查看路由轉(zhuǎn)發(fā)表,對路由的學習情況進行比對,使用這些舉措在源頭上有效控制IP地址的合理使用,保障用戶的較好體驗。