歐運娟
廣東省機械高級技工學校,廣東廣州 510450
校園網(wǎng)Internet訪問緩慢的分析與解決
歐運娟
廣東省機械高級技工學校,廣東廣州 510450
隨著校園網(wǎng)規(guī)模的逐漸擴大和系統(tǒng)應(yīng)用的不斷深入,校園網(wǎng)實現(xiàn)了校際間的信息共享及與Internet共享連接,為學校的教學、管理等各方面提供全面、切實的支持。但網(wǎng)絡(luò)問題也隨之而來,網(wǎng)絡(luò)系統(tǒng)在運行中會經(jīng)常不斷出現(xiàn)網(wǎng)絡(luò)故障的問題,尤其是Internet訪問緩慢的故障率最高,嚴重影響了校園網(wǎng)的正常使用。本文探討如何分析和解決Internet訪問緩慢的故障現(xiàn)象,為校園網(wǎng)的穩(wěn)定運行排憂解難。
Internet;共享接入;緩慢故障
Internet訪問緩慢是指訪問網(wǎng)絡(luò)是連通的,互聯(lián)網(wǎng)上的服務(wù)器已經(jīng)接受了用戶的請求,但數(shù)據(jù)傳輸速度非常緩慢。有些規(guī)模較小的校園網(wǎng),會選用帶路由功能的ADSL Modem接入方式共享上網(wǎng),更時常會遇到上網(wǎng)緩慢的現(xiàn)象,例如,IE瀏覽器長時間打不開目標網(wǎng)頁,本地連接只有發(fā)送信息量沒有接收信息量等,許多人會下意識地認為ADSL設(shè)備發(fā)生了斷流現(xiàn)象,事實上造成共享上網(wǎng)速度下降的原因有很多。
采用Internet共享接入方式上網(wǎng)比單機上網(wǎng)無論在結(jié)構(gòu)、配置和維護等方面,都要復雜得多,因此當Internet訪問緩慢故障發(fā)生的時候,眾多的故障原因造成對Internet訪問緩慢故障的判斷及解決有一定的困難,絕非像計算機單機上網(wǎng)故障那么簡單。對Internet訪問緩慢故障的判斷,既需要長期的知識和經(jīng)驗積累,又需要按照一定的故障判斷流程進行,以及依靠相關(guān)軟硬件工具的幫助。
引起Internet訪問緩慢故障的原因比較復雜,既有硬件原因也有軟件原因;既有內(nèi)網(wǎng)問題也有外網(wǎng)問題;既有病毒攻擊也有人為攻擊等。例如,受接入端帶寬的限制、網(wǎng)絡(luò)用戶需求過大、網(wǎng)絡(luò)廣播風暴的影響、代理服務(wù)器I/O性能問題、防火墻的設(shè)置問題、計算機病毒的影響等均是引起Internet訪問緩慢的誘因。為清晰、高效地判斷故障原因,可按照一定的流程進行,其流程如下:
1)識別和描述故障現(xiàn)象
排故前,須確切地知道共享網(wǎng)絡(luò)上是否真的發(fā)生Internet訪問緩慢,還是在上網(wǎng)過程中經(jīng)常掉線。識別故障現(xiàn)象時,通常應(yīng)該向投訴故障的操作者詢問以下幾個基本的問題:
(1)故障現(xiàn)象發(fā)生時,正在運行什么進程(即操作者正在對計算機進行什么操作);
(2)這個進程以前運行過嗎?
(3)以前這個進程的運行是否成功?
(4)這個進程最后一次成功運行是什么時候?
(5)從那時起哪些發(fā)生了改變?
根據(jù)詢問結(jié)果,開始對故障現(xiàn)象進行客觀的詳細描述,例如在使用Web瀏覽時,無論鍵入哪個網(wǎng)站都返回“該頁無法顯示”之類的信息。使用ping命令時,無論Ping哪個IP地址都顯示超時連接信息等。諸如此類的出錯消息會為縮小故障范圍提供許多有價值的信息。
在故障現(xiàn)場還要收集以下的故障信息:例如,故障的出現(xiàn)是否有規(guī)律,最近是否加入了新用戶,最近是否添加了新設(shè)備,是否有設(shè)備移動、修改或更換,是否修改了用戶權(quán)限,網(wǎng)絡(luò)操作系統(tǒng)是否重新配置過等等。經(jīng)過詢問、核實和故障信息收集,確認所發(fā)生的故障現(xiàn)象的真實性。
2)列舉故障疑似原因
引起Internet訪問緩慢故障的原因比較復雜,既有硬件原因也有軟件原因,有內(nèi)網(wǎng)問題也有外網(wǎng)問題,既有病毒攻擊也有人為攻擊等。當故障發(fā)生時應(yīng)綜合考慮各種可能的原因,例如,網(wǎng)卡硬件故障、網(wǎng)絡(luò)連通性故障、網(wǎng)絡(luò)設(shè)備故障、網(wǎng)絡(luò)協(xié)議故障或設(shè)置不當?shù)鹊?,并將其一一列舉出來,以供故障排查參考。
列舉故障疑似原因的思路應(yīng)該是先硬后軟,范圍應(yīng)集中在網(wǎng)絡(luò)連通性、網(wǎng)絡(luò)連接設(shè)備和服務(wù)設(shè)備、網(wǎng)絡(luò)設(shè)置問題這幾方面,列舉的依據(jù)應(yīng)該基于計算機網(wǎng)絡(luò)的原理、實戰(zhàn)經(jīng)驗的積累、以及對故障的描述。
3)分步排查故障原因
分步排查故障的基本步驟是:首先將所列舉的故障疑似原因按優(yōu)先級別進行排序,排序的原則是從外到內(nèi)。例如應(yīng)該第一優(yōu)先排查Internet共享接入的服務(wù)設(shè)備(如代理服務(wù)器)和互連設(shè)備(如路由器),然后按順序逐一對故障疑似原因進行隔離測試及排查,不斷地縮小搜索范圍,最終把真正的故障原因找出來。
在排查的過程中,除了利用先進的網(wǎng)絡(luò)測試工具之外,為了提高排查速度,應(yīng)先觀察網(wǎng)卡、交換機、Modem、路由器面板上的LED指示燈。因為這些指示燈是網(wǎng)絡(luò)當前運行狀態(tài)的標志,以及可以立即告訴你故障發(fā)生的所在地。
4)故障點及原因定位
經(jīng)反復測試和排查后,圈定故障點及故障屬性,然后要進一步驗證故障產(chǎn)生的真實原因。例如最終排查結(jié)果是代理服務(wù)器的問題,那么到底是主機的硬件故障還是服務(wù)軟件出錯?因此,在已確認故障點的情況下,還必須采用一些有效的手段對其故障原因進行確切的定位。
下面通過一例實際個案說明如何運用上述的Internet故障判斷流程解決問題,希望可以作為故障排除的共性參考。
案例:某校培訓中心是一個獨立的局域網(wǎng),劃分為A、B兩個子網(wǎng),相互之間的通信可經(jīng)路由器進行。其中A網(wǎng)原有32臺機,后來增加了20臺,合計52臺;B網(wǎng)共有40臺機。所有的工作站匯聚到路由器后通過代理服務(wù)器,按指定IP地址的方式共享訪問Internet,代理服務(wù)器安裝的是WinGate代理軟件。寬帶接入是一條2M的ADSL專線。故障現(xiàn)象是A網(wǎng)增加了用戶之后,局域網(wǎng)中有些工作站能夠正常上網(wǎng),而有些工作站雖能接入Internet,但非常緩慢,甚至無法打開任何網(wǎng)站的網(wǎng)頁。
第一步:識別和描述故障現(xiàn)象
通過在現(xiàn)場的詢問和查看,知道在A網(wǎng)增加工作站之前,兩個網(wǎng)段的所有工作站從未出現(xiàn)過上網(wǎng)緩慢的故障,但是A網(wǎng)增加了20臺工作站之后,在上網(wǎng)高峰期,B網(wǎng)有些工作站連接Internet很慢,甚至無法打開任何網(wǎng)站的網(wǎng)頁,而A網(wǎng)所有的工作站則上網(wǎng)速度正常,與未增加用戶之前無異。
現(xiàn)收集到與本故障相關(guān)的主要信息如下:
1)A網(wǎng)增加工作站之前,B網(wǎng)所有工作站上網(wǎng)速度正常;
2)斷開A網(wǎng)或減少開機的用戶,故障現(xiàn)象立即消失或緩解;
3)在非上網(wǎng)高峰期故障現(xiàn)象不明顯;
4)A網(wǎng)的主機型號是P4系列,外置網(wǎng)卡;B網(wǎng)的主機型號是P3系列,板載網(wǎng)卡;
5)電信部門提供的ADSL寬帶上行512K,下行2M,申請擴容一直未批。
6)B網(wǎng)中同一個工作站上網(wǎng)緩慢的現(xiàn)象并不固定在同一個狀態(tài),即在某個時間段不是太慢,但在另一時間段慢至打不開任何網(wǎng)站的網(wǎng)頁。
根據(jù)故障信息收集結(jié)果,基本上可以將本故障描述為:當A網(wǎng)用戶增加時,在上網(wǎng)高峰期B網(wǎng)有些用戶出現(xiàn)上網(wǎng)緩慢甚至無法打開網(wǎng)頁的故障現(xiàn)象,而A網(wǎng)則完全正常;當A網(wǎng)新增用戶退出或完全脫離網(wǎng)絡(luò)時,上述故障則自然消失。該故障的主要特征是上網(wǎng)緩慢,直至無法打開網(wǎng)頁。
第二步:列舉故障疑似原因
Internet訪問緩慢故障的疑似原因比較多,既有硬件方面的原因,也有軟件方面的原因,還有人為因素的影響。本故障現(xiàn)象看似簡單實則比較罕見,一般性的認為,該故障非常普通,只是ADSL帶寬不足的問題,只需增加外網(wǎng)帶寬即可。但進一步深入分析,發(fā)現(xiàn)若真是帶寬不足問題,對全網(wǎng)所有用戶都應(yīng)該有一定的影響,為什么只有B網(wǎng)部分用戶不正常。最費解的是,在A網(wǎng)增加工作站通常只會造成A子網(wǎng)的交換機或路由器端口阻塞,只影響本子網(wǎng)的用戶上網(wǎng),為什么A網(wǎng)自己一切正常反而波及到與之完全隔離的B網(wǎng)用戶呢。還有,該故障即時有時無,更增加了判斷的難度。因此,該故障原因很可能牽涉到局域網(wǎng)交換機、路由器和代理服務(wù)器的軟硬件性能問題(如網(wǎng)絡(luò)瓶頸、配置文件失效等),還可能牽涉到內(nèi)網(wǎng)各節(jié)點之間的動態(tài)連通性(指用戶訪問服務(wù)器的實時連接狀況)或線路干擾問題。
根據(jù)計算機網(wǎng)絡(luò)的基本原理、實戰(zhàn)經(jīng)驗和故障描述,列舉以下疑似故障原因:
1)代理服務(wù)器可能出現(xiàn)性能瓶頸使帶寬減少,或者是Win Gate代理軟件的設(shè)置有缺陷。
2)A網(wǎng)增加用戶之后數(shù)據(jù)量增大,可能會導致路由器過載,時延重大、帶寬減少而影響用戶上網(wǎng)。由于A網(wǎng)工作站的性能比B網(wǎng)的高,所以只影響到B網(wǎng)的用戶。
3)兩個子網(wǎng)之間可能存在線路干擾,因A網(wǎng)用戶多,主干線路產(chǎn)生的磁場強度大,故干擾了B網(wǎng)的用戶正常上網(wǎng)。
4)在上網(wǎng)高峰期,B網(wǎng)的用戶與代理服務(wù)器之間的動態(tài)連通性(指數(shù)據(jù)傳輸丟包率)可能有問題。
第三步:分步排查故障原因
1)利用代理服務(wù)器操作系統(tǒng)自帶的網(wǎng)絡(luò)監(jiān)視器和性能監(jiān)視器,在上網(wǎng)高峰期查看是否存在服務(wù)器訪問瓶頸,測試結(jié)果是:CPU占用率60%;內(nèi)存占用率54%;網(wǎng)絡(luò)利用率只有37%,顯然代理服務(wù)器的性能不存在問題。再檢查Win Gate代理軟件的設(shè)置并無異常,每個用戶的訪問流量(帶寬)自動調(diào)節(jié)在20K左右,滿足了瀏覽Internet的基本要求(上網(wǎng)瀏覽一般有15K以上即可)。排除了這個故障原因。
2)采用Opti View網(wǎng)絡(luò)綜合協(xié)議分析儀,在上網(wǎng)高峰期測試路由器A端口的實際吞吐量、時延和帶寬等參數(shù),測試結(jié)果全部都在路由器額定技術(shù)指標之下(產(chǎn)品說明書提供),完全不存在路由器過載的問題。也排除了這個故障原因。
3)將A、B網(wǎng)的主干雙絞線換成STP(屏蔽雙絞線),意在抗線路干擾,但結(jié)果是故障依舊。排除了線路干擾的原因。
4)在上網(wǎng)高峰期采用Ping命令檢查B網(wǎng)工作站與代理服務(wù)器之間的動態(tài)連通性能。在任意一臺工作站中首先測試與代理服務(wù)器靜態(tài)連通性 (直接ping代理服務(wù)器的IP地址),正常;接著測試動態(tài)連通性(執(zhí)行“ping 10.176.6.112 -l 65500”命令),發(fā)現(xiàn)代理服務(wù)器無法Ping通,而且測試結(jié)果是連續(xù)四個“Request time out”,表明數(shù)據(jù)傳輸丟包率幾乎達到了100%,將Sent Bytes數(shù)值逐步減少進行依次測試,當Sent Bytes數(shù)值大于2000時,線路連接丟包率就達到100%,再多選幾臺工作站測試,結(jié)果都是一樣。若斷開A網(wǎng)或削減用戶數(shù),則丟包率明顯減少。測試結(jié)果說明B網(wǎng)的工作站與代理服務(wù)器之間的動態(tài)連接,在網(wǎng)絡(luò)高峰期時出現(xiàn)丟包問題。為進一步證實,馬上在A網(wǎng)作同樣的測試,結(jié)果完全是沒有任何問題。
第四步:故障點及原因定位
排查結(jié)果基本可以確定本故障的原因是B網(wǎng)的用戶與代理服務(wù)器之間的動態(tài)連通性差,導致丟包率高,從而影響了上網(wǎng)速度。如何對故障原因進一步定位呢?實際上這又是一個更深入的原因列舉和排查過程。
數(shù)據(jù)丟包率原因通常與路由器、交換機及網(wǎng)卡有直接關(guān)系,以此為據(jù)繼續(xù)排查:
1)路由器是共用的,置換A、B網(wǎng)的路由端口,故障依舊,說明路由器無問題。
2)置換A、B網(wǎng)的交換機,故障依舊,說明交換機無問題。
3)懷疑B網(wǎng)的主機的網(wǎng)卡有問題,故任選一機,禁用其板載網(wǎng)卡,添加外置網(wǎng)卡;完成新網(wǎng)卡的驅(qū)程和設(shè)置上網(wǎng)參數(shù)后,立即訪問Internet,目標網(wǎng)頁迅速打開了,故障成功解決。
故障原因分析——板載網(wǎng)卡屬于內(nèi)置網(wǎng)卡,由于過多占用系統(tǒng)資源,其數(shù)據(jù)傳輸性能比外置網(wǎng)卡(硬網(wǎng)卡)差很遠。在A網(wǎng)未增加工作站之前,代理服務(wù)器自動分配給各用戶的帶寬約為30K左右,但A網(wǎng)增加工作站之后自動減為20K左右;由于B網(wǎng)的用戶主機的網(wǎng)卡傳輸性能差,帶寬減少后訪問請求的時間必然增長,訪問速度降低,導致超時登錄失而無法打開網(wǎng)頁。但當上網(wǎng)用戶數(shù)減少時,代理服務(wù)器又自動將每戶的帶寬增大,故障便悄然消失。
解決的辦法可以向電信部門申請拓展ADSL帶寬至3M或以上,但必須長時間支付所增加的線路成本,而更換B網(wǎng)工作站的所有網(wǎng)卡則屬一次性投資。學校領(lǐng)導最后決定采取后一個方案。
由于影響Internet訪問緩慢故障的因素比較多,在網(wǎng)絡(luò)的三個層面(物理層、數(shù)據(jù)鏈路層、網(wǎng)絡(luò)層)都有產(chǎn)生故障的可能,對其故障的處理過程基于一定的知識和經(jīng)驗,以及相關(guān)的軟硬件測試工具,通過由彼及此的排查手段,逐步縮小故障范圍,最終確定故障部位及原因,采取有效措施把故障消除。
[1]譚珂,全惠民.網(wǎng)絡(luò)典型故障分析及排除.1版.人民郵電出版社,2003:56,135-254,186-192.
[2]劉曉輝,王春海.網(wǎng)絡(luò)常見問題與故障1000例.1版.清華大學出版社,2005:56,60-89.
[3]劉曉輝.網(wǎng)絡(luò)故障與常見問題排查.1版.中國鐵道出版社 2004:172-180,186-196.
TP393
A
1674-6708(2010)22-0213-02