李紹昆
摘 要:作為計(jì)算機(jī)網(wǎng)絡(luò)維護(hù)管理人員,面對的是龐大的網(wǎng)絡(luò)系統(tǒng)、復(fù)雜的網(wǎng)絡(luò)設(shè)備和系統(tǒng)的不斷擴(kuò)充與升級。要想保證網(wǎng)絡(luò)順暢運(yùn)行,必需做好預(yù)防性日常維護(hù)管理工作,要在熟悉網(wǎng)絡(luò)技術(shù)體系和設(shè)備性能的基礎(chǔ)上,掌握網(wǎng)絡(luò)技障分析與排除的原則、方法和過程;學(xué)會操作使用相關(guān)測試分析工具和儀表;勤于實(shí)踐,積累經(jīng)驗(yàn),以期達(dá)到快速準(zhǔn)確地分析和排除故障的目的。本文針對計(jì)算機(jī)網(wǎng)絡(luò)故障的診斷與排除的相關(guān)問題進(jìn)行了分析與研究,希望能夠?yàn)橄嚓P(guān)領(lǐng)域提供一些幫助。
關(guān)鍵詞:計(jì)算機(jī);網(wǎng)絡(luò)故障;診斷與排除
一、識別故障現(xiàn)象
在進(jìn)行故障排除之前,必須確切地知道網(wǎng)絡(luò)到底出現(xiàn)了什么問題,無法共享網(wǎng)絡(luò)、不能瀏覽網(wǎng)頁,還是在“網(wǎng)上鄰居”中查不到對方的計(jì)算機(jī)。知道出現(xiàn)了什么問題并能夠及時(shí)的對其進(jìn)行定位是成功排除故障的首要條件,所以我們在進(jìn)行排查網(wǎng)絡(luò)故障的時(shí)候一定要找到處理問題的出發(fā)點(diǎn):
總體說來,在識別網(wǎng)絡(luò)故障的時(shí)候要注意下面幾個方面:
(1)當(dāng)網(wǎng)絡(luò)發(fā)生故障的時(shí)候,正在運(yùn)行哪些程序?
(2)這些程序以前是否成功運(yùn)行過?
(3)如果成功運(yùn)行過,最后一次運(yùn)行是在什么時(shí)候?
(4)第一次發(fā)生故障之前,對系統(tǒng)配置、軟件配置以及硬件設(shè)備配置,做了哪些更改?
二、收集相關(guān)信息
(1)以前是否正常
—個曾經(jīng)工作正常然后出現(xiàn)故障的設(shè)備與一個從未正常工作的設(shè)備之間存在著巨大的差別。如果某個發(fā)生故障的設(shè)備曾經(jīng)工作正常,我們可以推論一定是什么原因破壞了這種過程;我們應(yīng)該進(jìn)入故障分析模式,并且繼續(xù)與用戶的交流。
(2)故障發(fā)生時(shí)間
假設(shè)發(fā)生故障的部件以前能夠正常工作,那么您必須確認(rèn)這種故障的發(fā)生時(shí)間。提出這個問題的目的不僅僅是為了確定故障發(fā)生的時(shí)間和日期,同時(shí)也是為了確定當(dāng)時(shí)哪些事件導(dǎo)致了故障。例如當(dāng)故隱發(fā)生的時(shí)候是否有其他的應(yīng)用程序正在運(yùn)行或者正在打開空調(diào)等事件。
(3)系統(tǒng)變動情況
安裝新的應(yīng)用程序、硬件設(shè)備或?qū)ΜF(xiàn)有程序和硬件進(jìn)行升級都可能導(dǎo)致故障的發(fā)生。您自己也必須考由這個伺題,是否財(cái)網(wǎng)絡(luò)設(shè)置進(jìn)行的更改導(dǎo)致了故障?是否對服務(wù)器進(jìn)行了升級或者是對路由器曲配置進(jìn)行了更新?
(4)網(wǎng)絡(luò)基準(zhǔn)信息
當(dāng)網(wǎng)絡(luò)正確配置和運(yùn)行時(shí)測試基準(zhǔn),然后間斷住地進(jìn)行這種檢測。將這種間斷性的基準(zhǔn)和先前的基準(zhǔn)進(jìn)行比較。以確定其是否可以預(yù)示發(fā)展的趨勢以及前面可能遇到的問題。這些信息可以與實(shí)際排除故障時(shí)所收集到的統(tǒng)計(jì)資料進(jìn)行比較,并且可以指明故障的原因。
三、列舉故障原因
在得知了詳細(xì)的網(wǎng)絡(luò)故障情況之后,用戶就要從多方面來列舉有可能導(dǎo)致故障的原因。比如無法瀏覽網(wǎng)頁時(shí),到底是網(wǎng)卡硬件故障、網(wǎng)絡(luò)連接故障、網(wǎng)絡(luò)協(xié)議設(shè)置不當(dāng),還是歷瀏覽器的參數(shù)設(shè)置有誤。這時(shí)不可能一下子找出最終問題的根源所在,只能根據(jù)出錯的可能性將所有導(dǎo)致故障的原因逐一列舉出來。記住,不要忽略其中的任何一個故障產(chǎn)生原因。
四、設(shè)計(jì)排障方案
當(dāng)分析了可能導(dǎo)致故障的原因以后,就可以方便的設(shè)計(jì)相關(guān)的解決方案了。
在設(shè)計(jì)某種解決方案之前,必須考慮下面問題:
(1)所確定的原因是否真是故降原因所在。
(2)是否可以對設(shè)定的解決方案進(jìn)行充分的測試。
(3)設(shè)定的解決方案應(yīng)該得出什么樣的結(jié)果。
(4)所設(shè)定的解決方案對于網(wǎng)絡(luò)的其他部分是如何處理的。
在實(shí)施一項(xiàng)計(jì)劃之前,您必須做好這樣的準(zhǔn)備:這種方案可能會產(chǎn)生比現(xiàn)有故隨更壞的影響無論故障以及相應(yīng)的解決方案涉及到的是整個網(wǎng)絡(luò)或者是個別的用戶,您都必須了解如何將事件恢復(fù)到應(yīng)用方案前的初始狀態(tài)。基于對故障范圍以及解決方案助理解程度,您需要做以下一些工作:
(1)保存全部的網(wǎng)絡(luò)設(shè)置配置文件。
(2)對工作站的配置文件進(jìn)行備份記錄。
(3)記錄配線室的結(jié)構(gòu),包括設(shè)備的位置以及網(wǎng)絡(luò)的連接等。
(4)建立最終的基準(zhǔn)以便于新舊結(jié)果對照,同時(shí)在需要恢復(fù)時(shí)可以作為比較的準(zhǔn)則。
五、實(shí)施故障排除
在實(shí)施排障方案時(shí),一般一次只改變一個變量,否則就不知道哪個改變導(dǎo)致了問題的修復(fù)。此外,有一個恢復(fù)計(jì)劃是重要的,以防所做他的行動使情況變得更糟。比如,在實(shí)施方案中,包含一個初始化的步驟,保存現(xiàn)有的配置。如果問題出現(xiàn)了,可以使用保存的配置返回到一個已知的狀態(tài)。
在實(shí)施過程中應(yīng)該設(shè)計(jì)一些中間環(huán)節(jié),以便在一些關(guān)鍵點(diǎn)進(jìn)行測試,而不是在整個方案構(gòu)實(shí)施過程結(jié)束以后,再對結(jié)果作出評價(jià)。逐步對一些個體進(jìn)行測試遠(yuǎn)比對整個解決方案進(jìn)行測試要簡單得多。因?yàn)榍罢呖赡墚a(chǎn)生有限的故障,而后者卻可能在許多方面產(chǎn)生故障。
當(dāng)計(jì)劃方案會對網(wǎng)絡(luò)中的其他部分和其他用戶產(chǎn)生影響時(shí),必須通知用戶在實(shí)施過程中可能受到影響的服務(wù),以便用戶有充分的時(shí)間來安排停機(jī)時(shí)間。
當(dāng)完成了方案列表的制訂以及中間測試步驟的安排,并且通知了相應(yīng)的用戶以后,就可以將方案付諸實(shí)施了。
六、檢驗(yàn)排障效果
基于排障方案,處理了一個變量后,收集數(shù)據(jù),看是否已經(jīng)修復(fù)了問題。測試做出的所有修復(fù),確信沒有使問題變得更糟或引入新的問題。讓用戶再次運(yùn)行他們的應(yīng)用程序,以驗(yàn)證問題是否已經(jīng)被處理了。如果還沒有修復(fù)問題,重復(fù)以上解決過程。
應(yīng)該全面測試已經(jīng)實(shí)施的操作。測試過程應(yīng)該盡可能地模擬實(shí)際情況。例如在解決一臺發(fā)生故障的工作站時(shí),僅使用Ping工具確定其與服務(wù)器的連接是不夠的。如果可能,您應(yīng)該以系統(tǒng)用戶的身份登錄網(wǎng)絡(luò),然后再嘗試運(yùn)行位于工作站上的程序。最后記錄下相關(guān)的信息。
七、填寫排障記錄
在確認(rèn)故障排除后,要制作一個連貫的故障排除記錄文檔。其主要內(nèi)容,應(yīng)包括所有與故障相關(guān)的信息,如:故障定義、解決方法、操作過程、測試手段、測試步驟、調(diào)試結(jié)論等。這樣,將來在同樣或類似的故障出現(xiàn)時(shí),就可以通過查閱此排障文檔,很方便地解決問題。
八、采取預(yù)防措施
一個優(yōu)秀的網(wǎng)絡(luò)管理員,不僅能夠排除各種網(wǎng)絡(luò)故障,而且還耍制定相應(yīng)的對策,來防止此類問題的再次發(fā)生。比如,若網(wǎng)絡(luò)故障是由于系統(tǒng)或者應(yīng)用程序參數(shù)變更引起的,那么,就要告訴用戶,在以后的使用中,不要擅自修改這些參數(shù)。假設(shè)故障是由于某種網(wǎng)絡(luò)傳播的病毒引起的,那么,就可以通過安裝相應(yīng)的防病毒軟件,以及強(qiáng)化軟件管理和電子郵件下載等手段,來預(yù)防相同故障的發(fā)生。設(shè)計(jì)預(yù)防措施是一種主動的網(wǎng)絡(luò)管理方式,而不是一種被動的管理方式。
參考文獻(xiàn)
[1]李學(xué)聰,萬頻,李敏,宋亞男,李軍. 基于組合導(dǎo)航系統(tǒng)的網(wǎng)絡(luò)故障檢測與容錯技術(shù)研究[J]計(jì)算技術(shù)與自動化, 2010, (02) .
[2]劉紅. 嵌入式系統(tǒng)技術(shù)發(fā)展趨勢淺析[J]中國建設(shè)教育, 2010, (10) .