最近,單位中心機(jī)房的一臺服務(wù)器經(jīng)常莫名其妙地出現(xiàn)網(wǎng)絡(luò)中斷。到機(jī)房重啟后過一段時間,網(wǎng)絡(luò)又出故障。但是,連接在同一交換機(jī)下的其他服務(wù)器并沒有出現(xiàn)類似故障問題。
故障設(shè)備為一臺DELL PowerEdge R620服務(wù)器,該服務(wù)器新采購后不久,服務(wù)器上的應(yīng)用并不多,主要功能為通訊服務(wù)器,在線用戶也就200人左右。檢查服務(wù)器網(wǎng)卡,發(fā)現(xiàn)網(wǎng)卡燈閃爍正常,網(wǎng)絡(luò)配置沒問題,網(wǎng)卡驅(qū)動也正常安裝。通過Ping測試網(wǎng)絡(luò),也沒有發(fā)現(xiàn)問題。但是在遠(yuǎn)程登錄服務(wù)器的時候,發(fā)現(xiàn)和其他服務(wù)器相比,有點(diǎn)卡。與DELL廠商聯(lián)系,工程師建議我使用DELL官方故障排查工具DEST 檢測問題。在服務(wù)器上運(yùn)行檢測工具后,并未發(fā)現(xiàn)服務(wù)器硬件上有問題,工程師建議更新網(wǎng)卡驅(qū)動。
在DELL官網(wǎng)下載最新的網(wǎng)卡驅(qū)動,安裝并重啟服務(wù)器,服務(wù)器平穩(wěn)運(yùn)行了一兩天,網(wǎng)絡(luò)又出現(xiàn)中斷。根據(jù)用戶反映,網(wǎng)絡(luò)中斷前,用戶正在從該服務(wù)器上拷貝文件。根據(jù)前面的推斷,問題應(yīng)該出在網(wǎng)絡(luò)方面。
服務(wù)器接入的交換機(jī)為一臺H3C 5500,遠(yuǎn)程登錄到該設(shè)備,發(fā)現(xiàn)服務(wù)器所在接入端口被強(qiáng)制設(shè)置為速率100M全雙工模式運(yùn)行,在Input方面有大量錯誤數(shù)據(jù)包被丟棄。再看看服務(wù)器的網(wǎng)卡配置,在屬性的“高級”中看到,網(wǎng)卡的速率和雙工模式為自動協(xié)商(如圖1)。那自動協(xié)商的結(jié)果是不是也和交換機(jī)端一樣,100M全雙工模式呢?
圖1 “高級”選項卡
網(wǎng)卡在設(shè)置為自動協(xié)商時,一種是兩端都采用自動協(xié)商的方式通信,比如A機(jī)器和B機(jī)器在進(jìn)行自動協(xié)商,A機(jī)器具有10/100/1000M全/半雙工能力,而B機(jī)器只有10/100M全/半雙工能力,這樣雙方共有的最高鏈路能力為100M,全雙工。一旦雙方進(jìn)行自動協(xié)商,鏈路就會運(yùn)行在雙方能夠支持的最佳能力下。另一種情況就是我遇到的情況,一端為強(qiáng)制速率和雙工模式,另一端為自動協(xié)商模式。在這種情況下,因?yàn)閺?qiáng)行設(shè)定的一端不進(jìn)行協(xié)商,協(xié)商站點(diǎn)沒有方法知道強(qiáng)行設(shè)定站點(diǎn)工作在哪種雙工方式下。協(xié)商站點(diǎn)為了避免全半雙工不匹配,根據(jù)802.3標(biāo)準(zhǔn),它必須與強(qiáng)行站點(diǎn)使用相同的速率,但是工作在半雙工方式下。不管速率如何(除了10G),半雙工是以太網(wǎng)的默認(rèn)方式。在許多情況下,這會產(chǎn)生全半雙工不匹配問題。
聯(lián)系當(dāng)前問題,故障產(chǎn)生的原因就顯而易見。服務(wù)器端采用的自動協(xié)商,而交換機(jī)端采用的則是強(qiáng)制100M 全雙工模式。最后,自動協(xié)商后的結(jié)果是100M半雙工模式運(yùn)行,這樣就和交換機(jī)端配置不匹配,所以在通信時就會產(chǎn)生很多錯誤數(shù)據(jù)包,進(jìn)而出現(xiàn)網(wǎng)絡(luò)故障。
明白故障問題的成因,問題就迎刃而解。一種方法就是把服務(wù)器端也強(qiáng)制設(shè)置成100M全雙工模式,保持和交換機(jī)端配置一致。另一種就是改變交換機(jī)端的配置,去除原先配置的強(qiáng)制雙工和速率,也改為自動協(xié)商機(jī)制。結(jié)合實(shí)際情況,我采用第二種方法更加合理,因?yàn)榉?wù)器網(wǎng)卡最高支持1000M速率,而交換機(jī)端也是10/100/1000M自適應(yīng)模式,這樣自動協(xié)商后,就可以獲得1000M的高速率,更高的發(fā)揮服務(wù)器的網(wǎng)絡(luò)性能。
具體處理方法是,在H3C交換機(jī)端口模式下采用undo命令去除原來配置的速率和雙工模式,設(shè)備就會自動恢復(fù)成默認(rèn)的自動協(xié)商模式。
最后,登錄到服務(wù)器和交換機(jī)上,看到兩端的速率都變成1000M全雙工模式。隨后觀察了幾天,沒有再次出現(xiàn)故障問題。
在配置網(wǎng)絡(luò)時,最合理的做法就是把兩端都設(shè)置成自動協(xié)商模式,因?yàn)樵诤芏鄷r候,我們并不一定了解設(shè)備網(wǎng)卡或者端口具體支持的最大速率和雙工模式,但只要將兩端都設(shè)置成自動協(xié)商,兩端自然會通過協(xié)商,獲得最大支持的網(wǎng)絡(luò)速率,從而更好地發(fā)揮網(wǎng)絡(luò)性能。