引言:機房一臺Huawei服務(wù)器,一直都在正常運行。最近出現(xiàn)假死現(xiàn)象。通過任務(wù)管理器無法結(jié)束當前任務(wù),強行關(guān)機后再也無法開機了。更換同品牌同型號的主板后,故障排除。
機房一臺 Huawei RH2280服務(wù)器,安裝有全系統(tǒng)的在線考評系統(tǒng),一直都在正常運行。前些天出現(xiàn)假死現(xiàn)象,沒辦法對外發(fā)布信息。通過任務(wù)管理器無法結(jié)束當前任務(wù),只好采取強行關(guān)機的方式重啟服務(wù)器,然后就再無法開機了,長按電源開關(guān)也不奏效,服務(wù)器總是發(fā)出嘀嘀的蜂鳴聲。
機房里同型號的服務(wù)器有好幾臺,把故障服務(wù)器的兩個電源全部取下來,換上另一臺同型號的電源,加電后打開服務(wù)器電源開關(guān),服務(wù)器仍然無法開機。
把網(wǎng)線插到故障服務(wù)器后面的BMC管理口,另一端插到筆記本電腦上,配好BMC的IP地址后,可以Ping通管理網(wǎng)關(guān),就是進不了管理界面。聯(lián)系廠家的工程師后,通過遠程操作也進不了管理界面,無法定位故障原因,只好換一個同品牌同型號的主板試試看。
由于服務(wù)器上安裝有重要的考評系統(tǒng),擔心因為主板換了,而造成系統(tǒng)無法啟動。所以,在無法確認服務(wù)器磁盤的RAID環(huán)境,先把每個硬盤從服務(wù)器上取下來,并標注好硬盤名稱和在硬盤插槽的順序。
斷開電源后,打開機箱蓋,把主板上的內(nèi)存條、網(wǎng)卡和RAID卡等設(shè)備從服務(wù)器上取下來,并標注好這些設(shè)備在主板卡槽上的位置。接著卸下主板,換上同一型號的主板。按照先前標記好的順序把各種設(shè)備再安裝到剛換的主板上,一定要注意各個設(shè)備的卡槽順序。最后,再按卸下來的順序把硬盤組重新安裝上。啟動服務(wù)器,系統(tǒng)終于可以正常啟動了,而且所有應(yīng)用都能正常使用。
無法確認服務(wù)器的RAID環(huán)境下,更換的部件一定要同品牌同型號,弄不好會造成數(shù)據(jù)損壞。