■ 山東 張艷霞 樊培彩
編者按:筆者在處理服務(wù)器內(nèi)存故障中遇到服務(wù)器響應(yīng)異常慢的現(xiàn)象,經(jīng)分析后發(fā)現(xiàn)是由于服務(wù)器內(nèi)存插法順序錯(cuò)誤導(dǎo)致的。
筆者有一臺(tái)2013 年購(gòu)置的HP DL388eGEN8服務(wù)器,為雙CPU配置。近期該服務(wù)器出現(xiàn)內(nèi)存報(bào)警,提示內(nèi)存故障。
該機(jī)器上本來(lái)有4 條4 GB 內(nèi)存,筆者因不確定哪一條內(nèi)存故障,故順手拔掉了其中兩條內(nèi)存,機(jī)器能識(shí)別剩余8 GB 內(nèi)存,也能正常啟動(dòng)。而啟動(dòng)后,內(nèi)存利用率不高,CPU 利用率卻居高不下,基本上是大于80%,經(jīng)常是100%。機(jī)器響應(yīng)異常緩慢,system 進(jìn)程過(guò)高占用CPU,大于50%。運(yùn)行Ping 命令時(shí)明顯響應(yīng)慢。該設(shè)備作為Ping 的目標(biāo)機(jī),響應(yīng)異常慢。筆者在處理這個(gè)問(wèn)題時(shí),頗費(fèi)了一番周折。
開始筆者懷疑機(jī)器中病毒了,通過(guò)升級(jí)殺毒軟件,系統(tǒng)打補(bǔ)丁,但故障依舊,并未發(fā)現(xiàn)中病毒的跡象。無(wú)意中筆者看到了服務(wù)器內(nèi)存插槽圖,終于明白了服務(wù)器異常慢的根本原因。內(nèi)存插槽圖如圖1 所示。
Intel xeon 5500 系列處理器集成3 個(gè)內(nèi)存控制器,內(nèi)存子系統(tǒng)劃分為通道channels,每個(gè)控制器控制一個(gè)通道(channel),組成3通道內(nèi)存,每個(gè)處理器支持3個(gè)channel,每個(gè)channel 支持2 個(gè)內(nèi)存。對(duì)內(nèi)存的插法也有很多種情況,根據(jù)不同的插法可以達(dá)到性能和安全不同的效果。在多處理器配置的機(jī)型中,為達(dá)到最大化性能的目的,應(yīng)盡可能均勻地分配所有處理器對(duì)應(yīng)的內(nèi)存總?cè)萘?。?nèi)存條的配置:插法按照“ABCDEF”配置。
圖1 內(nèi)存插槽圖
筆者拔掉的2 條內(nèi)存,正好位于P2 這個(gè)CPU 旁邊,導(dǎo)致P2 邊上沒(méi)有內(nèi)存。
這才是造成服務(wù)器異常緩慢的根本原因。
因此,筆者通過(guò)拔出故障內(nèi)存,在P2 處理器旁邊A插槽插入正常內(nèi)存,服務(wù)器內(nèi)存從4 條4 GB 減為3 條4 GB,最終恢復(fù)正常。