張磊
欄目主持人:郭濤提供新聞線索可致電010-88559756
或發(fā)郵件至ciw_tguo@ccidmedia.com
存儲(chǔ)性能測(cè)量(SPM)對(duì)IT部門來(lái)說(shuō)是一個(gè)難題。當(dāng)前,服務(wù)器虛擬化應(yīng)用成了熱門,存儲(chǔ)性能測(cè)量也將面臨更多挑戰(zhàn)。
RiskMetrics集團(tuán)是美國(guó)紐約一家地區(qū)性金融服務(wù)公司。該公司擁有30臺(tái)VMware ESX服務(wù)器,分布在包括美國(guó)、瑞士等在內(nèi)的6個(gè)不同地方的數(shù)據(jù)中心里。每臺(tái)VMware ESX服務(wù)器運(yùn)行著10~15個(gè)虛擬機(jī)(VM)。存儲(chǔ)管理員不但要確保虛擬機(jī)能像物理機(jī)那樣運(yùn)行,而且要為虛擬機(jī)的快速增長(zhǎng)做好合理規(guī)劃?!爱?dāng)一個(gè)物理服務(wù)器出現(xiàn)故障時(shí),問(wèn)題不是出在主機(jī)上就是出在存儲(chǔ)上。但是當(dāng)虛擬服務(wù)器出現(xiàn)故障時(shí),存儲(chǔ)管理員不能簡(jiǎn)單地從主機(jī)和存儲(chǔ)兩方面來(lái)判定問(wèn)題所在,因?yàn)樵谕粩?shù)據(jù)存儲(chǔ)空間內(nèi)還有大量的其他虛擬機(jī)存在。”RiskMetrics集團(tuán)存儲(chǔ)系統(tǒng)架構(gòu)師德?tīng)柪嘟榻B說(shuō),“當(dāng)一臺(tái)虛擬機(jī)在寫入數(shù)據(jù)時(shí)出現(xiàn)故障,用戶需要考慮相關(guān)的存儲(chǔ)系統(tǒng)是否會(huì)對(duì)其他的虛擬機(jī)造成負(fù)面影響。在一臺(tái)物理服務(wù)器中,用戶可以通過(guò)檢查數(shù)據(jù)讀寫速度來(lái)判斷得到的數(shù)據(jù)是否正確。但是對(duì)于虛擬化服務(wù)器環(huán)境來(lái)說(shuō),用戶必須匯總所有虛擬機(jī)的性能指標(biāo),才能決定下一步如何做?!?/p>
RiskMetrics集團(tuán)使用Tek-Tools軟件公司的Profiler性能檢測(cè)工具,以圖形化的方式顯示出特定VMware ESX節(jié)點(diǎn)上的數(shù)據(jù)讀寫速度。Profiler性能檢測(cè)工具被用在RiskMetrics集團(tuán)在美國(guó)的一個(gè)基礎(chǔ)數(shù)據(jù)中心里,以便從VMware的vCenter Server(以前被稱為VMware虛擬中心)中獲取信息,并在儀表盤上顯示所有VMware ESX節(jié)點(diǎn)的運(yùn)行情況。德?tīng)柪嘟榻B說(shuō):“如果3個(gè)人打電話抱怨虛擬機(jī)運(yùn)行緩慢,我就可以查看這3個(gè)虛擬機(jī)是否正好處于同一個(gè)數(shù)據(jù)存儲(chǔ)池中?!?/p>
針對(duì)虛擬機(jī)環(huán)境的軟件工具
美國(guó)比佛頓市Dragon Slayer咨詢公司總裁馬克·斯坦默介紹說(shuō),Tek-Tools的Profiler、Akorri公司的BalancePoint、NetApp的SANscreen、SANpulse技術(shù)公司的SANlogics和Veeam軟件公司的Veeam Monitor等性能監(jiān)測(cè)軟件,可以幫助管理員確信花在應(yīng)用和存儲(chǔ)上的錢沒(méi)有浪費(fèi)?!拔锢憝h(huán)境和虛擬環(huán)境有天壤之別。”馬克·斯坦默表示,“用戶要使用一些軟件工具來(lái)評(píng)估服務(wù)器的性能,以確保不會(huì)搬起石頭砸自己的腳?!?/p>
馬克·斯坦默推薦用戶使用第三方的軟件工具,而不是那些存儲(chǔ)廠商提供的相關(guān)軟件?!暗谌焦ぞ咄ǔD転樘摂M服務(wù)器和應(yīng)用提供更加全面的監(jiān)測(cè)功能?!瘪R克·斯坦默說(shuō),“用戶需要端到端的監(jiān)測(cè),而不僅僅是單個(gè)點(diǎn)的監(jiān)測(cè)。”由于虛擬機(jī)的部署十分容易,用戶正加速創(chuàng)建虛擬機(jī),并把這些虛擬機(jī)移動(dòng)到僅具備基本運(yùn)行條件的環(huán)境中,而這樣很可能導(dǎo)致共享資源的超載。為此,很多公司采用性能測(cè)試工具對(duì)共享資源(包括存儲(chǔ)陣列、網(wǎng)絡(luò)和服務(wù)器)進(jìn)行分析,以便找出哪些資源被過(guò)度使用了。
虛擬服務(wù)器性能管理實(shí)踐
RiskMetrics集團(tuán)采用了一些常用的方法來(lái)保證虛擬服務(wù)器的良好性能。比如,存儲(chǔ)管理員不會(huì)為VMware ESX集群服務(wù)器配備一般的SATA硬盤,而是使用性能更好的光纖通道(FC)硬盤?!癡Mware虛擬化軟件的使用給存儲(chǔ)環(huán)境的管理帶來(lái)了更高的復(fù)雜性,但我們可以解決這些問(wèn)題,比如采用更高性能的硬盤,并將虛擬機(jī)和其他應(yīng)用隔離開?!钡?tīng)柪啾硎?“所有的虛擬服務(wù)器集群都有各自專用的RAID(獨(dú)立磁盤冗余陣列)組和LUN(邏輯單元編號(hào)),這樣就可以避免性能瓶頸?!?/p>
在電子郵件歸檔系統(tǒng)中,RiskMetrics集團(tuán)決定繞開VMware的內(nèi)部磁盤管理系統(tǒng),直接將1TB的LUN連接到虛擬機(jī)上,并在其上運(yùn)行賽門鐵克公司的Enterprise Vault軟件?!拔覀冞@樣做是出于性能上的考慮?!钡?tīng)柪嘟榻B說(shuō),“這樣一來(lái)就可以確保沒(méi)有人能直接訪問(wèn)這個(gè)LUN。因?yàn)長(zhǎng)UN不是VMware環(huán)境的一部分,所以用戶無(wú)法把虛擬機(jī)放在LUN上運(yùn)行。”
VMware建議用戶為系統(tǒng)的內(nèi)存交換(Swapping)預(yù)留一定的存儲(chǔ)空間。因此,RiskMetrics集團(tuán)在1TB的LUN上預(yù)留出20%的存儲(chǔ)空間。一旦存儲(chǔ)數(shù)據(jù)占用的空間超過(guò)80%,Profiler軟件就會(huì)自動(dòng)發(fā)送告警郵件給管理員。當(dāng)Enterprise Vault上線時(shí),預(yù)計(jì)1TB的LUN可以支持8個(gè)月的存儲(chǔ)需求。實(shí)際上到第6個(gè)月,1TB的存儲(chǔ)空間就被用完了。RiskMetrics集團(tuán)又增加了1TB的LUN,希望可以再支持6個(gè)月的系統(tǒng)運(yùn)行。
中國(guó)計(jì)算機(jī)報(bào)2009年19期