在實(shí)際管理和使用VMWare vSphere虛擬平臺(tái)時(shí),可能會(huì)遇到和網(wǎng)絡(luò)配置相關(guān)的故障。例如,某臺(tái)ESXi主機(jī)出現(xiàn)網(wǎng)絡(luò)連接異常,包括網(wǎng)絡(luò)通訊時(shí)斷時(shí)續(xù)或者瞬間中斷等。解決方法是,進(jìn)入ESXi主機(jī)的DCUI接口下執(zhí)行“ping xxx.xxx.xxx.xxx”命令,其中的“xxx.xxx.xxx.xxx”為別的ESXi主機(jī)的IP,來(lái)檢測(cè)網(wǎng)絡(luò)的連通性。如果Ping探測(cè)成功,說(shuō)明在物理層面沒(méi)有明顯的問(wèn)題。因?yàn)樵趫?zhí)行Ping探測(cè)時(shí),實(shí)際上是從虛擬交換機(jī)的VMkernel端口發(fā)送出去的,數(shù)據(jù)包經(jīng)過(guò)物理網(wǎng)卡,再到達(dá)外部的物理交換機(jī)上。Ping檢測(cè)成功,說(shuō)明這些環(huán)節(jié)沒(méi)有問(wèn)題。
如果探測(cè)失敗,并且經(jīng)檢測(cè)硬件并不存在故障的話(huà),就需要按照特定的流程進(jìn)行逐級(jí)的排查。既然是EXSi主機(jī)出現(xiàn)網(wǎng)絡(luò)故障,就必須先從ESXi主機(jī)配置入手檢測(cè)。例如,檢測(cè)EXSi主機(jī)的管理網(wǎng)絡(luò)是否存在配置錯(cuò)誤,物理網(wǎng)卡的雙工速率和物理交換機(jī)不匹配,網(wǎng)卡到交換機(jī)之間網(wǎng)線存在斷路,NIC Teaming(多網(wǎng)卡綁定實(shí)現(xiàn)負(fù)載均衡)的策略存在問(wèn)題(例如將其負(fù)載均衡策略設(shè)置為IPHash,但是上行交換機(jī)沒(méi)有配置與之對(duì)應(yīng)的端口組聚合等)等情況時(shí),都可能出現(xiàn)網(wǎng)絡(luò)連接不通暢的問(wèn)題。
當(dāng)排除了ESXi主機(jī)可能潛在的問(wèn)題后,接下來(lái)就需要對(duì)物理網(wǎng)絡(luò)進(jìn)行檢測(cè),例如網(wǎng)卡是否存在兼容性問(wèn)題、網(wǎng)絡(luò)設(shè)備是否存在硬件故障,網(wǎng)絡(luò)性能是否穩(wěn)定等。一般來(lái)說(shuō),EXSi主機(jī)自身配置的問(wèn)題,導(dǎo)致網(wǎng)絡(luò)連接異常的概率較大。
在其本機(jī)命令行界面中執(zhí) 行“exxcfg-vswitch –l”命令,來(lái)檢測(cè)標(biāo)準(zhǔn)網(wǎng)絡(luò)交換機(jī)、網(wǎng)卡和端口組的配置信息,據(jù)此可以檢測(cè)其是否存在問(wèn)題。執(zhí)行“esxcli network vswitch standard portgroup list”命令,對(duì)標(biāo)準(zhǔn)虛擬交換機(jī)端口組的VLAN ID的配置信息進(jìn)行查看和檢測(cè)。執(zhí)行“esxcfg-nics -l”命令,來(lái)檢查網(wǎng)卡的速率和雙工模式,以及網(wǎng)絡(luò)連接狀態(tài)信息。如果其處于“Down”狀態(tài),說(shuō)明鏈路層存在問(wèn)題。
根據(jù)檢測(cè)到的故障點(diǎn),可以有針對(duì)性地執(zhí)行對(duì)應(yīng)的修正命令,來(lái)處理不同的故障問(wèn)題。
當(dāng)檢測(cè)到vSS虛擬交換機(jī)存在問(wèn)題,可以執(zhí)行“esxcfg-vswitch -a xxx”命令,來(lái)添加新的虛擬交換機(jī),其中的“xxx”為其名稱(chēng)(以下與之相同)。
當(dāng)檢測(cè)到端口組出現(xiàn)問(wèn)題,可以執(zhí)行“esxcfgvswitch -A zzz xxx”命令,在目標(biāo)交換機(jī)上來(lái)添加名為“zzz”的端口組。
如果是上行鏈路的問(wèn)題,可以執(zhí)行“esxcfg -vswitch-L vmnicx xxx”命令,來(lái)添加名為“vmnicx”的網(wǎng)卡編號(hào),來(lái)創(chuàng)建新的上行鏈路。
如果是端口組的VLAN存在問(wèn)題,可以執(zhí)行“esxcli network vswitch standard portgroup set -p zzz –v vlanid”命令,修改標(biāo)準(zhǔn)虛擬交換機(jī)上指定端口組的VLAN ID,其中的“vlanid”參數(shù)為具體的ID編號(hào)。
如果網(wǎng)卡的速率或雙工模式異常,可以執(zhí)行“esxcfg-nics -d duplex -s speed vmnicx”命令,來(lái)對(duì)特定的網(wǎng)卡設(shè)定合適的速率和雙工模式,其中的“speed”參數(shù)為速率值,“duplex”參數(shù)為雙工模式。
如果是網(wǎng)絡(luò)連接狀態(tài)處于“Down”狀態(tài),就需要檢測(cè)網(wǎng)卡連接情況,將其調(diào)整到物理交換機(jī)的合適端口上。如果可以Ping通別的EXSi主機(jī),而且網(wǎng)絡(luò)連接配置都不存在問(wèn)題,就要考慮到可能是NIC Teaming策略配置存在問(wèn)題。
在端口組屬性編輯窗口左側(cè)選擇“Teaming and failover”項(xiàng),在 右 側(cè) 的“Load balancing”列表中查看選擇的策略項(xiàng)目。如果選擇的是“Route based on IP hash”項(xiàng),但是物理交換機(jī)機(jī)沒(méi)有配置與之對(duì)應(yīng)的端口組聚合,就會(huì)導(dǎo)致問(wèn)題的發(fā)生??梢赃x擇“Route based on originating virtual port”項(xiàng),進(jìn)行策略的調(diào)整。如果排除了虛擬層面的問(wèn)題,那就需要確定網(wǎng)絡(luò)故障是否由硬件故障導(dǎo)致的。
執(zhí)行“esxcfg-nics -l”命令,來(lái)查看網(wǎng)卡的型號(hào)等信息。之后登錄到VMWare的官網(wǎng)上查看HCL列表信息,來(lái)確定其兼容性是否符合要求。執(zhí)行“l(fā)spci -p”命令,在返回信息中會(huì)顯示相關(guān)的網(wǎng)卡是否處于異常狀態(tài),來(lái)檢測(cè)是否因?yàn)橛布?dǎo)致的故障。如果ESXi主機(jī)出現(xiàn)網(wǎng)絡(luò)連接時(shí)斷時(shí)續(xù)等情況,有可能是因?yàn)榫W(wǎng)絡(luò)堵塞等問(wèn)題造成其性能過(guò)低引發(fā)的。執(zhí)行“esxtop”命令,打開(kāi)網(wǎng)絡(luò)信息查看界面,可以查看和管理網(wǎng)絡(luò),物理網(wǎng)卡,虛擬機(jī)對(duì)應(yīng)的網(wǎng)絡(luò)連接情況,包括網(wǎng)絡(luò)傳輸和接收速率等。如果對(duì)域高速局域網(wǎng)來(lái)說(shuō),實(shí)際的傳輸速率很低的話(huà),就說(shuō)明網(wǎng)絡(luò)性能較低,需要深入檢測(cè)并排除相關(guān)問(wèn)題,恢復(fù)網(wǎng)絡(luò)的正常性能。此外,使用“resxtop”命令也可以查看網(wǎng)絡(luò)運(yùn)行信息。