Duncan (yellow-bricks.com) hat heute einen Eintrag über Netzwerkverlust nach einem HA Failover berichtet. Dieses Thema, welches sehr logisch ist wird aber oft vergessen, daher möchte ich noch einige HA Punkte beifügen. Dies ist nur ein kleiner “Brainstorm”, daher keine Garantie auf Vollständigkeit.
 
- HA Best Practice ist der Einsatz eines DNS Servers
- Soll der DNS Server Ausfall (könnte die ausgefallenen VM sein) ebenfalls überbrückt werden, kann mit der /etc/hosts gearbeitet werden, in dem die ESX Hosts mit IP, Name und FQDN (vollqualifiziert inkl. Domäne) eingetragen werden.
- Besteht eine Netzwerktrennung (physikalisch, VLAN oder IP Subnetz) zwischen den verschiedenen Uplinks, kann die Erhöhung der HA Funktionalität durch eine zweite Service Console an einem zweiten vSwitch sehr sinnvoll sein. Allerdings bringt ein zweiter vSwitch sehr wenig, wenn alle Uplinks der genutzten vSwitches an einem physikalischen Switch angeschlossen sind (was nicht selten zu sehen ist)
- Zwischen den HA Knoten und deren Service Console Netzwerken dürfen keine Router existieren
- Beachtung der Primary und Secondary Agenten bei räumlichen Trennungen und großen Clustern, da nur die ersten 5 Knoten als Primary fungieren (cat /var/log/vmware/aam/aam_config_util_listnodes.log)
- Es muss auf die Ressourcen im Failover Fall geachtet werden (in erster Linie genügend Hauptspeicherressourcen) – auch lokale Festplattendateien, die nur auf einem ESX verfügbar sind (nahezu VMotion Kompatibilität)
- Im Failover Fall müssen genügend vSwitch Ports zur Verfügung stehen
 
Gerade der Failover Fall wird sehr oft unterschätzt. Die Überprüfung der Primary und Secondary HA Knoten sollte Pflicht sein, um ein Klumpenrisiko durch alle Primaries in einem RZ zu verhindern. Außerdem müssen genügend Ressourcen zur Verfügung stehen – vor allem Hauptspeicher Reservierungen können zum Problem werden, und die VMs starten nicht. Es muss geprüft werden, ob genügend vSwitch Ports frei sind, damit beim Failover die VMs einen Netzwerkanschluss erhalten können (esxcfg-vswitch -l).