HA Cluster Problem
Ich konnte bereits bei mehreren Kunden feststellen, dass nach der Memory Reservierung einiger VMs die HA Funktion still und heimlich die Current Failover Capacity in der Ansicht des Clusters auf 0 umstellt (also optisch deaktiviert). Dies passiert bereits wenn nur eine virtuelle Maschine eine hohe Memory Reservierung erhält.¬†
Nach vielen Tests ist folgendes Szenario im Beispiel festzustellen:
- 3 Hostsysteme mit 16 GB RAM
- 30 virtuelle Maschinen zwischen 512 MB und 4 GB RAM (1 VM mit 4 GB, 4 VMs mit 2 GB,  15 mit 1 GB und 10 VMs mit 512 MB)
- keine der VMs hat eine Reservierung
- Cluster Failover Capacity ist auf 1 eingestuft
¬†Da keine Reservierung genutzt wird, hat jeder ESX Server eine maximale Hauptspeichermenge von etwa 30 GB RAM (inkl. Swap) zur Verfügung. Da die virtuellen Maschinen von ihrem Maximal-RAM allerdings zumeist nur 20 – 50% nutzen, und nur zu Hochzeiten mehr verwenden, kommt der ESX Server sehr gut mit dem verfügbaren physikalischen Speicher aus.
Stellt man jetzt eine der 4 GB VMs auf 100% Reservierung, schaltet der Cluster auf Failover Capacity 0, was ein Problem darstellt.
plakatives Rechenbeispiel:
- RAM: 3 x 16 = 48 GB
- Swap: 3 x 16 = 48 GB 
- RAM Verbrauch VMs maximal:  32 GB
- realler RAM Verbrauch VMs: 12 GB
Somit wäre in jedem Fall der Ausfall eines Hostsystems bzgl. der Ressourcen abgesichert. Trotzdem schaltet die Failover Capacity auf 0, was einem Abschalten von HA gleich käme.
Das Ergebnis unserer Tests ist daher wie folgt: HA berechnet für die VM mit den Maximalressourcen einen Slot, welcher mit der Anzahl der VMs multipliziert wird.
In diesem Beispiel: 30 x 4 GB reserviert = 120 GB (physikalisch vorhanden sind nur 48 GB).
Damit schaltet HA aufgrund fehlender Ressourcen den Failover Capacity Level auf 0.
Ich wäre sehr dankbar, wenn VMachine Leser, welche dieses Phänomen ebenfalls feststellen können, in den Kommentaren ein Post absetzen und dieses mit den Versionsdaten des ESX und des VCs versehen.









