ESX physische Uplinks gegen Pfadausfall sichern

vmnic Redundanz mit Link State Tracking / Smartlinks absichern

Ein vSphere Cluster sollte in jeder Hinsicht redundant ausgelegt sein. D.h. der Ausfall einer Komponente darf nicht zum Funktionsverlust führen. Wir bilden RAID Sets aus mehreren Disks, steuern Storage Einheiten über mehrere Controller, haben mehrere Pfade zur Storage, redundante LAN- und SAN-Switches und mehrere Uplinks pro Host ins physische Netzwerk.

VMware vSphere verwendet mehrere physische Uplinks, um daraus einen logischen NIC zu erstellen. Somit wird Redundanz gewährleistet. Besonders für Kenelports ist Redundanz besonders wichtig. Über diese wird das Management Network, vMotion, FT, iSCSI und Heartbeats abgewickelt.

Es gibt aber Szenarien, bei denen alle NICs eines ESX physischen Link haben und dennoch ein Pfadausfall auf dem Weg zum Core-Switch dazu führt, daß Pakete ins Nirvana gesendet werden.

Wir werden im folgenden Teil mehrere Architekturen anschauen und Methoden zeigen, um dies zu verhindern. „ESX physische Uplinks gegen Pfadausfall sichern“ weiterlesen

vSphere HA Features in der Zukunft: Restart Order

Auf der Seite Yellow-Bricks ist eine interessante Diskussion über ein mögliches neues Feature des HA Clusters entstanden. Duncan Epping von Yellow-Bricks ist selbst VMware Mitarbeiter. Er und einige seiner Kollegen diskutieren im Kommentarbereich mit Anwendern über eine mögliche neue Funktion und deren Gestaltung.

  • Definition von Abhängigkeiten (Ketten) zwischen VMs
  • Definition von Restart-Gruppen
  • Clusterweite Shutdown und Restart Richtlinien

Die Diskussion ist offen und jeder kann Anregungen zum Thema einbringen.

HA failover und STP

Eine Verfahrensweise, die ich mir bei Wartungen an ESX Clustern zu eigen gemacht habe, ist HA zu deaktivieren. Insbesondere dann, wenn es sich um Wartungen an der Netzinfrastruktur handelt. Warum eigentlich? HA ist inzwischen ein robuster Dienst und die Netzinfrastruktur sollte ohnehin redundant ausgelegt sein. Die Erfahrung zeigte allerdings, dass trotz aller Redundanz, Arbeiten an der Netzinfrastruktur immer wieder zu unerwünschten Failover Aktionen des HA führten. Dabei versucht z.B. ein Host (vergeblich), die laufenden VMs eines anderen zu starten. „HA failover und STP“ weiterlesen