Qlogic HBA verschwunden nach ESXi Update 6.0 U3

Das Patchen eines ESXi Hosts über den Update Manager ist normalerweise eine eher unspektakuläre Standard-Prozedur. Installieren – Reboot – Fertig!

Ich war etwas erstaunt, als mir ein Kunde berichtete, er habe nach dem Neustart eine VM verloren [Anm.: Diese VM wird per DRS-Regel auf dem Host gehalten und mit diesem beendet und gestartet.]. Ein kurzer Blick auf den Host erklärte den Umstand. Die VM war unerreichbar, da der Host keine (!) Datastores mehr hatte. Die Datastores hatte er verloren, weil er auch keine Fibre-Channel HBA mehr hatte. Der Qlogic QLE2692 war einfach nur weg. Die PCIe Karte war natürlich noch im Server und blinkte munter vor sich hin. 😉 „Qlogic HBA verschwunden nach ESXi Update 6.0 U3“ weiterlesen

PBM error occurred during PreMigrateCheckCallback

Beim Versuch einen vMotion Vorgang durchzuführen, lieferte der vSphere-Client fogenden Fehler:

Ein allgemeiner Systemfehler ist aufgetreten: PBM error occurred during PreMigrateCheckCallback: Invalid response code: 503 Service unavailable.

Die Ursache wird in KB 2118551 beschrieben. Zur oben beschriebenen Fehlermeldung kommt es, wenn der Profile-Driven Storage service nicht verfügbar ist. Man kann dies mittels einer SSH Verbindung auf die Virtual-Center-Server-Appliance (VCSA) überprüfen. „PBM error occurred during PreMigrateCheckCallback“ weiterlesen

VMware Content Library Service may have failed to start

Beim Start der Virtual Center Server Appliance (VCSA) kann es zu folgender Meldung in der Konsole kommen:

VMware Content Library Service may have failed to start

Dies ist ein Hinweis, daß die Appliance schon vor dem Reboot ein Problem hatte. Die Meldung kann auch beim Versuch, alle Dienste manuell auf der Bash zu starten ausgegeben werden.

service-control --start --all
.
.
.
Waiting for VMware Content Library Service..................
WARNING: VMware Content Library Service may have failed to start.

Die Ausgabe ist verkürzt wiedergegeben (Punkte).

Der Fehler entsteht durch eine defekte oder ungültige PID des content library service, die nach dem letzten Neustart nicht gelöscht wurde.  VMware beschreibt die Lösung in der KB 2147891. „VMware Content Library Service may have failed to start“ weiterlesen

VCSA 6.0 Log-Volume voll

Die VCenter ServerAppliance (VCSA) hat in Versionen vor 6.0 Update3 ein Problem mit voll laufender Log-Volumegruppe. Zunächst erscheint eine Warnung in der Web-GUI der Appliance, die man aber nur bemerkt, wenn man sich dort einloggt. Richtig übel wird es erst wenn das Log-Volume randvoll ist und dann unter Umständen wichtige Dienste nicht mehr starten.

Wenn das vCenter nicht mehr voll verwendbar ist, benötigt man Zugriff über SSH, oder über ein Konsolenfenster. Dazu muss man wissen auf welchem Host vCenter aktuell läuft und öffnet einen C#-Client auf diesen. „VCSA 6.0 Log-Volume voll“ weiterlesen

Brocade Web Tools als Default

Es gibt für Brocade FC-Switches zwei Management Methoden mit GUI: EZSwitchSetup und die Web-Tools.

EZSwitchSetup ist das vereinfachte Tool für Basiseinstellungen an singulären FC-Switches.  Mit den Web-Tools lassen sich komplexere Einstellungen und Multi-Switch-Systeme administrieren.

Gelegentlich stoße ich auf ein Gerät, welches default immer den EZSwitchSetup zu laden versucht, jedoch Teil einer Multi-Switch-Fabric ist. Der Browser zeigt immer die folgende Meldung.

Ein Klick auf den Link zu den Web-Tools öffnet das richtige Management Tool.

„Brocade Web Tools als Default“ weiterlesen

Check ESX Path Selection Policy (PSP)

VMware ESXi verwendet ein modulares Framework zur Verwaltung von gleichzeitigen Zugriffen auf Datenspeicher. Die Pluggable Storage Architecture (PSA) koordiniert die Arbeit der Multipathing-Plugins (MPP). Verschiedene Storage Hersteller liefern eigene MPP für den Betrieb ihrer Geräte an ESXi Hosts, oder geben Empfehlungen für die Verwendung des VMware Native Multipathing Plugin (NMP). Dieses bietet drei Path-Selection-Policies:

  • Fixed
  • Most recently used (MRU)
  • Roud Robin (RR)

Die Standard-Einstellung des VMware Native Multipathing Plugins ist MRU. Das bedeutet, dass jedes neue ESX-Volume auf jedem Host mit der Policy MRU angesteuert wird.

Beim neu hinzufügen von LUNs zum ESX Cluster passiert es immer wieder, daß für einzelne LUNs nicht die korrekte Path-Selection-Policy gesetzt wird. Bei n Luns x m Server kommt da unter Umständen eine große Anzahl an Konfigurationen zusammen mit erhöhter Fehlerwahrscheinlichkeit. „Check ESX Path Selection Policy (PSP)“ weiterlesen

Windows 10 BSOD auf Tastendruck

Ich kann mich an Zeiten erinnern, da genügte ein Mausklick oder eine falsche Taste, um das gesamte System abstürzen zu lassen. Der gefürchtete Bluescreen of Death (BSOD) war die Folge.

Man kann einen BSOD auch geplant durch eine Tastenkombination auslösen. Dies ist kein Bug, sondern ein Feature!

Dazu muss in der Registry eine Änderung vorgenommen werden:

HKEY_LOCAL_MACHINE\System\CurrentControlSet\Services\i8042prt\Parameters

Dort ein neues DWORD zufügen mit dem Namen „CrashOnCtrlScroll“ und dem Wert 1 (ob Hex oder Dezimal spielt hier keine Rolle). 😉

Danach muss das System neu gestartet werden.

Nach dem Reboot kann der BSOD mit folgender Tastenkombination ausgelöst werden:

[right Ctrl] + [Scroll Lock] + [Scroll Lock]

Dieses Verfahren funktioniert mit

  • Server 2003 SP1 mit Hotfix KB244138, sowie Server 2003 ab SP2
  • Vista SP1 mit Hotfix KB971284, sowie Vista ab SP2
  • Server 2008 SP1 mit Hotfix KB971284, sowie Server 2008 an SP2
  • Windows 7, 8, 8.1, 10

 

Links

MSDN – Forcing a System Crash from the Keyboard

Veeam Replication und VM MAC Conflict Alarm

Nach jedem Replikationsvorgang einer VM meldet vCenter einen VM MAC Conflict Alarm. Der Alarm ist korrekt, da Veeam die VM (hier eine vCenter Appliance) zu 100% repliziert, also auch inklusive der original MAC Adresse. Folglich wird der Alarm korrekt ausgelöst. In diesem speziellen Fall ist er jedoch unbegründet. Ein Replikat wird nur verwendet, wenn das Original nicht mehr verfügbar ist.

Falsche Alarme (oder besser gesagt unbegründete) quittieren ist mühsam und führt zur Abstumpfung. Die Wahrscheinlichkeit, daß dadurch irgendwann ein schwerer Alarm übersehen, oder ignoriert wird, steigt an.

„Veeam Replication und VM MAC Conflict Alarm“ weiterlesen

ESXi nach Upgrade zurücksetzen

ESXi Host nach einem Upgrade mittels DCUI auf Letzte Version zurücksetzen

ESXi Host-Upgrades bergen immer ein gewisses Risiko. So kann es während des Upgradevorgangs zu Problemen kommen, dass der Host nicht mehr optimal funktioniert. In solchen Fällen ist es gut zu wissen, daß man zum letzten funktionsfähigen Image zurückkehren kann.

Ein Rücksprung ist nach den folgenden Upgrademethoden möglich:

  • Installation oder Deinstallation eines VIB
  • Installation mittels Update Manager
  • Entfernung eines Host-Profils
  • Installation vom ISO

„ESXi nach Upgrade zurücksetzen“ weiterlesen

HP in Service Software Upgrade (ISSU) eines FlexFabric IRF Clusters

Software Updates auf Netzwerk-Infrastruktur ist ein heikles Thema. Einerseits muss man aus Gründen der Sicherheit die Software stets aktuell halten, andererseits ist ein Update mit einem Reboot der Hardware verbunden und damit mit Unterbrechung der Anbindung.

Einen Branch-Switch, der nur PC, Telefonie und Drucker bedient, kann man außerhalb der Arbeitszeiten durchaus neu starten. Sogenannte Endpoint Geräte verkraften einen Kontaktverlust in der Regel problemlos. Schwieriger wird es bei Core-Komponenten oder Top-of-Rack (TOR) Switches. Diese versorgen Server, oder andere Infrastruktur Komponenten, welche sehr empfndlich auf Unterbrechungen reagieren. Aus diesem Grund werden Core- und TOR-Switches auch redundant ausgelegt, so dass der Ausfall einer Einheit nicht den 24/7/365 Betrieb der Serversysteme gefährdet.

In diesem Artikel behandle ich das Thema, wie man einen HPE IRF-Cluster der 5700er Serie mittels In Service Software Upgrades (ISSU) ohne Downtime aktualisieren kann.

Der große Vorteil der ISSU Funktion besteht darin, daß redundante Member eines IRF-Clusters nacheinander aktualisiert werden können, ohne die Funktion des Clusters zu unterbrechen.

Es gibt zwei ISSU Methoden:

  • Compatible upgrade: Beide Software Versionen können coexistieren. Die Funktion des Clusters bleibt beim Upgrade Prozess erhalten.
  • Incompatible upgrade: Alte und neue Software-Versionen sind nicht kompatibel. Das Verfahren erfordert einen Kaltstart und die Funktion des gesamten IRF-Clusters ist unterbrochen.

Ich werde hier das Szenario eines kompatiblen Upgrades schildern.

„HP in Service Software Upgrade (ISSU) eines FlexFabric IRF Clusters“ weiterlesen