ESXi nach Upgrade zurücksetzen

ESXi Host nach einem Upgrade mittels DCUI auf Letzte Version zurücksetzen

ESXi Host-Upgrades bergen immer ein gewisses Risiko. So kann es während des Upgradevorgangs zu Problemen kommen, dass der Host nicht mehr optimal funktioniert. In solchen Fällen ist es gut zu wissen, daß man zum letzten funktionsfähigen Image zurückkehren kann.

Ein Rücksprung ist nach den folgenden Upgrademethoden möglich:

  • Installation oder Deinstallation eines VIB
  • Installation mittels Update Manager
  • Entfernung eines Host-Profils
  • Installation vom ISO

„ESXi nach Upgrade zurücksetzen“ weiterlesen

HP in Service Software Upgrade (ISSU) eines FlexFabric IRF Clusters

Software Updates auf Netzwerk-Infrastruktur ist ein heikles Thema. Einerseits muss man aus Gründen der Sicherheit die Software stets aktuell halten, andererseits ist ein Update mit einem Reboot der Hardware verbunden und damit mit Unterbrechung der Anbindung.

Einen Branch-Switch, der nur PC, Telefonie und Drucker bedient, kann man außerhalb der Arbeitszeiten durchaus neu starten. Sogenannte Endpoint Geräte verkraften einen Kontaktverlust in der Regel problemlos. Schwieriger wird es bei Core-Komponenten oder Top-of-Rack (TOR) Switches. Diese versorgen Server, oder andere Infrastruktur Komponenten, welche sehr empfndlich auf Unterbrechungen reagieren. Aus diesem Grund werden Core- und TOR-Switches auch redundant ausgelegt, so dass der Ausfall einer Einheit nicht den 24/7/365 Betrieb der Serversysteme gefährdet.

In diesem Artikel behandle ich das Thema, wie man einen HPE IRF-Cluster der 5700er Serie mittels In Service Software Upgrades (ISSU) ohne Downtime aktualisieren kann.

Der große Vorteil der ISSU Funktion besteht darin, daß redundante Member eines IRF-Clusters nacheinander aktualisiert werden können, ohne die Funktion des Clusters zu unterbrechen.

Es gibt zwei ISSU Methoden:

  • Compatible upgrade: Beide Software Versionen können coexistieren. Die Funktion des Clusters bleibt beim Upgrade Prozess erhalten.
  • Incompatible upgrade: Alte und neue Software-Versionen sind nicht kompatibel. Das Verfahren erfordert einen Kaltstart und die Funktion des gesamten IRF-Clusters ist unterbrochen.

Ich werde hier das Szenario eines kompatiblen Upgrades schildern.

„HP in Service Software Upgrade (ISSU) eines FlexFabric IRF Clusters“ weiterlesen

Windows 10 – Suche ohne Cortana

Um das mal kurz vorauszuschicken: Ich möchte hier kein Windows-10-Bashing lostreten. Auch als eingefleischter Windows-7 Fan liebe ich mein Tablet mit Windows 10.  Viele der Funktionen wirken durchdacht und sind komfortabel. Nach dem Desaster von Windows 8 und 8.1 (habe ich beide übersprungen) wirkt Windows 10 ausgereift – besonders nach dem Anniversary-Update. Hier ist aber noch ein kleiner Haken versteckt. Seit diesem Anniversary Update kann man die Assistentin Cortana nicht mehr in den Systemeinstellungen deaktivieren. Sie ist fest in die Suche integriert.

Persönliche Assistenten wie Siri, Cortana, Hey-Google, oder sonstige mögen sinnvolle Begleiter für einige Anwender sein.  Ich möchte sie aber bei Bedarf hinzuziehen und wieder abschalten, wenn ich sie nicht brauche. Auf Aspekte des Datenschutzes möchte ich an dieser Stelle erst gar nicht eingehen. „Windows 10 – Suche ohne Cortana“ weiterlesen

SNMP Agent auf ESXi aktivieren

In einem der letzten Beiträge habe ich über die freie Monitoring Lösung Netdisco berichtet. Neben den Informationen der Hardware-Switches wäre es doch praktisch, auch Informationen zu den virtuellen Switches der ESX Server zu erhalten. Hierfür muss der SNMP Agent auf dem ESX Server aktiviert, und eine Community definiert werden. Die Konfiguration erfolgt entweder über vSphereCLI, oder SSH.

vSphereCLI

Dies ist die etwas bequemere Methode, da man nicht erst SSH am Host freischalten muss.  Dazu muss die passende vSphereCLI lokal auf einem PC der Wahl installiert sein.

Der Pfad ist normalerweisse:

C:\Program Files\VMware\VMware vSphere CLI\

Community definieren

cd bin
vicfg-snmp.pl --server <myESX> --username root --password <myPass> -c <CommunityName>

Damit ist der Communitystring definiert, den beispielsweise Netdisco oder ein anderes Tool zur Abfrage verwendet.

Agent starten

Als nächstes muss der SNMP-Agent aktiviert werden.

vicfg-snmp.pl --server <myESX> --username root --password <myPass> --enable

Der Server ist nun bereit zur Abfrage. Ggf sollte überprüft werden, ob die ESX Firewall Verbindungen über den SNMP Port zuläßt.

Configuration über SSH

Die Konfiguration über SSH ist etwas umständlicher, da man jeweils SSH auf dem Host aktivieren muß, hat aber dafür etwas mehr Möglichkeiten.

Community definieren

esxcli system snmp set --communities <CommunityName>

Agent aktivieren

esxcli system snmp set --enable true

Firewall konfigurieren

Dieser Schritt ist optional, falls der Port nicht geöffnet sein sollte. Der erste Schritt erlaubt SNMP Zugriff von allen Hosts.

esxcli network firewall ruleset set --ruleset-id snmp --allowed-all true

Der nächste Schritt aktiviert die Regel.

esxcli network firewall ruleset set --ruleset-id snmp --enabled true

Danach wird der snmp Daemon neu gestartet, um die Einstellungen zu aktivieren.

/etc/init.d/snmpd restart

Syscontact und Syslocation setzen

Dieser Schritt ist wiederum optional, hilft aber im Monitoring Tool bei der Zuordnung.

esxcli system snmp set –syslocation=<myESXLocation> –syscontact=<myContact>

Hier kann myESXLocation und myContact ein String der eigenen Wahl sein.

esxcli system snmp set --syslocation=BackupSite --syscontact=IT-Service

Abfrage der Einstellungen

esxcli system snmp get

ESX-Host mit Netdisco erkennen

Auf der Seite von Netdisco (oder auch anderen Tools) muss eine Erkennung getriggert werden. Dazu öffnet man eine SSH Verbindung auf den Netdisco Server und logt sich als Admin-User ein (default: netdisco).

cd ~
~/bin/netdisco-do -D discover -d <ESX-IP>

Wenn alles richtig war, erscheinen nun die ESX Hosts unter Inventory von Netdisco.

 

 

 

Switch Monitoring mit Netdisco

Netzwerk-Infrastrukturen sind komplex und es bedarf strenger Disziplin, dabei den Überblick zu behalten.

  • Welche Geräte habe ich im LAN und wieviele davon?
  • Welches Device ist mit welchem Nachbarn verbunden?
  • Wie ist der Status der Firmware?
  • Wo gibt es Probleme?

Natürlich kann man jedes Gerät zyklisch prüfen, indem man sich auf der CLI oder WebGUI einloggt, aber das ist mühsam, zeitintensiv und fehleranfällig. Denn leicht vergisst man ein Gerät. Wie gut, dass mit dem Simple Network Management Protokoll (SNMP) eine Fernabfrage möglich ist. Die Möglichkeit der Abfrage allein genüngt natürlich nicht, man braucht auch Werkzeuge, die diese Daten vernünftig visualisieren.

Es gibt eine recht große Produktpalette auf diesem Gebiet. Darunter kommerzielle und freie Produkte. Einige davon sind sehr einfach, andere mächtig und komplex.

Ich möchte heute ein Produkt vorstellen, welches recht einfach und übersichtlich in der Handhabung ist, aber dennoch sehr funktional ist. Es heisst Netdisco und wird unter der BSD-Licencse verbreitet. Netdisco eignet sich für kleinere und große Infrastrukturen, wie z.B. universitäre Netze. Es arbeitert auf SNMP Basis, indem es ARP- und MAC-Tabellen von Layer2-Switches und Routern ausliest, diese in Verbindung setzt und lokal in einer Postgres Datenbank ablegt. Die Darstellung erfolgt über den integrierten Webserver.

„Switch Monitoring mit Netdisco“ weiterlesen

Backup & Restore VCSA 6.0 embedded Postgres Database

Wenn die Datenbank einer vCenter Server Appliance (VCSA) wiederhergestellt oder auf einen älteren Stand zurückgesetzt werden muss, sollte man ein Backup zur Hand haben. VMware bietet Hilfsmittel, um die integrierte Postgres DB zu sichern und wieder herzustellen.

Backup

Login in VCSA als root user.

Bash Shell freischalten

shell.set --enabled true
shell

Speicherort für Backups erstellen

mkdir ~/backups

Download der Skript Files von KB 2091961 (Seitenende) und mit WinSCP auf die vCenter Appliance übertragen. Ziel ist der zuvor erstellte Ordner „backups“.

cd ~/backups
ls -la
unzip <scriptfile>.zip

Skriptdateien ausführbar machen

chmod 700 backup_lin.py
chmod 700 restore_lin.py

Backupskript ausführen

python backup_lin.py -f backup_VCDB.bak

Das Backupfile „backup_VCDB.bak“ mittels WinSCP von der Appliance laden.

Restore

Login in VCSA als root user und ins Verzeichnis backups wechseln.

cd ~/backups

Mit WinSCP das Datenbank Backupfile in die Appliance (backups) transferieren. Überprüfen, ob das Restore Skript im ‚backups‘ Verzeichnis vorhanden ist und ob es ausführbar ist.

ls -la

Dienste beenden

Zunächst müssen der Inventory Service und der Content Library Service beendet werden.

service vmware-vpxd stop
service vmware-vcds stop

Restore Skript ausführen

python restore_lin.py -f backup_VCDB.bak

Es folgt ein längerer Restore Prozess.

Dienste starten

Die oben beendeten Dienste müssen nun wieder neu gestartet werden.

service vmware-vpxd start
service vmware-vcds start

Wer es noch etwas ausführlicher haben möchte, kann sich das Video auf YouTube ansehen.

Links

vmware KB 2091961 – Back up and restore vCenter Server Appliance/vCenter Server 6.0 vPostgres database.

 

VCSA root Passwort Reset

Es kommt leider immer wieder vor, dass wichtige Systeme in der Vergangenheit nicht, oder nur unzureichend dokumentiert wurden.  Geplante Wartungsarbeiten oder Updates drohen an einem fehlenden Login zur vCenter Server Appliance zu scheitern.

Bei einer vCenter Server Appliance 5.5 (VCSA) das root Passwort zurücksetzen ist nicht sehr kompliziert. Bei der VCSA 6.x ist jedoch der GRUB Bootloader mit einem Passwort geschützt, so dass der obige Trick nicht direkt durchführbar ist. Ich fand aber zwei unterschiedliche Ansätze, auch diesen Schutz zu umgehen. Der erste untfernt das GRUB Passwort und hat damit die Möglichkeit in eine Bash Shell zu booten. Die zweite Methode verändert die Password Shadows des root Users.

Beide Methoden setzen voraus, daß ich physischen Zugang zur Virtuellen Infrastruktur habe und in der Lage bin, von einer CD oder einem ISO zu booten.

„VCSA root Passwort Reset“ weiterlesen

DataCore widerruft Support für Emulex 16GB FibreChannel HBA

DataCore publiziert regelmäßig unter FAQ 1592 die Qualified Hardware Components. Darin werden Hardware Komponenten wie LAN Adapter, SAN-Switches, IP-Switches oder FibreChannel Host Bus Adapter (HBA) bekannter Hersteller gelistet und deren Kompatibilität mit den Unterschiedlichen DataCore Produkten. So zum Beispiel welcher Patchlevel seitens SANSymphony mindestens benötigt wird, oder welche Firmware das IO-Device haben soll.

Ich muss zugeben, ich bin keineswegs überrascht, dass in der aktuellen Oktober-Ausgabe der FAQ 1592 sämtliche 16 GBit FibreChannel HBA der Firma Emulex (Avago Technologies) als „not supported“ deklariert wurden. Dies betrifft Emulex Branded HBA, aber auch OEM Produkte von Fujitsu und HP.

Emulex LPe16000-M6, LPe16002-M6, LPe16004-M6, LPe16004-M6-EI, LPe16000B-M6, LPe16002B-M6 and LPe16202-x

Fujitsu LPe16000B-M6-F and LPe16002B-M6-F

HP All SN1100E models

All of the above HBAs are not supported. Customers that are already using the DataCore Emulex Fibre Channel driver with these HBAs in their DataCore Servers will continue to be supported.

„DataCore widerruft Support für Emulex 16GB FibreChannel HBA“ weiterlesen

Login in APC NMC nicht möglich

Gelegentlich ist der Login zum Web Frontend eineer APC Network-Management-Card (NMC) nicht möglich. Angeblich sei dort jemand eingeloggt, was aber in der Regel nicht der Fall ist.

Someone is currently logged into the APC Management Web Server. Please try again later

Später versuchen, wie der Dialog es vorschlägt, hilft dabei nicht. Die Meldung ist ein Indiz dafür, daß der Webdienst hängt.

Es gibt zwei einfache Tricks, diese Sperre aufzuheben.

Telnet

Man öffnet eine Telnet Sitzung zur NMC (z.B. Putty) und logt sich danach direkt wieder aus. Danach geligt der Login an der Web-Konsole wieder problemlos.

Logout.htm

Falls gerade kein Telnet-Client zur Hand ist, kann man auch diesen dirty-trick verwenden:

http://myAPC-IP/logout.htm

Anstatt myAPC-IP die IP Adresse der NMC einsetzen

Danach normal einloggen. 🙂

Links