Proxmox & Progress WhatsUp Gold im Home Lab: Hochverfügbarkeit, Backup-Strategien & Recovery im Test

Einleitung

Heute zeige ich euch, wie der Umbau des Home Labs mithilfe von Proxmox gelingt. Es handelt sich hierbei um ein spannendes Abenteuer mit Herausforderungen, spannenden Erkenntnissen und großartigen Erfolgen. Am Ende steht ein robustes, effizientes Setup, das eure ursprünglichen Erwartungen übertreffen wird dank moderner Virtualisierungs- und Speichertechnologien.

Der Aufbau des Home Labs

Für mein neues Setup fiel die Wahl auf Proxmox, vor allem wegen den leistungsstarken Features für Hochverfügbarkeit (High Availability), Failover und Backup. Ergänzt wurde das Ganze durch ZFS mit Replikation über lokale Arrays auf jedem Server, sowie NFS als zusätzliches Speicherelement. Ursprünglich wollte ich ein paar Failover-Szenarien manuell testen, jedoch kam mir hier schon die erste Herausforderung entgegen.

Der unerwartete Failover-Test

Ich arbeitete mit älterer, wiederverwendeter Hardware (HPe DL360 Gen9). Ein instabiler Port an meiner 10GBe-Netzwerkkarte sorgte für Probleme im Linux-Bonding und löste unbeabsichtigt einen echten Failover-Test aus. Allerdings reagierte Proxmox beeindruckend: Innerhalb von nur drei Sekunden wurden die betroffenen VMs automatisch auf den zweiten Host verschoben. Nach weniger als 40 Sekunden war mein WhatsUp Gold-System wieder online.

Was ich ganz besonders spannend fand: ZFS mit Replikation war schneller wieder verfügbar als das NFS-Storage; vermutlich wegen des Geschwindigkeitsvorteils von 10GBe gegenüber 2GBe. Es war faszinierend zu beobachten, wie sich das System praktisch selbst reparierte und einfach weiterlief, was die Stabilität und Systemstärke von Proxmox kennzeichnet.

Nutzung von GenAI für Einrichtung und Verwaltung

Beim Einrichten meines Clusters nutzte ich gezielt GenAI, um die Konfiguration optimal an meine Hardware anzupassen, Hochverfügbarkeit und Replikation zu realisieren. Zusätzlich entwickelte ich ein PowerShell-Skript, das über die Proxmox API detaillierte Informationen zu Hosts und VMs ausliest. Diese Daten flossen direkt in WhatsUp Gold zur Überwachung ein. Darüber hinaus begann ich, Geräte-Templates für Proxmox in WhatsUp Gold zu erstellen, um kritische Dienste per SNMP überwachen zu können.

Überprüfen der Hochverfügbarkeit

Einer der wichtigsten Meilensteine auf diesem Weg war die erfolgreiche Verifizierung der HA-Funktionalität von Proxmox. Die Ermittlung der Ursache von Kernel Panics, die Validierung von Protokollmeldungen und die Verfolgung präziser Zeitstempel waren von entscheidender Bedeutung. GenAI war entscheidend für die Fehlerbehebung und die Identifizierung spezifischer Protokollmeldungen, sodass ich die Wirksamkeit meines HA-Setups sicher nachweisen konnte. Dieser Erfolg unterstreicht die Robustheit und Zuverlässigkeit meiner neuen Architektur.

Ein wichtiger Meilenstein war der erfolgreiche Nachweis der Hochverfügbarkeit (HA) meines Setups. Dabei waren v.a. präzise Log-Analysen, genaue Zeitstempel und die systematische Fehlersuche bei Kernel-Panics hilfreich. Auch hier war GenAI eine große Unterstützung bei dem Auslesen von Logs und der Identifikation relevanter Meldungen. So konnte ich sicher nachweisen, dass meine HA-Konfiguration wie geplant funktioniert.

Der NFS-Speicherausfall: Ein Weckruf

An einem Freitagmorgen meldete mir Progress WhatsUp Gold 360, dass mein Connector nicht erreichbar war, genauso wie meine Website https://wug.ninja. Die Analyse ergab: Alle auf dem NFS gespeicherten VMs – inklusive meines WhatsUp Gold-Servers – waren nicht mehr erreichbar. Zum Glück konnte WhatsUp Gold 360 über seine Internetverbindungsüberwachung den Ausfall trotzdem per Warnmeldung melden, obwohl fast die gesamte Infrastruktur betroffen war.

Das NFS-System war komplett eingefroren/angehalten, sodass ich es nicht im Netzwerk anpingen oder mich über SSH, HTTPS oder auf andere Weise anmelden konnte. Das Speichersystem reagierte überhaupt nicht. Dieser Vorfall war eine wichtige Erinnerung daran, wie wichtig ein solider robuste Backup- und Recovery-Plan sind.

Wiederherstellung nach Backups: Belastungsprobe für das System

Mir blieb keine andere Wahl: Ich musste das NFS-System zwangsweise neu starten – wissend, dass dies Zeit kosten würde. Um Ausfallzeiten zu minimieren, griff ich auf Backups auf einer per USB angebundenen Festplatte zurück. Auch hier war GenAI wieder eine große Hilfe, die mich Schritt für Schritt durch den Wiederherstellungsprozess leitete.

Bei Linux-VMs erstellte ich über die Kommandozeile neue VMs, übertrug Dateien per WinSCP und konvertierte sie mit qemu-img. Alles lief reibungslos. Schwieriger war es bei Windows-VMs: diese VMs booteten nicht. Auch mit Recovery-ISOs kam ich nicht weiter.

Diese Herausforderung führte mich zu guestmountein Tool, mit dem sich virtuelle Festplatten mounten und durchsuchen lassen. So konnte ich meine Windows-Partitionen einhängen, mit WinSCP verbinden und die Datenbankdateien (MDF, LDF) sichern. Diese legte ich auf den ZFS-Testserver, der die ganze Zeit über stabil lief. Zwar etwas unkonventionell – aber erfolgreich. Für reguläre Wiederherstellungen empfiehlt sich natürlich der Einsatz von SQL-Server-Backupdateien (.bak).

Erkenntnisse und Zukunftspläne

Diese Erfahrung hat mir eindrücklich gezeigt, wie entscheidend Redundanz, Failover-Mechanismen und ein durchdachtes Backup-Konzept sind. Die auf ZFS gespeicherten VMs blieben über den gesamten Vorfall hinweg stabil, was einen klaren Vorteil aufweist. Inzwischen habe ich mein Setup vollständig überarbeitet: Alle produktiven VMs laufen jetzt auf ZFS mit Replikation. Das ehemals kritische NFS-System nutze ich nun ausschließlich für geplante Backups. Die wiederhergestellten VMs habe ich gelöscht. Stattdessen nutze ich die migrierten Instanzen weiter, um Datenverluste zu minimieren (mein USB-Backup war nur wöchentlich).

Innerhalb von Proxmox habe ich mehrere Backup-Jobs konfiguriert, um mein Sicherungskonzept weiter zu optimieren. Ein Job schreibt Backups auf den internen ZFS-Speicher mit gespiegeltem Festplattenset, ein weiterer sichert auf das NFS-System mit drei täglichen und einem wöchentlichen Backup. Zusätzlich habe ich ein WinSCP-Skript erstellt, das die NFS-Backups auf meinen Windows-PC überträgt und automatisch mit OneDrive synchronisiert. So entstand eine mehrschichtige Backup-Strategie, die meine Daten auf drei unabhängigen Speichersystemen plus Cloud absichert – ein wirkungsvoller Schutz vor Hardwaredefekten und unvorhersehbaren Ausfällen.

Fazit

Diese Reise war geprägt von Herausforderungen, Erkenntnissen und echten Erfolgen. Der Wechsel zu Proxmox hat mein Home Lab in eine systemstarke, leistungsfähige Umgebung verwandelt, die mit realen Ausfallszenarien umgehen kann. Nun werde ich mein Set Up weiter verfeinern können.

Ich freue mich diese Tipps mit euch zu teilen. Bleibt dran, denn es folgen noch weitere Home Lab-Erlebnisse. Viel Erfolg bei euren eigenen Home Lab-Abenteuern!

Tags

Lernen Sie WhatsUp Gold kennen

Kostenfreie Testversion Preise Demo

Wenn Sie die WhatsUp Gold Free Edition suchen (eine 10-Geräte-Version von WhatsUp Gold mit einer verlängerbaren 12 monatigen Lizenz), klicken Sie hier.

 

Blog-Abonnement

Erhalten Sie einmal im Monat eine E-Mail mit unseren neuesten Blog-Beiträgen.

Loading animation

Kommentare

Comments are disabled in preview mode.