Reconfiguration de mon laboratoire WhatsUp Gold avec Proxmox : une aventure de bascule, sauvegarde et restauration

Introduction

Salut à tous les technophiles ! Voici mon retour d’expérience sur la réarchitecture de mon home lab avec Proxmox. Ce fut un véritable parcours semé d'embûches, mais j’ai réussi à concevoir une infrastructure résiliente et performante grâce aux technologies modernes de virtualisation et de stockage.

Mise en place du lab

J’ai opté pour Proxmox pour sa haute disponibilité, ses capacités de bascule automatique (failover) et de sauvegarde. J’ai configuré ZFS avec réplication sur chaque serveur et ajouté un stockage NFS comme couche complémentaire. Je prévoyais des tests manuels de bascule, mais un incident imprévu m’en a offert un bien réel et instructif.

Test de bascule imprévu

Sur du matériel réutilisé (HPe DL360 Gen9), un port défectueux de la carte 10 GbE a provoqué une instabilité du bond Linux, entraînant un basculement automatique des VM en moins de 3 secondes sur l'autre hôte. Les services WhatsUp Gold sont revenus en ligne en moins de 40 secondes.

Fait notable : le stockage ZFS est revenu plus vite que le NFS (10 GbE vs 2 GbE), démontrant la robustesse intrinsèque de l’architecture.

Appui sur GenAI pour l’installation

GenAI m’a guidé pour configurer le cluster Proxmox et j’ai développé un script PowerShell utilisant l’API Proxmox pour intégrer les serveurs et VM dans WhatsUp Gold. J’ai aussi commencé à créer des templates SNMP spécifiques.

Validation de la haute disponibilité

Grâce à GenAI, j’ai pu diagnostiquer un kernel panic, analyser les journaux et valider avec précision les timestamps pour prouver que le fonctionnement HA tenait bien la route.

Le crash du stockage NFS

Un vendredi matin, WhatsUp Gold 360 m’a alerté de la perte de connexion réseau. Le site https://wug.ninja était inaccessible. Les VM sur NFS étaient indisponibles : le serveur NFS était complètement gelé. Une rude piqûre de rappel sur l’importance d’une stratégie de sauvegarde solide.

Restauration depuis les backups

Après un redémarrage forcé du NFS, j’ai restauré les sauvegardes stockées sur disque USB. GenAI m’a guidé étape par étape :

  • Pour les VM Linux : création de VM, fichiers transférés via WinSCP, conversion avec qemu-img.
  • Pour les VM Windows : blocage au démarrage, j’ai utilisé guestmount pour extraire les fichiers de base de données (.MDF/.LDF) et les restaurer manuellement.

Leçons & évolutions

Cette expérience m’a rappelé l’importance du multi-replication ZFS et des sauvegardes de type 3-2-1 (trois copies, deux supports, une hors-site). J’ai migré toutes les VM critiques sur ZFS, dédié le NFS aux sauvegardes, créé des jobs Proxmox de backup ZFS et NFS (1 hebdo + 3 journaliers), et automatisé la réplication vers OneDrive avec WinSCP.

Conclusion

Ce projet a converti mon home lab en une plateforme résiliente, capable de supporter des scénarios réels. J’ai hâte de continuer à l’optimiser.

Merci de m’avoir suivi dans cette aventure ! À très vite pour les prochaines explorations techniques !

Abonnez-vous à notre liste de diffusion

Recevez les plus récents billets de notre blog dans un e-mail mensuel.

Loading animation

Comments

Comments are disabled in preview mode.