Jump to content

WhatsUp Gold Failover Manager

Pour une disponibilité maximale de votre plateforme WhatsUp Gold

En tant qu'utilisateur WhatsUp Gold, vous placez une immense confiance dans la fiabilité et la stabilité du produit. N’oublions pas en effet qu’il ausculte pour votre compte la santé des infrastructures et des applications surveillées. Si un composant ne fonctionne plus comme il le devrait ou si une défaillance est imminente, WhatsUp Gold Solutions vous en avertit immédiatement. Vous pouvez commencer à résoudre le problème avant même que les utilisateurs potentiellement affectés ou votre direction ne vous contacte à ce sujet. WhatsUp Gold peut se prévaloir de former une solide base en matière de gestion des technologies de l’information, y compris en termes de gestion et de surveillance des flux, des applications, des serveurs et des réseaux.

Cependant, il existe des situations dans lesquelles WhatsUp Gold peut perdre en visibilité concernant l'infrastructure surveillée, pour des raisons indépendantes de sa configuration. Par exemple, votre politique de maintenance peut exiger un temps d'arrêt pour procéder à la mise à niveau des composants matériels comme logiciels, et à l’application de correctifs. Votre serveur WhatsUp Gold peut perdre la connectivité à l'infrastructure surveillée en raison d’une défaillance réseau du côté de votre fournisseur de télécommunications. Éventuellement, votre serveur WhatsUp Gold peut lui-même connaître des problèmes de performances, par exemple, un état de corruption de la mémoire ou des disques, ou encore une lenteur du système Windows dans son ensemble.

Dans l’un quelconque de ces scénarios, vous courez le risque de perdre la visibilité de votre infrastructure, même si ce n’est que sur de courtes périodes. Dans nombre d’environnements surveillés, cette éventualité n’est pas acceptable car ces « trous noirs » sont sources de risques importants en termes de fonctionnement et de conformité.

Négociez des temps d'arrêt planifiés ou non planifiés de votre serveur WhatsUp Gold sans perte de visibilité en termes de surveillance

Le module WhatsUp Gold Failover Manager a été conçu de façon à renforcer vos tâches de gestion et de surveillance de réseau et préserver une disponibilité élevée. l permet de superviser en continu la santé de l'infrastructure surveillée lorsque les performances ou la connectivité du serveur principal WhatsUp Gold sont en jeu. Dans de telles situations à risques, un serveur de basculement secondaire peut être automatiquement établi afin de prendre en charge les tâches de surveillance. WhatsUp Gold Failover Manager est pleinement intégré à Alert Center afin de traiter efficacement les notifications et les escalades d'alertes.

Avec WhatsUp Gold Failover Manager, vous pouvez :

  • définir des serveurs WhatsUp Gold principal et secondaire en vue de procéder à un basculement (manuel ou automatique) ;
  • sélectionner des conditions et des occurrences d'événements particuliers susceptibles de déclencher un basculement vers le serveur secondaire (« Failover ») et une reprise automatique du serveur principal (« Failback ») ;
  • assurer une protection des données de surveillance via la prise en charge de l'exploitation d'une base de données à distance ;
  • gérer à distance le processus de basculement vers le serveur secondaire depuis n'importe quel point du réseau ;
  • consigner les actions de « Failover » au niveau d'Alert Center afin de gérer les opérations de manière centralisée ;
  • éliminer quasiment le risque de « trous noirs » ou de perte des données de surveillance.

Les principales fonctionnalités de WhatsUp Gold Failover Manager incluent :

La configuration d'un serveur principal et d'un serveur secondaire

WhatsUp Gold Failover Manager permet la configuration d'un serveur primaire et d'un serveur secondaire exécutant tous deux rigoureusement la même version de WhatsUp Gold. Une fois le module Failover Manager installé, WhatsUp Gold continue de collecter des données et d'exécuter des services de surveillances cruciaux au cours des temps d'arrêt, qu'ils soient planifiés ou non. Les temps d'arrêt planifiés supposent généralement que le serveur principal est mis hors service pour des raisons de maintenance. Les temps d'arrêt non planifiés incluent les situations dans lesquelles le serveur principal enregistre un problème de performances ou perd la connectivité avec la base de données de surveillance. Un serveur secondaire peut être configuré pour palier ces situations et prendre automatiquement en charge le relai concernant le maintien des performances et la réalisation des tâches de surveillance active du serveur principal.

De puissantes options de configuration en cas de « Failover »

WhatsUp Gold Failover Manager prend en charge diverses façons de vérifier si le serveur principal se trouve dans une situation qui nécessite le déclenchement du basculement.

Tout d'abord, le serveur principal surveille l'ensemble des services de ses composants pour vérifier toute dégradation éventuelle des performances. Il peut être automatiquement configuré pour le basculer vers le serveur secondaire en cas de survenance d'événements spécifiques comme, par exemple, la défaillance de certains services (collecte, découverte, Alert Center). Depuis la version v14.2 de WhatsUpGold, une couche supplémentaire de résilience a été ajoutée, apportant la possibilité de redémarrer automatiquement un service défaillant, le cas échéant. Souvent, cette opération permet de résoudre le problème sans nécessiter de basculement.

Ensuite, le serveur secondaire prend le pouls du serveur principal de deux façons. Il vérifie à intervalles réguliers que le serveur principal est joignable, et surveille également les mises à jour de la base de données pour s'assurer que de nouvelles données y sont ajoutées selon une périodicité définie. Si ces deux conditions ne sont pas satisfaites, il prend automatiquement en charge les tâches de surveillance du serveur principal.

Enfin, il est possible de définir manuellement le serveur secondaire comme devenant le serveur principal, notamment au cours des temps d'arrêt planifiés.

Un processus intelligent de basculement et de reprise bidirectionnel

WhatsUp Gold Failover Manager est capable de mettre en place un processus intelligent de basculement et de reprise bidirectionnel. Une fois le basculement initié, le serveur secondaire se charge des tâches du serveur principal. Lorsque le serveur principal recouvre un fonctionnement normal, il peut être automatiquement rétabli dans son rôle premier par le système secondaire, lequel se met alors en veille. Si le serveur principal n'est pas automatiquement configuré pour prendre le relai du secondaire, il continue d'occuper le rôle de serveur secondaire jusqu'à ce qu'un événement « Failover » lui retransfère sa responsabilité première. Il s'agit bien là d'une démonstration de la capacité du système à mener un processus de basculement bidirectionnel. Un administrateur réseau peut également mettre manuellement en mode veille le serveur secondaire (lorsque ce dernier a pris le rôle du serveur principal) afin de rendre la main au serveur principal.

Une consolidation des alertes de basculement au niveau d'Alert Center

Chaque action de basculement « Failover » génère un message d'événement qui est reporté via le module WhatsUp Gold Alert Center. Les changements manuels apportés à l'état des serveurs principal et secondaire (passage du mode « Actif » au mode « Veille ») génèrent des événements « informationnels ». Les changements automatiques résultant de la détection d'une défaillance par les serveurs principal et secondaire, et du déclenchement de l'action de basculement « Failover » qui s'ensuit, génèrent des événements de type « Erreur ». Les administrateurs WhatsUp Gold disposent ainsi d'une visibilité complète de l'infrastructure TI et du système de gestion à partir d'une seule et même console. Les événements de type « Erreur » et « Informationnel » sont consultables dans le rapport « Failure Workspace » généré à intervalles prédéfinis.

Processus de basculement intelligent entre les serveurs WhatsUp Gold principal et secondaire

WhatsUp Gold Failover Manager propose un mécanisme de basculement intelligent entre des serveurs principal et secondaire sur lesquels est installé WhatsUp Gold. Les principales fonctionnalités sont les suivantes :

WhatsUp Gold Failover Manager - Fonctions fondamentales

  • Prise en charge de toutes les versions WhatsUp Gold (Standard, Premium, Distributed et MSP)
  • Prise en charge de l’installation sur tous les systèmes d’exploitation Windows actuels
  • Possibilité de déclencher automatiquement comme manuellement un basculement entre un serveur principal et un serveur secondaire
  • Nécessité de disposer rigoureusement de la même version de WhatsUp Gold sur l’un et l’autre serveurs
  • Prise en charge de l'ensemble des moniteurs actifs et des moniteurs de performances en prévision d'un basculement automatique
  • Prise en charge automatique de configurations à moniteurs passifs hébergées sur le même système hôte en prévision d'un basculement (ex. : WinEvents)
  • Prise en charge automatique de configurations à moniteurs passifs dans lesquelles il est possible de définir une double destination des messages (par exemple, les sources de flux peuvent être paramétrées de manière à acheminer les données de trafic à la fois vers le serveur principal et le serveur secondaire)
  • Prise en charge de plusieurs modes d'exploitation de la base de données à distance afin de veiller à la résilience des données de surveillance en cas de basculement

WhatsUp Gold Failover Manager - Configuration

  •  Il est possible de définir plusieurs conditions de déclenchement du basculement automatique en fonction de défaillances de services spécifiques (défaillances des services de collecte, découverte, Alert Center, Flow Monitor, WhatsConfigured, WhatsConnected ou WhatsVirtual)
  • Il existe trois façons de configurer le déclenchement du basculement :
    • Le serveur principal exécute le basculement lorsqu'il détecte la défaillance de services et qu'il dépasse le seuil de déclenchement.
    • Le serveur secondaire exécute le basculement lorsqu'il ne parvient pas à contacter le serveur principal pendant une durée spécifiée et qu'il détecte que les mises à jour de la base de données ont également été interrompues.
    • Déclenchement manuel du basculement par un administrateur.
  • La reprise automatique (« Failback ») entre le serveur secondaire (agissant en tant que serveur principal) et le serveur principal peut se produire de trois façons :
    • Le serveur principal peut être paramétré de telle sorte qu'il redevienne automatiquement « actif » dès qu'il est rétabli.
    • Le serveur secondaire peut continuer à jouer le rôle de serveur principal jusqu'à ce qu'un événement de basculement retransfère au serveur principal sa responsabilité première.
    • Reprise manuelle du serveur principal forcée par un administrateur.
  • Les paramètres configurables de déclenchement du basculement sont notamment la durée de la défaillance (période de temps pendant laquelle le serveur secondaire ne parvient pas à contacter le principal) et l'intervalle de requête d'état (temps écoulé entre deux vérifications périodiques de la base de données pour contrôler que le serveur principal effectue bien des mises à jour régulières des données).

WhatsUp Gold Failover Manager - Alertes et reporting

  • Les principes de seuil et d'escalade relatifs aux événements de basculement peuvent être configurés dans WhatsUp Gold Alert Center.
  • Le rapport « Failover Workspace » dans Alert Center affiche à la fois les messages informationnels (cas d'un basculement manuel) et les messages d'erreur (cas d'un basculement automatique).

Pour veiller à une visibilité continue de votre infrastructure et de vos applications

  • L'assurance d'une disponibilité élevée et d'une surveillance fiable de l'infrastructure et des applications.
    • La fonction de basculement automatique permet d'avoir en permanence un serveur secondaire prêt à prendre le relai en cas de dysfonctionnement du serveur WhatsUp Gold principal.
  • Le risque de « trous noirs » est réduit même en cas d'absence totale de visibilité en raison d'une défaillance du système de surveillance.
    • L'exploitation commerciale est protégée à chaque instant grâce à la préservation de la visibilité de l'infrastructure, même lorsque le système principal de surveillance est hors service.
    • Préservation de l'intégrité du reporting dans le cadre du contrat de niveau de service (SLA) via une visibilité continue de l'infrastructure et des services surveillés.
  • Risque atténué de perdre les données de surveillance.
    • Les données de surveillance collectées en continu peuvent s'avérer utiles à des fins d'analyse historique ou dans les cas où la réglementation exige de telles données. 
  • Fonctionnement efficace et extrêmement productif.
    • Automatisation et fonctions intelligentes de basculement et de reprise sans intervention manuelle.
  • L'ensemble des services WhatsUp Gold est couvert de manière flexible par ce dispositif.
    • Il est possible de protéger l'intégralité du système WhatsUp Gold ou de cibler des composants en particulier comme les services de collecte de données, d'alerte, de découverte ou des services additionnels distincts.

Comment fonctionne le basculement automatique ?

Le basculement automatique repose sur un mécanisme « d'auscultation » qui relie les serveurs principal et secondaire. Tant que le « pouls » entre le serveur principal et le serveur secondaire est régulier, ce dernier serveur n'a aucune raison de déclencher le basculement.

En fait, il prend le relai du serveur principal dès qu'il détecte et valide chez celui-ci une altération du « pouls ». Par ailleurs, un système principal intelligent peut demander au serveur secondaire de reprendre son rôle, s'il décèle des problèmes dans son propre fonctionnement.

Quelles versions de WhatsUp Gold le module Failover Manager prend-il en charge ?

WhatsUp Gold Failover Manager prend en charge toutes les versions de WhatsUp Gold (Standard, Premium, Distributed et MSP) s'exécutant sur l'ensemble des systèmes d'exploitation Windows existants. 

WhatsUp Gold Failover peut-il être déployé sur une machine virtuelle ?

WhatsUp Gold et WhatsUp Gold Failover Manager peuvent fonctionner sur des machines virtuelles reposant sur VMware ou Microsoft Virtual Server, tant que les ressources du serveur virtuel satisfont aux caractéristiques système requises par WhatsUp Gold.

Quels types de moniteurs sont pris en charge par WhatsUp Gold Failover Manager ?

WhatsUp Gold Failover Manager prend en charge tous les moniteurs actifs et moniteurs de performances.

Les moniteurs passifs tels que les déroutements Syslog et SNMP ne sont généralement pas pris en charge, car ils impliquent de définir une adresse IP de destination au niveau du périphérique surveillé. Lorsque le système bascule du serveur principal vers le secondaire, l'adresse IP du serveur WhatsUp Gold change et les messages qu'envoient les périphériques n'arrivent alors plus à destination.

Concernant Flow Monitor, les sources de flux (y compris les installations Flow Publisher) peuvent être configurées de manière à disposer de l'adresse IP du serveur principal comme du serveur secondaire afin de pouvoir acheminer les statistiques de flux vers l'une et l'autre destinations. Le serveur secondaire ignore tout simplement les enregistrements de flux tant qu'il ne devient pas serveur principal.

Les moniteurs passifs basés sur Windows Event sont pris en charge par le module Failover dans la mesure où ils sont configurés sur le même système hôte sur lequel s'exécutent WhatsUp Gold et Failover.

Comment WhatsUp Gold Failover Manager contribue-t-il à lutter contre la perte des données de surveillance ?

L'architecture de déploiement de WhatsUp Gold Failover Manager peut nécessiter deux ou trois machines virtuelles ou matérielles dans deux configurations distinctes. Cela permet d'éviter la perte des données de surveillance en cas de dysfonctionnement du serveur principal.

Dans le premier type d'architecture de déploiement, la base de données de surveillance peut être hébergée directement sur le serveur secondaire. La perte de connectivité avec le serveur principal n'a donc aucune incidence sur la collecte de données ni sur les mises à jour de la base de données.

Autre architecture de déploiement possible : il convient de faire tourner le serveur principal et le serveur secondaire sur deux machines virtuelles ou matérielles différentes. La base de données est alors hébergée sur une troisième machine, accessible à distance par les serveurs principal et secondaire. Pour plus d'informations sur les architectures de basculement, reportez-vous à la section Technologie WhatsUp Gold.

Videos