ネットワーク監視:アラート

目に見えないものを管理することはできないので、IT 管理者は可視化されたネットワークを監視して、ネットワークに何が起こっているかを常に把握している必要があります。ですが、多忙な IT 管理者はほかにも様々な業務を遂行する必要があり、一日中ダッシュボードをじっと見つめているわけにはいきません。ちょうど救急電話で救急車が出動するように、問題が起きたときにアラートを受けて対処することになります。

ネットワーク監視におけるアラート

ネットワークに何か問題の兆候となるような状況が見られたとき、顕在化してユーザーに影響が出るより前に対処できるようにするアラート機能は、ネットワーク監視ソフトウェアソリューションが提供するべき重要な機能の1つです。ネットワーク監視は、究極的には、様々なメトリクス情報を獲得して測定値が正常と考えられる範囲に収まっているかどうかをチェックするものであり、正常と考えられる範囲(しきい値)を逸脱したときに警告(アラート)が通知されます。また、アクティブモニタでは、デバイスの状態が変化したときに警告通知を行います。

通知は、アラートのアクションの1つですが、メールやテキストメッセージなど、様々な方法で行われます。重要度によって通知方法を変えることも可能です。Teams や Slack などのコラボレーションツールが利用されている部門では、それらのツールを使って通知が行われるでしょう。リアルタイムのネットワーク警告通知は、ネットワークおよび関連するアプリケーションとサービスが最適に動作し、高レベルの可用性を維持するのに役立ちます。SLA (サービス・レベル・アグリーメント) が締結されている場合は、それを満たすためにも、適切な警告通知機能が必要です。

優れたネットワーク監視ソリューションは、様々なしきい値を使って警告通知するように設定できます。例えば、WhatsUp Gold ネットワーク監視システムには次のようなしきい値ライブラリがあります。

  • パフォーマンス - システムパフォーマンスとリソース関連のイベント、I/O イベント、ping。
  • パッシブ - SNMP トラップ、Syslog イベントの検出と頻度、Windows イベントの検出と頻度。
  • ネットワークトラフィック分析 - 接続イベントと指標、インタフェーストラフィック、会話イベントと指標、カスタムしきい値。
  • システム - システムの正常性とフェイルオーバーの追跡、仮想マシン (VM) の追跡、システム構成の監査。
  • ワイヤレス - アクセスポイントの CPU とメモリの指標、不正 SSID、不正クライアント。

実行可能アクション

通知アクションに対して、実行可能アクションもあります。例えば、サーバーがダウンしていて、再起動する必要がある場合、復旧のためにサーバーを自動的に再起動するアクションをトリガーすることができます。IT 部門で警告通知を受け取る一方で、ネットワーク監視システムはすでに問題に対処しているという状況にもっていくことが可能です。

実行可能アクションは、デバイスに状態変化が起きたときに、そのデバイスに対してタスクを実行するように設定します。どういう状態変化があったかによって、すぐに問題解決のために実行できるタスクをトリガーしたり、またはインシデントのチケット生成や外部アプリケーションの実行などのアクションを設定できます。大きな効率化につながるので、実行可能アクションを設定して可能な限り自動化することが推奨されされます。

関連ブログ:ネットワーク監視テクノロジー – ちょっと覚えておくと良いこと

アラート設定の留意点

ネットワーク監視のアラート機能を効果的に利用するには、アラート設定を適切に行うことが重要になります。

ベースラインとしきい値

アラートは、何か問題の兆候があったときに警告通知をするものであり、その前提として正常な状態ではどういった測定値が得られるのかを把握しておく必要があります。ネットワークのアクティビティを継続的にチェックしてベースとなる正常なレベルの範囲を定義し、それからの逸脱があったら警告通知するのが原則です。正常な範囲をあまりに限定してわずかな逸脱で何度も警告通知が出されるようにすると、警告疲労を発生させ、逆効果になります。その一方、エンドユーザーに悪影響が出るぎりぎりまで警告を出さなければ、問題解決のための時間的余裕がなくなってしまいます。

アラートの受信者

ネットワークを1人で管理している場合を除き、重大なアラートはただちに CIO に通知するなど、重大度を含めて、どういうアラートが誰に通知されるべきかをしっかり検討して決定します。同じアラートを多数の人に一度に通知するのではなく、事前定義された階層に基づいて、重要度の高くないものは下位レベルの技術者が処理するようにし、必要に応じて適切な人々にエスカレーションされるように設定します。

警告の嵐を回避

1か所で発生した問題が、その問題を起こしたデバイスに依存している多数のデバイスにも波及することによって生ずる「警告の嵐」は、IT 部門を疲弊させるので、避けなければなりません。例えば、1台のゲートウェイがダウンし、それに依存して動作不能になった多数のデバイスから次々にアラートが発せられたら、IT 部門は大混乱に陥ります。それを回避するには、デバイス間の依存関係を明確化し、依存しているデバイスからはアラートは出さず、問題を起こしたデバイスからのアラートだけを通知するようにする必要があります。そのような適切なアラート設定によって、正確で迅速な対応が可能になります。

関連ブログ:ネットワーク監視における警告機能

WhatsUp Gold のアラート機能

警告の嵐や警告疲労を回避できる、洗練された WhatsUp Gold のアラート機能

プログレスの WhatsUp Gold には、洗練されたアラート機能があり、効率的に実用的なアラート設定ができます。

Network Alerts

WhatsUp Gold ネットワーク監視ソリューションのアラート機能には、次のような特長があります。

  • アラートのエスカレーション: ネットワークコンポーネントの重要性に基づいてアラートをエスカレートするポリシーを設定できます。例えば、トラブルチケットを自動的に生成して、問題を適切な管理者に即座に通知することができます。
  • アラートの確認: 重要なアラートは誰も気付かず放置されたままになるという事態に陥らないようにする必要があります。WhatsUp Gold には、応答者の確認がなかった場合は再通知を行うなどといった設定ができる通知ポリシーを適用できます。
  • 依存関係を認識したスマートなアラート: WhatsUp Gold は、ネットワーク内のレイヤ2とレイヤ3のデバイスに依存関係ルールを手動または自動で適用して、警告の嵐を防ぐことができます。
  • しきい値ベースのアラート: WhatsUp Gold では、しきい値に基づいてアクションがトリガーされます。様々な測定値に適切なしきい値を設定し、最適なアクションを指定することで、効果の高い効率的なきめ細かいアラート処理を行うことができます。