Azure のアップ/ダウン監視が重要な理由

米国の午前2時です。ヨーロッパとアジアの従業員や顧客は、Microsoft Azure クラウドで実行されているアプリケーションにアクセスできますか?自社で使用している Azure のサーバーとアプリケーションのステータスが、1年365日、1日24時間のベースで常時把握できない場合は、サードパーティーの監視ツールの導入を検討した方がいいでしょう。

2019年7月に ZDNet によって報告されたように、Azure は過去12ヵ月間に「3つのユニークで重大なインシデント」の影響を受けました。2018年9月の米国中南部のデータセンターの機能停止、2018年11月の連続した Active Directory 多要素認証問題、および2019年5月の DNS メンテナンス問題の3件です。この記事が指摘しているように、これは完全なリストではありません。詳細情報を得るには、Microsoft が提供している Azure の状態の履歴ページをチェックしてください。

こういったインシデントは、Azure に限ったことではありません。すべてのクラウドホスティングサービスプロバイダは、似たような停止レートを示しています。上記の ZDNet の記事は、Microsoft が Azure の現在の稼働率を、99.995%だと言明しているとも述べています。

社内を歩き回って確認することは不可能

ある程度の機能停止時間は避けられないとしても、IT 環境で Azure のようなクラウドサービスを利用することには多くのメリットがあり、理に適っています。設備投資に多額の費用をかけなくてすみ、IT 環境の費用を運用費として計上できます。アクティビティが急増した場合に、オンデマンドでコンピューティングリソースを拡張することもできます。アプリケーションの更新はユーザーと顧客に一度にロールアウトすることができ、常に最新のハードウェアとソフトウェア技術を使って作業することができます。

とは言うものの、IT インフラストラクチャがどこか遠く離れた Microsoft のデータセンターで機能しているという状況を、少し不安に感じる人もいるでしょう。社内を歩き回ってデータセンターのサーバーとアプリケーションが稼働しているかを確認するわけにはいきません。クラウドに移行すると、ある程度、運を天に任せるしかない部分が出てきます。「まあ大丈夫だとは思いますが、、、。」としか言えません。

サードパーティーからの保証を得る

クラウドリソースは、オンプレミスのデータセンターと同じように、顧客からのアクセスが急増したときやIT部員が自宅でくつろいでいる週末など、最悪のタイミングでダウンする可能性を残しています。クラウドサービスが停止してしまうと、顧客や社内ユーザーに約束した SLA 基準を満たせなくなるかもしれません。

そのため、Microsoft Azure などのクラウドサービスを使ってアプリケーションを実行している場合は、サードパーティーのクラウド監視ツールでアップ/ダウンをチェックすることが非常に重要です。クラウド監視ツールを使うと、すべてのサーバーとアプリケーションが主要な対象ユーザー(顧客、従業員、およびパートナー)からアクセス可能かどうかを(クラウドプロバイダが検出できるタイミングで)知ることができます。

Azure データセンターで通常通り仕事が行われていれば、サーバーの稼働状況はクラウドサービスを利用している IT 部門にも共有されます。Microsoft は、問題になりそうな事態があれば、クラウドサービスのユーザーに、エンドユーザーに悪影響が及ぶ前に通知する必要があります。もちろん、問題を解決できるよう速やかに対策が取られるべきです。

ですが、 IT インフラストラクチャがダウンしてしまったら、ビジネスが停止してしまうか深刻な打撃を受けてしまうので、もしもの場合に備えて、独立したサードパーティーの監視メカニズムを利用することは大いに意義があります。システムがダウンしたら直ちに通知を受けられるので安心できます。ダウンが発生したら、IT部門では Microsoft がその状況をきちんと把握していることを確認し、状況がすぐさま好転しない場合は経営幹部にも通知し対策を講じることができます。

事前準備が重要

Azure 環境がダウンするような状況に陥った場合、重要なのはそのような可能性があることを踏まえて事前に準備を整えておくことです。オンプレミスのデータセンターで定期的にデータをバックアップするのと同じように、クラウドに保存しているものをバックアップしておく必要があります。別のクラウドプロバイダのデータベースにバックアップするのが最善かもしれません。

ビジネスでダウンタイムが発生することが許されない場合は、カリフォルニア州サンフランシスコのセカンダリ Azure データセンターにデータをバックアップし、自動フェイルオーバー機能をセットアップすることを検討してください。また、Microsoft と協力して、同じデータセンター内で高可用性アーキテクチャを利用するようにすれば、アプリケーションが1秒以上停止しないことが保証されます。これらのサービスには追加料金がかかりますが、ダウンタイムが許されない場合は投資する価値があるでしょう。

バックアップしてあったオリジナルのIT環境を復旧する際に社内のIT部門が果たすべき役割は、利用している Azure サービスのレベルに大きく依存します。Azure 側と社内IT部門の責任を確認して、サーバーがダウンした場合に両者が何を行うべきかを正確に把握しておくことが重要です。また、代理として介入できるサードパーティーのマネージドサービス・プロバイダと提携することも考えられます。

Azure 環境を可視化

クラウド内のサーバーとアプリケーションのパフォーマンスを監視するのに、WhatsUp® Gold のクラウド監視が注目されています。このソリューションは、統合ダッシュボードから Azure 環境の可視化情報を提供し、どのサーバーとアプリケーションが稼働しているか、どのサーバーとアプリケーションが停止しているかがすぐにわかります。Azure から提供されるデータで最適なカスタムビューを作成し、しきい値ベースの警告通知を受けるよう設定することもできます。

クラウドリソースとオンプレミスリソースとを統合して使っていて何か問題があった場合、WhatsUp Gold で統合ダッシュボードからドリルダウンして、問題の原因がどこにあるかを速やかに解明することもできます。Azure インフラストラクチャの状態をすぐにチェックできるので、ユーザーに影響が及ぶ前に問題を特定できます。収集した情報は、Azure データセンター管理チームやマネージドサービス・プロバイダとも共有して問題解決を促進できます。

WhatsUp Gold は、リアルタイムで Azure 環境のアップ/ダウンの監視ができるだけでなく、Azure サーバーの使用状況と使用料金を表示することもできます。使用していないリソースに対して支払うことになっていないかをチェックできます。

ただやはり、何といっても、WhatsUp Gold を使用すると、Azure 環境が稼働しているか停止しているかを、1年365日、1日24時間、しっかり監視できる点が一番のメリットでしょう。また、IT部門は、ダウンしたサービスをできる限り迅速に復元するのに役立つ貴重な情報を入手できます。

WhatsUp Gold をお試しください