ネットワーク KPI とは?
ネットワーク KPI (key performance indicator、重要業績評価指標) とは、最適なネットワークパフォーマンス目標を達成するための測定基準およびベンチマークです。これらの目標を支援するために、実際のパフォーマンスを KPI 目標と比較して測定することで、ネットワークチームはネットワークのパフォーマンスやサービスレベルを改善・維持し、KPI の目的を満たすための意思決定を行うことができます。こうした意思決定には、次の内容が含まれます:
- より優れたネットワークインフラへの投資
- パフォーマンス目標を達成するためのネットワーク再構成
- パフォーマンスを最適化するための帯域幅制御や負荷分散の活用
- エンドユーザーのネットワーク利用ポリシーの変更
KPI とメトリクスとはどう違うのか?
KPI とメトリクスという用語を同じ意味で使う人も多く、場合によっては同じこともあります。
KPI は「特別な種類のメトリクス」と考えることができます。測定値という意味では、KPI はメトリクスの一種です。実際、すべての KPI はメトリクスに含まれます。ただし、メトリクスという言葉はより広い概念を指します。メトリクスは定量的な測定値であり、それほど重要ではない項目の測定もメトリクスに含まれます。
優秀なネットワーク担当者は、最も重要なメトリクスを特定し、それらを KPI として扱い、目標や目的を設定し、実際のパフォーマンスをその基準に照らして測定します。KPI を一般的なメトリクスと区別するのは “Key(重要)” という言葉です。通常のメトリクスが KPI に格上げされるのは、そのメトリクスが重要な目的や目標に結び付けられたときです。
一般的なネットワークメトリクスおよび主要業績評価指標 (KPI)
企業ごとに「何を測定し、どのような目標を設定するか」は異なります。そのため、各組織は独自の KPI セットを持つことになります。他のメトリクスも収集されますが、これらは特定の目標に結び付けられておらず、KPI のように重視されるわけではありません。
多くの企業にとって、サービスレベルアグリーメント (SLA) は単なる目標ではなく「遵守すべき要件」です。SLA 自体が KPI になることもあれば、複数の KPI を基に構成されることもあります。サービス品質 (QoS)、アプリケーションパフォーマンス、エンドユーザーエクスペリエンス (アプリケーションエクスペリエンスと呼ばれることもあります) も、よく KPI として扱われることが多い指標です。
以下は、一般的に使用されるネットワークメトリクスおよび KPI の代表的な16項目です。
- アプリケーション層遅延(Application Layer Latency): アプリケーション層のリクエスト/レスポンスのペアを監視・測定して、アプリケーションの遅延を追跡するメトリクスです。
- 帯域幅使用率(Bandwidth Usage): おそらく最も理解しやすいメトリクスの一つです。ネットワーク帯域幅は、特定のネットワーク接続を介してデータを送信するための通信リンクの最大容量を示す測定値であり、ある時間内に転送されたデータの量 (ビット/秒) で測定されます。帯域幅を監視することで、使用量の急増が見込まれるときは計画的に対応し、帯域幅を大量使用するアプリケーションやユーザーを特定して業務に重要なアプリケーションが必要な帯域幅を確保できるように調整できます。
- 接続時間(Connection Time): 2つのデバイス間で接続を確立するのに必要な時間です。サーバー応答の問題、接続トラブル、その他のネットワーク問題の兆候となることがあります。
- 接続性(Connectivity): ネットワーク上のデバイスやノード間の接続を確認することは重要です。不具合のあるデバイスや不適切な接続があると、サービス停止やパフォーマンス低下を引き起こします。接続性の問題は、特定のノードを狙うマルウェアによって発生し、ネットワークの一部領域のパフォーマンスに影響を与えることもよくあります。
- CPU 使用率(CPU Utilization): サーバーなどのデバイス内にある特定コンポーネントの CPU 使用率を示します
- エラー率(Error Rates): 名前の通り、データ転送中に発生するエラーの量を示すメトリクスです。信号干渉や衝突によって発生することがあり、高いエラー率はハードウェアの故障やその他のネットワーク問題を示す可能性があります。
- ネットワーク可用性(Network Availability): ネットワークが一定期間にわたってどれだけ稼働しているかを測定し、主要サービスをどの程度支えているかを示します。ネットワークの可用性は、一定期間にわたるネットワークの稼働時間を測定し、ネットワークが主要なサービスをどれだけうまくサポートしているかを示します。
- ネットワークジッタ(Network Jitter): 遅延が不規則で一貫性がなくなるとジッタが発生します。動画がガタガクしたり、音声が途切れたりするとエンドユーザーから苦情が出ますが、ジッタはネットワーク全体のパフォーマンスに影響を及ぼします。
- ネットワーク遅延(Network Latency): データがある地点から別の地点に移動するのにかかる時間を追跡する、ネットワークパフォーマンスの基本的なメトリクス/KPI です。
- パケット損失(Packet Loss): 目的地に到達しなかったパケットの割合です。パケット損失は遅延を引き起こし、ネットワークパフォーマンスを低下させます。
- QoS メトリクス(Quality of Service Metrics): VoIP などの特定サービスの品質を定義するため、優先度レベルや帯域幅など複数の個別測定値を含むメトリクスです。
- 応答時間(Response Time): ネットワークリクエストが対象デバイスに到達し、応答を返すまでの速さを測定します。
- 往復時間(Round-trip Time): リモートデバイスに ping を送信し、応答が戻ってくるまでの時間 (ミリ秒) です。
- サーバー応答時間(Server Response Time): サーバーがリクエストを受信し、処理し、応答を返すまでにかかる時間です。
- スループット(Throughput): ネットワーク上でデータが送信される速度です。より具体的には、実際に目的地に到達したデータパケット数で表されます。スループットが低い場合、パケット損失が原因である可能性があり、ネットワーク管理者は対処する必要があります。
- 稼働時間(Uptime): 最も基本的なメトリクスのひとつで、どのネットワークリソースが稼働し、どれが停止しているかを追跡します(死活監視)。
最後に
ネットワークパフォーマンスを最適化するには、単にデータを収集するだけでは不十分です。重要なのは、どのメトリクスを KPI として重視するかを見極め、実際のパフォーマンスと照らし合わせて改善策を講じることです。今回紹介した 16 のメトリクスや KPI は、ネットワークの状態を可視化し、問題の早期発見やビジネスに不可欠なサービスの安定運用に役立ちます。ネットワーク管理をより効果的に行うために、自社の目標に合った KPI を設定し、定期的に見直すことをお勧めします。
ITインフラ監視 (ITIM) の ABC
このブログは、ITインフラ監視のABC リストの中の "K" に該当するブログです。ITインフラ監視 (ITIM) の ABCページには全アルファベットに対応する項目が含まれていますので、是非ともご参照いただければと思います。