Da der größte Teil der IT-Infrastruktur das Netzwerk ist, ist es logisch, dass die Mehrheit aller IT-Infrastrukturprobleme ebendieses betrifft. Die enorme Größe und Komplexität des Netzwerks machen die Ursachenanalyse und Fehlerbehebung allerdings so knifflig wie die Suche nach der sprichwörtlichen Nadel im Heuhaufen.
Warum ist die Ursachenanalyse so schwierig?
Was die Ursachenanalyse erschwert, ist die Tatsache, dass die Datenverarbeitung mehr verteilt denn je ist.
Wichtige Anwendungen laufen sowohl lokal als auch als SaaS (Software as a Service) in der Cloud. Einige sind sogar hybrid, d.h. die Verarbeitung wird zwischen den beiden Systemen aufgeteilt. Das bedeutet, dass Netzwerk-IT-Profis sowohl die Cloud-, als auch die lokale Infrastruktur überwachen müssen, um Fehler bei hybriden Anwendungen zu beheben.
Um der Ursache auf den Grund zu gehen, müssen IT-Profis vielfältige Probleme aufspüren. Am schlimmsten sind die Probleme, bei denen das Netzwerk oder eine Anwendung komplett ausfällt. Nicht ganz so schlimm, aber oft schwieriger zu finden, ist die langsame Leistung.
Lästige intermittierende Probleme aufspüren
Sie wissen, wie frustriert Ihr Kfz-Mechaniker ist, wenn Sie Ihr Auto wegen eines Problems vorbeibringen, das immer wieder auftaucht und verschwindet, sobald der Mechaniker einen Blick darauf wirft. Das gleiche Problem macht IT-Profis zu schaffen. "Das größte Kopfzerbrechen bereitet der IT-Abteilung der Umgang mit intermittierenden Leistungsproblemen. Das sind Probleme, die sich bemerkbar machen und wieder verschwinden, bevor Sie die Quelle identifizieren können, nur um dann immer wieder zufällig aufzutreten. In den meisten Fällen sehen diese intermittierenden Leistungsprobleme so aus, als hätten sie ihre Wurzeln in einem bestimmten Bereich Ihres Netzwerks, während sie in Wirklichkeit von einem ganz anderen Bereich ausgehen", erklärt das Progress eBook "IT Pro's Guide to Faster Troubleshooting".
Netzwerk-Monitoring ermöglicht es der IT-Abteilung, proaktiv statt reaktiv zu handeln. "Das Tool bietet im Idealfall ein Frühwarnsystem, wenn ein Problem auftritt, das zu unzufriedenen Benutzern und Ausfallzeiten führen könnte", heißt es in dem eBook.
Netzwerkpläne führen die IT zur Ursache
Eine gute Netzwerk-Monitoring-Lösung sollte Layer-2- und Layer-3-Netzwerkinformationen ermitteln und diese Daten zur automatischen Erstellung von Netzwerk-Topologiekarten verwenden. Genau diese Pläne helfen der IT-Abteilung, die Ursache des Problems zu finden, die Reaktion zu beschleunigen und die mittlere Zeit bis zur Problemlösung (MTTR, Mean Time to Resolution) zu verkürzen.
Ursachenanalyse für Anwendungen: Anwendungszustände und -abhängigkeiten
Ihre Netzwerk-Monitoring-Lösung sollte es der IT-Abteilung ermöglichen, diese Abhängigkeiten zu definieren und dann zu überwachen, um den Zustand einer Anwendung zu verfolgen – dies sollte auch Teil des Warnsystems sein. Wenn eine Anwendung von einem Netzwerkelement abhängig ist und dieses Element ausfällt, sollte die Warnmeldung die IT-Abteilung zuerst auf das ausgefallene Element hinweisen, nicht auf die Anwendung.
Die Verfolgung des Anwendungsstatus ist der Schlüssel, um Probleme abzuwehren oder ihre eigentliche Ursache zu finden. "Ein IT-Monitoring-System kann mehrere Anwendungszustände unterstützen – den Betriebszustand, den Ausfallzustand, den Warnzustand und den Wartungszustand. So kann die IT-Abteilung einen Anwendungsstatus definieren, indem sie den überwachten Leistungsmetriken Schwellenwerte zuweist", heißt es im Progress eBook "IT Pro's Guide to Faster Troubleshooting".
Tracking-Geräte, die die Anwendung unterstützen, sind entscheidend für Problemvermeidung. "Wenn beispielsweise die CPU-Auslastung eines Prozesses auf einem Server 75% überschreitet, sollte die Anwendung in den Warnzustand versetzt werden. Wenn die CPU-Auslastung 90% übersteigt, sollte die IT-Abteilung benachrichtigt werden, dass die Anwendung ausgefallen ist. Auf diese Weise erhalten IT-Manager eine frühzeitige Warnung und genügend Zeit, um auf Leistungsprobleme zu reagieren, bevor sie sich auf die Nutzer und das Unternehmen auswirken", heißt es im eBook.
Wireless Ursachenanalyse
"Wenn es um Wireless-Netzwerke geht, ist die Anzeige von Wireless LAN Controllern (WLC), Zugangspunkten und Clients entscheidend. Diese Karten sollten bei jedem Abfragezyklus aktualisiert werden, um neue Clients anzuzeigen, wenn sie sich in das Wireless-Netzwerk einloggen", heißt es im Progress eBook. "Wenn sich ein Endnutzer eines Wireless-Netzwerks über die Leistung beschwert, können Sie mit einer Karte des Wireless-Netzwerks die Verbindung zwischen dem Client, dem Zugangspunkt und dem WLC verfolgen. Sie können auch alle anderen Clients sehen, die mit demselben Zugangspunkt verbunden sind, was möglicherweise auf ein Überlastungsproblem hinweist. Die erste Frage, die Sie sich stellen sollten, wenn ein Netzwerkproblem auftritt, lautet: 'Habe ich ein Problem mit der Kapazität des Zugangspunkts?'"
Die Wireless-Netzwerk-Infrastruktur muss in Echtzeit betrachtet werden. Um jedoch einen Eindruck vom allgemeinen Zustand und Trends zu erhalten, sollten historische Daten gesammelt werden, um Muster bei Elementen wie Client-Anzahl und der Bandbreitennutzung zu erkennen. "So können Sie Diagramme mit dem Zeitpunkt korrelieren, zu dem ein Leistungsproblem gemeldet wurde. Durch die Analyse von Mustern bei der Anzahl der mit einem Zugangspunkt verbundenen Clients und der entsprechenden Bandbreitennutzung können Sie feststellen, ob der Zugangspunkt das Wireless-Volumen bei Spitzenauslastung bewältigen kann", so das eBook. "Historische Diagramme, die die WLC-, CPU- und Speicherauslastung abdecken, sollten auch in mehreren Zeitmessungen betrachtet werden, um Muster aufzudecken, die mit dem Zeitpunkt der gemeldeten Leistungsprobleme korreliert werden können. Eine hohe Auslastung einer dieser Ressourcen deutet darauf hin, dass ein WLC nicht mit der Spitzenauslastung des Wireless-Netzwerks mithalten kann. Wenn Sie mit der wireless Kapazität zufrieden sind, die Ihren Nutzern zur Verfügung steht, diese es aber nicht sind, sollten Sie sich fragen, ob Sie ein Problem mit der Signalstärke haben."
Einheitliches Monitoring zeigt den Gesamtzustand Ihrer IT-Infrastruktur
- Geräteerkennung
- Abbildung der Infrastruktur
- Monitoring von Netzwerken, Anwendungen und Servern
- Proaktive Warnmeldungen
- Meldemechanismen
Einheitliches Netzwerk-Monitoring beginnt mit der Erkennung aller Geräte, Anwendungen und Dienste im Netzwerk und verfolgt dann die Konnektivität und Abhängigkeiten zwischen ihnen.
Isolierte Lösungen sind begrenzt
Die Ursachenanalyse wird durch isolierte Monitoring-Tools, bei denen jeder Gerätetyp seine eigene Monitoring-Lösung hat, nicht gut unterstützt. Wie viele Konsolen kann ein IT-Profi anstarren, bevor er durchdreht?
Es ist weitaus effizienter, eine einzige überschauliche Netzwerk-Monitoring-Lösung zu haben, als dass die IT-Abteilung manuell Warnmeldungen und Daten aus einer Vielzahl einzelner, isolierter Monitoring-Tools durchforstet.
Ihre Einführung in das IT-Infrastruktur-Monitoring
Möchten Sie mit den Grundlagen des IT-Infrastruktur-Monitorings (ITIM) beginnen? Unser alphabetisch geordnetes Glossar ist ein hervorragender Ort, um Ihr Wissen zu erweitern. Sehen Sie sich unsere aktuellen Themen an.