10 Stolperfallen bei der Einführung eines Monitoring-Systems

0
13.01.2015ǀ ǀ Monitoring

10 Stolperfallen bei der Einführung eines Monitoring-SystemsBei der Einführung eines Monitoring-Systems kann viel schief laufen: aus dem Ruder laufenden Kosten, mehrfach revidierte Zeitpläne oder dem System ablehnend gegenüberstehende Anwender. Ich habe in den letzten Jahren fast alle Hürden gesehen, die zum Scheitern eines Einführungsprojekts führen können. Aus Fehlern kann man jedoch lernen! Aus diesem Grund beschreibe ich in diesem Beitrag die zehn beliebtesten Stolperfallen bei Monitoring-Projekten.

1. Falsch definiert: die Anforderungen

Am Anfang steht die Definition der Anforderungen an das Monitoring-Tool. Nur wer seine Erwartungen und Anforderungen festlegen kann, erhält ein funktionierendes Systemmanagement für seine IT-Infrastruktur. Dabei müssen die Anforderungen aus den Fachabteilungen kommen, denn es gibt niemanden im Unternehmen, der die Systeme besser kennt als die Abteilungen selbst. Vom Monitoring-Spezialisten wird oft erwartet, dass er die perfekten Metriken kennt, die überwacht werden sollen.

Natürlich kann er durch seine Wissen und seine Erfahrung den Kollegen helfen und wichtige Impulse geben, wie man an Daten kommt (Schnittstellen?) und welche Messwerte wichtig sind. IT ist aber heute ein so komplexes Aufgabenfeld, dass er unmöglich jedes System und jede Applikation bis in das letzte Detail kennen kann. Zudem hat die Komplexität der eingesetzten Systeme und IT-Prozesse im Laufe der Jahre zugenommen. Es reicht daher meistens nicht mehr aus, nur eine Systemüberwachung zu installieren. Häufig ist es eher so, dass das Monitoring mit einer Configuration Management Database (CMDB) verknüpft werden, einem Ticketsystem oder einer Reporting-Engine.

Bei der Zusammenstellung der Anforderungen sollte man daher darauf achten, nicht nur die technischen Details aufzunehmen, sondern auch planen, wie sich das System am besten in bestehende Prozesse integrieren lässt. Das bedeutet auch, dass es obligatorisch ist, Schnittstellen zu Drittsystemen zu betrachten.

2. Falsch eingeschätzt: die Erwartungshaltung

Auch die Erwartungshaltung ist ein essentieller Teil beim Entscheidungsprozess, stellt sie doch die Grundlage für die Akzeptanz einer Lösung dar. Die Erwartungen werden nicht immer laut geäußert. Trotzdem erwartet sich jeder Beteiligte etwas von der Lösung und dem, was sie können soll. Das ist meistens stark von den Systemen geprägt, mit denen man bereits seit Jahren arbeitet. Beachtet man diese Erwartungshaltung nicht ausreichend, hat man am Ende des Projekts mit Sicherheit unzufriedene Anwender mit Hang zum Boykott.

3. Falsch implementiert: die Insellösung

Die meisten Unternehmen verfügen über Jahre gewachsene Insellösungen für einzelne Themen. Sie mögen ihren Zweck erfüllen, erfüllen aber häufig nur die Ansprüche einzelner Anwender. Was das reine IT-Monitoring betrifft, so muss das nicht unbedingt ein Problem sein. Geht man jedoch darüber hinaus und betrachtet die Tatsache, dass sich ein bereitgestellter Service (Beispiel: der Emailversand) aus mehreren Teilen (Relay, Exchange, SPAM Filter, Firewall etc.) zusammensetzt, realisiert man schnell, dass hier die Daten konsolidiert werden müssen. Oft ist das schwierig, weil die Personen, die die Insellösung mit viel Herzblut aufgebaut haben, wenig interessiert an ihrer Abschaffung sind. Schafft man es, die Betroffenen frühzeitig an einen Tisch zu bringen, kann das helfen, Konfliktpotenzial frühzeitig zu erkennen und rechtzeitig dagegen zu steuern.

4. Falsch ausgewählt: das Tool

Monitoring-Lösungen gibt es viele. Wie aber das richtige finden? Dazu muss man konsequent alle Abteilungen und Bereiche einbinden, die mit der Lösung arbeiten sollen. So haben z.B. Management und Technik eine komplett andere Sicht auf das System. Eine reine Überwachungsanwendung wie Nagios Core kann für den Administrator, der nur einige Systeme und Dienste überwachen muss, ausreichend sein. Den Manager wird es aber niemals glücklich machen, weil er Kennzahlen wie über Ausfallzeiten und Service Level Agreements und einen Monatsreport benötigt. Deshalb sind die Punkte 1 und 2 so wichtig für die richtige Entscheidung: Je genauer die Anforderungen und Erwartungen an das System beschrieben werden, desto besser ist die Auswahl des Systems.

5. Falsch vorbereitet: die Projektplanung

Die Einführung eines Monitorings beginnt häufig mit der Installation des Systems und einer langen Phase des Herumprobierens. Ergebnis sind die sogenannten historisch gewachsenen Systeme, die ab einem gewissen Zeitpunkt nicht mehr weiter gepflegt werden. Man kommt deshalb um eine genaue Planung nicht herum: sie ist essentiell für eine erfolgreiche Systemeinführung. Aus der Erfahrung heraus lässt sich sagen, dass ungeplante Einführungen in den seltensten Fällen in einen produktiven Betrieb überführt werden. Eine saubere Planung bietet außerdem die Möglichkeit, den Fortschritt des Projektes im Überblick zu behalten und eine höhere Qualität des Systems zu erreichen.

6. Falsch eingerichtet: die Konfiguration

Die Erfahrung lehrt, dass oft Konfigurationen entstehen, die nach einigen Monaten nicht mehr überschaubar sind, wenn sie ohne Framework aufgebaut werden. Der Konfigurationsstil muss definiert werden, insbesondere bei Nagios-Lösungen. Denn es ist nicht einfach, neue Metriken einzurichten. Man sollte daher genau überlegen, ob man nicht ein Framework hinzuziehen will, das eine strukturierte Konfiguration ermöglicht. Wenn das nicht gewünscht ist, sollte es zumindest Vorgaben und Richtlinien geben, wie die Konfiguration zu erfolgen hat. Die Definition nimmt man idealerweise schon im Rahmen der Projektplanung vor.

7. Falsch informiert: die Benachrichtigungen

Einer der herausforderndsten Punkte bei der Einführung eines Monitorings ist die Planung von Benachrichtigungen. Zu viele Meldungen bedeuten, dass die Anwender schnell überflutet werden und sich deshalb rasch Filter einrichten. Dadurch verlieren aber die Benachrichtigungen an Bedeutung. Das ist fatal, weil eine Benachrichtigung per Email oder SMS eigentlich ein kritisches Ereignis darstellt, dasmit hoher Priorität behandelt werden sollte. Die Definition von Schwellwerten ist deshalb für die Güte der Benachrichtigungen ausschlaggebend. Wichtig ist, dass sie immer wieder überprüft und in Frage gestellt werden. Zwar gibt es von einigen Herstellern Empfehlungen, in welchen Bereichen sich Performancewerte bewegen sollten, doch sind sie in der Praxis meistens wenig relevant. Die Definition, Überwachung und Anpassung von Schwellwerten in einem sinnvollen Maß ist also ein Prozess, der kontinuierlich gemacht werden muss. Können die Schwellwerte nicht bestimmt werden, macht es Sinn, die aufgezeichneten Performancedaten zu ermitteln und zu analysieren, welche Werte sich im Normbereich befinden und welche Werte problematischen Zustand beschreiben.

8. Falsch ergänzt: die Erweiterung

Ziel des Monitorings ist die automatisierte Überwachung von Diensten, Systemen und Prozessen, sowie die Früherkennung von Fehlerquellen. Dass ein Monitoring direkt nach der Einführung vollständig alle Fehler erkennt, ist eine Wunschvorstellung, die sicher nicht eintreten wird. Man sollte sich vor Augen halten, dass das Monitoring genau die Routinetätigkeiten verrichtet, die in ihm festgelegt wurden. Genau wie der Administrator sich durch neue Probleme weiterentwickelt und erst eine Lösung finden muss, verhält es sich auch mit dem Monitoring. Seine Erweiterung stellt daher eine kontinuierliche Aufgabe dar, die Schritt für Schritt Routinetätigkeiten unternimmt und somit den Administrator jeden Tag besser unterstützt.

9. Falsche Basis: die Hardware

In der Zeit von Virtualisierung und Hochverfügbarkeit ist es naheliegend, auch das Monitoring zu virtualisieren. DieVorteile einer Virtualisierung sind, dass man einfach weitere Ressourcen bereitstellen kann, dass Thema Hochverfügbarkeit auf einfache Weise löst und gleichzeitig Kosten einspart.Die Nachteile sind, dass die Ressourcen nicht zwangsläufig dediziert dem Monitoring zur Verfügung stehen und das Monitoring Komponenten überwacht, die es für den eigenen Betrieb benötigt. Daher sollte die Lösung idealerweise auf einem dedizierten System betrieben werden.
Größter Flaschenhals bei Installationen ist meist die Betrachtung von IO, der Lese- und Schreiboperationen pro Sekunde. Durch die Sammlung, das Lesen und Schreiben von vielen Metriken ist es wichtig, sich darüber Gedanken zu machen, wie die Informationen verarbeitet werden können. Beim Sizing einer Hardware sollte vor allem bedacht werden, wie sich die Infrastruktur in den nächsten Jahren entwickeln wird und welche Anforderungen an die Hardware in den nächsten drei bis fünf Jahren zu erwarten sind.

10. Falsch kalkuliert: die Folgekosten

Die Kosten für die Einführung eines Monitoring-Systemssind meist überschaubar, da auch die großen Hersteller erstmal einen Fuß in die Tür bekommen wollen. Überraschungen bergen dann die Folgekosten, die meistens unterschätzt werden. Die Kosten der Lösung sollten deshalb nicht nur in Bezug auf die Einführung des Systems betrachtet werden, sondern vor allem auch auf die nächsten Jahre.

Fazit

Bei der Einführung eines Monitoring-Systems gibt es viele Dinge, die man falsch machen kann. Kennt man die Stolperfallen, ist es aber meistens nichtschwer, sie zu vermeiden. Ohne eine durchdachte Planung und genaue Festlegung der eigenen Anforderungen und Erwartungen an das System ist aber jedes Projekt zum Scheitern verurteilt.

 

Tags:

Steffen Rieger - Director Infrastructure & Operations
Steffen Rieger leitet den Bereich Infrastruktur bei it-novum. Das umfasst den strategischen Vertrieb von Open Source Datacenter-Lösungen, den Betrieb der Rechenzentren der Konzerngruppe sowie die Leitung diverser operativer Teams.

Kommentar schreiben

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.