Überwachung ohne Maßnahmenmanagement ist Überwachung um der Überwachung willen. Tausende von Alarmen pro Tag, von denen die Hälfte ignoriert wird, ein Viertel zu einer manuellen Ticket-Erstellung führt und der Rest im Rauschen untergeht – das ist die Realität vieler IT-Abteilungen, die Monitoring ohne durchdachte Integration mit ITSM-Prozessen implementiert haben. Checkmk löst dieses Problem durch native Integrationen mit gängigen Ticketing- und ITSM-Systemen und schließt so den Kreislauf zwischen Problemerkennung und -lösung.
Inhaltsverzeichnis
- Warum ist die Überwachung ohne ITSM unvollständig?
- Wie lässt sich Checkmk in Fahrkartensysteme integrieren?
- Integration mit ServiceNow
- Integration mit Jira Service Management
- Integration mit anderen ITSM-Systemen
- Alarmmanagement und Lärmreduzierung
- Wichtigste Schlussfolgerungen
- FAQ
- Zusammenfassung
Warum ist die Überwachung ohne ITSM unvollständig?
Die Überwachung deckt Probleme auf – aber das ITSM verwaltet die Lösung. Ohne Integration zwischen diesen Systemen kommt es zum „Tal des Todes“: Ein Alarm wird im Überwachungssystem generiert, jemand sieht ihn (oder auch nicht), erstellt manuell ein Ticket, weist es der richtigen Person zu, vervollständigt die Beschreibung…. und erst dann beginnt die eigentliche Arbeit an dem Problem. Die Zeit von der Erkennung bis zur ersten Abhilfemaßnahme (MTTA – Mean Time To Acknowledge) ist viel länger als sie sein sollte.
Die andere Seite des Problems ist die fehlende Schließung des Kreises: Das Ticket ist gelöst, aber das Überwachungssystem weiß nicht, wann und von wem. Es fehlt an Daten für die MTTR-Analyse (Mean Time To Resolve), an Informationen über die Wiederholung von Vorfällen und an Kontext für die Nachuntersuchung.
Checkmk mit ITSM-Integration schließt diesen Kreislauf – von der automatischen Erstellung eines Tickets, wenn ein Problem erkannt wird, über die Aktualisierung seines Status bis hin zur automatischen Schließung, wenn die Überwachung eine Lösung bestätigt.
Wie lässt sich Checkmk in Fahrkartensysteme integrieren?
Checkmk bietet zwei Mechanismen für die Integration mit externen Systemen. Benachrichtigungsregeln ist ein integrierter Mechanismus, der über die Weboberfläche konfiguriert werden kann – Sie definieren, welche Warnungen, für welche Hosts/Services und unter welchen Umständen externe Aktionen ausgelöst werden sollen. Event Console ist ein Mechanismus zur Ereigniskorrelation, der Tickets auf der Grundlage von Ereignismustern und nicht auf der Grundlage einzelner Warnungen generieren kann.
Die technischen Integrationsmechanismen sind: Benachrichtigungsskripte (Python/Shell), die REST-API von Checkmk, Webhooks und Ereignisregeln. Checkmk bietet Standard-Benachrichtigungsskripte für die gängigsten ITSM-Systeme – ServiceNow, Jira, PagerDuty, OpsGenie und andere -, für die lediglich Verbindungsparameter konfiguriert werden müssen.
Integration mit ServiceNow
Die Integration von Checkmk mit ServiceNow ist eine der umfangreichsten unter den unterstützten ITSM-Systemen. Das in Checkmk Exchange verfügbare vorgefertigte Plugin unterstützt: automatische Erstellung von Vorfällen in ServiceNow, wenn ein CRIT- oder WARN-Alarm erkannt wird, automatische Aktualisierung des Vorfalls, wenn sich der überwachte Zustand ändert (z. B. von CRIT zu WARN), automatische Schließung des Vorfalls, wenn Checkmk eine Rückkehr zu einem OK-Zustand registriert.
Die Zuordnung von Attributen ist konfigurierbar – Sie können die Checkmk-Schweregrade den ServiceNow-Vorfallkategorien zuordnen, Supportgruppen auf der Grundlage von Host-Tags oder Service-Labels in Checkmk zuweisen. Durch die Zwei-Wege-Synchronisation können auch Notizen zu einem ServiceNow-Vorfall direkt von Checkmk aus hinzugefügt werden.
Integration mit Jira Service Management
Für Organisationen, die Jira Service Management (früher Jira Service Desk) verwenden, bietet Checkmk eine Integration über die REST-API von Jira. Checkmk-Warnungen erstellen Fragen im ausgewählten Jira-Projekt mit automatisch ausgefüllten Feldern: Zusammenfassung (Hostname + Service + Status), Beschreibung (vollständiger Kontext der Warnung aus Checkmk), Priorität (zugeordnet aus Schweregrad-Checkmk), Etiketten (Tags aus Checkmk).
Die Konfiguration ermöglicht die Weiterleitung von Tickets an verschiedene Jira-Projekte, je nach Quelle des Alarms – z.B. gehen Infrastruktur-Alerts an das Ops-Projekt, Anwendungs-Alerts an das Dev-Projekt. Die Integration mit Überwachungssoftware schafft ein einheitliches Ökosystem für das Incident Management.
Integration mit anderen ITSM-Systemen
Zusätzlich zu ServiceNow und Jira unterstützt Checkmk die Integration mit: PagerDuty (Alarmeskalation und Bereitschaftsmanagement), OpsGenie (alternative Alarmierungsplattform), Slack und Microsoft Teams (Chat-Benachrichtigungen mit einem Link zum Vorfall), E-Mail (mit umfangreicher HTML-Formatierung einschließlich Alarmkontext), VictorOps/Splunk On-Call, Zendesk und anderen über benutzerdefinierte Skripte.
Benutzerdefinierte Benachrichtigungsskripte ermöglichen die Integration mit jedem System, das HTTP-APIs unterstützt – das bedeutet unbegrenzte Flexibilität für Unternehmen mit benutzerdefinierten ITSM-Systemen.
Alarmmanagement und Lärmreduzierung
Die Integration mit ITSM ist nur so gut wie die Qualität der eingehenden Warnmeldungen. Checkmk bietet Mechanismen zur Rauschunterdrückung, die verhindern, dass Ticketing-Systeme mit falschen Alarmen und schwankenden Alarmen überflutet werden.
Flap Detection erkennt Dienste, die zwischen verschiedenen Zuständen ‚blinken‘ und hält Benachrichtigungen zurück, bis sie sich stabilisiert haben. Mit Delay und Renotification können Sie die Mindestdauer eines Problems festlegen, bevor ein Ticket erstellt wird. Die Unterdrückung von Alarmen während Servicefenstern verhindert, dass während geplanter Unterbrechungen Vorfälle erzeugt werden. Die Korrelation in der Ereigniskonsole ermöglicht es, mehrere Alarme, die sich auf ein einziges Ereignis beziehen (z.B. ein Switch-Ausfall, der Alarme für Hunderte von Hosts verursacht), in einem einzigen Ticket zusammenzufassen.
Wichtigste Schlussfolgerungen
- Eine Überwachung ohne Integration mit ITSM führt zu einem „Tal des Todes“ zwischen Erkennung und Reaktion auf das Problem.
- Checkmk bietet native Integrationen mit ServiceNow, Jira, PagerDuty und anderen durch vorgefertigte Plug-ins und Benachrichtigungsskripte.
- Die Zwei-Wege-Synchronisation schließt den Kreis: Das Ticket wird automatisch erstellt, aktualisiert und geschlossen, basierend auf den Überwachungsstatus.
- Mechanismen zur Rauschunterdrückung (Klappenerkennung, Verzögerung, Korrelation) verhindern, dass ITSM-Systeme mit falschen Tickets überflutet werden.
- Das flexible Skriptmodell für Benachrichtigungen ermöglicht die Integration mit jedem System über eine HTTP-API.
FAQ
Kann Checkmk das Ticket automatisch schließen, wenn das Problem behoben ist? Ja – mit bidirektionaler Integration (ServiceNow, Jira) kann Checkmk ein Ticket automatisch schließen oder aktualisieren, wenn der überwachte Dienst wieder OK ist.
Wie geht Checkmk mit doppelten Tickets mit wiederkehrenden Warnungen um? Sie können eine Logik konfigurieren, die prüft, ob für einen bestimmten Host/Dienst bereits ein offenes Ticket existiert, bevor Sie ein neues Ticket erstellen. Es gibt fertige Skripte, die diese Logik implementieren.
Können Sie für verschiedene Umgebungen unterschiedliche Ticketing-Regeln haben? Ja – Mit den Benachrichtigungsregeln in Checkmk können Sie sehr genau konfigurieren, welche Alarme für welche Hosts und zu welchen Zeiten Tickets in welchem System generiert werden sollen.
Wie implementiert man die Checkmk-ServiceNow-Integration ohne externe Berater? Checkmk bietet eine ausführliche Dokumentation und ein vorgefertigtes Plugin. Für komplexere Konfigurationen (benutzerdefinierte Mappings, bidirektionale Synchronisierung) bietet Ramsdata Unterstützung bei der Implementierung.
Zusammenfassung
Die Integration von Checkmk in ITSM-Systeme ist ein Schritt, der die Überwachung von einem Beobachtungstool zu einem Teil des Incident Management-Prozesses macht. Durch das automatische Erstellen, Aktualisieren und Schließen von Tickets entfällt die manuelle Arbeit für Administratoren und die MTTA wird auf ein Minimum reduziert. Kontaktieren Sie Ramsdata, um herauszufinden, wie Checkmk in die ITSM-Systeme Ihres Unternehmens integriert werden kann.