Eine der größten Herausforderungen bei der IT-Überwachung besteht darin, die Überwachungskonfiguration auf dem neuesten Stand zu halten. Neue Dienste, neue Anwendungen, geänderte Serverkonfigurationen – eine einmal konfigurierte Überwachung wird schnell alt und spiegelt nicht mehr den wahren Zustand der Infrastruktur wider. Checkmk löst dieses Problem durch einen automatischen Mechanismus zur Erkennung von Diensten (Service Discovery), der die überwachten Hosts kontinuierlich durchsucht und feststellt, was wie überwacht werden sollte – ohne jeden Dienst manuell zu konfigurieren.
Inhaltsverzeichnis
- Was ist Service Discovery bei Checkmk?
- Wie funktioniert der Service-Erkennungsmechanismus?
- Automatische Erkennung vs. Regeln Checkmk
- Service Discovery und Änderungen an der Infrastruktur
- Periodic Service Discovery – kontinuierliche Aktualisierung der Konfiguration
- Checkmk Agent – die Grundlage der Service-Erkennung
- Diensterkennung bei agentenloser Überwachung (SNMP, API)
- Wichtigste Schlussfolgerungen
- FAQ
- Zusammenfassung
Was ist Service Discovery bei Checkmk?
Service Discovery ist der Mechanismus von Checkmk, der automatisch feststellt, welche Dienste (Services) auf einem bestimmten Host überwacht werden sollten und welche Parameter überprüft werden sollten. Ein „Dienst“ in Checkmk ist jeder Aspekt des Systems, der überwacht werden kann – eine Festplatte, eine Netzwerkschnittstelle, ein Prozess, ein Daemon, ein Windows-Dienst, eine Kubernetes-Ressource und Hunderte von anderen.
Ohne automatische Erkennung müsste ein Administrator jeden Dienst auf jedem Host manuell konfigurieren und festlegen, was geprüft werden soll, welche Warnschwellenwerte gelten sollen und wie die Ergebnisse zu interpretieren sind. In einer Umgebung mit Hunderten oder Tausenden von Hosts ist dies nicht tragbar. Checkmk Service Discovery macht diese Arbeit überflüssig – es scannt die Hosts und schlägt vor oder fügt automatisch Dienste zur Überwachung hinzu. Checkmk im Angebot von Ramsdata ist ein Überwachungstool, das Ramsdata mit vollständigem technischem und Schulungs-Support bereitstellt.
Wie funktioniert der Service-Erkennungsmechanismus?
Der Service Discovery-Mechanismus von Checkmk funktioniert über so genannte Check-Plugins – Module, die für eine bestimmte Art von Service zuständig sind. Jedes Check-Plugin ‚weiß‘, wie es den Host nach Daten aus seinem Bereich abfragt und wie die Ergebnisse zu interpretieren sind.
Wenn Checkmk einen Host scannt, führt es alle relevanten Prüf-Plugins aus und liefert jeweils eine Liste der gefundenen Instanzen. Das Plugin zur Festplattenüberwachung gibt eine Liste aller auf dem Host gefundenen Festplatten zurück. Das Plugin zur Prozessüberwachung gibt eine Liste der laufenden Prozesse zurück, die bestimmten Mustern entsprechen. Das Plugin zur Überwachung von Netzwerkschnittstellen gibt eine Liste aller Schnittstellen zurück. Das Ergebnis eines Service Discovery-Scans ist eine Liste der vorgeschlagenen Dienste – der Administrator kann Ausnahmen akzeptieren, ablehnen oder konfigurieren.
Automatische Erkennung vs. Regeln Checkmk
Mit den Regeln in Checkmk können Sie die Erkennungs- und Überwachungsparameter auf hierarchische und skalierbare Weise konfigurieren. Anstatt jede Festplatte auf jedem Server einzeln zu konfigurieren, definiert der Administrator eine Regel: „Auf allen Produktionsservern überwachen Sie die Festplatten mit WARN-Alarm bei 80% Vollstand und CRIT bei 90%“. Die Regel wird automatisch auf alle Server in der Gruppe angewendet.
Service Discovery hält sich bei der Erkennung von Diensten an Regeln – wenn eine Regel besagt, dass temporäre Festplatten nicht überwacht werden sollen, schließt Service Discovery diese Festplatten automatisch aus der Liste der erkannten Dienste aus. Die Regeln können sehr granular sein – unterschiedliche Schwellenwerte für verschiedene Hosts, Ausschlüsse für bestimmte Prozesse oder Schnittstellen. Diese Kombination aus automatischer Erkennung und regelbasierter Konfiguration macht Checkmk extrem skalierbar.
Service Discovery und Änderungen an der Infrastruktur
Service Discovery ist besonders wertvoll bei Änderungen der Infrastruktur. Wenn ein neues Laufwerk, eine neue Netzwerkschnittstelle oder ein neuer Anwendungsdienst auf dem Server eintrifft, erkennt Checkmk diese Änderung beim nächsten Service Discovery-Scan und kennzeichnet sie als „neuen nicht genehmigten Dienst“.
Der Administrator sieht in Checkmk eine Liste der neuen, gelöschten und geänderten Dienste und kann für jeden von ihnen eine Entscheidung treffen – zur Überwachung akzeptieren, ablehnen oder für eine spätere Entscheidung zurückstellen. Dadurch wird das Risiko eliminiert, dass neue Infrastrukturkomponenten nicht überwacht werden – etwas, das bei der klassischen manuellen Konfiguration regelmäßig passiert. Auch der umgekehrte Fall – das Entfernen eines Laufwerks oder einer Schnittstelle – wird erkannt und der Dienst wird als ‚verloren‘ gekennzeichnet, so dass die Überwachungskonfiguration bereinigt werden kann. Weitere Informationen zu den Funktionen von Checkmk finden Sie in der Wissensdatenbank von Ramsdata.
Periodic Service Discovery – kontinuierliche Aktualisierung der Konfiguration
Im Modus Manuelle Service-Erkennung muss der Administrator regelmäßig Hosts scannen und neue Services akzeptieren. Die periodische Service-Erkennung automatisiert diesen Prozess – Checkmk scannt Hosts automatisch in vordefinierten Intervallen und akzeptiert – je nach Konfiguration – automatisch neue Services, entfernt abgelehnte Services oder markiert lediglich Änderungen zur manuellen Überprüfung.
Dies ist besonders wertvoll in dynamischen Umgebungen – Cloud, Kubernetes, Microservices – in denen regelmäßig neue Dienste auftauchen und verschwinden. Periodische Service Discovery stellt sicher, dass die Überwachung immer mit dem aktuellen Zustand der Infrastruktur synchronisiert ist, ohne dass Administratoren ständig manuell eingreifen müssen. Bei der Konfiguration des automatischen Modus ist Vorsicht geboten – eine aggressive Automatisierung kann zu einer unkontrollierten Vermehrung der Überwachungskonfigurationen führen.
Checkmk Agent – die Grundlage der Service-Erkennung
Der Checkmk Agent ist ein leichtgewichtiger Agent, der auf überwachten Hosts (Linux, Windows, AIX, Solaris und anderen) installiert wird. Er sammelt Systemdaten und stellt sie dem Checkmk Server zur Verfügung. Der Agent ist die Grundlage der Service-Erkennung – ohne ihn sind die Möglichkeiten der Service-Erkennung erheblich eingeschränkt.
Der Checkmk-Agent sammelt und liefert Daten aus Dutzenden von Quellen: Dateisystem, Prozesse, Systemdienste, Protokolle, Speicher, CPU, Netzwerk und mehr. Check-Plugins auf dem Checkmk-Server interpretieren diese Daten und erkennen Dienste. Der Vorteil des Checkmk-Agenten ist seine Plugin-Architektur (Local Checks) – jeder Administrator kann seine eigenen Prüfskripte hinzufügen, die dann automatisch vom Agenten gesammelt und von Checkmk interpretiert werden. Dies ermöglicht die Überwachung von Anwendungen und benutzerdefinierten Metriken mit vollständiger Integration in Service Discovery.
Diensterkennung bei agentenloser Überwachung (SNMP, API)
Nicht auf allen Geräten kann ein Agent installiert werden – Netzwerk-Switches, Drucker, IoT-Geräte, Festplatten-Arrays kommunizieren alle über SNMP. Checkmk unterstützt Service Discovery für SNMP-überwachte Hosts – es scannt die MIB und OID des Geräts und erkennt verfügbare Metriken.
Die Integration mit APIs von Drittanbietern (VMware vCenter, AWS, Azure, Kubernetes) ermöglicht die dynamische Erkennung von Services in virtualisierten und Cloud-Umgebungen. Checkmk erkennt automatisch neue virtuelle Maschinen, Kubernetes-Container und Cloud-Ressourcen und fügt sie der Überwachung hinzu, ohne dass jede Ressource manuell konfiguriert werden muss. Dies ist besonders wichtig in dynamischen Umgebungen, in denen sich die Infrastruktur mehrmals am Tag ändert.
Wichtigste Schlussfolgerungen
- Service Discovery identifiziert automatisch, was auf den einzelnen Hosts überwacht werden sollte.
- Check-Plugins analysieren die Daten des Hosts und geben Listen der erkannten Instanzen (Laufwerke, Schnittstellen, Prozesse) zurück.
- Checkmk-Regeln (Regeln) konfigurieren Erkennungs- und Überwachungsparameter auf hierarchische und skalierbare Weise.
- Periodic Service Discovery automatisiert die Synchronisierung der Überwachungskonfigurationen mit dem Zustand der Infrastruktur.
- Checkmk Agent bietet die umfangreichsten Funktionen zur Erkennung von Diensten – mit Unterstützung für benutzerdefinierte Plug-ins.
- Die agentenlose Überwachung über SNMP und API bietet Service Discovery für Netzwerkgeräte und Cloud-Umgebungen.
FAQ
Wie oft sollte Checkmk eine periodische Service-Ermittlung durchführen? Für statische Umgebungen ist einmal pro Tag oder einmal pro Woche ausreichend. Für dynamische Umgebungen (Kubernetes, Cloud) alle 30-60 Minuten oder weniger, mit einem vorsichtigen Auto-Akzeptanz-Modus.
Kann Service Discovery ablehnende Dienste automatisch entfernen? Ja – Periodic Service Discovery im Modus ‚fixall‘ nimmt automatisch neue Dienste an und entfernt verfallene Dienste. In Produktionsumgebungen lohnt es sich, den Modus ’new_only‘ zu verwenden und die Löschungen manuell zu überprüfen.
Wie kommt Checkmk mit Tausenden von Diensten auf einem großen Host zurecht? Checkmk ist skalierbar – Überwachungsserver können Zehntausende von Diensten unterstützen. Die verteilte Überwachungsarchitektur ermöglicht die Skalierung durch Hinzufügen lokaler Überwachungsserver.
Kann der Umfang von Service Discovery auf ausgewählte Servicetypen beschränkt werden? Ja – Regeln ermöglichen den Ausschluss bestimmter Check-Plugins oder Service-Typen von der Service-Erkennung für ausgewählte Host-Gruppen.
Zusammenfassung
Die automatische Service-Erkennung von Checkmk ist eine der wertvollsten Funktionen der Plattform – sie macht die manuelle Konfiguration jedes Dienstes überflüssig und stellt sicher, dass die Überwachung immer aktuell ist und den tatsächlichen Zustand der Infrastruktur widerspiegelt. In Kombination mit Richtlinien, periodischer Service-Erkennung und der Integration mit Agenten und APIs schafft Checkmk ein Überwachungssystem, das mit Ihrer Infrastruktur wächst und sich anpasst. Wenn Sie die IT-Überwachung in Ihrem Unternehmen einführen oder optimieren möchten, wenden Sie sich an den Checkmk-Partner Ramsdata.