L’un des plus grands défis de la surveillance informatique est de maintenir la configuration de la surveillance à jour. Nouveaux services, nouvelles applications, changements dans la configuration des serveurs – la surveillance configurée une fois devient rapidement obsolète et ne reflète plus l’état réel de l’infrastructure. Checkmk résout ce problème grâce à un mécanisme de découverte automatique des services (Service Discovery) qui scanne continuellement les hôtes surveillés et identifie ce qui doit être surveillé et comment – sans avoir à configurer manuellement chaque service.
Table des matières
- Qu’est-ce que la découverte de services chez Checkmk ?
- Comment fonctionne le mécanisme de détection des services ?
- Détection automatique vs. règles Checkmk
- Découverte des services et modifications de l’infrastructure
- Découverte périodique des services – mise à jour continue de la configuration
- Checkmk Agent – la base de la découverte des services
- Détection de services dans le cadre d’une surveillance sans agent (SNMP, API)
- Principales conclusions
- FAQ
- Résumé
Qu’est-ce que la découverte de services chez Checkmk ?
La découverte de services est le mécanisme de Checkmk qui identifie automatiquement quels services (services) doivent être surveillés sur un hôte donné et quels paramètres doivent être vérifiés. „Service” dans Checkmk est tout aspect du système qui peut être surveillé – un disque, une interface réseau, un processus, un démon, un service Windows, une ressource Kubernetes et des centaines d’autres.
Sans détection automatique, un administrateur devrait configurer manuellement chaque service sur chaque hôte – en déterminant ce qu’il faut vérifier, les seuils d’alerte à appliquer et la manière d’interpréter les résultats. Dans un environnement comprenant des centaines ou des milliers d’hôtes, cela n’est pas viable. Checkmk Service Discovery élimine ce travail – il analyse les hôtes et suggère ou ajoute automatiquement les services à surveiller. Dans l’offre de Ramsdata, Checkmk est un outil de surveillance que Ramsdata déploie avec un support technique et de formation complet.
Comment fonctionne le mécanisme de détection des services ?
Le mécanisme de découverte de services de Checkmk fonctionne grâce à ce que l’on appelle des plugins de contrôle, c’est-à-dire des modules responsables d’un type de service spécifique. Chaque module de contrôle „sait” comment demander à l’hôte les données relatives à son champ d’application et comment interpréter les résultats.
Lorsque Checkmk analyse un hôte, il exécute tous les plugins de contrôle pertinents et chacun renvoie une liste des instances détectées. Le plugin de surveillance des disques renvoie une liste de tous les disques trouvés sur l’hôte. Le module de surveillance des processus renvoie une liste des processus en cours d’exécution correspondant à des modèles définis. Le module de surveillance des interfaces réseau renvoie une liste de toutes les interfaces. Le résultat d’un balayage de découverte de services est une liste de services proposés – l’administrateur peut accepter, rejeter ou configurer des exceptions.
Détection automatique vs. règles Checkmk
Les règles de Checkmk permettent de configurer les paramètres de détection et de surveillance de manière hiérarchique et évolutive. Au lieu de configurer individuellement chaque disque sur chaque serveur, l’administrateur définit une règle : „sur tous les serveurs de production, surveiller les disques avec l’alerte WARN à 80% de remplissage et CRIT à 90%”. La règle est automatiquement appliquée à tous les serveurs du groupe.
Service Discovery respecte les règles lors de la détection des services – si une règle stipule „ne pas surveiller les disques temporaires”, Service Discovery exclut automatiquement ces disques de la liste des services détectés. Les règles peuvent être très granulaires – différents seuils pour différents hôtes, des exclusions pour des processus ou des interfaces spécifiques. Cette combinaison de détection automatique et de configuration basée sur des règles rend Checkmk extrêmement évolutif.
Découverte des services et modifications de l’infrastructure
Service Discovery est particulièrement utile pour les changements d’infrastructure. Lorsqu’un nouveau disque, une nouvelle interface réseau ou un nouveau service d’application arrive sur le serveur, Checkmk détecte ce changement lors du prochain balayage Service Discovery et le signale comme „nouveau service non approuvé”.
L’administrateur peut voir une liste des services nouveaux, supprimés et modifiés dans Checkmk et peut prendre une décision pour chacun d’entre eux – accepter pour la surveillance, rejeter ou laisser pour une décision ultérieure. Cela élimine le risque que de nouveaux composants de l’infrastructure ne soient pas surveillés, ce qui arrive régulièrement dans l’approche classique de la configuration manuelle. La situation inverse – suppression d’un disque ou d’une interface – est également détectée et le service est signalé comme „perdu”, ce qui permet de nettoyer la configuration de surveillance. Vous trouverez plus d’informations sur les capacités de Checkmk dans la base de connaissances de Ramsdata.
Découverte périodique des services – mise à jour continue de la configuration
Le mode de découverte manuelle de services exige que l’administrateur scanne régulièrement les hôtes et accepte les nouveaux services. La découverte périodique de services automatise ce processus – Checkmk scanne automatiquement les hôtes à des intervalles prédéfinis et, selon la configuration, accepte automatiquement les nouveaux services, supprime les services en déclin ou signale simplement les changements pour une vérification manuelle.
Ceci est particulièrement précieux dans les environnements dynamiques – cloud, Kubernetes, microservices – où de nouveaux services apparaissent et disparaissent régulièrement. La découverte périodique des services garantit que la surveillance est toujours synchronisée avec l’état réel de l’infrastructure sans que les administrateurs aient à effectuer un travail manuel constant. La configuration du mode automatique nécessite de la prudence – une automatisation agressive peut conduire à une prolifération incontrôlée des configurations de surveillance.
Checkmk Agent – la base de la découverte de services
L’agent Checkmk est un agent léger installé sur les hôtes surveillés (Linux, Windows, AIX, Solaris et autres) qui collecte les données du système et les met à la disposition du serveur Checkmk. L’agent est la base de la découverte de services – sans lui, les capacités de découverte de services sont considérablement limitées.
L’agent Checkmk collecte et fournit des données provenant de dizaines de sources : système de fichiers, processus, services système, journaux, mémoire, CPU, réseau, etc. Les plugins de contrôle sur le serveur Checkmk interprètent ces données et détectent les services. L’avantage de l’agent Checkmk est son architecture de plugins (Local Checks) – chaque administrateur peut ajouter ses propres scripts de contrôle, qui seront automatiquement collectés par l’agent et interprétés par Checkmk. Cela permet de surveiller les applications et les mesures personnalisées avec une intégration complète dans Service Discovery.
Détection de services dans le cadre d’une surveillance sans agent (SNMP, API)
Tous les appareils ne peuvent pas avoir un agent installé – les commutateurs réseau, les imprimantes, les appareils IoT, les matrices de disques communiquent tous via SNMP. Checkmk prend en charge la découverte de services pour les hôtes surveillés par SNMP – il analyse la MIB et l’OID de l’appareil et détecte les métriques disponibles.
L’intégration avec des API tierces (VMware vCenter, AWS, Azure, Kubernetes) permet une détection dynamique des services dans les environnements virtualisés et cloud. Checkmk détecte automatiquement les nouvelles machines virtuelles, les conteneurs Kubernetes, les ressources cloud et les ajoute à la surveillance sans configuration manuelle de chaque ressource. Ceci est particulièrement important dans les environnements dynamiques où l’infrastructure change plusieurs fois par jour.
Principales conclusions
- Service Discovery identifie automatiquement ce qui doit être surveillé sur chaque hôte.
- Les plugins de contrôle analysent les données de l’hôte et renvoient des listes d’instances détectées (lecteurs, interfaces, processus).
- Les règles de Checkmk (règles) configurent les paramètres de détection et de surveillance de manière hiérarchique et évolutive.
- La découverte périodique des services automatise la synchronisation des configurations de surveillance avec l’état de l’infrastructure.
- Checkmk Agent offre les capacités de découverte de services les plus étendues, avec la prise en charge de modules d’extension personnalisés.
- La surveillance sans agent via SNMP et API permet la découverte de services pour les périphériques réseau et les environnements en nuage.
FAQ
A quelle fréquence Checkmk doit-il procéder à une découverte périodique des services ? Pour les environnements statiques, une fois par jour ou par semaine suffit. Pour les environnements dynamiques (Kubernetes, cloud), toutes les 30 à 60 minutes ou moins, avec un mode d’acceptation automatique prudent.
La découverte de services peut-elle supprimer automatiquement les services en déclin ? Oui – La recherche périodique de services en mode „fixall” accepte automatiquement les nouveaux services et supprime les services dégradés. Dans les environnements de production, il convient d’utiliser le mode „new_only” et de vérifier manuellement les suppressions.
Comment Checkmk gère-t-il des milliers de services sur un grand hôte ? Checkmk est conçu pour évoluer – les serveurs de surveillance peuvent prendre en charge des dizaines de milliers de services. L’architecture de surveillance distribuée permet une mise à l’échelle par l’ajout de serveurs de surveillance locaux.
Le champ d’application de la découverte de services peut-il être limité à certains types de services ? Oui – les règles permettent d’exclure des plugins de contrôle ou des types de services spécifiques de la découverte de services pour les groupes d’hôtes sélectionnés.
Résumé
La découverte automatique des services de Checkmk est l’une des caractéristiques les plus précieuses de la plateforme – elle élimine la configuration manuelle de chaque service et garantit que la surveillance est toujours à jour et qu’elle reflète l’état réel de l’infrastructure. Combiné aux politiques, à la découverte périodique de services et à l’intégration avec des agents et des API, Checkmk crée un système de surveillance qui grandit et s’adapte à votre infrastructure. Si vous souhaitez mettre en œuvre ou optimiser la surveillance informatique dans votre organisation, contactez Ramsdata, partenaire de Checkmk.