La surveillance sans gestion des actions est une surveillance pour le plaisir de surveiller. Des milliers d’alertes par jour, dont la moitié sont ignorées, un quart d’entre elles aboutissent à la création manuelle d’un ticket et le reste est perdu dans le bruit – telle est la réalité de nombreux départements informatiques qui ont mis en place une surveillance sans intégration réfléchie avec les processus ITSM. Checkmk résout ce problème grâce à des intégrations natives avec les systèmes de ticketing et d’ITSM les plus répandus, fermant ainsi la boucle entre la détection et la résolution des problèmes.
Table des matières
- Pourquoi le contrôle est-il incomplet sans ITSM ?
- Comment Checkmk s’intègre-t-il aux systèmes de billetterie ?
- Intégration avec ServiceNow
- Intégration avec Jira Service Management
- Intégration avec d’autres systèmes ITSM
- Gestion des alertes et réduction du bruit
- Principales conclusions
- FAQ
- Résumé
Pourquoi le contrôle est-il incomplet sans ITSM ?
La surveillance détecte les problèmes, mais c’est l’ITSM qui gère la solution. Sans intégration entre ces systèmes, la « vallée de la mort » se produit : une alerte est générée dans le système de surveillance, quelqu’un la voit (ou non), crée manuellement un ticket, l’assigne à la bonne personne, complète la description…. et ce n’est qu’ensuite que le travail effectif sur le problème commence. Le délai entre la détection et la première action corrective (MTTA – Mean Time To Acknowledge) est beaucoup plus long qu’il ne devrait l’être.
L’autre aspect du problème est l’absence de bouclage de la boucle : le ticket est résolu, mais le système de suivi ne sait pas quand et par qui. Il y a un manque de données pour l’analyse MTTR (Mean Time To Resolve), un manque d’informations sur la récurrence des incidents, un manque de contexte pour le post-mortem.
Checkmk avec l’intégration ITSM ferme cette boucle – de la création automatique d’un ticket lorsqu’un problème est détecté, à la mise à jour de son statut, jusqu’à la fermeture automatique lorsque le contrôle confirme une solution.
Comment Checkmk s’intègre-t-il aux systèmes de billetterie ?
Checkmk propose deux mécanismes d’intégration avec des systèmes externes. Les règles de notification sont un mécanisme intégré configurable via l’interface web – vous définissez quelles alertes, pour quels hôtes/services et dans quelles circonstances doivent générer des actions externes. Event Console est un mécanisme de corrélation d’événements qui peut générer des tickets basés sur des modèles d’événements plutôt que sur des alertes individuelles.
Les mécanismes techniques d’intégration sont : les scripts de notification (Python/Shell), l’API REST de Checkmk, les webhooks et les règles d’événements. Checkmk fournit des scripts de notification prêts à l’emploi pour les systèmes ITSM les plus populaires – ServiceNow, Jira, PagerDuty, OpsGenie et autres – qui ne nécessitent que la configuration des paramètres de connexion.
Intégration avec ServiceNow
L’intégration de Checkmk avec ServiceNow est l’une des plus complètes parmi les systèmes ITSM supportés. Le plugin pré-construit disponible dans Checkmk Exchange supporte : la création automatique d’incidents dans ServiceNow lorsqu’une alerte CRIT ou WARN est détectée, la mise à jour automatique de l’incident lorsque l’état surveillé change (par exemple de CRIT à WARN), la fermeture automatique de l’incident lorsque Checkmk enregistre un retour à un état OK.
Le mappage des attributs est configurable – vous pouvez mapper les sévérités de Checkmk aux catégories d’incidents de ServiceNow, assigner des groupes de support basés sur des étiquettes d’hôtes ou des étiquettes de services dans Checkmk. La synchronisation bidirectionnelle permet également d’ajouter des notes à un incident ServiceNow directement depuis Checkmk.
Intégration avec Jira Service Management
Pour les organisations utilisant Jira Service Management (anciennement Jira Service Desk), Checkmk offre une intégration via l’API REST de Jira. Les alertes Checkmk créent des problèmes dans le projet Jira sélectionné avec des champs qui se remplissent automatiquement : résumé (nom d’hôte + service + statut), description (contexte complet de l’alerte à partir de Checkmk), priorité (mappée à partir de la sévérité Checkmk), étiquettes (tags de Checkmk).
La configuration permet d’acheminer les tickets vers différents projets Jira en fonction de la source de l’alerte – par exemple, les alertes d’infrastructure vont vers le projet Ops, les alertes d’application vers le projet Dev. L’intégration avec le logiciel de surveillance crée un écosystème cohérent de gestion des incidents.
Intégration avec d’autres systèmes ITSM
En plus de ServiceNow et Jira, Checkmk supporte l’intégration avec : PagerDuty (escalade des alertes et gestion de l’astreinte), OpsGenie (plateforme d’alerte alternative), Slack et Microsoft Teams (notifications de chat avec un lien vers l’incident), email (avec un formatage HTML riche incluant le contexte de l’alerte), VictorOps/Splunk On-Call, Zendesk et d’autres via des scripts personnalisés.
Les scripts de notification personnalisés permettent l’intégration avec n’importe quel système prenant en charge les API HTTP, ce qui offre une flexibilité illimitée aux organisations dotées de systèmes ITSM personnalisés.
Gestion des alertes et réduction du bruit
L’intégration avec l’ITSM ne vaut que par la qualité des alertes qui y sont envoyées. Checkmk offre des mécanismes de réduction du bruit qui empêchent les systèmes de billetterie d’être inondés de fausses alertes et d’alertes fluctuantes.
La fonction de détection de clignotement détecte les services qui passent d’un état à l’autre et retient les notifications jusqu’à ce qu’ils soient stabilisés. Les fonctions Délai et Renotification vous permettent de définir la durée minimale d’un problème avant qu’un ticket ne soit généré. La suppression des alertes pendant les fenêtres de service empêche la génération d’incidents pendant les interruptions programmées. La corrélation dans la console d’événements permet de regrouper dans un seul ticket plusieurs alertes liées à un seul événement (par exemple, une panne de commutateur provoquant des alertes sur des centaines d’hôtes).
Principales conclusions
- La surveillance sans intégration avec l’ITSM laisse une « vallée de la mort » entre la détection et la réponse au problème.
- Checkmk offre des intégrations natives avec ServiceNow, Jira, PagerDuty et d’autres grâce à des plug-ins et des scripts de notification prêts à l’emploi.
- La synchronisation bidirectionnelle permet de boucler la boucle : un ticket est automatiquement créé, mis à jour et fermé en fonction des états de surveillance.
- Les mécanismes de réduction du bruit (détection d’erreur, retard, corrélation) empêchent les systèmes ITSM d’être inondés de faux tickets.
- Le modèle de script de notification flexible permet l’intégration avec n’importe quel système via l’API HTTP.
FAQ
Checkmk peut-il fermer automatiquement le ticket lorsque le problème est résolu ? Oui – avec une intégration bidirectionnelle (ServiceNow, Jira) Checkmk peut automatiquement fermer ou mettre à jour un ticket lorsque le service surveillé revient à OK.
Comment Checkmk gère-t-il les doublons de tickets avec des alertes récurrentes ? Vous pouvez configurer une logique pour vérifier s’il existe déjà un ticket ouvert pour un hôte/service donné avant d’en créer un nouveau. Des scripts prêts à l’emploi mettant en œuvre cette logique sont disponibles.
Pouvez-vous avoir des règles de billetterie différentes pour des environnements différents ? Oui – Les règles de notification dans Checkmk permettent une configuration très granulaire des alertes, pour quels hôtes et à quel moment générer des tickets et dans quel système.
Comment implémenter l’intégration Checkmk-ServiceNow sans consultants externes ? Checkmk fournit une documentation détaillée et un plugin prêt à l’emploi. Pour des configurations plus complexes (mappings personnalisés, synchronisation bidirectionnelle), Ramsdata offre une assistance à la mise en œuvre.
Résumé
L’intégration de Checkmk aux systèmes ITSM est une étape qui transforme la surveillance d’un outil d’observation en une partie du processus de gestion des incidents. La création, la mise à jour et la fermeture automatiques des tickets éliminent le travail manuel des administrateurs et réduisent le MTTA au minimum. Contactez Ramsdata pour découvrir comment Checkmk peut s’intégrer aux systèmes ITSM de votre organisation.