Ramsdata

A monitorização sem gestão de acções é a monitorização pela monitorização. Milhares de alertas por dia, metade dos quais são ignorados, um quarto dos quais resultam na criação manual de bilhetes e os restantes perdem-se no ruído – esta é a realidade de muitos departamentos de TI que implementaram a monitorização sem uma integração cuidadosa com os processos de ITSM. A Checkmk resolve este problema através de integrações nativas com sistemas populares de ticketing e ITSM, fechando o ciclo entre a deteção e a resolução de problemas.

Índice

  1. Porque é que a monitorização sem ITSM é incompleta?
  2. Como é que o Checkmk se integra com os sistemas de emissão de bilhetes?
  3. Integração com o ServiceNow
  4. Integração com o Jira Service Management
  5. Integração com outros sistemas ITSM
  6. Gestão de alertas e redução de ruído
  7. Principais conclusões
  8. FAQ
  9. Resumo

Porque é que a monitorização sem ITSM é incompleta?

A monitorização detecta os problemas, mas é o ITSM que gere a solução. Sem integração entre estes sistemas, ocorre o “vale da morte”: é gerado um alerta no sistema de monitorização, alguém o vê (ou não), cria manualmente um bilhete, atribui-o à pessoa certa, completa a descrição…. e só depois é que começa o trabalho efetivo para resolver o problema. O tempo entre a deteção e a primeira ação corretiva (MTTA – Mean Time To Acknowledge) é muito mais longo do que deveria ser.

O outro lado do problema é a falta de encerramento do ciclo: o bilhete é resolvido, mas o sistema de monitorização não sabe quando e por quem. Faltam dados para a análise do MTTR (Mean Time To Resolve), falta informação sobre a recorrência de incidentes, falta contexto para o postmortem.

O Checkmk com integração ITSM fecha este ciclo – desde a criação automática de um bilhete quando é detectado um problema, passando pela atualização do seu estado, até ao encerramento automático quando a monitorização confirma uma solução.

Como é que o Checkmk se integra com os sistemas de emissão de bilhetes?

A Checkmk oferece dois mecanismos de integração com sistemas externos. As Regras de Notificação são um mecanismo incorporado configurável através da interface Web – define quais os alertas, para que anfitriões/serviços e em que circunstâncias devem gerar acções externas. A Consola de Eventos é um mecanismo de correlação de eventos que pode gerar bilhetes com base em padrões de eventos em vez de alertas individuais.

Os mecanismos técnicos de integração são: scripts de notificação (Python/Shell), a API REST da Checkmk, webhooks e Event Rules. A Checkmk fornece scripts de notificação prontos a utilizar para os sistemas ITSM mais populares – ServiceNow, Jira, PagerDuty, OpsGenie e outros – que apenas requerem a configuração de parâmetros de ligação.

Integração com o ServiceNow

A integração do Checkmk com o ServiceNow é uma das mais extensas dos sistemas ITSM suportados. O plugin pré-construído disponível no Checkmk Exchange suporta: criação automática de incidentes no ServiceNow quando é detectado um alerta CRIT ou WARN, atualização automática do incidente quando o estado monitorizado muda (por exemplo, de CRIT para WARN), encerramento automático do incidente quando o Checkmk regista um regresso a um estado OK.

O mapeamento de atributos é configurável – podes mapear as severidades do Checkmk para as categorias de incidentes do ServiceNow, atribuir grupos de suporte com base em etiquetas de anfitrião ou etiquetas de serviço no Checkmk. A sincronização bidirecional também permite que as notas sejam adicionadas a um incidente ServiceNow diretamente a partir do Checkmk.

Integração com o Jira Service Management

Para as organizações que utilizam o Jira Service Management (anteriormente Jira Service Desk), a Checkmk oferece integração através da API REST do Jira. Os alertas da Checkmk criam problemas no projeto Jira selecionado com campos de preenchimento automático: resumo (nome do anfitrião + serviço + estado), descrição (contexto completo do alerta da Checkmk), prioridade (mapeada a partir da gravidade da Checkmk), etiquetas (etiquetas da Checkmk).

A configuração permite o encaminhamento de bilhetes para diferentes projectos Jira, dependendo da origem do alerta – por exemplo, os alertas de infraestrutura vão para o projeto Ops, os alertas de aplicações para o projeto Dev. A integração com o software de monitorização cria um ecossistema de gestão de incidentes consistente.

Integração com outros sistemas ITSM

Para além do ServiceNow e do Jira, o Checkmk suporta a integração com: PagerDuty (escalonamento de alertas e gerenciamento de plantão), OpsGenie (plataforma alternativa de alertas), Slack e Microsoft Teams (notificações de bate-papo com um link para o incidente), e-mail (com formatação HTML avançada, incluindo contexto de alerta), VictorOps/Splunk On-Call, Zendesk e outros por meio de scripts personalizados.

Os scripts de notificação personalizados permitem a integração com qualquer sistema que suporte APIs HTTP – oferecendo flexibilidade ilimitada para organizações com sistemas ITSM personalizados.

Gestão de alertas e redução de ruído

A integração com o ITSM é tão boa quanto a qualidade dos alertas que lhe são enviados. A Checkmk oferece mecanismos de redução de ruído que evitam que os sistemas de bilhética sejam inundados com falsos alertas e alertas flutuantes.

A Deteção de Flap detecta os serviços a “piscar” entre estados e retém as notificações até estabilizarem. O Delay and Renotification permite-te definir a duração mínima de um problema antes de ser gerado um ticket. A supressão de alertas durante as janelas de serviço impede a geração de incidentes durante as interrupções programadas. A correlação no Event Console permite que vários alertas relacionados a um único evento (por exemplo, falha de switch causando alertas para centenas de hosts) sejam agrupados em um único tíquete.

Principais conclusões

  • A monitorização sem integração com o ITSM deixa um “vale da morte” entre a deteção e a resposta ao problema.
  • A Checkmk oferece integrações nativas com o ServiceNow, Jira, PagerDuty e outros através de plug-ins prontos e scripts de notificação.
  • A sincronização bidirecional fecha o ciclo: o bilhete é automaticamente criado, atualizado e encerrado com base nos estados de monitorização.
  • Os mecanismos de redução do ruído (deteção de falhas, atrasos, correlação) evitam que os sistemas ITSM sejam inundados com falsos bilhetes.
  • O modelo flexível de script de notificação permite a integração com qualquer sistema através da API HTTP.

FAQ

O Checkmk pode fechar automaticamente o bilhete quando o problema estiver resolvido? Sim – com a integração bidirecional (ServiceNow, Jira), o Checkmk pode fechar ou atualizar automaticamente um bilhete quando o serviço monitorizado volta a estar OK.

Como é que a Checkmk lida com bilhetes duplicados com alertas recorrentes? Podes configurar a lógica para verificar se já existe um ticket aberto para um determinado host/serviço antes de criar um novo. Estão disponíveis scripts prontos para implementar essa lógica.

Podes ter regras de emissão de bilhetes diferentes para ambientes diferentes? Sim – As regras de notificação no Checkmk permitem uma configuração muito granular de quais alertas, para quais hosts e em quais horários geram tickets e em qual sistema.

Como implementar a integração Checkmk-ServiceNow sem consultores externos? O Checkmk fornece documentação pormenorizada e um plugin pronto a utilizar. Para configurações mais complexas (mapeamentos personalizados, sincronização bidirecional), a Ramsdata oferece apoio à implementação.

Resumo

A integração do Checkmk com os sistemas ITSM é um passo que transforma a monitorização de uma ferramenta de observação numa parte do processo de gestão de incidentes. A criação, atualização e encerramento automático de tickets elimina o trabalho manual dos administradores e reduz o MTTA ao mínimo. Contacta a Ramsdata para saber como o Checkmk se pode integrar nos sistemas ITSM da tua organização.

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *

error: Content is protected !!