Um dos maiores desafios na monitorização de TI é manter a configuração da monitorização actualizada. Novos serviços, novas aplicações, alterações nas configurações do servidor – a monitorização configurada uma vez rapidamente se torna antiga e já não reflecte o verdadeiro estado da infraestrutura. O Checkmk resolve este problema através de um mecanismo automático de descoberta de serviços (Service Discovery) que analisa continuamente os anfitriões monitorizados e identifica o que deve ser monitorizado e como – sem configurar manualmente cada serviço.
Índice
- O que é o Service Discovery na Checkmk?
- Como funciona o mecanismo de deteção de serviços?
- Deteção automática vs. regras Checkmk
- Descoberta de serviços e alterações à infraestrutura
- Descoberta periódica de serviços – atualização contínua da configuração
- Checkmk Agent – a base da descoberta de serviços
- Deteção de serviços na monitorização sem agentes (SNMP, API)
- Principais conclusões
- FAQ
- Resumo
O que é o Service Discovery na Checkmk?
A Descoberta de Serviços é o mecanismo do Checkmk que identifica automaticamente quais serviços (serviços) devem ser monitorados em um determinado host e quais parâmetros devem ser verificados. “Serviço” no Checkmk é qualquer aspeto do sistema que pode ser monitorado – um disco, uma interface de rede, um processo, um daemon, um serviço do Windows, um recurso do Kubernetes e centenas de outros.
Sem a deteção automática, um administrador teria de configurar manualmente cada serviço em cada anfitrião – determinando o que verificar, quais os limites de alerta a aplicar e como interpretar os resultados. Num ambiente com centenas ou milhares de anfitriões, isto é insustentável. O Checkmk Service Discovery elimina este trabalho – analisa os anfitriões e sugere ou adiciona automaticamente os serviços a monitorizar. O Checkmk na oferta da Ramsdata é uma ferramenta de monitorização que a Ramsdata implementa com suporte técnico e de formação completos.
Como funciona o mecanismo de deteção de serviços?
O mecanismo de Descoberta de Serviços do Checkmk funciona através dos chamados plugins de verificação – módulos responsáveis por um tipo específico de serviço. Cada plugin de verificação “sabe” como consultar o anfitrião para obter dados relativos ao seu âmbito e como interpretar os resultados.
Quando o Checkmk examina um host, executa todos os plug-ins de verificação relevantes e cada um retorna uma lista de instâncias detectadas. O plug-in de monitorização do disco devolve uma lista de todos os discos encontrados no anfitrião. O plugin de monitorização de processos devolve uma lista de processos em execução que correspondem a padrões definidos. O plugin de monitorização de interfaces de rede devolve uma lista de todas as interfaces. O resultado de um scan de Service Discovery é uma lista de serviços propostos – o administrador pode aceitar, rejeitar ou configurar excepções.
Deteção automática vs. regras Checkmk
As regras no Checkmk permitem que os parâmetros de deteção e monitorização sejam configurados de forma hierárquica e escalável. Em vez de configurar cada disco em cada servidor individualmente, o administrador define uma regra: “em todos os servidores de produção, monitoriza os discos com o alerta WARN a 80% cheio e CRIT a 90%”. A regra é aplicada automaticamente a todos os servidores do grupo.
O Service Discovery respeita as regras ao detetar serviços – se uma regra disser “não monitorizar discos temporários”, o Service Discovery exclui automaticamente esses discos da lista de serviços detectados. As regras podem ser muito granulares – diferentes limiares para diferentes anfitriões, exclusões para processos ou interfaces específicos. Esta combinação de deteção automática com configuração baseada em regras torna o Checkmk extremamente escalável.
Descoberta de serviços e alterações à infraestrutura
O Service Discovery é particularmente valioso para as alterações da infraestrutura. Quando uma nova unidade, uma nova interface de rede ou um novo serviço de aplicação chega ao servidor, o Checkmk detecta esta alteração no scan seguinte do Service Discovery e assinala-a como um “novo serviço não aprovado”.
O administrador pode ver uma lista de serviços novos, eliminados e alterados no Checkmk e pode tomar uma decisão sobre cada um deles – aceitar para monitorização, rejeitar ou deixar para uma decisão posterior. Isto elimina o risco de novos componentes da infraestrutura não serem monitorizados – algo que acontece regularmente na abordagem clássica de configuração manual. A situação oposta – remoção de um disco ou interface – também é detectada e o serviço é assinalado como “perdido”, permitindo que a configuração de monitorização seja limpa. Mais informações sobre as capacidades do Checkmk podem ser encontradas na base de conhecimentos da Ramsdata.
Descoberta periódica de serviços – atualização contínua da configuração
O modo de Descoberta Manual de Serviços requer que o administrador verifique regularmente os hosts e aceite novos serviços. A Descoberta Periódica de Serviços automatiza esse processo – o Checkmk examina automaticamente os hosts em intervalos predefinidos e – dependendo da configuração – aceita automaticamente novos serviços, remove serviços em declínio ou apenas sinaliza as alterações para verificação manual.
Isso é particularmente valioso em ambientes dinâmicos – nuvem, Kubernetes, microsserviços – onde novos serviços aparecem e desaparecem regularmente. A descoberta periódica de serviços garante que o monitoramento esteja sempre em sincronia com o estado real da infraestrutura sem o trabalho manual constante dos administradores. A configuração do modo automático requer cautela – a automação agressiva pode levar a uma proliferação descontrolada de configurações de monitoramento.
Checkmk Agent – a base da descoberta de serviços
O Checkmk Agent é um agente leve instalado em hosts monitorados (Linux, Windows, AIX, Solaris e outros) que coleta dados do sistema e os disponibiliza para o servidor Checkmk. O agente é a base do Service Discovery – sem ele, os recursos de descoberta de serviços são significativamente limitados.
O agente Checkmk recolhe e fornece dados de dezenas de fontes: sistema de ficheiros, processos, serviços de sistema, registos, memória, CPU, rede e muito mais. Os plugins de verificação no servidor Checkmk interpretam estes dados e detectam serviços. A vantagem do agente Checkmk é a sua arquitetura de plugins (Local Checks) – cada administrador pode adicionar os seus próprios scripts de verificação, que serão automaticamente recolhidos pelo agente e interpretados pelo Checkmk. Isto permite a monitorização de aplicações e métricas personalizadas com integração total no Service Discovery.
Deteção de serviços na monitorização sem agentes (SNMP, API)
Nem todos os dispositivos podem ter um agente instalado – switches de rede, impressoras, dispositivos IoT, matrizes de disco, todos comunicam através de SNMP. O Checkmk suporta a Descoberta de Serviços para anfitriões monitorizados por SNMP – analisa o MIB e o OID do dispositivo e detecta as métricas disponíveis.
A integração com APIs de terceiros (VMware vCenter, AWS, Azure, Kubernetes) permite a deteção dinâmica de serviços em ambientes virtualizados e de nuvem. O Checkmk detecta automaticamente novas máquinas virtuais, contentores Kubernetes e recursos de nuvem e adiciona-os à monitorização sem a configuração manual de cada recurso. Isto é particularmente importante em ambientes dinâmicos onde a infraestrutura muda várias vezes por dia.
Principais conclusões
- O Service Discovery identifica automaticamente o que deve ser monitorizado em cada anfitrião.
- Os plugins de verificação analisam os dados do anfitrião e devolvem listas de instâncias detectadas (unidades, interfaces, processos).
- As regras Checkmk (regras) configuram os parâmetros de deteção e monitorização de uma forma hierárquica e escalável.
- O Periodic Service Discovery automatiza a sincronização das configurações de monitorização com o estado da infraestrutura.
- O Checkmk Agent fornece as mais amplas capacidades de descoberta de serviços – com suporte para plug-ins personalizados.
- A monitorização sem agentes através de SNMP e API fornece Service Discovery para dispositivos de rede e ambientes de nuvem.
FAQ
Com que frequência deve a Checkmk efetuar a Descoberta Periódica de Serviços? Para ambientes estáticos, uma vez por dia ou uma vez por semana é suficiente. Para ambientes dinâmicos (Kubernetes, nuvem), a cada 30-60 minutos ou menos, com um modo de aceitação automática cuidadoso.
O Service Discovery pode remover automaticamente os serviços em declínio? Sim – A Descoberta Periódica de Serviços no modo “fixall” aceita automaticamente serviços novos e remove serviços deteriorados. Em ambientes de produção, vale a pena utilizar o modo “new_only” e verificar manualmente as eliminações.
Como é que o Checkmk lida com milhares de serviços num grande anfitrião? O Checkmk foi concebido para escalar – os servidores de monitorização podem suportar dezenas de milhares de serviços. A arquitetura de Monitorização Distribuída permite o escalonamento através da adição de servidores de monitorização locais.
O âmbito da Descoberta de Serviços pode ser limitado a tipos de serviços selecionados? Sim – as regras permitem que plugins de verificação ou tipos de serviço específicos sejam excluídos do Service Discovery para grupos selecionados de anfitriões.
Resumo
A descoberta automática de serviços da Checkmk é uma das caraterísticas mais valiosas da plataforma – elimina a configuração manual de cada serviço e garante que a monitorização está sempre actualizada e reflecte o verdadeiro estado da infraestrutura. Combinado com as políticas, a Descoberta Periódica de Serviços e a integração com agentes e APIs, o Checkmk cria um sistema de monitorização que cresce e se adapta à sua infraestrutura. Se pretende implementar ou otimizar a monitorização de TI na sua organização, contacte o parceiro da Checkmk, a Ramsdata.