Ramsdata

Um dos maiores desafios na monitorização de TI é manter a configuração da monitorização actualizada. Novos serviços, novas aplicações, alterações nas configurações do servidor – a monitorização configurada uma vez rapidamente se torna antiga e já não reflecte o verdadeiro estado da infraestrutura. O Checkmk resolve este problema através de um mecanismo automático de descoberta de serviços (Service Discovery) que analisa continuamente os anfitriões monitorizados e identifica o que deve ser monitorizado e como – sem configurar manualmente cada serviço.

Índice

  1. O que é o Service Discovery na Checkmk?
  2. Como funciona o mecanismo de deteção de serviços?
  3. Deteção automática vs. regras Checkmk
  4. Descoberta de serviços e alterações à infraestrutura
  5. Descoberta periódica de serviços – atualização contínua da configuração
  6. Checkmk Agent – a base da descoberta de serviços
  7. Deteção de serviços na monitorização sem agentes (SNMP, API)
  8. Principais conclusões
  9. FAQ
  10. Resumo

O que é o Service Discovery na Checkmk?

A Descoberta de Serviços é o mecanismo do Checkmk que identifica automaticamente quais serviços (serviços) devem ser monitorados em um determinado host e quais parâmetros devem ser verificados. “Serviço” no Checkmk é qualquer aspeto do sistema que pode ser monitorado – um disco, uma interface de rede, um processo, um daemon, um serviço do Windows, um recurso do Kubernetes e centenas de outros.

Sem a deteção automática, um administrador teria de configurar manualmente cada serviço em cada anfitrião – determinando o que verificar, quais os limites de alerta a aplicar e como interpretar os resultados. Num ambiente com centenas ou milhares de anfitriões, isto é insustentável. O Checkmk Service Discovery elimina este trabalho – analisa os anfitriões e sugere ou adiciona automaticamente os serviços a monitorizar. O Checkmk na oferta da Ramsdata é uma ferramenta de monitorização que a Ramsdata implementa com suporte técnico e de formação completos.

Como funciona o mecanismo de deteção de serviços?

O mecanismo de Descoberta de Serviços do Checkmk funciona através dos chamados plugins de verificação – módulos responsáveis por um tipo específico de serviço. Cada plugin de verificação “sabe” como consultar o anfitrião para obter dados relativos ao seu âmbito e como interpretar os resultados.

Quando o Checkmk examina um host, executa todos os plug-ins de verificação relevantes e cada um retorna uma lista de instâncias detectadas. O plug-in de monitorização do disco devolve uma lista de todos os discos encontrados no anfitrião. O plugin de monitorização de processos devolve uma lista de processos em execução que correspondem a padrões definidos. O plugin de monitorização de interfaces de rede devolve uma lista de todas as interfaces. O resultado de um scan de Service Discovery é uma lista de serviços propostos – o administrador pode aceitar, rejeitar ou configurar excepções.

Deteção automática vs. regras Checkmk

As regras no Checkmk permitem que os parâmetros de deteção e monitorização sejam configurados de forma hierárquica e escalável. Em vez de configurar cada disco em cada servidor individualmente, o administrador define uma regra: “em todos os servidores de produção, monitoriza os discos com o alerta WARN a 80% cheio e CRIT a 90%”. A regra é aplicada automaticamente a todos os servidores do grupo.

O Service Discovery respeita as regras ao detetar serviços – se uma regra disser “não monitorizar discos temporários”, o Service Discovery exclui automaticamente esses discos da lista de serviços detectados. As regras podem ser muito granulares – diferentes limiares para diferentes anfitriões, exclusões para processos ou interfaces específicos. Esta combinação de deteção automática com configuração baseada em regras torna o Checkmk extremamente escalável.

Descoberta de serviços e alterações à infraestrutura

O Service Discovery é particularmente valioso para as alterações da infraestrutura. Quando uma nova unidade, uma nova interface de rede ou um novo serviço de aplicação chega ao servidor, o Checkmk detecta esta alteração no scan seguinte do Service Discovery e assinala-a como um “novo serviço não aprovado”.

O administrador pode ver uma lista de serviços novos, eliminados e alterados no Checkmk e pode tomar uma decisão sobre cada um deles – aceitar para monitorização, rejeitar ou deixar para uma decisão posterior. Isto elimina o risco de novos componentes da infraestrutura não serem monitorizados – algo que acontece regularmente na abordagem clássica de configuração manual. A situação oposta – remoção de um disco ou interface – também é detectada e o serviço é assinalado como “perdido”, permitindo que a configuração de monitorização seja limpa. Mais informações sobre as capacidades do Checkmk podem ser encontradas na base de conhecimentos da Ramsdata.

Descoberta periódica de serviços – atualização contínua da configuração

O modo de Descoberta Manual de Serviços requer que o administrador verifique regularmente os hosts e aceite novos serviços. A Descoberta Periódica de Serviços automatiza esse processo – o Checkmk examina automaticamente os hosts em intervalos predefinidos e – dependendo da configuração – aceita automaticamente novos serviços, remove serviços em declínio ou apenas sinaliza as alterações para verificação manual.

Isso é particularmente valioso em ambientes dinâmicos – nuvem, Kubernetes, microsserviços – onde novos serviços aparecem e desaparecem regularmente. A descoberta periódica de serviços garante que o monitoramento esteja sempre em sincronia com o estado real da infraestrutura sem o trabalho manual constante dos administradores. A configuração do modo automático requer cautela – a automação agressiva pode levar a uma proliferação descontrolada de configurações de monitoramento.

Checkmk Agent – a base da descoberta de serviços

O Checkmk Agent é um agente leve instalado em hosts monitorados (Linux, Windows, AIX, Solaris e outros) que coleta dados do sistema e os disponibiliza para o servidor Checkmk. O agente é a base do Service Discovery – sem ele, os recursos de descoberta de serviços são significativamente limitados.

O agente Checkmk recolhe e fornece dados de dezenas de fontes: sistema de ficheiros, processos, serviços de sistema, registos, memória, CPU, rede e muito mais. Os plugins de verificação no servidor Checkmk interpretam estes dados e detectam serviços. A vantagem do agente Checkmk é a sua arquitetura de plugins (Local Checks) – cada administrador pode adicionar os seus próprios scripts de verificação, que serão automaticamente recolhidos pelo agente e interpretados pelo Checkmk. Isto permite a monitorização de aplicações e métricas personalizadas com integração total no Service Discovery.

Deteção de serviços na monitorização sem agentes (SNMP, API)

Nem todos os dispositivos podem ter um agente instalado – switches de rede, impressoras, dispositivos IoT, matrizes de disco, todos comunicam através de SNMP. O Checkmk suporta a Descoberta de Serviços para anfitriões monitorizados por SNMP – analisa o MIB e o OID do dispositivo e detecta as métricas disponíveis.

A integração com APIs de terceiros (VMware vCenter, AWS, Azure, Kubernetes) permite a deteção dinâmica de serviços em ambientes virtualizados e de nuvem. O Checkmk detecta automaticamente novas máquinas virtuais, contentores Kubernetes e recursos de nuvem e adiciona-os à monitorização sem a configuração manual de cada recurso. Isto é particularmente importante em ambientes dinâmicos onde a infraestrutura muda várias vezes por dia.

Principais conclusões

  • O Service Discovery identifica automaticamente o que deve ser monitorizado em cada anfitrião.
  • Os plugins de verificação analisam os dados do anfitrião e devolvem listas de instâncias detectadas (unidades, interfaces, processos).
  • As regras Checkmk (regras) configuram os parâmetros de deteção e monitorização de uma forma hierárquica e escalável.
  • O Periodic Service Discovery automatiza a sincronização das configurações de monitorização com o estado da infraestrutura.
  • O Checkmk Agent fornece as mais amplas capacidades de descoberta de serviços – com suporte para plug-ins personalizados.
  • A monitorização sem agentes através de SNMP e API fornece Service Discovery para dispositivos de rede e ambientes de nuvem.

FAQ

Com que frequência deve a Checkmk efetuar a Descoberta Periódica de Serviços? Para ambientes estáticos, uma vez por dia ou uma vez por semana é suficiente. Para ambientes dinâmicos (Kubernetes, nuvem), a cada 30-60 minutos ou menos, com um modo de aceitação automática cuidadoso.

O Service Discovery pode remover automaticamente os serviços em declínio? Sim – A Descoberta Periódica de Serviços no modo “fixall” aceita automaticamente serviços novos e remove serviços deteriorados. Em ambientes de produção, vale a pena utilizar o modo “new_only” e verificar manualmente as eliminações.

Como é que o Checkmk lida com milhares de serviços num grande anfitrião? O Checkmk foi concebido para escalar – os servidores de monitorização podem suportar dezenas de milhares de serviços. A arquitetura de Monitorização Distribuída permite o escalonamento através da adição de servidores de monitorização locais.

O âmbito da Descoberta de Serviços pode ser limitado a tipos de serviços selecionados? Sim – as regras permitem que plugins de verificação ou tipos de serviço específicos sejam excluídos do Service Discovery para grupos selecionados de anfitriões.

Resumo

A descoberta automática de serviços da Checkmk é uma das caraterísticas mais valiosas da plataforma – elimina a configuração manual de cada serviço e garante que a monitorização está sempre actualizada e reflecte o verdadeiro estado da infraestrutura. Combinado com as políticas, a Descoberta Periódica de Serviços e a integração com agentes e APIs, o Checkmk cria um sistema de monitorização que cresce e se adapta à sua infraestrutura. Se pretende implementar ou otimizar a monitorização de TI na sua organização, contacte o parceiro da Checkmk, a Ramsdata.

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *

error: Content is protected !!