Início topics Observability O que é observabilidade?
Explore a solução de observabilidade da IBM Inscreva-se para receber atualizações sobre tópicos de IA
Ilustração com colagem de pictogramas de engrenagem, braço robótico, telefone celular
O que é observabilidade?

Observabilidade é a medida em que se pode compreender o estado interno ou condição de um sistema complexo com base apenas no conhecimento de suas produções externas. Quanto mais observável for um sistema, mais rápido e precisamente você poderá identificar a causa raiz de um problema de desempenho, sem a necessidade de testes ou codificação adicionais.

A observabilidade oferece visibilidade profunda dos aplicativos distribuídos modernos para identificação e resolução de problemas mais rápidas e automáticas.

Em TI e computação em nuvem, a observabilidade envolve o uso de ferramentas e práticas de software. Essas ferramentas servem para agregar, correlacionar e analisar um fluxo constante de dados de desempenho de uma aplicação distribuída, juntamente com o hardware e a rede em que ela é executada. Esse processo ajuda a monitorar, solucionar problemas e depurar aplicativos e redes com eficiência. O objetivo é atender às expectativas de experiência do cliente, acordos de nível de serviço (SLAs) e outros requisitos de negócios.

Um tópico de TI relativamente novo, a observabilidade é muitas vezes caracterizada erroneamente como uma palavra de efeito exagerada ou uma "reformulação" do monitoramento do sistema, monitoramento de desempenho de aplicações (APM)gerenciamento de desempenho da rede (NPM). Na verdade, a observabilidade é uma evolução natural dos métodos de coleta de dados APM e NPM, que lida melhor com a natureza cada vez mais rápida, distribuída e dinâmica das implementações de aplicativos nativas em nuvem. A observabilidade não substitui o monitoramento — ela permite um melhor monitoramento e melhores APM e NPM.

O termo "observabilidade" vem da teoria do controle, uma área da engenharia preocupada com a automação do controle de um sistema dinâmico. Exemplos incluem regular o fluxo de água através de um cano ou controlar a velocidade de um automóvel em inclinações e descidas, com base no feedback do sistema.

Desmascarando os mitos da observabilidade

Este ebook tem como objetivo desmistificar mitos sobre a observabilidade e destacar seu papel no mundo digital.

Conteúdo relacionado

Cadastre-se para receber o guia sobre observabilidade

Por que precisamos da observabilidade?

Nos últimos 20 anos, aproximadamente, as equipes de TI dependeram principalmente do APM para monitorar e solucionar problemas de aplicações. O APM coleta amostras e agrega periodicamente dados de aplicações e sistemas, chamados de telemetria, que são conhecidos por estarem relacionados a problemas de desempenho de aplicações.

O APM analisa a telemetria em relação aos principais indicadores de desempenho (KPIs) e reúne os resultados em um dashboard. Essas descobertas alertam as equipes de operações e suporte para condições anormais com as quais precisam lidar para resolver ou prevenir problemas.

O APM é suficientemente eficaz para monitorar e solucionar problemas de aplicações monolíticas ou aplicações distribuídas tradicionais. Nessas configurações, novas versões de código ocorrem periodicamente, e os fluxos de trabalho e as dependências entre componentes de aplicações, servidores e recursos relacionados são bem conhecidos ou fáceis de rastrear.

Atualmente, as organizações estão adotando rapidamente práticas de desenvolvimento modernas. Essas práticas incluem desenvolvimento ágil, integração contínua e implantação contínua (CI/CD), DevOps, várias linguagens de programação.

As organizações também estão adotando tecnologias nativas da nuvem , como microsserviços, contêineres Docker , Kubernetes e funções serverless . Como resultado, elas estão lançando mais serviços no mercado mais rapidamente do que nunca. Mas, no processo, estão implementando novos componentes de aplicações. Elas fazem isso em muitos lugares, em diferentes linguagens e por períodos de tempo muito variados, até mesmo segundos ou frações de segundo, para funções serverless. A amostragem de dados uma vez por minuto do APM não consegue acompanhar esse ritmo.

O que é necessário é telemetria de maior qualidade – e muito mais – que possa ser usada para criar um registro de alta fidelidade, com contexto vasto e totalmente correlacionado de cada solicitação ou transação do usuário da aplicação. Entre na observabilidade.

Como funciona a observabilidade?

As plataformas de observabilidade descobrem e coletam telemetria de desempenho continuamente, integrando-se à instrumentação existente incorporada aos componentes de aplicações e infraestrutura e fornecendo ferramentas para adicionar instrumentação a esses componentes. A observabilidade se concentra em quatro tipos principais de telemetria:

  • Logs. Os logs são registros granulares, com carimbo de data/hora, completos e imutáveis de eventos das aplicações. Entre outras coisas, os logs podem ser usados para criar um registro de alta fidelidade, milissegundo por milissegundo, de cada evento, completo com contexto circundante. Os desenvolvedores podem usar esses logs para "reprodução", para fins de solução de problemas e depuração.
  • Métricas. As métricas (às vezes chamadas de métricas de séries temporais) são medidas fundamentais da integridade das aplicações e do sistema em um determinado período de tempo. As métricas medem, por exemplo, quanta memória ou capacidade de CPU uma aplicação usa em um período de cinco minutos ou quanta latência uma aplicação experimenta durante um pico de uso.
  • Rastreamentos. Os rastreamentos registram a "jornada" de ponta a ponta de cada solicitação do usuário, desde a interface do usuário ou o aplicativo móvel, passando por toda a arquitetura distribuída e de volta ao usuário.
  • As dependências(também chamadas de mapas de dependências) revelam como cada componente das aplicações depende de outros componentes, aplicações e recursos de TI.

Depois de reunir essa telemetria, a plataforma a correlaciona em tempo real. Esse processo fornece às equipes de DevOps, equipes de engenharia de confiabilidade local (SREs) e equipe de TI informações contextuais completas. As equipes entendem o que, onde e por que de qualquer evento que possa indicar, causar ou ser usado para lidar com um problema de desempenho das aplicações. 

Muitas plataformas de observabilidade descobrem automaticamente novas fontes de telemetria à medida que podem surgir no sistema (como uma nova chamada de API para outra aplicação de software). As plataformas lidam com mais dados do que uma solução de APM padrão. Muitas plataformas incluem recursos de AIOps (inteligência artificial para operações), que separam os sinais, indicações de problemas reais, do ruído (dados não relacionados aos problemas).

 

Benefícios da observabilidade

A observabilidade torna um sistema mais fácil de entender (em geral e em detalhes) e monitorar, mais fácil e seguro de atualizar com novo código e mais fácil de reparar do que um sistema menos observável. Mais especificamente, a observabilidade apoia diretamente os objetivos de Ágil/DevOps/SRE de entregar software de maior qualidade mais rapidamente, permitindo que uma organização:

  • Descubra e lide com "desconhecidos desconhecidos" – problemas que você não sabe que existem. Uma das principais limitações das ferramentas de monitoramento é que elas só observam "desconhecidos conhecidos" – condições excepcionais que você já sabe observar. A observabilidade descobre condições que você talvez nunca saiba ou pense em procurar e, em seguida, rastreia sua relação com problemas de desempenho específicos e fornece o contexto para identificar as causas raiz para acelerar a resolução.
  • Detecte e resolva problemas no início do desenvolvimento. A observabilidade incorpora o monitoramento nas fases iniciais do processo de desenvolvimento de software. As equipes de DevOps podem identificar e corrigir problemas em novo código antes que eles afetem a experiência do cliente ou os SLAs.
  • Dimensione a observabilidade automaticamente. Por exemplo, você pode especificar a instrumentação e a agregação de dados como parte da configuração de um cluster Kubernetes e começar a coletar telemetria a partir do momento em que ele é iniciado até o momento em que é encerrado.
  • Permita a remediação automatizada e a infraestrutura de aplicações com autocorreção. Combine a observabilidade com os recursos de automação e aprendizado de máquina da AIOps para prever problemas com base nas produções do sistema e resolvê-los sem intervenção da administração.
Soluções relacionadas
Observabilidade com o IBM Instana

Conheça a plataforma líder de observabilidade empresarial para nuvens híbridas.

Explore a observabilidade com o Instana
Logs do IBM Cloud

Melhore o desempenho da infraestrutura e das aplicações em qualquer lugar com observabilidade proativa de logs e, ao mesmo tempo, otimize o TCO para sua infraestrutura de observabilidade dentro e fora do IBM Cloud.

Explore o registro em nuvem da próxima geração
IBM Cloud Monitoring

Monitore e solucione problemas de sua infraestrutura, serviços de nuvem e aplicações com o IBM Cloud Monitoring dentro e fora da infraestrutura do IBM Cloud.

Explore o IBM Cloud Monitoring
Automação impulsionada por IA

Descubra como oferecemos cobertura para você com a automação impulsionada por IA, desde seus fluxos de trabalho de negócios até suas operações de TI.

Explore a automação impulsionada por IA
IBM Cloud Pak for Watson AIOps

Descubra como o IBM Cloud Pak for Watson AIOps, uma solução de gerenciamento de operações de TI, permite que os operadores de TI coloquem a IA no centro de sua cadeia de ferramentas de ITOps.

Explore o IBM Cloud Pak for Watson AIOps
IBM® SevOne Network Performance Management

Otimize as operações de TI com insights e ações de observabilidade da rede centrados na aplicação.

Explore o IBM SevOne Network Performance Management
Gerencie os recursos de suas aplicações com o IBM Turbonomic

Aproveite a observabilidade para otimizar proativamente os recursos das aplicações, garantir o desempenho e economizar dinheiro.

Explore o IBM Turbonomic
Recursos Guia corporativo de observabilidade

Explore este guia para iniciantes para entender o que é observabilidade e como você pode começar sua observabilidade empresarial em três etapas simples.

Observabilidade versus monitoramento: qual é a diferença?

Leia como o monitoramento e a observabilidade podem ajudá-lo a identificar a causa subjacente dos problemas: em que eles são semelhantes e diferentes?

O que os desenvolvedores precisam saber sobre observabilidade

Explore o novo mundo com esse ebook. Vamos deixar para trás todos os sentimentos ruins sobre monitoramento e dar os primeiros passos no mundo da observabilidade e sua importância cada vez maior para os desenvolvedores.

Soluções de operações de IA e observabilidade da IBM: como elas se encaixam juntas para resolver incidentes

Explore as três soluções sinérgicas da IBM no domínio da AIOps: IBM Observability by Instana APM, Turbonomic Application Resource Management for IBM Cloud Paks e IBM Cloud Pak for Watson AIOps.

Dê o próximo passo

O IBM Instana fornece observabilidade em tempo real que todos e qualquer um podem usar. Ele proporciona um rápido time to value enquanto verifica se sua estratégia de observabilidade pode acompanhar a complexidade dinâmica dos ambientes atuais e futuros. Do celular ao mainframe, o Instana é compatível com mais de 250 tecnologias e está crescendo. 

Explore o IBM Instana Agende uma demonstração em tempo real