Início

Think

Tópicos

Análise de dados aumentada

O que é análise de dados aumentada?
Explore a solução de análise de dados aumentada da IBM Inscreva-se para receber atualizações sobre IA
Colagem de pictogramas com nuvens, gráfico de pizza e outros gráficos

Publicado em: 27 de agosto de 2024
Colaboradores: Dave Bergmann, Cole Stryker

O que é análise de dados aumentada?

A análise de dados aumentada é a integração do processamento de linguagem natural (NLP) e outros recursos de aprendizado de máquina em plataformas de análise de dados. As ferramentas de análise de dados aumentada também usam inteligência artificial (IA) para automatizar e otimizar a análise de dados por meio de fluxos de trabalho intuitivos e fáceis de usar.

A análise de dados aumentada ajuda a democratizar a tomada de decisões baseada em dados por meio da automação ou simplificação de processos, incluindo preparação de dados, seleção de modelos, geração de insights e visualização de dados. Com os recursos de análise de dados aumentada, as tarefas que antes exigiam o conhecimento técnico dos cientistas de dados podem ser executadas por analistas e usuários corporativos.  

A IA generativa acelerou a proliferação de plataformas de análise de dados aumentada e ferramentas de autoatendimento. A crescente disponibilidade de grandes modelos de linguagem (LLMs) sofisticados facilita as consultas de linguagem natural e a geração de linguagem natural (NLG), permitindo que os usuários consultem dados e interpretem resultados sem conhecimento técnico ou linguagens de programação especializadas.

Além disso, os algoritmos de aprendizado de máquina podem otimizar continuamente a funcionalidade principal das ferramentas de análise de dados aumentada para atender melhor às necessidades de usuários ou casos de uso específicos. Por exemplo, uma plataforma de business intelligence (BI) pode identificar padrões nas consultas dos usuários ao longo do tempo e, em seguida, exibir automaticamente insights praticáveis relevantes para esses padrões em tempo real em um dashboard de geração de relatórios.

Ao reduzir as barreiras técnicas para obter insights significativos a partir de dados complexos, a análise de dados aumentada amplia o acesso ao processo de análise. Ao fazê-lo, as soluções de análise de dados aumentada podem melhorar a alfabetização de dados em toda a empresa e garantir que as principais decisões de negócios em toda a organização sejam baseadas em uma análise de dados criteriosa.

Inscreva-se no boletim informativo Think
Elementos-chave da análise de dados aumentada

Como o termo sugere, as soluções de análise de dados aumentada são projetadas para aumentar todas as etapas do processo de análise de dados, desde a preparação de dados até a geração de insights e o fornecimento de relatórios claros e fáceis de interpretar. Uma plataforma robusta de análise de dados de autoatendimento permite que qualquer usuário obtenha insights mais profundos com menos esforço ou conhecimento técnico.

Os principais recursos de uma solução ideal de análise de dados aumentada incluem:

  • Gerenciamento automatizado de dados
  • Interações em linguagem natural
  • Visualização de dados
  • Insights automatizados e análise estatística

Gerenciamento automatizado de dados


Entre os benefícios mais óbvios da análise de dados aumentada está a oportunidade de reduzir o tédio e economizar tempo. Com o aumento da quantidade de dados introduzido pela era do big data, houve um aumento concomitante na quantidade de mão de obra necessária para preparar esses dados para análise e consolidar insights de fontes de dados díspares.
 

Preparação de dados

Para serem processados por algoritmos de aprendizado de máquina, os dados devem ser coletados de várias fontes, organizados e agregados e, em seguida, formatados de forma limpa e consistente. Ao lidar com conjuntos de dados tabulares, por exemplo, os campos de dados devem ser ordenados de forma consistente para ajudar a garantir que as respectivas funcionalidades das incorporações vetoriais de cada ponto de dados correspondam às de outros pontos de dados. Quando feito manualmente, esse pode ser um processo muito tedioso e trabalhoso.

Plataformas de BI modernas aprimoradas por IA podem usar aprendizado de máquina para automatizar muitas tarefas de limpeza de dados por meio de:

  • Detecção automática de atributos de dados relevantes. Por exemplo, um algoritmo pode detectar a presença de informações geográficas (como um código postal ou coordenadas de latitude e longitude) ou informações de contato (como um endereço de e-mail ou número de telefone). Essas funcionalidades de dados podem, então, ser colocadas em um esquema de formatação unificado.

  • Garanta da qualidade de dados e preservação da privacidade. Algoritmos podem ser treinados para ponderar, minimizar ou desconsiderar entradas de diferentes fontes de dados de acordo com a política de governança de dados de uma organização. Uma plataforma de análise de dados aumentada pode reforçar ainda mais as práticas de governança de dados, por exemplo, eliminando automaticamente pontos de dados de informações de identificação pessoal (PII). Isso é particularmente útil em áreas como a da saúde, nas quais o uso dessas informações é fortemente regulamentado.

  • Leitura e extração de informações de um PDF ou de fontes de rich text. Esse processo também pode envolver a remoção ou substituição de valores nulos ou caracteres especiais, como sinais de pontuação ou símbolos não padrão, para converter o texto em um formato legível por máquina.

  • Indexação e agrupamento de informações relacionadas. Por exemplo, um algoritmo pode reconhecer a presença de pontos de dados paralelos em diferentes fontes e sugerir agregação ou detectar pontos de dados redundantes e combiná-los automaticamente em uma única entrada. Além disso, uma plataforma de análise de dados aumentada pode integrar um modelo capaz de produzir incorporações vetoriais eficazes para cada documento, para permitir pesquisa vetorial eficiente e geração aumentada de recuperação.

 

Descoberta de dados

Embora o trabalho tipicamente associado a analistas de dados geralmente envolva consultas proativas de dados para informar decisões específicas ou testar hipóteses específicas, grande parte do valor oferecido pela ciência de dados robusta vem de explorar dados em geral em busca de conexões e insights não vistos ou inesperados.  

Uma ferramenta de análise de dados aumentada pode, por exemplo, recomendar automaticamente associações entre diferentes fontes de dados que um usuário poderia ter ignorado ou revelar valores discrepantes ou tendências anômalas para análise posterior. A aplicação de aprendizado não supervisionado, como modelos de associação ou agrupamento, pode reconhecer padrões e correlações inerentes que podem informar insights praticáveis.

Interações em linguagem natural


Uma das barreiras mais importantes para a entrada de usuários não técnicos interessados em análise de dados é a profundidade do conhecimento técnico especializado necessário para a análise de dados tradicional. Para muitas pessoas, aprender a programar ou usar linguagem de consulta estruturada (SQL) é proibitivamente difícil ou demorado. Isso inclui aprender as técnicas estatísticas, a nomenclatura e as melhores práticas necessárias para interpretar e validar os resultados de forma eficaz.

A combinação da análise de dados com o processamento de linguagem natural (PLN) talvez seja a maneira mais impactante e intuitiva pela qual a análise de dados ampliada expande o acesso a insights baseados em dados. Os usuários podem consultar dados usando linguagem simples e comum — “quais produtos têm as maiores taxas de devolução nos 30 dias seguintes à temporada de festas?” — e receber respostas em uma linguagem igualmente direta.

No back-end, um LLM deve interpretar essa consulta de linguagem natural, traduzi-la em uma solicitação estruturada e fazer suposições para preencher as informações ausentes com base em sua compreensão do contexto da pergunta do usuário. Um ou mais modelos devem ser selecionados para processar a solicitação. O modelo deve desenhar a(s) fonte(s) de dados mais pertinente(s) ao assunto. Finalmente, o LLM deve interpretar os resultados matemáticos e articulá-los de forma a centralizar os detalhes relevantes. 

Mas, da perspectiva do usuário, ele está simplesmente fazendo uma pergunta e recebendo uma resposta.

Visualização de dados



As melhores soluções de análise de dados aumentada podem não apenas oferecer recursos robustos de visualização de dados, mas também incorporar visualizações de dados na produção automatizada de relatórios, para facilitar o compartilhamento de informações e a tomada de decisões colaborativa.

Embora a linguagem natural seja muitas vezes uma maneira muito útil de articular informações, a visualização costuma ser a maneira mais intuitiva de fazer comparações e destacar padrões. Gráficos, tabelas, diagramas, plantas, mapas de calor e outros tipos de visualização de dados podem ser uma maneira útil de explorar dados e fazer conexões que talvez não se pense em incorporar explicitamente em uma consulta.

Historicamente, receber uma solicitação de linguagem natural como input e retornar uma visualização de dados sofisticada como produção exigiria a coreografia sofisticada de vários modelos operando de forma semelhante a uma linha de montagem. Mas a evolução contínua de LLMs anteriormente somente de texto para modelos de IA multimodais, que podem operar perfeitamente em diferentes modalidades de dados, otimizou ainda mais a versatilidade das plataformas de análise de dados aumentada.

Isso permite uma abordagem dinâmica à análise de dados, na qual até mesmo usuários não técnicos podem explorar abertamente conexões e hipóteses, com resultados, recomendações e insights notáveis disponibilizados prontamente em dashboards interativos fáceis de usar.

Insights automatizados e análise estatística



Embora o PLN roube os holofotes, os resultados recentes da pesquisa Magic Quadrant da Gartner indicam que o recurso mais procurado para plataformas de análise de dados e business intelligence (ABI) não é a consulta de linguagem natural, mas os insights automatizados. Em outras palavras, os usuários corporativos estão mais preocupados com os resultados do que com o processo de obtenção desses resultados.1

As melhores soluções de análise de dados aumentada aliviam o fardo de decidir exatamente como questionar seus dados para obter insights, liberando os usuários corporativos para se concentrarem em como agir com base nesses insights. Além dos recursos de NLP no nível superficial, um LLM pode atuar como um mecanismo de tomada de decisões em tempo real. Isso capacita uma plataforma moderna de análise de dados aumentada a adaptar a análise ao contexto específico da solicitação de um usuário de uma maneira muito mais dinâmica do que seria possível com regras IF-THEN simples. 

Por exemplo, o software de análise de dados aumentada pode inferir, a partir da natureza de uma solicitação, que tipo de dados serão examinados e que tipo de análise é desejada e, em seguida, sugerir de forma inteligente esquemas ideais de visualização de dados. As soluções de análise de dados aumentada também podem executar análises em vários modelos de forecasting e destacar as previsões do modelo que oferecem a maior certeza. Assim, as plataformas podem oferecer insights sobre o processo de previsão, em vez de simplesmente emitir previsões.

Os insights automatizados também capacitam a análise proativa de dados, destacando valores discrepantes e tendências emergentes à medida que surgem, em vez de esperar que a consulta certa os traga à tona. Por exemplo, ferramentas de análise de dados automática podem identificar uma queda inesperada nas métricas de engajamento do cliente, alertando os usuários corporativos sobre alguma falha da experiência do cliente, para que ela possa ser compreendida e abordada.

.

Análise de dados preditiva e análise de dados prescritiva

Uma plataforma de análise de dados ideal deve ser capaz de fornecer múltiplas lentes de análise de dados para entender o passado e tomar decisões informadas sobre o futuro. Existem quatro subconjuntos principais de insights analíticos, todos essenciais para o processo de tomada de decisões.

  • A análise de dados descritiva se preocupa com a análise objetiva: o que aconteceu ou o que está acontecendo? Por exemplo, no contexto das cadeias de suprimentos, a análise de dados descritiva pode explorar onde o dinheiro está sendo gasto ou onde há escassez de inventário.

  • A análise de dados diagnóstica visa entender o passado: por que as coisas aconteceram. Por exemplo, a análise do comportamento anterior do cliente pode ser usada para explicar por que uma iniciativa de marketing em andamento está aquém das expectativas.

  • A análise de dados preditiva visa prever o futuro: a probabilidade de que algo aconteça ou os resultados esperados para o possível curso de ação. A análise de dados preditiva normalmente representa a base de uma operação de business intelligence, fundamentando as decisões em uma compreensão mais profunda de suas prováveis consequências.

  • A análise de dados prescritiva visa prever ações ideais: o que deve acontecer ou como maximizar a probabilidade de um resultado desejado. A disciplina da modelagem prescritiva alimenta sistemas como mecanismos de recomendação, combinando análise preditiva de dados com forte lógica de tomada de decisões para identificar o caminho ideal a seguir.

Desafios e limitações da análise de dados aumentada

Embora as plataformas de análise de dados aumentada ofereçam uma ampla gama de benefícios importantes, elas não são uma panaceia autossuficiente para todos os problemas de negócios. A análise de dados aumentada deve ser vista como uma ferramenta poderosa que produz os melhores resultados quando usada por funcionários com alfabetização adequada e implementada juntamente com práticas sólidas de governança de dados.

  • Alfabetização de dados: embora a análise de dados aumentada reduza significativamente o trabalho braçal necessário para gerar insights praticáveis a partir dos dados, esses insights só são úteis nas mãos dos funcionários cujos departamentos priorizaram a alfabetização de dados. Por exemplo, uma plataforma pode descobrir e revelar uma correlação notável, mas somente um usuário informado pode exercer o julgamento necessário para desvendar a diferença entre correlação e causalidade.

  • Governança de dados: a qualidade dos insights e recomendações impulsionados por IA depende diretamente da qualidade e confiabilidade dos conjuntos de dados que sustentam essa análise. Para estabelecer confiança em toda a organização na análise prescritiva, as organizações devem investir em governança de dados robusta. Uma governança de dados forte permite qualidade de dados consistente, impõe a conformidade regulatória, consolida fontes de dados de forma limpa e monitora desvios de modelos e outras armadilhas do aprendizado de máquina.

Soluções da IBM relacionadas
  IBM watsonx BI Assistant

O IBM watsonx BI Assistant responde às suas perguntas de negócios em segundos, guiando-o para as decisões mais impactantes. Entenda o que aconteceu e o motivo, o que pode acontecer e o que você pode fazer a respeito. Com explicações claras e passo a passo de seu raciocínio, o watsonx BI Assistant capacita cada usuário corporativo.

Explore o IBM watsonx BI Assistant

IBM Cognos Analytics

Libere todo o potencial dos seus dados com automação e insights impulsionados por IA. O assistente de IA em linguagem natural está sempre disponível – basta descrever os dados necessários e deixe o Cognos Analytics construir visualizações de dados impressionantes para você.

Explore o IBM Cognos Analytics

IBM Planning Analytics

Preveja resultados com previsões flexíveis e integradas por IA. Analise cenários hipotéticos em grande escala e com detalhes finos em tempo real. Implemente conforme a necessidade — no local ou na nuvem, incluindo como serviço na AWS. Automatize e unifique o planejamento integrado de negócios em toda a sua organização e transforme previsões orientadas por IA em ações.

Conheça o IBM Planning Analytics
Recursos O que é análise de dados prescritiva?

Saiba mais sobre a análises de dados prescritiva: a prática de analisar dados para identificar padrões, fazer previsões e determinar os cursos de ação ideais.

O que é forecasting?

A forecasting de negócios visa estimar a demanda, projetar vendas ou estimar crescimento e expansão. Pode facilitar a alocação de orçamentos, capital, recursos humanos e muito mais. Aprenda como a forecasting ajuda a informar o processo de tomada de decisões.

O que é análise de dados avançada?

Explore a análise de dados avançada: uma coleção de técnicas e ferramentas sofisticadas utilizadas para analisar grandes volumes de dados, descobrir padrões ocultos e fornecer insights praticáveis.

Dê o próximo passo

Crie uma estratégia de IA para sua empresa em uma plataforma colaborativa de IA e dados, o IBM watsonx. Treine, valide, ajuste e implemente modelos de IA para ajudar você a escalar e acelerar o impacto da IA com dados confiáveis em toda a sua empresa.

Explore o watsonx Agende uma demonstração em tempo real
Notas de rodapé

Observação: todos os links são externos a ibm.com.

1 "Predicts 2024: How Artificial Intelligence Will Impact Analytics Users," (link externo a ibm.com) Gartner, 4 de janeiro de 2024.