O que é um desvio do modelo?

Publicado: 18 de janeiro de 2024
Colaborador: Jim Holdsworth

O desvio do modelo refere-se à degradação do desempenho do modelo devido a mudanças nos dados ou nas relações entre variáveis de input e produção. O desvio do modelo — também conhecido como decadência do modelo — pode impactar negativamente o desempenho do modelo, resultando em tomadas de decisão falhas e previsões erradas.

Para detectar e mitigar o desvio, organizações podem monitorar e gerenciar o desempenho em seus dados e plataforma de inteligência artificial. O desempenho do modelo pode começar bem, mas se não for devidamente monitorado ao longo do tempo, até mesmo o modelo de IA mais bem treinado e imparcial pode "desviar" de seus parâmetros originais e produzir resultados indesejados após ser implementado.

Se o treinamento de um modelo de IA não estiver alinhado com os dados recebidos, ele não poderá interpretar esses dados com precisão nem usar esses dados ao vivo para fazer previsões confiáveis. Se o desvio não for detectado e mitigado rapidamente, ele pode se agravar, aumentando o dano às operações.

Modelos criados usando dados históricos podem rapidamente se tornar obsoletos. Em muitos casos, novos pontos de dados estão sempre chegando — novas variações, novos padrões, novas tendências — que os antigos dados históricos não conseguem capturar.

Por que a governança da IA é um imperativo empresarial para dimensionar a IA empresarial

Saiba mais sobre as barreiras à adoção de IA, especialmente a falta de soluções de governança de IA e gerenciamento de riscos.

Conteúdo relacionado

Cadastre-se para receber o guia sobre modelos de base

Causas do desvio do modelo

O mundo está constantemente mudando, portanto, com dados que mudam constantemente, os modelos usados para entender o mundo devem ser constantemente revisados e atualizados. Aqui estão três tipos de desvio do modelo que precisam ser abordados, cada um com uma causa diferente.

Desvio do conceito

O primeiro é o desvio de conceito, que ocorre quando há uma mudança entre as variáveis de input e a variável alvo, momento em que o algoritmo começa a fornecer respostas incorretas porque as definições já não são válidas. A mudança nas variáveis independentes pode ocorrer em uma variedade de períodos de tempo, que incluem:

Sazonal

O desvio de conceito ocorre e recua regularmente, como por exemplo, a sazonalidade do comportamento de compra em resposta a mudanças climáticas. Em climas frios, as vendas de pás de neve e sopradores de neve normalmente aumentam no final do outono e início do inverno. Também devem ser feitos ajustes geográficos para a previsão de nevascas.

Súbito

Um desenvolvimento inesperado pode gerar novos padrões de compra. Um exemplo seria a publicidade repentina em torno do ChatGPT, criando aumento da demanda por hardware e software de IA, e um impulso ao valor das ações de empresas relacionadas à IA. Um modelo de previsão treinado antes dessas notícias serem publicadas não poderia prever os resultados subsequentes. Outro exemplo é a chegada da pandemia de -19, que também criou uma mudança súbita no comportamento: as vendas de jogos e equipamentos de exercício dispararam, enquanto restaurantes e hotéis estavam recebendo muito menos visitantes.

Gradual

Alguns desvios acontecem gradualmente, ou em um ritmo esperado. Por exemplo, spammers e hackers têm utilizado uma variedade de ferramentas e truques ao longo dos anos. Conforme os softwares de proteção e filtros de spam melhoram, os agentes mal-intencionados ajustam suas estratégias adequadamente. Qualquer IA projetada para fornecer proteção para interações digitais precisa acompanhar o ritmo; um modelo estático logo se tornará inútil.

Desvio de dados

O segundo é o desvio de dados, onde a distribuição de dados subjacente dos dados de input mudou. No varejo, as vendas de um produto podem ser impactadas pela introdução de outro novo produto ou pela retirada de um produto concorrente. Ou, se um site é inicialmente adotado por jovens, mas depois ganha aceitação de pessoas mais velhas, o modelo original baseado nos padrões de uso dos usuários mais jovens pode não ter o mesmo desempenho com a base de usuários mais velha.

Mudança de dados upstream

O terceiro é uma alteração de dados upstream, que ocorre quando há uma alteração na cadeia de dados. Por exemplo, os dados upstream podem ser alterados para uma moeda diferente, como USD em vez de Euros, ou medidas em milhas em vez de quilômetros, ou temperaturas em Fahrenheit em vez de Celsius. Tal mudança desestabilizaria um modelo que não foi construído para contabilizar a mudança na forma como os dados foram rotulados.

Melhores práticas para evitar o desvio do modelo

Para que as organizações detectem e ajudem a corrigir o desvio do modelo, elas devem considerar o seguinte:

Automatizar a detecção de desvio

A precisão de um modelo de IA pode degradar-se dentro de dias após a implementação porque os dados de produção divergem dos dados de treinamento do modelo. Isso pode levar a previsões incorretas e exposição significativa a riscos. As organizações devem usar um programa de IA e ferramentas de monitoramento que detectem automaticamente quando a precisão de um modelo diminui (ou desvia) abaixo de um limiar predefinido. Esse programa para detecção de desvio do modelo também deve rastrear quais transações causaram o desvio, permitindo que sejam etiquetadas novamente e usadas para retreinar o modelo, restaurando seu poder preditivo durante o tempo de execução.

Há duas maneiras de medir o desvio: A primeira é estatística, que usa métricas estatísticas. Isso é frequentemente mais fácil de implementar porque a maioria das métricas já está em uso dentro da empresa. A segunda é baseada em modelo. Isso mede a semelhança entre um ponto ou grupos de pontos e a linha de base de referência.

Automatizar testes de modelo

As organizações devem testar seus modelos de IA periodicamente ao longo de seu ciclo de vida. Este teste idealmente inclui:

Validação de modelos em pré-produção com testes para detectar viés e desvio, e então gerar relatórios de teste.
Transferir as configurações de teste de pré-implementação bem-sucedidas para a versão implementada do modelo e continuar com testes automatizados.
Sincronizar informações de modelo, dados e resultados de testes com sistemas de registro.
Automação que pode fornecer notificações consistentes e confiáveis e proporcionar mais tempo para as equipes se concentrarem no desenvolvimento de modelos em vez de monitoramento de modelos.

Gerenciar em um ambiente unificado

De acordo com o estudo "Total Economic Impact", da Forrester, “Ao criar, executar e gerenciar modelos em um ambiente unificado de dados e IA, [as organizações] podem garantir que os modelos de IA permaneçam justos, explicáveis e compatíveis em qualquer lugar. Essa abordagem de ponta a ponta em IA também capacita de forma única uma organização para detectar e ajudar a corrigir desvios e viés de modelos, e gerenciar o risco do modelo quando um modelo de IA está em produção.”

Uma boa prática é gerenciar todos os modelos a partir de um dashboard central. Uma abordagem integrada pode ajudar uma organização a rastrear métricas continuamente e alertar equipes sobre desvios na precisão e consistência dos dados através do desenvolvimento, validação e implementação. Uma visão centralizada e abrangente pode ajudar as organizações a quebrar silos e fornecer mais transparência em toda a linhagem de dados.

Monitorar continuamente

Detectar cenários de desvio e magnitude por meio de um modelo de IA que compara dados de produção e treinamento e previsões de modelos em tempo real. Dessa forma, o desvio pode ser encontrado rapidamente e o retrabalho iniciado imediatamente. Essa detecção é iterativa, assim como as operações de aprendizado de máquina (MLOps).

Analise a causa raiz

A análise baseada em tempo é útil para ver como o desvio evoluiu e quando ocorreu. Por exemplo, se as verificações são realizadas semanalmente, isso mostrará como o desvio evoluiu a cada dia. Analisar cronogramas também pode ser útil para determinar se o desvio foi gradual ou súbito.

Retreinar modelos

Use um novo conjunto de dados de treinamento que tenha amostras mais recentes e relevantes adicionadas a ele. O objetivo é colocar seus grandes modelos de linguagem (LLM) de volta em produção de forma rápida e correta. Se treinar novamente o modelo não resolver o problema, talvez seja necessário um novo modelo.

Atualizar modelos de ML em tempo real

Em vez de treinar um modelo com dados em lote, as organizações podem praticar "aprendizado on-line" ao ter seus modelos de aprendizado de máquina (ML) atualizados usando os dados do mundo real mais recentes assim que estiverem disponíveis.

Verificar os dados de input

Pode parecer que um modelo está desviando porque os dados usados para treiná-lo são significativamente diferentes dos dados de produção reais que serão usados. Em um caso de uso médico, se varreduras de alta resolução são usadas no treinamento, mas apenas varreduras de baixa resolução estão disponíveis no campo, então os resultados serão incorretos.

Soluções relacionadas

IBM watsonx.governance

Acelere os fluxos de trabalho de IA responsáveis, transparentes e explicáveis tanto em modelos de IA generativa quanto de aprendizado de máquina.

Explore o watsonx.governance

IBM Watson Studio

Monitore o desempenho do modelo. Receba alertas quando ocorrerem desvios na precisão do modelo e na consistência dos dados.

Conheça o IBM Watson Studio

Recursos

Leve sua organização ao próximo nível com dados confiáveis

Obtenha vantagem competitiva com estratégias de governança de dados.

Qual é a sua estratégia de dados?

Libere insights de CDOs e líderes de ciência de dados para construir uma estratégia de dados confiável que acelere o crescimento da receita.

Três passos para a qualidade de dados e desempenho de IA

Libere perspectivas de especialistas sobre como sua organização pode melhorar a qualidade dos dados, o desempenho da IA e a confiança.

Dê o próximo passo

Acelere fluxos de trabalho de IA responsáveis, transparentes e explicáveis em todo o ciclo de vida de modelos generativos e de aprendizado de máquina. Direcione, gerencie e monitore as atividades de IA da sua organização para gerenciar melhor as crescentes regulamentações de IA e detectar e mitigar riscos.

Explore o watsonx.governance

Agende uma demonstração em tempo real