O que é aprendizado supervisionado?

Aprendizagem supervisionada, também conhecida como aprendizado de máquina supervisionado, é uma subcategoria de aprendizado de máquina e inteligência artificial. É definido pelo uso de conjuntos de dados rotulados para treinar algoritmos que classificam dados ou preveem resultados com precisão.

À medida que os dados de entrada são inseridos no modelo, ele ajusta seus pesos até que o modelo tenha sido ajustado adequadamente, o que ocorre como parte do processo de validação cruzada. O aprendizado supervisionado ajuda as organizações a resolver diversos problemas do mundo real em escala, como classificar o spam em uma pasta separada da sua caixa de entrada. Ele pode ser usado para criar modelos de aprendizado de máquina altamente precisos.

Por que a governança da IA é um imperativo empresarial para dimensionar a IA empresarial

Saiba mais sobre as barreiras à adoção de IA, especialmente a falta de soluções de governança de IA e gerenciamento de riscos.

Conteúdo relacionado

Cadastre-se para obter o relatório da IDC

Comece sua jornada para a IA

Saiba como escalar a IA

Explore a AI Academy

Como funciona o aprendizado supervisionado

O aprendizado supervisionado usa um conjunto de treinamento para ensinar os modelos a produzir o resultado desejado. Esse conjunto de dados de treinamento inclui entradas e saídas corretas, o que permite ao modelo aprender com o tempo. O algoritmo mede sua precisão por meio da função de perda, ajustando-se até que o erro tenha sido suficientemente minimizado.

O aprendizado supervisionado pode ser separado em dois tipos de problemas na mineração de dados: classificação e regressão:

A classificação usa um algoritmo para atribuir dados de teste com precisão a categorias específicas. Reconhece entidades específicas dentro do conjunto de dados e tenta tirar algumas conclusões sobre como essas entidades devem ser rotuladas ou definidas. Algoritmos de classificação comuns são: classificadores lineares, máquinas de vetores de suporte (SVM), árvores de decisão, k-mais próximos e floresta aleatória, que são descritos em mais detalhes abaixo.
A regressão é utilizada para entender a relação entre variáveis dependentes e independentes. É geralmente usada para fazer projeções, como receita de vendas de um determinado negócio. Regressão linear, regressão logística e regressão polinomial são algoritmos de regressão populares.

Algoritmos de aprendizado supervisionado

Vários algoritmos e técnicas computacionais são usados em processos supervisionados de aprendizado de máquina. Abaixo estão breves explicações de alguns dos métodos de aprendizagem mais comumente usados, normalmente calculados através do uso de programas como R ou Python:

Redes neurais: utilizadas principalmente para algoritmos de aprendizado profundo, as redes neurais processam dados de treinamento imitando a interconectividade do cérebro humano por meio de camadas de nós. Cada nó é composto de entradas, pesos, um viés (ou limite) e uma saída. Se esse valor de saída exceder um determinado limite, ele “dispara” ou ativa o nó, passando dados para a próxima camada na rede. As redes neurais aprendem essa função de mapeamento por meio de aprendizado supervisionado, ajustando-se com base na função de perda por meio do processo de descida do gradiente. Quando a função de custo está igual ou próxima de zero, podemos confiar na precisão do modelo para obter a resposta correta.
Naive Bayes: Naive Bayes é uma abordagem de classificação que adota o princípio da independência condicional de classe do Teorema de Bayes. Isso significa que a presença de uma característica não afeta a presença de outra na probabilidade de um determinado resultado, e cada preditor tem um efeito igual sobre esse resultado. Existem três tipos de classificadores Naïve Bayes multinomial: Naive Bayes multinomial, Bernoulli Naïve Bayes e Naive Bayes Gaussiano. Essa técnica é usada principalmente em sistemas de classificação de texto, identificação de spam e recomendação.
Regressão linear:a regressão linear é usada para identificar a relação entre uma variável dependente e uma ou mais variáveis independentes e normalmente é aproveitada para fazer previsões sobre resultados futuros. Quando há apenas uma variável independente e uma variável dependente, ela é conhecida como regressão linear simples. À medida que o número de variáveis independentes aumenta, ela é chamada de regressão linear múltipla. Para cada tipo de regressão linear, procura traçar uma linha de melhor ajuste, que é calculada através do método dos mínimos quadrados. No entanto, ao contrário de outros modelos de regressão, essa linha é reta quando plotada em um gráfico.
Regressão logística: enquanto a regressão linear é utilizada quando variáveis dependentes são contínuas, a regressão logística é selecionada quando a variável dependente é categórica, o que significa que elas têm saídas binárias, como "verdadeiro" e "falso" ou "sim" e "não". Enquanto ambos os modelos de regressão procuram entender as relações entre entradas de dados, a regressão logística é usada principalmente para resolver problemas de classificação binária, como identificação de spam.
Máquinas de vetor de suporte (SVM): Uma máquina de vetor de suporte é um modelo popular de aprendizado supervisionado desenvolvido por Vladimir Vapnik, usado para classificação de dados e regressão. Dito isso, ele é normalmente aproveitado para problemas de classificação, construindo um hiperplano onde a distância entre duas classes de pontos de dados é máxima. Esse hiperplano é conhecido como limite de decisão, separando as classes de pontos de dados (por exemplo, laranjas versus maçãs) em ambos os lados do plano.
K-nearest neighbor: O K-nearest neighbor, também conhecido como algoritmo KNN, é um algoritmo não paramétrico que classifica os pontos de dados com base em sua proximidade e associação com outros dados disponíveis. Esse algoritmo pressupõe que pontos de dados semelhantes podem ser encontrados próximos uns dos outros. Consequentemente, procura calcular a distância entre os pontos de dados, geralmente por meio da distância euclidiana, e depois atribui uma categoria com base na categoria mais frequente ou média. Sua facilidade de uso e o baixo tempo de cálculo fazem dele o algoritmo preferido dos cientistas de dados, mas, à medida que o conjunto de dados de teste cresce, o tempo de processamento aumenta, tornando-o menos atraente para tarefas de classificação. O KNN é normalmente usado em mecanismos de recomendação e reconhecimento de imagens.
Random forest: Random forest é outro algoritmo flexível de aprendizado de máquina supervisionado usado para fins de classificação e regressão. A “floresta” faz referência a uma coleção de árvores de decisão não correlacionadas, que são então mescladas para reduzir a variação e criar previsões de dados mais precisas.

Aprendizagem não supervisionada vs. supervisionada vs. semi-supervisionada

O aprendizado de máquina não supervisionado e o aprendizado de máquina supervisionado são frequentemente discutidos juntos. Diferentemente do aprendizado supervisionado, o aprendizado não supervisionado usa dados não rotulados. A partir desses dados, ele descobre padrões que ajudam a resolver problemas de agrupamento ou associação. Isso é particularmente útil quando os especialistas em um assunto não têm certeza das propriedades comuns em um conjunto de dados. Algoritmos comuns de agrupamento são modelos hierárquicos, k-means e de mistura gaussiana.

A aprendizagem semi-supervisionada ocorre quando apenas parte dos dados de entrada fornecidos foi rotulada. A aprendizagem não supervisionada e semi-supervisionada pode ser uma alternativa mais atraente, pois pode ser demorado e dispendioso confiar na experiência do domínio para rotular os dados adequadamente para a aprendizagem supervisionada.

Para se aprofundar nas diferenças entre essas abordagens, confira "Aprendizado supervisionado versus não supervisionado: qual é a diferença?"

exemplos de aprendizado supervisionado

Modelos de aprendizado supervisionado podem ser usados para construir e avançar uma série de aplicações de negócios, incluindo o seguinte:

Reconhecimento de imagens e objetos: algoritmos de aprendizado supervisionado podem ser usados para localizar, isolar e categorizar objetos de vídeos ou imagens, tornando-os úteis quando aplicados a várias técnicas de visão computacional e análise de imagens.
Análise preditiva: um caso de uso generalizado para modelos de aprendizagem supervisionada é a criação de sistemas de análise preditiva para fornecer insights profundos sobre vários pontos de dados de negócios. Isto permite que as empresas antecipem determinados resultados com base numa determinada variável de produção, ajudando os líderes empresariais a justificar decisões ou a dinamizar em benefício da organização.
Análise do sentimento do cliente: usando algoritmos de aprendizado de máquina supervisionados, as organizações podem extrair e classificar informações importantes de grandes volumes de dados, incluindo contexto, emoção e intenção, com muito pouca intervenção humana. Isso pode ser extremamente útil para entender melhor as interações com os clientes e pode ser usado para melhorar os esforços de engajamento da marca.
Detecção de spam: a detecção de spam é outro exemplo de um modelo de aprendizado supervisionado. Usando algoritmos de classificação supervisionada, as organizações podem treinar bancos de dados para reconhecer padrões ou anomalias em novos dados para organizar correspondências relacionadas a spam e não relacionadas a spam de forma eficaz.

Desafios do aprendizado supervisionado

Embora o aprendizado supervisionado possa oferecer vantagens às empresas, como insights profundos de dados e automação aprimorada, existem alguns desafios ao criar modelos sustentáveis de aprendizado supervisionado. A seguir estão alguns desses desafios:

Os modelos de aprendizagem supervisionada podem exigir certos níveis de especialização para serem estruturados com precisão.
Os modelos de aprendizagem supervisionada de treinamento podem ser muito demorados.
Os conjuntos de dados podem ter uma probabilidade maior de erro humano, resultando em um aprendizado incorreto dos algoritmos.
Ao contrário dos modelos de aprendizagem não supervisionada, a aprendizagem supervisionada não pode agrupar ou classificar dados por si só.

Soluções relacionadas

IBM Watson Studio

Crie e escale a IA confiável em qualquer nuvem. Automatize o ciclo de vida da IA para ModelOps.

Explore o IBM Watson Studio

IBM Cloud Pak for Data

Conecte os dados certos, no momento certo, às pessoas certas em qualquer lugar.

Conheça o Cloud Pak for Data

Soluções IBM Cloud

Híbrida. Aberta. Resiliente. Sua plataforma e seu parceiro para a sua transformação digital.

Explore soluções em nuvem

Recursos

Descubra o Granite LLM da IBM

Granite é a série principal de modelos de base LLM da IBM, baseada em arquitetura de transformação apenas de decodificador. Os modelos de linguagem Granite são treinados com dados empresariais confiáveis que abrangem as áreas de internet, acadêmica, código, jurídica e financeira.

Aprendizagem prática e sem custo para tecnologias de IA generativa

Conheça os conceitos fundamentais de IA e IA generativa, incluindo engenharia de prompts, grandes modelos de linguagem e os melhores projetos em código aberto.

Aprendizado supervisionado versus não supervisionado: qual é a diferença?

Neste artigo, exploraremos os fundamentos de duas abordagens de ciência de dados: supervisionada e não supervisionada.

Modelos de aprendizado supervisionado

Explore algumas abordagens de aprendizado supervisionado, como máquinas de vetores de suporte e classificadores probabilísticos

Dê o próximo passo

Treine, valide, ajuste e implemente IA generativa, modelos fundacionais e recursos de machine learning com o IBM watsonx.ai, um estúdio empresarial de última geração para desenvolvedores de IA. Crie aplicações de IA em uma fração do tempo e com muito menos dados.

Explore o watsonx.ai

Agende uma demonstração em tempo real