¿Qué es el aprendizaje supervisado?

El aprendizaje supervisado, también conocido como machine learning supervisado, es una subcategoría del machine learning y la inteligencia artificial. Se define por el uso de conjuntos de datos etiquetados para entrenar algoritmos que clasifican los datos o predicen los resultados con precisión.

A medida que se introducen datos en el modelo, éste ajusta sus ponderaciones hasta que el modelo se ha ajustado adecuadamente, lo que ocurre como parte del proceso de validación cruzada. El aprendizaje supervisado ayuda a las organizaciones a resolver una variedad de problemas del mundo real a escala, como clasificar el spam en una carpeta separada de su bandeja de entrada. Se puede utilizar para crear modelos de machine learning de alta precisión.

Por qué la gobernanza de IA es un imperativo empresarial para escalar la IA empresarial

Conozca los obstáculos para la adopción de la IA, en particular la falta de soluciones de gestión de riesgos y gobernanza de la IA.

Contenido relacionado

Regístrese para leer el informe de IDC

Comience su viaje hacia la IA

Aprenda a escalar la IA

Explore la AI Academy

Cómo funciona el aprendizaje supervisado

El aprendizaje supervisado utiliza un conjunto de entrenamiento para enseñar a los modelos a producir el resultado deseado. Este conjunto de datos de entrenamiento incluye entradas y salidas correctas, que permiten al modelo aprender con el tiempo. El algoritmo mide su precisión a través de la función de pérdida, ajustando hasta que el error se haya minimizado lo suficiente.

El aprendizaje supervisado puede dividirse en dos tipos de problemas a la hora de extraer datos: clasificación y regresión:

La clasificación utiliza un algoritmo para asignar con precisión los datos de prueba en categorías específicas. Reconoce entidades específicas dentro del conjunto de datos e intenta sacar algunas conclusiones sobre cómo deben etiquetarse o definirse esas entidades. Los algoritmos de clasificación más comunes son los clasificadores lineales, las máquinas de vectores de soporte (SVM), los árboles de decisión, k vecinos más cercanos y random forest, que se describen con más detalle a continuación.
La regresión se usa para entender la relación entre variables dependientes e independientes. Se utiliza habitualmente para hacer proyecciones, como los ingresos por ventas de una empresa determinada. La regresión lineal, la regresión logística y la regresión polininómica son algoritmos de regresión populares.

Algoritmos de aprendizaje supervisado

En los procesos de machine learning supervisado se utilizan diversos algoritmos y técnicas de cálculo. A continuación se presentan breves explicaciones de algunos de los métodos de aprendizaje más utilizados, generalmente calculados mediante el uso de programas como R o Python:

Redes neuronales: principalmente aprovechadas para algoritmos de deep learning, las redes neuronales procesan los datos de entrenamiento de entrada al imitar la interconectividad del cerebro humano a través de capas de nodos. Cada nodo se compone de entradas, ponderaciones, un sesgo (umbral) y una salida. Si ese valor de salida supera un umbral determinado, se "dispara" o activa el nodo, pasando los datos a la siguiente capa de la red. Las redes neuronales aprenden a partir de ajustes basados en la función de pérdida mediante el proceso de descenso gradiente. Cuando la función de costes es igual o cercana a cero, puede confiar en la precisión del modelo.
Naive bayes: Naive Bayes es un enfoque de clasificación que adopta el principio de independencia condicional de clases del Teorema de Bayes. Esto significa que la presencia de una característica no influye en la presencia de otra en la probabilidad de un resultado dado, y cada predictor tiene un efecto igual en ese resultado. Existen tres tipos de clasificadores Naïve Bayes: Naïve Bayes multinomial, Naïve Bayes Bernoulli y Naïve Bayes gaussiano. Esta técnica se utiliza principalmente en la clasificación de textos, la identificación de spam y los sistemas de recomendación.
Regresión lineal: la regresión lineal se utiliza para identificar la relación entre una variable dependiente y una o más variables independientes, y suele aprovecharse para hacer predicciones sobre resultados futuros. Cuando sólo hay una variable independiente y una variable dependiente, se conoce como regresión lineal simple. A medida que aumenta el número de variables independientes, se denomina regresión lineal múltiple. Para cada tipo de regresión lineal, se busca trazar una línea de mejor ajuste, que se calcula mediante el método de los mínimos cuadrados. Sin embargo, a diferencia de otros modelos de regresión, esta línea es recta cuando se representa en un gráfico.
Regresión logística: mientras que la regresión lineal se utiliza cuando las variables dependientes son continuas, la regresión logística se selecciona cuando la variable dependiente es categórica, lo que significa que tienen salidas binarias, como "verdadero" y "falso" o "sí" y "no". Aunque ambos modelos de regresión buscan comprender las relaciones entre las entradas de datos, la regresión logística se utiliza principalmente para resolver problemas de clasificación binaria, como la identificación de spam.
Máquinas de vectores de soporte (SVM): una máquina de vectores de soporte es un modelo de aprendizaje supervisado popular desarrollado por Vladimir Vapnik, utilizado tanto para la clasificación de datos como para la regresión. Dicho esto, normalmente se aprovecha para problemas de clasificación, construyendo un hiperplano donde la distancia entre dos clases de puntos de datos es máxima. Este hiperplano se conoce como límite de decisión, que separa las clases de puntos de datos (por ejemplo, naranjas frente a manzanas) a ambos lados del plano.
K vecino más cercano: K vecino más cercano, también conocido como algoritmo KNN, es un algoritmo no paramétrico que clasifica los puntos de datos según su proximidad y asociación con otros datos disponibles. Este algoritmo asume que se pueden encontrar puntos de datos similares cerca unos de otros. Como resultado, busca calcular la distancia entre puntos de datos, generalmente a través de la distancia euclidiana, y luego asigna una categoría basada en la categoría o promedio más frecuente. Su facilidad de uso y su bajo tiempo de cálculo lo convierten en el algoritmo preferido por los científicos de datos, pero a medida que crece el conjunto de datos de prueba, el tiempo de procesamiento se alarga, lo que lo hace menos atractivo para las tareas de clasificación. KNN se utiliza normalmente para motores de recomendación y reconocimiento de imágenes.
Random forest: es otro algoritmo de machine learning supervisado flexible que se utiliza para fines de clasificación y regresión. El "forest" hace referencia a una colección de árboles de decisión no correlacionados, que luego se fusionan para reducir la varianza y crear predicciones de datos más precisas.

Aprendizaje no supervisado vs. supervisado vs. semisupervisado

El machine learning no supervisado y el machine learning supervisado se analizan con frecuencia en conjunto. A diferencia del aprendizaje supervisado, el aprendizaje supervisado utiliza datos no etiquetados. A partir de esos datos, descubre patrones que ayudan a resolver problemas de agrupación o asociación. Esto es particularmente útil cuando los expertos en la materia no están seguros de las propiedades comunes dentro de un conjunto de datos. Los algoritmos de agrupamiento comunes son los modelos jerárquicos, k-medias y de mezcla gaussiana.

El aprendizaje semisupervisado se produce cuando solo se ha etiquetado una parte de los datos de entrada dados. El aprendizaje no supervisado y semisupervisado puede ser una alternativa más atractiva, ya que puede llevar mucho tiempo y ser costoso confiar en la experiencia en el campo para etiquetar los datos de manera adecuada para el aprendizaje supervisado.

Para profundizar en las diferencias entre estos enfoques, consulte "Aprendizaje supervisado vs. aprendizaje no supervisado: ¿Cuál es la diferencia?"

ejemplos de aprendizaje supervisado

Los modelos de aprendizaje supervisado se pueden utilizar para crear y promover una serie de aplicaciones empresariales, incluidas las siguientes:

Reconocimiento de imágenes y objetos: los algoritmos de aprendizaje supervisado se pueden utilizar para localizar, aislar y categorizar objetos a partir de videos o imágenes, lo que los hace útiles cuando se aplican a diversas técnicas de visión por computadora y análisis de imágenes.
Análisis predictivo: un caso de uso generalizado para modelos de aprendizaje supervisados consiste en crear sistemas de análisis predictivos para proporcionar información detallada sobre diversos puntos de datos empresariales. Esto permite a las empresas anticipar ciertos resultados en función de una variable de salida determinada, lo que ayuda a los líderes empresariales a justificar las decisiones o pivotar en beneficio de la organización.
Análisis de la opinión del cliente: mediante el uso de algoritmos de machine learning supervisado, las organizaciones pueden extraer y clasificar información importante de grandes volúmenes de datos, incluidos el contexto, la emoción y la intención, con muy poca intervención humana. Esto puede resultar increíblemente útil para comprender mejor las interacciones con los clientes y se puede utilizar para mejorar los esfuerzos de participación de la marca.
Detección de spam: La detección de spam es otro ejemplo de un modelo de aprendizaje supervisado. Utilizando algoritmos de clasificación supervisados, las organizaciones pueden entrenar bases de datos para reconocer patrones o anomalías en nuevos datos para organizar de manera efectiva el spam y la correspondencia no relacionada con el spam.

Desafíos del aprendizaje supervisado

Aunque el aprendizaje supervisado puede ofrecer ventajas a las empresas, como una visión profunda de los datos y una mayor automatización, existen algunos desafíos a la hora de crear modelos de aprendizaje supervisado sostenibles. A continuación se enumeran algunos de estos desafíos:

Los modelos de aprendizaje supervisado pueden requerir ciertos niveles de experiencia para estructurarse con precisión.
El entrenamiento de modelos de aprendizaje supervisado puede requerir mucho tiempo.
Los conjuntos de datos pueden tener una mayor probabilidad de error humano, lo que hace que los algoritmos aprendan incorrectamente.
A diferencia de los modelos de aprendizaje no supervisado, el aprendizaje supervisado no puede agrupar ni clasificar datos por sí solo.

Soluciones relacionadas

IBM watsonx Studio

Cree y escale una IA de confianza en cualquier cloud. Automatice el ciclo de vida de la IA para ModelOps.

Descubra IBM watsonx Studio

IBM Cloud Pak for Data

Conecte los datos correctos, en el momento oportuno, a las personas adecuadas en cualquier lugar.

Descubra Cloud Pak for Data

Soluciones IBM Cloud

Híbrida. Abierta. Resiliente. Su plataforma y socio para la transformación digital.

Explorar las soluciones en la nube

Recursos

Aprendizaje práctico y gratuito para tecnologías de IA generativas

Aprenda los conceptos fundamentales de la IA y la IA generativa, incluida la ingeniería de avisos, los grandes modelos lingüísticos y los mejores proyectos de código abierto.

Aprendizaje supervisado vs. aprendizaje no supervisado: ¿Cuál es la diferencia?

En este artículo, exploraremos los conceptos básicos de dos enfoques de ciencia de datos: supervisados y no supervisados.

Modelos de aprendizaje supervisado

Explore algunos enfoques de aprendizaje supervisado, como las máquinas de vectores de apoyo y los clasificadores probabilísticos

Dé el siguiente paso

Entrene, valide, ajuste e implemente IA generativa, modelos fundacionales y capacidades de machine learning con IBM watsonx.ai, un estudio empresarial de próxima generación para constructores de IA. Cree aplicaciones de IA en menos tiempo y con menos datos.

Explore watsonx.ai

Solicite una demostración en directo