¿Qué es Deep Learning?

Deep learning es un subconjunto de machine learning, que es básicamente una red neuronal con tres o más capas. Estas redes neuronales intentan emular el comportamiento del cerebro humano —aunque lejos de igualar su capacidad— pero le permiten "aprender" a partir de grandes cantidades de datos. Aunque una red neuronal con una sola capa ya puede realizar predicciones aproximadas, las capas ocultas adicionales ayudan a optimizar y refinar la precisión.

Deep learning impulsa muchos servicios y aplicaciones de inteligencia artificial (IA) que mejoran la automatización, realizando tareas analíticas y físicas sin intervención humana. La tecnología de deep learning reside detrás de muchos productos y servicios de uso cotidiano (como los asistentes digitales, los controles de TV habilitados por voz y la detección de fraudes con tarjeta de crédito), así como de tecnologías emergentes (como los automóviles autónomos).

Comparación entre deep learning y machine learning

Si deep learning es un subconjunto de machine learning, ¿en qué se diferencian? Deep learning se distingue del machine learning clásico por el tipo de datos con los que trabaja y los métodos mediante los cuales aprende.

Los algoritmos de machine learning aprovechan los datos estructurados y etiquetados para realizar predicciones, lo que conlleva la definición de características específicas durante la entrada de datos para el modelo y su organización en tablas. Esto no significa necesariamente que no utilice datos no estructurados, solo que si lo hace, normalmente pasa por algún procesamiento previo para organizarlos en un formato estructurado.

Deep learning elimina parte del procesamiento previo de datos que requiere machine learning. Estos algoritmos pueden ingerir y procesar datos no estructurados, como texto e imágenes, y automatizan la extracción de características, eliminando parte de la dependencia de expertos humanos. Por ejemplo, pongamos que tenemos un conjunto de fotos de diferentes mascotas, y queremos categorizarlo por "gato ", "perro", "hámster", etc. Los algoritmos de deep learning pueden determinar qué características (por ejemplo, las orejas) son las más importantes para distinguir a un animal de otro. En machine learning, esta jerarquía de características la establece manualmente un experto humano.

A continuación, a través de los procesos de pendiente de gradiente y propagación inversa, el algoritmo de deep learning se ajusta y se adapta a sí mismo para ganar precisión, lo que le permite realizar predicciones sobre una nueva foto de un animal con mayor precisión.

Los modelos de machine learning y deep learning admiten diferentes tipos de aprendizaje, que generalmente se clasifican como aprendizaje supervisado, aprendizaje no supervisado y aprendizaje de refuerzo. El aprendizaje supervisado utiliza conjuntos de datos etiquetados para categorizar o realizar predicciones; esto requiere algún tipo de intervención humana para etiquetar correctamente los datos de entrada. Por el contrario, el aprendizaje no supervisado no requiere conjuntos de datos etiquetados y, en cambio, detecta patrones en los datos y los agrupa en función de cualquier característica distintiva. El aprendizaje de refuerzo es un proceso en el que un modelo aprende a ser más preciso para realizar una acción en un entorno basándose en los comentarios para maximizar el resultado.

Para un análisis más exhaustivo de las diferencias matizadas entre estas tecnologías, consulte el artículo "IA vs. Machine Learning vs. Deep Learning vs. Redes neuronales: ¿cuál es la diferencia?"

Para un análisis más detallado de las diferencias específicas entre el aprendizaje supervisado y no supervisado, consulte "Aprendizaje supervisado vs. no supervisado: ¿cuál es la diferencia? "

Cómo funciona deep learning

Las redes neuronales de deep learning, o redes neuronales artificiales, tratan de imitar el cerebro humano a través de una combinación de entradas de datos, ponderaciones y sesgos. Estos elementos trabajan conjuntamente para reconocer, clasificar y describir con precisión los objetos dentro de los datos.

Las redes neuronales profundas constan de varias capas de nodos interconectados, cada uno sobre la capa anterior para refinar y optimizar la predicción o categorización. Esta progresión de cálculos a través de la red se denomina propagación hacia delante. Las capas de entrada y salida de una red neuronal profunda se denominan capas visibles. La capa de entrada es donde el modelo de deep learning ingiere los datos para el procesamiento, y la capa de salida es donde se realiza la predicción o clasificación final.

Otro proceso llamado propagación inversa utiliza algoritmos, como pendiente de gradiente, para calcular errores en las predicciones y luego ajusta las ponderaciones y los sesgos de la función moviéndose hacia atrás a través de las capas con la finalidad de entrenar el modelo. Juntas, la propagación hacia delante y la propagación inversa permiten a la red neuronal realizar predicciones y corregir los errores en consecuencia. Con el tiempo, el algoritmo va ganando precisión.

Lo anterior describe el tipo más simple de red neuronal profunda en los términos más simples. Sin embargo, los algoritmos de deep learning son increíblemente complejos y existen diferentes tipos de redes neuronales para abordar problemas o conjuntos de datos específicos. Por ejemplo:

Las redes neuronales convolucionales (CNN, por sus siglas en inglés), usadas principalmente en aplicaciones de clasificación de imágenes y visión computacional, pueden detectar características y patrones de una imagen, habilitando tareas, como la detección o el reconocimiento de objetos. En 2015, por primera vez, una CNN superó a un humano en un reto de reconocimiento de objetos.
Las redes neuronales recurrentes (RNN, por sus siglas en inglés) se utilizan normalmente en aplicaciones de lenguaje natural y reconocimiento de voz, ya que aprovechan datos de series temporales o secuenciales.

Aplicaciones de deep learning

Las aplicaciones de deep learning del mundo real forman parte de nuestra vida diaria, pero en la mayoría de los casos, están tan bien integradas en los productos y servicios que los usuarios desconocen el complejo procesamiento de datos que se está realizando en segundo plano. Algunos de estos ejemplos son:

Cumplimiento de la ley

Los algoritmos de deep learning pueden analizar y aprender de los datos transaccionales para identificar patrones peligrosos que indican posible actividad delictiva o fraudulenta. El reconocimiento de voz, la visión computacional y otras aplicaciones de deep learning pueden mejorar la eficiencia y la efectividad del análisis de investigación mediante la extracción de patrones y pruebas de grabaciones de sonido y vídeo, imágenes y documentos. Esto ayuda a las fuerzas policiales a analizar grandes cantidades de datos de forma más rápida y precisa.

Servicios financieros

Las instituciones financieras normalmente utilizan análisis predictivo para aplicar algoritmos al comercio de acciones, evaluar riesgos de negocio para la aprobación de préstamos, detectar fraudes y ayudar a gestionar carteras de crédito e inversión a sus clientes.

Servicio al cliente

Muchas organizaciones incorporan tecnología de deep learning en sus procesos de servicio al cliente. Los chatbots, que se utilizan en una gran variedad de aplicaciones, servicios y portales de servicio al cliente, son una forma directa de IA. Los chatbots tradicionales utilizan lenguaje natural e incluso reconocimiento visual, que se encuentran comúnmente en los menús de los centros de llamada. Sin embargo, las soluciones de chatbot más sofisticadas tratan de determinar, a través del aprendizaje, si existen varias respuestas a preguntas ambiguas. Según las respuesta que recibe, el chatbot intenta responder a estas preguntas directamente o transfiere la conversación a un usuario humano.

Los asistentes virtuales, como Siri de Apple, Amazon Alexa o Google Assistant, amplían la idea de un chatbot con la funcionalidad de reconocimiento de voz, la cual habilita un nuevo método para interactuar con los usuarios de forma personalizada.

Asistencia sanitaria

El sector de la asistencia sanitaria se ha beneficiado enormemente de las prestaciones de deep learning desde la digitalización de las imágenes y los registros de los hospitales. Las aplicaciones de reconocimiento de imágenes prestan soporte a los especialistas en imágenes médicas y radiólogos, ayudándoles a analizar y evaluar más imágenes en menos tiempo.

Requisitos de hardware de deep learning

Deep learning requiere una gran cantidad de potencia computacional. Las unidades de procesamiento gráfico (GPU, por sus siglas en inglés) son ideales porque pueden manejar un gran volumen de cálculos en varios núcleos con gran cantidad de memoria disponible. Sin embargo, gestionar varias GPU en local puede generar una gran demanda de recursos internos y su ampliación resultar increíblemente costosa.

Soluciones relacionadas

Watson es una IA que permite un negocio más inteligente

Watson es un portfolio de aplicaciones, herramientas y soluciones preparadas para la empresa, diseñado para reducir los costes y los obstáculos de la adopción de IA, además de optimizar los resultados y el uso responsable de la IA.

Explore IBM Watson: IA para una empresa más inteligente

Watson Assistant: Chatbot de IA

Watson Assistant es el chatbot de IA para empresas. Esta tecnología de inteligencia artificial de empresa permite a los usuarios crear soluciones de IA conversacional.

Explore Watson Assistant

Watson Studio

Cree, ejecute y gestione modelos de IA. Prepare los datos y cree modelos en cualquier cloud mediante código abierto o modelado visual. Prevea y optimice sus resultados.

Explore Watson Studio

Recursos

Libro electrónico sobre inteligencia artificial

Una introducción al deep learning

Explore esta rama de machine learning que se entrena con grandes cantidades de datos y trabaja con unidades computacionales para realizar predicciones

Arquitecturas de deep learning

El auge de la inteligencia artificial

Dé el siguiente paso

Desde hace décadas, IBM ha sido pionera en el desarrollo de tecnologías de IA y deep learning, entre las que destaca el desarrollo de IBM Watson, el chatbot de IA de IBM. Watson fue uno de los primeros logros en tecnología de deep learning, y ahora se ha consolidado como solución para las empresas que buscan aplicar el procesamiento del lenguaje natural avanzado y técnicas de machine learning a sus sistemas mediante un enfoque escalonado y probado para la adopción y la implementación de IA.

Cómo empezar con IBM Watson® Studio