¿Qué es Amazon SageMaker?

Ilustración de orbes unidos a una línea ondulada

Autores

Tom Krantz

Staff Writer

IBM Think

Alexandra Jonker

Staff Editor

IBM Think

Alice Gomstyn

Staff Writer

IBM Think

¿Qué es Amazon SageMaker?

Amazon SageMaker es un servicio totalmente gestionado diseñado para simplificar el proceso de creación, capacitación e implementación de modelos de machine learning (ML). 

Creado por Amazon Web Services (AWS), SageMaker automatiza muchas de las tareas que requieren mucho trabajo en cada etapa de la implementación de ML, lo que reduce la complejidad de los flujos de trabajo y acelera el ciclo de vida general del machine learning. Esto puede conducir a iteraciones más rápidas, una mayor precisión y, en última instancia, un mayor valor empresarial de las iniciativas de machine learning.

SageMaker ofrece un conjunto de herramientas de ML. Por ejemplo, Autopilot permite entrenar modelos de inteligencia artificial (IA) en conjuntos de datos específicos y clasifica cada algoritmo según su precisión, mientras que Data Wrangler acelera la preparación de datos y hace que las fases iniciales del desarrollo de modelos de ML sean más eficientes.

SageMaker también incluye varias interfaces de programación de aplicaciones (API). Estas API permiten a los científicos de datos y desarrolladores crear soluciones ML listas para la producción sin las complejidades de la gestión de infraestructuras.

Antecedentes: comprensión del proceso de machine learning

Para comprender el impacto de Amazon SageMaker, es importante entender cómo funciona el machine learning. El proceso de machine learning puede dividirse en tres partes: proceso de decisión, función de error y optimización del modelo.

  • Proceso de decisión: los algoritmos de machine learning tienen como objetivo principal hacer predicciones o clasificaciones. A partir de datos de entrada, etiquetados o no, los algoritmos de machine learning pueden generar estimaciones e identificar patrones en los datos. 

  • Función de error: esta función evalúa la precisión de las predicciones del modelo. Al comparar los resultados del modelo con ejemplos conocidos, la función de error ayuda a evaluar el rendimiento del modelo y a identificar áreas de mejora.

  • Proceso de optimización del modelo: para mejorar la precisión del modelo, los algoritmos de machine learning ajustan de forma iterativa sus ponderaciones en función de las discrepancias entre los ejemplos conocidos y las estimaciones del modelo. Este ciclo de "evaluar y optimizar" continúa hasta que el modelo alcanza un umbral de precisión satisfactorio.

Amazon SageMaker puede ayudar a agilizar estos procesos, y permite a los científicos de datos implementar de manera eficiente modelos de machine learning. 

¿Qué hace AWS SageMaker?

AWS SageMaker simplifica el ciclo de vida del ML mediante un enfoque estructurado que abarca tres fases críticas: generación de datos de ejemplo, entrenamiento e implementación. Dentro de cada fase, los desarrolladores pueden utilizar instancias: entornos aislados, o servidores, que gestionan bases de datos y recursos informáticos, establecen parámetros de configuración y aprovisionan la infraestructura de TI necesaria. 

Generación de datos de ejemplo

Los desarrolladores pueden empezar por generar datos de ejemplo, que son esenciales para entrenar los modelos de ML. Este proceso implica buscar, limpiar y preparar conjuntos de datos del mundo real para el preprocesamiento. A veces, los desarrolladores pueden utilizar Amazon Ground Truth para crear datos de imágenes sintéticas etiquetadas que aumentan o reemplazan los datos de ejemplo. Una vez listos, los datos pueden cargarse en Amazon Simple Storage Service (S3), lo que permite acceder a ellos para utilizarlos con diversos servicios de AWS.

Las instancias de notebook de Amazon SageMaker proporcionan un entorno sólido para que los desarrolladores preparen y procesen sus datos para la capacitación. Al acceder a los datos almacenados en S3, SageMaker puede acelerar el proceso de desarrollo de modelos mediante el uso de instancias de ML totalmente gestionadas para entrenar modelos, ejecutar inferencias y procesar grandes conjuntos de datos dentro de Amazon Elastic Cloud Compute (EC2). 

SageMaker admite la codificación colaborativa a través de la aplicación de código abierto Jupyter Notebook. Los científicos de datos pueden importar sus propias herramientas o utilizar instancias de notebook precompiladas equipadas con controladores esenciales y bibliotecas de código preescrito para marcos de deep learning populares. Estas bibliotecas pueden consistir en operaciones matemáticas, capas de  redes neuronales y algoritmos de optimización. 

SageMaker también proporciona flexibilidad a los desarrolladores al admitir algoritmos personalizados empaquetados como imágenes de contenedores Docker. Los integra con Amazon S3, lo que permite a los equipos lanzar fácilmente sus proyectos de machine learning. Los desarrolladores pueden proporcionar sus propios algoritmos de entrenamiento o seleccionarlos entre una serie de algoritmos prediseñados a través de la consola de SageMaker. Hay tutoriales y recursos disponibles para guiar a los usuarios a través de estos procesos.

Formación

En la fase de entrenamiento, los desarrolladores utilizan algoritmos o modelos base preentrenados para afinar sus modelos de ML en conjuntos de datos específicos. Los desarrolladores pueden definir ubicaciones de datos en buckets de Amazon S3 y seleccionar los tipos de instancia adecuados para optimizar el proceso de capacitación. 

Las herramientas de orquestación como SageMaker Pipelines agilizan el flujo de trabajo al automatizar el proceso integral de creación, formación y la implementación de modelos de machine learning. Esto puede ayudar a ahorrar tiempo y garantizar la precisión en todos los flujos de trabajo. Además, Amazon SageMaker JumpStart permite a los desarrolladores utilizar modelos prediseñados a través de una interfaz no-code, lo que permite la colaboración sin necesidad de conocimientos técnicos profundos. 

Durante el entrenamiento de modelos, los desarrolladores pueden utilizar el ajuste de hiperparámetros de SageMaker para optimizar los modelos de lenguaje de gran tamaño (LLM) y mejorar el rendimiento en varias aplicaciones. El depurador monitoriza las métricas de las redes neuronales, lo que proporciona a los desarrolladores conocimientos en tiempo real sobre el rendimiento del modelo y el uso de los recursos. Esto puede ayudar a simplificar el proceso de depuración al permitir a los científicos de datos identificar rápidamente los problemas, analizar las tendencias y establecer alertas automatizadas para una gestión proactiva. SageMaker también proporciona una capacidad de Edge Manager que amplía la monitorización y la gestión de ML a los dispositivos edge

Implementación

Una vez completada la formación, SageMaker gestiona y escala de forma autónoma la infraestructura de nube subyacente para ayudar a garantizar una implementación fluida. Este proceso se basa en una variedad de tipos de instancias (por ejemplo, unidades de procesamiento de gráficos, o GPU, optimizadas para cargas de trabajo de ML). También se implementa en varias zonas de disponibilidad (grupos de centros de datos aislados pero lo suficientemente cerca como para tener una baja latencia) para mejorar la fiabilidad. Las comprobaciones del estado de salud y los endpoints HTTPS seguros refuerzan aún más la conectividad de las aplicaciones.

Una vez implementado, los desarrolladores pueden utilizar las métricas de Amazon CloudWatch para monitorizar el rendimiento de producción, obtener conocimientos en tiempo real y establecer alertas para cualquier desviación. Con capacidades de monitorización integrales, SageMaker puede respaldar un gobierno eficaz a lo largo del ciclo de vida del ML. Como resultado, las organizaciones pueden mantener el control y el cumplimiento mientras aprovechan el poder del machine learning.

¿Cuáles son los beneficios de Amazon SageMaker?

Amazon SageMaker ofrece una serie de beneficios que mejoran la experiencia de machine learning, entre los que se incluyen:

  • Entorno de desarrollo integrado 
  • Entrenamiento y optimización de modelos
  • Preparación y etiquetado de datos
  • Inferencia en tiempo real y por lotes
  • Soluciones rentables y sin servidor
  • Monitorización y depuración
  • Modelos de precios flexibles

Entorno de desarrollo integrado (IDE)

Amazon SageMaker Studio sirve como un IDE todo en uno para científicos de datos, y proporciona una interfaz intuitiva para administrar flujos de trabajo, desarrollar modelos y visualizar métricas. Es compatible con Jupyter Notebooks, lo que permite a los usuarios escribir y ejecutar código Python de manera eficiente.

Entrenamiento y optimización de modelos

Los usuarios pueden entrenar modelos de ML con algoritmos integrados o personalizados basados en marcos de entrenamiento de ML populares, como TensorFlow, PyTorch y MXNet. El servicio ofrece ajustes de hiperparámetros para optimizar las configuraciones de los modelos y obtener el mejor rendimiento. SageMaker también habilita la afinación de modelos preentrenados, lo que permite a los científicos de datos adaptar estos modelos a conjuntos de datos y tareas específicos.

Preparación y etiquetado de datos

Los conjuntos de datos de calidad son cruciales para crear modelos de machine learning eficaces. Ground Truth proporciona un servicio de etiquetado de datos que facilita la creación de conjuntos de datos de alta calidad a través de procesos automatizados de etiquetado y revisión humana. Además, Amazon SageMaker incluye un almacén de características integrado que permite a los equipos gestionar, compartir y descubrir características (entradas utilizadas para la capacitación y la inferencia) en diferentes modelos de machine learning. Esto puede ayudar a agilizar el proceso de preparación de los datos y mejorar la colaboración.

Inferencia en tiempo real y por lotes

Después de implementar modelos de machine learning, SageMaker permite la inferencia tanto en tiempo real como por lotes. Los usuarios pueden crear endpoints (URL específicas que sirven como puntos de acceso para las aplicaciones) para hacer predicciones en tiempo real y gestionar las cargas de trabajo de manera eficiente. Esto es particularmente útil para aplicaciones que requieren respuestas instantáneas, como en escenarios de IA generativa.

Soluciones sin servidor y rentables

Con características como el escalado automático y la integración con AWS Lambda, SageMaker proporciona capacidades sin servidor que ayudan a gestionar los recursos informáticos de forma dinámica en función de la demanda. El resultado es una optimización de los costes y la escalabilidad.

Monitorización y depuración

SageMaker ofrece herramientas como Amazon CloudWatch para monitorizar el rendimiento del modelo ML en tiempo real, y utiliza otros servicios de AWS para proporcionar una visión holística de la salud de la aplicación. Las características de depuración permiten a los científicos de datos rastrear los problemas en el entrenamiento y la implementación de los modelos, lo que ayuda a garantizar un ciclo de vida de machine learning sólido

Modelos de precios flexibles

AWS ofrece dos modelos de precios: bajo demanda y de pago por uso, con costes que varían en función de los tipos de instancia, el almacenamiento de datos y los servicios utilizados. Además, la capa nivel gratuito de Amazon SageMaker permite a los nuevos usuarios explorar la plataforma sin coste alguno, y proporciona acceso a una gama limitada de características y recursos. 

Diseño 3D de bolas rodando por un circuito

Las últimas noticias + conocimientos de IA 


Conocimientos y noticias organizados de expertos sobre IA, la nube y mucho más en el boletín semanal Think.  

Casos de uso de AWS SageMaker

La versatilidad de Amazon SageMaker lo hace adecuado para diversos casos de uso en todos los sectores. Algunos ejemplos son: 

Atención médica: los modelos de machine learning pueden analizar los datos de los pacientes para predecir resultados, personalizar los tratamientos y mejorar la eficiencia operativa. 

Finanzas: las instituciones financieras pueden utilizar Amazon SageMaker para desarrollar modelos de detección del fraude, calificación crediticia y evaluación. 

Venta minorista: las empresas utilizan el análisis predictivo para mejorar la gestión de inventarios, personalizar las experiencias de los clientes y optimizar las estrategias de precios. 

Amazon SageMaker y el gobierno de la IA

Herramientas como Amazon SageMaker pueden ayudar a las organizaciones a implementar con eficacia modelos de machine learning que impulsen la innovación y el valor empresarial, al tiempo que mantienen el control del sistema de IA y el cumplimiento normativo. Los usuarios pueden beneficiarse de varias herramientas de gobierno, entre ellas:

  • Gestión de identidades y accesos (IAM): esta característica permite a los usuarios gestionar permisos y roles, lo que ayuda a garantizar que solo los usuarios autorizados accedan a datos confidenciales y modelen endpoints.

  • Control de versiones: los usuarios pueden realizar un seguimiento de las versiones y configuraciones de los modelos para mantener un registro de auditoría claro, esencial para el cumplimiento y el gobierno.

  • Registro de modelos: el registro de modelos actúa como repositorio central para gestionar artefactos y metadatos de modelos, lo que ayuda a garantizar la transparencia y la responsabilidad a lo largo del ciclo de vida del desarrollo.

El SDK de Python de SageMaker mejora las capacidades de gobierno de Amazon SageMaker al permitir una integración perfecta con los flujos de trabajo y servicios existentes. Esto permite a las organizaciones automatizar las comprobaciones de cumplimiento y mantener la supervisión de sus proyectos de ML con mayor eficacia.

Amazon SageMaker también puede integrarse en estrategias más amplias de datos e IA. IBM y AWS han formado asociaciones estratégicas para mejorar las capacidades de las organizaciones que aprovechan los servicios basados en la nube. El uso de los modelos fundacionales de IBM junto con Amazon SageMaker permite a los equipos aprovechar los análisis avanzados, mejorar la gestión de datos y agilizar los flujos de trabajo. Al implementar modelos dentro de una Amazon VPC, las organizaciones pueden ayudar a garantizar un acceso seguro y controlado a sus recursos, lo que respalda aún más las iniciativas de gobierno.

Con la capacidad de trabajar en varias plataformas como Windows, las organizaciones pueden acoplar las herramientas de IBM y AWS para implementar fácilmente soluciones de IA y ML adaptadas a sus necesidades. Al utilizar las soluciones watsonx.governance de IBM con las sólidas funciones de SageMaker, las empresas pueden acelerar sus iniciativas de IA, especialmente en aplicaciones de IA generativa y MLOps

Soluciones relacionadas
Modelos fundacionales

Explore la biblioteca de modelos fundacionales de IBM en la cartera de watsonx para escalar la IA generativa para su negocio con confianza.

Descubra watsonx.ai
Soluciones de inteligencia artificial

Ponga la IA a trabajar en su negocio con la experiencia líder en IA del sector de IBM y junto a su cartera de soluciones.

Explore las soluciones de IA
Consultoría y servicios de IA

Reinvente las operaciones y flujos de trabajo críticos añadiendo IA para maximizar las experiencias, la toma de decisiones en tiempo real y el valor empresarial.

Explore los servicios de IA
Dé el siguiente paso

Explore la biblioteca de modelos fundacionales de IBM en la cartera de IBM watsonx para escalar la IA generativa para su negocio con confianza.

Explore watsonx.ai Explore las soluciones de IA