Mi IBM Iniciar sesión Suscríbase

Aceleramiento de la inferencia de PyTorch en IBM Z e IBM LinuxONE

18 de noviembre de 2024

Autores

Tina Tarquinio

VP

Product Management, IBM Z and LinuxONE

Elpida Tzortzatos

IBM Fellow and CTO of z/OS and AI on IBM Z and LinuxONE

El auge de PyTorch: transformación del desarrollo de IA

Durante la última década, hemos visto una transformación drástica en las empresas lideradas por IA. El auge del big data y del hardware especializado ha hecho que los eficaces modelos de IA que alguna vez estuvieron limitados a equipos de investigación de élite en universidades de primer nivel sean accesibles para las masas. Las redes neuronales profundas han impulsado esta democratización, y los infraestructuras de aprendizaje profundo, como PyTorch y TensorFlow, han ayudado al desarrollo de estos modelos. PyTorch se ha convertido en un actor clave en el ámbito de la IA, ofreciendo beneficios únicos que han llevado a su uso y adopción generalizados.

Diseño 3D de pelotas rodando en una pista

Las últimas novedades e insights sobre IA 


Descubra insights y noticias de expertos sobre IA, la nube y mucho más en el boletín semanal Think. 

Aceleración de PyTorch con el acelerador en chip de IBM Z Telum para IA

Los avances recientes en los aceleradores de IA han proporcionado la potencia necesaria para usar de manera eficaz infraestructuras de aprendizaje profundo como PyTorch. Estas mejoras de hardware aceleran el cómputo de modelos más complejos en grandes conjuntos de datos, lo que acelera significativamente la experimentación y el despliegue. Con la más reciente actualización de entrega continua de AI ToolKit for IBM Z and LinuxONE, estamos agregando soporte para PyTorch a través de un nuevo contenedor: IBM Z Accelerated for PyTorch. Este contiene un entorno de desarrollo e inferencia para PyTorch. Utilizará nuevas capacidades de aceleración de inferencia que se dirigen de manera transparente al acelerador de IA integrado de IBM y proporcionan una aceleración significativa en el aprendizaje automático tradicional y el aprendizaje profundo, así como en los modelos de lenguaje grandes codificadores. Estas capacidades ayudan a acelerar la experimentación con pruebas de concepto rápidas y a crear soluciones de IA en IBM Z y LinuxONE.

Mixture of Experts | Podcast

Decodificación de la IA: Resumen semanal de noticias

Únase a nuestro panel de ingenieros, investigadores, responsables de producto y otros profesionales de talla mundial que se abren paso entre el revuelo de la IA para ofrecerle las últimas noticias e insights al respecto.

¿Qué es PyTorch?

PyTorch es un marco de aprendizaje automático de código abierto que proporciona una plataforma flexible para crear modelos de aprendizaje profundo. Lanzado por el laboratorio de investigación de IA de Facebook en 2016, PyTorch permite a los desarrolladores crear y modificar modelos fácilmente a través de su estructura dinámica, que ofrece feedback inmediato. Esta adaptabilidad lo hace particularmente atractivo para investigadores y desarrolladores que desean experimentar con nuevas ideas.

La importancia de PyTorch en el marco de IA actual

PyTorch ha ganado una gran popularidad en el ecosistema de la IA. Su interfaz fácil de usar y sus eficaces características lo han convertido en la infraestructura de preferencia tanto para la investigación académica como para las aplicaciones comerciales. PyTorch ha desempeñado un papel crucial en el avance del aprendizaje profundo al proporcionar herramientas que simplifican el proceso de creación y entrenamiento de modelos complejos. Su flexibilidad permite a los desarrolladores experimentar con diferentes arquitecturas y técnicas, lo que redunda en soluciones más innovadoras. Características como la diferenciación automática y la manipulación intuitiva de tensores han facilitado la implementación de algoritmos avanzados, lo que ha derivado en un progreso más rápido en la investigación y la aplicación.

Una de las áreas más significativas en las que PyTorch ha tenido un impacto es en el desarrollo de modelos de lenguaje grandes (LLM). Estos modelos, que pueden comprender y generar texto similar al que genera un humano, han revolucionado el procesamiento de lenguaje natural. Los infraestructuras como PyTorch han facilitado la creación y el ajuste fino de estos modelos, lo que permite a los investigadores analizar nuevas arquitecturas y métodos de entrenamiento de manera más eficiente.

Cabe destacar que muchos de los modelos de lenguaje de última generación más recientes, entre ellos, los desarrollados por las empresas tecnológicas más importantes, se han implementado mediante el uso de PyTorch. La capacidad de la infraestructura para manejar grandes cantidades de datos y su compatibilidad con el entrenamiento distribuido han permitido el escalamiento de modelos que pueden comprender el contexto y los matices del lenguaje.

Con IBM Z Accelerated for PyTorch entregado a través de AI Toolkit for IBM Z and LinuxONE, nuestros clientes pueden emplear los despliegues de modelos PyTorch con la fiabilidad, disponibilidad y escalabilidad de IBM Z, junto con las capacidades de aceleramiento de inferencia del acelerador en chip Telum. Este aceleramiento de inferencia es transparente para los clientes, ya que los contenedores están diseñados para beneficiarse de las instrucciones de Neural Network Processing Assist (NNPA) de Telum de forma transparente y automática.

Los clientes ahora pueden usar esta capacidad para casos de uso de alto valor como detección de fraude, procesamiento de reclamos, procesamiento de lenguaje natural, detección de imágenes y más. Estos modelos pueden desplegarse en el formato nativo de PyTorch o exportarse a formatos como ONNX, que están muy optimizados para la inferencia.

Ya sea que los modelos de PyTorch se desplieguen en z/OS o en un entorno de Linux on IBM Z, la colocación de estos modelos con los datos y las aplicaciones de misión crítica de nuestro cliente es útil para obtener insights comerciales a escala mientras se continúa cumpliendo incluso con los acuerdos de nivel de servicio más estrictos.

AI Toolkit for IBM Z and LinuxONE

AI Toolkit for IBM Z and IBM LinuxONE está diseñado para permitir a nuestros clientes desplegar y acelerar la adopción de marcos de IA de código abierto populares en sus plataformas z/OS e IBM LinuxONE. AI Toolkit sigue un riguroso proceso de IBM Secure Engineering que examina y analiza los marcos de servicio de IA de código abierto y los contenedores certificados por IBM en busca de vulnerabilidades de seguridad y valida el cumplimiento de la normativa de la industria. Los clientes también pueden comprar IBM Elite Support for AI Toolkit for IBM Z and LinuxONE.

Aprenda más sobre AI Toolkit for IBM Z and IBM LinuxONE

Conozca lo que puede esperar de IBM Elite Support

Soluciones relacionadas

Soluciones relacionadas

IBM watsonx.ai

Entrene, valide, ajuste y despliegue IA generativa, modelos fundacionales y capacidades de machine learning con IBM watsonx.ai, un estudio empresarial de próxima generación para creadores de IA. Diseñe aplicaciones de IA en menos tiempo y con menos datos.

Descubra watsonx.ai
Soluciones de inteligencia artificial

Ponga IBM watsonx a trabajar a escala en su negocio con la experiencia en IA líder del sector y la cartera de soluciones de IBM a su lado.

Explore las soluciones de IA
Consultoría y servicios de IA

Reinvente los flujos de trabajo y las operaciones críticas añadiendo IA para maximizar las experiencias, la toma de decisiones en tiempo real y el valor empresarial.

Conozca los servicios de IA
Dé el siguiente paso

Obtenga acceso único a capacidades que abarcan el ciclo de vida del desarrollo de IA. Produzca potentes soluciones de IA con interfaces fáciles de usar, flujos de trabajo y acceso a API y SDK estándar de la industria.

Explore watsonx.ai Reserve una demostración en vivo