¿Qué es la IA generativa, qué son los modelos fundacionales y por qué son importantes?

La base de la producción de circuitos integrados con una oblea de silicio

Desde su lanzamiento en noviembre de 2022, ChatGPT de OpenAI ha capturado la imaginación tanto de los consumidores como de los líderes empresariales al demostrar el potencial que tiene la IA generativa para transformar drásticamente la forma en que vivimos y trabajamos. A medida que el alcance de su impacto en la sociedad continúa desarrollándose, las organizaciones empresariales y de gobierno están creando políticas sobre el uso de la tecnología por parte de los empleados o incluso restringiendo el acceso a ChatGPT.

Los más prudentes entre ellos han sido evaluar las formas en que pueden aplicar IA a sus organizaciones y prepararse para un futuro que ya está aquí. Los más avanzados están cambiando su forma de pensar, pasando de considerar la IA como un complemento secundario a replantearse los flujos de trabajo críticos con la IA como elemento central.

Las últimas tendencias de IA presentadas por expertos

Obtenga insights curados sobre las noticias más importantes e intrigantes de la IA. Suscríbase a nuestro boletín semanal Think. Consulte la Declaración de privacidad de IBM .

¡Gracias! Ya está suscrito.

Su suscripción se entregará en inglés. En cada boletín, encontrará un enlace para darse de baja. Puede gestionar sus suscripciones o darse de baja aquí. Consulte nuestra Declaración de privacidad de IBM para obtener más información.

Cómo la IA generativa, como ChatGPT, ya está transformando las empresas

El mercado global de la IA generativa se está acercando a un punto de inflexión, con una valoración de 8 mil millones de dólares y una CAGR estimada del 34.6 % para 2030. Dado que se espera que más de 85 millones de puestos de trabajo queden vacantes para ese momento, es necesario crear operaciones más inteligentes con IA y automatización para ofrecer la eficiencia, la eficacia y las experiencias que esperan los líderes empresariales y los stakeholders.

La IA generativa presenta una oportunidad convincente para aumentar los esfuerzos de los empleados y hacer que la empresa sea más productiva. Pero a medida que los altos ejecutivos líderes realizan una investigación de soluciones de IA generativa, están descubriendo más preguntas: ¿qué caso de uso ofrecerá el mayor valor para mi negocio? ¿Qué tecnología de IA se adapta mejor a mis necesidades? ¿Es segura? ¿Es sostenible? ¿Cómo se gobierna? ¿Y cómo me aseguro de que mis proyectos de IA tengan éxito?

Después de haber trabajado con modelos fundacionales durante varios años, IBM Consulting, IBM Technology e IBM Research han desarrollado un punto de vista fundamentado sobre lo que se necesita para obtener valor del despliegue responsable de la IA en toda la empresa.

AI Academy

El auge de la IA generativa para las empresas

Aprenda sobre el auge histórico de la IA generativa y lo que significa para las empresas.

Diferencias entre la IA empresarial existente en las empresas y las nuevas capacidades de IA generativa

Como su nombre indica, la IA generativa genera imágenes, música, voz, código, video o texto, al tiempo que interpreta y manipula datos preexistentes. La IA generativa no es un concepto nuevo: las técnicas de machine learning detrás de la IA generativa han evolucionado en la última década. El enfoque más reciente se basa en una arquitectura de redes neuronales, denominada "transformadores". Combinando la arquitectura transformadora con aprendizaje no supervisado, surgieron grandes modelos fundacionales que superan los puntos de referencia existentes capaces de manejar múltiples modalidades de datos.

Estos modelos grandes se denominan modelos fundacionales, ya que sirven como punto de partida para el desarrollo de modelos más avanzados y complejos. Al construir sobre un modelo fundacional, podemos crear modelos más especializados y sofisticados adaptados a casos de uso o dominios específicos. Los primeros ejemplos de modelos, como GPT-3, BERT, T5 o DALL-E, han demostrado lo que es posible: se ingresa una breve instrucción y el sistema genera un ensayo completo, o una imagen compleja, en función de sus parámetros. 

Los modelos de lenguaje grandes (LLM) se entrenaron explícitamente con grandes cantidades de datos de texto para tareas de PLN y contenían una cantidad significativa de parámetros, que generalmente superaban los 100 millones. Facilitan el procesamiento y la generación de textos en lenguaje natural para diversas tareas. Cada modelo tiene sus fortalezas y debilidades, y la elección de cuál usar depende de la tarea específica del PLN y las características de los datos que se analizan. Elegir el LLM correcto para un trabajo específico requiere experiencia en LLM.

BERT está diseñado para comprender las relaciones bidireccionales entre las palabras de una oración y se utiliza principalmente para la clasificación de tareas, la respuesta a preguntas y el reconocimiento de entidades nombradas. GPT, por otro lado, es un modelo unidireccional basado en transformadores que se utiliza principalmente para tareas de generación de texto, como traducción de idiomas, resumen y creación de contenido. T5 también es un modelo basado en transformadores; sin embargo, se diferencia de BERT y GPT en que se entrena con un enfoque de texto a texto y se puede ajustar para diversas tareas de procesamiento de lenguaje natural, como traducción de idiomas, resumen y respuesta a preguntas.

Aceleración y reducción del tiempo de creación de valor

Al estar previamente entrenados en cantidades masivas de datos, estos modelos fundacionales ofrecen una gran aceleración en el ciclo de vida del desarrollo de IA, lo que permite a las empresas centrarse en el ajuste para sus casos de uso específicos. A diferencia de la creación de modelos de PLN personalizados para cada dominio, los modelos fundacionales permiten a las empresas reducir el tiempo de creación de valor de meses a semanas. En las interacciones con los clientes, IBM Consulting está viendo una reducción de hasta el 70 % en el tiempo de creación de valor para casos de uso de PLN, como el resumen de transcripciones del centro de atención telefónica, el análisis de revisiones y más. 

Desplegar modelos fundacionales de manera responsable

Dado el costo de entrenar y mantener los modelos fundacionales, las empresas tendrán que tomar decisiones sobre cómo incorporarlos y desplegarlos para sus casos de uso. Hay consideraciones específicas para los casos de uso y los puntos de decisión en torno al costo, el esfuerzo, la privacidad de datos, la propiedad intelectual y la seguridad. Es posible utilizar una o varias opciones de despliegue dentro de una empresa, sopesando estos puntos de decisión. 

Los modelos fundacionales acelerarán drásticamente la adopción de IA en los negocios al reducir los requisitos de etiquetado, lo que facilitará que las empresas experimenten con IA, creen automatización y aplicaciones eficientes impulsadas por IA, y desplieguen IA en una gama más amplia de situaciones de misión crítica. El objetivo de IBM Consulting es llevar el poder de los modelos fundacionales a cada empresa en un entorno de nube híbrida sin fricciones. 

Para obtener más información, vea cómo se puede utilizar la IA generativa para maximizar las experiencias, la toma de decisiones y el valor empresarial, y cómo IBM Consulting aporta un enfoque valioso y responsable a la IA.

 

Autor

Manish Goyal

Senior Partner - Global AI & Analytics Leader

IBM Consulting

Shobhit Varshney

VP & Sr. Partner, AI, Data & Automation Leader, Americas

IBM

Eniko Rozsa

Distinguished Engineer, CTO for the Global AI & Analytics Practice, IBM Consulting

Soluciones relacionadas
IBM watsonx.ai

Entrene, valide, ajuste y despliegue IA generativa, modelos fundacionales y capacidades de machine learning con IBM watsonx.ai, un estudio empresarial de próxima generación para creadores de IA. Diseñe aplicaciones de IA en menos tiempo y con menos datos.

Descubra watsonx.ai
Soluciones de inteligencia artificial

Ponga la IA a trabajar en su negocio con la experiencia en IA líder en la industria y la cartera de soluciones de IBM a su lado.

Explore las soluciones de IA
Servicios de IA

Reinvente los flujos de trabajo y las operaciones críticas añadiendo IA para maximizar las experiencias, la toma de decisiones en tiempo real y el valor empresarial.

Conozca los servicios de IA
Dé el siguiente paso

Obtenga acceso único a capacidades que abarcan el ciclo de vida del desarrollo de IA. Produzca potentes soluciones de IA con interfaces fáciles de usar, flujos de trabajo y acceso a API y SDK estándar de la industria.

Explore watsonx.ai Reserve una demostración en vivo