Desde su lanzamiento en noviembre de 2022, ChatGPT de OpenAI ha capturado la imaginación tanto de los consumidores como de los líderes empresariales al demostrar el potencial que tiene la IA generativa para transformar drásticamente la forma en que vivimos y trabajamos. A medida que el alcance de su impacto en la sociedad continúa desarrollándose, las organizaciones empresariales y de gobierno están creando políticas sobre el uso de la tecnología por parte de los empleados o incluso restringiendo el acceso a ChatGPT.
Los más prudentes entre ellos han sido evaluar las formas en que pueden aplicar IA a sus organizaciones y prepararse para un futuro que ya está aquí. Los más avanzados están cambiando su forma de pensar, pasando de considerar la IA como un complemento secundario a replantearse los flujos de trabajo críticos con la IA como elemento central.
Boletín de la industria
Obtenga insights curados sobre las noticias más importantes e intrigantes de la IA. Suscríbase a nuestro boletín semanal Think. Consulte la Declaración de privacidad de IBM .
Su suscripción se entregará en inglés. En cada boletín, encontrará un enlace para darse de baja. Puede gestionar sus suscripciones o darse de baja aquí. Consulte nuestra Declaración de privacidad de IBM para obtener más información.
El mercado global de la IA generativa se está acercando a un punto de inflexión, con una valoración de 8 mil millones de dólares y una CAGR estimada del 34.6 % para 2030. Dado que se espera que más de 85 millones de puestos de trabajo queden vacantes para ese momento, es necesario crear operaciones más inteligentes con IA y automatización para ofrecer la eficiencia, la eficacia y las experiencias que esperan los líderes empresariales y los stakeholders.
La IA generativa presenta una oportunidad convincente para aumentar los esfuerzos de los empleados y hacer que la empresa sea más productiva. Pero a medida que los altos ejecutivos líderes realizan una investigación de soluciones de IA generativa, están descubriendo más preguntas: ¿qué caso de uso ofrecerá el mayor valor para mi negocio? ¿Qué tecnología de IA se adapta mejor a mis necesidades? ¿Es segura? ¿Es sostenible? ¿Cómo se gobierna? ¿Y cómo me aseguro de que mis proyectos de IA tengan éxito?
Después de haber trabajado con modelos fundacionales durante varios años, IBM Consulting, IBM Technology e IBM Research han desarrollado un punto de vista fundamentado sobre lo que se necesita para obtener valor del despliegue responsable de la IA en toda la empresa.
Como su nombre indica, la IA generativa genera imágenes, música, voz, código, video o texto, al tiempo que interpreta y manipula datos preexistentes. La IA generativa no es un concepto nuevo: las técnicas de machine learning detrás de la IA generativa han evolucionado en la última década. El enfoque más reciente se basa en una arquitectura de redes neuronales, denominada "transformadores". Combinando la arquitectura transformadora con aprendizaje no supervisado, surgieron grandes modelos fundacionales que superan los puntos de referencia existentes capaces de manejar múltiples modalidades de datos.
Estos modelos grandes se denominan modelos fundacionales, ya que sirven como punto de partida para el desarrollo de modelos más avanzados y complejos. Al construir sobre un modelo fundacional, podemos crear modelos más especializados y sofisticados adaptados a casos de uso o dominios específicos. Los primeros ejemplos de modelos, como GPT-3, BERT, T5 o DALL-E, han demostrado lo que es posible: se ingresa una breve instrucción y el sistema genera un ensayo completo, o una imagen compleja, en función de sus parámetros.
Los modelos de lenguaje grandes (LLM) se entrenaron explícitamente con grandes cantidades de datos de texto para tareas de PLN y contenían una cantidad significativa de parámetros, que generalmente superaban los 100 millones. Facilitan el procesamiento y la generación de textos en lenguaje natural para diversas tareas. Cada modelo tiene sus fortalezas y debilidades, y la elección de cuál usar depende de la tarea específica del PLN y las características de los datos que se analizan. Elegir el LLM correcto para un trabajo específico requiere experiencia en LLM.
BERT está diseñado para comprender las relaciones bidireccionales entre las palabras de una oración y se utiliza principalmente para la clasificación de tareas, la respuesta a preguntas y el reconocimiento de entidades nombradas. GPT, por otro lado, es un modelo unidireccional basado en transformadores que se utiliza principalmente para tareas de generación de texto, como traducción de idiomas, resumen y creación de contenido. T5 también es un modelo basado en transformadores; sin embargo, se diferencia de BERT y GPT en que se entrena con un enfoque de texto a texto y se puede ajustar para diversas tareas de procesamiento de lenguaje natural, como traducción de idiomas, resumen y respuesta a preguntas.
Al estar previamente entrenados en cantidades masivas de datos, estos modelos fundacionales ofrecen una gran aceleración en el ciclo de vida del desarrollo de IA, lo que permite a las empresas centrarse en el ajuste para sus casos de uso específicos. A diferencia de la creación de modelos de PLN personalizados para cada dominio, los modelos fundacionales permiten a las empresas reducir el tiempo de creación de valor de meses a semanas. En las interacciones con los clientes, IBM Consulting está viendo una reducción de hasta el 70 % en el tiempo de creación de valor para casos de uso de PLN, como el resumen de transcripciones del centro de atención telefónica, el análisis de revisiones y más.
Dado el costo de entrenar y mantener los modelos fundacionales, las empresas tendrán que tomar decisiones sobre cómo incorporarlos y desplegarlos para sus casos de uso. Hay consideraciones específicas para los casos de uso y los puntos de decisión en torno al costo, el esfuerzo, la privacidad de datos, la propiedad intelectual y la seguridad. Es posible utilizar una o varias opciones de despliegue dentro de una empresa, sopesando estos puntos de decisión.
Los modelos fundacionales acelerarán drásticamente la adopción de IA en los negocios al reducir los requisitos de etiquetado, lo que facilitará que las empresas experimenten con IA, creen automatización y aplicaciones eficientes impulsadas por IA, y desplieguen IA en una gama más amplia de situaciones de misión crítica. El objetivo de IBM Consulting es llevar el poder de los modelos fundacionales a cada empresa en un entorno de nube híbrida sin fricciones.
Para obtener más información, vea cómo se puede utilizar la IA generativa para maximizar las experiencias, la toma de decisiones y el valor empresarial, y cómo IBM Consulting aporta un enfoque valioso y responsable a la IA.
Entrene, valide, ajuste y despliegue IA generativa, modelos fundacionales y capacidades de machine learning con IBM watsonx.ai, un estudio empresarial de próxima generación para creadores de IA. Diseñe aplicaciones de IA en menos tiempo y con menos datos.
Ponga la IA a trabajar en su negocio con la experiencia en IA líder en la industria y la cartera de soluciones de IBM a su lado.
Reinvente los flujos de trabajo y las operaciones críticas añadiendo IA para maximizar las experiencias, la toma de decisiones en tiempo real y el valor empresarial.