Los sistemas de IA compuestos son configuraciones avanzadas que combinan múltiples modelos de IA, técnicas o sistemas para resolver problemas complejos con más eficacia de la que podría hacerlo un único modelo de inteligencia artificial (IA). Estos sistemas integran diferentes componentes, cada uno especializado en una tarea particular para trabajar de forma colaborativa o secuencial.
Aunque se presta mucha atención a los modelos de lenguaje de gran tamaño (LLM), estos modelos masivos de machine learning (ML) se enfrentan a limitaciones. Su funcionamiento y desarrollo son caros y lentos. Carecen de experiencia específica en el dominio y no siempre son expertos en gestionar tareas complejas que involucran muchos pasos en varios sistemas.
Debido a estas limitaciones, los investigadores han descubierto que complementar los modelos monolíticos con otros modelos y herramientas, cada uno optimizado para una función específica, puede constituir un enfoque más eficaz.
Una entrada de blog de 2024 del Laboratorio de Investigación de Inteligencia Artificial de Berkeley (BAIR) fue una visión clarificadora temprana de cómo serían los sistemas compuestos de IA. En la entrada se propuso que se podrían obtener mejores resultados mediante la construcción de sistemas de IA compuestos y que el futuro de la IA implicaría que las organizaciones reunieran LLM, sistemas de recuperación, agentes de IA y herramientas externas, cada uno optimizado para tareas específicas.
Hay numerosos beneficios en la orquestación de varios modelos individuales y componentes interactivos.
Al dividir las tareas entre modelos especializados, los sistemas compuestos reducen la carga cognitiva en los componentes individuales de la IA. Por ejemplo, un modelo podría centrarse en analizar datos estructurados mientras que otro interpreta datos no estructurados, como imágenes o texto. Esta división del trabajo conduce a un mejor rendimiento y una mayor precisión en comparación con los sistemas de un solo modelo.
Los LLM son impresionantes y lo son cada vez más cuando se les dota de más recursos computacionales, pero se topan con límites de rendimiento y rendimientos decrecientes debido a las leyes de escalabilidad. A veces, en lugar de dedicar más recursos informáticos a un LLM, es preferible delegar ciertas tareas en otro modelo, agente o herramienta que no necesite tantos recursos.
Combinar varios modelos para realizar una tarea a veces puede ser más rápido que entrenar un solo LLM para hacerlo. Además, los sistemas compuestos pueden procesar diferentes tipos de datos simultáneamente, lo que permite la toma de decisiones en tiempo real. Esto resulta crítico en aplicaciones de IA como la detección del fraude, donde las respuestas rápidas son esenciales, o en aplicaciones edge, donde se debe minimizar la latencia.
Los sistemas compuestos son muy versátiles y aplicables a diversos casos de uso. Esta versatilidad convierte a los sistemas de IA compuestos en la opción preferida de las empresas que pretenden optimizar las operaciones en múltiples ámbitos.
Las organizaciones pueden beneficiarse de diseños de sistemas que utilizan una combinación de componentes previamente entrenados, soluciones de código abierto y módulos personalizados. Cada componente se puede actualizar o reemplazar independientemente a medida que la tecnología evoluciona sin necesidad de revisar todo el sistema. Al distribuir tareas entre varios modelos, los sistemas compuestos se benefician del beneficio y la resiliencia ante fallos de componentes individuales.
Los métodos compuestos, incluida la generación aumentada por recuperación (RAG), amplían las capacidades de los LLM al permitirles acceder a fuentes de datos fuera de sus conjuntos de datos de entrenamiento iniciales conjuntos de datos. La combinación de diferentes modelos permite a los desarrolladores optimizar para objetivos específicos, como la velocidad o la experiencia en el dominio.
Los LLM pueden ser difíciles de gestionar, propensos a las alucinaciones y a tomar decisiones que no siempre son fácilmente explicables. Una solución de IA compuesta puede ayudar a controlar las entradas y filtrar las salidas, lo que se traduce en un comportamiento más controlado que fomenta la confianza.
Los sistemas de IA compuestos ya se utilizan en casos de uso del mundo real, como:
Ciertas versiones de chatbots, como ChatGPT de OpenAI y Copilot de Microsoft, se basan en arquitecturas compuestas. ChatGPT, por ejemplo, amplía su utilidad a través de varias herramientas y API para tareas específicas.
Reúne un LLM, el generador de imágenes DALL-E y un complemento intérprete de código. Utiliza RAG para acceder dinámicamente a fuentes de datos externas y bases de conocimientos. Se utilizan modelos de IA independientes para detectar y filtrar contenidos nocivos o inapropiados antes de ofrecer una respuesta.
Aunque esta tecnología aún no se ha generalizado, los sistemas de vehículos autónomos utilizan modelos de visión artificial para detectar y reconocer objetos en el entorno del coche. Los algoritmos de fusión de sensores combinan datos de cámaras, LiDAR, radares y sensores ultrasónicos para crear un mapa tridimensional completo del entorno, lo que mejora el conocimiento de la situación.
Los modelos de aprendizaje por refuerzo gestionan la toma de decisiones, como determinar cuándo cambiar de carril, ajustar la velocidad o detenerse en un semáforo, en función de las condiciones en tiempo real.
Además, el procesamiento del lenguaje natural (PLN) permite al vehículo interpretar y responder a las órdenes habladas de los pasajeros. Estos componentes funcionan juntos de manera fluida para procesar grandes cantidades de datos, tomar decisiones inteligentes y rápidas y proporcionar una experiencia intuitiva.
Un sistema de IA compuesto para la atención al cliente combina varias tecnologías de IA para brindar un servicio eficiente, personalizado y receptivo. Por ejemplo, los modelos de PLN analizan las consultas de los clientes para extraer la intención y los detalles clave, lo que permite que el sistema comprenda el problema con precisión.
Una vez identificada la intención, un chatbot con IA generativa (IA gen) interactúa conversacionalmente con el cliente y le ofrece asistencia inmediata o aclara detalles adicionales. Al mismo tiempo, un sistema de recomendaciones sugiere soluciones pertinentes, como pasos para la solución de problemas, artículos de preguntas frecuentes o recomendaciones de productos adaptadas a las necesidades del cliente.
Para mejorar la experiencia, un modelo de análisis de sentimientos evalúa el tono y el estado emocional del cliente, lo que ayuda a priorizar los casos urgentes o de insatisfacción para la intervención humana. Esta combinación de componentes permite una atención al cliente rápida, inteligente y empática, reduciendo el tiempo de resolución y manteniendo al mismo tiempo altos niveles de satisfacción del cliente.
Un sistema compuesto de IA en las cadenas de suministro utiliza múltiples componentes de IA para optimizar la logística, la gestión de inventarios y la eficiencia general. Por ejemplo, los modelos de análisis predictivo pronostican la demanda analizando los datos históricos de ventas, las tendencias estacionales y las variables del mercado, lo que permite una planificación precisa del inventario.
Los sistemas de visión artificial monitorizan las operaciones del almacén, identificando ineficiencias o errores en tiempo real, como artículos extraviados o mercancías dañadas. Al mismo tiempo, los algoritmos de optimización de rutas determinan las rutas de entrega más eficientes, teniendo en cuenta factores como el tráfico, el clima y el consumo de combustible.
Además, el PLN permite la gestión automatizada de las comunicaciones con proveedores y clientes, como el procesamiento de órdenes de compra o la respuesta a consultas. Al integrar estos componentes, el sistema mejora la capacidad de respuesta de la cadena de suministro, reduce el desperdicio y ayuda a garantizar la entrega oportuna, al tiempo que se adapta dinámicamente a los cambios en la demanda y las condiciones externas.
Diseñar sistemas de IA compuestos implica integrar varios modelos de IA y componentes en marcos cohesivos capaces de abordar tareas complejas. Estos marcos proporcionan la infraestructura para combinar diversos modelos de IA y ayudan a garantizar una comunicación perfecta entre ellos.
En un sistema de IA compuesto, una lógica de control programada podría recurrir a un modelo o un LLM podría estar "a cargo", según los objetivos del sistema.
Ambos enfoques tienen claras ventajas y las distintas formas en las que los modelos y otros componentes pueden funcionar juntos en un sistema de IA son ilimitadas, por lo que los diseñadores tienen que pensar críticamente en su enfoque y estar dispuestos a experimentar con varias arquitecturas y combinaciones de componentes.
Las operaciones de machine learning (MLOps) se vuelven más complicadas con los flujos de trabajo compuestos. Por ejemplo, es difícil aplicar métricas coherentes en diferentes tipos de herramientas y modelos. Los investigadores de BAIRD afirman que surge una nueva fase del desarrollo de la IA junto con el cambio a sistemas compuestos para ayudar a lidiar con los desafíos presentados por el monitoreo, la depuración y otras preocupaciones operativas involucradas.