Los nuevos modelos de OpenAI desglosan tareas complejas

Los últimos modelos de o1-preview de OpenAI abordan problemas complejos dividiéndolos en etapas, lo que podría cambiar la forma en que los sectores abordan los desafíos.

Este enfoque, conocido como razonamiento por cadena de pensamiento, supone un cambio significativo respecto a los modelos de IA anteriores que a menudo producían respuestas sin explicar su razonamiento. Estos avances podrían remodelar la forma en que las empresas y los investigadores abordan tareas complejas de resolución de problemas.

"Estos modelos son mejores en tareas que requieren más lógica y razonamiento porque llevan tiempo a Think a través del problema", afirma Chris Hay, ingeniero distinguido de IBM. "Es como si estuvieran mostrando su trabajo, paso a paso".

Razonamiento en cadena de pensamiento

El enfoque de la cadena de pensamiento permite a los usuarios ver cómo la IA llega a sus conclusiones. Hay explicó el proceso: "Si le preguntas a un niño, por ejemplo, cuánto es 25 multiplicado por 10 más cinco, hay tres pasos. Es posible que te dé una respuesta confusa. Pero tú le dices: no, no, tienes que desglosarlo... es como en la escuela, tienes que mostrar tu trabajo".

Nathalie Baracaldo, investigadora científica sénior de seguridad de IA de IBM, destacó la importancia de este avance: "la principal diferencia radica en que ahora podemos saber cómo ha llegado el modelo a una decisión". “Tenemos explicaciones sobre lo que hizo el agente que son muy útiles para entender por qué ocurrió algo”.

Este nivel de transparencia podría tener implicaciones de gran alcance en diversos sectores. En el desarrollo de software, por ejemplo, los modelos muestran capacidades de codificación mejoradas con menos errores. Hay señaló: "Están codificando mejor y alucinando menos", refiriéndose a los casos en los que la IA produce información plausible pero incorrecta.

Los nuevos modelos también incorporan el aprendizaje por refuerzo en su proceso de entrenamiento. Hay explicó: "También han cambiado la forma en que se entrenan en los modelos base. Hablan de cómo utilizan el aprendizaje de refuerzo… para enseñar y entrenar esos modelos”.

Colaboración entre humanos e IA

El uso más eficaz de estos modelos avanzados de IA implicará probablemente una asociación entre la experiencia humana y la capacidad de las máquinas. "El humano siempre tendrá que proporcionar información, estar de acuerdo con la planificación y verificar estas cosas", dijo Hay.

Hay advirtió que no hay que sobreestimar las capacidades de los modelos: "Creo que se pueden obtener outputs excelentes. Creo que cuando la gente escucha AGI, piensa en una gran cabeza palpitante en las nubes... e realidad, si lo pienso bien, los modelos, tal y como son, con su predicción de tokens siguientes, sus buenos datos de entrenamiento y su planificación, etc., hacen un trabajo bastante bueno, mejor que los humanos en muchas tareas".

El desarrollo de estos modelos plantea interrogantes sobre la naturaleza de la inteligencia artificial y su comparación con la cognición humana. Los nuevos modelos han demostrado una destreza notable en ciertas áreas, superando a los humanos en pruebas estandarizadas como el examen de la barra y los SAT. Sin embargo, siguen teniendo dificultades con tareas que la mayoría de los humanos encuentran intuitivas.

Hay señaló que los modelos pueden tener dificultades con tareas que los humanos consideran sencillas: "El modelo sobresale en tareas específicas e individuales. Sin embargo, actualmente tiene dificultades para distinguir entre las diferentes partes de una conversación. Esto genera confusión en su capacidad para gestionar varios conceptos simultáneamente. El modelo enfatiza demasiado el contexto y a menudo considera demasiada información irrelevante al procesar las solicitudes”.

Baracaldo añadió una nota de precaución: "Aunque este modelo es impresionante, a veces comete errores. Y si lees el informe técnico, a veces crea soluciones que un experto, un ser humano, piensa que no son factibles, pero el modelo no conoce todos los supuestos”.

Las implicaciones de estos avances van más allá del sector tecnológico. En la investigación y el mundo académico, podrían acelerar el ritmo de descubrimiento ayudando en el análisis de datos complejos y la generación de hipótesis. En campos como la medicina y el derecho, podrían servir como herramientas para aumentar la experiencia humana, lo que podría conducir a diagnósticos más precisos o análisis legales más completos.

Hay resumió el valor práctico de los nuevos modelos para las empresas: “Son codificadores mucho mejores que antes”.