OpenAI, la empresa creadora de ChatGPT, está trabajando en una nueva tecnología de razonamiento bajo el nombre en clave «Strawberry». Según una fuente familiarizada con el tema y documentos internos revisados por Reuters, este proyecto busca mejorar las capacidades de razonamiento de sus modelos de inteligencia artificial.
OpenAI trabaja en la tecnología de razonamiento llamada Strawberry
El proyecto Strawberry, cuyos detalles no habían sido reportados previamente, es un esfuerzo de OpenAI para demostrar que sus modelos pueden ofrecer capacidades avanzadas de razonamiento. Equipos dentro de OpenAI están trabajando en este proyecto, según un documento interno visto por Reuters en mayo.
La fuente describió el plan como un trabajo en progreso, y no se pudo determinar qué tan cerca está Strawberry de estar disponible públicamente. El funcionamiento exacto de Strawberry se mantiene en secreto incluso dentro de OpenAI.
Objetivo de Strawberry: investigación profunda
El documento describe que los modelos Strawberry tienen como objetivo permitir que la IA de OpenAI no solo genere respuestas a consultas, sino que también pueda planificar con anticipación para navegar por Internet de manera autónoma y realizar lo que OpenAI llama «investigación profunda».
Esto es algo que hasta ahora ha eludido a los modelos de IA, según entrevistas con más de una docena de investigadores de IA. Al ser consultado sobre Strawberry, un portavoz de OpenAI dijo que desean que sus modelos de IA vean y comprendan el mundo más como lo hacemos nosotros.
El pasado de Strawberry y su progreso
Strawberry, anteriormente conocido como Q*, ya se consideraba un avance dentro de la empresa el año pasado. Dos fuentes describieron demostraciones capaces de responder preguntas complicadas de ciencia y matemáticas fuera del alcance de los modelos comerciales disponibles hoy en día.
Una fuente distinta informó que OpenAI ha probado internamente una IA que obtuvo más del 90% en un conjunto de datos de matemáticas, un punto de referencia de problemas de matemáticas de campeonato. No se pudo determinar si esto está relacionado con el proyecto Strawberry.
Mejorando la capacidad de razonamiento
OpenAI espera que esta innovación mejore drásticamente las capacidades de razonamiento de sus modelos de IA. Strawberry implica una forma especializada de procesar un modelo de IA después de haber sido preentrenado con grandes conjuntos de datos, según la fuente.
Los investigadores de IA coinciden en que el razonamiento es clave para que la IA alcance niveles de inteligencia humana o superhumana. Los modelos de lenguaje grandes pueden resumir textos densos y redactar prosa elegante rápidamente, pero a menudo fallan en problemas de sentido común.
Desafíos y comparaciones
Strawberry es un componente clave del plan de OpenAI para superar estos desafíos. En los últimos meses, la empresa ha señalado privadamente a desarrolladores y otras partes externas que está a punto de lanzar tecnología con capacidades de razonamiento significativamente más avanzadas.
El post-entrenamiento, una fase del desarrollo de un modelo que implica métodos como «fine-tuning», es fundamental para mejorar el rendimiento de los modelos de IA. Strawberry tiene similitudes con un método desarrollado en Stanford en 2022 llamado «Self-Taught Reasoner» o «STaR».
Tareas de largo horizonte
Entre las capacidades a las que apunta Strawberry está la realización de tareas de largo horizonte (LHT), que requieren que un modelo planifique y realice una serie de acciones durante un período prolongado. OpenAI está creando, entrenando y evaluando los modelos en un conjunto de datos de «investigación profunda».
OpenAI quiere que sus modelos utilicen estas capacidades para realizar investigaciones navegando por la web de manera autónoma con la asistencia de un «CUA», un agente informático que puede tomar acciones basadas en sus hallazgos.
Además, OpenAI planea probar estas capacidades en el trabajo de ingenieros de software y aprendizaje automático. Esta nueva tecnología promete ser un gran avance en la inteligencia artificial y está generando gran expectativa en la comunidad tecnológica.
Fuente: https://www.reuters.com/technology/artificial-intelligence/openai-working-new-reasoning-technology-under-code-name-strawberry-2024-07-12/