OpenAI está destinando sus principales recursos a crear un investigador de AI totalmente autónomo
OpenAI está cambiando sus prioridades y apostando por un investigador de AI totalmente autónomo. La primera etapa es un “becario de AI” para septiembre de…
Procesado por IA desde MIT Technology Review; editado por Hamidun News
OpenAI está cambiando el enfoque de investigación y apostando no por otro chatbot, sino por un investigador autónomo de IA. La empresa quiere desarrollar un sistema que pueda trabajar en problemas complejos durante semanas con una intervención humana mínima y que eventualmente se convierta en un verdadero 'laboratorio en un centro de datos.'
Nuevo Prioritario
Según Jacob Pachocki, Director Científico Jefe de OpenAI, el proyecto se está convirtiendo en un objetivo compartido por toda la empresa alrededor del cual deben converger modelos de razonamiento, sistemas de agentes y herramientas de interpretabilidad. El próximo hito es demostrar un 'pasante autónomo de IA' para septiembre de 2026: un sistema al que se le puedan asignar un conjunto limitado de tareas de investigación durante varios días de trabajo. La siguiente fase está planeada para 2028: un sistema multiagente completamente automatizado capaz de abordar problemas demasiado grandes o complejos para un único equipo de personas.
Para OpenAI, esto no es simplemente una dirección de investigación elegante. La empresa ya no es la única que marca el ritmo del mercado como lo fue en los primeros días de GPT, y ahora compite con Anthropic y Google DeepMind no solo en la calidad del modelo, sino también en lo que se convierte la pila de productos alrededor de ellos.
La apuesta por un investigador de IA parece ser un intento de ir más allá de un asistente de chat y codificación y crear la siguiente capa de automatización: un sistema que no solo responda consultas, sino que realice trabajo prolongado desde la formulación del problema hasta los resultados intermedios.
"Esencialmente, tendrás un laboratorio de investigación completo dentro de un centro de datos", dice
Pachocki.
Lo Que Ya Está Listo
OpenAI cree que un prototipo inicial de este enfoque ya es visible en Codex. Esta herramienta de agente puede escribir y ejecutar código, analizar documentos, crear visualizaciones, compilar resúmenes y manejar largas cadenas técnicas que los humanos tenían que trabajar manualmente antes.
Pachocki afirma explícitamente que la empresa quiere tomar lo que ha tenido éxito en la programación y transferir este modo de operación a una clase más ampla de problemas. La lógica es simple: si un agente puede manejar independientemente porciones sustanciales de trabajo de ingeniería, el mismo enfoque puede extenderse a la ciencia e investigación aplicada.
OpenAI espera que el futuro sistema tenga no una única función 'mágica', sino un conjunto de habilidades de investigación que puedan encadenarse:
- Analizar grandes volúmenes de texto, código y notas
- Proponer hipótesis y enfoques de verificación
- Dividir problemas grandes en subtareas y gestionarlas en paralelo
- Encontrar soluciones en matemática, física, biología, química y escenarios de política gubernamental
De acuerdo con OpenAI, la base técnica consiste en dos direcciones. Primero, los modelos de propósito general se han vuelto mejores en mantener el enfoque y el contexto durante períodos más largos: la transición de GPT-3 a GPT-4 ya demostró un crecimiento notable en la 'resistencia' en una sola tarea.
En segundo lugar, los modelos de razonamiento que trabajan a través de problemas paso a paso y pueden retroceder después de un error son más adecuados para ciclos autónomos largos. Además, los modelos se entrenan especialmente en tareas matemáticas y de codificación complejas para aprender a mantener un contexto extendido y gestionar múltiples subtareas simultáneamente.
Donde Están las Debilidades
La pregunta más obvia no es la ambición, sino la confiabilidad. Investigadores independientes reconocen que la idea de un científico autónomo de IA es una continuación lógica del éxito de los agentes de programación, pero advierten: una vez que un sistema debe ejecutar no solo un paso sino una larga cadena de acciones, la probabilidad de error en cada etapa comienza a acumularse.
En pruebas del Allen Institute for AI, modelos fuertes ya demostraron buen desempeño en tareas científicas, pero aún cometían errores regulares. Incluso si las versiones más nuevas han mejorado, el problema no desaparece: proponer una idea sólida es una cosa; llevar consistentemente una investigación de varios días a una conclusión correcta es otra.
Hay también una capa más difícil de riesgos. Pachocki dice que OpenAI está apostando por el monitoreo de cadena de pensamiento: el modelo deja una especie de notas de trabajo mientras resuelve, mientras que otros modelos o investigadores observan para asegurar que no se desvíe hacia un comportamiento peligroso o simplemente incorrecto.
Pero él mismo admite que el control completo aún no está en su lugar. Un sistema autónomo puede malinterpretar instrucciones, exceder los límites de la tarea, convertirse en un objetivo de ataque u obtener acceso a herramientas demasiado poderosas.
Por lo tanto, versiones verdaderamente poderosas de tales agentes, en su opinión, tendrán que mantenerse en entornos sandbox aislados y restringidos hasta que los mecanismos de supervisión sean significativamente más confiables.
Lo Que Esto Significa
Si OpenAI ejecuta siquiera parcialmente este plan, el próximo salto de IA estará vinculado no a chatbots más conversacionales, sino a sistemas que pueden ser asignados porciones de trabajo intelectual real durante días o semanas.
Pero es precisamente aquí donde reside la verdadera prueba: el mercado cree fácilmente en el progreso rápido de los agentes, mientras que la ciencia y la seguridad exigirán no efectos de demostración, sino resultados reproducibles bajo supervisión humana.
¿Quieres dejar de leer sobre IA y empezar a usarla?
AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.