MarkTechPost→ original

xAI запустила /goal в Grok Build: автономный агент планирует и верифицирует многошаговые задачи

xAI добавила в Grok Build режим /goal — автономное выполнение длинных многошаговых задач без ручного контроля каждого шага. Вы передаёте одну цель, агент сам…

Procesado por IA desde MarkTechPost; editado por Hamidun News
xAI запустила /goal в Grok Build: автономный агент планирует и верифицирует многошаговые задачи
Fuente: MarkTechPost. Collage: Hamidun News.
◐ Escuchar artículo

xAI lanzó /goal en Grok Build: agente autónomo planifica y verifica tarefas multietapa

xAI lanzó el modo /goal en Grok Build — una herramienta para la ejecución autónoma de tareas largas y multietapa que construye un plan por su cuenta, trabaja a través de una lista de verificación y verifica el resultado hasta su finalización completa.

Cómo funciona /goal

El principio de funcionamiento difiere del diálogo habitual con un LLM. Usted formula un único objetivo — por ejemplo, "implementa autenticación OAuth", "escribe y prueba un analizador JSON" o "migra un componente de class a hooks" — y se lo pasa al agente. Luego /goal asume el control.

El agente analiza la tarea, construye un plan paso a paso y lo divide en acciones específicas. Cada acción se ejecuta de forma independiente: el agente escribe código, ejecuta comandos, verifica resultados intermedios. Si algo sale mal — corrige el enfoque sin su participación. El ciclo de planificación → ejecución → verificación se repite hasta que el objetivo original se alcance completamente.

En el modo habitual, un desarrollador mantiene un diálogo con un LLM: proporciona un prompt, obtiene una respuesta, corrige, aclara, solicita de nuevo. En /goal, usted delega no solo la ejecución de la tarea, sino también la gestión de todo el proceso. Este es un nivel fundamentalmente diferente de autonomía.

Verificación integrada de resultados

La característica clave del modo es la verificación integrada en cada paso. /goal no ejecuta pasos de forma mecánica en secuencia: después de cada etapa, el agente evalúa si el resultado intermedio coincide con las expectativas y solo entonces avanza.

Para tareas de coding multietapa, esto es crítico:

  • Escribir código — paso 1, no el resultado final
  • Ejecutar pruebas y asegurar que pasen — paso 2
  • Verificar que el código nuevo no rompió el comportamiento existente — paso 3
  • Confirmar que el objetivo se alcanzó completamente — verificación final

La falta de verificación es una de las quejas más comunes sobre los agentes de coding existentes. La herramienta técnicamente "completó" la tarea, pero el resultado no coincide con lo que se necesita. Los errores "silenciosos" — cuando un agente avanza confiadamente por el camino equivocado — son uno de los escenarios más desafiantes en sistemas autónomos. /goal intenta abordarlo.

/goal en el contexto del mercado

xAI posiciona Grok Build como un entorno de desarrollo completo donde Grok participa en el ciclo de creación de código, en lugar de simplemente responder preguntas. /goal es el siguiente paso en esta estrategia.

"Usted pasa un objetivo único, el agente planifica el enfoque, sigue

la lista de verificación y verifica el resultado hasta la finalización", — así es como el equipo de xAI describe el modo.

El mercado de agentes para desarrolladores se está saturando. GitHub Copilot Workspace ofrece sesiones de planificación multietapa directamente en el repositorio. Devin de Cognition se posiciona como un agente desarrollador completamente autónomo. JetBrains, Cursor y otros IDEs integran capacidades de agente. Google y Anthropic desarrollan modos de agente en sus plataformas. En este contexto, /goal es una respuesta lógica de xAI: un modo autónomo donde los usuarios ya trabajan con código.

Es notable cómo los agentes autónomos se están convirtiendo en una función estándar a una velocidad notable, en lugar de desarrollo experimental. Hace un año, tales capacidades estaban limitadas a herramientas B2B de nicho. Hoy se están lanzando directamente en productos de masas para desarrolladores.

Qué significa esto

Cuando una herramienta planifica, ejecuta y verifica por sí sola, el desarrollador cambia a un modo de definición de tareas en lugar de microgestionar cada paso. Para proyectos de coding largos, esto cambia todo el escenario de trabajo. La pregunta ya no es si se necesitan agentes autónomos — están aquí. La pregunta es con qué confiabilidad manejan la verificación cuando la tarea es realmente compleja.

ZK
Hamidun News
Noticias de AI sin ruido. Selección editorial diaria de más de 400 fuentes. Producto de Zhemal Khamidun, Head of AI en Alpina Digital.

¿Quieres dejar de leer sobre IA y empezar a usarla?

AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.

¿Qué te parece?
Cargando comentarios…