xAI запустила /goal в Grok Build: автономный агент планирует и верифицирует многошаговые задачи
xAI добавила в Grok Build режим /goal — автономное выполнение длинных многошаговых задач без ручного контроля каждого шага. Вы передаёте одну цель, агент сам…
Processado por IA de MarkTechPost; editado por Hamidun News
xAI lançou /goal no Grok Build: agente autônomo planeja e verifica tarefas multi-etapas
xAI lançou o modo /goal no Grok Build — uma ferramenta para execução autônoma de tarefas longas e multi-etapas que constrói um plano por conta própria, trabalha através de uma checklist e verifica o resultado até sua conclusão completa.
Como /goal funciona
O princípio de funcionamento difere do diálogo usual com um LLM. Você formula um objetivo único — por exemplo, "implemente autenticação OAuth", "escreva e teste um parser JSON" ou "migre um componente de class para hooks" — e o passa para o agente. Depois /goal assume o controle.
O agente analisa a tarefa, constrói um plano passo a passo e o divide em ações específicas. Cada ação é executada de forma independente: o agente escreve código, executa comandos, verifica resultados intermediários. Se algo dá errado — ele corrige a abordagem sem sua participação. O ciclo de planejamento → execução → verificação se repete até que o objetivo original seja totalmente alcançado.
No modo usual, um desenvolvedor conduz um diálogo com um LLM: passa um prompt, recebe uma resposta, corrige, esclarece, solicita novamente. Em /goal, você delega não apenas a execução da tarefa, mas também o gerenciamento de todo o processo. Este é um nível fundamentalmente diferente de autonomia.
Verificação built-in de resultado
A característica-chave do modo é a verificação built-in em cada etapa. /goal não executa etapas mecanicamente em sequência: após cada estágio, o agente avalia se o resultado intermediário corresponde às expectativas e só então avança.
Para tarefas de coding multi-etapas, isso é crítico:
- Escrever código — etapa 1, não o resultado final
- Executar testes e garantir que passem — etapa 2
- Verificar que o novo código não quebrou o comportamento existente — etapa 3
- Confirmar que o objetivo foi totalmente alcançado — verificação final
A falta de verificação é uma das reclamações mais comuns sobre agentes de coding existentes. A ferramenta tecnicamente "completou" a tarefa, mas o resultado não corresponde ao que é necessário. Erros "silenciosos" — quando um agente avança confiante por um caminho errado — são um dos cenários mais desafiadores em sistemas autônomos. /goal tenta resolver isso.
/goal em contexto de mercado
xAI posiciona o Grok Build como um ambiente de desenvolvimento completo onde Grok participa do ciclo de criação de código, em vez de simplesmente responder perguntas. /goal é o próximo passo nesta estratégia.
"Você passa um objetivo único, o agente planeja a abordagem, segue
pela checklist e verifica o resultado até a conclusão", — é assim que a equipe xAI descreve o modo.
O mercado de agentes para desenvolvedores está se saturando. GitHub Copilot Workspace oferece sessões de planejamento multi-etapas diretamente no repositório. Devin da Cognition se posiciona como um agente desenvolvedor completamente autônomo. JetBrains, Cursor e outras IDEs integram capacidades de agente. Google e Anthropic desenvolvem modos de agente em suas plataformas. Diante deste cenário, /goal é uma resposta lógica da xAI: um modo autônomo onde os usuários já trabalham com código.
Notavelmente, agentes autônomos estão se tornando uma funcionalidade padrão em velocidade notável, em vez de desenvolvimento experimental. Um ano atrás, tais capacidades eram limitadas a ferramentas B2B de nicho. Hoje estão sendo lançadas diretamente em produtos de massa para desenvolvedores.
O que isso significa
Quando uma ferramenta planeja, executa e verifica por conta própria, o desenvolvedor muda para um modo de definição de tarefas em vez de microgerenciar cada etapa. Para projetos de coding longos, isso muda todo o cenário de trabalho. A pergunta não é mais se agentes autônomos são necessários — eles estão aqui. A pergunta é com que confiabilidade eles lidam com verificação quando a tarefa é realmente complexa.
Quer parar de ler sobre IA e começar a usar?
AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.
O essencial da IA — uma vez por semana
Sete histórias que realmente importaram, escolhidas a dedo. Sem ruído nem releases.
Pronto! Verifique seu e-mail para a confirmação.