Google AI Ultra: como transformar uma assinatura em um pool de agentes paralelos e consenso entre modelos

O Google AI Ultra pode ser usado não apenas como acesso ao Gemini, mas também como base para desenvolvimento multiagente. Em um esquema com um pool de workers em segundo plano no Gemini CLI, o agente principal assume a orquestração e a verificação cruzada entre modelos das decisões. No centro da arquitetura está o servidor MCP Agent-Pool-MCP, que distribui tarefas, papéis e artefatos entre os agentes.

Khamidun Zhemal

Monitoramento de AI · Habr AI

30 de abr. de 2026· 2 min

Processado por IA de Habr AI; editado por Hamidun News

Google AI Ultra: como transformar uma assinatura em um pool de agentes paralelos e consenso entre modelos — Fonte: Habr AI. Colagem: Hamidun News.

◐ Ouvir artigo

Google AI Ultra pode ser visto não como uma cara assinatura do Gemini, mas como a base para seu próprio ambiente multi-agente. A ideia é distribuir tarefas rotineiras entre workers de fundo, enquanto usa o agente principal como orquestrador e revisor de soluções.

Assinatura como Infraestrutura

A tese principal desta análise é simples: o preço do Ultra parece alto, mas pode ser justificado não pelo número de chats, mas pela arquitetura do trabalho. Em vez de colocar um modelo em refatoração infinita, a proposta é uma combinação de Antigravity IDE, Claude como agente principal e Gemini CLI como um pool de executores quase ilimitado. Se o limite diário de um modelo acabar, o cenário não desaba: o orquestrador muda para outro modelo e as tarefas de fundo continuam separadamente.

Esta abordagem resolve dois problemas de uma vez. O primeiro é o custo de tokens em cenários de API clássicos, onde cada agente auxiliar consome orçamento. O segundo é o gargalo de uma única sessão IDE: mesmo que o ambiente possa chamar sub-agentes, é difícil gerenciar, atribuir papéis e construir processos repetíveis.

Aqui é apresentado como uma transição de uma janela inteligente para um time completo de agentes, onde alguns lidam com pesquisa, alguns com código e alguns verificam a solução proposta.

Como Funciona o Pool

Para isso, propõe-se um servidor MCP customizado chamado Agent-Pool-MCP. Funciona em um modelo de pull: a sessão principal não espera que o executor de fundo termine uma tarefa, apenas recebe um task_id e segue adiante. Antes de uma mudança complexa, você pode primeiro enviar pesquisa em modo somente leitura, depois perguntar separadamente um segundo modelo via consult_peer e apenas depois iniciar o refactoring. Em vez de um cenário linear—pense, faça, verifique—você tem um pipeline onde diferentes estágios rodam em paralelo e não se bloqueiam mutuamente.

o agente IDE principal define tarefas e coleta resultados
workers de fundo no Gemini CLI realizam análise, código e verificações
consult_peer oferece uma segunda opinião de outro modelo antes de mudanças de código
diretório compartilhado `.agent/delegation/` roteia artefatos entre agentes
skills e workflows definem papéis, checklists e pipelines padrão

A regra-chave aqui é extremamente rígida: agentes não devem editar os mesmos arquivos simultaneamente. Um escreve conclusões em um arquivo markdown separado, outro as lê e formula uma proposta arquitetônica, um terceiro audita templates. Isso elimina a maioria das colisões e transforma o sistema de agentes em algo como um time de desenvolvimento com lanes separados de responsabilidade. O princípio é afirmado de forma direta:

Ninguém toca nos arquivos um do outro.

Consenso e Controle

A parte mais interessante é o consenso entre modelos. Como o pool de workers é construído no Gemini CLI, outro modelo assume o papel de agente IDE principal para obter não auto-concordância, mas validação externa real da ideia. No exemplo, Claude propõe uma solução arquitetônica e Gemini busca pontos cegos e retorna um veredicto como AGREE ou SUGGEST_CHANGES antes de alguém mudar a base de código. Por cima disso há orquestração fractal, onde o orquestrador pode gerar novos times e sub-times aninhados quase como gerentes de engenharia e desenvolvedores em uma estrutura regular.

O comportamento de agentes em espera é discutido separadamente. Sem ajuste adicional, eles ou sondagem o status de uma tarefa de fundo sem sentido, ou correm para fazê-la eles mesmos e duplicam trabalho. Para isso, uma dica chamada on_wait_hint é adicionada ao sistema: ela diz ao modelo quando mudar para outra tarefa útil e quando, ao contrário, apenas esperar pelo resultado. A ênfase final é segurança: qualquer servidor MCP deve ser considerado um ponto potencial de injeção de prompt; travar versões, restringir acesso ao sistema de arquivos e não passar segredos em prompts.

O Que Isso Significa

Esta análise ilustra bem um novo deslocamento no mercado de ferramentas de IA: o valor de uma assinatura agora é medido não apenas pela qualidade do modelo, mas também por quão facilmente você pode construir uma infraestrutura de agentes funcional a partir dela. Se esta abordagem pegar, planos de IA caros venderão não mais respostas, mas um ambiente completo para desenvolvimento paralelo, pesquisa e revisão de IA interna.

Hamidun News

Notícias de AI sem ruído. Seleção editorial diária de mais de 50 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.

Canal do Telegram RSS hamidun.com

Quer parar de ler sobre IA e começar a usar?

AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.

🎓 Academy — 7 dias grátis Consultoria grátis