Google AI Ultra: cómo convertir una suscripción en un pool de agentes paralelos y consenso entre modelos

Q: ¿Cuál es la fuente?

Publicado originalmente en Habr AI. Hamidun News procesa y adapta los materiales con IA.

Q: ¿Cuándo se publicó?

30 abr 2026. Tiempo de lectura: 3 min.

Google AI Ultra puede usarse no solo como acceso a Gemini, sino también como base para el desarrollo multiagente. En un esquema con un pool de workers en…

Redacción de Hamidun News

Monitoreo de AI · Habr AI

30 abr 2026· 2 min

Procesado por IA desde Habr AI; editado por Hamidun News

Google AI Ultra: cómo convertir una suscripción en un pool de agentes paralelos y consenso entre modelos — Fuente: Habr AI. Collage: Hamidun News.

◐ Escuchar artículo

Google AI Ultra puede verse no como una cara suscripción a Gemini, sino como la base para tu propio entorno multi-agente. La idea es distribuir tareas rutinarias entre workers de fondo, mientras usas el agente principal como orquestrador y revisor de soluciones.

Suscripción como Infraestructura

La tesis principal de este análisis es simple: el precio de Ultra parece alto, pero puede justificarse no por el número de chats, sino por la arquitectura del trabajo. En lugar de meter un modelo en refactorización infinita, la propuesta es una combinación de Antigravity IDE, Claude como agente principal y Gemini CLI como un pool de ejecutores casi ilimitado. Si se agota el límite diario de un modelo, el escenario no se derrumba: el orquestrador cambia a otro modelo y las tareas de fondo continúan por separado.

Este enfoque resuelve dos problemas a la vez. El primero es el coste de tokens en escenarios de API clásicos, donde cada agente auxiliar consume presupuesto. El segundo es el cuello de botella de una única sesión IDE: aunque el entorno pueda llamar sub-agentes, es difícil gestionar, asignar roles y construir procesos repetibles.

Aquí se presenta como una transición de una ventana inteligente a un equipo completo de agentes, donde algunos manejan investigación, algunos código y algunos verifican la solución propuesta.

Cómo Funciona el Pool

Para esto, se propone un servidor MCP personalizado llamado Agent-Pool-MCP. Funciona en un modelo de pull: la sesión principal no espera a que el ejecutor de fondo termine una tarea, simplemente obtiene un task_id y sigue adelante. Antes de un cambio complejo, puedes primero enviar investigación en modo de solo lectura, luego preguntar por separado a un segundo modelo vía consult_peer y solo entonces lanzar la refactorización. En lugar de un escenario lineal—piensa, haz, verifica—obtienes un pipeline donde diferentes etapas se ejecutan en paralelo y no se bloquean mutuamente.

el agente IDE principal establece tareas y recopila resultados
workers de fondo en Gemini CLI realizan análisis, código y verificaciones
consult_peer da una segunda opinión de otro modelo antes de cambios de código
directorio compartido `.agent/delegation/` enruta artefactos entre agentes
skills y workflows definen roles, checklists y pipelines estándar

La regla clave aquí es extremadamente estricta: los agentes no deben editar los mismos archivos simultáneamente. Uno escribe conclusiones en un archivo markdown separado, otro las lee y formula una propuesta arquitectónica, un tercero audita templates. Esto elimina la mayoría de colisiones y convierte el sistema de agentes en algo como un equipo de desarrollo con carriles separados de responsabilidad. El principio se afirma de forma directa:

Nadie toca los archivos de los demás.

Consenso y Control

La parte más interesante es el consenso entre modelos. Como el pool de workers se construye en Gemini CLI, otro modelo asume el papel de agente IDE principal para obtener no auto-acuerdo, sino validación externa real de la idea. En el ejemplo, Claude propone una solución arquitectónica y Gemini busca puntos ciegos y devuelve un veredicto como AGREE o SUGGEST_CHANGES antes de que alguien cambie la base de código. Encima de esto se construye orquestración fractal, donde el orquestrador puede generar nuevos equipos y sub-equipos anidados casi como gestores de ingeniería y desarrolladores en una estructura regular.

El comportamiento de agentes en espera se discute por separado. Sin ajuste adicional, o sondean sin sentido el estado de una tarea de fondo, o se apresuran a hacerla ellos mismos y duplican trabajo. Para esto, se añade al sistema una pista llamada on_wait_hint: le dice al modelo cuándo cambiar a otra tarea útil y cuándo, por el contrario, simplemente esperar el resultado. El énfasis final es seguridad: cualquier servidor MCP debe considerarse un punto potencial de inyección de prompt; fija versiones, restringe acceso al sistema de archivos y no pases secretos en prompts.

Qué Significa Esto

Este análisis ilustra bien un nuevo desplazamiento en el mercado de herramientas de IA: el valor de una suscripción ahora se mide no solo por la calidad del modelo, sino también por cuán fácil es construir una infraestructura de agentes funcional a partir de él. Si este enfoque prospera, los planes de IA caros venderán no más respuestas, sino un entorno completo para desarrollo paralelo, investigación y revisión de IA interna.

Hamidun News

Noticias de AI sin ruido. Selección editorial diaria de más de 400 fuentes. Producto de Zhemal Khamidun, Head of AI en Alpina Digital.

Canal de Telegram RSS hamidun.com

¿Quieres dejar de leer sobre IA y empezar a usarla?

AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.

🎓 Academy — 7 días gratis Consulta gratuita