Habr AI→ original

Google AI Ultra: cómo convertir una suscripción en un pool de agentes paralelos y consenso entre modelos

Google AI Ultra puede usarse no solo como acceso a Gemini, sino también como base para el desarrollo multiagente. En un esquema con un pool de workers en…

Procesado por IA desde Habr AI; editado por Hamidun News
Google AI Ultra: cómo convertir una suscripción en un pool de agentes paralelos y consenso entre modelos
Fuente: Habr AI. Collage: Hamidun News.
◐ Escuchar artículo

Google AI Ultra puede verse no como una cara suscripción a Gemini, sino como la base para tu propio entorno multi-agente. La idea es distribuir tareas rutinarias entre workers de fondo, mientras usas el agente principal como orquestrador y revisor de soluciones.

Suscripción como Infraestructura

La tesis principal de este análisis es simple: el precio de Ultra parece alto, pero puede justificarse no por el número de chats, sino por la arquitectura del trabajo. En lugar de meter un modelo en refactorización infinita, la propuesta es una combinación de Antigravity IDE, Claude como agente principal y Gemini CLI como un pool de ejecutores casi ilimitado. Si se agota el límite diario de un modelo, el escenario no se derrumba: el orquestrador cambia a otro modelo y las tareas de fondo continúan por separado.

Este enfoque resuelve dos problemas a la vez. El primero es el coste de tokens en escenarios de API clásicos, donde cada agente auxiliar consume presupuesto. El segundo es el cuello de botella de una única sesión IDE: aunque el entorno pueda llamar sub-agentes, es difícil gestionar, asignar roles y construir procesos repetibles.

Aquí se presenta como una transición de una ventana inteligente a un equipo completo de agentes, donde algunos manejan investigación, algunos código y algunos verifican la solución propuesta.

Cómo Funciona el Pool

Para esto, se propone un servidor MCP personalizado llamado Agent-Pool-MCP. Funciona en un modelo de pull: la sesión principal no espera a que el ejecutor de fondo termine una tarea, simplemente obtiene un task_id y sigue adelante. Antes de un cambio complejo, puedes primero enviar investigación en modo de solo lectura, luego preguntar por separado a un segundo modelo vía consult_peer y solo entonces lanzar la refactorización. En lugar de un escenario lineal—piensa, haz, verifica—obtienes un pipeline donde diferentes etapas se ejecutan en paralelo y no se bloquean mutuamente.

  • el agente IDE principal establece tareas y recopila resultados
  • workers de fondo en Gemini CLI realizan análisis, código y verificaciones
  • consult_peer da una segunda opinión de otro modelo antes de cambios de código
  • directorio compartido `.agent/delegation/` enruta artefactos entre agentes
  • skills y workflows definen roles, checklists y pipelines estándar

La regla clave aquí es extremadamente estricta: los agentes no deben editar los mismos archivos simultáneamente. Uno escribe conclusiones en un archivo markdown separado, otro las lee y formula una propuesta arquitectónica, un tercero audita templates. Esto elimina la mayoría de colisiones y convierte el sistema de agentes en algo como un equipo de desarrollo con carriles separados de responsabilidad. El principio se afirma de forma directa:

Nadie toca los archivos de los demás.

Consenso y Control

La parte más interesante es el consenso entre modelos. Como el pool de workers se construye en Gemini CLI, otro modelo asume el papel de agente IDE principal para obtener no auto-acuerdo, sino validación externa real de la idea. En el ejemplo, Claude propone una solución arquitectónica y Gemini busca puntos ciegos y devuelve un veredicto como AGREE o SUGGEST_CHANGES antes de que alguien cambie la base de código. Encima de esto se construye orquestración fractal, donde el orquestrador puede generar nuevos equipos y sub-equipos anidados casi como gestores de ingeniería y desarrolladores en una estructura regular.

El comportamiento de agentes en espera se discute por separado. Sin ajuste adicional, o sondean sin sentido el estado de una tarea de fondo, o se apresuran a hacerla ellos mismos y duplican trabajo. Para esto, se añade al sistema una pista llamada on_wait_hint: le dice al modelo cuándo cambiar a otra tarea útil y cuándo, por el contrario, simplemente esperar el resultado. El énfasis final es seguridad: cualquier servidor MCP debe considerarse un punto potencial de inyección de prompt; fija versiones, restringe acceso al sistema de archivos y no pases secretos en prompts.

Qué Significa Esto

Este análisis ilustra bien un nuevo desplazamiento en el mercado de herramientas de IA: el valor de una suscripción ahora se mide no solo por la calidad del modelo, sino también por cuán fácil es construir una infraestructura de agentes funcional a partir de él. Si este enfoque prospera, los planes de IA caros venderán no más respuestas, sino un entorno completo para desarrollo paralelo, investigación y revisión de IA interna.

ZK
Hamidun News
Noticias de AI sin ruido. Selección editorial diaria de más de 400 fuentes. Producto de Zhemal Khamidun, Head of AI en Alpina Digital.

¿Quieres dejar de leer sobre IA y empezar a usarla?

AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.

¿Qué te parece?
Cargando comentarios…