Jiqizhixin (机器之心)→ original

DeepMind: más agentes, ¿peores resultados?

DeepMind publicó una investigación que pone en duda la idea popular de que aumentar el número de agentes de AI en un sistema mejora el resultado final. Según…

Procesado por IA desde Jiqizhixin (机器之心); editado por Hamidun News
DeepMind: más agentes, ¿peores resultados?
Fuente: Jiqizhixin (机器之心). Collage: Hamidun News.
◐ Escuchar artículo

La industria de la inteligencia artificial ha vivido durante mucho tiempo bajo una lógica simple: más significa mejor. Más parámetros, más datos, más poder de cómputo. Ahora DeepMind desafía el siguiente paso de esta idea—la creencia de que aumentar el número de agentes de IA dentro de un sistema automáticamente conduce a un aumento en sus capacidades. La nueva investigación de la empresa sugiere que las arquitecturas multiagente tienen un techo estructural, y acercarse a él podría ser costoso para quienes han apostado por el escalado de agentes como el camino principal a seguir.

La idea de sistemas multiagente en sí no es nueva. Durante los últimos dos años, los principales laboratorios—OpenAI, Anthropic, Google—han promovido activamente un concepto en el que varios agentes de IA especializados trabajan juntos, distribuyendo tareas y verificando mutuamente los resultados. Se suponía que tal arquitectura imita la inteligencia colectiva: un agente escribe código, otro lo prueba, un tercero busca errores, y un coordinador general supervisa el proceso. La lógica parecía impecable—hasta que DeepMind comenzó a medir qué sucede realmente en la práctica.

La investigación encontró un efecto contraintuitivo: a partir de cierto umbral, agregar nuevos agentes no mejora el resultado sino que lo empeora. La razón radica en los costos de coordinación. Cada nuevo agente en el sistema no es simplemente poder de cómputo adicional, sino también una nueva fuente de contradicciones potenciales. Los agentes deben coordinar resultados intermedios, transmitir contexto y resolver conflictos de interpretación. Con un pequeño número de participantes, estos gastos generales son insignificantes. A medida que su número crece, comienzan a consumir las mismas ganancias para las que se creó el sistema. En cierto punto, el sistema deja de ser una orquesta y se convierte en una multitud.

Técnicamente, el problema se agrava por el hecho de que los modelos de lenguaje modernos carecen de un mecanismo confiable para resolver contradicciones entre agentes. Cuando dos agentes llegan a conclusiones diferentes—y esto ocurre más frecuentemente cuanto más compleja es la tarea—el sistema requiere un árbitro, un protocolo de votación o una reversión a una de las variantes. Cada uno de estos enfoques introduce sus propias distorsiones. Un árbitro puede cometer errores. La votación por mayoría elimina soluciones no estándar pero correctas. Una reversión significa que parte del trabajo se realizó en vano. Todo esto—no bugs en implementaciones específicas, sino propiedades fundamentales de sistemas distribuidos con los que los ingenieros han estado lidiando durante décadas, incluso en software clásico.

Para la industria, este descubrimiento tiene serias consecuencias prácticas. Startups y grandes empresas han invertido recursos significativos en construir los llamados marcos de agentes—AutoGen de Microsoft, CrewAI, LangGraph y muchas otras herramientas orientadas específicamente a orquestar un gran número de agentes. La tesis de que el escalado de agentes compensa las limitaciones de modelos individuales se ha convertido casi en dogma en las presentaciones tecnológicas. Si DeepMind está en lo correcto, algunas de estas soluciones arquitectónicas deberán reconsiderarse no en años, sino ahora.

Al mismo tiempo, es importante no sobreestimar el pesimismo de la investigación. El "techo de agentes" no es una sentencia de muerte para el enfoque multiagente como tal, sino una indicación de que el escalado debe ser inteligente, no mecánico. Los sistemas con un pequeño número de agentes bien especializados, zonas claramente delimitadas de responsabilidad y superposición mínima de tareas continúan demostrando ganancias reales en productividad. El problema surge cuando los desarrolladores agregan agentes bajo el principio de "más es mejor" sin considerar cómo se organiza la coordinación entre ellos.

El descubrimiento de DeepMind se inserta en una discusión más amplia sobre las limitaciones de escalado en IA, que se ha intensificado notablemente en los últimos meses. Después de varios años en los que aumentar el poder computacional casi automáticamente proporcionaba mejoras de calidad, la industria enfrenta cada vez más rendimientos decrecientes—ya sea en el preentrenamiento de modelos grandes o, ahora, en arquitecturas de agentes. Esto no significa que el progreso se haya detenido.

Significa que las recetas simples ya no funcionan y deben ser reemplazadas por soluciones arquitectónicas cualitativas. Para los laboratorios que compiten por el liderazgo en la era de la IA basada en agentes, los resultados de DeepMind no son motivo de pánico, sino razón para reconsiderar seriamente cómo exactamente planean construir sistemas de próxima generación.

ZK
Hamidun News
Noticias de AI sin ruido. Selección editorial diaria de más de 400 fuentes. Producto de Zhemal Khamidun, Head of AI en Alpina Digital.

¿Quieres dejar de leer sobre IA y empezar a usarla?

AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.

¿Qué te parece?
Cargando comentarios…