TechCrunch→ original

Meta traslada IA agente a decenas de millones de núcleos AWS Graviton en lugar de GPU

Meta está expandiendo su asociación con AWS y trasladando parte de sus cargas de trabajo de IA a procesadores Graviton. Esto no se trata de GPUs para…

Procesado por IA desde TechCrunch; editado por Hamidun News
Meta traslada IA agente a decenas de millones de núcleos AWS Graviton en lugar de GPU
Fuente: TechCrunch. Collage: Hamidun News.
◐ Escuchar artículo

Meta está apostando efectivamente por una nueva capa de infraestructura de IA: la empresa ha firmado un acuerdo con AWS para desplegar decenas de millones de núcleos Graviton para cargas de trabajo de IA basadas en agentes. Esto no es simplemente otra compra de GPU para el entrenamiento de modelos, sino una señal de que el mercado está comenzando a dividirse en dos grandes direcciones. Una implica el entrenamiento de modelos cada vez más grandes en aceleradores.

La segunda implica atender a un gran número de escenarios basados en agentes posteriores al entrenamiento, donde el desempeño máximo importa menos que el costo, la eficiencia energética y el desempeño predecible a escala. De acuerdo con un anuncio oficial de Amazon del 24 de abril de 2026, el despliegue comienza con decenas de millones de núcleos Graviton y puede expandirse a medida que crezcan las necesidades de Meta. Amazon señala que Meta ya se ha convertido en uno de los mayores clientes de Graviton del mundo.

Estamos hablando de CPUs AWS Graviton, no GPUs: son procesadores ARM desarrollados por Amazon, disponibles a través de la nube de AWS. Meta planea ejecutar parte de su infraestructura que respalda sus servicios de IA y procesa miles de millones de interacciones en estos núcleos, donde necesitan coordinarse flujos de trabajo complejos de múltiples pasos.

Por qué importa esto: el auge de la IA basada en agentes está cambiando la estructura misma de la demanda de hardware. Las GPUs siguen siendo esenciales cuando se entrenan grandes modelos o se ejecuta inferencia particularmente pesada. Pero una vez que se superponen agentes sobre estos modelos, la proporción de diferentes tipos de tareas aumenta rápidamente: razonamiento en tiempo real, generación de código, búsqueda, planificación de secuencias de acciones, orquestación de llamadas de herramientas y gestión de largas cadenas de pasos.

Estas cargas de trabajo a menudo afectan no solo a los aceleradores, sino también a la CPU, memoria, comunicación entre nodos y el costo de cada solicitud. Para empresas de la escala de Meta, esto ya no es un detalle técnico, sino una cuestión económica para toda la plataforma de IA. Para AWS, el acuerdo con Meta es varias victorias a la vez.

Primero, Amazon obtiene una señal de mercado muy visible: sus propios chips se pueden usar no solo dentro de AWS, sino también en una de las infraestructuras de IA más exigentes del mundo. Segundo, ayuda a devolver parte del gasto de Meta a AWS. En agosto de 2025, Meta firmó un acuerdo de nube de seis años con Google Cloud por más de 10 mil millones de dólares, y ante esto, el nuevo contrato con Amazon parece un paso hacia un esquema de compra de computación más diversificado.

Tercero, AWS fortalece su posición en un nuevo segmento: no solo "nube para modelos", sino proveedor de una pila completa para IA basada en agentes.

También hay otro contexto. El 20 de abril de 2026, Anthropic anunció una expansión de su asociación con Amazon y un compromiso de gastar más de 100 mil millones de dólares en AWS durante diez años, incluyendo capacidad basada en Trainium. Ante esto, la asociación Meta-Graviton muestra que Amazon está intentando establecerse en múltiples capas de infraestructura de IA: en aceleradores para entrenamiento e inferencia, y por separado en CPUs para cargas de trabajo basadas en agentes y servicios.

El argumento adicional de Amazon es la economía. Graviton5, según la empresa, fue creado específicamente para estos escenarios, ofreciendo hasta 192 núcleos, mayor caché y hasta un 25% de mejora de desempeño respecto a la generación anterior. Para los clientes, esto significa un intento de reducir el costo de las operaciones de IA sin sacrificar la escala.

La conclusión principal es simple: la carrera por los chips de IA ya no se reduce a la escasez de GPU y al dominio de Nvidia. Los grandes actores están comenzando a ensamblar pilas de computación híbridas, donde cada categoría de hardware se encarga de su propio dominio: GPUs para entrenamiento, aceleradores especializados para parte de la inferencia, CPUs para orquestación, cadenas de agentes y cargas de trabajo de aplicaciones masivas. El acuerdo Meta-AWS muestra que la próxima lucha es por quién proporcionará el mejor precio por unidad de trabajo de IA útil.

Y si los productos basados en agentes se convierten verdaderamente en la interfaz principal para los modelos, la demanda de estas arquitecturas de CPU crecerá no menos rápidamente que la demanda de aceleradores de IA clásicos.

ZK
Hamidun News
Noticias de AI sin ruido. Selección editorial diaria de más de 400 fuentes. Producto de Zhemal Khamidun, Head of AI en Alpina Digital.

¿Quieres dejar de leer sobre IA y empezar a usarla?

AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.

¿Qué te parece?
Cargando comentarios…