Alphabet negocia con Marvell dos nuevos chips de AI para acelerar la inferencia en los servicios de Google
Alphabet está en conversaciones con Marvell para desarrollar dos chips de AI para inferencia. El primero debe acelerar la transferencia de datos mediante un…
Procesado por IA desde 3DNews AI; editado por Hamidun News
Alphabet está discutiendo con Marvell el desarrollo de dos chips de IA especializados para inferencia — la etapa en que un modelo ya entrenado procesa solicitudes reales de usuarios. Si el proyecto se concreta, Google tendrá hardware diseñado no para récords de laboratorio, sino para respuestas rápidas y masivas en servicios interactivos.
Qué chips se están discutiendo
En el centro de la discusión hay dos componentes diferentes. El primero es un módulo de memoria que debe acelerar la transferencia de datos dentro del sistema de IA. Para la inferencia, esto es crítico: incluso un acelerador poderoso pierde su valor si el modelo se topa con limitaciones de ancho de banda de memoria, retrasos en el intercambio de datos y entrega lenta de información. En los grandes modelos de lenguaje, estos cuellos de botella a menudo determinan qué tan rápido y barato puede el sistema servir el flujo diario de solicitudes de usuarios.
El segundo componente es una versión actualizada de TPU, los procesadores tensores propios de Google, orientados hacia aplicaciones interactivas. Hablamos de escenarios donde el usuario espera una respuesta inmediatamente: búsqueda, asistentes de IA, generación de texto, sugerencias en la interfaz. Esta elección demuestra un cambio de prioridades: el valor cada vez más se crea no en el momento del entrenamiento del modelo, sino en el momento de su ejecución continua en millones de solicitudes breves, donde importan la latencia estable, la previsibilidad y el costo de cada respuesta.
Por qué Alphabet necesita a Marvell
Para Alphabet, una asociación con Marvell parece pragmática. Marvell es fuerte en infraestructura de centros de datos y microchips especializados, mientras que Google ha estado desarrollando su propia línea de TPU durante muchos años. En lugar de hacer todo completamente internamente, Alphabet puede dividir la responsabilidad: conservar el control sobre la arquitectura del acelerador y traer un socio para aquellas partes del sistema donde la memoria, las interconexiones, el empaque y el intercambio rápido de datos entre componentes son particularmente importantes.
El acuerdo también tiene lógica económica. La inferencia se está convirtiendo rápidamente en una de las capas más caras de la infraestructura de IA, porque es precisamente la que funciona con tráfico constante de usuarios. Cuanto más preciso sea el hardware ajustado a un tipo específico de carga, más fácil será escalar el servicio sin un crecimiento explosivo de costos. Para Google, esta es una oportunidad para reducir el costo por respuesta y controlar mejor su propio stack tecnológico; para Marvell, es una forma de fortalecer su posición en el mercado sobrecalentado de aceleradores de IA.
- Un módulo de memoria separado puede reducir cuellos de botella al trabajar con modelos grandes
- Un TPU actualizado es más adecuado para diálogos y otros escenarios interactivos
- Los chips especializados típicamente ofrecen más eficiencia por vatio y por dólar
- Para Google, es una forma de fortalecer el control sobre su propia infraestructura de IA
- Para Marvell, es una entrada más profunda en el mercado de aceleración para IA
Dónde se notará el efecto
Si las negociaciones llegan a suministros reales, el efecto primero será notado no por los usuarios, sino por los equipos responsables de la infraestructura de Google. La inferencia no es una ejecución única del modelo, sino una operación continua bajo carga, cuando el sistema debe responder rápidamente a un enorme número de solicitudes en sucesión. En tal modo, lo que importa no es solo el cálculo en sí, sino el tiempo de respuesta predecible, la eficiencia energética y la ausencia de cuellos de botella al transferir datos entre memoria y acelerador.
En la práctica, esto significa un ajuste más fino del hardware para productos específicos. El mercado se está alejando gradualmente de la idea de un chip universal único que funciona igualmente bien para todas las tareas de IA. En su lugar, las empresas ensamblan combinaciones separadas de componentes para entrenamiento, inferencia y modos interactivos. Las negociaciones entre Alphabet y Marvell encajan bien en esta tendencia: los ganadores no serán quienes tengan más GPU, sino quienes diseñen con mayor precisión toda la cadena de ejecución del modelo para la carga real.
Qué significa esto
Las negociaciones entre Alphabet y Marvell muestran que la nueva carrera en IA se está desarrollando no solo alrededor de modelos, sino también alrededor de hardware especializado para servicios cotidianos. Quienquiera que pueda entregar una respuesta rápida de forma más barata y confiable obtendrá la ventaja.
¿Quieres dejar de leer sobre IA y empezar a usarla?
AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.