TNW→ original

Google negocia con Marvell sobre chips de IA para inferencia y reduce dependencia de Broadcom

Google podría involucrar a Marvell en el desarrollo de dos nuevos chips de IA — una unidad de procesamiento de memoria y TPU para inferencia. Esto…

Procesado por IA desde TNW; editado por Hamidun News
Google negocia con Marvell sobre chips de IA para inferencia y reduce dependencia de Broadcom
Fuente: TNW. Collage: Hamidun News.
◐ Escuchar artículo

Google está dando el siguiente paso en su estrategia de chips: la empresa está discutiendo con Marvell la creación de dos aceleradores de IA especializados para expandir su cadena de desarrollo más allá de Broadcom. Si las negociaciones concluyen con un acuerdo, Google ganará otro socio de silicio personalizado—y reforzará su apuesta por la inferencia más barata y masiva, no solo el entrenamiento de grandes modelos. Según la información disponible, el tema de las negociaciones implica dos nuevos chips.

El primero es una unidad de procesamiento de memoria, un componente diseñado específicamente para operaciones de memoria y transferencia de datos dentro de sistemas de IA. El segundo es una TPU optimizada precisamente para inferencia—cuando un modelo ya ha sido entrenado y necesita responder rápidamente a las solicitudes de los usuarios.

Para Google, esta es un área sensible: cuantas más solicitudes fluyen a través de Gemini, búsqueda, publicidad y servicios en la nube, más fuertemente el costo de cada respuesta y el consumo de energía de los centros de datos presionan a la empresa. Actualmente, Google no está construyendo su ecosistema de silicio personalizado solo. Broadcom ha sido durante mucho tiempo un socio clave, y MediaTek también aparece en la cadena de desarrollo. La aparición de Marvell como un posible tercer socio significa más que simplemente expandir la lista de contratistas.

Es una forma de distribuir riesgos, no depender de un único proveedor de componentes críticos y, simultáneamente, probar diferentes enfoques de ingeniería para diferentes clases de cargas de trabajo—desde entrenamiento hasta inferencia en servicios de producción. Es importante destacar que por ahora se trata solo de negociaciones: no hay contrato firmado aún, según la información disponible. Pero el hecho mismo de tales discusiones muestra hacia dónde se dirige el mercado.

Con el telón de fondo del auge de la IA generativa, las empresas están diseñando cada vez más sus propios chips porque las GPU universales siguen siendo costosas, escasas y no siempre óptimas para una tarea específica. La inferencia es un objetivo particularmente atractivo para la personalización: es donde los productos orientados al usuario finalmente se escalan, donde la latencia, el costo de solicitud y el rendimiento predecible importan.

Un interés separado se despierta hacia la unidad de procesamiento de memoria. En la infraestructura de IA, el cuello de botella a menudo no es la potencia computacional pura, sino la velocidad a la que los datos llegan al acelerador. Cuanto más eficientemente un sistema funciona con memoria, menos los bloques de cálculo permanecen inactivos y mejor se puede utilizar el hardware ya instalado. Tales soluciones pueden ser tan importantes como las propias TPU: mejoran el equilibrio general del sistema y reducen la sobrecarga de movimiento de datos.

Para Google, este es un paso particularmente lógico. La empresa ha estado desarrollando su línea de TPU durante muchos años y sabe cómo integrar estrechamente el hardware con su software, centros de datos e infraestructura en la nube. Los nuevos componentes especializados pueden ayudarle a ajustar mejor la pila para diferentes escenarios: por separado para entrenamiento, por separado para servir un número enorme de solicitudes, por separado para cuellos de botella relacionados con la memoria. Este enfoque típicamente produce no solo ganancias de rendimiento sino también un control más riguroso sobre el costo, los plazos de entrega y la dependencia de ecosistemas externos.

Otra capa de esta historia es la posición negociadora de Google. Cuando una empresa tiene múltiples socios de diseño, le resulta más fácil distribuir proyectos por especialización y no atar su hoja de ruta completa al ritmo de un solo contratista. En una industria donde el lanzamiento de la próxima generación de hardware de IA impacta directamente en los márgenes de la nube y la velocidad de lanzamiento de productos, tal flexibilidad se convierte en un activo estratégico.

Incluso sin un contrato final, el diálogo mismo con Marvell muestra que Google está preparando alternativas de antemano y expandiendo su margen de maniobra. En términos prácticos, esta noticia es importante no porque Google encontró otro fabricante de chips, sino porque las mayores empresas de IA se están moviendo hacia una arquitectura de hardware más granular y especializada. El ganador no será quien simplemente tenga más aceleradores, sino quien mejor distribuya roles entre ellos. Si el trato con Marvell se concreta, será otra señal: la siguiente fase de la carrera de IA no es solo sobre modelos, sino sobre la economía de la inferencia, donde cada vatio y cada ganancia de milisegundos se convierte en una ventaja competitiva.

ZK
Hamidun News
Noticias de AI sin ruido. Selección editorial diaria de más de 400 fuentes. Producto de Zhemal Khamidun, Head of AI en Alpina Digital.

¿Quieres dejar de leer sobre IA y empezar a usarla?

AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.

¿Qué te parece?
Cargando comentarios…