Google presenta nuevos chips de AI para inferencia y desafía a Nvidia
Google está desarrollando una nueva generación de chips de AI centrados en la inferencia, un desafío directo a Nvidia. Cerebras anunció planes para una IPO…
Procesado por IA desde Bloomberg Tech; editado por Hamidun News
Google desafía a Nvidia: la empresa está desarrollando una nueva generación de sus propios chips de IA enfocados en inferencia — la etapa final de la operación de redes neuronales, cuando un modelo entrenado procesa solicitudes de usuarios en tiempo real. Los chips de inferencia son fundamentalmente diferentes de los necesarios para el entrenamiento de modelos. Entrenar sistemas grandes de lenguaje es meses de computación en miles de GPUs, un gasto de capital único.
La inferencia es una carga constante: cada vez que un usuario envía una solicitud a Gemini, ChatGPT o cualquier otro servicio de IA, el chip realiza inferencia. A medida que las aplicaciones de IA alcanzan cientos de millones de usuarios, los costos de inferencia se convierten en el principal rubro de gastos para las empresas de tecnología. Según algunas estimaciones, en 2027 superarán los costos de entrenamiento tres o cuatro veces.
Google ha estado construyendo su propia estrategia de silicio desde hace tiempo. La empresa ha estado desarrollando TPU (Tensor Processing Units) desde 2015 — mucho antes de que los chips de IA se convirtieran en noticia de primera plana. Hasta ahora, estos procesadores se han utilizado principalmente dentro de Google Cloud y para entrenar modelos Gemini.
Ahora la empresa tiene la intención de crear hardware especializado específicamente para inferencia — con mayor ancho de banda y menor consumo de energía por solicitud. Para Nvidia, cuyos chips H100 y H200 se han convertido en el estándar para centros de datos en todo el mundo, este es un desafío directo. Google es uno de los mayores clientes de Nvidia en el mundo, y trasladar incluso parte de la carga al hardware propio significa pérdidas significativas para la empresa de Santa Clara.
Paralelamente, otro evento se está gestando en el sector de chips de IA: Cerebras Systems anunció planes de salir a bolsa. La empresa es conocida por su producto insignia — el Wafer-Scale Engine, esencialmente una oblea de silicio completa que funciona como un único procesador. Esta arquitectura elimina las latencias en la transferencia de datos entre chips individuales y acelera el procesamiento de modelos grandes.
Cerebras ya intentó un IPO anteriormente pero retiró la solicitud. Regresar al camino del IPO es una señal al mercado: a pesar del enfriamiento de algunos inversores de IA, las arquitecturas alternativas de chips continúan siendo percibidas como activos prometedores. La empresa posiciona sus soluciones como particularmente efectivas para trabajar con modelos abiertos en entornos corporativos cerrados — un segmento que crece rápidamente impulsado por requisitos de seguridad y soberanía de datos.
La tercera historia de la semana proviene del espacio. Blue Origin lanzó con éxito el cohete New Glenn e aterrizó su propulsor reutilizable — un hito técnico importante hacia la reducción de costos de lanzamiento. Sin embargo, la carga útil, el satélite AST SpaceMobile, no alcanzó su órbita calculada.
AST SpaceMobile está construyendo una red global de internet de banda ancha que funciona directamente desde teléfonos inteligentes sin terminales especiales. El fracaso orbital afectó inmediatamente el precio de las acciones: las acciones de la empresa cayeron. El mercado una vez más recordó que en el espacio, el éxito técnico y el éxito comercial son cosas diferentes.
Las tres historias juntas pintan un retrato de la economía tecnológica de mediados de los años 2020. La carrera de chips de IA se está moviendo más allá de la duopolio: además de Nvidia y AMD, gigantes tecnológicos con su propio silicio y startups especializadas como Cerebras están entrando en la batalla por la infraestructura. La pregunta de quién controlará la infraestructura física de la era de la IA sigue abierta.
¿Quieres dejar de leer sobre IA y empezar a usarla?
AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.