Meta reveló un plan para cuatro chips MTIA de AI para inferencia, pero sin abandonar Nvidia y AMD
Meta reveló la hoja de ruta de cuatro aceleradores MTIA, que deberían asumir una parte cada vez mayor de las cargas de trabajo de AI en los centros de datos…
Procesado por IA desde 3DNews AI; editado por Hamidun News
Meta reveló un plan para desarrollar su propia línea de aceleradores de IA MTIA: en los próximos dos años, la empresa quiere lanzar cuatro generaciones de chips para tareas de ranking, recomendación e IA generativa. Sin embargo, no será posible abandonar completamente a Nvidia y AMD — Meta ve su propio silicio como un complemento a las compras de hardware de terceros, no como un reemplazo inmediato.
Por qué Meta necesita sus propios chips
La razón principal es simple: la carga de infraestructura de Meta está creciendo demasiado rápido, y los GPU universales se están volviendo cada vez más caros. La empresa está expandiendo la capacidad del centro de datos para Facebook, Instagram y sus propios servicios generativos, por lo que está intentando obtener más control sobre los costos de inferencia — la etapa cuando un modelo ya está entrenado y responde a las consultas de los usuarios. Para tal trabajo, no siempre es necesario el acelerador más versátil.
A veces es más rentable construir un chip para escenarios internos específicos y extraer la mejor eficiencia por vatio y por dólar. Meta dice que ya utiliza cientos de miles de chips MTIA para inferencia en recomendaciones, contenido orgánico y publicidad. En esencia, no se trata de un experimento de laboratorio, sino de una parte integrada de la infraestructura de producción.
En este contexto, la empresa está acelerando el desarrollo de nuevas generaciones. Otro número significativo: en 2026, Meta espera gastos de capital en el nivel de $115–135 mil millones, y una parte significativa de estas inversiones se destina a infraestructura de IA. Sus propios aceleradores deben ayudar no solo a escalar más rápido, sino también a reducir la dependencia de precios y suministros de proveedores externos.
Cómo se ve la hoja de ruta
En el centro de la nueva hoja de ruta hay cuatro chips MTIA que Meta planea desplegar a una velocidad mucho mayor que la típica en la industria. Mientras que muchos chips de IA se actualizan cada uno o dos años, Meta quiere moverse en intervalos de aproximadamente seis meses. Esto fue posible gracias a un enfoque modular: las nuevas generaciones se diseñan para encajar en racks ya preparados e infraestructura de red sin rediseño completo del sitio.
- MTIA 300 ya está en producción y diseñado para tareas de ranking y recomendación.
- MTIA 400 será el siguiente paso y, según la empresa, se está preparando para su implementación en los centros de datos de Meta.
- MTIA 450 se está diseñando principalmente para inferencia de IA generativa.
- MTIA 500 continuará en la misma línea y se espera que fortalezca la infraestructura en 2027.
A partir de MTIA 400, Meta diseña no solo el chip en sí, sino un sistema completo a su alrededor: múltiples bastidores de servidores, red y refrigeración líquida. Este enfoque es importante porque en grandes clusters de IA, los límites de rendimiento hace tiempo que se ven limitados no solo por la computación, sino también por la entrega de datos, el consumo de energía y la disipación de calor. Cuanto mejor optimice la empresa toda la pila, menos pague de más por la versatilidad que no siempre necesita.
Por qué esto no es un reemplazo para Nvidia
A pesar del anuncio de gran repercusión, Meta no posiciona directamente MTIA como una alternativa que desplazará a Nvidia o AMD de sus centros de datos. En cambio, la empresa habla de un enfoque de "cartera": diferentes tipos de cargas de trabajo requieren chips diferentes, y simplemente no hay una solución universal para todo. En los próximos años, los aceleradores externos seguirán siendo críticos, especialmente donde se necesitan los escenarios más pesados de entrenamiento de modelos grandes o acceso rápido a ecosistemas de hardware y software ya listos.
La apuesta de Meta es diferente: trasladar a sus propios chips las cargas de trabajo donde se puede obtener la máxima ganancia en precio y eficiencia. Al mismo tiempo, la empresa intenta no construir un ecosistema cerrado. MTIA se diseña inicialmente con dependencia de herramientas familiares de la industria — PyTorch, vLLM, Triton y estándares del Open Compute Project.
Esto simplifica la implementación en centros de datos existentes. Parte del desarrollo se realiza conjuntamente con Broadcom, y la fabricación se confía a TSMC, por lo que incluso el silicio "propio" tiene una larga cadena externa de socios.
Qué significa esto
Meta demuestra que la carrera del hardware de IA se está moviendo desde simplemente comprar las GPU más poderosas hacia un modelo más sofisticado: las grandes plataformas están armando una flota mixta de aceleradores de terceros y propietarios. Para el mercado, esta es una señal de que la principal escasez en los próximos años no serán solo los chips en sí, sino también la capacidad de adaptar rápidamente la infraestructura a tipos específicos de cargas de trabajo de IA.
¿Quieres dejar de leer sobre IA y empezar a usarla?
AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.