Дефицит памяти стал главным узким местом в AI-инфраструктуре — Huang
На конференции Dell World в Лас-Вегасе CEO Nvidia Jensen Huang заявил, что дефицит высокоскоростной памяти (HBM) — самое критичное узкое место в цепи поставок д

En la conferencia Dell World en Las Vegas, el CEO de Nvidia Jensen Huang abordó un problema crítico que afecta a toda la industria de IA: la escasez de memoria de alta velocidad. En una conversación con el CEO de Dell Michael Dell y el periodista de Bloomberg Ed Ludlow, Huang declaró directamente que la escasez de memoria se ha vuelto más aguda que los propios cuellos de botella en la fabricación de chips. Este es un reconocimiento franco de que el ritmo de implementación de la infraestructura de IA se está ralentizando no por la falta de GPUs en sí, sino por la incapacidad de producir la cantidad requerida de memoria.
Por qué la Memoria se Convirtió en Escasa
La memoria de alta velocidad HBM (High Bandwidth Memory) es un tipo especial de memoria incrustada directamente en el acelerador. Almacena parámetros de redes neuronales y cálculos intermedios, permitiendo que la GPU funcione a velocidad máxima sin latencia al acceder a la memoria del sistema más lenta. Los H100 y H200 de Nvidia tienen entre 80 y 141 gigabytes de memoria.
El problema es que la demanda de HBM está creciendo exponencialmente, mientras que la producción ni siquiera mantiene el ritmo del crecimiento lineal. Hace un año, las grandes empresas pedían cientos de GPUs; ahora se habla de miles; pronto se necesitarán millones. La producción de memoria es un ciclo tecnológico de varios años: las nuevas fábricas se construyen en cinco a siete años, la tecnología se vuelve cada vez más compleja y hay muy pocos competidores en este segmento.
A Quién Afecta Más
Los principales productores de memoria — Samsung y SK Hynix de Corea del Sur, así como Micron estadounidense — tienen dificultades para mantenerse al día con el crecimiento de la demanda. Las tres empresas están invirtiendo decenas de miles de millones en nuevas capacidades de producción, pero ni siquiera eso es suficiente: el déficit ya está creciendo geométricamente. Esto crea una cascada de problemas en toda la cadena de suministro:
- Los precios están subiendo: Las GPUs con memoria suficiente se vuelven 1,5 a 2 veces más caras en el mercado secundario
- Incertidumbre estratégica: las empresas no saben si recibirán el equipo requerido de manera oportuna
- Compromisos arquitectónicos: forzados a usar modelos más estrechos, distribuir cálculos entre una mayor cantidad de GPUs
- Estratificación del mercado: quienes aseguren contratos de suministro de memoria primero obtendrán una ventaja competitiva significativa
Incluso Dell, uno de los mayores integradores de servidores, depende de los suministros de memoria. La empresa no puede vender más servidores de IA de alto rendimiento si no hay GPUs, y las GPUs permanecen incompletas sin capacidad de memoria suficiente.
Cómo Está Respondiendo la Industria
Nvidia está trabajando activamente en nuevas generaciones de memoria — HBM3e y HBM4 ya están en desarrollo, con ancho de banda y desempeño esperados altos. Sin embargo, el cronograma para el desarrollo, calificación y producción en masa de nuevos estándares de memoria se mide en años, no en meses. En paralelo, la empresa y sus socios están buscando soluciones de software: optimización de software, nuevas arquitecturas de redes neuronales que requieren menos memoria por unidad de desempeño. Pero esto también tiene límites estrictos — no todos los modelos pueden reducirse sin perder la calidad de salida.
Huang declaró: este no es un problema a corto plazo que se resuelva en meses.
La escasez de memoria seguirá siendo un factor limitante grave durante al menos los próximos años.
Lo Que Esto Significa para la Industria de IA
La escasez de memoria se está convirtiendo en un nuevo techo para el ritmo de implementación de la infraestructura de IA. No todas las empresas podrán implementar modelos de lenguaje grandes en la escala y cronograma necesarios. Esto crea una clara estratificación de mercado: aquellos que aseguren el acceso a la memoria primero se desarrollarán más rápidamente, mientras que aquellos que se atrasen se quedarán rezagados. Para inversores de riesgo y startups, esto significa que obtener el equipo correcto se convierte en un factor de éxito tan crítico como la idea y el equipo en sí. Recuerda la era de escasez de silicio, cuando simplemente tener chips proporcionaba ventaja competitiva.