TechCrunch→ original

La startup surcoreana XCENA recaudó $135M, apostando por la memoria en lugar de la potencia computacional

La startup surcoreana XCENA recaudó $135M en una valoración de $570M. La empresa desafía el consenso de la industria: el cuello de botella en la IA moderna no e

La startup surcoreana XCENA recaudó $135M, apostando por la memoria en lugar de la potencia computacional
Fuente: TechCrunch. Collage: Hamidun News.
◐ Escuchar artículo

La startup surcoreana de chips XCENA levantó $135 millones en inversiones con una valoración de $570 millones. La empresa apuesta por una tesis contraintuitiva: el cuello de botella en el desarrollo de IA moderna no es la potencia computacional de la GPU, sino la velocidad de acceso a la memoria.

Todos ven el problema, pero no todos entienden su verdadera causa

La industria ha estado obsesionada con la escasez de GPUs durante los últimos dos años. Cada día trae noticias sobre falta de potencia computacional, guerras de chips y restricciones de compra. XCENA mira el mismo problema, pero lo ve de manera diferente. Según su lógica, incluso si le das al modelo el chip más poderoso del mundo, pasará enormes cantidades de tiempo simplemente esperando a que los datos necesarios viajen desde la memoria al núcleo computacional. Este fenómeno, conocido como memory bottleneck, afecta al rendimiento mucho más severamente de lo que muchos se dan cuenta.

La arquitectura moderna de GPU confirma esto. El núcleo computacional es capaz de realizar operaciones en nanosegundos. ¿Acceso a la memoria? Frecuentemente son miles de millones de nanosegundos de espera. La paradoja emerge: el procesador está listo para computar, pero se ve obligado a esperar a que lleguen los datos.

El problema crece con el tamaño y la complejidad del modelo

El problema empeora exponencialmente. Al entrenar un modelo con billones de parámetros, el volumen de datos que debe ser movido entre la memoria y el procesador se vuelve simplemente astronómico. La memoria no puede mantenerse al día con el flujo de solicitudes.

  • Cada duplicación de parámetros del modelo aumenta exponencialmente los requisitos de memoria
  • El tiempo de acceso a la memoria crece de manera no lineal con el aumento del volumen
  • El consumo de energía para mover datos supera el consumo de energía de los propios cálculos
  • Incluso las GPU de vanguardia funcionan al 30-50% de su potencial debido a las esperas de memoria

Los ingenieros en laboratorios importantes ya están viendo este problema en la práctica. Al entrenar modelos a escala GPT, una parte significativa del tiempo del procesador se dedica a esperar los datos necesarios, en lugar de a los cálculos mismos.

En lo que XCENA está apostando

La startup está desarrollando arquitecturas de memoria especializadas que prometen reducir la latencia de acceso y aumentar el ancho de banda. Si el enfoque funciona, podría proporcionar una enorme ventaja competitiva a laboratorios y empresas que entrenan modelos grandes. Inversión de $135 millones de fondos de capital de riesgo serios significa que la industria está comenzando a creer en esta tesis. Esto también puede sugerir que algunos investigadores importantes y desarrolladores de modelos ya han enfrentado este problema de primera mano y están buscando activamente soluciones.

Lo que esto significa para el futuro de la IA

Si XCENA tiene razón, la arquitectura de la infraestructura de IA de próxima generación se verá diferente. En lugar de solo una carrera por GPU cada vez más potentes, habrá una carrera paralela e igualmente intensa por una velocidad de acceso a la memoria más rápida. Esto podría redefinir significativamente qué empresas y laboratorios pueden permitirse entrenar la próxima generación de modelos. Quizás XCENA esté equivocada en su análisis, y el principal cuello de botella sea realmente la computación. Pero el hecho de que la startup logró atraer tales sumas basándose en esta visión sugiere algo: el escepticismo está comenzando a ceder a un estudio serio de la memoria como una restricción crítica en el progreso de la IA.

ZK
Hamidun News
Noticias de AI sin ruido. Selección editorial diaria de más de 400 fuentes. Producto de Zhemal Khamidun, Head of AI en Alpina Digital.
¿Qué te parece?
Cargando comentarios…