TechCrunch→ original

Startup sul-coreana XCENA levantou $135M, apostando em memória em vez de poder computacional

A startup sul-coreana XCENA levantou $135M em uma avaliação de $570M. A empresa desafia o consenso da indústria: o gargalo da IA moderna não é a potência comput

Startup sul-coreana XCENA levantou $135M, apostando em memória em vez de poder computacional
Fonte: TechCrunch. Colagem: Hamidun News.
◐ Ouvir artigo

A startup de chips sul-coreana XCENA levantou $135 milhões em investimentos com avaliação de $570 milhões. A empresa aposta em uma tese contraintuitiva: o gargalo no desenvolvimento de IA moderna não é o poder computacional da GPU, mas a velocidade de acesso à memória.

Todos veem o problema, mas nem todos entendem sua verdadeira causa

A indústria tem sido obcecada com escassez de GPUs nos últimos dois anos. Todos os dias trazem notícias sobre falta de poder computacional, guerras de chips e restrições de compra. A XCENA olha para o mesmo problema, mas o vê de forma diferente. Segundo sua lógica, mesmo que você forneça ao modelo o chip mais poderoso do mundo, ele gastará enormes quantidades de tempo simplesmente esperando que os dados necessários viagem da memória para o núcleo computacional. Esse fenômeno, conhecido como memory bottleneck, prejudica o desempenho muito mais severamente do que muitos percebem.

A arquitetura moderna de GPU confirma isso. O núcleo computacional é capaz de realizar operações em nanossegundos. Acesso à memória? Muitas vezes são bilhões de nanossegundos de espera. O paradoxo emerge: o processador está pronto para computar, mas é forçado a esperar que os dados cheguem.

O problema cresce com o tamanho e a complexidade do modelo

O problema piora exponencialmente. Ao treinar um modelo com trilhões de parâmetros, o volume de dados que precisa ser movido entre a memória e o processador se torna simplesmente astronômico. A memória não consegue acompanhar o fluxo de solicitações.

  • Cada duplicação de parâmetros do modelo aumenta exponencialmente os requisitos de memória
  • O tempo de acesso à memória cresce não linearmente com o aumento do volume
  • O consumo de energia para mover dados supera o consumo de energia dos próprios cálculos
  • Até mesmo GPUs de ponta funcionam a 30-50% do seu potencial devido às esperas de memória

Engenheiros em grandes laboratórios já estão vendo este problema na prática. Ao treinar modelos em escala GPT, uma parte significativa do tempo do processador é gasta esperando pelos dados necessários, em vez de nos cálculos propriamente ditos.

No que XCENA está apostando

A startup está desenvolvendo arquiteturas de memória especializadas que prometem reduzir a latência de acesso e aumentar a largura de banda. Se a abordagem funcionar, isso poderia fornecer uma enorme vantagem competitiva para laboratórios e empresas que treinam modelos grandes. Investimento de $135 milhões de fundos de capital de risco sérios significa que a indústria está começando a acreditar nesta tese. Isso também pode sugerir que alguns pesquisadores importantes e desenvolvedores de modelos já enfrentaram este problema em primeira mão e estão ativamente buscando soluções.

O que isso significa para o futuro da IA

Se XCENA estiver certa, a arquitetura da infraestrutura de IA de próxima geração parecerá diferente. Em vez de apenas uma corrida por GPUs cada vez mais poderosas, haverá uma corrida paralela e igualmente intensa pela velocidade de acesso à memória mais rápida. Isso pode redefinir significativamente quais empresas e laboratórios podem se permitir treinar a próxima geração de modelos. Talvez XCENA esteja errada em sua análise, e o principal gargalo seja realmente a computação. Mas o fato de que a startup conseguiu atrair tais quantias baseada nesta visão sugere algo: o ceticismo está começando a ceder a um estudo sério da memória como uma restrição crítica no progresso da IA.

ZK
Hamidun News
Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.
O que você acha?
Carregando comentários…