ThunderKittens da Together AI: uma nova linguagem para kernels de GPU eficientes
A Together AI lançou o ThunderKittens, uma linguagem de programação compacta para escrever kernels de GPU otimizados. No chip H100, ele roda visivelmente mais r

◐ Ouvir artigo
A Together AI lançou o ThunderKittens, uma linguagem de programação compacta para escrever kernels de GPU otimizados. No chip H100, ele roda visivelmente mais rápido do que o FlashAttention2 clássico. A interface lembra PyTorch, então engenheiros de ML entendem rápido. Os autores dizem abertamente que se trata de um projeto experimental. O código é totalmente open source e já foi integrado ao NanoGPT para o aprendizado de desenvolvedores.