Together AI: cómo las optimizaciones de kernels cierran la brecha entre los modelos y las GPU
El equipo de Together AI adaptó kernels CUDA para las nuevas GPU Blackwell en una semana — un trabajo en el que NVIDIA llevaba un año. Todo gracias a FlashAtten

◐ Escuchar artículo
El equipo de Together AI adaptó kernels CUDA para las nuevas GPU Blackwell en una semana — un trabajo en el que NVIDIA llevaba un año. Todo gracias a FlashAttention (2022) y ThunderKittens. Esto cierra la brecha entre las matemáticas de los modelos y la potencia real del hardware.