Together AI Blog→ original

Together AI: como otimizações de kernels fecham a lacuna entre modelos e GPUs

A equipe da Together AI adaptou kernels CUDA para as novas GPUs Blackwell em uma semana — um trabalho que a NVIDIA levou um ano para fazer. Tudo graças ao Flash

Together AI: como otimizações de kernels fecham a lacuna entre modelos e GPUs
Fonte: Together AI Blog. Colagem: Hamidun News.
◐ Ouvir artigo

A equipe da Together AI adaptou kernels CUDA para as novas GPUs Blackwell em uma semana — um trabalho que a NVIDIA levou um ano para fazer. Tudo graças ao FlashAttention (2022) e ao ThunderKittens. Isso fecha a lacuna entre a matemática dos modelos e o poder real do hardware.

ZK
Hamidun News
Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.
O que você acha?
Carregando comentários…