Andrej Karpathy condensou GPT em 243 linhas de Python puro
Andrej Karpathy lançou o microGPT — uma implementação completa da arquitetura transformer em 243 linhas de Python puro, sem dependências externas. O projeto faz

◐ Слушать статью
Andrej Karpathy lançou o microGPT — uma implementação completa da arquitetura transformer em 243 linhas de Python puro, sem dependências externas. O projeto faz tanto treinamento quanto inferência, revelando toda a matemática dos grandes modelos de linguagem até a última operação. Karpathy o chama de "projeto de arte", mas, na prática, criou o tutorial mais compacto e transparente sobre a arquitetura GPT. Para quem quer entender como os modelos de linguagem realmente funcionam, este é o melhor ponto de partida.