Hugging Face Blog→ original

NVIDIA Nemotron: Modelos de Difusão Geram Texto 6× Mais Rápido

NVIDIA Nemotron gera 32 tokens por vez ao invés de um, usando difusão em vez de auto-regressão. Três modos em um modelo: autoregressivo padrão, difusão rápida e

NVIDIA Nemotron: Modelos de Difusão Geram Texto 6× Mais Rápido
Fonte: Hugging Face Blog. Colagem: Hamidun News.
◐ Ouvir artigo

NVIDIA Nemotron gera 32 tokens por vez ao invés de um, usando difusão em vez de auto-regressão. Três modos em um modelo: autoregressivo padrão, difusão rápida e auto-especulação com aceleração de 6× no B200. Modelos 3B, 8B e 14B já estão em open source.

ZK
Hamidun News
Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.
O que você acha?
Carregando comentários…