MarkTechPost→ original

NVIDIA apresentou o Nemotron 3 Super — um modelo aberto com 120 bilhões de parâmetros

A empresa de Santa Clara lançou o Nemotron 3 Super, um modelo de linguagem aberto com 120 bilhões de parâmetros, criado especificamente para aplicações…

Processado por IA de MarkTechPost; editado por Hamidun News
NVIDIA apresentou o Nemotron 3 Super — um modelo aberto com 120 bilhões de parâmetros
Fonte: MarkTechPost. Colagem: Hamidun News.
◐ Ouvir artigo

NVIDIA Apresentou Nemotron 3 Super — Um Modelo Aberto com 120 Bilhões de Parâmetros

A lacuna entre sistemas comerciais fechados e modelos de linguagem abertos está se estreitando em um ritmo que teria parecido impossível há apenas alguns anos. NVIDIA, uma empresa cujo nome há muito se tornou sinônimo de superioridade de hardware na era da inteligência artificial, está dando passos cada vez mais confiantes também no espaço de software. Seu novo lançamento — Nemotron 3 Super com 120 bilhões de parâmetros — pretende não apenas um lugar na tabela de líderes, mas uma redefinição da própria lógica de construção de modelos abertos para tarefas de agente.

Para entender o significado deste lançamento, é necessário observar o contexto. Nos últimos dois anos, modelos abertos se desenvolveram rapidamente, mas sempre ficaram atrás dos equivalentes fechados em várias características-chave: desempenho em tarefas complexas de múltiplas etapas, velocidade de inferência e a capacidade de trabalhar eficientemente em cenários multiagente. GPT-4, Claude e Gemini mantiveram uma vantagem de qualidade por muito tempo precisamente nessas áreas. Nemotron 3 Super foi criado como uma resposta a essa lacuna — não um compromisso entre abertura e qualidade, mas uma tentativa de eliminar a própria necessidade de tal compromisso.

A solução técnica subjacente ao modelo merece atenção especial. NVIDIA aplicou uma arquitetura híbrida na qual o mecanismo Mamba — uma alternativa eficiente ao Transformer clássico ao trabalhar com sequências longas — é combinado com o mecanismo Attention tradicional. Sobreposto a isso está a abordagem Mixture-of-Experts, que permite ativar apenas parte dos parâmetros com cada chamada ao modelo. O resultado é um aumento cinco vezes na vazão em relação aos análogos arquitetônicos da mesma classe de peso. Não é uma métrica de marketing: em sistemas reais de agente, onde o modelo processa dezenas de requisições paralelas e gerencia cadeias de ferramentas, a velocidade de inferência muitas vezes se torna o gargalo de todo o sistema.

Na linha de produtos NVIDIA, Nemotron 3 Super ocupa uma posição intermediária bem considerada. A versão compacta com 30 bilhões de parâmetros é voltada para implantação com recursos limitados e aplicações locais. Soluções maiores são para tarefas que exigem profundidade máxima de raciocínio. Nemotron 3 Super preenche o espaço entre eles: poderoso o suficiente para cenários corporativos complexos, eficiente o suficiente para não exigir despesas de infraestrutura gigantescas. Este posicionamento sugere que NVIDIA está projetando não um produto separado, mas um ecossistema no qual cada componente resolve sua própria tarefa sem redundância.

As consequências deste lançamento se estendem muito além da discussão técnica. Em primeiro lugar, aumenta a pressão sobre OpenAI, Anthropic e Google no segmento de clientes corporativos. Empresas que anteriormente escolhiam APIs fechadas por razões de qualidade agora têm um argumento para mudar para soluções abertas: controle total de dados, capacidade de ajuste fino e ausência de dependência de um provedor externo. Para indústrias sensíveis à privacidade — finanças, saúde, setor governamental — isso pode ser um fator decisivo na escolha da infraestrutura.

Igualmente importante é o sinal que Nemotron 3 Super envia para a comunidade de pesquisa. Pesos abertos significam a possibilidade de reprodução, auditoria e melhoria — algo do qual modelos fechados são fundamentalmente privados. Se a arquitetura híbrida Mamba-Attention realmente entrega os ganhos de eficiência alegados, ela poderia se tornar um novo padrão para a próxima geração de sistemas abertos. NVIDIA está essencialmente publicando não apenas um modelo, mas um ponto de referência arquitetônico.

O lançamento de Nemotron 3 Super marca um momento em que a IA aberta deixa de ser sinônimo de "suficientemente bom" e começa a reivindicar o papel de melhor em sua classe. NVIDIA converte habilmente seu domínio no espaço de hardware em autoridade de software, formando um stack completo — de chips a pesos de modelo. Para o mercado, isso significa concorrência intensificada e, como resultado, progresso acelerado. Para desenvolvedores — escolha real expandida. E para toda a indústria — confirmação de que a corrida mais emocionante em inteligência artificial hoje está se desdobrando não atrás de portas fechadas de laboratórios, mas em acesso aberto.

ZK
Hamidun News
Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.

Quer parar de ler sobre IA e começar a usar?

AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.

O que você acha?
Carregando comentários…