Últimas publicações

Google DeepMind apresenta DiffusionGemma para geração rápida de texto em NVIDIA
Google DeepMind otimizou o novo modelo DiffusionGemma para plataformas NVIDIA, acelerando a geração de texto em tempo real em chats, copilots e agentes.

NVIDIA MCG Toolkit automatiza a documentação de modelos de AI para novas regulamentações
A NVIDIA apresenta uma ferramenta para automatizar a documentação de modelos de AI, que ajuda equipes a cumprir exigências regulatórias como o EU AI Act e a criar model cards verificáveis sem trabalho manual.

NVIDIA apresenta DynoSim para otimização de parâmetros de LLM serving
NVIDIA apresenta DynoSim — uma ferramenta para otimização automática da configuração de atendimento de grandes modelos de linguagem através de simulação da fronteira de Pareto.

NVIDIA RTX apresenta DLSS 4.5 e personagens IA multilíngues para jogos
NVIDIA apresentou uma atualização RTX com suporte para personagens IA multilíngues através de ACE e novo DLSS 4.5 para Unreal Engine, simplificando o desenvolvimento de jogos com IA.

NVIDIA RTX PRO 4500 Blackwell: acelerando genômica e simulação de proteínas
A NVIDIA lançou a placa de vídeo RTX PRO 4500 Blackwell para acelerar computações genômicas e simulação de proteínas — componentes-chave da medicina de precisão.

Novo CompileIQ da NVIDIA encontra potencial oculto em núcleos GPU através de ajuste de parâmetros do compilador
NVIDIA apresentou CompileIQ — uma ferramenta de IA que seleciona automaticamente os parâmetros ideais do compilador para máximo desempenho dos núcleos GPU, encontrando acelerações onde a otimização manual já foi esgotada

NVIDIA CUDA 13.3 Simplifica Desenvolvimento em GPU com Tile Programming em C++
NVIDIA lançou CUDA 13.3 com Tile Programming em C++, que automatiza a otimização de operações de baixo nível com memória GPU para desenvolvedores.

NVIDIA Blackwell estabeleceu recorde STAC-AI em negociação de IA financeira
A arquitetura NVIDIA Blackwell demonstrou melhor desempenho no teste STAC-AI para IA financeira, processando maior volume de dados mais rápido que todos os concorrentes.

NVIDIA adiciona CUDA Tile para otimização de núcleos GPU em C++
A NVIDIA apresentou a tecnologia CUDA Tile integrada em C++ para o desenvolvimento de núcleos GPU de alto desempenho baseados em uma abordagem orientada a tiles.

NVIDIA Dynamo Snapshot: aceleração do lançamento de modelos no Kubernetes
NVIDIA apresentou uma ferramenta para reduzir o tempo de carregamento de modelos de inferência no Kubernetes de minutos para segundos — uma solução para evitar perda de GPU em picos de tráfego.

StepFun apresenta Step 3.7 Flash em GPU NVIDIA para trabalho multimodal
StepFun lançou Step 3.7 Flash — um modelo de IA multimodal com 198 bilhões de parâmetros que trabalha simultaneamente com texto, imagens, vídeo e documentos em aceleradores NVIDIA.

NVIDIA Ajuda Empresas de Telecom a Implantar Fábricas de IA Soberanas com Token-Metering
Empresas de telecom estão construindo infraestruturas de IA soberanas na arquitetura NVIDIA Cloud Partner, usando token-metering para acesso controlado—uma abordagem para serviços escaláveis e de alta margem para governo

NVIDIA GB200: Computação em Escala Exascalar em um Rack através de Agendamento Inteligente de Tarefas
NVIDIA demonstrou como maximizar o desempenho do GB200 NVL72 através do Slurm com consciência de topologia de rede—resultados mostram computação em escala exascalar em um único rack.

NVIDIA Mostra Como Rastrear GPUs em Clusters Kubernetes
A maioria das equipes subutiliza GPUs em clusters Kubernetes porque simplesmente não veem quem está usando, quanto de memória está sendo consumida e se os contêineres estão travados.

NVIDIA mostrou como sistemas multi-agentes encontram sinais nos mercados financeiros
Sistemas multi-agentes de IA ajudam pesquisadores a automatizar a busca por sinais de negociação em dados de mercado, analisando preços, indicadores econômicos e fontes alternativas para identificar padrões ocultos.

NVIDIA abre ferramenta para geração de imagens médicas 3D
A NVIDIA apresentou o framework NV-Generate-CTMR para síntese automática de imagens médicas 3D realistas, resolvendo a escassez de dados em radiologia e acelerando o treinamento de modelos de IA generalizados.

NVIDIA Vera Rubin: como os desenvolvedores dimensionarão IA de agentes sem latências
A NVIDIA apresentou Vera Rubin — uma plataforma para dimensionar IA de agentes que combina o GPU Vera Rubin NVL72 e o acelerador Groq 3 LPX para atingir 400 tokens por segundo em modelos de um trilhão de parâmetros.

NVIDIA mostrou a diferença entre avaliação de modelos e avaliação de agentes de IA
Benchmarks de modelos e avaliação de agentes resolvem tarefas diferentes: os primeiros testam compreensão de linguagem, os segundos — o comportamento real do sistema em ação.

NVIDIA desenvolveu um sistema de verificação de skills para gerenciar agentes de AI
A NVIDIA apresentou uma abordagem para verificar e gerenciar skills — instruções usadas por um agente de AI. Isso permite que organizações ampliem sistemas autônomos com segurança.

NVIDIA lançou AI-Q para pesquisas profundas em frameworks de agentes
NVIDIA apresentou AI-Q — um componente especializado para delegar pesquisas complexas a um backend separado. Suporta dados corporativos via MCP e funciona com Claude Code, Codex e outros agentes.

Como a NVIDIA recomenda adaptar agentes de AI para tarefas específicas
Uma publicação da NVIDIA detalha 9 técnicas de customização: um modelo de uso geral precisa ser adaptado para logística, suporte ao cliente e geração de código. A configuração correta reduz alucinações e custos.