Dernières publications

Google DeepMind présente DiffusionGemma pour la génération rapide de texte sur NVIDIA
Google DeepMind a optimisé le nouveau modèle DiffusionGemma pour les plateformes NVIDIA afin d'accélérer la génération de texte en temps réel dans les chats, copilotes et agents.

NVIDIA MCG Toolkit automatise la documentation des modèles d'AI pour les nouvelles réglementations
NVIDIA présente un outil d'automatisation de la documentation des modèles d'AI, qui aide les équipes à répondre aux exigences réglementaires comme l'EU AI Act et à créer des model cards vérifiables sans travail manuel.

NVIDIA présente DynoSim pour optimiser les paramètres du service LLM
NVIDIA présente DynoSim, un outil pour optimiser automatiquement la configuration du service des grands modèles de langage par simulation de la frontière de Pareto.

NVIDIA RTX présente DLSS 4.5 et des personnages IA multilingues pour les jeux
NVIDIA a présenté une mise à jour RTX avec support des personnages IA multilingues via ACE et le nouveau DLSS 4.5 pour Unreal Engine, simplifiant le développement de jeux avec l'IA.

NVIDIA RTX PRO 4500 Blackwell : accélération de la génomique et de la modélisation des protéines
NVIDIA a lancé la carte graphique RTX PRO 4500 Blackwell pour accélérer les calculs génomiques et la modélisation des protéines — des composants clés de la médecine de précision.

Le nouveau CompileIQ de NVIDIA découvre le potentiel caché des cœurs GPU grâce à l'ajustement des paramètres du compilateur
NVIDIA a présenté CompileIQ — un outil basé sur l'IA qui sélectionne automatiquement les paramètres optimaux du compilateur pour maximiser les performances des cœurs GPU, découvrant des accélérations là où l'optimisation

NVIDIA CUDA 13.3 simplifie le développement GPU avec Tile programming en C++
NVIDIA a lancé CUDA 13.3 avec Tile programming en C++, qui automatise l'optimisation des opérations mémoire GPU bas niveau pour les développeurs.

NVIDIA Blackwell établit un record STAC-AI dans le trading AI financier
L'architecture NVIDIA Blackwell a démontré les meilleures performances au test STAC-AI pour l'IA financière, traitant un volume de données plus important plus rapidement que tous ses concurrents.

NVIDIA a ajouté CUDA Tile pour optimiser les noyaux GPU en C++
NVIDIA a présenté la technologie CUDA Tile intégrée en C++ pour développer des noyaux GPU haute performance basés sur une approche orientée tuiles.

NVIDIA Dynamo Snapshot: accélération du lancement des modèles sur Kubernetes
NVIDIA a présenté un outil pour réduire le temps de chargement des modèles d'inférence sur Kubernetes de minutes à secondes — une solution pour éviter la perte de capacité GPU lors de pics de trafic.

StepFun présente Step 3.7 Flash sur GPU NVIDIA pour le travail multimodal
StepFun lance Step 3.7 Flash — un modèle d'IA multimodal avec 198 milliards de paramètres, qui traite simultanément du texte, des images, de la vidéo et des documents sur les accélérateurs NVIDIA.

NVIDIA Aide les Opérateurs Télécom à Déployer des Usines d'IA Souveraines avec Token-Metering
Les opérateurs télécom construisent des infrastructures d'IA souveraines sur l'architecture NVIDIA Cloud Partner, utilisant le token-metering pour un accès contrôlé—une approche vers des services scalables à marges élevé

NVIDIA GB200: Calcul à l'échelle exascalaire dans un rack par ordonnancement intelligent des tâches
NVIDIA a démontré comment maximiser les performances du GB200 NVL72 grâce à Slurm avec une connaissance de la topologie réseau—les résultats montrent un calcul à l'échelle exascalaire sur un seul rack.

NVIDIA Explique Comment Suivre les GPUs dans les Clusters Kubernetes
La plupart des équipes sous-utilisent les GPUs dans les clusters Kubernetes parce qu'elles ne voient tout simplement pas qui les utilise, combien de mémoire est consommée et si les conteneurs sont bloqués.

NVIDIA a montré comment les systèmes multi-agents trouvent des signaux sur les marchés financiers
Les systèmes multi-agents d'IA aident les chercheurs à automatiser la recherche de signaux de trading dans les données de marché en analysant les prix, les indicateurs économiques et les sources alternatives pour identif

NVIDIA dévoile un outil de génération d'images médicales 3D
NVIDIA a présenté NV-Generate-CTMR pour synthétiser automatiquement des images médicales 3D réalistes, résolvant la pénurie de données en radiologie et accélérant l'entraînement de modèles IA généralisés.

NVIDIA Vera Rubin : comment les développeurs pourront mettre à l'échelle l'IA d'agent sans latence
NVIDIA présente Vera Rubin, une plateforme pour l'IA d'agent qui combine GPU Vera Rubin NVL72 et accélérateur Groq 3 LPX pour atteindre 400 tokens/sec sur les modèles trillion-paramétriques.

NVIDIA a montré la différence entre l'évaluation des modèles et l'évaluation des agents IA
Les benchmarks de modèles et l'évaluation d'agents résolvent des tâches différentes : les premiers testent la compréhension du langage, les seconds — le comportement réel du système en action.

NVIDIA a développé un système de vérification des skills pour gérer les agents AI
NVIDIA a présenté une approche de vérification et de gestion des skills — les instructions qu’utilise un agent AI. Cela permet aux organisations de faire évoluer des systèmes autonomes en toute sécurité.

NVIDIA a lancé AI-Q pour les recherches approfondies dans les frameworks d'agents
NVIDIA a présenté AI-Q, un composant spécialisé pour déléguer les recherches complexes à un backend distinct. Il supporte les données d'entreprise via MCP et fonctionne avec Claude Code et Codex.

Comment NVIDIA recommande d'adapter des agents AI à des tâches spécifiques
Une publication de NVIDIA détaille 9 techniques de personnalisation : un modèle généraliste doit être adapté à la logistique, au support client et à la génération de code. Un bon réglage réduit les hallucinations et le c