NVIDIA Vera Rubin : comment les développeurs vont mettre l'AI agentique à l'échelle sans latence
NVIDIA a lancé Vera Rubin — une plateforme haute vitesse pour l'AI agentique. Elle combine le GPU Vera Rubin et l'accélérateur Groq 3 LPX. Sur des modèles à mil

◐ Écouter l'article
NVIDIA a lancé Vera Rubin — une plateforme haute vitesse pour l'AI agentique. Elle combine le GPU Vera Rubin et l'accélérateur Groq 3 LPX. Sur des modèles à mille milliards de paramètres, elle atteint 400 tokens/s avec une latence dans un contexte de 400K tokens.