Anthropic présente Claude Opus 4.8 avec des améliorations pour le codage et les tâches multi-agents
Anthropic a lancé Claude Opus 4.8 — une mise à jour d'Opus 4.7 avec des améliorations en codage, tâches multi-agents et travail prolongé. Le nouveau modèle…
Traité par IA depuis Anthropic Blog ; édité par Hamidun News
Anthropic a présenté Claude Opus 4.8 — une mise à jour du modèle phare avec un jugement amélioré pour les tâches multi-agents. Le modèle est disponible au même prix qu'Opus 4.7 et fonctionne dans le système avec les nouvelles fonctionnalités de claude.ai et Claude Code.
Trois nouvelles fonctionnalités avec Opus 4.8
En plus du modèle lui-même, Anthropic a lancé des outils pour un meilleur contrôle :
- Sur claude.ai — un curseur pour contrôler l'effort : du mode rapide à l'analyse approfondie
- Claude Code a reçu Dynamic Workflows pour résoudre des tâches très complexes (travail sur plusieurs jours)
- Fast Mode pour Opus 4.8 coûte maintenant trois fois moins cher et fonctionne 2,5× plus vite que d'habitude
Sur les benchmarks standards de codage, de raisonnement et de tâches pratiques, Opus 4.8 surpasse Opus 4.7 et rivalise avec GPT-5.5.
Ce que les tests ont montré
Opus 4.8 est unique par sa fiabilité sur les tâches longues. Sur le benchmark Super-Agent, c'est l'unique modèle qui a complété toutes les tâches end-to-end et qui a surpassé Opus 4.7 et GPT-5.5. Sur CursorBench (test d'éditeur de code), le modèle surpasse tous les niveaux de complexité, en appelant les outils de manière plus efficace. Sur le Legal Agent Benchmark, Opus 4.8 est le premier modèle à franchir le seuil de 10 % sur le standard all-pass. Cela signifie qu'un avocat peut maintenant lui confier un travail plus complexe. Sur Online-Mind2Web (agents de navigation), le modèle a obtenu 84 % — un bond notable au-dessus d'Opus 4.7 et GPT-5.5.
Ce que disent les développeurs
Les ingénieurs chez Devin ont noté qu'Opus 4.8 fonctionne plus proprement avec les outils et suit les instructions avec la cohérence nécessaire pour le travail autonome. Le modèle a corrigé les problèmes de verbosité qui existaient dans la version 4.7.
«
Opus 4.8 est une mise à jour de qualité : plus rapide, collaboration plus facile, et meilleur maintien du contexte et du style tout au long d'une longue session », dit l'un des premiers testeurs.
L'équipe de CoCounsel constate qu'Opus 4.8 fournit un meilleur raisonnement dans les analyses complexes et termine le travail plus rapidement avec des résultats plus denses. Sur le benchmark Super-Agent, le modèle a prouvé qu'il pouvait gérer de longs flux de travail sans erreurs et sans intervention humaine.
Ce que cela signifie
Opus 4.8 n'est pas simplement une mise à jour de version, mais un signal que les modèles de base évoluent très rapidement. En un trimestre, Anthropic l'a rendu pratiquement plus utile pour les agents commerciaux : les agents Devin sont plus fiables, les avocats déléguent davantage, les ingénieurs économisent du temps sur la révision de code. Pour les entreprises, cela signifie que les investissements dans les outils d'IA deviennent plus rentables.
Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?
AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.