Anthropic sort Claude Opus 4.7 pour la programmation d'agents, la vision et les tâches autonomes
Anthropic a lancé Claude Opus 4.7 — une mise à jour directe d'Opus 4.6 axée sur la programmation d'agents, la vision et les tâches autonomes longues. Le…
Traité par IA depuis MarkTechPost ; édité par Hamidun News
Anthropic a lancé Claude Opus 4.7 le 16 avril 2026 — une mise à jour ciblée mais hautement significative de son modèle phare qui s'attaque aux douleurs pratiques des développeurs plutôt qu'aux benchmarks abstraits : programmation multi-agents, traitement d'images détaillées et tâches autonomes longues où le modèle doit non seulement répondre, mais planifier, se vérifier lui-même et accomplir les tâches de bout en bout. L'entreprise positionne Opus 4.
7 comme une mise à jour directe d'Opus 4.6, et non comme une nouvelle gamme de produits. Pourtant, dans les scénarios d'ingénierie, la différence s'est avérée substantielle.
Selon Anthropic, le modèle suit mieux les instructions, gère avec plus de soin les processus multi-étapes et trouve plus souvent des moyens de vérifier les résultats avant de les retourner à l'utilisateur. C'est particulièrement important dans les environnements où l'IA n'écrit pas simplement des fragments de code à la demande, mais agit comme un exécuteur semi-autonome : lisant les référentiels, exécutant des outils, corrigeant les erreurs, continuant le travail après les défaillances et conservant les solutions intermédiaires en mémoire. Sur les benchmarks d'Anthropic et de ses partenaires, l'amélioration ne semble pas cosmétique.
Sur le benchmark interne de 93 tâches de programmation, Opus 4.7 a amélioré le taux de réussite des tâches de 13% par rapport à Opus 4.6, incluant quatre tâches que ni Opus 4.
6 ni Sonnet 4.6 n'ont pu résoudre. Dans CursorBench, le modèle a atteint 70% contre 58% dans la version précédente.
Dans les cas de test de Notion pour des processus complexes multi-étapes, l'amélioration a été de 14% avec une consommation de tokens réduite et trois fois moins d'erreurs lors de l'appel d'outils. Rakuten affirme séparément que sur Rakuten-SWE-Bench, le nouveau modèle ferme trois fois plus de tâches de production qu'Opus 4.6.
La deuxième grande mise à jour est la vision. Claude Opus 4.7 peut traiter des images jusqu'à 2576 pixels du côté le plus long — environ 3,75 mégapixels.
C'est plus de trois fois supérieur à la limite des modèles Claude précédents. Pour le mode de chat normal, ce chiffre pourrait sembler secondaire, mais pour les scénarios multi-agents c'est critique : le modèle peut analyser des captures d'écran denses d'interfaces, des diagrammes techniques, des schémas, des structures chimiques et des documents où les détails fins importent. Anthropic fournit un exemple du domaine du computer use : sur le benchmark visuel XBOW, la nouvelle version a obtenu 98,5% contre 54,5% pour Opus 4.
6. En pratique, cela déplace une série de tâches de la catégorie « fonctionne parfois » à « peut être intégré dans les produits ». Anthropic a également renforcé les outils pour l'exécution autonome longue.
Opus 4.7 introduit un nouveau niveau d'effort de raisonnement — xhigh, positionné entre high et max. Dans l'API, l'entreprise a lancé une bêta publique de task budgets, permettant aux développeurs de limiter le budget de tokens lors de longs traitements et de gérer les priorités des étapes.
Claude Code propose désormais un mode ultrareview pour un examen plus approfondi des modifications, et le mode auto permet désormais moins d'interruptions pour les tâches longues avec les demandes de permission. Cependant, la migration à partir d'Opus 4.6 n'est pas entièrement gratuite : le tokeniseur mis à jour peut augmenter les tokens d'entrée d'environ 1,0–1,35 fois selon le type de contenu, et le raisonnement plus profond aux étapes ultérieures des tâches multi-agents augmente le volume de tokens de sortie.
Anthropic met l'accent séparément sur le thème de la sécurité. Opus 4.7 est lancé peu après l'annonce de Mythos Preview — un modèle plus puissant dont l'accès Anthropic a décidé de restreindre en raison des risques de cybersécurité.
Par conséquent, Opus 4.7 est le premier modèle public sur lequel Anthropic teste les blocages automatiques pour les demandes cyber à haut risque. Pour les scénarios légitimes comme le pentesting, le red teaming et la recherche de vulnérabilités, l'entreprise a simultanément ouvert un programme de vérification.
Selon l'évaluation propre d'Anthropic, le profil de sécurité d'Opus 4.7 est généralement proche de 4.6 : le modèle s'est amélioré en honnêteté et en résistance aux injections de prompts, bien que dans certaines catégories il soit imparfait et reste toujours en retrait de Mythos Preview en termes de cohérence globale du comportement.
La conclusion principale est simple : Claude Opus 4.7 n'est pas une nouvelle génération pour le simple fait d'un nouveau numéro, mais un lancement pragmático pour ceux qui construisent des flux de travail réels sur le modèle. Si votre scénario est un assistant IDE, un agent d'examen de code, une analyse de documents, une vision par ordinateur pour les interfaces ou de longues chaînes d'actions pilotées par des outils, la mise à jour semble significative dès maintenant.
Pour l'utilisateur moyen, la différence peut ne pas toujours être évidente, mais pour les développeurs et les équipes qui mesurent la qualité non pas par des démos mais par le nombre de tâches accomplies de bout en bout, Opus 4.7 semble être l'une des mises à jour les plus utiles d'Anthropic ces derniers temps.
Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?
AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.