Habr AI→ original

Anthropic a donné des conseils opposés pour Fable 5 et Opus 4.8 : qu'il faut changer dans les prompts

Les prompts qui fonctionnent depuis des années sur Claude Opus 4.8 peuvent casser Fable 5. Anthropic publie désormais des guides séparés pour chaque modèle…

Traité par IA depuis Habr AI ; édité par Hamidun News
Anthropic a donné des conseils opposés pour Fable 5 et Opus 4.8 : qu'il faut changer dans les prompts
Source : Habr AI. Collage: Hamidun News.
◐ Écouter l'article

Anthropic a commencé à publier des guides de prompting séparés pour chacun de ses modèles — et les conseils qu'ils contiennent se contredisent parfois directement. Les développeurs qui ont passé des années à accumuler des collections de prompts testés devront les réviser séparément pour chaque nouveau flagship.

Pourquoi Fable 5 s'est comporté bizarrement

Un cas révélateur de la communauté : un développeur a connecté Claude Fable 5 immédiatement après son lancement. Le modèle surpasse objectivement Opus 4.8 sur les benchmarks, cependant en pratique il fonctionnait moins bien que prévu. Lors d'une exécution, un agent a consommé 200 000 tokens en une heure et demie sans compléter la tâche. Au départ, le développeur en rendait responsable le modèle lui-même, jusqu'à ce qu'il ouvre le guide officiel de prompting d'Anthropic spécifiquement pour Fable 5. Le problème s'est avéré être dans les prompts. Ils étaient écrits pour la logique d'Opus 4.8 et entraient en conflit avec l'architecture du nouveau flagship. Après les avoir reformulés selon les recommandations d'Anthropic pour Fable 5, tout a fonctionné.

Conclusion clé : Anthropic dispose maintenant de deux documents séparés sur le prompting — et les conseils qu'ils contiennent sont parfois diamétralement opposés. Ces instructions qui avaient vécu pendant des années dans les skills et prompts système sont devenues contre-productives sur le nouveau modèle.

Conseils contradictoires pour deux flagships

Lorsqu'on compare les recommandations officielles d'Anthropic pour Fable 5 et Opus 4.8, les différences s'avèrent plus prononcées que ce qu'on pourrait attendre de deux modèles du même fournisseur :

  • Sous-agents : Opus 4.8 a besoin d'être explicitement poussé à déléguer des tâches — sans instructions il préfère tout résoudre dans un seul contexte. Fable 5 lance les sous-agents agressivement par défaut, et il doit être contenu avec des limites explicites de profondeur et de nombre d'appels.
  • Explication du raisonnement : L'instruction « explique ton raisonnement » — une technique éprouvée pour Opus — a commencé à causer des refus d'exécution de tâche sur Fable 5.
  • Verbosité : Fable 5 produit de longues réponses même sans être sollicité. Opus 4.8 a besoin d'être explicitement demandé pour des réponses détaillées.
  • Limites de récursion : Pour Fable 5, il est critique de spécifier d'avance des restrictions sur le nombre d'appels d'outils et la profondeur des chaînes imbriquées — sinon vous finissez facilement avec exactement ces 200 000 tokens par session.
  • Format par défaut : Fable 5 tend vers la sortie structurée même sans instruction explicite ; Opus dans une situation similaire préfère du texte libre.

Anthropic explique l'écart par différents régimes d'entraînement : Fable 5 est optimisé pour les longues chaînes d'agents avec autonomie maximale, Opus 4.8 — pour les réponses de haute qualité dans un seul appel.

Un troisième chemin d'OpenAI

OpenAI a sa propre philosophie du prompting pour o3 et GPT-5, qui ne correspond ni aux recommandations pour Fable 5 ni à celles pour Opus 4.8. Tandis qu'Anthropic se concentre sur la gestion de l'autonomie de l'agent et sa tendance à auto-élargir le contexte, OpenAI met l'accent sur une décomposition claire des tâches, des restrictions explicites sur le format de sortie et des points de contrôle obligatoires dans les scénarios multi-étapes.

La réaction de la communauté est mitigée. Certains développeurs voient les guides différenciés comme un signe de maturité de la plateforme : les modèles sont construits différemment, et il est plus honnête de le reconnaître explicitement que de donner des conseils universels qui fonctionnent à demi-puissance pour tous. D'autres le voient comme une gêne — au lieu d'une collection de prompts vérifiée, vous devez maintenant en gérer au moins trois versions parallèles.

« Techniquement c'est justifié — les modèles sont différents.

Mais en pratique cela signifie plusieurs versions des mêmes prompts en production », — d'une discussion dans la communauté des développeurs.

Que cela signifie

L'ère des prompts universels qui fonctionnent aussi bien sur n'importe quel flagship arrive à sa fin. Si vous travaillez avec plusieurs modèles en production, vous aurez besoin soit d'une configuration séparée pour chaque modèle, soit d'un routeur de prompts qui sélectionne automatiquement la bonne variante. Pour les équipes, c'est une tâche d'ingénierie spécifique qui devra être résolue avant l'arrivée du prochain flagship.

ZK
Hamidun News
Actualités IA sans bruit. Sélection éditoriale quotidienne de plus de 400 sources. Produit de Zhemal Khamidun, Head of AI chez Alpina Digital.

Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?

AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.

Qu'en pensez-vous ?
Chargement des commentaires…