Anthropic dio consejos opuestos para Fable 5 y Opus 4.8: qué cambiar en los prompts
Los prompts que han funcionado durante años en Claude Opus 4.8 pueden romper Fable 5. Anthropic ahora publica guías separadas para cada modelo — y los…
Procesado por IA desde Habr AI; editado por Hamidun News
Anthropic ha comenzado a lanzar guías de prompting separadas para cada uno de sus modelos — y los consejos en ellas a veces se contradicen directamente. Los desarrolladores que durante años han acumulado colecciones de prompts probados tendrán que revisarlos por separado para cada nuevo flagship.
Por qué Fable 5 se comportaba de manera extraña
Un caso ilustrativo de la comunidad: un desarrollador conectó Claude Fable 5 inmediatamente después de su lanzamiento. El modelo objetivamente supera a Opus 4.8 en benchmarks, sin embargo en la práctica funcionaba peor de lo esperado. En una ejecución, un agente consumió 200 mil tokens en hora y media sin completar la tarea. Al principio, el desarrollador culpó al modelo en sí, hasta que abrió la guía oficial de prompting de Anthropic específicamente para Fable 5. El problema resultó estar en los prompts. Fueron escritos para la lógica de Opus 4.8 y conflictaban con la arquitectura del nuevo flagship. Después de reformularlos de acuerdo con las recomendaciones de Anthropic para Fable 5, todo funcionó.
Conclusión clave: Anthropic ahora tiene dos documentos separados sobre prompting — y los consejos en ellos a veces son diametralmente opuestos. Aquellas instrucciones que durante años vivían en skills y prompts de sistema se volvieron contraproducentes en el nuevo modelo.
Consejos contradictorios para dos flagships
Al comparar las recomendaciones oficiales de Anthropic para Fable 5 y Opus 4.8, las diferencias resultan más agudas de lo que cabría esperar de dos modelos del mismo proveedor:
- Subagentes: Opus 4.8 necesita ser impulsado explícitamente a delegar tareas — sin instrucciones prefiere resolver todo en un único contexto. Fable 5 lanza subagentes agresivamente por defecto, y necesita ser contenido con límites explícitos de profundidad y número de llamadas.
- Explicación del razonamiento: La instrucción "explica tu razonamiento" — una técnica probada para Opus — comenzó a causar rechazos de ejecución de tareas en Fable 5.
- Verbosidad: Fable 5 produce respuestas largas incluso sin ser solicitado. Opus 4.8 necesita ser explícitamente pedido para respuestas detalladas.
- Límites de recursión: Para Fable 5, es crítico especificar de antemano restricciones en el número de llamadas de herramientas y profundidad de cadenas anidadas — de lo contrario fácilmente obtienes exactamente esos 200 mil tokens por sesión.
- Formato por defecto: Fable 5 tiende a la salida estructurada incluso sin instrucción explícita; Opus en situación similar prefiere texto libre.
Anthropic explica la discrepancia a través de diferentes regímenes de entrenamiento: Fable 5 está optimizado para cadenas de agentes extendidas con autonomía máxima, Opus 4.8 — para respuestas de alta calidad dentro de una única llamada.
Un tercer camino de OpenAI
OpenAI tiene su propia filosofía de prompting para o3 y GPT-5, que no se alinea ni con las recomendaciones para Fable 5 ni con las de Opus 4.8. Mientras que Anthropic se enfoca en gestionar la autonomía del agente y su tendencia a auto-expandir contexto, OpenAI enfatiza descomposición clara de tareas, restricciones explícitas en el formato de salida y puntos de control obligatorios en escenarios multi-paso.
La reacción de la comunidad es mixta. Algunos desarrolladores ven guías diferenciadas como una señal de madurez de la plataforma: los modelos están construidos de manera diferente, y es más honesto reconocerlo explícitamente que dar consejos universales que funcionan a media potencia para todos. Otros lo ven como una inconveniencia — en lugar de una colección de prompts verificada, ahora necesitas mantener al menos tres versiones paralelas.
"Técnicamente esto está justificado — los modelos son diferentes.
Pero en la práctica significa múltiples versiones de los mismos prompts en producción", — de una discusión en la comunidad de desarrolladores.
Qué significa esto
La era de los prompts universales que funcionan igualmente bien en cualquier flagship está llegando a su fin. Si trabajas con múltiples modelos en producción, necesitarás una configuración separada para cada uno o un enrutador de prompts que seleccione automáticamente la variante correcta. Para los equipos, esta es una tarea de ingeniería específica que tendrá que resolverse antes de que llegue el próximo flagship.
¿Quieres dejar de leer sobre IA y empezar a usarla?
AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.
Lo esencial de la IA — una vez por semana
Siete historias que de verdad importaron, elegidas a mano. Sin ruido ni notas de prensa.
¡Listo! Revisa tu correo para la confirmación.