Habr AI→ original

Anthropic dio consejos opuestos para Fable 5 y Opus 4.8: qué cambiar en los prompts

Los prompts que han funcionado durante años en Claude Opus 4.8 pueden romper Fable 5. Anthropic ahora publica guías separadas para cada modelo — y los…

Procesado por IA desde Habr AI; editado por Hamidun News
Anthropic dio consejos opuestos para Fable 5 y Opus 4.8: qué cambiar en los prompts
Fuente: Habr AI. Collage: Hamidun News.
◐ Escuchar artículo

Anthropic ha comenzado a lanzar guías de prompting separadas para cada uno de sus modelos — y los consejos en ellas a veces se contradicen directamente. Los desarrolladores que durante años han acumulado colecciones de prompts probados tendrán que revisarlos por separado para cada nuevo flagship.

Por qué Fable 5 se comportaba de manera extraña

Un caso ilustrativo de la comunidad: un desarrollador conectó Claude Fable 5 inmediatamente después de su lanzamiento. El modelo objetivamente supera a Opus 4.8 en benchmarks, sin embargo en la práctica funcionaba peor de lo esperado. En una ejecución, un agente consumió 200 mil tokens en hora y media sin completar la tarea. Al principio, el desarrollador culpó al modelo en sí, hasta que abrió la guía oficial de prompting de Anthropic específicamente para Fable 5. El problema resultó estar en los prompts. Fueron escritos para la lógica de Opus 4.8 y conflictaban con la arquitectura del nuevo flagship. Después de reformularlos de acuerdo con las recomendaciones de Anthropic para Fable 5, todo funcionó.

Conclusión clave: Anthropic ahora tiene dos documentos separados sobre prompting — y los consejos en ellos a veces son diametralmente opuestos. Aquellas instrucciones que durante años vivían en skills y prompts de sistema se volvieron contraproducentes en el nuevo modelo.

Consejos contradictorios para dos flagships

Al comparar las recomendaciones oficiales de Anthropic para Fable 5 y Opus 4.8, las diferencias resultan más agudas de lo que cabría esperar de dos modelos del mismo proveedor:

  • Subagentes: Opus 4.8 necesita ser impulsado explícitamente a delegar tareas — sin instrucciones prefiere resolver todo en un único contexto. Fable 5 lanza subagentes agresivamente por defecto, y necesita ser contenido con límites explícitos de profundidad y número de llamadas.
  • Explicación del razonamiento: La instrucción "explica tu razonamiento" — una técnica probada para Opus — comenzó a causar rechazos de ejecución de tareas en Fable 5.
  • Verbosidad: Fable 5 produce respuestas largas incluso sin ser solicitado. Opus 4.8 necesita ser explícitamente pedido para respuestas detalladas.
  • Límites de recursión: Para Fable 5, es crítico especificar de antemano restricciones en el número de llamadas de herramientas y profundidad de cadenas anidadas — de lo contrario fácilmente obtienes exactamente esos 200 mil tokens por sesión.
  • Formato por defecto: Fable 5 tiende a la salida estructurada incluso sin instrucción explícita; Opus en situación similar prefiere texto libre.

Anthropic explica la discrepancia a través de diferentes regímenes de entrenamiento: Fable 5 está optimizado para cadenas de agentes extendidas con autonomía máxima, Opus 4.8 — para respuestas de alta calidad dentro de una única llamada.

Un tercer camino de OpenAI

OpenAI tiene su propia filosofía de prompting para o3 y GPT-5, que no se alinea ni con las recomendaciones para Fable 5 ni con las de Opus 4.8. Mientras que Anthropic se enfoca en gestionar la autonomía del agente y su tendencia a auto-expandir contexto, OpenAI enfatiza descomposición clara de tareas, restricciones explícitas en el formato de salida y puntos de control obligatorios en escenarios multi-paso.

La reacción de la comunidad es mixta. Algunos desarrolladores ven guías diferenciadas como una señal de madurez de la plataforma: los modelos están construidos de manera diferente, y es más honesto reconocerlo explícitamente que dar consejos universales que funcionan a media potencia para todos. Otros lo ven como una inconveniencia — en lugar de una colección de prompts verificada, ahora necesitas mantener al menos tres versiones paralelas.

"Técnicamente esto está justificado — los modelos son diferentes.

Pero en la práctica significa múltiples versiones de los mismos prompts en producción", — de una discusión en la comunidad de desarrolladores.

Qué significa esto

La era de los prompts universales que funcionan igualmente bien en cualquier flagship está llegando a su fin. Si trabajas con múltiples modelos en producción, necesitarás una configuración separada para cada uno o un enrutador de prompts que seleccione automáticamente la variante correcta. Para los equipos, esta es una tarea de ingeniería específica que tendrá que resolverse antes de que llegue el próximo flagship.

ZK
Hamidun News
Noticias de AI sin ruido. Selección editorial diaria de más de 400 fuentes. Producto de Zhemal Khamidun, Head of AI en Alpina Digital.

¿Quieres dejar de leer sobre IA y empezar a usarla?

AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.

¿Qué te parece?
Cargando comentarios…