Habr AI→ original

Claude Fable 5 vivió tres días: filtración de prompt de sistema, degradación y directiva de EE.UU.

Anthropic lanzó Claude Fable 5 el 9 de junio y lo retiró tres días después. Durante ese período: el investigador Pliny publicó el supuesto prompt de sistema…

Procesado por IA desde Habr AI; editado por Hamidun News
Claude Fable 5 vivió tres días: filtración de prompt de sistema, degradación y directiva de EE.UU.
Fuente: Habr AI. Collage: Hamidun News.
◐ Escuchar artículo

Anthropic lanzó Claude Fable 5 y el Mythos 5 cerrado el 9 de junio — y ya el 12 retiró el acceso a ambas versiones. Dentro de tres días entre el lanzamiento y la retirada, ocurrió más de lo que muchos modelos acumulan en un año: compromiso del prompt del sistema, degradación oculta de respuestas, cambio en la política de retención de datos y una directiva del gobierno de EE.UU.

Lanzamiento y revocación repentina

Fable 5 fue posicionado como un paso significativo en la línea Claude: razonamiento mejorado, seguimiento más preciso de instrucciones, análisis contextual profundo. Mythos 5 — una versión con capacidades expandidas — se distribuyó solo en circuito cerrado para socios seleccionados. El lanzamiento simultáneo de dos versiones — pública y cerrada — fue en sí un movimiento atípico: Anthropic normalmente lanza un modelo con expansión gradual de acceso.

Tres días después del lanzamiento, la empresa suspendió el acceso a ambos modelos sin explicación. La declaración oficial solo confirmó el hecho de la suspensión, sin indicar razones. Incluso las revocaciones de emergencia se acompañan normalmente de una breve explicación pública — aquí no la hubo.

La ausencia de comentarios solo intensificó olas de discusión y especulación.

Compromiso del prompt y degradación oculta

El investigador Pliny publicó una entrada detallada en X con el supuesto prompt del sistema de Fable 5 y colocó el archivo completo en GitHub. Según él, los mecanismos de protección del modelo fueron eludidos usando métodos de inyección de prompt de múltiples pasos. Anthropic ni confirmó ni negó oficialmente la autenticidad de los datos publicados, lo que muchos interpretaron como consentimiento tácito.

En paralelo, la comunidad de IA descubrió un problema mucho más grave: la empresa supuestamente degradó secretamente la calidad de las respuestas para varios investigadores de IA. Esto se refiere a una práctica en la que ciertas cuentas — probablemente aquellas que probaban activamente las protecciones del modelo — recibían respuestas notablemente peores que los usuarios normales. Para una comunidad dedicada a la evaluación independiente de sistemas de IA, este es un golpe serio: si un modelo deliberadamente se degrada para quienes lo verifican, ningún benchmark externo puede considerarse confiable.

"Si

Anthropic puede degradar deliberadamente el modelo para usuarios específicos, cualquier prueba pública pierde credibilidad", escribió uno de los benchmarkers de IA.

La disputa sobre métodos de elusión de protecciones fue más allá del ámbito académico: varios equipos independientes publicaron demostraciones de escenarios de jailbreak exitosos con Fable 5, lo que intensificó la presión sobre la empresa para obtener explicaciones.

Datos, herramientas y regulación

En medio de los escándalos, Anthropic actualizó silenciosamente su política de privacidad: las conversaciones con Claude ahora se almacenan hasta 30 días por defecto en lugar de un período más corto. El cambio ocurrió sin anuncio oficial — observadores independientes lo notaron, y esto solo agregó crítica contra una empresa ya acusada de falta de transparencia. En el frente del desarrollo, Anthropic continuó avanzando Claude Code durante el mismo período. Entre las actualizaciones clave del conjunto de herramientas:

  • Soporte expandido para cadenas de agentes
  • Nuevos tipos de hooks (CwdChanged, FileChanged, TaskCreated)
  • Trabajo mejorado con grandes monorepos
  • Soporte para ejecución paralela de subagentes
  • Interfaz actualizada de gestión de permisos

Al final del período, surgió una directiva del gobierno de EE.UU., afectando el uso de Claude en estructuras gubernamentales. Los detalles del documento aún no han sido totalmente divulgados, pero la mera aparición de un acto regulatorio que menciona un modelo comercial específico es rara. Esta es una señal: la supervisión de sistemas de IA poderosos se está moviendo de la discusión a la práctica.

Qué significa esto

En tres días, Anthropic viajó desde un lanzamiento importante hasta la retirada completa del modelo — con paradas en el prompt del sistema comprometido, el escándalo de degradación de respuestas y el silencioso cambio en los términos de retención de datos. Cada episodio individualmente es explicable, pero juntos forman un patrón de opacidad. Conforme las capacidades de los sistemas de IA crecen, los reguladores y usuarios exigirán mayor claridad — la historia de Fable 5 demuestra claramente lo que resulta de su ausencia.

ZK
Hamidun News
Noticias de AI sin ruido. Selección editorial diaria de más de 400 fuentes. Producto de Zhemal Khamidun, Head of AI en Alpina Digital.

¿Quieres dejar de leer sobre IA y empezar a usarla?

AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.

¿Qué te parece?
Cargando comentarios…