Fuga del Claude Mythos: modelo 'demasiado peligroso para el público' cayó en manos no autorizadas
Anthropic anunció que su modelo Claude Mythos es demasiado peligroso para una versión pública — y ese mismo día, usuarios no autorizados ya tenían acceso…
Procesado por IA desde The Verge; editado por Hamidun News
Anthropic se ha visto en una situación incómoda: el modelo Claude Mythos, que la empresa había pasado semanas presentando como demasiado peligroso para acceso abierto, se filtró a personas no autorizadas incluso antes de que comenzaran las pruebas oficiales. Según Bloomberg, un pequeño grupo de usuarios no autorizados obtuvo acceso a Mythos el mismo día en que Anthropic anunció planes para proporcionar el modelo a un círculo limitado de empresas. El hecho mismo de la existencia de Mythos se conoció antes — a través de una filtración, no de un anuncio oficial.
Ahora la empresa ha declarado que está investigando el incidente. Mythos fue posicionado como un modelo con capacidades excepcionales en el campo de la ciberseguridad. Estas mismas capacidades se convirtieron en la justificación oficial para un enfoque extremadamente cauteloso en el lanzamiento: Anthropic insistía en que el modelo no estaba listo para una base de usuarios amplia debido a los riesgos potenciales.
La empresa había planeado lanzar pruebas cerradas solo con socios seleccionados — como parte del proyecto Glasswing. El incidente pone a Anthropic en una posición particularmente delicada. La empresa ha construido su reputación en torno a la idea de desarrollo responsable de IA y controles de seguridad rigurosos.
Declarar públicamente que un modelo es demasiado peligroso — y luego permitir su filtración en el día del anuncio — es un golpe precisamente a la parte de la imagen que Anthropic ha cultivado durante años. Actualmente se desconoce cómo los usuarios obtuvieron acceso, cuán completo fue ese acceso y qué capacidades del modelo lograron aprovechar. Anthropic no está divulgando los detalles de la investigación.
Lo que sucedió expone un problema sistémico enfrentado por todos los laboratorios de IA importantes: cuanto más cerrado y "secreto" se declara un modelo, mayor es el interés en él — y más dolorosa se vuelve cualquier filtración. Para Anthropic, este incidente se ha convertido en una prueba tangible de cuán bien las palabras de la empresa sobre seguridad están respaldadas por procesos reales dentro de la empresa.
¿Quieres dejar de leer sobre IA y empezar a usarla?
AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.