Guardian→ original

Anthropic Restringe el Acceso a Claude Mythos por Riesgos Globales de Ciberseguridad

Anthropic no lanza Claude Mythos para acceso público porque el modelo puede descubrir y potencialmente explotar vulnerabilidades críticas en sistemas…

Procesado por IA desde Guardian; editado por Hamidun News
Anthropic Restringe el Acceso a Claude Mythos por Riesgos Globales de Ciberseguridad
Fuente: Guardian. Collage: Hamidun News.
◐ Escuchar artículo

Anthropic ha pausado efectivamente el lanzamiento público de Claude Mythos, reconociendo un hecho simple: un modelo capaz de encontrar sistemáticamente y encadenar vulnerabilidades críticas puede ser útil para defensores, pero en manos equivocadas rápidamente se convierte en una herramienta para ataques. La situación se agravó por reportes de acceso no autorizado a Mythos por parte de un pequeño grupo de usuarios. Si ni siquiera un sistema cerrado es fácil mantener bajo control, la pregunta ya no es si tales capacidades aparecerán en el mercado, sino quién se preparará primero.

Mythos es el nuevo modelo de Anthropic, presentado el 7 de abril de 2026. La empresa afirma que puede encontrar y potencialmente explotar vulnerabilidades zero-day en sistemas operativos y navegadores clave. Se trata de defectos que los desarrolladores aún desconocen y consecuentemente no han reparado.

Según la propia Anthropic, algunos de los problemas descubiertos permanecieron inadvertidos durante diez, veinte e incluso veintisiete años. En su informe técnico, la empresa escribe que Mythos fue capaz de construir automáticamente exploits complejos, incluyendo la combinación de múltiples vulnerabilidades en una única cadena. Esta es precisamente la razón por la que el modelo no fue lanzado para acceso público: el riesgo es demasiado alto de que tales capacidades se utilicen no solo para defensa sino también para ataques.

Al mismo tiempo, Anthropic no ocultó completamente a Mythos. Aproximadamente 40 empresas y organizaciones de los sectores tecnológico, infraestructural y financiero obtuvieron acceso a través del Project Glasswing para encontrar debilidades en sistemas críticos antes de que herramientas similares se generalicen. Los principales actores ya se han reunido alrededor del proyecto, y las autoridades y reguladores comenzaron a discutir no una amenaza abstracta sino escenarios muy prácticos: qué sucederá si tal herramienta termina en manos de atacantes.

El interés de los bancos en el tema es comprensible. En el peor de los casos, los ataques a servicios críticos podrían provocar interrupciones en banca en línea, pagos, cajeros automáticos y cadenas de liquidación relacionadas. Incluso sin un escenario catastrófico, el mero hecho de la existencia de tal herramienta cambia el equilibrio entre la velocidad del descubrimiento de vulnerabilidades y la velocidad de su reparación.

Las preocupaciones se intensificaron después de reportes de que varias personas podrían haber obtenido acceso no autorizado a Mythos a través del entorno cerrado. Anthropic declaró que está investigando este incidente. Para la industria, esta es una señal alarmante en dos niveles.

Primero, ni siquiera un lanzamiento limitado garantiza el aislamiento completo del modelo. Segundo, cuanto más valiosos y peligrosos son tales sistemas, mayor es el incentivo para eludir barreras organizacionales y técnicas. En este contexto, la pregunta clave se desplaza de "cuán poderoso es el modelo en sí" a "cuán confiablemente está estructurado el entorno a su alrededor" — desde control de acceso y auditoría de acciones hasta reglas para divulgar vulnerabilidades descubiertas.

Sin embargo, hay una salvedad importante en torno a Mythos. Las evaluaciones independientes confirman un salto notable en las capacidades cibernéticas del modelo, pero no proporcionan motivos para pánico injustificado. El British AI Security Institute reportó que Mythos fue el primer modelo en pasar completamente su simulación de ataque corporativo de 32 pasos, aunque solo en 3 de 10 intentos.

En tareas de nivel experto como capture-the-flag, el modelo mostró una tasa de éxito del 73%. Pero el instituto mismo enfatiza por separado: estas pruebas se realizaron en entornos vulnerables y poco protegidos, sin defensores activos y sin un conjunto completo de herramientas de monitoreo. En otras palabras, no se trata de capacidad comprobada para comprometer cualquier banco o nube bien protegida con presionar un botón, sino que el umbral para ataques complejos está bajando rápidamente.

Además, algunos investigadores creen que Mythos no es una ruptura mágica con la generación anterior, sino una aceleración de una tendencia ya en curso: otros modelos más baratos también están aprendiendo a encontrar bugs individuales peligrosos, aunque de manera menos estable y peor en escenarios largos de múltiples pasos. La conclusión principal es simple: Claude Mythos es importante no como una sensación singular, sino como una señal de una nueva fase en la ciberseguridad. Si tales modelos realmente pueden encontrar debilidades más rápido que las personas y cada vez mejor convertirlas en cadenas de ataque funcionales, las empresas tendrán que acelerar la gestión de parches, fortalecer el control de acceso, el registro y los procesos internos de respuesta.

Y para reguladores y las propias empresas de IA, es también una cuestión de gobernanza: quién obtiene acceso a sistemas de este nivel, bajo qué reglas, y qué sucederá cuando capacidades similares aparezcan con competidores o en modelos abiertos.

ZK
Hamidun News
Noticias de AI sin ruido. Selección editorial diaria de más de 400 fuentes. Producto de Zhemal Khamidun, Head of AI en Alpina Digital.

¿Quieres dejar de leer sobre IA y empezar a usarla?

AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.

¿Qué te parece?
Cargando comentarios…