Habr AI→ original

Anthropic prueba Claude Mythos: fuga revela modelo con 10 billones de parámetros

Una gran fuga en Anthropic ha sacado a la luz casi 3 mil documentos inéditos en un caché expuesto, incluyendo borradores sobre el nuevo modelo Claude Mythos…

Procesado por IA desde Habr AI; editado por Hamidun News
Anthropic prueba Claude Mythos: fuga revela modelo con 10 billones de parámetros
Fuente: Habr AI. Collage: Hamidun News.
◐ Escuchar artículo

Anthropic puede haber revelado accidentalmente al mercado el siguiente nivel de sus modelos antes de estar lista. De una caché abierta de la empresa, se filtraron borradores de publicaciones, documentos internos y miles de materiales no publicados a la red, de los que se deduce: el nuevo modelo Claude Mythos es notablemente más fuerte que los actuales líderes y puede resultar demasiado riesgoso para un lanzamiento público regular. Basándose en estos datos, no se trata de una actualización cosmética de la línea Claude, sino de un sistema que la empresa internamente considera el IA más poderoso de su historia y, por lo tanto, lanza con acceso anticipado extremadamente limitado.

Investigadores en ciberseguridad descubrieron la filtración, encontrando casi 3 mil archivos relacionados con el CMS y borradores internos de Anthropic. Entre ellos había borradores de anuncios, imágenes, documentos y materiales que la empresa aún no había publicado. Anthropic confirmó el hecho de la filtración y reconoció que clientes con acceso anticipado ya están probando Mythos.

Según un representante de la empresa, el modelo proporciona un salto cualitativo en las capacidades de IA. Este es un detalle importante: no se trata simplemente de rumores de redes sociales, sino de un conjunto de materiales cuya existencia la empresa no realmente negó, aunque no reveló todas las características oficialmente. La escala del descubrimiento hace que la historia sea inusual: en lugar de una página aleatoriamente surgida, el mercado vio una gran cantidad de preparativos internos para el lanzamiento, y antes de cualquier anuncio público completo.

Si los borradores filtrados son confiables, Claude Mythos debería estar por encima de la jerarquía actual de Haiku, Sonnet y Opus. En los documentos, aparece un nuevo nivel Capybara — probablemente una designación para la configuración más cara y de mejor desempeño basada en Mythos. Se afirma que este modelo supera a Claude Opus 4.

6 en tres direcciones simultáneamente: programación, razonamiento académico y ciberseguridad. La red también circuló una estimación de 10 billones de parámetros, pero es importante entender que esto aún no es una cifra confirmada de un lanzamiento oficial. Incluso si el recuento de parámetros resulta ser menor, el significado general de la filtración sigue siendo el mismo: Anthropic está preparando un modelo que considera sustancialmente más potente y notablemente más costoso de operar.

De ahí la cautela con el lanzamiento: tales sistemas requieren más computación, cuestan más en inferencia y son más difíciles de adaptar a un modelo de acceso masivo regular. La principal diferencia de Mythos respecto a los lanzamientos familiares es el énfasis en los riesgos. En los materiales filtrados, el modelo se describe como un sistema que significativamente supera a otros IAs en capacidades cibernéticas.

Para el mercado, esto suena como una advertencia: el siguiente salto en modelos generativos puede estar asociado no solo con una codificación mejor, sino también con un descubrimiento más efectivo de vulnerabilidades, construcción de exploits y automatización de ataques. Anteriormente, Anthropic ya había hablado sobre casos en los que sus herramientas se intentaron utilizar en campañas maliciosas, y los modelos al nivel de Opus han aprendido a encontrar vulnerabilidades previamente desconocidas en código real. Por lo tanto, la estrategia de Anthropic se ve inusual: primero dar acceso a organizaciones asociadas con la defensa, y solo entonces decidir sobre un lanzamiento más amplio.

Este enfoque se ajusta a la lógica general de los últimos meses, cuando los desarrolladores de modelos fronterizos discuten cada vez más no solo puntuaciones de referencia, sino también el umbral de peligro, después del cual las capacidades del modelo se convierten en un problema en sí mismas. Para desarrolladores y empresas, dos conclusiones son importantes aquí. La primera: la carrera por los modelos se está desplazando de la competencia en "quién escribe texto mejor" a la competencia en "quién trabaja mejor con código, infraestructura y seguridad."

La segunda: el acceso a los sistemas más poderosos será cada vez más limitado no por marketing, sino por consideraciones reales de costo, control y prevención de abuso. Claude Mythos puede resultar ser otra filtración exagerada, y algunas de las cifras y formulaciones ciertamente serán revisadas. Pero la tendencia en sí ya es obvia: Anthropic está probando un nuevo nivel de IA y lo está haciendo con máxima cautela.

Si la empresa realmente ve en el modelo una herramienta capaz de ayudar simultáneamente a los defensores y potenciar a los atacantes, el lanzamiento masivo de tales sistemas deja de ser una cuestión técnica y se convierte en una cuestión de política de acceso.

ZK
Hamidun News
Noticias de AI sin ruido. Selección editorial diaria de más de 400 fuentes. Producto de Zhemal Khamidun, Head of AI en Alpina Digital.

¿Quieres dejar de leer sobre IA y empezar a usarla?

AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.

¿Qué te parece?
Cargando comentarios…