Anthropic: Claude Mythos Preview Encuentra Miles de Vulnerabilidades Críticas en Código
Anthropic presentó Claude Mythos Preview como una nueva clase de herramienta para descubrir bugs en código. Según la empresa, el modelo ya ha identificado…
Procesado por IA desde IEEE Spectrum AI; editado por Hamidun News
Anthropic demostró cuán rápidamente está cambiando la ciberseguridad en la era de la IA generativa: su modelo Claude Mythos Preview fue capaz de identificar miles de vulnerabilidades de nivel alto y crítico, incluyendo problemas en sistemas operativos populares, navegadores y bibliotecas criptográficas. Pero la conclusión principal no es que la IA haya aprendido a encontrar bugs mejor. Las mismas capacidades que ayudan a identificar debilidades en el código también pueden usarse para explotarlas, por lo que la automatización de seguridad ahora requiere no solo velocidad, sino también nuevas reglas de control.
A principios de abril, el Frontier Red Team dentro de Anthropic informó que Mythos Preview descubrió numerosos problemas graves, aunque el modelo no fue entrenado específicamente para buscar tales vulnerabilidades. Según la empresa, entre los hallazgos hay defectos en prácticamente todos los principales sistemas operativos y navegadores principales. Los ejemplos citados incluyen un bug de 27 años en OpenBSD que permite el compromiso remoto de máquinas, una vulnerabilidad en navegador a través de la cual un atacante puede leer datos de otro dominio, y debilidades en bibliotecas criptográficas que podrían llevar al descifrado de tráfico protegido o falsificación de certificados.
Con estos resultados como telón de fondo, Anthropic lanzó Project Glasswing. El proyecto involucra a Amazon Web Services, Apple, Google, Microsoft y Nvidia, y la tarea de la asociación es directa: usar Mythos Preview para escanear software y fortalecer su protección. La lógica es clara.
Si los grandes modelos de lenguaje ya son capaces de analizar bases de código masivas, rastrear el flujo de datos entre componentes y notar conexiones no triviales entre errores, entonces se convierten en más que simplemente otra herramienta de análisis estático—se convierten en un instrumento que de alguna manera comienza a acercarse al trabajo de un investigador de seguridad en vivo. Esto también es señalado por profesionales de la industria. Destacan que la fortaleza de tales modelos no es solo la velocidad, aunque eso importa en sí mismo, sino la capacidad de razonar sobre la semántica del código.
Las herramientas tradicionales con reglas rígidas buscan principalmente coincidencias de patrones contra plantillas predeterminadas, mientras que los sistemas LLM modernos pueden rastrear cómo fluyen los datos a través de diferentes niveles de abstracción y detectar un problema que surge solo en la intersección de varios componentes. Para repositorios grandes, esto es particularmente importante: un agente de IA puede encontrar más fácilmente una aguja rara pero peligrosa en un inmenso pajar de código. Sin embargo, este enfoque tiene un lado negativo.
Los modelos todavía producen falsos positivos, pueden clasificar incorrectamente un bug como vulnerabilidad o exagerar la gravedad de un problema. Para los mantenedores de proyectos open source, esto se convierte en una carga adicional: el número de reportes crece, y el tiempo para revisar cada señal aumenta. Otro riesgo es que las herramientas de IA no solo pueden ser atacadas—por ejemplo, a través de prompt injection—sino también ser utilizadas como mecanismo ofensivo.
El mismo Mythos Preview, se afirma, puede vincular múltiples defectos separados en una cadena de explotación paso a paso que en última instancia otorga acceso a nivel raíz al kernel de Linux. Es por eso que los expertos hablan no de reemplazar completamente a los humanos, sino de un esquema de verificación multicapa. Un enfoque ya utilizado en la industria es la adversarial self review: el modelo primero encuentra un problema, luego intenta desafiar su propia conclusión o pasa el hallazgo a otro modelo para validación independiente.
Esta capa adicional ayuda a reducir ruido, pero no elimina la revisión manual. Las conclusiones de IA permanecen probabilísticas, lo que significa que la decisión final debe ser tomada por un especialista que entienda la lógica comercial del producto, la arquitectura del sistema y escenarios reales de explotación. Las empresas también son aconsejadas para desarrollar modelado dinámico de amenazas, red teaming, y desplazar la seguridad al comienzo del proceso de desarrollo, para que los desarrolladores eliminen puntos débiles mientras escriben código, en lugar de después del lanzamiento.
La pregunta principal ahora ni siquiera es si la IA puede encontrar vulnerabilidades mejor y más rápido que los humanos, sino cómo integrarla en un proceso de trabajo seguro. La siguiente frontera para tales sistemas no es solo detección sino también remediación a gran escala de problemas encontrados. Si esta etapa puede automatizarse sin pérdida de calidad y sin abandono del control humano, el desarrollo de software seguro se acelerará notablemente.
Si no, la industria tendrá otra herramienta poderosa pero ruidosa que crea tanto trabajo como ahorra.
¿Quieres dejar de leer sobre IA y empezar a usarla?
AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.