Anthropic presentó Claude Opus 4.8 con mejoras para codificación y tareas de agentes
Anthropic lanzó Claude Opus 4.8, una actualización de Opus 4.7 con mejoras en codificación, tareas de agentes y trabajo prolongado. El nuevo modelo supera a…
Procesado por IA desde Anthropic Blog; editado por Hamidun News
Anthropic presentó Claude Opus 4.8, una actualización del modelo insignia con mejor capacidad de razonamiento para tareas de agentes. El modelo está disponible al mismo precio que Opus 4.7 e integra nuevas características en claude.ai y Claude Code.
Tres nuevas características con Opus 4.8
Además del modelo, Anthropic lanzó herramientas para mejor control:
- En claude.ai — un regulador para controlar el esfuerzo: desde Modo Rápido hasta análisis profundo
- Claude Code recibió Flujos de Trabajo Dinámicos para resolver tareas muy grandes (trabajo de varios días)
- El Modo Rápido para Opus 4.8 ahora cuesta tres veces menos y funciona 2.5× más rápido que antes
En los puntos de referencia estándar de codificación, razonamiento y tareas prácticas, Opus 4.8 supera a Opus 4.7 y compite con GPT-5.5.
Qué mostraron las pruebas
Opus 4.8 es única por su confiabilidad en tareas prolongadas. En el punto de referencia Super-Agent, es el único modelo que completó todas las tareas end-to-end y superó a Opus 4.7 y GPT-5.5. En CursorBench (prueba del editor de código), el modelo supera todos los niveles de dificultad, invocando herramientas de manera más eficiente. En el Legal Agent Benchmark, Opus 4.8 es el primer modelo que cruza el umbral del 10% en el estándar all-pass. Esto significa que un abogado ahora puede confiarle tareas más complejas. En Online-Mind2Web (agentes de navegador), el modelo alcanzó el 84%, un salto notable sobre Opus 4.7 y GPT-5.5.
Qué dicen los desarrolladores
Los ingenieros de Devin señalaron que Opus 4.8 maneja las herramientas de forma más limpia y sigue las instrucciones con la coherencia necesaria para el trabajo autónomo. El modelo corrigió los problemas de verbosidad que había en la versión 4.7.
«Opus 4.8 es una actualización de calidad: más rápido, más fácil de
colaborar, y mantiene mejor el contexto y el estilo a lo largo de sesiones prolongadas», dice uno de los primeros probadores.
El equipo de CoCounsel observa que Opus 4.8 proporciona mejor razonamiento en análisis complejos y completa el trabajo más rápido con resultados más densos. En el punto de referencia Super-Agent, el modelo demostró que puede conducir flujos de trabajo prolongados sin errores y sin intervención humana.
Qué significa esto
Opus 4.8 no es simplemente una actualización de versión, sino una señal de que los modelos base se están desarrollando muy rápidamente. En un trimestre, Anthropic la hizo prácticamente más útil para agentes comerciales: los agentes de Devin son más confiables, los abogados delegan más, los ingenieros ahorran tiempo en revisión de código. Para los negocios, esto significa que las inversiones en herramientas de IA se vuelven más rentables.
¿Quieres dejar de leer sobre IA y empezar a usarla?
AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.