MarkTechPost→ original

Anthropic lanza Claude Opus 4.7 para programación de agentes, visión y tareas autónomas

Anthropic lanzó Claude Opus 4.7 — una actualización directa de Opus 4.6 enfocada en programación de agentes, visión y tareas autónomas largas. El modelo es…

Procesado por IA desde MarkTechPost; editado por Hamidun News
Anthropic lanza Claude Opus 4.7 para programación de agentes, visión y tareas autónomas
Fuente: MarkTechPost. Collage: Hamidun News.
◐ Escuchar artículo

Anthropic lanzó Claude Opus 4.7 el 16 de abril de 2026 — una actualización puntual pero altamente significativa de su modelo insignia que aborda dolores prácticos de los desarrolladores en lugar de benchmarks abstractos: programación de agentes, manejo de imágenes detalladas y tareas autónomas largas donde el modelo debe no solo responder, sino planificar, verificarse a sí mismo y completar tareas de principio a fin. La empresa posiciona Opus 4.

7 como una actualización directa de Opus 4.6, no como una nueva línea de productos. Sin embargo, en escenarios de ingeniería, la diferencia resultó sustancial.

Según Anthropic, el modelo sigue mejor las instrucciones, maneja con más cuidado los procesos de múltiples pasos y encuentra más a menudo formas de verificar resultados antes de devolverlos al usuario. Esto es particularmente importante en entornos donde la IA no escribe simplemente fragmentos de código bajo demanda, sino que actúa como ejecutor semi-autónomo: leyendo repositorios, ejecutando herramientas, corrigiendo errores, continuando el trabajo después de fallos y manteniendo soluciones intermedias en memoria. En los benchmarks de Anthropic y sus asociados, la mejora no parece cosmética.

En el benchmark interno de 93 tareas de programación, Opus 4.7 mejoró la tasa de finalización de tareas en un 13% en comparación con Opus 4.6, incluyendo cuatro tareas que ni Opus 4.

6 ni Sonnet 4.6 pudieron resolver. En CursorBench, el modelo alcanzó el 70% frente al 58% en la versión anterior.

En los casos de prueba de Notion para procesos complejos de múltiples pasos, la mejora fue del 14% con menor consumo de tokens y tres veces menos errores al llamar herramientas. Rakuten afirma por separado que en Rakuten-SWE-Bench, el nuevo modelo cierra tres veces más tareas de producción que Opus 4.6.

La segunda gran actualización es la visión. Claude Opus 4.7 puede procesar imágenes de hasta 2576 píxeles en el lado más largo, aproximadamente 3,75 megapíxeles.

Esto es más de tres veces superior al límite de los modelos Claude anteriores. Para el modo de chat normal, esta cifra podría parecer secundaria, pero para escenarios de agentes es crítica: el modelo puede analizar capturas de pantalla densas de interfaces, diagramas técnicos, esquemas, estructuras químicas y documentos donde los detalles finos importan. Anthropic proporciona un ejemplo del área de computer use: en el benchmark visual XBOW, la nueva versión alcanzó el 98,5% frente al 54,5% de Opus 4.

6. En la práctica, esto mueve una serie de tareas de la categoría "a veces funciona" a "puede integrarse en productos". Anthropic también ha reforzado las herramientas para ejecución autónoma larga.

Opus 4.7 introduce un nuevo nivel de esfuerzo de razonamiento — xhigh, posicionado entre high y max. En la API, la empresa lanzó una beta pública de task budgets, permitiendo a los desarrolladores limitar el presupuesto de tokens en ejecuciones largas y gestionar prioridades de pasos.

Claude Code ahora incluye un modo ultrareview para un examen más profundo de cambios, y el modo auto ahora permite menos interrupciones para tareas largas con solicitudes de permiso. Sin embargo, la migración desde Opus 4.6 no es completamente gratuita: el tokenizador actualizado puede aumentar tokens de entrada aproximadamente 1,0–1,35 veces según el tipo de contenido, y el razonamiento más profundo en etapas posteriores de tareas de agentes aumenta el volumen de tokens de salida.

Anthropic enfatiza por separado el tema de la seguridad. Opus 4.7 se lanza poco después del anuncio de Mythos Preview — un modelo más potente cuyo acceso Anthropic decidió restringir debido a riesgos de ciberseguridad.

Por lo tanto, Opus 4.7 es el primer modelo público donde Anthropic prueba bloqueos automáticos para solicitudes de cyber de alto riesgo. Para escenarios legítimos como pentesting, red teaming e investigación de vulnerabilidades, la empresa simultáneamente abrió un programa de verificación.

Según la propia evaluación de Anthropic, el perfil de seguridad de Opus 4.7 es generalmente cercano al 4.6: el modelo mejoró en honestidad y resistencia a prompt injection, aunque en ciertas categorías es imperfecto y aún queda por detrás de Mythos Preview en consistencia general de comportamiento.

La conclusión principal es simple: Claude Opus 4.7 no es una nueva generación por el simple hecho de un nuevo número, sino un lanzamiento pragmático para quienes construyen flujos de trabajo reales sobre el modelo. Si tu escenario es un asistente de IDE, un agente de revisión de código, análisis de documentos, visión por computadora para interfaces o largas cadenas de acciones dirigidas por herramientas, la actualización se ve significativa ahora mismo.

Para el usuario promedio, la diferencia puede no siempre ser obvia, pero para desarrolladores y equipos que miden la calidad no por demostraciones sino por el número de tareas completadas de principio a fin, Opus 4.7 parece una de las actualizaciones más útiles de Anthropic en tiempos recientes.

ZK
Hamidun News
Noticias de AI sin ruido. Selección editorial diaria de más de 400 fuentes. Producto de Zhemal Khamidun, Head of AI en Alpina Digital.

¿Quieres dejar de leer sobre IA y empezar a usarla?

AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.

¿Qué te parece?
Cargando comentarios…