Habr AI→ original

Anthropic lanzó Opus 4.7, y OpenAI convirtió Codex en un agente de trabajo en computadora

Anthropic posicionó Opus 4.7 como líder en tareas agentes complejas y lanzó Claude Design, mientras que OpenAI convirtió Codex en un agente de computadora…

Procesado por IA desde Habr AI; editado por Hamidun News
Anthropic lanzó Opus 4.7, y OpenAI convirtió Codex en un agente de trabajo en computadora
Fuente: Habr AI. Collage: Hamidun News.
◐ Escuchar artículo

Esta semana mostró que la carrera de la IA se ha desplazado nuevamente, de chatbots a agentes de trabajo completos. Anthropic fortaleció su modelo insignia Opus 4.7 e inmediatamente creó una nueva herramienta de diseño para él, OpenAI enseñó a Codex a ver la pantalla y controlar la computadora, y Google y Baidu ampliaron su conjunto de herramientas para voz e imágenes.

En este contexto, es particularmente notable cómo la IA está saliendo de los laboratorios e ingresando al trabajo cotidiano, al mercado de software e incluso a la especulación del mercado bursátil. El lanzamiento principal de la semana es Claude Opus 4.7.

Anthropic llama al modelo el lanzamiento público más fuerte de la empresa hasta ahora para pipelines de código largos, razonamiento multietapa y tareas de agentes. En SWE-bench Pro, el resultado aumentó del 53,4% al 64,3% en comparación con Opus 4.6.

El modelo funciona mejor con visión y lee capturas de pantalla y diagramas más densos con una resolución de hasta 3,75 megapíxeles. Para escenarios complejos, ha aparecido un nuevo nivel de razonamiento, xhigh; en Claude Code ahora está habilitado de forma predeterminada. Además, la empresa introdujo Task Budgets en beta para limitar el gasto de tokens por tarea y mejoró la memoria en escenarios largos de múltiples sesiones.

El precio de la API se mantuvo sin cambios, pero el nuevo tokenizador puede consumir hasta un 35% más de tokens en el mismo texto. En paralelo, Anthropic lanzó Claude Design — una herramienta separada que transforma un brief en varias variantes de interfaz, página de destino y presentación, luego proporciona exportación a Canva, PDF, PPTX e HTML. OpenAI respondió no con un nuevo modelo, sino con un nuevo modo de funcionamiento para Codex.

Después de la actualización, el agente ganó computer use: ve la pantalla, mueve el cursor y ejecuta acciones a través de la interfaz gráfica. En el lanzamiento, la función está disponible en macOS, y múltiples agentes pueden trabajar en paralelo sin interceptar el enfoque del usuario. Dentro del producto, apareció un navegador integrado para trabajar con localhost, generación de imágenes directamente en el flujo de tareas, memoria entre sesiones e integración con más de 90 servicios populares como Jira, GitLab, Microsoft 365, Notion y Slack.

También se agregaron automatizaciones programadas, donde el agente eleva el contexto y prepara tareas para el día. Este es un cambio importante: la competencia es cada vez menos sobre la calidad de las respuestas en chat y cada vez más sobre cuán profundamente un modelo puede integrarse en el entorno de trabajo real. Google y Baidu fortalecieron su capa de aplicación la misma semana.

Gemini 3.1 Flash TTS admite más de 70 idiomas, 30 voces predefinidas y más de 200 etiquetas de audio que se pueden insertar directamente en el texto para que el modelo pueda susurrar, toser o cambiar la entonación según el guión. Google ofrece vista previa a través de AI Studio y Vertex AI y marca automáticamente el resultado con una marca de agua SynthID.

Baidu, a su vez, abrió ERNIE Image — un generador de imágenes con 8 mil millones de parámetros que puede ejecutarse en 24 GB de memoria de video. El punto fuerte del modelo es renderizar texto dentro de imágenes: desde carteles hasta interfaces y guiones gráficos. Pero casi simultáneamente, un investigador demostró reverse-SynthID — una forma abierta de eliminar la marca de agua invisible de Google de imágenes generadas con una precisión alegada alrededor del 91%.

Resulta ser una bifurcación ilustrativa: las empresas están haciendo que la generación sea cada vez más accesible, pero los mecanismos de protección alrededor del contenido de IA siguen siendo frágiles. Las historias más reveladoras de la semana no vinieron de los laboratorios. La marca de calzado Allbirds vendió sus activos y nombre por aproximadamente $39 millones, luego anunció un giro hacia GPU-as-a-Service bajo el nuevo nombre NewBird AI, y en una onda de frenesí vio cómo sus acciones se elevaron más de seis veces en un día.

Simultáneamente, una versión de IA de "Grey Night" con una voz sintética de una superestrella occidental llegó a la cima del gráfico mundial de Shazam e inmediatamente se convirtió en una disputa sobre derechos, autoría y regalías. Otro caso — la ficticia "bisonmania" inventada por una investigadora sueca: un diagnóstico fabricado convenció no solo a varios LLM populares, sino también a los autores de una publicación científica real, quienes citaron el preprint falso como una fuente genuina. Tales historias golpean más fuerte que cualquier benchmark: muestran cómo la IA interfiere en la música, las finanzas, los medios e incluso en la citación científica.

La conclusión de la semana es simple: el mercado de IA está entrando en una fase donde el valor se determina no por afirmaciones abstractas de que un modelo se ha vuelto más inteligente, sino por su capacidad de asumir una parte del trabajo real, actuar dentro de interfaces e influir en procesos más allá del chat. Cuanto más confiadamente los agentes hacen la transición de texto a acciones, más importante se vuelven el control, la verificación de hechos, los derechos sobre el resultado y la robustez de los mecanismos de protección. Y es precisamente aquí donde los próximos meses serán tan importantes como la próxima carrera de benchmarks.

ZK
Hamidun News
Noticias de AI sin ruido. Selección editorial diaria de más de 400 fuentes. Producto de Zhemal Khamidun, Head of AI en Alpina Digital.

¿Quieres dejar de leer sobre IA y empezar a usarla?

AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.

¿Qué te parece?
Cargando comentarios…