OpenAI lanza GPT-5.4: apuesta por agentes de computadora, no solo por código

El 5 de marzo de 2026, OpenAI lanzó GPT-5.4, su modelo insignia con control nativo de la computadora, tool search y modo xhigh para tareas complejas. El cambio más evidente es el paso de un modelo simplemente potente a un agente de AI funcional. En los benchmarks, el modelo mejoró con fuerza en escenarios de agentes y navegación web, pero las pruebas aplicadas muestran un panorama mixto: backend y lógica sólidos, mientras la maquetación visual todavía se rompe en los detalles.

Khamidun Zhemal

Monitoreo de AI · Habr AI

30 abr 2026· 3 min

Procesado por IA desde Habr AI; editado por Hamidun News

OpenAI lanza GPT-5.4: apuesta por agentes de computadora, no solo por código — Fuente: Habr AI. Collage: Hamidun News.

◐ Escuchar artículo

OpenAI lanzó GPT-5.4 el 5 de marzo de 2026 — un nuevo buque insignia que combina codificación fuerte, razonamiento y control nativo de computadora. El enfoque principal del lanzamiento se ha desplazado de un "chatbot inteligente" a un agente de IA que no solo responde preguntas, sino que también puede ejecutar cadenas de acciones en interfaces y herramientas de trabajo.

Apuesta por Agentes

La principal novedad en GPT-5.4 es el Computer Use integrado. El modelo puede trabajar desde capturas de pantalla, gestionar el cursor, hacer clic en botones, rellenar formularios y verificar resultados.

Para los desarrolladores, esto significa una transición más madura de la simple generación de texto a escenarios de agentes: los bots pueden navegar por sitios web, ejecutar pasos del navegador y realizar operaciones rutinarias sin un script codificado para cada clic. Esto ya no es una característica para videos de demostración, sino una capa fundamental para procesos comerciales reales donde un agente necesita ver la interfaz y confirmar que una acción realmente funcionó. Según los datos oficiales de OpenAI, la mejora es particularmente notable donde el modelo debe actuar de forma autónoma en lugar de simplemente escribir código en el vacío.

En OSWorld-Verified, GPT-5.4 alcanzó el 75,0% en comparación con el 47,3% para GPT-5.2, y en BrowseComp — el 82,7% en comparación con el 65,8%.

Mientras tanto, la mejora en SWE-Bench Pro fue más modesta: 57,7% en comparación con 55,6%. Esta es una buena señal para quienes construyen asistentes y agentes de flujo de trabajo, y más contenida para quienes esperaban un avance incondicional en programación.

Control nativo de computadora a través de capturas de pantalla y acciones de interfaz
Tool Search para grandes conjuntos de herramientas sin inflar el prompt
Modo de razonamiento `xhigh` para tareas pesadas
Hasta 1 millón de tokens de contexto en Codex con soporte experimental
Tasa más baja de errores factuales en comparación con GPT-5.2

Lo Que Mostraron las Pruebas

En la práctica, el panorama no fue tan uniforme como en los puntos de referencia de presentación. En una prueba visual, se pidió al modelo que construyera un panel de control de casa inteligente complejo, luego que renderizara el resultado en sí mismo y corrigiera errores después de la autoverificación. La composición general y el estilo eran reconocibles, pero los detalles dejaban mucho que desear: el texto se superponía a los bloques, los márgenes se desplazaban, algunos elementos se cortaban y el termostato neomórfico anunciado resultó ser un círculo simplificado.

Es decir, el modelo ya captura la sensación de "interfaz premium", pero aún está lejos de ser un desarrollador frontend sénior autónomo. Sin embargo, en el escenario de backend, GPT-5.4 se veía más convincente.

En una tarea sobre un limitador de velocidad listo para producción para FastAPI y Redis, el modelo no se limitó a una solución básica, sino que construyó un esquema completo con tipificación estricta, un script Lua para atomicidad y un fallback local en caso de caída de Redis. En una prueba lógica con condiciones de horario conflictivas, también funcionó correctamente: no inventó una respuesta "de alguna manera", sino que demostró consistentemente que no existe solución. Este es un marcador importante de madurez: el modelo reconoce contradicciones con más frecuencia en lugar de alucinar con confianza.

Precio y Disponibilidad

OpenAI lanzó GPT-5.4 el 5 de marzo de 2026 directamente en la API, Codex y ChatGPT como GPT-5.4 Thinking.

A partir del lanzamiento, el modelo comenzó a reemplazar GPT-5.2 Thinking para usuarios pagos de ChatGPT Plus, Team y Pro, mientras que GPT-5.4 Pro se puso a disposición en los niveles Pro y Enterprise.

Para los desarrolladores, esto puede ser una noticia no menos importante que los propios puntos de referencia: el nuevo buque insignia no permaneció como una demostración de laboratorio, sino que se integró inmediatamente en productos de producción. El precio de la API parece más agresivo de lo que cabría esperar del buque insignia de OpenAI: $2,50 por millón de tokens de entrada, $0,25 para entrada en caché y $15 por millón de tokens de salida. Sí, el modelo es más caro que GPT-5.

2 por token, pero OpenAI apuesta por una mejor eficiencia de tokens: si un agente resuelve una tarea en menos pasos y no vaga tanto por el contexto, la economía general podría ser bastante razonable incluso para equipos pequeños.

Lo Que Esto Significa

GPT-5.4 no parece ser un "reemplazo mágico para desarrolladores", pero muestra claramente hacia dónde se dirige el mercado. La siguiente competencia no es solo por la calidad de las respuestas, sino por la capacidad del modelo de ver interfaces, usar herramientas, recordar contexto largo y llevar tarefas a su conclusión. Para los negocios, esto significa una cosa simple: el valor se está desplazando de prompts únicos a agentes que pueden trabajar dentro de procesos reales. Es en estos escenarios donde se decidirá qué plataforma es más adecuada para el trabajo real, en lugar de demostraciones únicas y espectaculares.

Hamidun News

Noticias de AI sin ruido. Selección editorial diaria de más de 50 fuentes. Producto de Zhemal Khamidun, Head of AI en Alpina Digital.

Canal de Telegram RSS hamidun.com

¿Quieres dejar de leer sobre IA y empezar a usarla?

AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.

🎓 Academy — 7 días gratis Consulta gratuita