OpenAI lanza GPT-5.5: modelo agente más fuerte que GPT-5.4, pero el precio de la API se duplicó
OpenAI lanzó GPT-5.5 y apuesta por escenarios de agentes: el modelo planifica pasos de forma autónoma, usa herramientas y mantiene mejor el contexto largo…
Procesado por IA desde AI News; editado por Hamidun News
OpenAI el 23 de abril presentó GPT-5.5 y posicionó el lanzamiento no como una actualización común de modelo, sino como la base para agentes de IA en funcionamiento. La empresa afirma que la nueva versión planifica mejor, utiliza herramientas y completa tareas complejas de múltiples pasos sin solicitudes constantes de humanos.
En Qué Apuesta
La idea principal del lanzamiento es que GPT-5.5 debe funcionar no como un chatbot para respuestas aisladas, sino como un ejecutor de tareas largas en la computadora. Según la descripción de OpenAI, el modelo es más fuerte en programación de agentes, trabajo con interfaces, análisis de datos, preparación de documentos y tareas de investigación.
En lugar de un escenario donde los usuarios describen manualmente cada paso, se ofrece a las empresas la posibilidad de entregar al modelo tareas "sucias" con múltiples partes y dejar que construya el plan por sí solo, verifique resultados intermedios y avance hacia la respuesta final. OpenAI hace un punto especial en que el crecimiento en capacidades no desaceleró el modelo en producción. GPT-5.
5, según la empresa, mantiene la latencia por token de GPT-5.4 pero gasta menos tokens en las mismas tareas en Codex. El modelo también fue desarrollado e implementado junto con los sistemas NVIDIA GB200 y GB300 NVL72, lo que muestra que los lanzamientos de modelos de frontera ahora están vinculados no solo a algoritmos sino también a infraestructura.
"Este es un paso real hacia el tipo de computación que esperamos en el futuro", dijo
Greg Brockman.
Dónde es Visible el Crecimiento
El argumento más fuerte de OpenAI son los puntos de referencia relacionados no con preguntas académicas sino con trabajo práctico de agentes. GPT-5.5 mostró ganancias notables donde los modelos necesitan no solo responder sino planificar una secuencia de acciones, invocar herramientas, mantener contexto largo y completar una tarea. Al mismo tiempo, el lanzamiento no parece una victoria incondicional en todas las categorías: en algunas evaluaciones externas, los competidores mantienen posiciones fuertes, especialmente donde la orquestación de herramientas a través de MCP es importante.
- Terminal-Bench 2.0: 82,7% frente a 75,1% para GPT-5.4 y 69,4% para Claude Opus 4.7.
- SWE-Bench Pro: 58,6% para resolver problemas reales de GitHub en un solo pase.
- MRCR v2 en 1 millón de tokens: 74,0% frente a 36,6% para GPT-5.4, casi un salto doble en contexto largo.
- BrowseComp en versión Pro: 90,1%, pero en MCP Atlas el liderazgo permanece con Claude Opus 4.7, y GPT-5.5 no tenía resultado publicado allí.
Precio y Acceso
La parte más controvertida del lanzamiento es la economía. Para API, OpenAI estableció el precio en $5 por millón de tokens de entrada y $30 por millón de tokens de salida, mientras que las tasas de GPT-5.4 eran la mitad: $2,50 y $15 respectivamente.
GPT-5.5 Pro es aún más caro—$30 para entrada y $180 para salida. OpenAI argumenta que comparar solo precios de tokens ya no es suficiente: el modelo resuelve las mismas tareas con menos tokens, por lo que el costo real de un escenario de trabajo, según la empresa, crece no el doble sino aproximadamente 20%.
El acceso a GPT-5.5 fue inicialmente a ChatGPT y Codex para los planes pagos Plus, Pro, Business y Enterprise, con acceso a API siguiendo el 24 de abril. Dentro de la propia OpenAI, el lanzamiento se presenta como ya una herramienta funcional: la empresa dice que Codex es utilizado semanalmente por más del 85% de los empleados.
Los ejemplos incluyen procesamiento de seis meses de solicitudes de charlas públicas, análisis de 24.771 formularios fiscales K-1 totalizando 71.637 páginas e automatización de informes comerciales semanales, ahorrando 5–10 horas por semana a los empleados.
Lo Que Esto Significa
GPT-5.5 muestra hacia dónde se dirige el mercado: los modelos ahora se venden no como "otro chat inteligente" sino como una capa para trabajo digital autónomo. Para los negocios, la pregunta ya no es solo qué modelo es más inteligente, sino cuánto cuesta una tarea completada, teniendo en cuenta reintentos, verificaciones e integración con herramientas. Este es el campo donde OpenAI tiene la intención de justificar su precio más alto.
¿Quieres dejar de leer sobre IA y empezar a usarla?
AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.