OpenAI presenta GPT-5.4 mini y nano para código, subagentes y cargas de AI a gran escala
OpenAI lanzó GPT-5.4 mini y nano, versiones compactas de su modelo insignia para tareas en las que la velocidad y el costo son críticos. Mini es más de dos…
Procesado por IA desde 3DNews AI; editado por Hamidun News
OpenAI ha lanzado GPT-5.4 mini y GPT-5.4 nano — dos versiones compactas de su línea de productos principal, diseñadas no para razonamiento récord, sino para escenarios rápidos y a gran escala. La empresa apuesta por modelos que son más baratos, más rápidos y aún así retienen una parte significativa de las capacidades de la GPT-5.4 de tamaño completo.
Los puntos fuertes de mini
GPT-5.4 mini es la mayor de las dos novedades. Según OpenAI, mostró mejoras notables sobre GPT-5 mini en programación, lógica, uso de herramientas y análisis multimodal, y se volvió más de dos veces más rápida.
En el benchmark SWE-Bench Pro, el modelo obtuvo 54,4% frente a 45,7% de GPT-5 mini, y en OSWorld-Verified, que prueba la capacidad de trabajar con interfaces mediante capturas de pantalla, mostró 72,1% frente a 42,0% de la versión mini anterior. Esto importa no solo para gráficos bonitos. OpenAI posiciona directamente GPT-5.
4 mini como un modelo de trabajo para tareas donde la latencia es perceptible para el usuario: autocompletado y corrección de código, ciclos de depuración rápidos, subagentes para operaciones auxiliares y sistemas que leen capturas de pantalla e interactúan con interfaces. La idea es simple: no toda tarea necesita enviarse al modelo más caro si una versión más pequeña puede manejarla casi tan bien, pero significativamente más rápido.
Dónde es útil nano
GPT-5.4 nano es el modelo más pequeño y más barato en la nueva línea. OpenAI la recomienda no como un motor de chat universal, sino como una herramienta utilitaria para operaciones simples pero frecuentes.
Estos son escenarios donde el rendimiento importa más que la profundidad del razonamiento: análisis de flujo de documentos, clasificación, extracción de campos, ranking de resultados y soporte para subtareas de código simple. Incluso nano obtuvo 52,4% en SWE-Bench Pro, superando significativamente a GPT-5 mini. Juntas, mini y nano encajan bien en una arquitectura donde un modelo grande planifica el trabajo y varios pequeños lo ejecutan en paralelo.
En Codex, este es exactamente el escenario que OpenAI está promoviendo: GPT-5.4 puede coordinar el proceso, mientras que GPT-5.4 mini se encarga de tareas específicas como búsqueda en la base de código, lectura de archivos grandes y procesamiento de documentación.
Este enfoque dividido ayuda a mantener bajo control tanto la latencia como el presupuesto.
- Asistentes IA rápidos para escribir y editar código
- Subagentes para búsqueda de repositorios y análisis de archivos grandes
- Herramientas que entienden capturas de pantalla y administran interfaces
- Clasificación, extracción de datos y ranking en pipelines a gran escala
- Ejecución más económica de tareas auxiliares sin comprometer la calidad general del sistema
Acceso y precios
A partir del 17 de marzo de 2026, GPT-5.4 mini está disponible inmediatamente en API, Codex y ChatGPT. En la API, el modelo admite texto, imágenes, llamada de funciones, búsqueda web, búsqueda de archivos, computer use y skills.
La ventana de contexto es de 400.000 tokens, y el precio es de 0,75 dólares por millón de tokens de entrada y 4,50 dólares por millón de tokens de salida. Para servicios con un alto número de solicitudes paralelas, este es uno de los principales argumentos de venta.
En Codex, mini usa solo el 30% de la cuota de GPT-5.4 completa, por lo que se puede usar para subtareas paralelas baratas. En ChatGPT, el modelo tiene un papel más limitado: para usuarios Free y Go, está disponible a través del modo Thinking, y para otros, sirve como fallback cuando se alcanza el límite de GPT-5.
4 Thinking. GPT-5.4 nano, por su parte, solo está disponible a través de la API y cuesta 0,20 dólares por millón de tokens de entrada y 1,25 dólares por millón de tokens de salida.
Qué significa esto
OpenAI está construyendo cada vez más una línea de productos no alrededor de un modelo "mejor", sino alrededor de un conjunto de roles: un modelo grande piensa y coordina, los pequeños manejan rápidamente la rutina. Para desarrolladores y productos IA, esto es buena noticia: el costo de sistemas de agentes se puede reducir sin una caída acentuada en la calidad, especialmente donde importan la velocidad, el paralelismo y el alto volumen de solicitudes.
¿Quieres dejar de leer sobre IA y empezar a usarla?
AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.