36Kr (36氪)→ original

GPT-5.2: OpenAI enseñó al modelo a correr 40% más rápido (sin 'esteroides')

¿Alguna vez te has preguntado por qué tu chatbot favorito a veces se "cuelga" durante unos segundos antes de proporcionar una respuesta que claramente ya…

Procesado por IA desde 36Kr (36氪); editado por Hamidun News
GPT-5.2: OpenAI enseñó al modelo a correr 40% más rápido (sin 'esteroides')
Fuente: 36Kr (36氪). Collage: Hamidun News.
◐ Escuchar artículo

¿Alguna vez te has preguntado por qué tu chatbot favorito a veces se "cuelga" durante unos segundos antes de proporcionar una respuesta que claramente ya conoce? En el mundo de los grandes modelos de lenguaje, el tiempo no es solo dinero—es experiencia del usuario y, en última instancia, supervivencia del producto en el mercado. Hoy, el equipo OpenAI Developers ha echado más leña al fuego de la carrera de velocidad, anunciando una aceleración significativa de sus modelos actuales.

Estamos hablando de GPT-5.2 y del modelo especializado Codex, que de repente se han vuelto un 40% más rápidos. Lo más intrigante de esta noticia es el aspecto técnico.

Los ingenieros de OpenAI enfatizaron que esta aceleración se logró sin cambiar la arquitectura del modelo y sin recalcular los pesos. Para quienes no están inmersos en los detalles: normalmente, para hacer un modelo más rápido, tienes que "podarlo" (destilación) o reentrenarlo desde cero con menos parámetros. Aquí vemos pura magia de optimización de inferencia.

Parece que el equipo de Sam Altman ha encontrado la forma de usar el hardware disponible de manera más eficiente sin sacrificar el "cerebro" de la red neuronal.

¿Por qué importa esto ahora? Estamos en un punto donde la calidad de las respuestas de los principales modelos—ya sean GPT, Claude o Gemini—ha alcanzado una meseta. La diferencia en la lógica es cada vez menos perceptible para el usuario promedio. Ahora la batalla se está desplazando al plano de la eficiencia. Si tu modelo genera código de la misma calidad que el de un competidor, pero lo hace casi 1,5 veces más rápido, los desarrolladores te elegirán. Para Codex, esto es literalmente una cuestión de vida o muerte: cuando estás escribiendo código en un IDE, incluso un retraso de medio segundo comienza a irritar y rompe tu flujo de pensamiento.

Este salto del 40% también golpea las posiciones de startups de hardware como Groq, que construyen su marketing únicamente en velocidades locas de generación de tokens. Si OpenAI puede continuar optimizando el software a este ritmo, la necesidad de "aceleradores" especializados podría no ser tan aguda como predijeron los analistas. Esta es una señal para todo el mercado: antes de comprar otros diez mil H100s, intenta reescribir tus núcleos CUDA y optimizar el batching.

Para los negocios finales, esta actualización significa ahorros directos. Inferencia más rápida significa menos costos de tiempo de servidor por solicitud. Aún no está claro si esto se reflejará en el costo de tokens en la API, pero históricamente, OpenAI siempre ha intentado convertir la eficiencia técnica en reducciones de precios para capturar cuota de mercado. Probablemente, en las próximas semanas, veremos una actualización de la lista de precios que hará rascarse la cabeza a Anthropic y Google nuevamente.

En última instancia, estamos viendo que la era de la "fuerza bruta," cuando el progreso se lograba solo aumentando la escala de la computación, se está complementando gradualmente con una era de elegante maestría en ingeniería. OpenAI está claramente señalando que no solo alquila enormes clusters de Microsoft, sino que también sabe cómo exprimir el máximo de ellos. Esta es una buena señal para toda la industria: el potencial de las arquitecturas actuales está lejos de agotarse.

Lo principal: OpenAI está desplazando el enfoque de la "inteligencia" a la "velocidad," y el 40% es solo el comienzo. ¿Están listos los competidores para tal optimización sin perder calidad?

ZK
Hamidun News
Noticias de AI sin ruido. Selección editorial diaria de más de 400 fuentes. Producto de Zhemal Khamidun, Head of AI en Alpina Digital.

¿Quieres dejar de leer sobre IA y empezar a usarla?

AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.

¿Qué te parece?
Cargando comentarios…