Ars Technica→ original

OpenAI presentó un modelo ultrarrápido para programación para sortear los chips de Nvidia

OpenAI anunció GPT-5.3-Codex-Spark, un modelo de lenguaje especializado en la escritura de código que muestra una mejora de rendimiento de 15 veces. El logro…

Procesado por IA desde Ars Technica; editado por Hamidun News
OpenAI presentó un modelo ultrarrápido para programación para sortear los chips de Nvidia
Fuente: Ars Technica. Collage: Hamidun News.
◐ Escuchar artículo

OpenAI presentó GPT-5.3-Codex-Spark — un modelo especializado para generación de código que funciona 15 veces más rápido que la versión anterior. Pero la verdadera noticia no está tanto en la velocidad, sino en cómo lo logró OpenAI: la empresa optimizó la arquitectura para chips no estándar del tamaño de un plato, evitando efectivamente la dependencia crítica de los escasos procesadores gráficos Nvidia. Este movimiento demuestra el deseo de OpenAI de controlar toda la pila — del software al hardware físico — y simultáneamente destaca la creciente competencia en el mercado de procesadores de IA especializados.

En los últimos dos años, Nvidia se ha convertido en un cuello de botella para todas las grandes empresas de IA. Las GPU H100 y A100, que se han convertido en el estándar para entrenar grandes modelos de lenguaje, tienen una enorme demanda, pero la oferta se queda atrás. Los precios son elevados, los envíos se retrasan, y las restricciones geopolíticas lo complican aún más.

OpenAI, Meta, Google — todos buscan formas de reducir la dependencia de Nvidia u optimizar el uso de los recursos disponibles. La empresa x.AI de Elon Musk anunció recientemente su propio chip, Apple está haciendo lo mismo con su Neural Engine, y Amazon está invirtiendo en procesadores Trainium e Inferentia.

El mercado se está fragmentando, y OpenAI decidió no quedarse atrás.

GPT-5.3-Codex-Spark es un desarrollo dirigido. Si los modelos universales como GPT-4o deben manejar múltiples tareas, entonces Codex se enfoca en una cosa: escribir código lo más rápido y con precisión posible.

Esto permitió a los ingenieros de OpenAI realizar una optimización significativa. La arquitectura se reformuló para las especificidades de la codificación, se eliminaron capas computacionales innecesarias, se reestructuraron las operaciones tensoriales. El resultado es la misma salida de calidad con costos computacionales mínimos.

Pero el cambio principal afecta a la capa de hardware. OpenAI desarrolló o replanteó chips no estándar que funcionan con esta arquitectura de forma nativa. Estos procesadores son más compactos que las GPU estándar, se integran más fácilmente, requieren menos energía y refrigeración — todo lo que hace que los centros de datos sean más baratos y resilientes a fallos.

El aumento de rendimiento de 15 veces es impresionante, pero el número requiere contexto. Probablemente no significa que el modelo realice cálculos directos 15 veces más rápido. Se trata del tiempo end-to-end de generación de código — desde la solicitud del usuario hasta la salida lista. Aquí las mejoras se suman: arquitectura optimizada, chips especializados, canalización de procesamiento reformulada. Este es un enfoque típico para la industria de IA: el algoritmo más eficiente en el hardware más eficiente da el resultado máximo.

Para la industria, esto significa varias cosas a la vez. Primero, aumenta la presión sobre Nvidia. Si otras empresas comienzan a usar con éxito sus propios chips, la demanda de GPU puede caer. Segundo, refuerza la tendencia hacia la integración vertical en laboratorios de IA. Apple, Google, Meta y ahora OpenAI — todos están desarrollando sus propios chips. Tercero, para los desarrolladores, esta es una buena noticia: un generador de código más rápido y más barato podría reducir el costo de usar APIs y hacer que los asistentes de IA sean más accesibles.

Pero OpenAI no se liberará completamente de Nvidia. Los modelos universales aún requieren GPU poderosas durante el entrenamiento. Los propios chips de OpenAI parecen estar optimizados específicamente para inferencia — ejecutar modelos ya entrenados. Esto tiene sentido: el entrenamiento ocurre raramente, pero las solicitudes de usuarios llegan constantemente. OpenAI ha encontrado una forma de controlar la capa donde puede beneficiarse de la escala. Y este es el movimiento estratégico correcto.

ZK
Hamidun News
Noticias de AI sin ruido. Selección editorial diaria de más de 400 fuentes. Producto de Zhemal Khamidun, Head of AI en Alpina Digital.

¿Quieres dejar de leer sobre IA y empezar a usarla?

AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.

¿Qué te parece?
Cargando comentarios…