Nuevas GPUs reducirán el costo de la inferencia, pero no los precios para usuarios
La inferencia (despliegue de modelos de IA) se encarece por la creciente carga de infraestructura. Una nueva generación de GPUs y aceleradores especializados pr

◐ Escuchar artículo
La inferencia (despliegue de modelos de IA) se encarece por la creciente carga de infraestructura. Una nueva generación de GPUs y aceleradores especializados promete reducir la demanda de computación y abaratar costos para desarrolladores. Pero los usuarios difícilmente verán rebajas — las empresas no reducirán sus márgenes.