Novas GPUs reduzirão o custo da inferência, mas não os preços para usuários
Inferência (implantação de modelos de IA) fica mais cara por causa da crescente demanda de infraestrutura. Uma nova geração de GPUs e aceleradores especializado

◐ Ouvir artigo
Inferência (implantação de modelos de IA) fica mais cara por causa da crescente demanda de infraestrutura. Uma nova geração de GPUs e aceleradores especializados promete reduzir a demanda de processamento e diminuir custos para desenvolvedores. Mas usuários dificilmente verão queda de preços — empresas não vão cortar suas margens.