El Algoritmo TurboQuant de Google derrumba las acciones de fabricantes de memoria tras la publicación de investigación
Google presentó TurboQuant — un método de compresión de cache KV para LLMs que reduce el consumo de memoria al menos seis veces y, según la empresa, no degrada

◐ Слушать статью
Google presentó TurboQuant — un método de compresión de cache KV para LLMs que reduce el consumo de memoria al menos seis veces y, según la empresa, no degrada la calidad. El mercado reaccionó en cuestión de horas: las acciones de Micron, Western Digital y SanDisk cayeron cuando los inversores inmediatamente recalcularon la demanda futura de memoria para AI. Si el enfoque funciona, la inferencia podría volverse significativamente más barata.