LangChain Blog→ original

LangChain presentó DeltaChannel para ahorrar memoria en agentes de larga duración

LangChain lanzó DeltaChannel en LangGraph 1.2, un nuevo primitivo para ahorrar memoria en agentes de larga duración. Anteriormente, el estado completo se guarda

Procesado por IA desde LangChain Blog; editado por Hamidun News
LangChain presentó DeltaChannel para ahorrar memoria en agentes de larga duración
Fuente: LangChain Blog. Collage: Hamidun News.
◐ Escuchar artículo

Los agentes de larga duración enfrentan un problema clásico de escalabilidad: en cada paso es necesario guardar el estado completo del sistema, y a medida que funciona, los volúmenes de almacenamiento crecen exponencialmente. Una sesión que funciona durante varias horas o días rápidamente se convierte en decenas de gigabytes de datos almacenados en caché. LangChain resolvió esta tarea con el nuevo primitivo DeltaChannel en LangGraph 1.2.

El problema: crecimiento exponencial de memoria

Imagina un agente que funciona de la siguiente manera: da un paso, calcula el resultado, guarda todo el estado del sistema. En el siguiente paso se repite lo mismo. El estado completo se escribe nuevamente en el almacenamiento. En el paso centésimo tienes 100 copias del estado, en el milésimo, 1000. El problema se escala rápidamente. En una sesión larga (digamos que el agente funciona todo el día y realiza millones de mini-operaciones) el costo de almacenamiento se vuelve inaceptable. No es solo dinero en espacio en disco, sino también retrasos en lectura/escritura y la complejidad de la recuperación en caso de fallo.

Qué es DeltaChannel

DeltaChannel es una nueva construcción primitiva en LangGraph que resuelve el problema a nivel de arquitectura. En lugar de guardar una copia completa del estado en cada paso, el sistema solo registra los cambios (delta). La idea no es nueva: los sistemas de control de versiones (Git), las bases de datos (Registros de Escritura Anticipada) y los sistemas distribuidos han utilizado este enfoque durante mucho tiempo.

Pero en el contexto de agentes de IA, aplicarlo de manera estándar fue más difícil: el estado del agente incluye muchas estructuras anidadas, cachés e historial de interacciones. LangChain implementó DeltaChannel de la siguiente manera: en cada paso, el sistema recalcula exactamente qué cambió en el estado (nuevos mensajes, contexto actualizado, resultados de cálculos). Solo se registra este delta.

Periódicamente (por defecto cada N pasos, N se puede configurar) se ejecuta una copia completa (instantánea) para que la recuperación después de un fallo no requiera reproducir toda la historia.

Cómo esto ahorra memoria

  • Delta en lugar de estado completo — en lugar de guardar todo el contexto del agente después de cada paso, solo se registran los campos modificados y los nuevos registros
  • Instantáneas periódicas — las copias completas del estado no se escriben después de cada paso, sino una vez cada N pasos (estándar cada 100 pasos, pero se puede configurar)
  • Crecimiento lineal en lugar de cuadrático — una sesión larga de 1000 pasos ahora ocupa aproximadamente la misma memoria que una sesión de 100 pasos ocupaba antes; con un millón de pasos la diferencia se vuelve aún más radical

En la práctica, esto significa que un agente de larga duración que antes requería decenas de gigabytes de almacenamiento ahora puede funcionar con volúmenes órdenes de magnitud menores. Para sistemas de producción grandes, esto convierte el problema de 'no se puede ejecutar' en el problema de 'es económico'.

DeltaChannel ya en Deep Agents v0.6

LangChain integró DeltaChannel en Deep Agents v0.6, el nuevo marco para agentes de larga duración, por defecto, sin indicadores de configuración. Para los usuarios finales, esto significa que la mejora funciona automáticamente.

No se requiere cambio de código. No se requiere migración de datos antiguos: las sesiones antiguas continúan funcionando con los nuevos mecanismos en paralelo. Esto es especialmente útil para sistemas de larga duración: chatbots que mantienen conversaciones durante horas, flujos de trabajo de múltiples pasos que ejecutan tareas complejas en varias horas, y agentes asistentes que aprenden de la experiencia a lo largo de semanas.

En cada uno de estos casos, el antiguo sistema de almacenamiento habría sido un cuello de botella. Para desarrolladores que desean un ajuste fino (por ejemplo, cambiar el intervalo entre instantáneas), hay parámetros de configuración disponibles. Pero en la práctica, los valores predeterminados funcionan bien para la mayoría de escenarios, desde chatbots hasta flujos de trabajo complejos de múltiples pasos.

Qué significa esto

Los agentes que funcionaban durante horas o días ahora son más económicos y escalables. Esto es crítico para la producción: cada gigabyte de memoria ahorrada es una reducción real en el costo de ejecutar sistemas de larga duración. DeltaChannel muestra que los ingenieros de LangChain escuchan atentamente los comentarios de los usuarios de producción y resuelven sus problemas no de manera indirecta (hacks, optimización por partes), sino a nivel del entorno de ejecución mismo. Este es un signo de la madurez del marco.

ZK
Hamidun News
Noticias de AI sin ruido. Selección editorial diaria de más de 400 fuentes. Producto de Zhemal Khamidun, Head of AI en Alpina Digital.

¿Quieres dejar de leer sobre IA y empezar a usarla?

AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.

¿Qué te parece?
Cargando comentarios…