LangChain Blog→ original

LangChain apresenta DeltaChannel para economizar memória de agentes de longa duração

LangChain lançou o DeltaChannel no LangGraph 1.2 — um novo primitivo para economizar memória de agentes de longa duração. Antes, o estado completo era salvo em

Processado por IA de LangChain Blog; editado por Hamidun News
LangChain apresenta DeltaChannel para economizar memória de agentes de longa duração
Fonte: LangChain Blog. Colagem: Hamidun News.
◐ Ouvir artigo

Agentes de longa duração enfrentam um problema clássico de escalabilidade: em cada passo, é necessário salvar o estado completo do sistema, e conforme o trabalho progride, os volumes de armazenamento crescem exponencialmente. Uma sessão que funciona por várias horas ou dias rapidamente se torna dezenas de gigabytes de dados em cache. LangChain resolveu essa tarefa com o novo primitivo DeltaChannel no LangGraph 1.2.

Problema: crescimento exponencial de memória

Imagine um agente que funciona da seguinte forma: dá um passo, calcula o resultado, salva todo o estado do sistema. No próximo passo, o mesmo processo se repete. O estado completo é salvo novamente no armazenamento. No centésimo passo, você tem 100 cópias do estado, no milésimo — 1000. O problema escala rapidamente. Em uma sessão longa (digamos, um agente funciona o dia todo e realiza milhões de mini-operações) o custo de armazenamento se torna proibitivo. Não é apenas dinheiro em espaço em disco — também há atrasos de leitura/escrita e complexidade de recuperação em caso de falha.

O que é DeltaChannel

O DeltaChannel é uma nova construção primitiva no LangGraph que resolve o problema em nível de arquitetura. Em vez de salvar um snapshot completo do estado em cada passo, o sistema registra apenas as mudanças (delta). A ideia não é nova — sistemas de controle de versão (Git), bancos de dados (Write-Ahead Logs) e sistemas distribuídos há muito tempo usam essa abordagem.

Mas no contexto de agentes de IA, aplicar isso de forma padrão era mais complexo: o estado do agente inclui muitas estruturas aninhadas, caches e histórico de interações. LangChain implementou o DeltaChannel assim: em cada passo, o sistema calcula exatamente o que mudou no estado (novas mensagens, contexto atualizado, resultados de computação). Apenas essa delta é registrada.

Periodicamente (por padrão a cada N passos, N é configurável) um snapshot completo é executado para que a recuperação após uma falha não exija reexecução de todo o histórico.

Como isso economiza memória

  • Delta em vez de estado completo — em vez de salvar todo o contexto do agente após cada passo, apenas os campos alterados e novos registros são gravados
  • Snapshots periódicos — snapshots completos do estado são gravados não após cada passo, mas a cada N passos (padrão a cada 100 passos, mas configurável)
  • Crescimento linear em vez de quadrático — uma sessão longa de 1000 passos agora usa aproximadamente a mesma quantidade de memória que uma sessão de 100 passos usava antes; com um milhão de passos, a diferença se torna ainda mais radical

Na prática, isso significa que um agente de longa duração que antes exigia dezenas de gigabytes de armazenamento agora pode funcionar em volumes ordens de magnitude menores. Para grandes sistemas de produção, isso transforma o problema de 'não é possível executar' em 'isso é econômico'.

DeltaChannel já em Deep Agents v0.6

LangChain integrou o DeltaChannel ao Deep Agents v0.6 — um novo framework para agentes de longa duração — por padrão, sem flags de configuração. Para usuários finais, isso significa que a melhoria funciona automaticamente.

Nenhuma alteração de código é necessária. Nenhuma migração de dados antigos é necessária — as sessões antigas continuam funcionando com os novos mecanismos em paralelo. Isso é particularmente útil para sistemas de longa duração: chatbots que mantêm conversas por horas, workflows de múltiplos passos que executam tarefas complexas ao longo de várias horas, e agentes assistentes que aprendem com a experiência ao longo de semanas.

Em cada um desses casos, o sistema de armazenamento antigo se tornaria um gargalo. Para desenvolvedores que desejam ajuste fino (por exemplo, alterar o intervalo entre snapshots), parâmetros de configuração estão disponíveis. Mas na prática, os valores padrão funcionam bem para a maioria dos cenários, desde chatbots até workflows complexos de múltiplas etapas.

O que isso significa

Agentes que funcionam por horas ou dias agora se tornam mais econômicos e escaláveis. Isso é crítico para produção: cada gigabyte de memória economizado é uma redução real no custo de execução de sistemas de longa duração. O DeltaChannel mostra que os engenheiros da LangChain ouvem atentamente o feedback dos usuários de produção e resolvem seus problemas não por meio de soluções alternativas (hacks, otimização por partes), mas em nível do próprio runtime. Este é um sinal da maturidade do framework.

ZK
Hamidun News
Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.

Quer parar de ler sobre IA e começar a usar?

AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.

O que você acha?
Carregando comentários…